KR20220152226A - 신속한 백신 플랫폼 - Google Patents
신속한 백신 플랫폼 Download PDFInfo
- Publication number
- KR20220152226A KR20220152226A KR1020227031285A KR20227031285A KR20220152226A KR 20220152226 A KR20220152226 A KR 20220152226A KR 1020227031285 A KR1020227031285 A KR 1020227031285A KR 20227031285 A KR20227031285 A KR 20227031285A KR 20220152226 A KR20220152226 A KR 20220152226A
- Authority
- KR
- South Korea
- Prior art keywords
- cell
- cells
- amino acids
- virus
- antigen
- Prior art date
Links
- 229960005486 vaccine Drugs 0.000 title claims abstract description 88
- 230000001717 pathogenic effect Effects 0.000 claims abstract description 101
- 238000000034 method Methods 0.000 claims abstract description 85
- 208000015181 infectious disease Diseases 0.000 claims abstract description 35
- 210000004027 cell Anatomy 0.000 claims description 647
- 239000000427 antigen Substances 0.000 claims description 131
- 108091007433 antigens Proteins 0.000 claims description 131
- 102000036639 antigens Human genes 0.000 claims description 131
- 244000052769 pathogen Species 0.000 claims description 115
- 210000004940 nucleus Anatomy 0.000 claims description 67
- 102000005962 receptors Human genes 0.000 claims description 58
- 108020003175 receptors Proteins 0.000 claims description 58
- 239000012634 fragment Substances 0.000 claims description 43
- 230000035899 viability Effects 0.000 claims description 35
- 241001678559 COVID-19 virus Species 0.000 claims description 34
- 230000028327 secretion Effects 0.000 claims description 30
- 238000005138 cryopreservation Methods 0.000 claims description 27
- 239000006285 cell suspension Substances 0.000 claims description 25
- 210000005061 intracellular organelle Anatomy 0.000 claims description 24
- 108020004999 messenger RNA Proteins 0.000 claims description 24
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 claims description 22
- GLNADSQYFUSGOU-GPTZEZBUSA-J Trypan blue Chemical compound [Na+].[Na+].[Na+].[Na+].C1=C(S([O-])(=O)=O)C=C2C=C(S([O-])(=O)=O)C(/N=N/C3=CC=C(C=C3C)C=3C=C(C(=CC=3)\N=N\C=3C(=CC4=CC(=CC(N)=C4C=3O)S([O-])(=O)=O)S([O-])(=O)=O)C)=C(O)C2=C1N GLNADSQYFUSGOU-GPTZEZBUSA-J 0.000 claims description 20
- 239000001045 blue dye Substances 0.000 claims description 20
- 239000008188 pellet Substances 0.000 claims description 20
- 241000282414 Homo sapiens Species 0.000 claims description 19
- 108010092694 L-Selectin Proteins 0.000 claims description 17
- 102000016551 L-selectin Human genes 0.000 claims description 17
- 108010064548 Lymphocyte Function-Associated Antigen-1 Proteins 0.000 claims description 17
- 230000015572 biosynthetic process Effects 0.000 claims description 17
- 239000002955 immunomodulating agent Substances 0.000 claims description 17
- 229940121354 immunomodulator Drugs 0.000 claims description 17
- 101710135378 pH 6 antigen Proteins 0.000 claims description 17
- 230000037396 body weight Effects 0.000 claims description 16
- 230000002584 immunomodulator Effects 0.000 claims description 16
- 108091016585 CD44 antigen Proteins 0.000 claims description 14
- 230000003472 neutralizing effect Effects 0.000 claims description 14
- 239000000725 suspension Substances 0.000 claims description 14
- 238000003786 synthesis reaction Methods 0.000 claims description 14
- 150000007523 nucleic acids Chemical class 0.000 claims description 13
- 238000004519 manufacturing process Methods 0.000 claims description 12
- 210000000948 non-nucleated cell Anatomy 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 11
- 108091008927 CC chemokine receptors Proteins 0.000 claims description 10
- 102000005674 CCR Receptors Human genes 0.000 claims description 10
- 108091008928 CXC chemokine receptors Proteins 0.000 claims description 10
- 102000054900 CXCR Receptors Human genes 0.000 claims description 10
- 238000002156 mixing Methods 0.000 claims description 10
- 239000012679 serum free medium Substances 0.000 claims description 10
- 210000002472 endoplasmic reticulum Anatomy 0.000 claims description 9
- 230000014509 gene expression Effects 0.000 claims description 9
- 230000004071 biological effect Effects 0.000 claims description 8
- 210000002288 golgi apparatus Anatomy 0.000 claims description 7
- 102000039446 nucleic acids Human genes 0.000 claims description 7
- 108020004707 nucleic acids Proteins 0.000 claims description 7
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 6
- 238000007910 systemic administration Methods 0.000 claims description 5
- 239000008194 pharmaceutical composition Substances 0.000 claims description 4
- 239000002671 adjuvant Substances 0.000 claims description 3
- 210000000170 cell membrane Anatomy 0.000 claims description 3
- 239000003085 diluting agent Substances 0.000 claims description 3
- 239000000546 pharmaceutical excipient Substances 0.000 claims description 3
- 230000002062 proliferating effect Effects 0.000 claims description 3
- 108010003723 Single-Domain Antibodies Proteins 0.000 claims description 2
- 230000024245 cell differentiation Effects 0.000 claims description 2
- 238000010257 thawing Methods 0.000 claims description 2
- 102000004457 Granulocyte-Macrophage Colony-Stimulating Factor Human genes 0.000 claims 5
- 102000027791 CD44 antigen Human genes 0.000 claims 3
- 239000000825 pharmaceutical preparation Substances 0.000 claims 2
- 239000000203 mixture Substances 0.000 abstract description 40
- 238000011161 development Methods 0.000 abstract description 12
- 235000001014 amino acid Nutrition 0.000 description 570
- 150000001413 amino acids Chemical class 0.000 description 560
- 241000700605 Viruses Species 0.000 description 280
- 210000000805 cytoplasm Anatomy 0.000 description 214
- 230000001086 cytosolic effect Effects 0.000 description 113
- 230000001225 therapeutic effect Effects 0.000 description 98
- 206010028980 Neoplasm Diseases 0.000 description 83
- 102000053602 DNA Human genes 0.000 description 56
- 108020004414 DNA Proteins 0.000 description 55
- 201000011510 cancer Diseases 0.000 description 50
- 108090000623 proteins and genes Proteins 0.000 description 50
- 102000004169 proteins and genes Human genes 0.000 description 49
- 235000018102 proteins Nutrition 0.000 description 47
- 108090000765 processed proteins & peptides Proteins 0.000 description 45
- 150000003384 small molecules Chemical class 0.000 description 39
- 241000711573 Coronaviridae Species 0.000 description 38
- 229920002477 rna polymer Polymers 0.000 description 37
- 210000001519 tissue Anatomy 0.000 description 37
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 33
- 238000010362 genome editing Methods 0.000 description 33
- 201000010099 disease Diseases 0.000 description 32
- 230000003612 virological effect Effects 0.000 description 31
- -1 antibodies Proteins 0.000 description 27
- 239000003814 drug Substances 0.000 description 27
- 210000000130 stem cell Anatomy 0.000 description 27
- 241000894006 Bacteria Species 0.000 description 25
- 102000003814 Interleukin-10 Human genes 0.000 description 25
- 108090000174 Interleukin-10 Proteins 0.000 description 25
- 101710198474 Spike protein Proteins 0.000 description 24
- 239000012190 activator Substances 0.000 description 24
- 229940076144 interleukin-10 Drugs 0.000 description 24
- 239000003053 toxin Substances 0.000 description 23
- 231100000765 toxin Toxicity 0.000 description 23
- 108700012359 toxins Proteins 0.000 description 23
- 229940096437 Protein S Drugs 0.000 description 22
- 241001529453 unidentified herpesvirus Species 0.000 description 20
- 210000003743 erythrocyte Anatomy 0.000 description 19
- 229940124597 therapeutic agent Drugs 0.000 description 19
- 102100039620 Granulocyte-macrophage colony-stimulating factor Human genes 0.000 description 18
- 239000013543 active substance Substances 0.000 description 18
- 102000004196 processed proteins & peptides Human genes 0.000 description 18
- 108010052285 Membrane Proteins Proteins 0.000 description 17
- 238000003211 trypan blue cell staining Methods 0.000 description 17
- 108090001074 Nucleocapsid Proteins Proteins 0.000 description 16
- 241001453380 Burkholderia Species 0.000 description 15
- 210000004271 bone marrow stromal cell Anatomy 0.000 description 15
- 210000004072 lung Anatomy 0.000 description 15
- 201000009030 Carcinoma Diseases 0.000 description 14
- 230000000840 anti-viral effect Effects 0.000 description 14
- 230000003248 secreting effect Effects 0.000 description 14
- 230000008685 targeting Effects 0.000 description 14
- 241000193738 Bacillus anthracis Species 0.000 description 13
- 241000699666 Mus <mouse, genus> Species 0.000 description 13
- 230000007159 enucleation Effects 0.000 description 13
- 102000004127 Cytokines Human genes 0.000 description 12
- 108090000695 Cytokines Proteins 0.000 description 12
- 102000018697 Membrane Proteins Human genes 0.000 description 12
- 241000607479 Yersinia pestis Species 0.000 description 12
- 210000003563 lymphoid tissue Anatomy 0.000 description 12
- 102100032912 CD44 antigen Human genes 0.000 description 11
- 235000004443 Ricinus communis Nutrition 0.000 description 11
- 229940065181 bacillus anthracis Drugs 0.000 description 11
- 230000018109 developmental process Effects 0.000 description 11
- 239000002243 precursor Substances 0.000 description 11
- 241000271566 Aves Species 0.000 description 10
- 108030001720 Bontoxilysin Proteins 0.000 description 10
- 102000009410 Chemokine receptor Human genes 0.000 description 10
- 108050000299 Chemokine receptor Proteins 0.000 description 10
- 241000223936 Cryptosporidium parvum Species 0.000 description 10
- 241000589602 Francisella tularensis Species 0.000 description 10
- 241000607142 Salmonella Species 0.000 description 10
- 241000607768 Shigella Species 0.000 description 10
- 241000607626 Vibrio cholerae Species 0.000 description 10
- 239000000556 agonist Substances 0.000 description 10
- 229940053031 botulinum toxin Drugs 0.000 description 10
- 241001493065 dsRNA viruses Species 0.000 description 10
- 229940118764 francisella tularensis Drugs 0.000 description 10
- 238000002560 therapeutic procedure Methods 0.000 description 10
- 229940118696 vibrio cholerae Drugs 0.000 description 10
- 241000589562 Brucella Species 0.000 description 9
- 208000025721 COVID-19 Diseases 0.000 description 9
- 241000193155 Clostridium botulinum Species 0.000 description 9
- 241000193468 Clostridium perfringens Species 0.000 description 9
- 241001445332 Coxiella <snail> Species 0.000 description 9
- 241000196324 Embryophyta Species 0.000 description 9
- 108050004280 Epsilon toxin Proteins 0.000 description 9
- 101000867232 Escherichia coli Heat-stable enterotoxin II Proteins 0.000 description 9
- 108010039491 Ricin Proteins 0.000 description 9
- 240000000528 Ricinus communis Species 0.000 description 9
- 201000003176 Severe Acute Respiratory Syndrome Diseases 0.000 description 9
- 230000002238 attenuated effect Effects 0.000 description 9
- 239000003636 conditioned culture medium Substances 0.000 description 9
- 231100000655 enterotoxin Toxicity 0.000 description 9
- 210000001808 exosome Anatomy 0.000 description 9
- 244000309459 oncolytic virus Species 0.000 description 9
- 238000010186 staining Methods 0.000 description 9
- 108090000672 Annexin A5 Proteins 0.000 description 8
- 102100034283 Annexin A5 Human genes 0.000 description 8
- 241001646719 Escherichia coli O157:H7 Species 0.000 description 8
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 8
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 description 8
- 125000003275 alpha amino acid group Chemical group 0.000 description 8
- 238000004108 freeze drying Methods 0.000 description 8
- 210000000987 immune system Anatomy 0.000 description 8
- 208000032839 leukemia Diseases 0.000 description 8
- 239000003446 ligand Substances 0.000 description 8
- 230000000670 limiting effect Effects 0.000 description 8
- 210000002540 macrophage Anatomy 0.000 description 8
- 102000019034 Chemokines Human genes 0.000 description 7
- 108010012236 Chemokines Proteins 0.000 description 7
- 241000606161 Chlamydia Species 0.000 description 7
- 241000283073 Equus caballus Species 0.000 description 7
- 241000233866 Fungi Species 0.000 description 7
- 206010018338 Glioma Diseases 0.000 description 7
- 241001505332 Polyomavirus sp. Species 0.000 description 7
- 241000606701 Rickettsia Species 0.000 description 7
- 241000315672 SARS coronavirus Species 0.000 description 7
- 206010039491 Sarcoma Diseases 0.000 description 7
- 241001529934 Simian T-lymphotropic virus 3 Species 0.000 description 7
- 208000036142 Viral infection Diseases 0.000 description 7
- 230000000890 antigenic effect Effects 0.000 description 7
- 230000001580 bacterial effect Effects 0.000 description 7
- 230000000925 erythroid effect Effects 0.000 description 7
- 210000003527 eukaryotic cell Anatomy 0.000 description 7
- 238000001727 in vivo Methods 0.000 description 7
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 7
- 230000001939 inductive effect Effects 0.000 description 7
- 210000002536 stromal cell Anatomy 0.000 description 7
- 230000014616 translation Effects 0.000 description 7
- 238000012384 transportation and delivery Methods 0.000 description 7
- 238000011282 treatment Methods 0.000 description 7
- 230000009385 viral infection Effects 0.000 description 7
- 102100021943 C-C motif chemokine 2 Human genes 0.000 description 6
- 238000011740 C57BL/6 mouse Methods 0.000 description 6
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- 102000004889 Interleukin-6 Human genes 0.000 description 6
- 108090001005 Interleukin-6 Proteins 0.000 description 6
- 206010025323 Lymphomas Diseases 0.000 description 6
- 241000701076 Macacine alphaherpesvirus 1 Species 0.000 description 6
- 241000124008 Mammalia Species 0.000 description 6
- 108010006232 Neuraminidase Proteins 0.000 description 6
- 102000005348 Neuraminidase Human genes 0.000 description 6
- 241000702263 Reovirus sp. Species 0.000 description 6
- 208000037847 SARS-CoV-2-infection Diseases 0.000 description 6
- 210000001744 T-lymphocyte Anatomy 0.000 description 6
- 241000700647 Variola virus Species 0.000 description 6
- 241000711975 Vesicular stomatitis virus Species 0.000 description 6
- 230000001154 acute effect Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 6
- 239000003795 chemical substances by application Substances 0.000 description 6
- 201000002491 encephalomyelitis Diseases 0.000 description 6
- 229940088598 enzyme Drugs 0.000 description 6
- 239000000185 hemagglutinin Substances 0.000 description 6
- 230000028993 immune response Effects 0.000 description 6
- 239000002105 nanoparticle Substances 0.000 description 6
- 102000040430 polynucleotide Human genes 0.000 description 6
- 108091033319 polynucleotide Proteins 0.000 description 6
- 239000002157 polynucleotide Substances 0.000 description 6
- 210000005166 vasculature Anatomy 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- 102000007469 Actins Human genes 0.000 description 5
- 108010085238 Actins Proteins 0.000 description 5
- 241000283690 Bos taurus Species 0.000 description 5
- 102100028990 C-X-C chemokine receptor type 3 Human genes 0.000 description 5
- 101710082514 C-X-C chemokine receptor type 3 Proteins 0.000 description 5
- 102100031650 C-X-C chemokine receptor type 4 Human genes 0.000 description 5
- 241000588724 Escherichia coli Species 0.000 description 5
- 208000032612 Glial tumor Diseases 0.000 description 5
- 101710154606 Hemagglutinin Proteins 0.000 description 5
- 101000922348 Homo sapiens C-X-C chemokine receptor type 4 Proteins 0.000 description 5
- 241000270322 Lepidosauria Species 0.000 description 5
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 5
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 5
- 102100034925 P-selectin glycoprotein ligand 1 Human genes 0.000 description 5
- 101710176177 Protein A56 Proteins 0.000 description 5
- 241000700159 Rattus Species 0.000 description 5
- 241000283984 Rodentia Species 0.000 description 5
- 108010067390 Viral Proteins Proteins 0.000 description 5
- 230000001464 adherent effect Effects 0.000 description 5
- 210000004504 adult stem cell Anatomy 0.000 description 5
- 210000003719 b-lymphocyte Anatomy 0.000 description 5
- 230000008827 biological function Effects 0.000 description 5
- 230000001413 cellular effect Effects 0.000 description 5
- 239000000975 dye Substances 0.000 description 5
- 210000002919 epithelial cell Anatomy 0.000 description 5
- 238000000684 flow cytometry Methods 0.000 description 5
- 238000007710 freezing Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000002538 fungal effect Effects 0.000 description 5
- 210000003630 histaminocyte Anatomy 0.000 description 5
- 239000005556 hormone Substances 0.000 description 5
- 229940088597 hormone Drugs 0.000 description 5
- 238000002347 injection Methods 0.000 description 5
- 239000007924 injection Substances 0.000 description 5
- 210000004185 liver Anatomy 0.000 description 5
- 208000020816 lung neoplasm Diseases 0.000 description 5
- 201000001441 melanoma Diseases 0.000 description 5
- 210000002901 mesenchymal stem cell Anatomy 0.000 description 5
- 210000003097 mucus Anatomy 0.000 description 5
- 210000000440 neutrophil Anatomy 0.000 description 5
- 210000001685 thyroid gland Anatomy 0.000 description 5
- 241001430294 unidentified retrovirus Species 0.000 description 5
- IAKHMKGGTNLKSZ-INIZCTEOSA-N (S)-colchicine Chemical compound C1([C@@H](NC(C)=O)CC2)=CC(=O)C(OC)=CC=C1C1=C2C=C(OC)C(OC)=C1OC IAKHMKGGTNLKSZ-INIZCTEOSA-N 0.000 description 4
- 241000251468 Actinopterygii Species 0.000 description 4
- 102100031151 C-C chemokine receptor type 2 Human genes 0.000 description 4
- 101710149815 C-C chemokine receptor type 2 Proteins 0.000 description 4
- 102100036301 C-C chemokine receptor type 7 Human genes 0.000 description 4
- 101710149858 C-C chemokine receptor type 7 Proteins 0.000 description 4
- 241000283707 Capra Species 0.000 description 4
- 102000000844 Cell Surface Receptors Human genes 0.000 description 4
- 108010001857 Cell Surface Receptors Proteins 0.000 description 4
- 241000701022 Cytomegalovirus Species 0.000 description 4
- 241001466953 Echovirus Species 0.000 description 4
- 241000991587 Enterovirus C Species 0.000 description 4
- 241000238631 Hexapoda Species 0.000 description 4
- 241000701024 Human betaherpesvirus 5 Species 0.000 description 4
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 4
- 102000004083 Lymphotoxin-alpha Human genes 0.000 description 4
- 108090000542 Lymphotoxin-alpha Proteins 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 208000003445 Mouth Neoplasms Diseases 0.000 description 4
- 241000829388 Mus musculus polyomavirus 1 Species 0.000 description 4
- 241001631646 Papillomaviridae Species 0.000 description 4
- 241001494479 Pecora Species 0.000 description 4
- 241000125945 Protoparvovirus Species 0.000 description 4
- 206010042971 T-cell lymphoma Diseases 0.000 description 4
- 208000027585 T-cell non-Hodgkin lymphoma Diseases 0.000 description 4
- 241000700618 Vaccinia virus Species 0.000 description 4
- 239000003443 antiviral agent Substances 0.000 description 4
- 210000003651 basophil Anatomy 0.000 description 4
- 210000004369 blood Anatomy 0.000 description 4
- 239000008280 blood Substances 0.000 description 4
- 239000002975 chemoattractant Substances 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 206010014599 encephalitis Diseases 0.000 description 4
- 230000003511 endothelial effect Effects 0.000 description 4
- 210000003979 eosinophil Anatomy 0.000 description 4
- 206010016629 fibroma Diseases 0.000 description 4
- 235000019688 fish Nutrition 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 210000004907 gland Anatomy 0.000 description 4
- 208000006454 hepatitis Diseases 0.000 description 4
- 231100000283 hepatitis Toxicity 0.000 description 4
- 210000002865 immune cell Anatomy 0.000 description 4
- 230000002458 infectious effect Effects 0.000 description 4
- 206010022000 influenza Diseases 0.000 description 4
- 229940100601 interleukin-6 Drugs 0.000 description 4
- 210000003734 kidney Anatomy 0.000 description 4
- 208000012987 lip and oral cavity carcinoma Diseases 0.000 description 4
- 201000005202 lung cancer Diseases 0.000 description 4
- 210000004698 lymphocyte Anatomy 0.000 description 4
- 210000004962 mammalian cell Anatomy 0.000 description 4
- 201000005962 mycosis fungoides Diseases 0.000 description 4
- 210000000822 natural killer cell Anatomy 0.000 description 4
- 210000001178 neural stem cell Anatomy 0.000 description 4
- 239000013612 plasmid Substances 0.000 description 4
- 210000004918 root sheath Anatomy 0.000 description 4
- 210000003079 salivary gland Anatomy 0.000 description 4
- 239000004055 small Interfering RNA Substances 0.000 description 4
- 239000013603 viral vector Substances 0.000 description 4
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical group C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 3
- 102100027211 Albumin Human genes 0.000 description 3
- 108010088751 Albumins Proteins 0.000 description 3
- 241000004176 Alphacoronavirus Species 0.000 description 3
- 239000000592 Artificial Cell Substances 0.000 description 3
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 3
- 241000195493 Cryptophyta Species 0.000 description 3
- 241000709661 Enterovirus Species 0.000 description 3
- 101710091045 Envelope protein Proteins 0.000 description 3
- 208000006168 Ewing Sarcoma Diseases 0.000 description 3
- 241000711950 Filoviridae Species 0.000 description 3
- 208000021309 Germ cell tumor Diseases 0.000 description 3
- 108090000288 Glycoproteins Proteins 0.000 description 3
- 102000003886 Glycoproteins Human genes 0.000 description 3
- 241000282412 Homo Species 0.000 description 3
- 101000655352 Homo sapiens Telomerase reverse transcriptase Proteins 0.000 description 3
- 241000598436 Human T-cell lymphotropic virus Species 0.000 description 3
- 102100034349 Integrase Human genes 0.000 description 3
- 108010074328 Interferon-gamma Proteins 0.000 description 3
- 241000712079 Measles morbillivirus Species 0.000 description 3
- 241001529936 Murinae Species 0.000 description 3
- 208000034176 Neoplasms, Germ Cell and Embryonal Diseases 0.000 description 3
- 206010029260 Neuroblastoma Diseases 0.000 description 3
- 101710137390 P-selectin glycoprotein ligand 1 Proteins 0.000 description 3
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 3
- 206010035148 Plague Diseases 0.000 description 3
- 101710188315 Protein X Proteins 0.000 description 3
- 206010037660 Pyrexia Diseases 0.000 description 3
- 206010041067 Small cell lung cancer Diseases 0.000 description 3
- 102100021669 Stromal cell-derived factor 1 Human genes 0.000 description 3
- 102100024568 Tumor necrosis factor ligand superfamily member 11 Human genes 0.000 description 3
- 102100031988 Tumor necrosis factor ligand superfamily member 6 Human genes 0.000 description 3
- 241000710959 Venezuelan equine encephalitis virus Species 0.000 description 3
- 230000033289 adaptive immune response Effects 0.000 description 3
- 230000004721 adaptive immunity Effects 0.000 description 3
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 3
- 210000000270 basal cell Anatomy 0.000 description 3
- 230000000975 bioactive effect Effects 0.000 description 3
- 210000003969 blast cell Anatomy 0.000 description 3
- 210000003169 central nervous system Anatomy 0.000 description 3
- 208000006990 cholangiocarcinoma Diseases 0.000 description 3
- 210000001612 chondrocyte Anatomy 0.000 description 3
- 229940028617 conventional vaccine Drugs 0.000 description 3
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 description 3
- 210000004443 dendritic cell Anatomy 0.000 description 3
- 208000028104 epidemic louse-borne typhus Diseases 0.000 description 3
- 238000001317 epifluorescence microscopy Methods 0.000 description 3
- 210000001723 extracellular space Anatomy 0.000 description 3
- 239000012091 fetal bovine serum Substances 0.000 description 3
- 210000002950 fibroblast Anatomy 0.000 description 3
- 208000005017 glioblastoma Diseases 0.000 description 3
- 230000001434 glomerular Effects 0.000 description 3
- 230000012010 growth Effects 0.000 description 3
- 239000003102 growth factor Substances 0.000 description 3
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 3
- 210000000936 intestine Anatomy 0.000 description 3
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 210000004379 membrane Anatomy 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 230000005012 migration Effects 0.000 description 3
- 238000013508 migration Methods 0.000 description 3
- 208000025113 myeloid leukemia Diseases 0.000 description 3
- 239000002071 nanotube Substances 0.000 description 3
- 210000000581 natural killer T-cell Anatomy 0.000 description 3
- 230000009826 neoplastic cell growth Effects 0.000 description 3
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 3
- 210000003924 normoblast Anatomy 0.000 description 3
- 210000003463 organelle Anatomy 0.000 description 3
- 239000001301 oxygen Substances 0.000 description 3
- 229910052760 oxygen Inorganic materials 0.000 description 3
- 201000002528 pancreatic cancer Diseases 0.000 description 3
- 208000008443 pancreatic carcinoma Diseases 0.000 description 3
- 230000000849 parathyroid Effects 0.000 description 3
- 238000001243 protein synthesis Methods 0.000 description 3
- 230000000241 respiratory effect Effects 0.000 description 3
- 210000000582 semen Anatomy 0.000 description 3
- 208000000587 small cell lung carcinoma Diseases 0.000 description 3
- 210000001082 somatic cell Anatomy 0.000 description 3
- 241000114864 ssRNA viruses Species 0.000 description 3
- 210000002105 tongue Anatomy 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 210000004881 tumor cell Anatomy 0.000 description 3
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 description 3
- 230000005641 tunneling Effects 0.000 description 3
- 206010061393 typhus Diseases 0.000 description 3
- 208000031261 Acute myeloid leukaemia Diseases 0.000 description 2
- 241000710929 Alphavirus Species 0.000 description 2
- 208000003829 American Hemorrhagic Fever Diseases 0.000 description 2
- 241000224489 Amoeba Species 0.000 description 2
- 241001206546 Ampullaviridae Species 0.000 description 2
- 201000003076 Angiosarcoma Diseases 0.000 description 2
- 241000203069 Archaea Species 0.000 description 2
- 241000712891 Arenavirus Species 0.000 description 2
- 201000009695 Argentine hemorrhagic fever Diseases 0.000 description 2
- 241000157873 Ascoviridae Species 0.000 description 2
- 206010003571 Astrocytoma Diseases 0.000 description 2
- 241001533362 Astroviridae Species 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 241000714230 Avian leukemia virus Species 0.000 description 2
- 230000003844 B-cell-activation Effects 0.000 description 2
- 241000701412 Baculoviridae Species 0.000 description 2
- 241000008904 Betacoronavirus Species 0.000 description 2
- 241001231757 Betaretrovirus Species 0.000 description 2
- 241001340646 Bicaudaviridae Species 0.000 description 2
- 241000145903 Bombyx mori cypovirus 1 Species 0.000 description 2
- 208000018084 Bone neoplasm Diseases 0.000 description 2
- 241000829192 Bos taurus polyomavirus 1 Species 0.000 description 2
- 241000701083 Bovine alphaherpesvirus 1 Species 0.000 description 2
- 241000714266 Bovine leukemia virus Species 0.000 description 2
- 238000007809 Boyden Chamber assay Methods 0.000 description 2
- 206010006187 Breast cancer Diseases 0.000 description 2
- 206010006500 Brucellosis Diseases 0.000 description 2
- 241001136175 Burkholderia pseudomallei Species 0.000 description 2
- 206010069748 Burkholderia pseudomallei infection Diseases 0.000 description 2
- 208000011691 Burkitt lymphomas Diseases 0.000 description 2
- 102100035875 C-C chemokine receptor type 5 Human genes 0.000 description 2
- 101710149870 C-C chemokine receptor type 5 Proteins 0.000 description 2
- 102100023702 C-C motif chemokine 13 Human genes 0.000 description 2
- 102100021984 C-C motif chemokine 4-like Human genes 0.000 description 2
- 102100032367 C-C motif chemokine 5 Human genes 0.000 description 2
- 102100034871 C-C motif chemokine 8 Human genes 0.000 description 2
- 102100025248 C-X-C motif chemokine 10 Human genes 0.000 description 2
- 102100039398 C-X-C motif chemokine 2 Human genes 0.000 description 2
- 102100036170 C-X-C motif chemokine 9 Human genes 0.000 description 2
- 102100032937 CD40 ligand Human genes 0.000 description 2
- 241000589875 Campylobacter jejuni Species 0.000 description 2
- 241000680578 Canid alphaherpesvirus 1 Species 0.000 description 2
- 241000202252 Cerberus Species 0.000 description 2
- 108010008951 Chemokine CXCL12 Proteins 0.000 description 2
- 241001647378 Chlamydia psittaci Species 0.000 description 2
- 241000195597 Chlamydomonas reinhardtii Species 0.000 description 2
- 244000249214 Chlorella pyrenoidosa Species 0.000 description 2
- 235000007091 Chlorella pyrenoidosa Nutrition 0.000 description 2
- 241000351651 Clavaviridae Species 0.000 description 2
- 206010009944 Colon cancer Diseases 0.000 description 2
- 241000218631 Coniferophyta Species 0.000 description 2
- 208000001528 Coronaviridae Infections Diseases 0.000 description 2
- 241000701520 Corticoviridae Species 0.000 description 2
- 241000450599 DNA viruses Species 0.000 description 2
- 241001461743 Deltacoronavirus Species 0.000 description 2
- 241000702421 Dependoparvovirus Species 0.000 description 2
- 206010012735 Diarrhoea Diseases 0.000 description 2
- 241000615461 Dicistroviridae Species 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- 241000710945 Eastern equine encephalitis virus Species 0.000 description 2
- 241001115402 Ebolavirus Species 0.000 description 2
- 102100023688 Eotaxin Human genes 0.000 description 2
- 241000701087 Felid alphaherpesvirus 1 Species 0.000 description 2
- 201000008808 Fibrosarcoma Diseases 0.000 description 2
- 229920001917 Ficoll Polymers 0.000 description 2
- 241000710781 Flaviviridae Species 0.000 description 2
- 208000022072 Gallbladder Neoplasms Diseases 0.000 description 2
- 241000008920 Gammacoronavirus Species 0.000 description 2
- 241000961639 Gammaflexiviridae Species 0.000 description 2
- 241001663880 Gammaretrovirus Species 0.000 description 2
- 206010051066 Gastrointestinal stromal tumour Diseases 0.000 description 2
- 241001112691 Goatpox virus Species 0.000 description 2
- 108010017080 Granulocyte Colony-Stimulating Factor Proteins 0.000 description 2
- 102000004269 Granulocyte Colony-Stimulating Factor Human genes 0.000 description 2
- 241000557006 Halorubrum Species 0.000 description 2
- 241000150562 Hantaan orthohantavirus Species 0.000 description 2
- 208000001258 Hemangiosarcoma Diseases 0.000 description 2
- 241000893570 Hendra henipavirus Species 0.000 description 2
- 241000711549 Hepacivirus C Species 0.000 description 2
- 241000724709 Hepatitis delta virus Species 0.000 description 2
- 241000700586 Herpesviridae Species 0.000 description 2
- 208000017604 Hodgkin disease Diseases 0.000 description 2
- 208000021519 Hodgkin lymphoma Diseases 0.000 description 2
- 208000010747 Hodgkins lymphoma Diseases 0.000 description 2
- 101000897480 Homo sapiens C-C motif chemokine 2 Proteins 0.000 description 2
- 101000896959 Homo sapiens C-C motif chemokine 4-like Proteins 0.000 description 2
- 101000797762 Homo sapiens C-C motif chemokine 5 Proteins 0.000 description 2
- 101000946794 Homo sapiens C-C motif chemokine 8 Proteins 0.000 description 2
- 101000858088 Homo sapiens C-X-C motif chemokine 10 Proteins 0.000 description 2
- 101000889128 Homo sapiens C-X-C motif chemokine 2 Proteins 0.000 description 2
- 101000947172 Homo sapiens C-X-C motif chemokine 9 Proteins 0.000 description 2
- 101000978392 Homo sapiens Eotaxin Proteins 0.000 description 2
- 101000899111 Homo sapiens Hemoglobin subunit beta Proteins 0.000 description 2
- 101000868279 Homo sapiens Leukocyte surface antigen CD47 Proteins 0.000 description 2
- 101000617130 Homo sapiens Stromal cell-derived factor 1 Proteins 0.000 description 2
- 101000638161 Homo sapiens Tumor necrosis factor ligand superfamily member 6 Proteins 0.000 description 2
- 101000638255 Homo sapiens Tumor necrosis factor ligand superfamily member 8 Proteins 0.000 description 2
- 241000714260 Human T-lymphotropic virus 1 Species 0.000 description 2
- 241000714259 Human T-lymphotropic virus 2 Species 0.000 description 2
- 241000700588 Human alphaherpesvirus 1 Species 0.000 description 2
- 241000701074 Human alphaherpesvirus 2 Species 0.000 description 2
- 241000701085 Human alphaherpesvirus 3 Species 0.000 description 2
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 2
- 241001502974 Human gammaherpesvirus 8 Species 0.000 description 2
- 241000725303 Human immunodeficiency virus Species 0.000 description 2
- 241000702617 Human parvovirus B19 Species 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 2
- 241000073062 Iflaviridae Species 0.000 description 2
- 241001500351 Influenzavirus A Species 0.000 description 2
- 241001500350 Influenzavirus B Species 0.000 description 2
- 241001500343 Influenzavirus C Species 0.000 description 2
- 241000401052 Influenzavirus D Species 0.000 description 2
- 102100040019 Interferon alpha-1/13 Human genes 0.000 description 2
- 102100026720 Interferon beta Human genes 0.000 description 2
- 102100037850 Interferon gamma Human genes 0.000 description 2
- 102000008070 Interferon-gamma Human genes 0.000 description 2
- 102000014150 Interferons Human genes 0.000 description 2
- 108010050904 Interferons Proteins 0.000 description 2
- 102000000589 Interleukin-1 Human genes 0.000 description 2
- 108010002352 Interleukin-1 Proteins 0.000 description 2
- 108010065805 Interleukin-12 Proteins 0.000 description 2
- 102000013462 Interleukin-12 Human genes 0.000 description 2
- 102100033502 Interleukin-37 Human genes 0.000 description 2
- 102000004890 Interleukin-8 Human genes 0.000 description 2
- 108090001007 Interleukin-8 Proteins 0.000 description 2
- 241000701460 JC polyomavirus Species 0.000 description 2
- 102000003855 L-lactate dehydrogenase Human genes 0.000 description 2
- 108700023483 L-lactate dehydrogenases Proteins 0.000 description 2
- 206010023825 Laryngeal cancer Diseases 0.000 description 2
- 102000004058 Leukemia inhibitory factor Human genes 0.000 description 2
- 108090000581 Leukemia inhibitory factor Proteins 0.000 description 2
- 102100032913 Leukocyte surface antigen CD47 Human genes 0.000 description 2
- 208000031422 Lymphocytic Chronic B-Cell Leukemia Diseases 0.000 description 2
- 208000028018 Lymphocytic leukaemia Diseases 0.000 description 2
- 102100026894 Lymphotoxin-beta Human genes 0.000 description 2
- 108090000362 Lymphotoxin-beta Proteins 0.000 description 2
- 108010046938 Macrophage Colony-Stimulating Factor Proteins 0.000 description 2
- 102000007651 Macrophage Colony-Stimulating Factor Human genes 0.000 description 2
- 208000006644 Malignant Fibrous Histiocytoma Diseases 0.000 description 2
- 241001480512 Mammalian orthoreovirus 3 Species 0.000 description 2
- 241001115401 Marburgvirus Species 0.000 description 2
- 241001661687 Marnaviridae Species 0.000 description 2
- 208000000172 Medulloblastoma Diseases 0.000 description 2
- 241000710185 Mengo virus Species 0.000 description 2
- 206010027406 Mesothelioma Diseases 0.000 description 2
- 229930192392 Mitomycin Natural products 0.000 description 2
- 208000034578 Multiple myelomas Diseases 0.000 description 2
- 241000711466 Murine hepatitis virus Species 0.000 description 2
- 241000714177 Murine leukemia virus Species 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 2
- 208000033776 Myeloid Acute Leukemia Diseases 0.000 description 2
- NWIBSHFKIJFRCO-WUDYKRTCSA-N Mytomycin Chemical compound C1N2C(C(C(C)=C(N)C3=O)=O)=C3[C@@H](COC(N)=O)[C@@]2(OC)[C@@H]2[C@H]1N2 NWIBSHFKIJFRCO-WUDYKRTCSA-N 0.000 description 2
- 241000526636 Nipah henipavirus Species 0.000 description 2
- 208000015914 Non-Hodgkin lymphomas Diseases 0.000 description 2
- 108700020796 Oncogene Proteins 0.000 description 2
- 108090000630 Oncostatin M Proteins 0.000 description 2
- 102000004140 Oncostatin M Human genes 0.000 description 2
- 241000150452 Orthohantavirus Species 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- 206010033128 Ovarian cancer Diseases 0.000 description 2
- 206010061535 Ovarian neoplasm Diseases 0.000 description 2
- 108010054395 P-selectin ligand protein Proteins 0.000 description 2
- 229930012538 Paclitaxel Natural products 0.000 description 2
- 208000002606 Paramyxoviridae Infections Diseases 0.000 description 2
- 206010057249 Phagocytosis Diseases 0.000 description 2
- 241000709664 Picornaviridae Species 0.000 description 2
- 208000007913 Pituitary Neoplasms Diseases 0.000 description 2
- 206010035226 Plasma cell myeloma Diseases 0.000 description 2
- 102100030304 Platelet factor 4 Human genes 0.000 description 2
- 206010035664 Pneumonia Diseases 0.000 description 2
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 2
- 241000287531 Psittacidae Species 0.000 description 2
- 206010037688 Q fever Diseases 0.000 description 2
- 108010025832 RANK Ligand Proteins 0.000 description 2
- 241000712909 Reticuloendotheliosis virus Species 0.000 description 2
- 208000005678 Rhabdomyoma Diseases 0.000 description 2
- 241000702670 Rotavirus Species 0.000 description 2
- 241000710799 Rubella virus Species 0.000 description 2
- 101150099493 STAT3 gene Proteins 0.000 description 2
- 241000710961 Semliki Forest virus Species 0.000 description 2
- 241000150278 Seoul orthohantavirus Species 0.000 description 2
- 241000700584 Simplexvirus Species 0.000 description 2
- 108091027967 Small hairpin RNA Proteins 0.000 description 2
- 108020004459 Small interfering RNA Proteins 0.000 description 2
- 208000005718 Stomach Neoplasms Diseases 0.000 description 2
- 241000282887 Suidae Species 0.000 description 2
- 241000282898 Sus scrofa Species 0.000 description 2
- 208000000389 T-cell leukemia Diseases 0.000 description 2
- 208000028530 T-cell lymphoblastic leukemia/lymphoma Diseases 0.000 description 2
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 2
- 206010043276 Teratoma Diseases 0.000 description 2
- 241000710924 Togaviridae Species 0.000 description 2
- 241001533336 Tombusviridae Species 0.000 description 2
- 208000034784 Tularaemia Diseases 0.000 description 2
- 102100024598 Tumor necrosis factor ligand superfamily member 10 Human genes 0.000 description 2
- 102100024584 Tumor necrosis factor ligand superfamily member 12 Human genes 0.000 description 2
- 102100036922 Tumor necrosis factor ligand superfamily member 13B Human genes 0.000 description 2
- 102100026890 Tumor necrosis factor ligand superfamily member 4 Human genes 0.000 description 2
- 102100032100 Tumor necrosis factor ligand superfamily member 8 Human genes 0.000 description 2
- 208000015778 Undifferentiated pleomorphic sarcoma Diseases 0.000 description 2
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 2
- 241000961586 Virgaviridae Species 0.000 description 2
- 208000033559 Waldenström macroglobulinemia Diseases 0.000 description 2
- 208000000260 Warts Diseases 0.000 description 2
- 241000710951 Western equine encephalitis virus Species 0.000 description 2
- 241001536558 Yaba monkey tumor virus Species 0.000 description 2
- 240000008042 Zea mays Species 0.000 description 2
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 2
- 208000009956 adenocarcinoma Diseases 0.000 description 2
- 229930013930 alkaloid Natural products 0.000 description 2
- 230000000735 allogeneic effect Effects 0.000 description 2
- 210000002255 anal canal Anatomy 0.000 description 2
- 210000004102 animal cell Anatomy 0.000 description 2
- 239000005557 antagonist Substances 0.000 description 2
- 230000002155 anti-virotic effect Effects 0.000 description 2
- 210000001130 astrocyte Anatomy 0.000 description 2
- 239000012620 biological material Substances 0.000 description 2
- 210000000988 bone and bone Anatomy 0.000 description 2
- 210000001185 bone marrow Anatomy 0.000 description 2
- 210000002798 bone marrow cell Anatomy 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 2
- 210000000481 breast Anatomy 0.000 description 2
- 210000000233 bronchiolar non-ciliated Anatomy 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- ZPUCINDJVBIVPJ-LJISPDSOSA-N cocaine Chemical compound O([C@H]1C[C@@H]2CC[C@@H](N2C)[C@H]1C(=O)OC)C(=O)C1=CC=CC=C1 ZPUCINDJVBIVPJ-LJISPDSOSA-N 0.000 description 2
- 229960001338 colchicine Drugs 0.000 description 2
- 238000001816 cooling Methods 0.000 description 2
- 210000004087 cornea Anatomy 0.000 description 2
- 210000004246 corpus luteum Anatomy 0.000 description 2
- 230000001054 cortical effect Effects 0.000 description 2
- 201000010549 croup Diseases 0.000 description 2
- 210000004292 cytoskeleton Anatomy 0.000 description 2
- 239000003937 drug carrier Substances 0.000 description 2
- 210000000804 eccrine gland Anatomy 0.000 description 2
- 235000013601 eggs Nutrition 0.000 description 2
- 210000000981 epithelium Anatomy 0.000 description 2
- 210000003238 esophagus Anatomy 0.000 description 2
- 210000003754 fetus Anatomy 0.000 description 2
- 201000003444 follicular lymphoma Diseases 0.000 description 2
- 230000008014 freezing Effects 0.000 description 2
- 201000010175 gallbladder cancer Diseases 0.000 description 2
- 206010017758 gastric cancer Diseases 0.000 description 2
- 230000002496 gastric effect Effects 0.000 description 2
- 201000011243 gastrointestinal stromal tumor Diseases 0.000 description 2
- 210000001035 gastrointestinal tract Anatomy 0.000 description 2
- 210000004602 germ cell Anatomy 0.000 description 2
- 210000002175 goblet cell Anatomy 0.000 description 2
- 210000003714 granulocyte Anatomy 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 230000035931 haemagglutination Effects 0.000 description 2
- 201000009277 hairy cell leukemia Diseases 0.000 description 2
- 201000010536 head and neck cancer Diseases 0.000 description 2
- 208000014829 head and neck neoplasm Diseases 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 210000002216 heart Anatomy 0.000 description 2
- 210000002443 helper t lymphocyte Anatomy 0.000 description 2
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 2
- 231100000844 hepatocellular carcinoma Toxicity 0.000 description 2
- 210000005260 human cell Anatomy 0.000 description 2
- 229940079322 interferon Drugs 0.000 description 2
- 210000004966 intestinal stem cell Anatomy 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 210000002510 keratinocyte Anatomy 0.000 description 2
- 210000001756 lactotroph Anatomy 0.000 description 2
- 206010023841 laryngeal neoplasm Diseases 0.000 description 2
- 201000010260 leiomyoma Diseases 0.000 description 2
- 210000003644 lens cell Anatomy 0.000 description 2
- 150000002632 lipids Chemical class 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 210000001165 lymph node Anatomy 0.000 description 2
- 208000003747 lymphoid leukemia Diseases 0.000 description 2
- 201000000564 macroglobulinemia Diseases 0.000 description 2
- 210000005075 mammary gland Anatomy 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 239000002609 medium Substances 0.000 description 2
- 210000002752 melanocyte Anatomy 0.000 description 2
- 201000004015 melioidosis Diseases 0.000 description 2
- 229960005558 mertansine Drugs 0.000 description 2
- 210000000274 microglia Anatomy 0.000 description 2
- 210000003470 mitochondria Anatomy 0.000 description 2
- 230000026326 mitochondrial transport Effects 0.000 description 2
- 229960004857 mitomycin Drugs 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 210000001616 monocyte Anatomy 0.000 description 2
- 210000000214 mouth Anatomy 0.000 description 2
- 210000003550 mucous cell Anatomy 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 210000000663 muscle cell Anatomy 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 210000005036 nerve Anatomy 0.000 description 2
- 210000004498 neuroglial cell Anatomy 0.000 description 2
- 231100000590 oncogenic Toxicity 0.000 description 2
- 230000002246 oncogenic effect Effects 0.000 description 2
- 230000000174 oncolytic effect Effects 0.000 description 2
- 201000008968 osteosarcoma Diseases 0.000 description 2
- 229960001592 paclitaxel Drugs 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 239000000813 peptide hormone Substances 0.000 description 2
- 125000001151 peptidyl group Chemical group 0.000 description 2
- 230000008782 phagocytosis Effects 0.000 description 2
- 229910052698 phosphorus Inorganic materials 0.000 description 2
- 239000011574 phosphorus Substances 0.000 description 2
- 230000001817 pituitary effect Effects 0.000 description 2
- 208000010916 pituitary tumor Diseases 0.000 description 2
- 229930001119 polyketide Natural products 0.000 description 2
- 150000003881 polyketide derivatives Chemical class 0.000 description 2
- 244000144977 poultry Species 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 230000035755 proliferation Effects 0.000 description 2
- 230000005180 public health Effects 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 210000003289 regulatory T cell Anatomy 0.000 description 2
- 210000002345 respiratory system Anatomy 0.000 description 2
- 210000001995 reticulocyte Anatomy 0.000 description 2
- 201000009410 rhabdomyosarcoma Diseases 0.000 description 2
- 210000001625 seminal vesicle Anatomy 0.000 description 2
- 230000001953 sensory effect Effects 0.000 description 2
- 210000000717 sertoli cell Anatomy 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 210000003491 skin Anatomy 0.000 description 2
- 210000004927 skin cell Anatomy 0.000 description 2
- 201000010153 skin papilloma Diseases 0.000 description 2
- 208000000649 small cell carcinoma Diseases 0.000 description 2
- 210000001764 somatotrope Anatomy 0.000 description 2
- 230000007480 spreading Effects 0.000 description 2
- 238000003892 spreading Methods 0.000 description 2
- 206010041823 squamous cell carcinoma Diseases 0.000 description 2
- 150000003431 steroids Chemical class 0.000 description 2
- 210000002784 stomach Anatomy 0.000 description 2
- 201000011549 stomach cancer Diseases 0.000 description 2
- 210000000106 sweat gland Anatomy 0.000 description 2
- 208000011580 syndromic disease Diseases 0.000 description 2
- RCINICONZNJXQF-MZXODVADSA-N taxol Chemical compound O([C@@H]1[C@@]2(C[C@@H](C(C)=C(C2(C)C)[C@H](C([C@]2(C)[C@@H](O)C[C@H]3OC[C@]3([C@H]21)OC(C)=O)=O)OC(=O)C)OC(=O)[C@H](O)[C@@H](NC(=O)C=1C=CC=CC=1)C=1C=CC=CC=1)O)C(=O)C1=CC=CC=C1 RCINICONZNJXQF-MZXODVADSA-N 0.000 description 2
- 230000002381 testicular Effects 0.000 description 2
- 208000008732 thymoma Diseases 0.000 description 2
- 206010044412 transitional cell carcinoma Diseases 0.000 description 2
- 241000712461 unidentified influenza virus Species 0.000 description 2
- 241000701366 unidentified nuclear polyhedrosis viruses Species 0.000 description 2
- 210000000626 ureter Anatomy 0.000 description 2
- 210000003708 urethra Anatomy 0.000 description 2
- 210000001215 vagina Anatomy 0.000 description 2
- 230000002792 vascular Effects 0.000 description 2
- 201000010653 vesiculitis Diseases 0.000 description 2
- 229960004854 viral vaccine Drugs 0.000 description 2
- 210000005253 yeast cell Anatomy 0.000 description 2
- MZOFCQQQCNRIBI-VMXHOPILSA-N (3s)-4-[[(2s)-1-[[(2s)-1-[[(1s)-1-carboxy-2-hydroxyethyl]amino]-4-methyl-1-oxopentan-2-yl]amino]-5-(diaminomethylideneamino)-1-oxopentan-2-yl]amino]-3-[[2-[[(2s)-2,6-diaminohexanoyl]amino]acetyl]amino]-4-oxobutanoic acid Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN MZOFCQQQCNRIBI-VMXHOPILSA-N 0.000 description 1
- MUFJHYRCIHHATF-UHFFFAOYSA-N 2-(3-phenyl-4,5-dihydro-1,2-oxazol-5-yl)acetic acid Chemical compound O1C(CC(=O)O)CC(C=2C=CC=CC=2)=N1 MUFJHYRCIHHATF-UHFFFAOYSA-N 0.000 description 1
- 108020005345 3' Untranslated Regions Proteins 0.000 description 1
- FWBHETKCLVMNFS-UHFFFAOYSA-N 4',6-Diamino-2-phenylindol Chemical compound C1=CC(C(=N)N)=CC=C1C1=CC2=CC=C(C(N)=N)C=C2N1 FWBHETKCLVMNFS-UHFFFAOYSA-N 0.000 description 1
- 108010082808 4-1BB Ligand Proteins 0.000 description 1
- 108020003589 5' Untranslated Regions Proteins 0.000 description 1
- BZTDTCNHAFUJOG-UHFFFAOYSA-N 6-carboxyfluorescein Chemical compound C12=CC=C(O)C=C2OC2=CC(O)=CC=C2C11OC(=O)C2=CC=C(C(=O)O)C=C21 BZTDTCNHAFUJOG-UHFFFAOYSA-N 0.000 description 1
- 208000030507 AIDS Diseases 0.000 description 1
- 208000002008 AIDS-Related Lymphoma Diseases 0.000 description 1
- ZKHQWZAMYRWXGA-KQYNXXCUSA-J ATP(4-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-J 0.000 description 1
- 241000714175 Abelson murine leukemia virus Species 0.000 description 1
- 241000588626 Acinetobacter baumannii Species 0.000 description 1
- 208000007876 Acrospiroma Diseases 0.000 description 1
- 208000024893 Acute lymphoblastic leukemia Diseases 0.000 description 1
- 208000014697 Acute lymphocytic leukaemia Diseases 0.000 description 1
- 206010000871 Acute monocytic leukaemia Diseases 0.000 description 1
- 208000036762 Acute promyelocytic leukaemia Diseases 0.000 description 1
- 102400000630 Acylation stimulating protein Human genes 0.000 description 1
- 101800000415 Acylation stimulating protein Proteins 0.000 description 1
- 208000001783 Adamantinoma Diseases 0.000 description 1
- 241001428876 Adelaide River virus Species 0.000 description 1
- 208000003200 Adenoma Diseases 0.000 description 1
- 206010001233 Adenoma benign Diseases 0.000 description 1
- ZKHQWZAMYRWXGA-UHFFFAOYSA-N Adenosine triphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O ZKHQWZAMYRWXGA-UHFFFAOYSA-N 0.000 description 1
- 241000701242 Adenoviridae Species 0.000 description 1
- 102000014777 Adipokines Human genes 0.000 description 1
- 108010078606 Adipokines Proteins 0.000 description 1
- 208000009746 Adult T-Cell Leukemia-Lymphoma Diseases 0.000 description 1
- 208000016683 Adult T-cell leukemia/lymphoma Diseases 0.000 description 1
- 241000701386 African swine fever virus Species 0.000 description 1
- 235000001674 Agaricus brunnescens Nutrition 0.000 description 1
- 241001135972 Aleutian mink disease virus Species 0.000 description 1
- 241000175213 Alloherpesviridae Species 0.000 description 1
- 241000961634 Alphaflexiviridae Species 0.000 description 1
- 241001664176 Alpharetrovirus Species 0.000 description 1
- 241000520665 Alphatetraviridae Species 0.000 description 1
- 208000037540 Alveolar soft tissue sarcoma Diseases 0.000 description 1
- 241000025051 Alvernaviridae Species 0.000 description 1
- 241000702419 Ambidensovirus Species 0.000 description 1
- 206010061424 Anal cancer Diseases 0.000 description 1
- 208000001446 Anaplastic Thyroid Carcinoma Diseases 0.000 description 1
- 206010073478 Anaplastic large-cell lymphoma Diseases 0.000 description 1
- 206010002240 Anaplastic thyroid cancer Diseases 0.000 description 1
- 241001339993 Anelloviridae Species 0.000 description 1
- 102100035765 Angiotensin-converting enzyme 2 Human genes 0.000 description 1
- 108090000975 Angiotensin-converting enzyme 2 Proteins 0.000 description 1
- 208000007860 Anus Neoplasms Diseases 0.000 description 1
- 241000282709 Aotus trivirgatus Species 0.000 description 1
- 206010073360 Appendix cancer Diseases 0.000 description 1
- 241000702652 Aquareovirus Species 0.000 description 1
- 241000272875 Ardeidae Species 0.000 description 1
- 241000712892 Arenaviridae Species 0.000 description 1
- 241001292006 Arteriviridae Species 0.000 description 1
- 206010060971 Astrocytoma malignant Diseases 0.000 description 1
- 102100022718 Atypical chemokine receptor 2 Human genes 0.000 description 1
- 102100022716 Atypical chemokine receptor 3 Human genes 0.000 description 1
- 241000178568 Aura virus Species 0.000 description 1
- 241000295638 Australian bat lyssavirus Species 0.000 description 1
- 241000711404 Avian avulavirus 1 Species 0.000 description 1
- 241000008921 Avian coronavirus Species 0.000 description 1
- 241000713826 Avian leukosis virus Species 0.000 description 1
- 241000713842 Avian sarcoma virus Species 0.000 description 1
- 241001651352 Avihepatovirus A Species 0.000 description 1
- 235000000832 Ayote Nutrition 0.000 description 1
- 108010028006 B-Cell Activating Factor Proteins 0.000 description 1
- 208000036170 B-Cell Marginal Zone Lymphoma Diseases 0.000 description 1
- 208000010839 B-cell chronic lymphocytic leukemia Diseases 0.000 description 1
- 208000003950 B-cell lymphoma Diseases 0.000 description 1
- 208000032791 BCR-ABL1 positive chronic myelogenous leukemia Diseases 0.000 description 1
- 108020000946 Bacterial DNA Proteins 0.000 description 1
- 208000035143 Bacterial infection Diseases 0.000 description 1
- 235000017166 Bambusa arundinacea Nutrition 0.000 description 1
- 235000017491 Bambusa tulda Nutrition 0.000 description 1
- 241001533460 Barnaviridae Species 0.000 description 1
- 206010004146 Basal cell carcinoma Diseases 0.000 description 1
- 241000112287 Bat coronavirus Species 0.000 description 1
- 241000639360 Bat coronavirus 1 Species 0.000 description 1
- 241000972317 Bat coronavirus CDPHE15 Species 0.000 description 1
- 241000731616 Bat coronavirus HKU10 Species 0.000 description 1
- 241000008922 Beluga Whale coronavirus SW1 Species 0.000 description 1
- 206010061692 Benign muscle neoplasm Diseases 0.000 description 1
- 241000008905 Betacoronavirus 1 Species 0.000 description 1
- 241000961645 Betaflexiviridae Species 0.000 description 1
- 241000405758 Betapartitivirus Species 0.000 description 1
- BVKZGUZCCUSVTD-UHFFFAOYSA-M Bicarbonate Chemical compound OC([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-M 0.000 description 1
- 241000543377 Bidnaviridae Species 0.000 description 1
- 206010004593 Bile duct cancer Diseases 0.000 description 1
- 241000702628 Birnaviridae Species 0.000 description 1
- 241000150523 Black Creek Canal orthohantavirus Species 0.000 description 1
- 206010005003 Bladder cancer Diseases 0.000 description 1
- 241001474374 Blennius Species 0.000 description 1
- 208000034200 Bolivian hemorrhagic fever Diseases 0.000 description 1
- 206010005949 Bone cancer Diseases 0.000 description 1
- 206010005969 Bone giant cell tumour Diseases 0.000 description 1
- 241000776207 Bornaviridae Species 0.000 description 1
- 241001416153 Bos grunniens Species 0.000 description 1
- 241001536324 Botryococcus Species 0.000 description 1
- 241001536303 Botryococcus braunii Species 0.000 description 1
- 208000003508 Botulism Diseases 0.000 description 1
- 208000031462 Bovine Mastitis Diseases 0.000 description 1
- 241000700585 Bovine alphaherpesvirus 2 Species 0.000 description 1
- 241000711443 Bovine coronavirus Species 0.000 description 1
- 241001227615 Bovine foamy virus Species 0.000 description 1
- 241000713704 Bovine immunodeficiency virus Species 0.000 description 1
- 241000701822 Bovine papillomavirus Species 0.000 description 1
- 241000621124 Bovine papular stomatitis virus Species 0.000 description 1
- 241000701922 Bovine parvovirus Species 0.000 description 1
- 241000710780 Bovine viral diarrhea virus 1 Species 0.000 description 1
- 208000003174 Brain Neoplasms Diseases 0.000 description 1
- 208000014644 Brain disease Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 208000007690 Brenner tumor Diseases 0.000 description 1
- 206010073258 Brenner tumour Diseases 0.000 description 1
- 241001533462 Bromoviridae Species 0.000 description 1
- 206010070487 Brown tumour Diseases 0.000 description 1
- 241000231316 Buggy Creek virus Species 0.000 description 1
- 241001493154 Bunyamwera virus Species 0.000 description 1
- 241000722910 Burkholderia mallei Species 0.000 description 1
- 102100031172 C-C chemokine receptor type 1 Human genes 0.000 description 1
- 101710149814 C-C chemokine receptor type 1 Proteins 0.000 description 1
- 101710149862 C-C chemokine receptor type 3 Proteins 0.000 description 1
- 102100024167 C-C chemokine receptor type 3 Human genes 0.000 description 1
- 101710149863 C-C chemokine receptor type 4 Proteins 0.000 description 1
- 102100037853 C-C chemokine receptor type 4 Human genes 0.000 description 1
- 102100036305 C-C chemokine receptor type 8 Human genes 0.000 description 1
- 102100025074 C-C chemokine receptor-like 2 Human genes 0.000 description 1
- 102100036841 C-C motif chemokine 1 Human genes 0.000 description 1
- 101710155835 C-C motif chemokine 1 Proteins 0.000 description 1
- 101710112613 C-C motif chemokine 13 Proteins 0.000 description 1
- 102100023705 C-C motif chemokine 14 Human genes 0.000 description 1
- 102100023703 C-C motif chemokine 15 Human genes 0.000 description 1
- 102100023700 C-C motif chemokine 16 Human genes 0.000 description 1
- 102100023698 C-C motif chemokine 17 Human genes 0.000 description 1
- 102100023701 C-C motif chemokine 18 Human genes 0.000 description 1
- 102100036842 C-C motif chemokine 19 Human genes 0.000 description 1
- 101710155857 C-C motif chemokine 2 Proteins 0.000 description 1
- 102100036848 C-C motif chemokine 20 Human genes 0.000 description 1
- 102100036846 C-C motif chemokine 21 Human genes 0.000 description 1
- 102100036850 C-C motif chemokine 23 Human genes 0.000 description 1
- 102100036849 C-C motif chemokine 24 Human genes 0.000 description 1
- 102100021933 C-C motif chemokine 25 Human genes 0.000 description 1
- 102100021935 C-C motif chemokine 26 Human genes 0.000 description 1
- 102100021936 C-C motif chemokine 27 Human genes 0.000 description 1
- 102100021942 C-C motif chemokine 28 Human genes 0.000 description 1
- 102100034673 C-C motif chemokine 3-like 1 Human genes 0.000 description 1
- 102100032366 C-C motif chemokine 7 Human genes 0.000 description 1
- 102100036166 C-X-C chemokine receptor type 1 Human genes 0.000 description 1
- 102100028989 C-X-C chemokine receptor type 2 Human genes 0.000 description 1
- 102100031658 C-X-C chemokine receptor type 5 Human genes 0.000 description 1
- 102100025279 C-X-C motif chemokine 11 Human genes 0.000 description 1
- 102100025277 C-X-C motif chemokine 13 Human genes 0.000 description 1
- 102100025250 C-X-C motif chemokine 14 Human genes 0.000 description 1
- 102100039396 C-X-C motif chemokine 16 Human genes 0.000 description 1
- 102100039435 C-X-C motif chemokine 17 Human genes 0.000 description 1
- 102100036189 C-X-C motif chemokine 3 Human genes 0.000 description 1
- 102100036150 C-X-C motif chemokine 5 Human genes 0.000 description 1
- 102100036153 C-X-C motif chemokine 6 Human genes 0.000 description 1
- 101150049756 CCL6 gene Proteins 0.000 description 1
- 101150011672 CCL9 gene Proteins 0.000 description 1
- 108010029697 CD40 Ligand Proteins 0.000 description 1
- 102100025221 CD70 antigen Human genes 0.000 description 1
- 210000005236 CD8+ effector T cell Anatomy 0.000 description 1
- 238000010453 CRISPR/Cas method Methods 0.000 description 1
- 108090000835 CX3C Chemokine Receptor 1 Proteins 0.000 description 1
- 102100039196 CX3C chemokine receptor 1 Human genes 0.000 description 1
- 108050007957 Cadherin Proteins 0.000 description 1
- 102000000905 Cadherin Human genes 0.000 description 1
- 241000714198 Caliciviridae Species 0.000 description 1
- 241001493160 California encephalitis virus Species 0.000 description 1
- 240000009258 Camassia scilloides Species 0.000 description 1
- 241001137864 Camelpox virus Species 0.000 description 1
- 241000178270 Canarypox virus Species 0.000 description 1
- 241000711506 Canine coronavirus Species 0.000 description 1
- 241000046998 Canine minute virus Species 0.000 description 1
- 241000701931 Canine parvovirus Species 0.000 description 1
- 241000282465 Canis Species 0.000 description 1
- 241000150506 Cano Delgadito orthohantavirus Species 0.000 description 1
- 241001535104 Caprine alphaherpesvirus 1 Species 0.000 description 1
- 206010007275 Carcinoid tumour Diseases 0.000 description 1
- 206010007279 Carcinoid tumour of the gastrointestinal tract Diseases 0.000 description 1
- 208000009458 Carcinoma in Situ Diseases 0.000 description 1
- 201000000274 Carcinosarcoma Diseases 0.000 description 1
- 102100029391 Cardiotrophin-like cytokine factor 1 Human genes 0.000 description 1
- 241000710190 Cardiovirus Species 0.000 description 1
- 241000520666 Carmotetraviridae Species 0.000 description 1
- 241001181440 Carpias Species 0.000 description 1
- 208000005024 Castleman disease Diseases 0.000 description 1
- 241000700199 Cavia porcellus Species 0.000 description 1
- 241001467055 Caviid betaherpesvirus 2 Species 0.000 description 1
- 101150075117 Ccl12 gene Proteins 0.000 description 1
- 206010007953 Central nervous system lymphoma Diseases 0.000 description 1
- 241000209443 Ceratophyllum demersum Species 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 206010050337 Cerumen impaction Diseases 0.000 description 1
- 206010008342 Cervix carcinoma Diseases 0.000 description 1
- 241000711969 Chandipura virus Species 0.000 description 1
- 241001331000 Charleville virus Species 0.000 description 1
- 102000006573 Chemokine CXCL12 Human genes 0.000 description 1
- 102100036645 Chemokine-like protein TAFA-1 Human genes 0.000 description 1
- 102100036650 Chemokine-like protein TAFA-2 Human genes 0.000 description 1
- 102100036649 Chemokine-like protein TAFA-3 Human genes 0.000 description 1
- 102100025944 Chemokine-like protein TAFA-4 Human genes 0.000 description 1
- 102100025942 Chemokine-like protein TAFA-5 Human genes 0.000 description 1
- 201000006082 Chickenpox Diseases 0.000 description 1
- 241001502567 Chikungunya virus Species 0.000 description 1
- 206010008631 Cholera Diseases 0.000 description 1
- 208000005243 Chondrosarcoma Diseases 0.000 description 1
- 201000009047 Chordoma Diseases 0.000 description 1
- 208000006332 Choriocarcinoma Diseases 0.000 description 1
- 208000016216 Choristoma Diseases 0.000 description 1
- 208000004378 Choroid plexus papilloma Diseases 0.000 description 1
- 208000002691 Choroiditis Diseases 0.000 description 1
- 206010008805 Chromosomal abnormalities Diseases 0.000 description 1
- 208000031404 Chromosome Aberrations Diseases 0.000 description 1
- 208000010833 Chronic myeloid leukaemia Diseases 0.000 description 1
- 241001060419 Chrysoviridae Species 0.000 description 1
- 108010005939 Ciliary Neurotrophic Factor Proteins 0.000 description 1
- 102100031614 Ciliary neurotrophic factor Human genes 0.000 description 1
- 241001533399 Circoviridae Species 0.000 description 1
- 241000710777 Classical swine fever virus Species 0.000 description 1
- 241000973027 Closteroviridae Species 0.000 description 1
- 241000243321 Cnidaria Species 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 108010071942 Colony-Stimulating Factors Proteins 0.000 description 1
- 241000204955 Colorado tick fever virus Species 0.000 description 1
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 1
- 241000702669 Coltivirus Species 0.000 description 1
- 102100030135 Complement C1q tumor necrosis factor-related protein 5 Human genes 0.000 description 1
- 102100031673 Corneodesmosin Human genes 0.000 description 1
- 101710139375 Corneodesmosin Proteins 0.000 description 1
- 241001123928 Coronavirus HKU15 Species 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 241000709687 Coxsackievirus Species 0.000 description 1
- 208000009798 Craniopharyngioma Diseases 0.000 description 1
- 241000710127 Cricket paralysis virus Species 0.000 description 1
- 241000150230 Crimean-Congo hemorrhagic fever orthonairovirus Species 0.000 description 1
- 206010011416 Croup infectious Diseases 0.000 description 1
- 240000004244 Cucurbita moschata Species 0.000 description 1
- 235000009854 Cucurbita moschata Nutrition 0.000 description 1
- 235000009804 Cucurbita pepo subsp pepo Nutrition 0.000 description 1
- 241000702662 Cypovirus Species 0.000 description 1
- 241000252233 Cyprinus carpio Species 0.000 description 1
- 241000702221 Cystoviridae Species 0.000 description 1
- 102100035298 Cytokine SCM-1 beta Human genes 0.000 description 1
- 241001506928 Deformed wing virus Species 0.000 description 1
- 241000283323 Delphinapterus leucas Species 0.000 description 1
- 241000701809 Deltapapillomavirus 1 Species 0.000 description 1
- 241000701808 Deltapapillomavirus 2 Species 0.000 description 1
- 241001663879 Deltaretrovirus Species 0.000 description 1
- 241000725619 Dengue virus Species 0.000 description 1
- 201000004624 Dermatitis Diseases 0.000 description 1
- 208000008334 Dermatofibrosarcoma Diseases 0.000 description 1
- 206010057070 Dermatofibrosarcoma protuberans Diseases 0.000 description 1
- 206010048768 Dermatosis Diseases 0.000 description 1
- 208000001154 Dermoid Cyst Diseases 0.000 description 1
- 241000723298 Dicentrarchus labrax Species 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 102100031107 Disintegrin and metalloproteinase domain-containing protein 11 Human genes 0.000 description 1
- 101710121366 Disintegrin and metalloproteinase domain-containing protein 11 Proteins 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 241000907524 Drosophila C virus Species 0.000 description 1
- 241000856856 Duck coronavirus Species 0.000 description 1
- 241000725618 Duck hepatitis B virus Species 0.000 description 1
- 241001176668 Duck hepatitis virus 2 Species 0.000 description 1
- 101150002621 EPO gene Proteins 0.000 description 1
- 208000006825 Eastern Equine Encephalomyelitis Diseases 0.000 description 1
- 201000005804 Eastern equine encephalitis Diseases 0.000 description 1
- 201000011001 Ebola Hemorrhagic Fever Diseases 0.000 description 1
- 241000258955 Echinodermata Species 0.000 description 1
- 241000709643 Echovirus E9 Species 0.000 description 1
- 102100037354 Ectodysplasin-A Human genes 0.000 description 1
- 206010014587 Encephalitis eastern equine Diseases 0.000 description 1
- 206010014611 Encephalitis venezuelan equine Diseases 0.000 description 1
- 206010014612 Encephalitis viral Diseases 0.000 description 1
- 206010014614 Encephalitis western equine Diseases 0.000 description 1
- 241000710188 Encephalomyocarditis virus Species 0.000 description 1
- 208000032274 Encephalopathy Diseases 0.000 description 1
- 208000001976 Endocrine Gland Neoplasms Diseases 0.000 description 1
- 206010014733 Endometrial cancer Diseases 0.000 description 1
- 206010014759 Endometrial neoplasm Diseases 0.000 description 1
- 241000868840 Endornaviridae Species 0.000 description 1
- 208000002460 Enteropathy-Associated T-Cell Lymphoma Diseases 0.000 description 1
- 101710204837 Envelope small membrane protein Proteins 0.000 description 1
- 102000010911 Enzyme Precursors Human genes 0.000 description 1
- 108010062466 Enzyme Precursors Proteins 0.000 description 1
- 208000033832 Eosinophilic Acute Leukemia Diseases 0.000 description 1
- 206010014967 Ependymoma Diseases 0.000 description 1
- 206010066919 Epidemic polyarthritis Diseases 0.000 description 1
- 241000725578 Equid gammaherpesvirus 2 Species 0.000 description 1
- 241000710803 Equine arteritis virus Species 0.000 description 1
- 241000713730 Equine infectious anemia virus Species 0.000 description 1
- 208000031637 Erythroblastic Acute Leukemia Diseases 0.000 description 1
- 101710111526 Erythroferrone Proteins 0.000 description 1
- 208000036566 Erythroleukaemia Diseases 0.000 description 1
- 102000003951 Erythropoietin Human genes 0.000 description 1
- 108090000394 Erythropoietin Proteins 0.000 description 1
- 101100172469 Escherichia coli (strain K12) envZ gene Proteins 0.000 description 1
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 244000207543 Euphorbia heterophylla Species 0.000 description 1
- 241000465885 Everglades virus Species 0.000 description 1
- 208000010201 Exanthema Diseases 0.000 description 1
- 108010037362 Extracellular Matrix Proteins Proteins 0.000 description 1
- 102000010834 Extracellular Matrix Proteins Human genes 0.000 description 1
- 208000017259 Extragonadal germ cell tumor Diseases 0.000 description 1
- 208000010368 Extramammary Paget Disease Diseases 0.000 description 1
- 206010061850 Extranodal marginal zone B-cell lymphoma (MALT type) Diseases 0.000 description 1
- 201000001342 Fallopian tube cancer Diseases 0.000 description 1
- 208000013452 Fallopian tube neoplasm Diseases 0.000 description 1
- 108010039471 Fas Ligand Protein Proteins 0.000 description 1
- 208000004729 Feline Leukemia Diseases 0.000 description 1
- 241000714201 Feline calicivirus Species 0.000 description 1
- 241000519954 Feline foamy virus Species 0.000 description 1
- 241000713800 Feline immunodeficiency virus Species 0.000 description 1
- 241000711475 Feline infectious peritonitis virus Species 0.000 description 1
- 241000714165 Feline leukemia virus Species 0.000 description 1
- 241000701915 Feline panleukopenia virus Species 0.000 description 1
- 241000701925 Feline parvovirus Species 0.000 description 1
- 241000714174 Feline sarcoma virus Species 0.000 description 1
- 241000282324 Felis Species 0.000 description 1
- 241000192125 Firmicutes Species 0.000 description 1
- 241001470863 Flanders hapavirus Species 0.000 description 1
- 241000710831 Flavivirus Species 0.000 description 1
- 206010016935 Follicular thyroid cancer Diseases 0.000 description 1
- 241000710198 Foot-and-mouth disease virus Species 0.000 description 1
- 241001428964 Four Corners hantavirus Species 0.000 description 1
- 102100020997 Fractalkine Human genes 0.000 description 1
- 229930091371 Fructose Natural products 0.000 description 1
- 239000005715 Fructose Substances 0.000 description 1
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 1
- 241000701367 Fuselloviridae Species 0.000 description 1
- 210000000712 G cell Anatomy 0.000 description 1
- 241000531123 GB virus C Species 0.000 description 1
- 101001066288 Gallus gallus GATA-binding factor 3 Proteins 0.000 description 1
- 241000701046 Gammaherpesvirinae Species 0.000 description 1
- 201000004066 Ganglioglioma Diseases 0.000 description 1
- 208000005577 Gastroenteritis Diseases 0.000 description 1
- 206010017993 Gastrointestinal neoplasms Diseases 0.000 description 1
- 241000702463 Geminiviridae Species 0.000 description 1
- 206010061183 Genitourinary tract neoplasm Diseases 0.000 description 1
- 241000713813 Gibbon ape leukemia virus Species 0.000 description 1
- 201000010915 Glioblastoma multiforme Diseases 0.000 description 1
- 241001136687 Globuloviridae Species 0.000 description 1
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 1
- 206010018404 Glucagonoma Diseases 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 241001631709 Gonometa Species 0.000 description 1
- 241001517118 Goose parvovirus Species 0.000 description 1
- 241000219146 Gossypium Species 0.000 description 1
- 241000700735 Ground squirrel hepatitis virus Species 0.000 description 1
- 102100034221 Growth-regulated alpha protein Human genes 0.000 description 1
- 241000190708 Guanarito mammarenavirus Species 0.000 description 1
- 241001664989 Guttaviridae Species 0.000 description 1
- 208000031886 HIV Infections Diseases 0.000 description 1
- 206010061192 Haemorrhagic fever Diseases 0.000 description 1
- 241000500022 Haloarcula hispanica Species 0.000 description 1
- 208000020061 Hand, Foot and Mouth Disease Diseases 0.000 description 1
- 208000025713 Hand-foot-and-mouth disease Diseases 0.000 description 1
- 241001123922 Hedgehog coronavirus 1 Species 0.000 description 1
- 241000590002 Helicobacter pylori Species 0.000 description 1
- 208000006050 Hemangiopericytoma Diseases 0.000 description 1
- 102100031573 Hematopoietic progenitor cell antigen CD34 Human genes 0.000 description 1
- 108010054147 Hemoglobins Proteins 0.000 description 1
- 102000001554 Hemoglobins Human genes 0.000 description 1
- 241000035314 Henipavirus Species 0.000 description 1
- 229920002971 Heparan sulfate Polymers 0.000 description 1
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 1
- 241000700721 Hepatitis B virus Species 0.000 description 1
- 241000724675 Hepatitis E virus Species 0.000 description 1
- 206010019771 Hepatitis F Diseases 0.000 description 1
- 208000037262 Hepatitis delta Diseases 0.000 description 1
- 206010019786 Hepatitis non-A non-B Diseases 0.000 description 1
- 102000003745 Hepatocyte Growth Factor Human genes 0.000 description 1
- 108090000100 Hepatocyte Growth Factor Proteins 0.000 description 1
- 241000709715 Hepatovirus Species 0.000 description 1
- 241000709721 Hepatovirus A Species 0.000 description 1
- 241001136039 Heron hepatitis B virus Species 0.000 description 1
- 208000029433 Herpesviridae infectious disease Diseases 0.000 description 1
- 241000710948 Highlands J virus Species 0.000 description 1
- 101000678892 Homo sapiens Atypical chemokine receptor 2 Proteins 0.000 description 1
- 101000678890 Homo sapiens Atypical chemokine receptor 3 Proteins 0.000 description 1
- 101000777558 Homo sapiens C-C chemokine receptor type 10 Proteins 0.000 description 1
- 101000716068 Homo sapiens C-C chemokine receptor type 6 Proteins 0.000 description 1
- 101000716063 Homo sapiens C-C chemokine receptor type 8 Proteins 0.000 description 1
- 101000978379 Homo sapiens C-C motif chemokine 13 Proteins 0.000 description 1
- 101000978381 Homo sapiens C-C motif chemokine 14 Proteins 0.000 description 1
- 101000978376 Homo sapiens C-C motif chemokine 15 Proteins 0.000 description 1
- 101000978375 Homo sapiens C-C motif chemokine 16 Proteins 0.000 description 1
- 101000978362 Homo sapiens C-C motif chemokine 17 Proteins 0.000 description 1
- 101000978371 Homo sapiens C-C motif chemokine 18 Proteins 0.000 description 1
- 101000713106 Homo sapiens C-C motif chemokine 19 Proteins 0.000 description 1
- 101000713099 Homo sapiens C-C motif chemokine 20 Proteins 0.000 description 1
- 101000713085 Homo sapiens C-C motif chemokine 21 Proteins 0.000 description 1
- 101000713081 Homo sapiens C-C motif chemokine 23 Proteins 0.000 description 1
- 101000713078 Homo sapiens C-C motif chemokine 24 Proteins 0.000 description 1
- 101000897486 Homo sapiens C-C motif chemokine 25 Proteins 0.000 description 1
- 101000897493 Homo sapiens C-C motif chemokine 26 Proteins 0.000 description 1
- 101000897494 Homo sapiens C-C motif chemokine 27 Proteins 0.000 description 1
- 101000897477 Homo sapiens C-C motif chemokine 28 Proteins 0.000 description 1
- 101000946370 Homo sapiens C-C motif chemokine 3-like 1 Proteins 0.000 description 1
- 101000777471 Homo sapiens C-C motif chemokine 4 Proteins 0.000 description 1
- 101000797758 Homo sapiens C-C motif chemokine 7 Proteins 0.000 description 1
- 101000947174 Homo sapiens C-X-C chemokine receptor type 1 Proteins 0.000 description 1
- 101000922405 Homo sapiens C-X-C chemokine receptor type 5 Proteins 0.000 description 1
- 101000858060 Homo sapiens C-X-C motif chemokine 11 Proteins 0.000 description 1
- 101000858064 Homo sapiens C-X-C motif chemokine 13 Proteins 0.000 description 1
- 101000858068 Homo sapiens C-X-C motif chemokine 14 Proteins 0.000 description 1
- 101000889133 Homo sapiens C-X-C motif chemokine 16 Proteins 0.000 description 1
- 101000889048 Homo sapiens C-X-C motif chemokine 17 Proteins 0.000 description 1
- 101000947193 Homo sapiens C-X-C motif chemokine 3 Proteins 0.000 description 1
- 101000947186 Homo sapiens C-X-C motif chemokine 5 Proteins 0.000 description 1
- 101000947177 Homo sapiens C-X-C motif chemokine 6 Proteins 0.000 description 1
- 101000868215 Homo sapiens CD40 ligand Proteins 0.000 description 1
- 101000934356 Homo sapiens CD70 antigen Proteins 0.000 description 1
- 101000989964 Homo sapiens Cardiotrophin-like cytokine factor 1 Proteins 0.000 description 1
- 101000715175 Homo sapiens Chemokine-like protein TAFA-1 Proteins 0.000 description 1
- 101000715173 Homo sapiens Chemokine-like protein TAFA-2 Proteins 0.000 description 1
- 101000715170 Homo sapiens Chemokine-like protein TAFA-3 Proteins 0.000 description 1
- 101000788132 Homo sapiens Chemokine-like protein TAFA-4 Proteins 0.000 description 1
- 101000788164 Homo sapiens Chemokine-like protein TAFA-5 Proteins 0.000 description 1
- 101000804771 Homo sapiens Cytokine SCM-1 beta Proteins 0.000 description 1
- 101001033280 Homo sapiens Cytokine receptor common subunit beta Proteins 0.000 description 1
- 101000880080 Homo sapiens Ectodysplasin-A Proteins 0.000 description 1
- 101000854520 Homo sapiens Fractalkine Proteins 0.000 description 1
- 101001069921 Homo sapiens Growth-regulated alpha protein Proteins 0.000 description 1
- 101000777663 Homo sapiens Hematopoietic progenitor cell antigen CD34 Proteins 0.000 description 1
- 101000959820 Homo sapiens Interferon alpha-1/13 Proteins 0.000 description 1
- 101001034829 Homo sapiens Interferon alpha-10 Proteins 0.000 description 1
- 101001034828 Homo sapiens Interferon alpha-14 Proteins 0.000 description 1
- 101000959794 Homo sapiens Interferon alpha-2 Proteins 0.000 description 1
- 101000959708 Homo sapiens Interferon alpha-4 Proteins 0.000 description 1
- 101000959704 Homo sapiens Interferon alpha-5 Proteins 0.000 description 1
- 101000961126 Homo sapiens Interferon alpha-7 Proteins 0.000 description 1
- 101000999391 Homo sapiens Interferon alpha-8 Proteins 0.000 description 1
- 101001054334 Homo sapiens Interferon beta Proteins 0.000 description 1
- 101001054329 Homo sapiens Interferon epsilon Proteins 0.000 description 1
- 101000599940 Homo sapiens Interferon gamma Proteins 0.000 description 1
- 101001002470 Homo sapiens Interferon lambda-1 Proteins 0.000 description 1
- 101000999370 Homo sapiens Interferon omega-1 Proteins 0.000 description 1
- 101001011441 Homo sapiens Interferon regulatory factor 4 Proteins 0.000 description 1
- 101001002634 Homo sapiens Interleukin-1 alpha Proteins 0.000 description 1
- 101001033249 Homo sapiens Interleukin-1 beta Proteins 0.000 description 1
- 101001076407 Homo sapiens Interleukin-1 receptor antagonist protein Proteins 0.000 description 1
- 101000998122 Homo sapiens Interleukin-37 Proteins 0.000 description 1
- 101001055222 Homo sapiens Interleukin-8 Proteins 0.000 description 1
- 101000804764 Homo sapiens Lymphotactin Proteins 0.000 description 1
- 101000764535 Homo sapiens Lymphotoxin-alpha Proteins 0.000 description 1
- 101000947178 Homo sapiens Platelet basic protein Proteins 0.000 description 1
- 101000582950 Homo sapiens Platelet factor 4 Proteins 0.000 description 1
- 101000713602 Homo sapiens T-box transcription factor TBX21 Proteins 0.000 description 1
- 101000830565 Homo sapiens Tumor necrosis factor ligand superfamily member 10 Proteins 0.000 description 1
- 101000830603 Homo sapiens Tumor necrosis factor ligand superfamily member 11 Proteins 0.000 description 1
- 101000830598 Homo sapiens Tumor necrosis factor ligand superfamily member 12 Proteins 0.000 description 1
- 101000830600 Homo sapiens Tumor necrosis factor ligand superfamily member 13 Proteins 0.000 description 1
- 101000830594 Homo sapiens Tumor necrosis factor ligand superfamily member 14 Proteins 0.000 description 1
- 101000830596 Homo sapiens Tumor necrosis factor ligand superfamily member 15 Proteins 0.000 description 1
- 101000764263 Homo sapiens Tumor necrosis factor ligand superfamily member 4 Proteins 0.000 description 1
- 244000309467 Human Coronavirus Species 0.000 description 1
- 241000701149 Human adenovirus 1 Species 0.000 description 1
- 241000701109 Human adenovirus 2 Species 0.000 description 1
- 241000711467 Human coronavirus 229E Species 0.000 description 1
- 241001109669 Human coronavirus HKU1 Species 0.000 description 1
- 241000482741 Human coronavirus NL63 Species 0.000 description 1
- 241000701027 Human herpesvirus 6 Species 0.000 description 1
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 1
- 241000713340 Human immunodeficiency virus 2 Species 0.000 description 1
- 241000701806 Human papillomavirus Species 0.000 description 1
- 241000829111 Human polyomavirus 1 Species 0.000 description 1
- 241000726041 Human respirovirus 1 Species 0.000 description 1
- 241000712003 Human respirovirus 3 Species 0.000 description 1
- 241001559187 Human rubulavirus 2 Species 0.000 description 1
- 241001559186 Human rubulavirus 4 Species 0.000 description 1
- 241001135958 Human type D retrovirus Species 0.000 description 1
- 206010021042 Hypopharyngeal cancer Diseases 0.000 description 1
- 206010056305 Hypopharyngeal neoplasm Diseases 0.000 description 1
- 206010062767 Hypophysitis Diseases 0.000 description 1
- 241001533448 Hypoviridae Species 0.000 description 1
- 241000543391 Hytrosaviridae Species 0.000 description 1
- 102000039989 IL-17 family Human genes 0.000 description 1
- 108091069193 IL-17 family Proteins 0.000 description 1
- 241000701378 Ichnovirus Species 0.000 description 1
- 241000711450 Infectious bronchitis virus Species 0.000 description 1
- 241000711804 Infectious hematopoietic necrosis virus Species 0.000 description 1
- 241000710921 Infectious pancreatic necrosis virus Species 0.000 description 1
- 108010034143 Inflammasomes Proteins 0.000 description 1
- 208000005726 Inflammatory Breast Neoplasms Diseases 0.000 description 1
- 206010021980 Inflammatory carcinoma of the breast Diseases 0.000 description 1
- 241000702394 Inoviridae Species 0.000 description 1
- 108010014726 Interferon Type I Proteins 0.000 description 1
- 102000002227 Interferon Type I Human genes 0.000 description 1
- 101710192051 Interferon alpha-1/13 Proteins 0.000 description 1
- 102100039734 Interferon alpha-10 Human genes 0.000 description 1
- 102100039733 Interferon alpha-14 Human genes 0.000 description 1
- 102100040018 Interferon alpha-2 Human genes 0.000 description 1
- 102100039949 Interferon alpha-4 Human genes 0.000 description 1
- 102100039948 Interferon alpha-5 Human genes 0.000 description 1
- 102100039350 Interferon alpha-7 Human genes 0.000 description 1
- 102100036532 Interferon alpha-8 Human genes 0.000 description 1
- 108010005716 Interferon beta-1a Proteins 0.000 description 1
- 108010005714 Interferon beta-1b Proteins 0.000 description 1
- 102100026688 Interferon epsilon Human genes 0.000 description 1
- 102100020990 Interferon lambda-1 Human genes 0.000 description 1
- 102100020989 Interferon lambda-2 Human genes 0.000 description 1
- 101710099622 Interferon lambda-2 Proteins 0.000 description 1
- 102100036479 Interferon omega-1 Human genes 0.000 description 1
- 102100030126 Interferon regulatory factor 4 Human genes 0.000 description 1
- 108010047761 Interferon-alpha Proteins 0.000 description 1
- 102000006992 Interferon-alpha Human genes 0.000 description 1
- 108090000467 Interferon-beta Proteins 0.000 description 1
- 229940119178 Interleukin 1 receptor antagonist Drugs 0.000 description 1
- 102100020881 Interleukin-1 alpha Human genes 0.000 description 1
- 102100039065 Interleukin-1 beta Human genes 0.000 description 1
- 102100026015 Interleukin-1 family member 10 Human genes 0.000 description 1
- 108050004799 Interleukin-1 family member 10 Proteins 0.000 description 1
- 102000051628 Interleukin-1 receptor antagonist Human genes 0.000 description 1
- 108090000177 Interleukin-11 Proteins 0.000 description 1
- 102000003815 Interleukin-11 Human genes 0.000 description 1
- 108090000176 Interleukin-13 Proteins 0.000 description 1
- 102000003816 Interleukin-13 Human genes 0.000 description 1
- 108090000172 Interleukin-15 Proteins 0.000 description 1
- 102000003812 Interleukin-15 Human genes 0.000 description 1
- 101800003050 Interleukin-16 Proteins 0.000 description 1
- 102000049772 Interleukin-16 Human genes 0.000 description 1
- 108050003558 Interleukin-17 Proteins 0.000 description 1
- 102000013691 Interleukin-17 Human genes 0.000 description 1
- 102000003810 Interleukin-18 Human genes 0.000 description 1
- 108090000171 Interleukin-18 Proteins 0.000 description 1
- 102100035017 Interleukin-18-binding protein Human genes 0.000 description 1
- 101710205006 Interleukin-18-binding protein Proteins 0.000 description 1
- 102100039879 Interleukin-19 Human genes 0.000 description 1
- 108050009288 Interleukin-19 Proteins 0.000 description 1
- 108010002350 Interleukin-2 Proteins 0.000 description 1
- 102000000588 Interleukin-2 Human genes 0.000 description 1
- 102100030704 Interleukin-21 Human genes 0.000 description 1
- 102100030703 Interleukin-22 Human genes 0.000 description 1
- 108010065637 Interleukin-23 Proteins 0.000 description 1
- 108010002386 Interleukin-3 Proteins 0.000 description 1
- 101710181613 Interleukin-31 Proteins 0.000 description 1
- 108010067003 Interleukin-33 Proteins 0.000 description 1
- 102100033474 Interleukin-36 alpha Human genes 0.000 description 1
- 108050004801 Interleukin-36 alpha Proteins 0.000 description 1
- 102100033498 Interleukin-36 beta Human genes 0.000 description 1
- 108050003379 Interleukin-36 beta Proteins 0.000 description 1
- 102100033503 Interleukin-36 gamma Human genes 0.000 description 1
- 101710195086 Interleukin-36 gamma Proteins 0.000 description 1
- 102100021150 Interleukin-36 receptor antagonist protein Human genes 0.000 description 1
- 101710089409 Interleukin-36 receptor antagonist protein Proteins 0.000 description 1
- 108090000978 Interleukin-4 Proteins 0.000 description 1
- 102000004388 Interleukin-4 Human genes 0.000 description 1
- 108010002616 Interleukin-5 Proteins 0.000 description 1
- 102000000743 Interleukin-5 Human genes 0.000 description 1
- 108010002586 Interleukin-7 Proteins 0.000 description 1
- 102100026236 Interleukin-8 Human genes 0.000 description 1
- 108010018951 Interleukin-8B Receptors Proteins 0.000 description 1
- 102000015696 Interleukins Human genes 0.000 description 1
- 108010063738 Interleukins Proteins 0.000 description 1
- 206010061252 Intraocular melanoma Diseases 0.000 description 1
- 241000701377 Iridoviridae Species 0.000 description 1
- 241000701372 Iridovirus Species 0.000 description 1
- 208000009164 Islet Cell Adenoma Diseases 0.000 description 1
- 241000710842 Japanese encephalitis virus Species 0.000 description 1
- 241000712890 Junin mammarenavirus Species 0.000 description 1
- 208000007766 Kaposi sarcoma Diseases 0.000 description 1
- 241000701646 Kappapapillomavirus 2 Species 0.000 description 1
- 241000120527 Kemerovo virus Species 0.000 description 1
- 208000008839 Kidney Neoplasms Diseases 0.000 description 1
- 241000724834 Kilham rat virus Species 0.000 description 1
- 102100020880 Kit ligand Human genes 0.000 description 1
- 101710177504 Kit ligand Proteins 0.000 description 1
- 241000897510 Klamath virus Species 0.000 description 1
- 208000000675 Krukenberg Tumor Diseases 0.000 description 1
- 241000713102 La Crosse virus Species 0.000 description 1
- 241000186660 Lactobacillus Species 0.000 description 1
- 241001520693 Lagos bat lyssavirus Species 0.000 description 1
- 241001428884 Langur virus Species 0.000 description 1
- 208000031671 Large B-Cell Diffuse Lymphoma Diseases 0.000 description 1
- 208000006404 Large Granular Lymphocytic Leukemia Diseases 0.000 description 1
- 208000032004 Large-Cell Anaplastic Lymphoma Diseases 0.000 description 1
- 206010023927 Lassa fever Diseases 0.000 description 1
- 241000712902 Lassa mammarenavirus Species 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- 108010092277 Leptin Proteins 0.000 description 1
- 102000016267 Leptin Human genes 0.000 description 1
- 241000714210 Leviviridae Species 0.000 description 1
- 241000234435 Lilium Species 0.000 description 1
- 206010062038 Lip neoplasm Diseases 0.000 description 1
- 102000003752 Lipocalin 1 Human genes 0.000 description 1
- 108010057281 Lipocalin 1 Proteins 0.000 description 1
- 241000701365 Lipothrixviridae Species 0.000 description 1
- 108020005198 Long Noncoding RNA Proteins 0.000 description 1
- 241000253097 Luteoviridae Species 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- 241000195947 Lycopodium Species 0.000 description 1
- 208000008771 Lymphadenopathy Diseases 0.000 description 1
- 206010025219 Lymphangioma Diseases 0.000 description 1
- 241000701043 Lymphocryptovirus Species 0.000 description 1
- 206010025312 Lymphoma AIDS related Diseases 0.000 description 1
- 102100035304 Lymphotactin Human genes 0.000 description 1
- 102100026238 Lymphotoxin-alpha Human genes 0.000 description 1
- 101710145006 Lysis protein Proteins 0.000 description 1
- 201000003791 MALT lymphoma Diseases 0.000 description 1
- 241000282553 Macaca Species 0.000 description 1
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 1
- 241000712898 Machupo mammarenavirus Species 0.000 description 1
- 108010009474 Macrophage Inflammatory Proteins Proteins 0.000 description 1
- 102000009571 Macrophage Inflammatory Proteins Human genes 0.000 description 1
- 241000218922 Magnoliophyta Species 0.000 description 1
- 241000175209 Malacoherpesviridae Species 0.000 description 1
- 208000030070 Malignant epithelial tumor of ovary Diseases 0.000 description 1
- 206010025997 Malignant neoplasm of islets of Langerhans Diseases 0.000 description 1
- 206010073059 Malignant neoplasm of unknown primary site Diseases 0.000 description 1
- 208000032271 Malignant tumor of penis Diseases 0.000 description 1
- 241001480504 Mammalian orthoreovirus 1 Species 0.000 description 1
- 241001480506 Mammalian orthoreovirus 2 Species 0.000 description 1
- 240000003183 Manihot esculenta Species 0.000 description 1
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 1
- 208000025205 Mantle-Cell Lymphoma Diseases 0.000 description 1
- 241001559177 Mapuera rubulavirus Species 0.000 description 1
- 241000645849 Marseilleviridae Species 0.000 description 1
- 241000701244 Mastadenovirus Species 0.000 description 1
- 101710085938 Matrix protein Proteins 0.000 description 1
- 208000037196 Medullary thyroid carcinoma Diseases 0.000 description 1
- 208000035490 Megakaryoblastic Acute Leukemia Diseases 0.000 description 1
- 206010027145 Melanocytic naevus Diseases 0.000 description 1
- 101710127721 Membrane protein Proteins 0.000 description 1
- 241001643857 Menangle virus Species 0.000 description 1
- 208000002030 Merkel cell carcinoma Diseases 0.000 description 1
- 241001009374 Mesoniviridae Species 0.000 description 1
- 206010027462 Metastases to ovary Diseases 0.000 description 1
- 206010027480 Metastatic malignant melanoma Diseases 0.000 description 1
- 108700011259 MicroRNAs Proteins 0.000 description 1
- 241000702318 Microviridae Species 0.000 description 1
- 241000710949 Middelburg virus Species 0.000 description 1
- 208000025370 Middle East respiratory syndrome Diseases 0.000 description 1
- 241000127282 Middle East respiratory syndrome-related coronavirus Species 0.000 description 1
- 241000186187 Mimiviridae Species 0.000 description 1
- 241000008903 Miniopterus bat coronavirus HKU8 Species 0.000 description 1
- 241000972316 Mink coronavirus 1 Species 0.000 description 1
- 241000702625 Mink enteritis virus Species 0.000 description 1
- 101710151803 Mitochondrial intermediate peptidase 2 Proteins 0.000 description 1
- 241000725171 Mokola lyssavirus Species 0.000 description 1
- 241000700559 Molluscipoxvirus Species 0.000 description 1
- 241000700560 Molluscum contagiosum virus Species 0.000 description 1
- 241000713862 Moloney murine sarcoma virus Species 0.000 description 1
- 241000700627 Monkeypox virus Species 0.000 description 1
- 208000035489 Monocytic Acute Leukemia Diseases 0.000 description 1
- 241000711513 Mononegavirales Species 0.000 description 1
- 241000479161 Mount Elgon bat virus Species 0.000 description 1
- 241000713333 Mouse mammary tumor virus Species 0.000 description 1
- 241000868135 Mucambo virus Species 0.000 description 1
- 208000005647 Mumps Diseases 0.000 description 1
- 241000711386 Mumps virus Species 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 241000701029 Murid betaherpesvirus 1 Species 0.000 description 1
- 241001136036 Murid betaherpesvirus 2 Species 0.000 description 1
- 241000008906 Murine coronavirus Species 0.000 description 1
- 241000699660 Mus musculus Species 0.000 description 1
- 101100381525 Mus musculus Bcl6 gene Proteins 0.000 description 1
- 101000978374 Mus musculus C-C motif chemokine 12 Proteins 0.000 description 1
- 101100222387 Mus musculus Cxcl15 gene Proteins 0.000 description 1
- 201000003793 Myelodysplastic syndrome Diseases 0.000 description 1
- 208000033761 Myelogenous Chronic BCR-ABL Positive Leukemia Diseases 0.000 description 1
- 208000037538 Myelomonocytic Juvenile Leukemia Diseases 0.000 description 1
- 208000014767 Myeloproliferative disease Diseases 0.000 description 1
- 201000004458 Myoma Diseases 0.000 description 1
- 241000701553 Myoviridae Species 0.000 description 1
- 241000700562 Myxoma virus Species 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- 241001457453 Nairobi sheep disease virus Species 0.000 description 1
- 241001250129 Nannochloropsis gaditana Species 0.000 description 1
- 241001336717 Nanoviridae Species 0.000 description 1
- 241000264424 Nariva virus Species 0.000 description 1
- 241001112477 Narnaviridae Species 0.000 description 1
- 208000001894 Nasopharyngeal Neoplasms Diseases 0.000 description 1
- 206010061306 Nasopharyngeal cancer Diseases 0.000 description 1
- 206010028851 Necrosis Diseases 0.000 description 1
- 241000238847 Nelson Bay orthoreovirus Species 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 206010053584 Neonatal pneumonia Diseases 0.000 description 1
- 208000009277 Neuroectodermal Tumors Diseases 0.000 description 1
- 206010029266 Neuroendocrine carcinoma of the skin Diseases 0.000 description 1
- 201000004404 Neurofibroma Diseases 0.000 description 1
- 208000005890 Neuroma Diseases 0.000 description 1
- 208000033755 Neutrophilic Chronic Leukemia Diseases 0.000 description 1
- 208000007256 Nevus Diseases 0.000 description 1
- 241001244466 New world arenaviruses Species 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 108010064862 Nicotinamide phosphoribosyltransferase Proteins 0.000 description 1
- 102000015532 Nicotinamide phosphoribosyltransferase Human genes 0.000 description 1
- 241001484257 Nimaviridae Species 0.000 description 1
- 241000723741 Nodaviridae Species 0.000 description 1
- 206010029488 Nodular melanoma Diseases 0.000 description 1
- 241000714209 Norwalk virus Species 0.000 description 1
- 208000010505 Nose Neoplasms Diseases 0.000 description 1
- 101710141454 Nucleoprotein Proteins 0.000 description 1
- 241000439378 Nyamiviridae Species 0.000 description 1
- 108010042215 OX40 Ligand Proteins 0.000 description 1
- 208000007871 Odontogenic Tumors Diseases 0.000 description 1
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 206010048757 Oncocytoma Diseases 0.000 description 1
- 102000043276 Oncogene Human genes 0.000 description 1
- 241000922889 Ophioviridae Species 0.000 description 1
- 241000702259 Orbivirus Species 0.000 description 1
- 241000700635 Orf virus Species 0.000 description 1
- 206010031096 Oropharyngeal cancer Diseases 0.000 description 1
- 206010057444 Oropharyngeal neoplasm Diseases 0.000 description 1
- 241000713112 Orthobunyavirus Species 0.000 description 1
- 241000700732 Orthohepadnavirus Species 0.000 description 1
- 241000712464 Orthomyxoviridae Species 0.000 description 1
- 241000150218 Orthonairovirus Species 0.000 description 1
- 241000700629 Orthopoxvirus Species 0.000 description 1
- 241000702244 Orthoreovirus Species 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 208000007571 Ovarian Epithelial Carcinoma Diseases 0.000 description 1
- 206010061328 Ovarian epithelial cancer Diseases 0.000 description 1
- 241000123724 Ovine papillomavirus Species 0.000 description 1
- 208000002063 Oxyphilic Adenoma Diseases 0.000 description 1
- 208000025618 Paget disease of nipple Diseases 0.000 description 1
- 241000282577 Pan troglodytes Species 0.000 description 1
- 208000037064 Papilloma of choroid plexus Diseases 0.000 description 1
- 241001504519 Papio ursinus Species 0.000 description 1
- 206010033733 Papule Diseases 0.000 description 1
- 206010061332 Paraganglion neoplasm Diseases 0.000 description 1
- 241000711504 Paramyxoviridae Species 0.000 description 1
- 241000700639 Parapoxvirus Species 0.000 description 1
- 208000000821 Parathyroid Neoplasms Diseases 0.000 description 1
- 206010033976 Paravaccinia Diseases 0.000 description 1
- 241000710936 Partitiviridae Species 0.000 description 1
- 241000701945 Parvoviridae Species 0.000 description 1
- 208000002471 Penile Neoplasms Diseases 0.000 description 1
- 206010034299 Penile cancer Diseases 0.000 description 1
- 108010047320 Pepsinogen A Proteins 0.000 description 1
- 229920002485 Peptide(-Arg) Polymers 0.000 description 1
- 241000150350 Peribunyaviridae Species 0.000 description 1
- 208000031839 Peripheral nerve sheath tumour malignant Diseases 0.000 description 1
- 241000520712 Permutotetraviridae Species 0.000 description 1
- 241000710778 Pestivirus Species 0.000 description 1
- 208000009565 Pharyngeal Neoplasms Diseases 0.000 description 1
- 206010034811 Pharyngeal cancer Diseases 0.000 description 1
- 241000701253 Phycodnaviridae Species 0.000 description 1
- 244000082204 Phyllostachys viridis Species 0.000 description 1
- 235000015334 Phyllostachys viridis Nutrition 0.000 description 1
- 241001627241 Picobirnaviridae Species 0.000 description 1
- 241000008909 Pipistrellus bat coronavirus HKU5 Species 0.000 description 1
- 201000005746 Pituitary adenoma Diseases 0.000 description 1
- 206010061538 Pituitary tumour benign Diseases 0.000 description 1
- 241000868134 Pixuna virus Species 0.000 description 1
- 241000701369 Plasmaviridae Species 0.000 description 1
- 102100036154 Platelet basic protein Human genes 0.000 description 1
- 108090000778 Platelet factor 4 Proteins 0.000 description 1
- 241000711902 Pneumovirus Species 0.000 description 1
- 241000702072 Podoviridae Species 0.000 description 1
- 208000008601 Polycythemia Diseases 0.000 description 1
- 241001631648 Polyomaviridae Species 0.000 description 1
- 241000985694 Polypodiopsida Species 0.000 description 1
- 241001135549 Porcine epidemic diarrhea virus Species 0.000 description 1
- 241000702619 Porcine parvovirus Species 0.000 description 1
- 208000003971 Posterior uveitis Diseases 0.000 description 1
- 241001533393 Potyviridae Species 0.000 description 1
- 241000700625 Poxviridae Species 0.000 description 1
- 208000006664 Precursor Cell Lymphoblastic Leukemia-Lymphoma Diseases 0.000 description 1
- 206010065857 Primary Effusion Lymphoma Diseases 0.000 description 1
- 208000026149 Primary peritoneal carcinoma Diseases 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 208000033759 Prolymphocytic T-Cell Leukemia Diseases 0.000 description 1
- 208000033826 Promyelocytic Acute Leukemia Diseases 0.000 description 1
- 241000150258 Prospect Hill orthohantavirus Species 0.000 description 1
- 206010060862 Prostate cancer Diseases 0.000 description 1
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 1
- 102000016611 Proteoglycans Human genes 0.000 description 1
- 108010067787 Proteoglycans Proteins 0.000 description 1
- 208000010378 Pulmonary Embolism Diseases 0.000 description 1
- 201000008183 Pulmonary blastoma Diseases 0.000 description 1
- 244000184734 Pyrus japonica Species 0.000 description 1
- 241000569181 Quailpox virus Species 0.000 description 1
- 241000711798 Rabies lyssavirus Species 0.000 description 1
- 241000702434 Raccoon parvovirus Species 0.000 description 1
- 241000700638 Raccoonpox virus Species 0.000 description 1
- 208000034541 Rare lymphatic malformation Diseases 0.000 description 1
- 241000320410 Rat sialodacryoadenitis coronavirus Species 0.000 description 1
- 241000714180 Rauscher mink cell focus-forming virus Species 0.000 description 1
- 208000015634 Rectal Neoplasms Diseases 0.000 description 1
- 206010038389 Renal cancer Diseases 0.000 description 1
- 208000006265 Renal cell carcinoma Diseases 0.000 description 1
- 102100028255 Renin Human genes 0.000 description 1
- 108090000783 Renin Proteins 0.000 description 1
- 241000702247 Reoviridae Species 0.000 description 1
- 241000725643 Respiratory syncytial virus Species 0.000 description 1
- 206010057190 Respiratory tract infections Diseases 0.000 description 1
- 201000000582 Retinoblastoma Diseases 0.000 description 1
- 241000711931 Rhabdoviridae Species 0.000 description 1
- 241000004178 Rhinolophus bat coronavirus HKU2 Species 0.000 description 1
- 208000025316 Richter syndrome Diseases 0.000 description 1
- 241000606697 Rickettsia prowazekii Species 0.000 description 1
- 241000713124 Rift Valley fever virus Species 0.000 description 1
- 241001534527 Roniviridae Species 0.000 description 1
- 241000710942 Ross River virus Species 0.000 description 1
- 241000714474 Rous sarcoma virus Species 0.000 description 1
- 241000008907 Rousettus bat coronavirus HKU9 Species 0.000 description 1
- 241000710801 Rubivirus Species 0.000 description 1
- 241000040592 Rudiviridae Species 0.000 description 1
- 108010017324 STAT3 Transcription Factor Proteins 0.000 description 1
- 108010019992 STAT4 Transcription Factor Proteins 0.000 description 1
- 102000005886 STAT4 Transcription Factor Human genes 0.000 description 1
- 108010011005 STAT6 Transcription Factor Proteins 0.000 description 1
- 241000192617 Sabia mammarenavirus Species 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 1
- 101100394363 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) HBN1 gene Proteins 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- 241000608282 Sagiyama virus Species 0.000 description 1
- 241000701062 Saimiriine gammaherpesvirus 2 Species 0.000 description 1
- 208000004337 Salivary Gland Neoplasms Diseases 0.000 description 1
- 206010061934 Salivary gland cancer Diseases 0.000 description 1
- 241001135555 Sandfly fever Sicilian virus Species 0.000 description 1
- 241000593524 Sargassum patens Species 0.000 description 1
- 208000006938 Schwannomatosis Diseases 0.000 description 1
- 241000555745 Sciuridae Species 0.000 description 1
- 241001047198 Scomberomorus semifasciatus Species 0.000 description 1
- 241001123657 Seal parapoxvirus Species 0.000 description 1
- 241000961587 Secoviridae Species 0.000 description 1
- 201000010208 Seminoma Diseases 0.000 description 1
- 241001632234 Senecavirus Species 0.000 description 1
- 206010040047 Sepsis Diseases 0.000 description 1
- 208000000097 Sertoli-Leydig cell tumor Diseases 0.000 description 1
- 208000009359 Sezary Syndrome Diseases 0.000 description 1
- 208000021388 Sezary disease Diseases 0.000 description 1
- 241000700665 Sheeppox virus Species 0.000 description 1
- 108010079723 Shiga Toxin Proteins 0.000 description 1
- 102100024040 Signal transducer and activator of transcription 3 Human genes 0.000 description 1
- 102100023980 Signal transducer and activator of transcription 6 Human genes 0.000 description 1
- 241000710192 Simian hepatitis A virus Species 0.000 description 1
- 241000713311 Simian immunodeficiency virus Species 0.000 description 1
- 241000580858 Simian-Human immunodeficiency virus Species 0.000 description 1
- 241000710960 Sindbis virus Species 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 241000702202 Siphoviridae Species 0.000 description 1
- 208000000453 Skin Neoplasms Diseases 0.000 description 1
- 208000001203 Smallpox Diseases 0.000 description 1
- 208000021712 Soft tissue sarcoma Diseases 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 241001514388 Sphaerolipoviridae Species 0.000 description 1
- 102220599672 Spindlin-1_D614G_mutation Human genes 0.000 description 1
- 241000405448 Spiraviridae Species 0.000 description 1
- 241000713820 Squirrel monkey retrovirus Species 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 241000194019 Streptococcus mutans Species 0.000 description 1
- 241000702287 Sugarcane streak virus Species 0.000 description 1
- 241000701093 Suid alphaherpesvirus 1 Species 0.000 description 1
- 241000700568 Suipoxvirus Species 0.000 description 1
- 241000700565 Swinepox virus Species 0.000 description 1
- 208000031673 T-Cell Cutaneous Lymphoma Diseases 0.000 description 1
- 102100036840 T-box transcription factor TBX21 Human genes 0.000 description 1
- 208000029052 T-cell acute lymphoblastic leukemia Diseases 0.000 description 1
- 208000026651 T-cell prolymphocytic leukemia Diseases 0.000 description 1
- 101150077103 TPO gene Proteins 0.000 description 1
- 241000404000 Tanapox virus Species 0.000 description 1
- 241001137863 Taterapox virus Species 0.000 description 1
- 241000701521 Tectiviridae Species 0.000 description 1
- 208000024313 Testicular Neoplasms Diseases 0.000 description 1
- 201000000331 Testicular germ cell cancer Diseases 0.000 description 1
- 206010057644 Testis cancer Diseases 0.000 description 1
- 206010043515 Throat cancer Diseases 0.000 description 1
- 241000947555 Thrush coronavirus HKU12 Species 0.000 description 1
- 201000009365 Thymic carcinoma Diseases 0.000 description 1
- 208000024770 Thyroid neoplasm Diseases 0.000 description 1
- 241000710771 Tick-borne encephalitis virus Species 0.000 description 1
- 241001125862 Tinca tinca Species 0.000 description 1
- 241000341969 Tioman virus Species 0.000 description 1
- 241000711517 Torovirus Species 0.000 description 1
- 241000710915 Totiviridae Species 0.000 description 1
- 108090001012 Transforming Growth Factor beta Proteins 0.000 description 1
- 102000004887 Transforming Growth Factor beta Human genes 0.000 description 1
- 102000046299 Transforming Growth Factor beta1 Human genes 0.000 description 1
- 108010009583 Transforming Growth Factors Proteins 0.000 description 1
- 102000009618 Transforming Growth Factors Human genes 0.000 description 1
- 101800004564 Transforming growth factor alpha Proteins 0.000 description 1
- 102400001320 Transforming growth factor alpha Human genes 0.000 description 1
- 101800002279 Transforming growth factor beta-1 Proteins 0.000 description 1
- 102000056172 Transforming growth factor beta-3 Human genes 0.000 description 1
- 108090000097 Transforming growth factor beta-3 Proteins 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- 101710097160 Tumor necrosis factor ligand superfamily member 10 Proteins 0.000 description 1
- 101710097155 Tumor necrosis factor ligand superfamily member 12 Proteins 0.000 description 1
- 102100024585 Tumor necrosis factor ligand superfamily member 13 Human genes 0.000 description 1
- 101710181056 Tumor necrosis factor ligand superfamily member 13B Proteins 0.000 description 1
- 102100024586 Tumor necrosis factor ligand superfamily member 14 Human genes 0.000 description 1
- 102100024587 Tumor necrosis factor ligand superfamily member 15 Human genes 0.000 description 1
- 102100032101 Tumor necrosis factor ligand superfamily member 9 Human genes 0.000 description 1
- 241000287436 Turdus merula Species 0.000 description 1
- 241000711955 Turkey rhinotracheitis virus Species 0.000 description 1
- 241000385708 Turkeypox virus Species 0.000 description 1
- 241000008908 Tylonycteris bat coronavirus HKU4 Species 0.000 description 1
- 241001059845 Tymoviridae Species 0.000 description 1
- GBOGMAARMMDZGR-UHFFFAOYSA-N UNPD149280 Natural products N1C(=O)C23OC(=O)C=CC(O)CCCC(C)CC=CC3C(O)C(=C)C(C)C2C1CC1=CC=CC=C1 GBOGMAARMMDZGR-UHFFFAOYSA-N 0.000 description 1
- 208000025865 Ulcer Diseases 0.000 description 1
- 206010046431 Urethral cancer Diseases 0.000 description 1
- 206010046458 Urethral neoplasms Diseases 0.000 description 1
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 1
- 208000008385 Urogenital Neoplasms Diseases 0.000 description 1
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 1
- 208000002495 Uterine Neoplasms Diseases 0.000 description 1
- 201000005969 Uveal melanoma Diseases 0.000 description 1
- 206010046980 Varicella Diseases 0.000 description 1
- 241000701067 Varicellovirus Species 0.000 description 1
- 208000002687 Venezuelan Equine Encephalomyelitis Diseases 0.000 description 1
- 201000009145 Venezuelan equine encephalitis Diseases 0.000 description 1
- 201000009693 Venezuelan hemorrhagic fever Diseases 0.000 description 1
- 241000711970 Vesiculovirus Species 0.000 description 1
- 208000014070 Vestibular schwannoma Diseases 0.000 description 1
- 241000271897 Viperidae Species 0.000 description 1
- 208000028227 Viral hemorrhagic fever Diseases 0.000 description 1
- 108070000030 Viral receptors Proteins 0.000 description 1
- 241000713325 Visna/maedi virus Species 0.000 description 1
- 102100038611 Vitamin D-binding protein Human genes 0.000 description 1
- 241001137865 Volepox virus Species 0.000 description 1
- 206010047700 Vomiting Diseases 0.000 description 1
- 208000004354 Vulvar Neoplasms Diseases 0.000 description 1
- 241000120535 Wallal virus Species 0.000 description 1
- 241000710886 West Nile virus Species 0.000 description 1
- 208000005466 Western Equine Encephalomyelitis Diseases 0.000 description 1
- 201000005806 Western equine encephalitis Diseases 0.000 description 1
- 241000231320 Whataroa virus Species 0.000 description 1
- 208000008383 Wilms tumor Diseases 0.000 description 1
- 241001492404 Woodchuck hepatitis virus Species 0.000 description 1
- 241000714205 Woolly monkey sarcoma virus Species 0.000 description 1
- 241000702661 Wound tumor virus Species 0.000 description 1
- 241000700574 Yatapoxvirus Species 0.000 description 1
- 241000710772 Yellow fever virus Species 0.000 description 1
- 208000012018 Yolk sac tumor Diseases 0.000 description 1
- 241001481505 Yug Bogdanovac vesiculovirus Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 1
- 206010000269 abscess Diseases 0.000 description 1
- 206010059394 acanthoma Diseases 0.000 description 1
- 208000004064 acoustic neuroma Diseases 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 208000021841 acute erythroid leukemia Diseases 0.000 description 1
- 208000013593 acute megakaryoblastic leukemia Diseases 0.000 description 1
- 208000020700 acute megakaryocytic leukemia Diseases 0.000 description 1
- 210000005006 adaptive immune system Anatomy 0.000 description 1
- 208000002517 adenoid cystic carcinoma Diseases 0.000 description 1
- 201000008395 adenosquamous carcinoma Diseases 0.000 description 1
- 108700010877 adenoviridae proteins Proteins 0.000 description 1
- 210000001789 adipocyte Anatomy 0.000 description 1
- 239000000478 adipokine Substances 0.000 description 1
- 238000011467 adoptive cell therapy Methods 0.000 description 1
- 230000001919 adrenal effect Effects 0.000 description 1
- 210000004100 adrenal gland Anatomy 0.000 description 1
- 201000006966 adult T-cell leukemia Diseases 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 208000015230 aggressive NK-cell leukemia Diseases 0.000 description 1
- 210000005058 airway cell Anatomy 0.000 description 1
- 150000003797 alkaloid derivatives Chemical class 0.000 description 1
- 210000001132 alveolar macrophage Anatomy 0.000 description 1
- 229940035676 analgesics Drugs 0.000 description 1
- 239000000730 antalgic agent Substances 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000003712 anti-aging effect Effects 0.000 description 1
- 230000003556 anti-epileptic effect Effects 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 239000003146 anticoagulant agent Substances 0.000 description 1
- 229940127219 anticoagulant drug Drugs 0.000 description 1
- 239000001961 anticonvulsive agent Substances 0.000 description 1
- 239000000935 antidepressant agent Substances 0.000 description 1
- 229940005513 antidepressants Drugs 0.000 description 1
- 229960003965 antiepileptics Drugs 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 229940041181 antineoplastic drug Drugs 0.000 description 1
- 239000000164 antipsychotic agent Substances 0.000 description 1
- 229940005529 antipsychotics Drugs 0.000 description 1
- 229940121357 antivirals Drugs 0.000 description 1
- 201000011165 anus cancer Diseases 0.000 description 1
- 210000000040 apocrine gland Anatomy 0.000 description 1
- 230000001640 apoptogenic effect Effects 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 208000021780 appendiceal neoplasm Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 210000004396 apud cell Anatomy 0.000 description 1
- 206010003246 arthritis Diseases 0.000 description 1
- 244000309743 astrovirus Species 0.000 description 1
- 210000002453 autonomic neuron Anatomy 0.000 description 1
- DXZFFLRJVDZCMT-UHFFFAOYSA-N azane 2,2,2-trichloro-1,3,2lambda6-dioxatellurolane Chemical compound Cl[TeH]1(OCCO1)(Cl)Cl.N DXZFFLRJVDZCMT-UHFFFAOYSA-N 0.000 description 1
- 208000022362 bacterial infectious disease Diseases 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 210000004666 bacterial spore Anatomy 0.000 description 1
- 239000011425 bamboo Substances 0.000 description 1
- 210000004082 barrier epithelial cell Anatomy 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 210000002947 bartholin's gland Anatomy 0.000 description 1
- 210000002469 basement membrane Anatomy 0.000 description 1
- 210000002228 beta-basophil Anatomy 0.000 description 1
- 102000006635 beta-lactamase Human genes 0.000 description 1
- 208000026900 bile duct neoplasm Diseases 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 201000000053 blastoma Diseases 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 210000004204 blood vessel Anatomy 0.000 description 1
- 210000002449 bone cell Anatomy 0.000 description 1
- 201000011143 bone giant cell tumor Diseases 0.000 description 1
- 208000008921 border disease Diseases 0.000 description 1
- 210000000133 brain stem Anatomy 0.000 description 1
- 238000000339 bright-field microscopy Methods 0.000 description 1
- 235000012467 brownies Nutrition 0.000 description 1
- 210000000465 brunner gland Anatomy 0.000 description 1
- 229940074375 burkholderia mallei Drugs 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 208000002458 carcinoid tumor Diseases 0.000 description 1
- 210000004413 cardiac myocyte Anatomy 0.000 description 1
- 238000012754 cardiac puncture Methods 0.000 description 1
- 210000000845 cartilage Anatomy 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 241001233037 catfish Species 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000009087 cell motility Effects 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 230000017455 cell-cell adhesion Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 210000004718 centriole Anatomy 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 201000007335 cerebellar astrocytoma Diseases 0.000 description 1
- 208000030239 cerebral astrocytoma Diseases 0.000 description 1
- 210000002939 cerumen Anatomy 0.000 description 1
- 201000010881 cervical cancer Diseases 0.000 description 1
- 229940044683 chemotherapy drug Drugs 0.000 description 1
- 201000005217 chondroblastoma Diseases 0.000 description 1
- 210000003737 chromaffin cell Anatomy 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 208000032852 chronic lymphocytic leukemia Diseases 0.000 description 1
- 201000006778 chronic monocytic leukemia Diseases 0.000 description 1
- 201000010902 chronic myelomonocytic leukemia Diseases 0.000 description 1
- 201000010903 chronic neutrophilic leukemia Diseases 0.000 description 1
- 210000000254 ciliated cell Anatomy 0.000 description 1
- 229960003920 cocaine Drugs 0.000 description 1
- 201000010276 collecting duct carcinoma Diseases 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- 210000002808 connective tissue Anatomy 0.000 description 1
- 210000000555 contractile cell Anatomy 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000011359 convalescent plasma therapy Methods 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 208000017563 cutaneous Paget disease Diseases 0.000 description 1
- 201000007241 cutaneous T cell lymphoma Diseases 0.000 description 1
- 208000035250 cutaneous malignant susceptibility to 1 melanoma Diseases 0.000 description 1
- 208000017763 cutaneous neuroendocrine carcinoma Diseases 0.000 description 1
- GBOGMAARMMDZGR-JREHFAHYSA-N cytochalasin B Natural products C[C@H]1CCC[C@@H](O)C=CC(=O)O[C@@]23[C@H](C=CC1)[C@H](O)C(=C)[C@@H](C)[C@@H]2[C@H](Cc4ccccc4)NC3=O GBOGMAARMMDZGR-JREHFAHYSA-N 0.000 description 1
- GBOGMAARMMDZGR-TYHYBEHESA-N cytochalasin B Chemical compound C([C@H]1[C@@H]2[C@@H](C([C@@H](O)[C@@H]3/C=C/C[C@H](C)CCC[C@@H](O)/C=C/C(=O)O[C@@]23C(=O)N1)=C)C)C1=CC=CC=C1 GBOGMAARMMDZGR-TYHYBEHESA-N 0.000 description 1
- 231100000433 cytotoxic Toxicity 0.000 description 1
- 230000001472 cytotoxic effect Effects 0.000 description 1
- PCCPERGCFKIYIS-AWEZNQCLSA-N daxalipram Chemical compound C1=C(OC)C(OCCC)=CC([C@@]2(C)OC(=O)NC2)=C1 PCCPERGCFKIYIS-AWEZNQCLSA-N 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 210000003298 dental enamel Anatomy 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 206010012818 diffuse large B-cell lymphoma Diseases 0.000 description 1
- 102000038379 digestive enzymes Human genes 0.000 description 1
- 108091007734 digestive enzymes Proteins 0.000 description 1
- 210000002249 digestive system Anatomy 0.000 description 1
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 239000002552 dosage form Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000012377 drug delivery Methods 0.000 description 1
- 230000002183 duodenal effect Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 201000008184 embryoma Diseases 0.000 description 1
- 210000001671 embryonic stem cell Anatomy 0.000 description 1
- 201000011523 endocrine gland cancer Diseases 0.000 description 1
- 210000000750 endocrine system Anatomy 0.000 description 1
- 208000001991 endodermal sinus tumor Diseases 0.000 description 1
- 210000005168 endometrial cell Anatomy 0.000 description 1
- 230000002357 endometrial effect Effects 0.000 description 1
- 208000027858 endometrioid tumor Diseases 0.000 description 1
- 210000001163 endosome Anatomy 0.000 description 1
- 210000002889 endothelial cell Anatomy 0.000 description 1
- 210000004188 enterochromaffin-like cell Anatomy 0.000 description 1
- 210000003158 enteroendocrine cell Anatomy 0.000 description 1
- 230000000688 enterotoxigenic effect Effects 0.000 description 1
- 230000002327 eosinophilic effect Effects 0.000 description 1
- 210000001339 epidermal cell Anatomy 0.000 description 1
- 210000005175 epidermal keratinocyte Anatomy 0.000 description 1
- 210000003386 epithelial cell of thymus gland Anatomy 0.000 description 1
- 208000010932 epithelial neoplasm Diseases 0.000 description 1
- 229940105423 erythropoietin Drugs 0.000 description 1
- 201000004101 esophageal cancer Diseases 0.000 description 1
- 230000017188 evasion or tolerance of host immune response Effects 0.000 description 1
- 201000005884 exanthem Diseases 0.000 description 1
- 210000002744 extracellular matrix Anatomy 0.000 description 1
- 210000001813 extracellular matrix secreting cell Anatomy 0.000 description 1
- 210000003414 extremity Anatomy 0.000 description 1
- 208000024519 eye neoplasm Diseases 0.000 description 1
- 210000000744 eyelid Anatomy 0.000 description 1
- 201000010972 female reproductive endometrioid cancer Diseases 0.000 description 1
- 210000004904 fingernail bed Anatomy 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 108700014844 flt3 ligand Proteins 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 230000003325 follicular Effects 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 210000004475 gamma-delta t lymphocyte Anatomy 0.000 description 1
- 201000008361 ganglioneuroma Diseases 0.000 description 1
- 201000011587 gastric lymphoma Diseases 0.000 description 1
- 238000010363 gene targeting Methods 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 201000007116 gestational trophoblastic neoplasm Diseases 0.000 description 1
- 230000000762 glandular Effects 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 239000003163 gonadal steroid hormone Substances 0.000 description 1
- 208000003064 gonadoblastoma Diseases 0.000 description 1
- 230000003394 haemopoietic effect Effects 0.000 description 1
- 208000017772 hamartoma of lung Diseases 0.000 description 1
- 230000008821 health effect Effects 0.000 description 1
- 201000010235 heart cancer Diseases 0.000 description 1
- 208000024348 heart neoplasm Diseases 0.000 description 1
- 229940037467 helicobacter pylori Drugs 0.000 description 1
- 230000003067 hemagglutinative effect Effects 0.000 description 1
- 201000002222 hemangioblastoma Diseases 0.000 description 1
- 230000002489 hematologic effect Effects 0.000 description 1
- 208000031169 hemorrhagic disease Diseases 0.000 description 1
- 230000002008 hemorrhagic effect Effects 0.000 description 1
- 230000002440 hepatic effect Effects 0.000 description 1
- 210000003494 hepatocyte Anatomy 0.000 description 1
- 206010066957 hepatosplenic T-cell lymphoma Diseases 0.000 description 1
- 201000011045 hereditary breast ovarian cancer syndrome Diseases 0.000 description 1
- 208000029824 high grade glioma Diseases 0.000 description 1
- 238000000703 high-speed centrifugation Methods 0.000 description 1
- 235000003642 hunger Nutrition 0.000 description 1
- 201000006866 hypopharynx cancer Diseases 0.000 description 1
- 230000002267 hypothalamic effect Effects 0.000 description 1
- 230000002519 immonomodulatory effect Effects 0.000 description 1
- 230000005934 immune activation Effects 0.000 description 1
- 230000003053 immunization Effects 0.000 description 1
- 238000002649 immunization Methods 0.000 description 1
- 238000003119 immunoblot Methods 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 201000004933 in situ carcinoma Diseases 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 208000037951 infantile gastroenteritis Diseases 0.000 description 1
- 201000006747 infectious mononucleosis Diseases 0.000 description 1
- 201000004653 inflammatory breast carcinoma Diseases 0.000 description 1
- 108700010900 influenza virus proteins Proteins 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 108010044426 integrins Proteins 0.000 description 1
- 102000006495 integrins Human genes 0.000 description 1
- 229960004461 interferon beta-1a Drugs 0.000 description 1
- 229960003161 interferon beta-1b Drugs 0.000 description 1
- 229960003130 interferon gamma Drugs 0.000 description 1
- 108010018844 interferon type III Proteins 0.000 description 1
- 229940028894 interferon type ii Drugs 0.000 description 1
- 239000003407 interleukin 1 receptor blocking agent Substances 0.000 description 1
- 108090000681 interleukin 20 Proteins 0.000 description 1
- 102000004114 interleukin 20 Human genes 0.000 description 1
- 108010074108 interleukin-21 Proteins 0.000 description 1
- 108010074109 interleukin-22 Proteins 0.000 description 1
- 108090000237 interleukin-24 Proteins 0.000 description 1
- 102000003898 interleukin-24 Human genes 0.000 description 1
- 229940096397 interleukin-8 Drugs 0.000 description 1
- XKTZWUACRZHVAN-VADRZIEHSA-N interleukin-8 Chemical compound C([C@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@@H](NC(C)=O)CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCSC)C(=O)N1[C@H](CCC1)C(=O)N1[C@H](CCC1)C(=O)N[C@@H](C)C(=O)N[C@H](CC(O)=O)C(=O)N[C@H](CCC(O)=O)C(=O)N[C@H](CC(O)=O)C(=O)N[C@H](CC=1C=CC(O)=CC=1)C(=O)N[C@H](CO)C(=O)N1[C@H](CCC1)C(N)=O)C1=CC=CC=C1 XKTZWUACRZHVAN-VADRZIEHSA-N 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000010255 intramuscular injection Methods 0.000 description 1
- 239000007927 intramuscular injection Substances 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 108010059642 isinglass Proteins 0.000 description 1
- 201000005992 juvenile myelomonocytic leukemia Diseases 0.000 description 1
- 201000010982 kidney cancer Diseases 0.000 description 1
- 210000003292 kidney cell Anatomy 0.000 description 1
- 230000002147 killing effect Effects 0.000 description 1
- 210000001865 kupffer cell Anatomy 0.000 description 1
- 210000004561 lacrimal apparatus Anatomy 0.000 description 1
- 230000006651 lactation Effects 0.000 description 1
- 229940039696 lactobacillus Drugs 0.000 description 1
- 201000003445 large cell neuroendocrine carcinoma Diseases 0.000 description 1
- 201000004962 larynx cancer Diseases 0.000 description 1
- 206010024217 lentigo Diseases 0.000 description 1
- NRYBAZVQPHGZNS-ZSOCWYAHSA-N leptin Chemical compound O=C([C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(C)C)CCSC)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CS)C(O)=O NRYBAZVQPHGZNS-ZSOCWYAHSA-N 0.000 description 1
- 229940039781 leptin Drugs 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 210000002332 leydig cell Anatomy 0.000 description 1
- 201000006721 lip cancer Diseases 0.000 description 1
- 206010024627 liposarcoma Diseases 0.000 description 1
- 201000007270 liver cancer Diseases 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000000314 lubricant Substances 0.000 description 1
- 201000007373 lung adenoid cystic carcinoma Diseases 0.000 description 1
- 201000006385 lung benign neoplasm Diseases 0.000 description 1
- 208000026807 lung carcinoid tumor Diseases 0.000 description 1
- 210000002596 lutein cell Anatomy 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 208000012804 lymphangiosarcoma Diseases 0.000 description 1
- 210000004324 lymphatic system Anatomy 0.000 description 1
- 208000018555 lymphatic system disease Diseases 0.000 description 1
- 208000017830 lymphoblastoma Diseases 0.000 description 1
- 108010070560 lymphocyte proliferation potentiating factors Proteins 0.000 description 1
- 230000000527 lymphocytic effect Effects 0.000 description 1
- 210000003738 lymphoid progenitor cell Anatomy 0.000 description 1
- 210000003712 lysosome Anatomy 0.000 description 1
- 230000001868 lysosomic effect Effects 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 235000009973 maize Nutrition 0.000 description 1
- 206010025482 malaise Diseases 0.000 description 1
- 201000004792 malaria Diseases 0.000 description 1
- 208000030883 malignant astrocytoma Diseases 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 201000011614 malignant glioma Diseases 0.000 description 1
- 208000006178 malignant mesothelioma Diseases 0.000 description 1
- 201000009020 malignant peripheral nerve sheath tumor Diseases 0.000 description 1
- 201000001117 malignant triton tumor Diseases 0.000 description 1
- 208000026045 malignant tumor of parathyroid gland Diseases 0.000 description 1
- 208000027202 mammary Paget disease Diseases 0.000 description 1
- 240000004308 marijuana Species 0.000 description 1
- 208000000516 mast-cell leukemia Diseases 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 201000000349 mediastinal cancer Diseases 0.000 description 1
- 208000029586 mediastinal germ cell tumor Diseases 0.000 description 1
- 208000023356 medullary thyroid gland carcinoma Diseases 0.000 description 1
- 210000003593 megakaryocyte Anatomy 0.000 description 1
- 206010027191 meningioma Diseases 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 230000001394 metastastic effect Effects 0.000 description 1
- 208000021039 metastatic melanoma Diseases 0.000 description 1
- 206010061289 metastatic neoplasm Diseases 0.000 description 1
- 208000037970 metastatic squamous neck cancer Diseases 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 210000000110 microvilli Anatomy 0.000 description 1
- 208000020298 milker nodule Diseases 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 208000022669 mucinous neoplasm Diseases 0.000 description 1
- 208000010805 mumps infectious disease Diseases 0.000 description 1
- 210000000107 myocyte Anatomy 0.000 description 1
- 230000007498 myristoylation Effects 0.000 description 1
- 208000009091 myxoma Diseases 0.000 description 1
- OHDXDNUPVVYWOV-UHFFFAOYSA-N n-methyl-1-(2-naphthalen-1-ylsulfanylphenyl)methanamine Chemical compound CNCC1=CC=CC=C1SC1=CC=CC2=CC=CC=C12 OHDXDNUPVVYWOV-UHFFFAOYSA-N 0.000 description 1
- 210000000282 nail Anatomy 0.000 description 1
- 208000037830 nasal cancer Diseases 0.000 description 1
- 210000001989 nasopharynx Anatomy 0.000 description 1
- 229930014626 natural product Natural products 0.000 description 1
- 230000017074 necrotic cell death Effects 0.000 description 1
- 230000001423 neocortical effect Effects 0.000 description 1
- 208000018280 neoplasm of mediastinum Diseases 0.000 description 1
- 210000000653 nervous system Anatomy 0.000 description 1
- 210000000933 neural crest Anatomy 0.000 description 1
- 208000007538 neurilemmoma Diseases 0.000 description 1
- 201000009494 neurilemmomatosis Diseases 0.000 description 1
- 208000027831 neuroepithelial neoplasm Diseases 0.000 description 1
- 208000029974 neurofibrosarcoma Diseases 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 210000001719 neurosecretory cell Anatomy 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 201000000032 nodular malignant melanoma Diseases 0.000 description 1
- 210000001331 nose Anatomy 0.000 description 1
- 238000012758 nuclear staining Methods 0.000 description 1
- 238000011580 nude mouse model Methods 0.000 description 1
- 201000008106 ocular cancer Diseases 0.000 description 1
- 201000002575 ocular melanoma Diseases 0.000 description 1
- 208000027825 odontogenic neoplasm Diseases 0.000 description 1
- 210000001706 olfactory mucosa Anatomy 0.000 description 1
- 210000000287 oocyte Anatomy 0.000 description 1
- 201000011130 optic nerve sheath meningioma Diseases 0.000 description 1
- 208000022982 optic pathway glioma Diseases 0.000 description 1
- 201000006958 oropharynx cancer Diseases 0.000 description 1
- 210000000963 osteoblast Anatomy 0.000 description 1
- 210000002997 osteoclast Anatomy 0.000 description 1
- 210000004409 osteocyte Anatomy 0.000 description 1
- 230000002611 ovarian Effects 0.000 description 1
- 208000021284 ovarian germ cell tumor Diseases 0.000 description 1
- 210000001711 oxyntic cell Anatomy 0.000 description 1
- 230000026792 palmitoylation Effects 0.000 description 1
- 210000000277 pancreatic duct Anatomy 0.000 description 1
- 208000003154 papilloma Diseases 0.000 description 1
- 208000029211 papillomatosis Diseases 0.000 description 1
- 235000001954 papillon Nutrition 0.000 description 1
- 244000229285 papillon Species 0.000 description 1
- 208000007312 paraganglioma Diseases 0.000 description 1
- 230000001769 paralizing effect Effects 0.000 description 1
- 244000045947 parasite Species 0.000 description 1
- 210000002990 parathyroid gland Anatomy 0.000 description 1
- 208000030940 penile carcinoma Diseases 0.000 description 1
- 201000008174 penis carcinoma Diseases 0.000 description 1
- 210000003668 pericyte Anatomy 0.000 description 1
- 210000002856 peripheral neuron Anatomy 0.000 description 1
- 210000001539 phagocyte Anatomy 0.000 description 1
- 238000002135 phase contrast microscopy Methods 0.000 description 1
- 208000028591 pheochromocytoma Diseases 0.000 description 1
- 239000002953 phosphate buffered saline Substances 0.000 description 1
- 210000004694 pigment cell Anatomy 0.000 description 1
- 210000004560 pineal gland Anatomy 0.000 description 1
- 201000004119 pineal parenchymal tumor of intermediate differentiation Diseases 0.000 description 1
- 210000003635 pituitary gland Anatomy 0.000 description 1
- 208000021310 pituitary gland adenoma Diseases 0.000 description 1
- 210000004180 plasmocyte Anatomy 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 210000001778 pluripotent stem cell Anatomy 0.000 description 1
- 210000000557 podocyte Anatomy 0.000 description 1
- 229920000768 polyamine Polymers 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 description 1
- 208000016800 primary central nervous system lymphoma Diseases 0.000 description 1
- 208000025638 primary cutaneous T-cell non-Hodgkin lymphoma Diseases 0.000 description 1
- 238000011321 prophylaxis Methods 0.000 description 1
- 230000001141 propulsive effect Effects 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 210000005267 prostate cell Anatomy 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 235000015136 pumpkin Nutrition 0.000 description 1
- 206010037844 rash Diseases 0.000 description 1
- 206010038038 rectal cancer Diseases 0.000 description 1
- 201000001275 rectum cancer Diseases 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 208000010639 renal pelvis urothelial carcinoma Diseases 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000008672 reprogramming Effects 0.000 description 1
- 208000023504 respiratory system disease Diseases 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 210000000844 retinal pigment epithelial cell Anatomy 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 108700038288 rhodamine-phalloidin Proteins 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 229940046939 rickettsia prowazekii Drugs 0.000 description 1
- 229960004641 rituximab Drugs 0.000 description 1
- 201000007416 salivary gland adenoid cystic carcinoma Diseases 0.000 description 1
- 201000000306 sarcoidosis Diseases 0.000 description 1
- 238000013341 scale-up Methods 0.000 description 1
- 206010039667 schwannoma Diseases 0.000 description 1
- 201000008407 sebaceous adenocarcinoma Diseases 0.000 description 1
- 210000001732 sebaceous gland Anatomy 0.000 description 1
- 210000002374 sebum Anatomy 0.000 description 1
- 229940125723 sedative agent Drugs 0.000 description 1
- 239000000932 sedative agent Substances 0.000 description 1
- 210000000697 sensory organ Anatomy 0.000 description 1
- 210000003728 serous cell Anatomy 0.000 description 1
- 208000012201 sexual and gender identity disease Diseases 0.000 description 1
- 208000015891 sexual disease Diseases 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 208000037968 sinus cancer Diseases 0.000 description 1
- 201000000849 skin cancer Diseases 0.000 description 1
- 201000008261 skin carcinoma Diseases 0.000 description 1
- 208000017520 skin disease Diseases 0.000 description 1
- 210000000813 small intestine Anatomy 0.000 description 1
- 210000001622 small lutein cell Anatomy 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 210000002325 somatostatin-secreting cell Anatomy 0.000 description 1
- 206010062261 spinal cord neoplasm Diseases 0.000 description 1
- 208000037959 spinal tumor Diseases 0.000 description 1
- 210000000952 spleen Anatomy 0.000 description 1
- 230000003393 splenic effect Effects 0.000 description 1
- 210000001324 spliceosome Anatomy 0.000 description 1
- 230000037351 starvation Effects 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 208000003265 stomatitis Diseases 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 210000000352 storage cell Anatomy 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 201000008205 supratentorial primitive neuroectodermal tumor Diseases 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 230000009182 swimming Effects 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 210000001258 synovial membrane Anatomy 0.000 description 1
- 229950008461 talimogene laherparepvec Drugs 0.000 description 1
- 210000001779 taste bud Anatomy 0.000 description 1
- 210000002435 tendon Anatomy 0.000 description 1
- 201000003120 testicular cancer Diseases 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 210000001550 testis Anatomy 0.000 description 1
- ZRKFYGHZFMAOKI-QMGMOQQFSA-N tgfbeta Chemical compound C([C@H](NC(=O)[C@H](C(C)C)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC(C)C)NC(=O)CNC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC)C(C)C)[C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O)C1=CC=C(O)C=C1 ZRKFYGHZFMAOKI-QMGMOQQFSA-N 0.000 description 1
- 201000002510 thyroid cancer Diseases 0.000 description 1
- 208000030901 thyroid gland follicular carcinoma Diseases 0.000 description 1
- 208000013818 thyroid gland medullary carcinoma Diseases 0.000 description 1
- 208000019179 thyroid gland undifferentiated (anaplastic) carcinoma Diseases 0.000 description 1
- 230000009772 tissue formation Effects 0.000 description 1
- 210000004906 toe nail Anatomy 0.000 description 1
- 210000000515 tooth Anatomy 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 208000018417 undifferentiated high grade pleomorphic sarcoma of bone Diseases 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 241000701451 unidentified granulovirus Species 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 201000000334 ureter transitional cell carcinoma Diseases 0.000 description 1
- 201000005112 urinary bladder cancer Diseases 0.000 description 1
- 230000002485 urinary effect Effects 0.000 description 1
- 208000023747 urothelial carcinoma Diseases 0.000 description 1
- 206010046766 uterine cancer Diseases 0.000 description 1
- 208000037965 uterine sarcoma Diseases 0.000 description 1
- 238000002255 vaccination Methods 0.000 description 1
- 208000013139 vaginal neoplasm Diseases 0.000 description 1
- 201000006266 variola major Diseases 0.000 description 1
- 108010039429 vascin Proteins 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 230000002861 ventricular Effects 0.000 description 1
- 208000008662 verrucous carcinoma Diseases 0.000 description 1
- 201000002498 viral encephalitis Diseases 0.000 description 1
- 230000029812 viral genome replication Effects 0.000 description 1
- 108010063191 vitamin D-binding protein-macrophage activating factor Proteins 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
- 230000008673 vomiting Effects 0.000 description 1
- 210000001849 von ebner gland Anatomy 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 239000001993 wax Substances 0.000 description 1
- 229940051021 yellow-fever virus Drugs 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/0005—Vertebrate antigens
- A61K39/0011—Cancer antigens
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K35/00—Medicinal preparations containing materials or reaction products thereof with undetermined constitution
- A61K35/12—Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K35/00—Medicinal preparations containing materials or reaction products thereof with undetermined constitution
- A61K35/12—Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
- A61K35/28—Bone marrow; Haematopoietic stem cells; Mesenchymal stem cells of any origin, e.g. adipose-derived stem cells
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K35/00—Medicinal preparations containing materials or reaction products thereof with undetermined constitution
- A61K35/66—Microorganisms or materials therefrom
- A61K35/76—Viruses; Subviral particles; Bacteriophages
- A61K35/761—Adenovirus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K35/00—Medicinal preparations containing materials or reaction products thereof with undetermined constitution
- A61K35/66—Microorganisms or materials therefrom
- A61K35/76—Viruses; Subviral particles; Bacteriophages
- A61K35/763—Herpes virus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K35/00—Medicinal preparations containing materials or reaction products thereof with undetermined constitution
- A61K35/66—Microorganisms or materials therefrom
- A61K35/76—Viruses; Subviral particles; Bacteriophages
- A61K35/768—Oncolytic viruses not provided for in groups A61K35/761 - A61K35/766
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
- A61K39/215—Coronaviridae, e.g. avian infectious bronchitis virus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/88—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation using microencapsulation, e.g. using amphiphile liposome vesicle
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
- C12N5/0652—Cells of skeletal and connective tissues; Mesenchyme
- C12N5/0662—Stem cells
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/51—Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
- A61K2039/515—Animal cells
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/51—Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
- A61K2039/515—Animal cells
- A61K2039/5156—Animal cells expressing foreign proteins
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/51—Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
- A61K2039/525—Virus
- A61K2039/5256—Virus expressing foreign proteins
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/60—Medicinal preparations containing antigens or antibodies characteristics by the carrier linked to the antigen
- A61K2039/6006—Cells
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K9/00—Medicinal preparations characterised by special physical form
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/16011—Herpesviridae
- C12N2710/16611—Simplexvirus, e.g. human herpesvirus 1, 2
- C12N2710/16622—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/16011—Herpesviridae
- C12N2710/16611—Simplexvirus, e.g. human herpesvirus 1, 2
- C12N2710/16632—Use of virus as therapeutic agent, other than vaccine, e.g. as cytolytic agent
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/16011—Herpesviridae
- C12N2710/16611—Simplexvirus, e.g. human herpesvirus 1, 2
- C12N2710/16671—Demonstrated in vivo effect
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/20011—Coronaviridae
- C12N2770/20022—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/20011—Coronaviridae
- C12N2770/20034—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/20011—Coronaviridae
- C12N2770/20051—Methods of production or purification of viral material
- C12N2770/20052—Methods of production or purification of viral material relating to complementing cells and packaging systems for producing virus or viral particles
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/20011—Coronaviridae
- C12N2770/20061—Methods of inactivation or attenuation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/20011—Coronaviridae
- C12N2770/20071—Demonstrated in vivo effect
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Virology (AREA)
- Genetics & Genomics (AREA)
- Biomedical Technology (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- Zoology (AREA)
- Medicinal Chemistry (AREA)
- Animal Behavior & Ethology (AREA)
- Pharmacology & Pharmacy (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Microbiology (AREA)
- Epidemiology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Immunology (AREA)
- General Engineering & Computer Science (AREA)
- Developmental Biology & Embryology (AREA)
- Cell Biology (AREA)
- Mycology (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Oncology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Rheumatology (AREA)
- Communicable Diseases (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Hematology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Pulmonology (AREA)
Abstract
제핵 세포 기반 플랫폼을 사용하여 백신 조성물을 제조하고, 전달하는 방법을 제공한다. 제핵 세포 기반 플랫폼을 사용하여 피험체에서 병원성 감염을 제거하는 방법 또한 제공한다. 상기 제핵 세포 기반 플랫폼은 종래 생물학적 백신에 비해 백신 개발 타임라인을 단축하고, 백신 효능을 개선시킨다.
Description
상호 참조
본 출원은 2020년 2월 11일 출원된 미국 가출원 제62/975,044호, 및 2020년 4월 22일 출원된 미국 가출원 제63/014,002호의 우선권을 주장하며, 상기 가출원은 각각 그 전문이 본원에서 참조로 포함된다.
서열 목록
본 출원은 ASCII 포맷으로 전자 제출된 서열 목록을 포함하고, 이는 그 전문이 본원에서 참조로 포함된다. 2021년 2월 9일 작성된 상기 ASCII 사본의 명칭은 53712-706_601_SL.txt이고, 그 크기는 1,695,927 바이트이다.
중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2: severe acute respiratory syndrome coronavirus) 대유행 및 그에 수반되는 이환율 및 사망률은 방어적이고, 지속적인 면역 반응을 유도하는 안전하고 효과적인 백신의 필요성을 강조한다. 대유행은 또한 코로나바이러스 질환 2019(COVID-19: Coronavirus disease 2019)의 광범위한 전파와 같은 긴급 의료 요구를 해결하기 위한 전 세계의 종래 백신 개발 파이프라인의 심각한 단점을 드러냈다. SARS-CoV-2와 같이 빠르게 진화하는 병원체에 의해 유발되는 질환 또는 병태를 치료하기 위한 안전하고, 효과적인 백신 및 치료제의 출시시간을 개선할 수 있는 새로운 백신 개발 플랫폼에 대한 긴급하고, 충족되지 않은 요구가 존재한다.
요약
일부 실시양태에서, 본원에서는 핵의 부재하에서 병원체에 대한 백신의 합성 또는 분비를 위한 하나 이상의 세포내 세포소기관을 포함하는 핵이 없는 세포를 기술한다. 일부 실시양태에서, 병원체는 바이러스이다. 일부 실시양태에서, 바이러스는 코로나 바이러스이다. 일부 실시양태에서, 코로나 바이러스는 중증 급성 호흡기 증후군(SARS: severe acute respiratory syndrome) 코로나 바이러스이다. 일부 실시양태에서, SARS 코로나 바이러스는 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2)이다. 일부 실시양태에서, 바이러스는 종양용해성 바이러스이다. 일부 실시양태에서, 병원체는 박테리아이다. 일부 실시양태에서, 박테리아는 바실러스 안트라시스(Bacillus anthracis), 예르시니아 페스티스(Yersinia pestis), 프란시셀라 툴라렌시스(Francisella tularensis), 브루셀라(Brucella), 살모넬라(Salmonella), 에스케리키아 콜라이(Escherichia coli) O157:H7, 시겔라(Shigella), 부르크홀데리아 말레이(Burkholderia mallei), 부르크홀데리아 슈도말레이(Burkholderia pseudomallei), 클라미디아 시타시(Chlamydia psittaci), 콕시엘라 번에티이, 리케차 프로와제키(Rickettsia prowazekii), 비브리오 콜레라에(Vibrio cholerae), 또는 크립토스포리디움 파르붐(Cryptosporidium parvum) 또는 그의 임의의 조합이다. 일부 실시양태에서, 병원체는 독소이다. 일부 실시양태에서, 독소는 클로스트리디움 보툴리눔(Clostridium botulinum) 독소, 클로스트리디움 페르프린겐스(Clostridium perfringens)의 엡실론 독소, 포도상구균 장독소 B, 또는 리시누스 코무니스(Ricinus communis)로부터의 리신 독소, 또는 그의 임의의 조합이다. 일부 실시양태에서, 하나 이상의 세포내 세포소기관은 소포체 또는 골지체이다. 일부 실시양태에서, 백신은 핵이 없는 세포의 표면에 커플링된다. 일부 실시양태에서, 백신은 백신을 핵이 없는 세포의 표면에 커플링시키는 막횡단 도메인을 포함한다. 일부 실시양태에서, 핵이 없는 세포는 과립구-대식세포 콜로니 자극 인자를 포함하는 면역조정제를 추가로 포함한다. 면역조정제는 (a) 류코시아린; (b) L-셀렉틴, 림프구 기능 연관 항원 1; (c) 초후기 항원-4; (a) 내지 (c) 중 어느 하나의 일부; (a) 내지 (d)의 임의의 조합을 포함하는 귀소 수용체를 추가로 포함한다. 일부 실시양태에서, 핵이 없는 세포의 직경은 약 1 마이크로미터 (㎛) 내지 100 ㎛이다. 일부 실시양태에서, 직경은 약 8 ㎛이다. 일부 실시양태에서, 핵이 없는 세포는 적어도 24시간 동안 냉동동면 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 48시간 냉동동면 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 24시간 동안 동결보존 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 24시간 동안 동결건조 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 동결보존, 냉동동면, 또는 동결건조된 것이다. 일부 실시양태에서, 핵이 없는 세포는 단리 또는 정제된 것이다. 일부 실시양태에서, 생존능은 본원에 기술된 바와 같이 트리판 블루 염료 배제를 사용하여 측정된다. 일부 실시양태에서, 트리판 블루 염료 배제는 (a) 현탁액 중에서 분취량의 복수의 핵이 없는 세포를 원심분리하여 세포 펠릿을 생성하고; (b) 무혈청 배지 중에 세포 펠릿을 재현탁시켜 무혈청 세포 현탁액을 생성하고; (c) 1부 트리판 블루 염료 및 1부의 무혈청 세포 현탁액을 혼합하고; (d) (c)의 3-5분 이내에 복수의 핵이 없는 세포를 계수함으로써 수행되며, 여기서, 복수의 핵이 없는 세포 중 적어도 일부는 트리판 블루 염료로 염색되지 않고, 이는 생존능을 시사하는 것이다. 일부 실시양태에서, 생존능은 본원에 기술된 바와 같이 아넥신-5 세포 표면 염색을 사용하여 측정된다. 일부 실시양태에서, 핵이 없는 세포는 적혈구 또는 적혈구 전구체가 아니다.
일부 실시양태에서, 본원에서는 본원에 기술된 핵이 없는 세포 또는 복수의 핵이 없는 세포; 및 약학적으로 허용되는: 부형제, 희석제, 또는 담체를 포함하는 약학적 제제를 기술한다.
일부 실시양태에서, 본원에서는 (a) 세포로부터 핵을 제거하여 병원체에 대한 백신의 합성 또는 분비를 위한 하나 이상의 세포내 세포소기관을 포함하는 제핵 세포를 생성하는 단계; 및 (b) 백신을 코딩하는 외인성 mRNA를 제핵 세포에 도입하는 단계로서, 여기서, 제핵 세포는 핵의 부재하에서서 백신을 발현하는 것인 단계를 포함하는, 백신을 제조하는 방법을 기술한다. 일부 실시양태에서, 병원체는 바이러스이다. 일부 실시양태에서, 바이러스는 코로나 바이러스이다. 일부 실시양태에서, 코로나 바이러스는 중증 급성 호흡기 증후군(SARS) 코로나 바이러스이다. 일부 실시양태에서, SARS 코로나 바이러스는 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2)이다. 일부 실시양태에서, 바이러스는 종양용해성 바이러스이다. 일부 실시양태에서, 병원체는 박테리아이다. 일부 실시양태에서, 박테리아는 바실러스 안트라시스, 예르시니아 페스티스, 프란시셀라 툴라렌시스, 브루셀라, 살모넬라, 에스케리키아 콜라이 O157:H7, 시겔라, 부르크홀데리아 말레이, 부르크홀데리아 슈도말레이, 클라미디아 시타시, 콕시엘라 번에티이, 리케차 프로와제키, 비브리오 콜레라에, 또는 크립토스포리디움 파르붐 또는 그의 임의의 조합이다. 일부 실시양태에서, 병원체는 독소이다. 일부 실시양태에서, 독소는 클로스트리디움 보툴리눔 독소, 클로스트리디움 페르프린겐스의 엡실론 독소, 포도상구균 장독소 B, 또는 리시누스 코무니스로부터의 리신 독소, 또는 그의 임의의 조합이다. 일부 실시양태에서, 제핵 세포를 4℃ 이하에서 보관하여 제핵 세포의 생물학적 활성을 가역적으로 저속화 또는 정지시킨 후, 이어서, (b)에서의 도입 전에 해동시켰다. 일부 실시양태에서, 핵이 없는 세포를 동결건조시킨 후, 이어서, (b)에서의 도입 전에 재수화시켰다. 일부 실시양태에서, 제핵 세포를 -120℃ 이하에서 보관하여 제핵 세포의 생물학적 활성을 가역적으로 저속화 또는 정지시킨 후, 이어서, (b)에서의 도입 전에 해동시켰다. 일부 실시양태에서, (a)에서 세포로부터 핵을 제거하는 단계는 세포 분화 없이 수행된다. 일부 실시양태에서, 하나 이상의 세포내 세포소기관은 소포체 또는 골지체이다. 일부 실시양태에서, 핵이 없는 세포의 직경은 약 1 마이크로미터(㎛) 내지 100 ㎛이다. 일부 실시양태에서, 직경은 약 8 ㎛이다. 일부 실시양태에서, 본 방법은 (a)에서 핵을 제거하기 전에 과립구-대식세포 콜로니 자극 인자를 포함하는 면역조정제를 코딩하는 핵산 서열을 포함하는 외인성 핵산 분자를 세포에 도입하는 단계를 추가로 포함한다. 일부 실시양태에서, 본 방법은 (a)에서 핵을 제거하기 전에 류코시아린; L-셀렉틴, 림프구 기능 연관 항원 1; 초후기 항원-4; C-X-C 케모카인 수용체 타입 3; CD44 항원; C-C 케모카인 수용체 타입 7; 그의 귀소 수용체 중 어느 하나의 일부; 또는 그의 귀소 수용체 중 어느 하나의 임의의 조합을 포함하는 귀소 수용체를 코딩하는 핵산 서열을 포함하는 외인성 핵산 분자를 세포에 도입하는 단계를 추가로 포함한다. 일부 실시양태에서, 본 방법은 과립구-대식세포 콜로니 자극 인자를 포함하는 면역조정제를 코딩하는 서열을 포함하는 외인성 mRNA 분자를 핵이 없는 세포에 도입하는 단계를 추가로 포함한다. 일부 실시양태에서, 본 방법은 류코시아린; L-셀렉틴, 림프구 기능 연관 항원 1; 초후기 항원-4; C-X-C 케모카인 수용체 타입 3; CD44 항원; C-C 케모카인 수용체 타입 7; 그의 귀소 수용체 중 어느 하나의 일부; 또는 그의 귀소 수용체 중 어느 하나의 임의의 조합을 포함하는 귀소 수용체를 코딩하는 서열을 포함하는 외인성 mRNA 분자를 핵이 없는 세포에 도입하는 단계를 추가로 포함한다. 일부 실시양태에서, 핵이 없는 세포는 적혈구 또는 적혈구 전구체가 아니다.
일부 실시양태에서, 본원에서는 피험체에게 핵의 부재하에서 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2)에 대한 백신의 합성 또는 분비를 위한 하나 이상의 세포내 세포소기관을 포함하는 핵이 없는 세포를 투여하는 단계를 포함하는, 피험체에게 SARS-CoV-2에 대한 백신을 전달하는 방법을 기술한다. 일부 실시양태에서, 하나 이상의 세포내 세포소기관은 소포체 또는 골지체이다. 일부 실시양태에서, 핵이 없는 세포는 과립구-대식세포 콜로니 자극 인자를 포함하는 면역조정제를 추가로 포함한다. 일부 실시양태에서, 핵이 없는 세포는 류코시아린; L-셀렉틴, 림프구 기능 연관 항원 1; 초후기 항원-4; C-X-C 케모카인 수용체 타입 3; CD44 항원; C-C 케모카인 수용체 타입 7; 그의 귀소 수용체 중 어느 하나의 일부; 또는 그의 귀소 수용체 중 어느 하나의 임의의 조합을 포함하는 귀소 수용체를 추가로 포함한다. 일부 실시양태에서, 핵이 없는 세포의 직경은 약 1 마이크로미터(㎛) 내지 100 ㎛이다. 일부 실시양태에서, 직경은 약 8 ㎛이다. 일부 실시양태에서, 투여 단계는 전신 투여를 포함한다. 일부 실시양태에서, 핵이 없는 세포는 약 103개의 세포/kg(체중) 내지 약 1012개의 세포/kg(체중)의 투여량으로 투여된다. 일부 실시양태에서, 핵이 없는 세포는 피험체에게 적어도 1시간, 2시간, 4시간, 6시간, 8시간, 12시간, 1일, 2일, 1주, 2주, 3주, 1개월, 2개월, 3개월, 4개월, 5개월, 6개월, 7개월, 8개월, 9개월, 10개월, 11개월, 1년, 2년, 3년, 또는 4년 이내에 2회 투여된다. 일부 실시양태에서, 피험체는 인간이다. 일부 실시양태에서, 본 방법은 애주번트를 투여하는 단계를 추가로 포함한다. 일부 실시양태에서, 핵이 없는 세포는 적혈구 또는 적혈구 전구체가 아니다.
일부 실시양태에서, 본원에서는 실질적으로 핵이 없는 복수의 세포로서, 여기서, 복수의 것 중 적어도 하나의 핵이 없는 세포는 핵의 부재하에서 병원체에 대한 백신의 합성 또는 분비를 위한 하나 이상의 세포내 세포소기관을 포함하는 것인 복수의 세포; 및 실질적으로 핵이 없는 복수의 세포를 피험체에게 투여하는 것에 관한 사용설명서를 포함하는 키트를 기술한다. 일부 실시양태에서, 실질적으로 핵이 없는 복수의 세포는 동결보존, 냉동동면, 또는 동결건조된 것이다. 일부 실시양태에서, 키트는 피험체에게 실질적으로 핵이 없는 복수의 세포를 투여하기 전 실질적으로 핵이 없는 복수의 세포의 생물학적 활성을 회복시키는 것에 관한 사용설명서를 추가로 포함한다. 일부 실시양태에서, 키트는 백신을 코딩하는 외인성 mRNA를 제핵 세포에 도입하는 것에 관한 사용설명서를 추가로 포함한다.
일부 실시양태에서, 본원에서는 핵의 부재하에서 병원체 항원에 대한 수용체 또는 그의 병원체 항원 결합 단편의 합성을 위한 하나 이상의 세포내 세포소기관을 포함하는 핵이 없는 세포로서, 여기서, 수용체 또는 수용체의 발현 수준은 핵이 없는 세포에 대해 외인성인 것인 핵이 없는 세포를 기술한다. 일부 실시양태에서, 하나 이상의 세포내 세포소기관은 소포체 또는 골지체이다. 일부 실시양태에서, 병원체 항원에 대한 수용체 또는 그의 병원체 항원 결합 단편은 핵이 없는 세포의 표면에 커플링된다. 일부 실시양태에서, 병원체 항원에 대한 수용체 또는 그의 병원체 항원 결합 단편은 핵이 없는 세포의 세포막 내에 막횡단 도메인을 포함한다. 일부 실시양태에서, 핵이 없는 세포는 과립구-대식세포 콜로니 자극 인자를 포함하는 면역조정제를 코딩하는 서열, 또는 그의 일부를 갖는 외인성 mRNA 분자를 추가로 포함한다. 일부 실시양태에서, 핵이 없는 세포의 직경은 약 1 마이크로미터(㎛) 내지 100 ㎛이다. 일부 실시양태에서, 직경은 약 8 ㎛이다. 일부 실시양태에서, 핵이 없는 세포는 적어도 24시간 동안 냉동동면 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 48시간 냉동동면 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 24시간 동안 동결보존 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 24시간 동안 동결건조 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 동결보존, 냉동동면, 또는 동결건조된 것이다. 일부 실시양태에서, 핵이 없는 세포는 단리 또는 정제된 것이다. 일부 실시양태에서, 생존능은 본원에 기술된 바와 같이 트리판 블루 염료 배제를 사용하여 측정된다. 일부 실시양태에서, 트리판 블루 염료 배제는 (a) 현탁액 중에서 분취량의 복수의 핵이 없는 세포를 원심분리하여 세포 펠릿을 생성하고; (b) 무혈청 배지 중에 세포 펠릿을 재현탁시켜 무혈청 세포 현탁액을 생성하고; (c) 1부 트리판 블루 염료 및 1부의 무혈청 세포 현탁액을 혼합하고; (d) (c)의 3-5분 이내에 복수의 핵이 없는 세포를 계수함으로써 수행되며, 여기서, 복수의 핵이 없는 세포 중 적어도 일부는 트리판 블루 염료로 염색되지 않고, 이는 생존능을 시사하는 것이다. 일부 실시양태에서, 생존능은 본원에 기술된 바와 같이 아넥신-5 세포 표면 염색을 사용하여 측정된다. 일부 실시양태에서, 핵이 없는 세포는 단리 또는 정제된 것이다. 일부 실시양태에서, 세포는 병원체 항원과 숙주 세포에 의해 생산된 그의 천연 수용체 사이의 결합을 차단하는 중화 항체를 추가로 포함한다. 일부 실시양태에서, 중화 항체는 핵이 없는 세포의 하나 이상의 세포내 세포소기관에 의해 합성된다. 일부 실시양태에서, 세포는 류코시아린; L-셀렉틴, 림프구 기능 연관 항원 1; 초후기 항원-4; C-X-C 케모카인 수용체 타입 3; CD44 항원; C-C 케모카인 수용체 타입 7; 그의 귀소 수용체 중 어느 하나의 일부; 또는 그의 귀소 수용체 중 어느 하나의 임의의 조합을 포함하는 귀소 수용체를 추가로 포함한다. 일부 실시양태에서, 병원체는 바이러스이다. 일부 실시양태에서, 바이러스는 코로나 바이러스이다. 일부 실시양태에서, 코로나 바이러스는 중증 급성 호흡기 증후군(SARS) 코로나 바이러스이다. 일부 실시양태에서, SARS 코로나 바이러스는 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2)이다. 일부 실시양태에서, 바이러스는 종양용해성 바이러스이다. 일부 실시양태에서, 병원체는 박테리아이다. 일부 실시양태에서, 박테리아는 바실러스 안트라시스, 예르시니아 페스티스, 프란시셀라 툴라렌시스, 브루셀라, 살모넬라, 에스케리키아 콜라이 O157:H7, 시겔라, 부르크홀데리아 말레이, 부르크홀데리아 슈도말레이, 클라미디아 시타시, 콕시엘라 번에티이, 리케차 프로와제키, 비브리오 콜레라에, 또는 크립토스포리디움 파르붐 또는 그의 임의의 조합이다. 일부 실시양태에서, 병원체는 독소이다. 일부 실시양태에서, 독소는 클로스트리디움 보툴리눔 독소, 클로스트리디움 페르프린겐스의 엡실론 독소, 포도상구균 장독소 B, 또는 리시누스 코무니스로부터의 리신 독소, 또는 그의 임의의 조합이다. 일부 실시양태에서, 백신은 본원에 기술된 백신이다. 일부 실시양태에서, 핵이 없는 세포는 적혈구 또는 적혈구 전구체가 아니다.
일부 실시양태에서, 본원에서는 피험체에게 본원에 기술된 핵이 없는 세포, 또는 본원에 기술된 약학적 제제를 투여하여 세포에 병원체 항원을 갖는 병원체를 포획하고, 병원체가 세포 내에서 증식하지 못하게 방해하는 단계를 포함하는, 피험체에서 병원체에 의한 감염을 감소시키는 방법, 또는 피험체를 감염시키는 프로세스에서 병원체를 감소시키는 방법을 기술한다. 일부 실시양태에서, 병원체는 투여 후 약 14일 이하인 기간 내에 피험체로부터 제거된다. 일부 실시양태에서, 핵이 없는 세포는 중화 항체 또는 나노바디를 방출하여 병원체의 병원체 항원과 숙주 세포에 의해 생산된 그의 천연 수용체 사이의 결합을 차단한다. 일부 실시양태에서, 투여 단계는 전신 투여를 포함한다. 일부 실시양태에서, 핵이 없는 세포는 약 103개의 세포/kg(체중) 내지 약 1012개의 세포/kg(체중)의 투여량으로 투여된다. 일부 실시양태에서, 핵이 없는 세포는 피험체에게 적어도 1시간, 2시간, 4시간, 6시간, 8시간, 12시간, 1일, 2일, 1주, 2주, 3주, 1개월, 2개월, 3개월, 4개월, 5개월, 6개월, 7개월, 8개월, 9개월, 10개월, 11개월, 1년, 2년, 3년, 또는 4년 이내에 2회 투여된다. 일부 실시양태에서, 병원체는 바이러스이다. 일부 실시양태에서, 바이러스는 코로나 바이러스이다. 일부 실시양태에서, 코로나 바이러스는 중증 급성 호흡기 증후군(SARS) 코로나 바이러스이다. 일부 실시양태에서, SARS 코로나 바이러스는 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2)이다. 일부 실시양태에서, 바이러스는 종양용해성 바이러스이다. 일부 실시양태에서, 병원체는 박테리아이다. 일부 실시양태에서, 박테리아는 바실러스 안트라시스, 예르시니아 페스티스, 프란시셀라 툴라렌시스, 브루셀라, 살모넬라, 에스케리키아 콜라이 O157:H7, 시겔라, 부르크홀데리아 말레이, 부르크홀데리아 슈도말레이, 클라미디아 시타시, 콕시엘라 번에티이, 리케차 프로와제키, 비브리오 콜레라에, 또는 크립토스포리디움 파르붐 또는 그의 임의의 조합이다. 일부 실시양태에서, 병원체는 독소이다. 일부 실시양태에서, 독소는 클로스트리디움 보툴리눔 독소, 클로스트리디움 페르프린겐스의 엡실론 독소, 포도상구균 장독소 B, 또는 리시누스 코무니스로부터의 리신 독소, 또는 그의 임의의 조합이다. 일부 실시양태에서, 백신은 본원에 기술된 백신이다. 일부 실시양태에서, 핵이 없는 세포는 과립구-대식세포 콜로니 자극 인자를 포함하는 면역조정제를 추가로 포함한다. 일부 실시양태에서, 핵이 없는 세포는 림프 조직에서 하나 이상의 세포 상에서 발현된 리간드에 특이적인 귀소 수용체를 추가로 포함한다. 일부 실시양태에서, 귀소 수용체는 C-X-C 케모카인 수용체 타입 3, 류코시아린, CD44 항원, C-C 케모카인 수용체 타입 7, L-셀렉틴, 림프구 기능 연관 항원 1, 또는 초후기 항원-4, 또는 그의 조합을 포함한다. 일부 실시양태에서, 핵이 없는 세포의 직경은 약 1 마이크로미터(㎛) 내지 100 ㎛이다. 일부 실시양태에서, 핵이 없는 세포의 직경은 약 8 ㎛이다. 일부 실시양태에서, 핵이 없는 세포는 적어도 24시간 동안 냉동동면 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 48시간 냉동동면 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 24시간 동안 동결보존 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 24시간 동안 동결건조 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 동결보존, 냉동동면, 또는 동결건조된 것이다. 일부 실시양태에서, 핵이 없는 세포는 단리 또는 정제된 것이다. 일부 실시양태에서, 생존능은 본원에 기술된 바와 같이 트리판 블루 염료 배제를 사용하여 측정된다. 일부 실시양태에서, 트리판 블루 염료 배제는 (a) 현탁액 중에서 분취량의 복수의 핵이 없는 세포를 원심분리하여 세포 펠릿을 생성하고; (b) 무혈청 배지 중에 세포 펠릿을 재현탁시켜 무혈청 세포 현탁액을 생성하고; (c) 1부 트리판 블루 염료 및 1부의 무혈청 세포 현탁액을 혼합하고; (d) (c)의 3-5분 이내에 복수의 핵이 없는 세포를 계수함으로써 수행되며, 여기서, 복수의 핵이 없는 세포 중 적어도 일부는 트리판 블루 염료로 염색되지 않고, 이는 생존능을 시사하는 것이다. 일부 실시양태에서, 생존능은 본원에 기술된 바와 같이 아넥신-5 세포 표면 염색을 사용하여 측정된다. 일부 실시양태에서, 핵이 없는 세포는 적혈구 또는 적혈구 전구체가 아니다.
본원에 개시된 측면은 핵의 부재하에서, 서열 번호 1, 301-347, 또는 501-512 중 하나 이상의 것과 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87% 88%, 89% 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 서열에 의해 코딩되는, 바이러스에 대한 백신의 합성 또는 분비를 위한 하나 이상의 세포내 세포소기관을 포함하는 핵이 없는 세포를 기술한다. 일부 실시양태에서, 핵이 없는 세포는 적혈구 또는 적혈구 전구체가 아니다. 일부 실시양태에서, 핵이 없는 세포는 하나 이상의 세포내 세포소기관이 내인성인 유핵 모세포로부터 유래된 것이다. 일부 실시양태에서, 바이러스는 코로나 바이러스이다. 일부 실시양태에서, 백신 조성물은 DNA, RNA, 항원성 펩티드, 약독화된 생 바이러스, 또는 불활성화된 바이러스, 또는 그의 조합이다. 일부 실시양태에서, 항원성 펩티드는 서열 번호 2, 3-7, 151-154, 251-260, 401-447, 551-562, 651-660, 751-761, 851-859, 951-984, 1051-1057, 또는 1151-1153 중 하나 이상의 것과 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87% 88%, 89% 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, 항원성 펩티드는 서열 번호 2, 8, 401-447 또는 551-562 중 하나 이상의 것과 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87% 88%, 89% 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, 항원성 펩티드는 서열 번호 101-104, 201-209, 301-347, 501-512, 601-610, 701-711, 801-809, 901-934, 1001-1007, 또는 1101-1103 중 하나 이상의 것과 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87% 88%, 89% 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 핵산 서열로부터 코딩된다. 일부 실시양태에서, 항원성 펩티드는 알부민을 코딩하는 아미노산 서열, 또는 그의 일부를 추가로 포함한다. 일부 실시양태에서, 백신은 세포의 표면에 커플링된다. 일부 실시양태에서, 백신은 분비성이다. 일부 실시양태에서, 핵이 없는 세포는 과립구-대식세포 콜로니 자극 인자를 포함하는 면역조정제를 추가로 포함한다. 일부 실시양태에서, 핵이 없는 세포는 림프 조직에서 하나 이상의 세포 상에서 발현된 리간드에 특이적인 귀소 수용체를 추가로 포함한다. 일부 실시양태에서, 귀소 수용체는 C-X-C 케모카인 수용체 타입 3, 류코시아린, CD44 항원, C-C 케모카인 수용체 타입 7, L-셀렉틴, 림프구 기능 연관 항원 1, 또는 초후기 항원-4, 또는 그의 조합을 포함한다. 일부 실시양태에서, 핵이 없는 세포의 직경은 약 1 마이크로미터(㎛) 내지 100 ㎛이다. 일부 실시양태에서, 핵이 없는 세포의 직경은 약 8 ㎛이다. 일부 실시양태에서, 핵이 없는 세포는 적어도 24시간 동안 냉동동면 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 24시간 동안 동결보존 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 48시간 냉동동면 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 48시간 동안의 동결보존 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 24시간 동안 동결건조 후 생존가능하다. 일부 실시양태에서, 생존능은 본원에 기술된 바와 같이 트리판 블루 염료 배제를 사용하여 측정된다. 일부 실시양태에서, 트리판 블루 염료 배제는 (a) 현탁액 중에서 분취량의 복수의 핵이 없는 세포를 원심분리하여 세포 펠릿을 생성하고; (b) 무혈청 배지 중에 세포 펠릿을 재현탁시켜 무혈청 세포 현탁액을 생성하고; (c) 1부 트리판 블루 염료 및 1부의 무혈청 세포 현탁액을 혼합하고; (d) (c)의 3-5분 이내에 복수의 핵이 없는 세포를 계수함으로써 수행되며, 여기서, 복수의 핵이 없는 세포 중 적어도 일부는 트리판 블루 염료로 염색되지 않고, 이는 생존능을 시사하는 것이다. 일부 실시양태에서, 생존능은 본원에 기술된 바와 같이 아넥신-5 세포 표면 염색을 사용하여 측정된다. 일부 실시양태에서, 핵이 없는 세포는 동결보존, 냉동동면, 또는 동결건조된 것이다. 일부 실시양태에서, 핵의 부재하에서 백신의 합성 또는 분비는 약 3일 이상의 기간 동안 핵이 없는 세포에 의해 수행된다. 일부 실시양태에서, 핵이 없는 세포는 약학적으로 허용되는 담체 중에 존재한다. 일부 실시양태에서, 핵이 없는 세포는 약 103개의 세포/kg(체중) 내지 약 1012개의 세포/kg(체중)의 투여량으로 존재한다. 일부 실시양태에서, 핵이 없는 세포는 적어도 약 103, 104, 105, 106, 107, 108, 109, 1010, 1011, 1012개의 세포/kg(체중) 이상의 투여량으로 존재한다. 일부 실시양태에서, 핵이 없는 세포는 최대 약 103, 104, 105, 106, 107, 108, 109, 1010, 1011, 1012개의 세포/kg(체중)의 투여량으로 존재한다. 일부 실시양태에서, 핵이 없는 세포는 단리 및 정제된 것이다.
본원에 개시된 측면은 핵의 부재하에서 박테리아 또는 독소에 대한 백신의 합성 또는 분비를 위한 하나 이상의 세포내 세포소기관을 포함하는 핵이 없는 세포를 기술한다. 일부 실시양태에서, 핵이 없는 세포는 적혈구 또는 적혈구 전구체가 아니다. 일부 실시양태에서, 핵이 없는 세포는 하나 이상의 세포내 세포소기관이 내인성인 유핵 모세포로부터 유래된 것이다. 일부 실시양태에서, 독소는 클로스트리디움 보툴리눔 독소, 클로스트리디움 페르프린겐스의 엡실론 독소, 포도상구균 장독소 B, 또는 리시누스 코무니스로부터의 리신 독소, 또는 그의 임의의 조합이다. 일부 실시양태에서, 박테리아는 바실러스 안트라시스, 예르시니아 페스티스, 프란시셀라 툴라렌시스, 브루셀라, 살모넬라, 에스케리키아 콜라이 O157:H7, 시겔라, 부르크홀데리아 말레이, 부르크홀데리아 슈도말레이, 클라미디아 시타시, 콕시엘라 번에티이, 리케차 프로와제키, 비브리오 콜레라에, 또는 크립토스포리디움 파르붐 또는 그의 임의의 조합이다. 일부 실시양태에서, 백신은 세포의 표면에 커플링된다. 일부 실시양태에서, 백신은 분비성이다. 일부 실시양태에서, 핵이 없는 세포는 과립구-대식세포 콜로니 자극 인자를 포함하는 면역조정제를 추가로 포함한다. 일부 실시양태에서, 핵이 없는 세포는 림프 조직에서 하나 이상의 세포 상에서 발현된 리간드에 특이적인 귀소 수용체를 추가로 포함한다. 일부 실시양태에서, 귀소 수용체는 C-X-C 케모카인 수용체 타입 3, 류코시아린, CD44 항원, C-C 케모카인 수용체 타입 7, L-셀렉틴, 림프구 기능 연관 항원 1, 또는 초후기 항원-4, 또는 그의 조합을 포함한다. 일부 실시양태에서, 핵이 없는 세포의 직경은 약 1 마이크로미터(㎛) 내지 100 ㎛이다. 일부 실시양태에서, 핵이 없는 세포의 직경은 약 8 ㎛이다. 일부 실시양태에서, 핵이 없는 세포는 적어도 24시간 동안 냉동동면 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 24시간 동안 동결보존 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 48시간 냉동동면 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 48시간 동안의 동결보존 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 24시간 동안 동결건조 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 동결보존, 냉동동면, 또는 동결건조된 것이다. 일부 실시양태에서, 핵이 없는 세포는 단리 또는 정제된 것이다. 일부 실시양태에서, 생존능은 본원에 기술된 바와 같이 트리판 블루 염료 배제를 사용하여 측정된다. 일부 실시양태에서, 트리판 블루 염료 배제는 (a) 현탁액 중에서 분취량의 복수의 핵이 없는 세포를 원심분리하여 세포 펠릿을 생성하고; (b) 무혈청 배지 중에 세포 펠릿을 재현탁시켜 무혈청 세포 현탁액을 생성하고; (c) 1부 트리판 블루 염료 및 1부의 무혈청 세포 현탁액을 혼합하고; (d) (c)의 3-5분 이내에 복수의 핵이 없는 세포를 계수함으로써 수행되며, 여기서, 복수의 핵이 없는 세포 중 적어도 일부는 트리판 블루 염료로 염색되지 않고, 이는 생존능을 시사하는 것이다. 일부 실시양태에서, 생존능은 본원에 기술된 바와 같이 아넥신-5 세포 표면 염색을 사용하여 측정된다. 일부 실시양태에서, 핵이 없는 세포는 동결보존, 냉동동면, 또는 동결건조된 것이다. 일부 실시양태에서, 핵의 부재하에서 백신의 합성 또는 분비는 약 3일 이상의 기간 동안 핵이 없는 세포에 의해 수행된다. 일부 실시양태에서, 핵이 없는 세포는 약학적으로 허용되는 담체 중에 존재한다. 일부 실시양태에서, 핵이 없는 세포는 약 103개의 세포/kg(체중) 내지 약 1012개의 세포/kg(체중)의 투여량으로 존재한다. 일부 실시양태에서, 핵이 없는 세포는 적어도 약 103, 104, 105, 106, 107, 108, 109, 1010, 1011, 1012개의 세포/kg(체중) 이상의 투여량으로 존재한다. 일부 실시양태에서, 핵이 없는 세포는 최대 약 103, 104, 105, 106, 107, 108, 109, 1010, 1011, 1012개의 세포/kg(체중)의 투여량으로 존재한다. 일부 실시양태에서, 핵이 없는 세포는 단리 및 정제된 것이다.
본원에 개시된 측면은 본원에 기술된 복수의 핵이 없는 세포를 포함하는 세포 집단을 제공한다.
본원에 개시된 측면은 피험체에게 본원에 기술된 복수의 중 한 세포를 제1 용량으로 투여하는 단계를 포함하는, 피험체에게 백신을 전달하는 방법을 제공한다. 일부 실시양태에서, 피험체는 투여 후에 백신 접종을 받는다. 일부 실시양태에서, 투여는 냉동동면 또는 동결보존으로부터 세포를 제거한 후 적어도 24시간 후에 수행된다. 일부 실시양태에서, 투여는 냉동동면 또는 동결보존으로부터 세포를 제거한 후 적어도 48시간 후에 수행된다. 일부 실시양태에서, 핵이 없는 세포는 적어도 24시간 동안 동결건조 후 생존가능하다. 일부 실시양태에서, 생존능은 본원에 기술된 바와 같이 트리판 블루 염료 배제를 사용하여 측정된다. 일부 실시양태에서, 트리판 블루 염료 배제는 (a) 현탁액 중에서 분취량의 복수의 핵이 없는 세포를 원심분리하여 세포 펠릿을 생성하고; (b) 무혈청 배지 중에 세포 펠릿을 재현탁시켜 무혈청 세포 현탁액을 생성하고; (c) 1부 트리판 블루 염료 및 1부의 무혈청 세포 현탁액을 혼합하고; (d) (c)의 3-5분 이내에 복수의 핵이 없는 세포를 계수함으로써 수행되며, 여기서, 복수의 핵이 없는 세포 중 적어도 일부는 트리판 블루 염료로 염색되지 않고, 이는 생존능을 시사하는 것이다. 일부 실시양태에서, 생존능은 본원에 기술된 바와 같이 아넥신-5 세포 표면 염색을 사용하여 측정된다. 일부 실시양태에서, 세포는 피험체에서 핵의 부재하에서 3일 이상의 기간 동안 백신을 합성 또는 분비한다. 일부 실시양태에서, 세포는 피험체에서 핵의 부재하에서 약 3 내지 5일 동안 백신을 합성 또는 분비한다. 일부 실시양태에서, 본 방법은 제1 용량의 한 세포를 투여한 후 적어도 1개월 후에 피험체에게 세포 집단 중 제2 세포를 제2 용량으로 투여하는 단계를 추가로 포함한다. 일부 실시양태에서, 본 방법은 제1 용량의 한 세포를 투여한 후 적어도 2개월 후에 피험체에게 세포 집단 중 제2 세포를 제3 용량으로 투여하는 단계를 추가로 포함한다.
본원에 개시된 측면은 핵의 부재하에서 치료제를 합성 또는 분비하는 핵이 없는 세포를 그를 필요로 하는 피험체에게 투여하는 단계를 포함하고, 여기서, 치료제는 바이러스에 의한 감염과 연관된 질환 또는 병태를 치료하는 데 치료적으로 효과적이며, 서열 번호 1과 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87% 88%, 89% 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 서열에 의해 코딩된 것인 방법을 제공한다. 일부 실시양태에서, 본 방법은 피험체에서 질환 또는 병태를 치료하는 단계를 추가로 포함한다. 일부 실시양태에서, 치료제는 (a) 인터류킨 10의 효능제; (b) 인터류킨 10의 길항제; (c) 인터류킨 6; (d) 종양 괴사 인자(TNF: tumor necrosis factor); (e) (a) 내지 (d) 중 어느 하나의 일부; 또는 (e) (a) 내지 (d) 중 임의의 것의 조합이다. 일부 실시양태에서, 인터류킨 10의 효능제는 인터류킨 10, 또는 그의 일부이고, 서열 번호 13과 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87% 88%, 89% 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, 인터류킨 10의 효능제, 또는 그의 일부는 알부민 또는 그의 일부을 코딩하는 아미노산 서열을 추가로 포함한다. 일부 실시양태에서, 치료제는 세포에 의해 분비된다. 일부 실시양태에서, 인터류킨 6의 효능제, 또는 그의 일부는 서열 번호 14와 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87% 88%, 89% 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, TNF의 효능제는 서열 번호 15와 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87% 88%, 89% 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, 핵이 없는 세포는 피험체의 폐 조직에서 하나 이상의 세포 상에서 발현된 리간드에 특이적인 귀소 수용체를 추가로 포함한다. 일부 실시양태에서, 귀소 수용체는 P-셀렉틴 당단백질 리간드-1, C-C 모티프 케모카인 수용체 2, 또는 C-X-C 모티프 케모카인 수용체 4, 또는 그의 조합을 포함한다. 일부 실시양태에서, 세포는 피험체의 림프 조직에서 하나 이상의 세포 상에서 발현된 리간드에 특이적인 귀소 수용체를 추가로 포함한다. 일부 실시양태에서, 귀소 수용체는 C-X-C 케모카인 수용체 타입 3, 류코시아린, CD44 항원, C-C 케모카인 수용체 타입 7, L-셀렉틴, 림프구 기능 연관 항원 1, 또는 초후기 항원-4, 또는 그의 조합을 포함한다. 일부 실시양태에서, 핵이 없는 세포는 과립구-대식세포 콜로니 자극 인자(GM-CSF: granulocyte-macrophage colony-stimulating factor)를 포함하는 면역조정제를 추가로 포함한다. 일부 실시양태에서, 질환 또는 병태는 호흡기 질환 또는 병태이다. 일부 실시양태에서, 질환 또는 병태는 코로나바이러스 질환(COVID)의 증상을 포함한다. 일부 실시양태에서, COVID는 COVID-19이다.
본원에 개시된 측면은 핵의 부재하에서 치료제를 합성 또는 분비하는 핵이 없는 세포를 그를 필요로 하는 피험체에게 투여하는 단계를 포함하고, 여기서, 치료제는 적어도 부분적으로 병원체에 의한 감염에 의해 유발된 질환 또는 병태를 치료하는 데 치료적으로 효과적인 것인 방법을 제공한다. 일부 실시양태에서, 병원체는 바이러스, 박테리아, 진균, 또는 독소이다. 일부 실시양태에서, 바이러스는 종양용해성 바이러스이다. 일부 실시양태에서, 독소는 클로스트리디움 보툴리눔 독소, 클로스트리디움 페르프린겐스의 엡실론 독소, 포도상구균 장독소 B, 또는 리시누스 코무니스로부터의 리신 독소, 또는 그의 임의의 조합이다. 일부 실시양태에서, 박테리아는 바실러스 안트라시스, 예르시니아 페스티스, 프란시셀라 툴라렌시스, 브루셀라, 살모넬라, 에스케리키아 콜라이 O157:H7, 시겔라, 부르크홀데리아 말레이, 부르크홀데리아 슈도말레이, 클라미디아 시타시, 콕시엘라 번에티이, 리케차 프로와제키, 비브리오 콜레라에, 또는 크립토스포리디움 파르붐 또는 그의 임의의 조합이다. 일부 실시양태에서, 치료제는: (a) 인터류킨 10의 효능제; (b) 인터류킨 10의 길항제(예컨대, GIT27, AS101, 메소프람, 또는 리툭시맙); (c) 인터류킨 6; (d) 종양 괴사 인자(TNF); (e) (a) 내지 (d) 중 어느 하나의 일부; 또는 (e) (a) 내지 (d) 중 임의의 것의 조합이다. 일부 실시양태에서, 인터류킨 10의 효능제는 인터류킨 10, 또는 그의 일부이고, 서열 번호 13과 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87% 88%, 89% 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, 인터류킨 10의 효능제, 또는 그의 일부는 알부민 또는 그의 일부을 코딩하는 아미노산 서열을 추가로 포함한다. 일부 실시양태에서, 치료제는 세포에 의해 분비된다. 일부 실시양태에서, 인터류킨 6의 효능제, 또는 그의 일부는 서열 번호 14와 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87% 88%, 89% 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, TNF의 효능제는 서열 번호 15와 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87% 88%, 89% 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, 핵이 없는 세포는 피험체의 폐 조직에서 하나 이상의 세포 상에서 발현된 리간드에 특이적인 귀소 수용체를 추가로 포함한다. 일부 실시양태에서, 귀소 수용체는 P-셀렉틴 당단백질 리간드-1, C-C 모티프 케모카인 수용체 2, 또는 C-X-C 모티프 케모카인 수용체 4, 또는 그의 조합을 포함한다. 일부 실시양태에서, 세포는 피험체의 림프 조직에서 하나 이상의 세포 상에서 발현된 리간드에 특이적인 귀소 수용체를 추가로 포함한다. 일부 실시양태에서, 귀소 수용체는 C-X-C 케모카인 수용체 타입 3, 류코시아린, CD44 항원, C-C 케모카인 수용체 타입 7, L-셀렉틴, 림프구 기능 연관 항원 1, 또는 초후기 항원-4, 또는 그의 조합을 포함한다. 일부 실시양태에서, 핵이 없는 세포는 과립구-대식세포 콜로니 자극 인자(GM-CSF)를 포함하는 면역조정제를 추가로 포함한다. 일부 실시양태에서, 질환 또는 병태는 표 3-6에 제공되어 있다.
본원에 개시된 측면은 (a) 병원체에 의한 감염을 앓는 피험체에게 실질적으로 핵이 없는 복수의 세포를 투여하여 (i) (a)에서 피험체에게 투여된 복수의 세포 중 적어도 하나의 핵이 없는 세포의 병원체에 의한 감염을 허용하고; (ii) (i) 후, 적어도 하나의 핵이 없는 세포 내에서의 병원체의 증식을 방해함으로써 생체내에서 피험체로부터 병원체를 격리시키는 단계; 및 (b) (i) 생체내에서 복수의 세포 중 적어도 하나의 세포로부터 병원체를 제거 또는 감소; 및 (ii) 피험체로부터 적어도 하나의 핵이 없는 세포를 실질적으로 제거 중 적어도 하나에 의해 병원체 연관된 질환 또는 병태를 치료하는 단계를 포함하는, 병원체 연관된 질환 또는 병태를 치료하는 방법을 제공한다. 일부 실시양태에서, 적어도 하나의 핵이 없는 세포는 피험체의 림프 조직에서 하나 이상의 세포 상에서 발현된 리간드에 특이적인 귀소 수용체를 포함한다. 일부 실시양태에서, 귀소 수용체는 C-X-C 케모카인 수용체 타입 3, 류코시아린, CD44 항원, C-C 케모카인 수용체 타입 7, L-셀렉틴, 림프구 기능 연관 항원 1, 또는 초후기 항원-4, 또는 그의 조합을 포함한다. 일부 실시양태에서, 병원체는 코로나 바이러스이다. 일부 실시양태에서, 코로나 바이러스는 서열 번호 1과 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87% 88%, 89% 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 핵산 서열에 의해 코딩된다. 일부 실시양태에서, 적어도 하나의 핵이 없는 세포는 (a) 과립구-대식세포 콜로니 자극 인자; (b) 사이토카인; (c) (a) 또는 (b)의 일부; 또는 (d) (a) 내지 (c)의 임의의 조합을 포함하는 면역조정제를 포함한다. 일부 실시양태에서, 적어도 하나의 핵이 없는 세포는 (a) 내지 (d) 중 하나 이상의 것을 합성 또는 분비하는 데 충분한 하나 이상의 세포내 세포소기관을 포함한다. 일부 실시양태에서, 사이토카인은 서열 번호 13, 14, 또는 15, 또는 그의 조합과 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87% 88%, 89% 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, 사이토카인은 분비성이다. 일부 실시양태에서, 적어도 하나의 핵이 없는 세포의 직경은 1 마이크로미터(㎛) 내지 100 ㎛이다. 일부 실시양태에서, 적어도 하나의 핵이 없는 세포의 직경은 약 8 ㎛이다. 일부 실시양태에서, 본 방법은 (a)에서의 투여 이전에 냉동동면 또는 동결보존으로부터 실질적으로 핵이 없는 복수의 세포를 제거하는 단계를 추가로 포함한다. 일부 실시양태에서, 실질적으로 핵이 없는 복수의 세포는 냉동동면, 동결보존, 또는 동결건조로부터 실질적으로 핵이 없는 복수의 세포를 제거한 후 적어도 24시간 동안 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 24시간 동안 동결건조 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 동결보존, 냉동동면, 또는 동결건조된 것이다. 일부 실시양태에서, 핵이 없는 세포는 단리 또는 정제된 것이다. 일부 실시양태에서, 생존능은 본원에 기술된 바와 같이 트리판 블루 염료 배제를 사용하여 측정된다. 일부 실시양태에서, 트리판 블루 염료 배제는 (a) 현탁액 중에서 분취량의 복수의 핵이 없는 세포를 원심분리하여 세포 펠릿을 생성하고; (b) 무혈청 배지 중에 세포 펠릿을 재현탁시켜 무혈청 세포 현탁액을 생성하고; (c) 1부 트리판 블루 염료 및 1부의 무혈청 세포 현탁액을 혼합하고; (d) (c)의 3-5분 이내에 복수의 핵이 없는 세포를 계수함으로써 수행되며, 여기서, 복수의 핵이 없는 세포 중 적어도 일부는 트리판 블루 염료로 염색되지 않고, 이는 생존능을 시사하는 것이다. 일부 실시양태에서, 생존능은 본원에 기술된 바와 같이 아넥신-5 세포 표면 염색을 사용하여 측정된다. 일부 실시양태에서, (b)에서 병원체 연관된 질환 또는 병태를 치료하는 단계는 복수의 세포 중 적어도 하나의 세포로부터 병원체를 제거 또는 감소시킴으로써 이루어진다. 일부 실시양태에서, 적어도 하나의 세포는 적어도 하나의 세포로부터 병원체를 제거 또는 감소시키는 데 효과적인 항바이러스제를 포함한다. 일부 실시양태에서, (b)에서 병원체 연관된 질환 또는 병태를 치료하는 단계는 피험체로부터 적어도 하나의 핵이 없는 세포를 실질적으로 제거함으로써 이루어진다. 일부 실시양태에서, 복수의 세포는 적혈구 또는 적혈구 전구체가 아니다. 일부 실시양태에서, 적어도 하나의 핵이 없는 세포는 병원체와, 피험체의 세포에 의해 발현된 병원체 인식 수용체 사이의 결합을 차단하는 중화 항체를 코딩하는 이종성 폴리뉴클레오티드를 포함한다.
일부 실시양태에서, 본 방법은 핵의 부재하에서 적어도 하나의 핵이 없는 세포에 의해 중화 항체를 분비하여 병원체와, 피험체의 세포의 병원체 인식 모이어티 사이의 결합을 감소 또는 호전시키는 단계를 추가로 포함한다. 일부 실시양태에서, 병원체는 바이러스, 박테리아, 독소, 또는 진균이다. 일부 실시양태에서, 바이러스는 종양용해성 바이러스이다. 일부 실시양태에서, 바이러스는 코로나 바이러스이다. 일부 실시양태에서, 코로나 바이러스는 SARS-CoV-2, 또는 그의 변이체이다. 일부 실시양태에서, 독소는 클로스트리디움 보툴리눔 독소, 클로스트리디움 페르프린겐스의 엡실론 독소, 포도상구균 장독소 B, 또는 리시누스 코무니스로부터의 리신 독소, 또는 그의 임의의 조합이다. 일부 실시양태에서, 박테리아는 바실러스 안트라시스, 예르시니아 페스티스, 프란시셀라 툴라렌시스, 브루셀라, 살모넬라, 에스케리키아 콜라이 O157:H7, 시겔라, 부르크홀데리아 말레이, 부르크홀데리아 슈도말레이, 클라미디아 시타시, 콕시엘라 번에티이, 리케차 프로와제키, 비브리오 콜레라에, 또는 크립토스포리디움 파르붐 또는 그의 임의의 조합이다.
참조로 포함
본 명세서에 언급된 모든 공개문헌, 특허 및 특허 출원은 마치 각각의 개별 공개문헌, 특허 또는 특허 출원이 참조로 포함되는 것으로 구체적이고 개별적으로 명시된 것처럼 동일한 정도로 본원에서 참조로 포함된다. 참고로 포함된 공개문헌 및 특허 또는 특허 출원이 명세서에 포함된 개시내용과 모순되는 한, 본 명세서는 그러한 모순되는 자료를 대체 및/또는 우선한다.
본원에 개시된 방법 및 조성물의 일부 신규한 특징이 본 개시내용에 기재되어 있다. 개시된 조성물 및 방법의 원리가 활용되는 예시적인 실시양태를 기술하는 하기의 상세한 설명, 및 이에 대한 첨부 도면을 참조함으로써 본원에 개시된 방법 및 조성물의 특징 및 이점에 대한 더욱 잘 이해할 수 있게 될 것이다:
도 1은 본 개시내용의 한 실시양태에 따른 신속한 바이러스 백신 플랫폼을 위해 세포를 조작하는 프로세스를 보여주는 것이다.
도 2는 종래 백신 개발 타임라인과 비교하여, 본 개시내용의 한 실시양태에 따른 신속한 바이러스 백신 플랫폼을 이용한 백신 생산 타임라인을 보여주는 것이다.
도 3은 본 개시내용의 한 실시양태에 따라 새롭게 확인된 바이러스를 처리하기 위해 신속한 바이러스 백신 플랫폼을 보급하기 위한 프로세스를 보여주는 것이다.
도 4는 본 개시내용의 실시양태에 따른 본원에 기술된 세포질체가 살아있는 바이러스(예를 들어, 코로나바이러스)를 포획하고, 제거하는 프로세스를 보여주는 것이다.
도 5는 본원에 기술된 신속한 바이러스 백신 플랫폼의 이점의 비제한적인 예를 보여주는 것이다.
도 6a는 명시된 시간 동안 4℃에서 냉동동면으로부터 회복된 직후 MSC 및 MSC 유래 세포질체의 생존능을 보여주는 대표적인 선 그래프이다. 생존능을 트리판 블루 염료 배제를 사용하여 자동화된 세포 계수(Cell Countess)에서 평가하였고, 입력된 세포 개수 대비 비로 제시하였다.
도 6b는 명시된 시간 동안 4℃에서 냉동동면으로부터 회복된 직후 보이덴(Boyden) 챔버 검정법에서 이동된 MSC 및 MSC 유래 세포질체를 비교하는 대표적인 막대 그래프이다. 세포와 세포질체를 무혈청(음성 대조군) 또는 10% 프리미엄 FBS(P-FBS)를 바닥 챔버에서 화학유인물질로 사용하여 3시간 동안 이동하도록 하고, 계수를 로딩 대조군 대비로 정규화하였다.
도 7a는 MSC 및 세포질체 내로 형질감염된 인터류킨 10(IL-10) mRNA의 개략도이다. IL-10 mRNA 코딩 영역(CDS)의 시작 코돈 앞에 코작(Kozak) 서열을 부가하였다. 인간 베타 글로빈(HBB) mRNA의 5'UTR 및 3'UTR은 각각 IL-10 CDS의 5' 및 3' 단부에 부가하였다. 인공 5'Cap은 IL-10 mRNA의 5' 단부에 부가하였고, mRNA 안정성을 증가시키기 위해 슈도우리딘 변형을 조작하였다.
도 7b는 형질감염(++) 또는 비-형질감염(--) MSC 또는 MSC 유래 세포질체의 배양 배지 중 IL-10 농도를 보여주는 막대 그래프이다. MSC 유래 세포질체를 IL-10 mRNA로 형질감염시킨 후, 2.5 x 104개의 세포/웰로 24 웰 플레이트에 시딩하였다. 조절 배지(CM: conditioned medium)를 형질감염 24시간 후에 수집하고, IL-10 농도를 ELISA에 의해 측정하였다.
도 7c는 1시간 도 7b에서와 같이 처리된 MSC 또는 세포질체로부터의 명시된 조절 배지(CM)로 처리된 혈청 고갈 RAW 대식세포에서 Stat3 및 인산화된 Stat3(P-Stat3, IL-10 활성화의 마커)의 단백질 발현을 보여주는 면역블롯이다. 비처리 = 비처리 CM 대조군. 완전 배지 = MSC 완전 배양 배지로 처리된 RAW 세포. MSC Ctrl = 형질감염되지 않은 MSC로부터의 CM으로 처리된 RAW 세포. MSC IL-10 = IL-10 mRNA 형질감염된 MSC로부터의 CM으로 처리된 RAW 세포. 세포질체 Ctrl = 형질감염되지 않은 세포질체로부터의 CM으로 처리된 RAW 세포. 세포질체 IL-10 = IL-10 mRNA 형질감염 세포질체로부터의 CM으로 처리된 RAW 세포.
도 7d는 ELISA에 의해 측정된 마우스 혈액 중 분비된 IL-10 사이토카인의 농도를 보여주는 막대 그래프이다. MSC 또는 MSC 유래 세포질체를 도 7b에서와 같이 처리하고, C57BL/6 마우스의 혈관 구조 내로 안와후 주사하였다. 주사 2시간 후, 동물을 안락사시키고, 심장 천자로 혈액 샘플을 수집하였다. 평균 ± SEM; n=3.
도 8a는 24시간 화학유인물질로서의 10% FBS를 향해 기저 막 추출물(BME: Basement Membrane Extract)로 코팅된 8.0 ㎛ 다공성 필터의 밑면을 침범한, 보이덴 챔버 분석에서 크리스탈 바이올렛(Crystal Violet) 염색 MSC 또는 MSC 유래 세포질체의 대표적인 명시야 현미경 이미지이다. 음성 = FBS 부재(음성 대조군). 스케일 바 = 50 ㎛.
도 8b는 로딩 대조군 대비 막의 밑면을 침범한, 도 8a에서와 같이 처리된 MSC 또는 MSC 유래 세포질체의 비를 보여주는 대표적인 막 그래프이다.
도 9a는 현탁 배지 중 MSC 및 세포질체의 대표적인 표면형광 현미경 이미지(상단 패널) 및 위상차 현미경 이미지(하단 패널)이다. 액틴 피질을 라이프액트(Lifeact) RFP로 염색한 반면, 세포 핵은 바이브란트® 다이사이클™ 그린(Vybrant® Dyecycle™ Green)으로 염색하였다. 화살표는 세포질체를 가리키고, 화살촉은 MSC 핵을 가리킨다. 스케일 바 = 20 ㎛.
도 9b는 니콘 엘리먼트(Nikon Element) 소프트웨어로 측정한, MSC 및 세포질체의 크기 분포를 보여주는 대표적인 산점도이다.
도 9c는 폐에 존재하는, 검출된 바이브란트® DiD 표지된 MSC 또는 세포질체를 보여주는 대표적인 막대 그래프이다. MSC 또는 세포질을 DiD 염료로 표지하고, C57BL/6 마우스의 혈관 구조 내로 안와후 주사하였다. 조직을 24시간 후에 수거하고, 세포 현탁액을 유세포 분석법에 의해 분석하였다. 평균 ± SEM; n=3.
도 9d는 간에 존재하는, 검출된 바이브란트® DiD 표지된 MSC 또는 세포질체를 보여주는 대표적인 막대 그래프이다. 평균 ± SEM; n=3. MSC 또는 세포질을 DiD 염료로 표지하고, C57BL/6 마우스의 혈관 구조 내로 안와후 주사하였다. 조직을 24시간 후에 수거하고, 세포 현탁액을 유세포 분석법에 의해 분석하였다.
도 10a는 폐에서 검출된 DiD 표지된 MSC 또는 세포질체의 개수를 보여주는 대표적인 산점도이다. MSC를 표준 부착 조건하에(2D) 또는 3D 세포질체를 생성하기 위해 핸드 드롭 방법(3D)에 의해 현탁액 중에서 배양하였다. MSC 및 세포질체를 바이브란트® DiD 염료로 표지하고, C57BL/6 마우스의 혈관 구조에 안와후 주사하였다. 조직을 24시간 후에 수거하고, 세포 현탁액을 유세포 분석법에 의해 분석하였다. 평균 ± SEM; n=2.
도 10b는 간에서 검출된 DiD 표지된 MSC 또는 세포질체의 개수를 보여주는 대표적인 산점도이다. MSC를 표준 부착 조건하에(2D) 또는 3D 세포질체를 생성하기 위해 핸드 드롭 방법(3D)에 의해 현탁액 중에서 배양하였다. MSC 및 세포질체를 바이브란트® DiD 염료로 표지하고, C57BL/6 마우스의 혈관 구조에 안와후 주사하였다. 조직을 24시간 후에 수거하고, 세포 현탁액을 유세포 분석법에 의해 분석하였다. 평균 ± SEM; n=2.
도 10c는 비장에서 검출된 바이브란트® DiD 표지된 MSC 또는 세포질체의 개수를 보여주는 대표적인 산점도이다. MSC를 표준 부착 조건하에(2D) 또는 3D 세포질체를 생성하기 위해 핸드 드롭 방법(3D)에 의해 현탁액 중에서 배양하였다. MSC 및 세포질체를 DiD 염료로 표지하고, C57BL/6 마우스의 혈관 구조에 안와후 주사하였다. 조직을 24시간 후에 수거하고, 세포 현탁액을 유세포 분석법에 의해 분석하였다. 평균 ± SEM; n=2.
도 11a-11b는 감염 후 12 hr째의 MOI 0.05로 VSV-GFP(화살표)로 감염된 유핵 모 MSC(상단) 및 MSC 유래 세포질체(하단)의 표면형광 현미경 이미지를 도시한 것이다. GFP 항원은 핵이 없는 MSC에 의해 명확하고, 강건하게 발현되었으며, 이는 제핵 세포에서의 바이러스 복제 및 항원 생산을 시사하는 것이다. 스케일 바 = 50 ㎛. 도 11b. 감염 후 12시간째의 MOI 0.05로 MOI 0.1로 VSV-GFP(화살촉)로 감염된 핵이 없는 MSC 유래 세포의 고배율 표면형광 이미지. 세포질체를 로다민 팔로이딘 (화살표)을 이용하여 F-액틴 필라멘트에 대해 염색하고, 핵 결여를 도시하기 위해 DAPI를 사용하여 핵 염색을 수행하였다.
도 12a-12d는 감염 후 48 hr째의 MOI 0.05로 GFP 항원을 코딩하는 oHSV로 감염된 MSC 및 핵이 없는 MSC의 표면형광 현미경 이미지를 도시한 것이다. oHSV-GFP 접종 후 18 hr째 MSC로부터 핵이 없는 MSC(세포질체)를 생성하였다. 스케일 바 = 50 ㎛. 도 12b는 라이프액트-RFP를 발현하는 MSC 또는 핵이 없는 MSC를 GFP를 코딩하는 종양용해성 단순 헤르페스 바이러스(oHSV-GFP: oncolytic herpes simplex virus encoding GFP) 0.05 MOI로 감염시킨 후, 이어서, 누드 마우스에서 성장하는 확립된 U87 교아세포종 종양에 주사한 것을 도시한 것이다. 이미지는 주사 후 7일째에 촬영하였다. 강력한 GFP 신호로 나타난 바와 같이, MSC 및 핵이 없는 MSC는 oHSV를 종양 세포로 전달하였다. 7일 후 종양에서 핵이 없는 MSC는 거의 검출되지 않은 반면, 성장하는 종양의 중앙(주사 부위)과 바깥쪽 가장자리에는 다수의 MSC가 존재한다는 것이 주목할 만하였다. 도 12c는 oHSV-GFP 바이러스를 보유하는 MSC 또는 핵이 없는 MSC에 의해 감염된 종양 세포의 부분을 나타내는 GFP로 커버된 종양 면적의 비율(%)을 보여주는 막대 그래프이다. 도 12d는 PBS 주사 대조군과 비교하여 IL-12(애주번트) 조작된 핵이 없는 MSC 및 oHSV 조작된 핵이 없는 MSC의 조합으로 처리된 확립된 교아세포종 종양에 존재하는 CD8+ 이펙터 T 세포의 비가 증가된 것을 보여주는 그래프이다.
도 13a-13b는 제핵 중간엽 기질 세포(MSC: mesenchymal stromal cel)(세포질체)가 세포 투과성 항원 펩티드를 쉽게 흡수한다는 것을 도시한 것이다. 도 13a는 100 μM의 세포 투과성 항원 펩티드(Arg)9-FAM(6-카복시플루오르세인, FAM-Arg-Arg-Arg-Arg-Arg-Arg-Arg-Arg-Arg-OH)과 함께 인큐베이션된 MSC(좌측) 및 제핵 MSC(세포질체)(우측)를 보여주는 것이다. 스케일 바 = 50 ㎛. 화살표는 훽스트(Hoechst) 염색된 핵을 나타내고, 화살촉은 양성 (Arg)9-FAM을 나타낸다. 도 13b는 이미지J(ImageJ)에서 측정된 상대 형광 강도를 나타내는 막대 그래프를 도시한 것이다. 보정된 총 세포 형광 = 적분된 밀도 - (선택한 세포 면적 X 배경 판독값의 평균 형광). 평균 ± SEM; n=10.
도 1은 본 개시내용의 한 실시양태에 따른 신속한 바이러스 백신 플랫폼을 위해 세포를 조작하는 프로세스를 보여주는 것이다.
도 2는 종래 백신 개발 타임라인과 비교하여, 본 개시내용의 한 실시양태에 따른 신속한 바이러스 백신 플랫폼을 이용한 백신 생산 타임라인을 보여주는 것이다.
도 3은 본 개시내용의 한 실시양태에 따라 새롭게 확인된 바이러스를 처리하기 위해 신속한 바이러스 백신 플랫폼을 보급하기 위한 프로세스를 보여주는 것이다.
도 4는 본 개시내용의 실시양태에 따른 본원에 기술된 세포질체가 살아있는 바이러스(예를 들어, 코로나바이러스)를 포획하고, 제거하는 프로세스를 보여주는 것이다.
도 5는 본원에 기술된 신속한 바이러스 백신 플랫폼의 이점의 비제한적인 예를 보여주는 것이다.
도 6a는 명시된 시간 동안 4℃에서 냉동동면으로부터 회복된 직후 MSC 및 MSC 유래 세포질체의 생존능을 보여주는 대표적인 선 그래프이다. 생존능을 트리판 블루 염료 배제를 사용하여 자동화된 세포 계수(Cell Countess)에서 평가하였고, 입력된 세포 개수 대비 비로 제시하였다.
도 6b는 명시된 시간 동안 4℃에서 냉동동면으로부터 회복된 직후 보이덴(Boyden) 챔버 검정법에서 이동된 MSC 및 MSC 유래 세포질체를 비교하는 대표적인 막대 그래프이다. 세포와 세포질체를 무혈청(음성 대조군) 또는 10% 프리미엄 FBS(P-FBS)를 바닥 챔버에서 화학유인물질로 사용하여 3시간 동안 이동하도록 하고, 계수를 로딩 대조군 대비로 정규화하였다.
도 7a는 MSC 및 세포질체 내로 형질감염된 인터류킨 10(IL-10) mRNA의 개략도이다. IL-10 mRNA 코딩 영역(CDS)의 시작 코돈 앞에 코작(Kozak) 서열을 부가하였다. 인간 베타 글로빈(HBB) mRNA의 5'UTR 및 3'UTR은 각각 IL-10 CDS의 5' 및 3' 단부에 부가하였다. 인공 5'Cap은 IL-10 mRNA의 5' 단부에 부가하였고, mRNA 안정성을 증가시키기 위해 슈도우리딘 변형을 조작하였다.
도 7b는 형질감염(++) 또는 비-형질감염(--) MSC 또는 MSC 유래 세포질체의 배양 배지 중 IL-10 농도를 보여주는 막대 그래프이다. MSC 유래 세포질체를 IL-10 mRNA로 형질감염시킨 후, 2.5 x 104개의 세포/웰로 24 웰 플레이트에 시딩하였다. 조절 배지(CM: conditioned medium)를 형질감염 24시간 후에 수집하고, IL-10 농도를 ELISA에 의해 측정하였다.
도 7c는 1시간 도 7b에서와 같이 처리된 MSC 또는 세포질체로부터의 명시된 조절 배지(CM)로 처리된 혈청 고갈 RAW 대식세포에서 Stat3 및 인산화된 Stat3(P-Stat3, IL-10 활성화의 마커)의 단백질 발현을 보여주는 면역블롯이다. 비처리 = 비처리 CM 대조군. 완전 배지 = MSC 완전 배양 배지로 처리된 RAW 세포. MSC Ctrl = 형질감염되지 않은 MSC로부터의 CM으로 처리된 RAW 세포. MSC IL-10 = IL-10 mRNA 형질감염된 MSC로부터의 CM으로 처리된 RAW 세포. 세포질체 Ctrl = 형질감염되지 않은 세포질체로부터의 CM으로 처리된 RAW 세포. 세포질체 IL-10 = IL-10 mRNA 형질감염 세포질체로부터의 CM으로 처리된 RAW 세포.
도 7d는 ELISA에 의해 측정된 마우스 혈액 중 분비된 IL-10 사이토카인의 농도를 보여주는 막대 그래프이다. MSC 또는 MSC 유래 세포질체를 도 7b에서와 같이 처리하고, C57BL/6 마우스의 혈관 구조 내로 안와후 주사하였다. 주사 2시간 후, 동물을 안락사시키고, 심장 천자로 혈액 샘플을 수집하였다. 평균 ± SEM; n=3.
도 8a는 24시간 화학유인물질로서의 10% FBS를 향해 기저 막 추출물(BME: Basement Membrane Extract)로 코팅된 8.0 ㎛ 다공성 필터의 밑면을 침범한, 보이덴 챔버 분석에서 크리스탈 바이올렛(Crystal Violet) 염색 MSC 또는 MSC 유래 세포질체의 대표적인 명시야 현미경 이미지이다. 음성 = FBS 부재(음성 대조군). 스케일 바 = 50 ㎛.
도 8b는 로딩 대조군 대비 막의 밑면을 침범한, 도 8a에서와 같이 처리된 MSC 또는 MSC 유래 세포질체의 비를 보여주는 대표적인 막 그래프이다.
도 9a는 현탁 배지 중 MSC 및 세포질체의 대표적인 표면형광 현미경 이미지(상단 패널) 및 위상차 현미경 이미지(하단 패널)이다. 액틴 피질을 라이프액트(Lifeact) RFP로 염색한 반면, 세포 핵은 바이브란트® 다이사이클™ 그린(Vybrant® Dyecycle™ Green)으로 염색하였다. 화살표는 세포질체를 가리키고, 화살촉은 MSC 핵을 가리킨다. 스케일 바 = 20 ㎛.
도 9b는 니콘 엘리먼트(Nikon Element) 소프트웨어로 측정한, MSC 및 세포질체의 크기 분포를 보여주는 대표적인 산점도이다.
도 9c는 폐에 존재하는, 검출된 바이브란트® DiD 표지된 MSC 또는 세포질체를 보여주는 대표적인 막대 그래프이다. MSC 또는 세포질을 DiD 염료로 표지하고, C57BL/6 마우스의 혈관 구조 내로 안와후 주사하였다. 조직을 24시간 후에 수거하고, 세포 현탁액을 유세포 분석법에 의해 분석하였다. 평균 ± SEM; n=3.
도 9d는 간에 존재하는, 검출된 바이브란트® DiD 표지된 MSC 또는 세포질체를 보여주는 대표적인 막대 그래프이다. 평균 ± SEM; n=3. MSC 또는 세포질을 DiD 염료로 표지하고, C57BL/6 마우스의 혈관 구조 내로 안와후 주사하였다. 조직을 24시간 후에 수거하고, 세포 현탁액을 유세포 분석법에 의해 분석하였다.
도 10a는 폐에서 검출된 DiD 표지된 MSC 또는 세포질체의 개수를 보여주는 대표적인 산점도이다. MSC를 표준 부착 조건하에(2D) 또는 3D 세포질체를 생성하기 위해 핸드 드롭 방법(3D)에 의해 현탁액 중에서 배양하였다. MSC 및 세포질체를 바이브란트® DiD 염료로 표지하고, C57BL/6 마우스의 혈관 구조에 안와후 주사하였다. 조직을 24시간 후에 수거하고, 세포 현탁액을 유세포 분석법에 의해 분석하였다. 평균 ± SEM; n=2.
도 10b는 간에서 검출된 DiD 표지된 MSC 또는 세포질체의 개수를 보여주는 대표적인 산점도이다. MSC를 표준 부착 조건하에(2D) 또는 3D 세포질체를 생성하기 위해 핸드 드롭 방법(3D)에 의해 현탁액 중에서 배양하였다. MSC 및 세포질체를 바이브란트® DiD 염료로 표지하고, C57BL/6 마우스의 혈관 구조에 안와후 주사하였다. 조직을 24시간 후에 수거하고, 세포 현탁액을 유세포 분석법에 의해 분석하였다. 평균 ± SEM; n=2.
도 10c는 비장에서 검출된 바이브란트® DiD 표지된 MSC 또는 세포질체의 개수를 보여주는 대표적인 산점도이다. MSC를 표준 부착 조건하에(2D) 또는 3D 세포질체를 생성하기 위해 핸드 드롭 방법(3D)에 의해 현탁액 중에서 배양하였다. MSC 및 세포질체를 DiD 염료로 표지하고, C57BL/6 마우스의 혈관 구조에 안와후 주사하였다. 조직을 24시간 후에 수거하고, 세포 현탁액을 유세포 분석법에 의해 분석하였다. 평균 ± SEM; n=2.
도 11a-11b는 감염 후 12 hr째의 MOI 0.05로 VSV-GFP(화살표)로 감염된 유핵 모 MSC(상단) 및 MSC 유래 세포질체(하단)의 표면형광 현미경 이미지를 도시한 것이다. GFP 항원은 핵이 없는 MSC에 의해 명확하고, 강건하게 발현되었으며, 이는 제핵 세포에서의 바이러스 복제 및 항원 생산을 시사하는 것이다. 스케일 바 = 50 ㎛. 도 11b. 감염 후 12시간째의 MOI 0.05로 MOI 0.1로 VSV-GFP(화살촉)로 감염된 핵이 없는 MSC 유래 세포의 고배율 표면형광 이미지. 세포질체를 로다민 팔로이딘 (화살표)을 이용하여 F-액틴 필라멘트에 대해 염색하고, 핵 결여를 도시하기 위해 DAPI를 사용하여 핵 염색을 수행하였다.
도 12a-12d는 감염 후 48 hr째의 MOI 0.05로 GFP 항원을 코딩하는 oHSV로 감염된 MSC 및 핵이 없는 MSC의 표면형광 현미경 이미지를 도시한 것이다. oHSV-GFP 접종 후 18 hr째 MSC로부터 핵이 없는 MSC(세포질체)를 생성하였다. 스케일 바 = 50 ㎛. 도 12b는 라이프액트-RFP를 발현하는 MSC 또는 핵이 없는 MSC를 GFP를 코딩하는 종양용해성 단순 헤르페스 바이러스(oHSV-GFP: oncolytic herpes simplex virus encoding GFP) 0.05 MOI로 감염시킨 후, 이어서, 누드 마우스에서 성장하는 확립된 U87 교아세포종 종양에 주사한 것을 도시한 것이다. 이미지는 주사 후 7일째에 촬영하였다. 강력한 GFP 신호로 나타난 바와 같이, MSC 및 핵이 없는 MSC는 oHSV를 종양 세포로 전달하였다. 7일 후 종양에서 핵이 없는 MSC는 거의 검출되지 않은 반면, 성장하는 종양의 중앙(주사 부위)과 바깥쪽 가장자리에는 다수의 MSC가 존재한다는 것이 주목할 만하였다. 도 12c는 oHSV-GFP 바이러스를 보유하는 MSC 또는 핵이 없는 MSC에 의해 감염된 종양 세포의 부분을 나타내는 GFP로 커버된 종양 면적의 비율(%)을 보여주는 막대 그래프이다. 도 12d는 PBS 주사 대조군과 비교하여 IL-12(애주번트) 조작된 핵이 없는 MSC 및 oHSV 조작된 핵이 없는 MSC의 조합으로 처리된 확립된 교아세포종 종양에 존재하는 CD8+ 이펙터 T 세포의 비가 증가된 것을 보여주는 그래프이다.
도 13a-13b는 제핵 중간엽 기질 세포(MSC: mesenchymal stromal cel)(세포질체)가 세포 투과성 항원 펩티드를 쉽게 흡수한다는 것을 도시한 것이다. 도 13a는 100 μM의 세포 투과성 항원 펩티드(Arg)9-FAM(6-카복시플루오르세인, FAM-Arg-Arg-Arg-Arg-Arg-Arg-Arg-Arg-Arg-OH)과 함께 인큐베이션된 MSC(좌측) 및 제핵 MSC(세포질체)(우측)를 보여주는 것이다. 스케일 바 = 50 ㎛. 화살표는 훽스트(Hoechst) 염색된 핵을 나타내고, 화살촉은 양성 (Arg)9-FAM을 나타낸다. 도 13b는 이미지J(ImageJ)에서 측정된 상대 형광 강도를 나타내는 막대 그래프를 도시한 것이다. 보정된 총 세포 형광 = 적분된 밀도 - (선택한 세포 면적 X 배경 판독값의 평균 형광). 평균 ± SEM; n=10.
상세한 설명
본원에서는 병원성 감염(예컨대, 바이러스, 진균, 기생충, 박테리아) 또는 상기 병원성 감염과 연관된 질환 또는 병태를 치료하거나, 또는 예방하기 위한 조성물 및 키트, 및 그의 사용 방법을 개시한다. 본 개시내용의 조성물은 병원성 감염과 연관된 질환 또는 병태를 치료하고/거나, 병원성 감염을 예방하는 데 효과적인 치료제를 함유하고, 일부 경우에서는 그를 생산하도록 조작된 제핵 세포인 세포질체를 포함한다. 일부 실시양태에서, 본원에 기술된 치료제는 백신(예컨대, 약독화된 바이러스 항원), 급성 바이러스 감염을 치료하는 데 효과적인 바이러스 표적화제, 또는 상기 둘의 조합일 수 있다. 일부 실시양태에서, 세포질은 또한 병원체를 포획하고(예컨대, 생체내), 이들을 불활성화시켜 급성 감염을 치료하고, 추가 감염을 예방하도록 조작될 수 있다. 일부 실시양태에서, 병원체는 예컨대, 코로나바이러스와 같은 하나 이상의 바이러스이다.
기존의 세포 기반 요법은 많은 단점을 가지고 있다. 효과적인 세포 기반 치료제의 개발은 종종 유전 공학 및 생체외 세포의 게놈 내로 새로운 유전 물질의 도입을 필요로 한다. 그러나, 이러한 프로세스는 특히 조작된 세포가 신체에 영구적으로 생착되거나, 또는 숙주 세포와 융합하는 경우, 암 및 생명을 위협하는 다른 질환을 생성하는 위험한 돌연변이를 게놈에 도입할 수 있다. 기존의 많은 세포 기반 치료제의 또 다른 중요한 문제는 신체에 전달된 후, 세포가 제어할 수 없을 정도로 증식하고, 신체에 영구적으로 생착될 수 있어 생명을 위협할 수 있다는 것이다. 또한, 피험체에 투여한 후 세포 제어가 부족하면 정확한 용량의 치료 세포 및 그의 생체활성 생성물의 전달이 어려워질 수 있다(예컨대, 약동학적 성질 불량). 따라서, 치료제 또는 다른 생체분자를 전달하기 위한 안전하고 제어가능한 세포 기반 요법이 필요하다.
환자 또는 피험체 전달 전에, 전통적인 세포 기반 치료제는 바람직한 세포 및 치료 기능을 생성하도록 생체외에서 일반적으로 변형되거나, 또는 유전적으로 변경된다. 그러나, 이러한 세포가 피험체에 도입되면, 새로운 숙주 환경이 크게 리프로그래밍되고, 부정적으로 변경되거나, 또는 그렇지 않으면 효과가 없게 만들 수 있다. 따라서, 리프로그래밍 및 유해한 외부 신호에 반응할 수 없는 더욱 예측가능한 세포 기반 요법이 필요하다.
현존하는 세포 기반 요법은 암 또는 다른 질환에 대한 치료제로서 피험체에게 전달하기 위해 그에 로딩될 수 있는 DNA 손상/유전자 표적화제의 양에 의해 제한된다. 이는 DNA 손상 화학요법 약물, DNA 통합 바이러스, 종양용해성 바이러스, 및 일정한 간격을 두고 주기적으로 분포하는 짧은 회문 반복부(CRISPR: cluster regularly interspaced short palindromic repeat), Cas의 작은 클러스터(CRISPR/Cas 시스템), 및 플라스미드를 포함하나, 이에 제한되지 않는 유전자 요법 적용 프로그램/전달을 포함하나, 이에 제한되지 않는다. 따라서, 이러한 제한이 없는 세포 기반 요법이 필요하며, 이는 고용량의 세포독성 치료제를 전달하는 이상적인 플랫폼이 될 수 있다.
본 개시내용의 세포질체를 사용하여 피험체에게 치료제를 전달하는 데에는 몇 가지 이점이 있다. 그의 핵으로부터의 DNA(예컨대, 핵-코딩 유전자 또는 외래 또는 돌연변이체 DNA)를 의도하지 않게 숙주 세포로 전달하는 종래 세포 기반과 달리, 본 개시내용의 세포질체는 핵 없이는 그렇게 할 수 없다. 추가로, 본원에 기술된 세포질체를 사용하여 피험체에 치료제를 전달하는 것은 제어가능하고, 유한하며(예컨대, 14일 이하), 적어도 핵이 없으면, 세포질체가 다른 세포 유형으로 증식하거나 분화할 수 없기 때문이다. 본 개시내용의 세포질체는 핵의 부재하에서 본원에 기술된 치료제 또는 다른 생체분자를 발현 및/또는 분비할 수 있을 뿐만 아니라, 생체내 표적 세포 또는 표적 조직 또는 환경으로 이동하거나, 또는 귀소할 수 있다. 이는 적어도 부분적으로는, 생성된 세포질체가 정상적인 생물학적 기능(예컨대, 단백질 생산/분비, 세포 운동성, 케모카인 감지 등)에 충분한 모세포로부터의 세포소기관을 보유하도록 본원에 기술된 방법을 사용하여 모세포로부터 제핵함으로써 달성된다. 심지어 피험체에게 전신적으로 전달되는 경우에도, 본원에 기술된 세포질체는 안전하고, 제어가능한 방식으로 피험체의 표적 조직 또는 표적 세포(예컨대, 림프 조직, 폐 조직)에 치료제를 효율적이고 효과적으로 전달한다. 또한, 종래 세포 기반 요법을 대량으로 제조하는 것은 시간 집약적이고, 고가인 바, 임상 적용이 제한된다. 핵을 포함하는 불멸화 세포(예컨대, hTERT)를 사용하여 제조 능력을 향상시키면 제조 규모가 증가하고, 제조 비용이 낮아질 수 있다고 생각되지만, 불멸화 세포는 염색체 이상을 일으키기 쉽고, 종양 또는 이소성 조직 형성을 촉진하여, 임상 적용에 안전하지 않게 만든다. 본 개시내용의 실시양태에 따라 이러한 세포 또는 임의의 세포 유형으로부터 제핵함으로써, 세포질체 제조와 연관된 규모 증가 및 비용 절감을 달성할 수 있으며, 동시에 종래 세포 기반에 의해 야기되는 인간 건강에 대한 위험을 완화시킬 수 있다.
본원에 기술된 조성물의 개선된 제조 규모 및 비용, 안전성 프로파일, 및 효율성은 백신 개발에 중요한 이점을 갖는다. 본원에 기술된 조성물을 제조하는 방법은, 일반적으로 생산자 세포주로부터 백신(예컨대, 항원, mRNA)의 단리 및 정제가 요구되는 종래 백신 개발 타임라인보다 더 빠르다. 대조적으로, 본 개시내용의 세포질체는 항바이러스 조성물을 연속적으로 생산하도록 조작되어 백신의 단리 및 정제의 필요성을 제거한다. 필요한 시점에서, 본원에 기술된 조성물은 근육내 주사보다는 전신으로(예컨대, 흡입) 투여되어 의료 시설이 백신을 투여할 필요가 없게 만들고, 환자 경험을 개선시킬 수 있다. 세포질체는 림프 조직(또는 다른 표적 조직)으로 신속하게 이동할 수 있기 때문에, 백신은 전신 투여된 특정의 종래 세포 기반 요법(예컨대, 엑소좀)의 경우 아주 짧은 시간 동안 피험체의 림프계에 보급될 수 있다. 추가로, 세포질체의 작은 크기(예컨대, 약 8 마이크로미터)는 세포질체가 혈 구조 및 조직 실질의 작은 개구에 포획되지 않도록 하여 종래 세포 기반 요법과 비교하여 생체 분포를 개선시킨다. 본원에 개시된 세포질체는 활동성 감염과 퇴칠할 뿐만 아니라, 추후 감염을 예방하기 위해 사실상 임의 유형의 백신 또는 항바이러스제(예컨대, 항바이러스 및/또는 중화 항체)를 발현하도록 조작될 수 있다. 추가로, 본원에 기술된 세포질체는 1 초과의 백신 유형(예컨대, 1 초과의 병원체 유형에 대한 것)을 발현하도록 조작될 수 있고, 이로써, 백신 패널이 단일 투여 형태로 피험체에게 투여될 수 있다. 이는 효과적인 면역 전략법을 위해 향후에 여러 백신이 필요할 수 있는 신속하게 진화하는 병원체(예컨대, SARS-CoV-2)에 특히 유용하다.
본원에 개시된 세포질체는 긴급한 의학적 필요에 대한 기성 솔루션이다. 세포질체는 제핵 이전 또는 이후에, 그가 림프 조직에 도달하기 이전에 면역계에 의해 제거될 위험 없이, 세포질체를 림프 조직으로 표적화하는 데 충분한 다른 생체들 중에서 표적화 모이어티(예컨대, 귀소 수용체), 면역 회피 모이어티(예컨대, "날 먹지마(don't eat me)" 신호전달 펩티드)를 발현하도록 조작될 수 있다. 세포질체는 동결보존, 냉동동면, 또는 동결건조되고, 장기간 동안 보관될 수 있으며, 이로써, 그의 생물학적 활성은 저속화되거나, 정지될 수 있다. 긴급하게 의학적으로 필요한 경우, 세포질체의 생물학적 기능은 전달 전 필요에 따라 회복될 수 있고(예컨대, 해동, 재수화), 추가 조작을 위해(예컨대, 백신 또는 항바이러스제 발현을 위해) 최대 5일 동안 실행가능하게 유지될 수 있다. 이러한 생물학적 기능으로는 치료 표면 단백질, 면역 자극 항원 또는 수용체 발현, 사이토카인, 호르몬 또는 단백질 분비, 엑소좀 방출, 막 입자 방출, 사멸 과정을 통한 면역계 자극 또는 터널링 나노튜브 생성을 포함하나, 이에 제한되지 않는다. 본 개시내용의 세포질체는 세포질체의 의도된 기능에 부정적인 영향을 미치지 않으면서, 제조 및 유통 과정 동안 다회에 걸쳐 동결 및 해동될 수 있어, 신속한 백신 보급을 위한 이상적인 플랫폼이 된다.
일부 실시양태에서, 본 개시내용의 세포질체는 본원에 기술된 외인성 백신 또는 다른 생체분자를 생산하거나, 또는 전달하도록 조작되지 않고 치료적일 수 있다. 예를 들어, 조작되지 않은 세포질체는 그 자체가 회복기 혈장 요법 접근법과 유사하게, 예를 들어, 관심 병원체에 대해 면역된 피험체로부터 수득된 세포로부터 유래된 세포질체와 같이 환자 또는 피험체로 전달될 때 치료 특성을 가질 수 있다. 상기 세포는 병원체-숙주 수용체 인게이지먼트를 차단하는 중화 항체를 자연적으로 생산할 수 있다. 일부 실시양태에서, 조작되지 않은 세포질체는 본원에 기술된 치료제 또는 생체분자 중 임의의 어느 하나를 자연적으로 생산할 수 있으며, 이는 이를 필요로 하는 피험체에서 치료 효과를 달성하기 위해 사용될 수 있다.
본원에 기술된 신속한 백신 플랫폼의 많은 이점의 비제한적인 예는 도 5에 제공되어 있다. 세포질체의 생산은 빠르게 확장될 수 있으며, 바이러스 항원을 발현하도록 조작된 수억 개의 세포질체는 쉽게 제조될 수 있고, 필요할 때까지 보관될 수 있다. 바이러스 항원을 발현하도록 조작되는 것 외에도, 본원에 기술된 세포질체는 트랩으로 작용할 수 있다. 이러한 기술적 특징은 조작된 세포질체가 병원체에 감염되도록 하여 병원체를 격리하고, 병원체가 다른 세포를 감염시키는 것을 방지한다. 예를 들어, 본원에 기술된 세포질체는 스파이크 단백질을 발현하는 SARS-CoV-2 바이러스에 의해 감염되게 ACE2 수용체를 발현하도록 조작될 수 있다. 감염 시, SARS-CoV-2 바이러스는 세포질체에 포획되어 더 이상 복제할 수 없다. 감염된 세포질체는 분해를 위해 면역계의 표적이 될 수 있다. 세포질체는 세포질체를 표적 조직 또는 미세환경, 예컨대, 림프절로 귀소시키도록 케모카인 수용체를 발현하도록 조작될 수 있다.
본원에서는 피험체에서 병원성 감염의 예방 또는 치료를 위한 조성물, 방법 및 키트를 제공된다. 일부 실시양태에서, 병원성 감염은 바이러스 감염, 예컨대, 코로나바이러스 또는 인플루엔자 바이러스의 감염이다. 일부 실시양태에서, 병원성 감염은 박테리아 감염이다. 본원에서는 바이러스 감염 또는 발생을 예방하거나, 또는급성 감염을 치료하기에 적합한 항바이러스 조성물을 발현하도록 조작된 세포질체를 개시한다. 피험체에게 전달될 때, 세포질체는 항바이러스 조성물을 세포질체 표면에 제시하거나, 또는 항바이러스 조성물을 표적 조직을 둘러싼 세포외 공간으로 분비함으로써 표적 조직에 항바이러스 조성물을 전달한다.
일부 실시양태에서, 본 개시내용의 세포질체는 또한 병원체에 의한 세포질체의 감염을 허용하고, 생체내 병원체의 증식을 방지함으로써 피험체에서 병원체를 포획하는 데 적합하다. 도 4에 제시된 바와 같이, 본원에 기술된 세포질체는 병원체에 의해 인식될 수 있는 바이러스 수용체를 발현하여 세포질체의 감염을 촉진할 수 있다. 병원체는 세포질체를 감염시키면 핵 게놈의 부재하에서 복제 또는 증식할 수 없는 세포질체 내에 격리된다. 5일 이하 후, 세포질체는 식세포 작용의 자연적 프로세스를 사용하여 피험체로부터 제거된다. 일부 실시양태에서, 세포질체는 피험체에서 면역계를 활성화시켜 바이러스의 제거를 가속화시킨다. 생체내에서 병원체의 증식을 방지하기 위한 본원에 개시된 세포질체의 적어도 하나의 이점은 많은 병원체가 복제하는 데 필요한 유전 정보를 포함하는 핵이 결여되어 있다는 점이다.
도 1을 참조하면. 일부 실시양태에서, 제핵 이전에 피험체에서 예컨대, 림프 조직(예컨대, 림프절) 또는 폐 조직과 같은 표적 세포 또는 조직을 표적화하는 부착 분자, 케모카인 또는 보유 수용체, 또는 그 둘 모두를 발현하도록 유전자 조작된 케모카인(단계 1). 이어서, 본원에 기술된 방법을 사용하여 조작된 세포에서 제핵을 수행하여 세포질체를 생성한다(단계 2). 이어서, 피험체에서 적응 면역 반응을 증진시키기 위해 백신 또는 다른 생체분자(예컨대, 치료제, 중화 항체), 및/또는 면역 조정제(예컨대, 면역 활성제)를 발현, 및 일부 실시양태에서, 그를 분비하도록 조작될 수 있다(단계 3). 세포질체는 의도된 기능에 따라 필요에 따라 추가로 조작된다. 생성된 세포질체는 바이러스 포획을 위한 트랩으로서, 또는 백신 보급을 위해 사용될 수 있다. 바이러스 트랩의 비제한적인 예에서, 세포질체는 치료제(예컨대, 백신) 페이로드로 조작되지 않을 수 있다. 일부 경우에는 바이러스에 의한 향후 감염을 예방하기 위해 관심 병원체에 대한 중화 항체를 발현 및/또는 분비하는 것이 유리할 수 있다. 일부 실시양태에서, 이 예의 바이러스는 코로나 바이러스, 예컨대, SARS-CoV-2이다. 그러나, 도 1의 워크플로우는 박테리아 병원체(예컨대, 바실러스 안트라시스) 또는 인체 건강에 상당한 위험을 초래하는 독소를 비롯한, 본원에 기술된 모든 병원체에 적용될 수 있다.
12개월 이상이 소요되는 전통적인 백신 개발과 비교하여, 새로운 병원체(예컨대, 바이러스) 확인에서부터 배포까지의, 본 개시내용의 세포질체를 제조하는 프로세스는 대략 2개월이 소요된다. 도 2에 제시된 바와 같이, 본 개시내용의 세포질체는 바이러스 발생에 앞서 미리 제조될 수 있고, 장기간 동결보존될 수 있다. 이는 (예컨대, 귀소 수용체, 면역 활성제를 발현하도록 조작된) 본 개시내용의 세포질체가 다음 바이러스 발생을 처리하기 위해 신속하게 보급될 수 있다는 것을 의미한다. 도 3을 참조하면, 미리 제조되고, 동결보존된 세포질체는 약독화된 바이러스 단백질을 분비하도록 조작된다. 그를 필요로 하는 피험체에게 투여되었을 때, 세포질체는 피험체에서 면역 활성화 및 바이러스에 대한 중화 항체의 생성을 유도한다.
본 개시내용의 세포질체를 제조하는 방법을 제공된다. 일부 실시양태에서, 세포를 사이토칼라신 B로 처리하여 피질 액틴 세포골격을 연화시킨다. 이어서, 피콜(Ficoll) 구배로 고속 원심분리에 의해 세포로부터 핵을 물리적으로 추출하여 핵이 없는 (제핵) 세포질체를 생성할 수 있다. 세포질체 및 무손상 유핵 세포는 피콜 구배에서 상이한 층으로 침강하기 때문에, 일부 실시양태에서, 세포질체는 쉽게 단리되고, 치료 목적 또는 다른 세포와의 융합을 위해 제조될 수 있다 (유핵화 또는 제핵화). 제핵 프로세스는 수천만 개의 세포를 프로세스할 수 수 있도록 임상적으로 확장될 수 있다.
본원에서는 본 개시내용의 세포질체를 사용 또는 전달하는 방법을 개시한다. 세포질체는 건강한 개체를 치료하기 위해(예컨대, 에너지를 개선하거나, 운동으로부터 회복시키기 위해, 또는 천연물을 전달하기 위해) 또는 다양한 질환(예컨대, 본원에 기술된 질환 중 임의의 것)을 치료하기 위해 임상적으로 관련된 카르고/페이로드를 전달하는 귀소 비히클로서 사용될 수 있다. 예를 들어, 세포질체는 건강한 개체, 예컨대, 전달되는 치료제가 효과적인 특정 장애로 진단받지 않은 개체에게 보충제, 항노화 인자, 예방 치료 등을 전달하는 데 사용될 수 있다.
또한, 본원에서는 본원에 기술된 임의의 조성물을 포함하는 키트를 제공한다. 예를 들어, 키트는 본원에 기술된 임의의 조성물 또는 방법에 관한 사용 설명서를 포함할 수 있다. 일부 실시양태에서, 키트는 적어도 하나의 용량의 임의의 조성물을 포함할 수 있다.
I. 조성물
본원에서는 피험체에서 병원체 연관된 질환 또는 병태를 치료하거나, 또는 예방하는 데 유용한 조성물을 제공한다. 일부 실시양태에서, 본원에 개시된 조성물은 병원체 연관된 질환 또는 병태의 치료 또는 예방에 적합한 활성제를 발현하도록 조작된 세포질체(예컨대, 제핵 세포)을 포함한다. 일부 실시양태에서, 병원체 연관된 질환 또는 병태는 바이러스 감염, 예컨대, 코로나바이러스 감염이다. 일부 실시양태에서, 세포질체는 항바이러스 조성물, 예컨대, 약독화된 바이러스 항원 또는 항바이러스 항체, 또는 그의 조합을 발현하도록 조작된다. 일부 실시양태에서, 세포질체는 세포질체의 표면에 항바이러스 조성물을 포함한다(예컨대, 항원 제시). 일부 실시양태에서, 항바이러스 조성물은 세포질체에 의해 표적 조직의 세포외 공간으로 분비된다. 일부 실시양태에서, 세포질체는 세포질체의 감염을 허용하고, 생체내에서 병원체의 증식을 방지함으로써 생체내에서 병원체를 포획하거나, 또는 포획하도록 조작되어 급성 병원성 감염, 또는 병원체 연관 질환 또는 병태를 치료한다.
본원에 기술된 세포질체는 제한되거나, 또는 정의된(예컨대, 공지된 또는 프로그램 가능한) 수명을 갖도록 조작된다. 본원에 기술된 세포질체는 일부 다른 세포 기반 요법(예컨대, 엑소좀, 적혈구, 입양 세포 요법)에서 세포와 비교하여 감소된 크기를 가지며, 이는 일부 실시양태에서 생체분포를 개선시킨다.
본원에 기술된 세포질체는 냉동동면 또는 동결보존 후 생존능을 유지하는 바, 이를 통해 세포질체는 약물 전달을 위한 플랫폼으로서 널리 채택될 수 있도록 독특하게 적합화될 수 있다. 동결보존은 생물학적 물질(예컨대, 세포, 세포질체)을 매우 낮은 온도(예컨대, 고체 CO2 중에서 -80℃, 액체 질소에서 -196℃ 등)에서 단기 또는 장기로 냉각 또는 동결 및 저장하는 것을 포함한다. 냉동동면은 예컨대, 4℃와 같은 비동결 온도에서 가사 상태로 생물학적 물질(예컨대, 세포, 세포질체)을 단기 냉각 및 보관하는 것을 포함한다. 세포질체의 냉동동면은 하기 이유 중 하나 이상의 이유로 유리할 수 있다: 냉동동면은 동결보존보다 덜 노동 집약적이고, 냉동동면된 세포질체는 운송(예컨대, 배송)될 수 있다. 일부 실시양태에서, 세포질체는 동결보존된다. 일부 실시양태에서, 세포질체는 냉동동면된다. 냉동동면 또는 동결보존으로부터 세포질체를 제거한 후, 세포질체는 본원에 기술된 방법에 따라 사용될 수 있다. 일부 실시양태에서, 세포질체는 냉동동면 또는 동결보존으로부터의 제거 후 적어도 약 24시간, 48시간, 72, 또는 24 내지 72시간 사이의 임의의 증분된 시간 동안 생존가능하다. 일부 실시양태에서, 세포질체는 약 24 내지 약 48시간 동안 생존가능하다. 일부 실시양태에서, 세포질체는 약 48 내지 약 72시간동안 생존가능하다. 일부 실시양태에서, 생존능은 본원에 기술된 바와 같이 트리판 블루 염료 배제를 사용하여 측정된다. 일부 실시양태에서, 생존능은 본원에 기술된 바와 같이 아넥신-5 세포 표면 염색을 사용하여 측정된다.
본원에 기술된 세포질체는 주어진 치료 적용에 가장 적합하도록 광범위하게 조작된다. 예를 들어, 세포질체는 표적 병원체에 의한 세포질체의 감염을 증가시키는 (예컨대, 세포 표면 수용체로) 조작된다. 일부 실시양태에서, 세포질체는 백신으로서 사용하기 위한 약독화된 바이러스 항원 또는 급성 바이러스 감염을 치료하는 데 사용하기 위한 항바이러스 항체를 발현하도록 조작된다. 또 다른 예에서, 세포질체는 어려운 조직(예컨대, 근육)을 특이적으로 표적화하는 단백질, 및 활성제, 예컨대, 약독화된 바이러스 항원 또는 항바이러스 항체를 생산하거나 발현하도록 조작된다. 추가로, 일부 실시양태에서, 세포질체는 숙주에서 항원 반응을 피하기 위해 면역 회피 모이어티(예컨대, CD34+)로 조작된다. 세포질체는 또한 세포 귀소, 케모카인 감지 및 주로 이환된 부위에서 손상된 조직을 표적화하는 데 필수적인 다른 생물학적 기능에 사용되는 세포 표면 수용체(예컨대, 부착 분자, 케모카인 수용체)를 발현하도록 조작된다.
일부 실시양태에서, 세포질체는 1시간 미만 내지 14일(예컨대, 1시간 미만 내지 1시간, 1시간 미만 내지 6시간, 6시간 내지 12시간, 12시간 내지 1일, 1일, 2일, 3일, 4일, 5,일, 6일, 7일, 8일, 9일, 10일, 11일, 13일, 14일, 1 내지 14일, 1 내지 12일, 1 내지 10일, 1 내지 9일, 1 내지 8일, 1 내지 7일, 1 내지 6일, 1 내지 5일, 1 내지 4일, 1 내지 3일, 1 내지 2일, 2 내지 14일, 2 내지 12일, 2 내지 10일, 2 내지 8일, 2 내지 7일, 2 내지 6일, 2 내지 5일, 2 내지 4일, 2 내지 3일, 3 내지 14일, 3 내지 12일, 3 내지 10일, 3 내지 8일, 3 내지 7일, 3 내지 6일, 3 내지 5일, 3 내지 4일, 4 내지 14일, 4 내지 12일, 4 내지 10일, 4 내지 8일, 4 내지 7일, 4 내지 6일, 4 내지 5일, 4 내지 7일, 5 내지 14일, 5 내지 12일, 5 내지 10일, 5 내지 8일, 5 내지 7일, 5 내지 6일, 6 내지 14일, 6 내지 12일, 6 내지 10일, 6 내지 8일, 6 내지 7일, 7 내지 14일, 7 내지 12일, 7 내지 10일, 7 내지 8일, 8 내지 14일, 8 내지 12일, 8 내지 10일, 10 내지 14일, 10 내지 12일, 12 내지 14일 미만, 14일 미만, 12일 미만, 10일 미만, 8일 미만, 7일 미만, 6일 미만, 5일 미만, 4일 미만, 3일 미만, 2일 미만, 1일 미만, 12시간 미만, 또는 6시간 미만)의 정의된 수명을 갖는다. 일부 실시양태에서, 세포질체 집단의 수명은 세포질체 집단 중 일부(예컨대, 집단 중 적어도 50%, 적어도 60% 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 98%)가 사멸된 것으로 결정된 평균 시간을 측정함으로써 평가될 수 있다. 세포 사멸은 당업계에 공지된 임의의 방법에 의해 결정될 수 있다. 일부 실시양태에서, 예컨대, 하나 이상의 시점에서 세포질의 생존능은 (예컨대, 트립판 블루 염료 배제에 의해, 무손상 세포막에 대한 평가함으로써, (예컨대, 부착성 세포질체에서) 플라스틱에의 부착을 평가함으로써, 세포질체 이동을 평가함으로써, 아폽토시스 마커를 사용한 음성 염색 등에 의해) 형태학적 또는 기능적 파라미터가 무손상인지 여부를 측정함으로써 평가될 수 있다. 일부 실시양태에서, 세포질체의 수명은 그의 수득 기점이 된 세포의 수명과 관련될 수 있다. 예를 들어, 일부 실시양태에서, 대식세포로부터 수득된 세포질체는 12 내지 24시간 동안 생존할 수 있다.
일부 실시양태에서, 세포질체의 직경은 1 ㎛ 이상이다. 일부 실시양태에서, 세포질체의 직경은 1 ㎛ 초과이다. 일부 실시양태에서, 세포질체의 직경은 1-100 ㎛(예컨대, 1- 90 ㎛, 1-80 ㎛, 1-70 ㎛, 1-60 ㎛, 1-50 ㎛, 1-40 ㎛, 1-30 ㎛, 1-20 ㎛, 1-10 ㎛, 1-5 ㎛, 5- 90 ㎛, 5-80 ㎛, 5-70 ㎛, 5-60 ㎛, 5-50 ㎛, 5-40 ㎛, 5-30 ㎛, 5-20 ㎛, 5-10 ㎛, 10-90 ㎛, 10-80 ㎛, 10-70 ㎛, 10-60 ㎛, 10-50 ㎛, 10-40 ㎛, 10-30 ㎛, 10-20 ㎛, 10-15 ㎛ 15-90 ㎛, 15-80 ㎛, 15-70 ㎛, 15-60 ㎛, 15-50 ㎛, 15-40 ㎛, 15-30 ㎛, 15-20 ㎛)이다. 일부 실시양태에서, 세포질체의 직경은 10-30 ㎛이다. 일부 실시양태에서, 세포질체의 직경은 5-25 ㎛(예컨대, 5-20 ㎛, 5-15 ㎛. 5-10 ㎛, 10-25 ㎛, 10-20 ㎛, 10-15 ㎛, 15-25 ㎛, 15-20 ㎛, 또는 20-25 ㎛)이다. 일부 실시양태에서, 세포질체는 엑소좀이 아니다. 임의의 특정 이론에 얽매이지 않고, 일부 실시양태에서, 일부 세포질체는 유리하게는 더 나은 생체분포를 허용하거나, 피험체의 폐에 포획될 가능성이 더 작을 만큼 충분히 작을 수 있다고 간주된다.
일부 실시양태에서, 세포질체는 그의 특성을 변경하기 위해 세포(예컨대, 이종배양된 세포)에 적용되거나, 또는 그와 함께 배양될 수 있다. 예를 들어, 일부 실시양태에서, 세포질체(예컨대, 조작되지 않은 세포질체 또는 조작된 세포질체)는 이종배양된 세포에서 건강 증진 인자를 상향조절할 수 있고, 일부 실시양태에서, 이종배양된 세포는 그가 채취된 피험체에게 반환될 수 있다.
A. 세포
본원에서는 본 개시내용의 세포질체를 생산하도록 조작된 세포 및 세포주를 제공한다. 세포질체는 상응하는 모세포, 예컨대, 유핵 모세포로부터 유래될 수 있다. 모세포의 비제한적 예로는 불멸화 세포, 암세포(예를 들어, 임의의 암세포), 1차(예를 들어, 숙주 유래) 세포, 또는 세포주를 포함한다. 일부 실시양태에서, 세포로부터 유래된 모세포는 예컨대, 문헌 [Huang et al., J. Exp. Clin. Med. 2010 Oct. 22l 2(5):202-217]에 기술된 것과 같은 적합한 방법을 이용하여 불멸화된다. 일부 실시양태에서, 세포질체는 미국 특허 출원 제16/715,859호(상기 특허는 그 전문이 본원에서 참조로 포함된다)에 제공된 적합한 방법을 사용하여 모세포로부터 유래된 것이다.
일부 실시양태에서, 세포는 하나 이상의 세포를 갖는 임의의 유기체로부터 유래할 수 있다. 일부 비제한적인 예에는 원핵 세포, 진핵 세포, 박테리아 세포, 고세균 세포, 단세포 진핵 유기체의 세포, 원생동물 세포, 식물 세포, 조류 세포, 진균 세포, 동물 세포, 무척추 동물의 세포, 척추 동물의 세포, 포유동물(예컨대, 돼지, 소, 염소, 양, 설치류, 래트, 마우스, 인간이 아닌 영장류, 인간 등)의 세포 등을 포함한다. 일부 실시양태에서, 세포는 체세포이다. 일부 실시양태에서, 세포는 줄기 세포 또는 전구 세포이다. 일부 실시양태에서, 세포는 중간엽 줄기 또는 전구 세포이다. 일부 실시양태에서, 세포는 중간엽 간질 세포이다. 세포는 하나 이상의 세포를 가진 임의의 유기체에서 유래할 수 있다.
세포의 일부 비제한적인 예에는 원핵 세포, 진핵 세포, 박테리아 세포, 고세균 세포, 단세포 진핵 유기체의 세포, 원생동물 세포, 식물 세포(예컨대, 식물 작물, 과일, 야채, 곡물, 대두, 옥수수(corn), 옥수수(maize), 밀, 씨앗, 토마토, 쌀, 카사바, 사탕수수, 호박, 건초, 감자, 목화, 대마초, 담배, 현화 식물, 침엽수, 겉씨 식물, 양치류, 석송, 뿔풀, 우산이끼, 이끼), 조류 세포(예컨대, 보트리오코커스 브라우니(Botryococcus braunii), 클라미도모나스 레인하티(Chlamydomonas reinhardtii), 나노클로롭시스 가디타나(Nannochloropsis gaditana), 클로렐라 피레노이도사(Chlorella pyrenoidosa), 사르가숨 파텐스 C. 아가르드(Sargassum patens C. Agardh) 등), 해조류(예컨대, 해조), 진균 세포(예컨대, 효모세포, 버섯 세포), 동물 세포, 무척추 동물 세포(예컨대, 초파리, 자포동물, 극피동물, 선충류 등), 척추동물 세포(예컨대, 어류, 양서류, 파충류, 조류, 포유동물), 포유동물(예컨대, 돼지, 소, 염소, 양, 설치류, 래트, 마우스, 인간이 아닌 영장류, 인간 등) 세포 등을 포함한다. 종종, 세포는 천연 유기체에서 유래하지 않은 것이다(예컨대, 세포는 합성에 의해 제조될 수 있으며, 이는 종종 인공 세포로 명명). 일부 실시양태에서, 세포는 체세포이다. 일부 실시양태에서, 세포는 줄기 세포 또는 전구 세포이다. 일부 실시양태에서, 세포는 중간엽 줄기 또는 전구 세포이다. 일부 실시양태에서, 세포는 조혈 줄기 또는 전구 세포이다. 일부 실시양태에서, 세포는 근육 세포, 피부 세포, 혈액 세포, 또는 면역 세포이다. 다른 예시적인 세포는 림프 세포, 예컨대, B 세포, T 세포(세포독성 T 세포, 자연 살해 T 세포, 조절 T 세포, T 헬퍼 세포), 자연 살해 세포, 사이토카인 유도 살해(CIK: cytokine induced killer) 세포; 골수 세포, 예컨대, 과립구(호염구 과립구, 호산구 과립구, 호중구 과립구/과분절 호중구), 단핵구/대식세포, 적혈구(망상적혈구), 비만 세포, 혈소판/거핵구, 수지상 세포와 같은 골수 세포; 갑상선(갑상선 상피 세포, 소포곁세포), 부갑상선(부갑상선 주 세포, 호산성 세포), 부신(크롬친화성 세포), 송과체(솔방울샘세포) 세포를 포함하는 내분비계 세포; 신경교 세포(성상, 미세아교세포), 거대세포 신경분비 세포, 성상세포, 뵈처 세포, 및 뇌하수체(고나도트로프, 코르티코트로프, 소마토트로프, 락토트로프)를 포함하는 신경계의 세포; 폐포세포(타입 I 폐포세포, 타입 II 폐포세포), 클라라 세포, 배상 세포, 먼지 세포를 포함하는 호흡계 세포; 심근세포, 혈관주위세포를 포함하는 순환계 세포; 위(위장 세포, 정수리 세포), 배상 세포, 파네스 세포, G 세포, D 세포, ECL 세포, I 세포, K 세포, S 세포를 포함하는 소화계 세포; 장염색세포, APUD 세포, 간(간세포, 쿠퍼 세포), 연골/뼈/근육을 포함하는 장내분비 세포; 조골세포, 골세포, 파골세포, 치아(백아질모세포, 에나멜 모세포)를 포함하는 뼈 세포; 연골모세포, 연골세포를 포함하는 연골 세포; 트리코사이트, 케라티노사이트, 멜라닌세포(모반 세포)를 포함한 피부 세포; 근세포를 포함하는 근육 세포; 족세포, 사구체 인접 세포, 사구체내 간질 세포/사구체외 간질 세포 세포, 신장 근위 세뇨관 브러시 경계 세포, 황반 조밀 세포를 포함하는 비뇨계 세포; 정자, 세르톨리 세포, 라이디히 세포, 난자를 포함하는 생식계 세포; 및 다른 세포, 지방세포, 섬유아세포, 힘줄 세포, 표피 각질세포(분화 표피 세포), 표피 기저 세포(줄기 세포), 손톱 및 발톱의 각질 세포, 손톱 바닥 기저 세포(줄기 세포), 수질 모간 세포, 피질 모간 세포, 표피 모간 세포, 표피 모근 초세포, 헉슬리층의 모근 초세포, 헨레층의 모근 초세포, 외부 모근 초세포, 모발 기질세포(줄기세포), 습식 중층 장벽 상피 세포, 각막, 혀, 구강, 식도, 항문관, 원위 요도 및 질의 중층 편평 상피의 표면 상피 세포, 각막, 혀, 구강, 식도, 항문관, 원위 요도 및 질의 상피의 기저 세포(줄기 세포), 요로상피세포(방광과 요관 내막), 외분비 상피 세포, 침샘 점액 세포(다당류가 풍부한 분비물), 침샘 장액 세포(당단백질 효소가 풍부한 분비물), 혀의 폰 에브너선 세포(미뢰 세척액), 유선 세포(젖 분비), 눈물샘 세포(눈물 분비), 귀의 귀지샘 세포(왁스 분비), 에크린 땀샘 암 세포(당단백질 분비), 에크린 땀샘 투명 세포(소분자 분비), 아포크린 땀샘 세포(냄새 분비, 성호르몬 민감), 눈꺼풀의 몰 세포(분화된 땀샘), 피지선 세포(지질이 풍부한 피지 분비), 코의 보우만샘 세포(후각 상피 세척), 브루너선 십이지장 세포(효소 및 알칼리성 점액), 정낭 세포(정액 수영을 위한 프럭토스 포함한 정액 성분 분비), 전립선 세포(정액 성분 분비), 구도샘 세포(점액 분비), 바르톨린선 세포(질 활택제 분비), 분비샘 세포(점액 분비), 자궁내막 세포(탄수화물 분비), 호흡기 및 소화관의 분리된 배상 세포(점액 분비), 위 내벽 점액 세포(점액 분비), 위샘 자이모겐 세포(펩시노겐 분비), 위선 산소 세포(염산 분비), 췌장 포상 세포(중탄산염 및 소화 효소 분비), 소장 파네스 세포(리소자임 분비), 폐의 타입 II 폐포세포(계면활성제 분비), 폐의 클라라 세포, 호르몬 분비 세포, 뇌하수체 전엽 세포, 소마토트로프, 락토트로프, 티로트로프, 고나도트로프, 코르티코트로프, 뇌하수체 중엽 세포, 거대세포 신경분비 세포, 소화관 및 기도 세포, 갑상선 세포, 갑상선 상피 세포, 소포곁세포 세포, 부갑상선 세포, 부갑상선 주 세포, 산소 세포, 부신 세포, 크로마핀 세포, 고환의 라이디히 세포, 난포의 내층 세포, 파열된 난포의 황체 세포, 과립구 루테인 세포, 테카 루테인 세포, 사구체 인접 세포(레닌 분비), 신장의 황반 조밀 세포, 대사 및 저장 세포, 장벽 기능 세포(폐, 장, 외분비선 및 비뇨생식기 관), 신장, 타입 I 폐포세포(폐의 내벽 공기 공간), 췌관 세포(샘꽈리중심세포), 민무늬관 세포(땀샘, 침샘, 유선 등), 도관 세포(정낭, 전립선 등), 닫힌 내부 체강을 둘러싸고 있는 상피 세포, 추진 기능이 있는 섬모 세포, 세포외 기질 분비 세포, 수축성 세포; 골격근 세포, 줄기 세포, 심장 근육 세포, 혈액 및 면역계 세포, 적혈구(적혈구), 거핵구(혈소판 전구체), 단핵구, 결합 조직 대식세포(다양한 유형), 표피 랑게르한스 세포, 파골세포(골내), 수지상 세포(림프 조직 내), 미세아교세포(중추 신경계내), 호중구 과립구, 호산구 과립구, 호염기구 과립구, 비만 세포, 헬퍼 T 세포, 억제 T 세포, 세포독성 T 세포, 자연 살해 T 세포, B 세포, 자연 살해 세포, 망상적혈구, 줄기 세포 및 혈액 및 면역계 수임 전구체(다양한 유형), 만능 줄기 세포, 전능 줄기 세포, 유도 만능 줄기 세포, 성체 줄기 세포, 감각 변환기 세포, 자율 신경 세포, 감각 기관 및 말초 뉴런 지지 세포, 중추 신경계 뉴런 및 신경교 세포, 수정체 세포, 색소 세포, 멜라닌세포, 망막 색소 상피세포, 생식 세포, 난자/난모세포, 정자, 정자세포, 정자세포(정자세포를 위한 줄기세포), 정자, 영양 세포, 난포 세포, 세르톨리 세포(고환내), 흉선 상피 세포, 간질 세포 및 간질 신장 세포를 포함할 수 있다.
진핵 세포의 비제한적인 예는 포유동물(예컨대, 설치류, 인간이 아닌 영장류, 또는 인간), 비포유동물(예컨대, 어류, 조류, 파충류 또는 양서류), 무척추동물, 곤충, 진균, 또는 식물 세포를 포함한다. 일부 실시양태에서, 진핵 세포는 사카로마이세스 세레비지아에(Saccharomyces cerevisiae)와 같은 효모 세포이다. 일부 실시양태에서, 진핵 세포는 예컨대, 포유동물, 조류, 식물 또는 곤충 세포와 같은 고등 진핵생물이다. 일부 실시양태에서, 유핵 세포는 1차 세포이다. 일부 실시양태에서, 유핵 세포는 면역 세포(예컨대, 림프구(예컨대, T 세포, B 세포), 대식세포, 자연 살해 세포, 호중구, 비만 세포, 호염기구, 수지상 세포, 단핵구, 골수 유래 억제 세포, 호산구)이다. 일부 실시양태에서, 유핵 세포는 식세포 또는 백혈구이다. 일부 실시양태에서, 유핵 세포는 줄기 세포(예컨대, 성체 줄기 세포(예컨대, 조혈 줄기 세포, 유방 줄기 세포, 장 줄기 세포, 중간엽 줄기 세포, 내피 줄기 세포, 신경 줄기 세포, 후각 성체 줄기 세포, 신경 능선 줄기 세포, 고환 세포), 배아 줄기 세포, 유도 만능성 줄기 세포 (iPS))이다. 일부 실시양태에서, 유핵 세포는 전구 세포이다. 일부 실시양태에서, 유핵 세포는 세포주로부터의 것이다. 일부 실시양태에서, 유핵 세포는 부유 세포이다. 일부 실시양태에서, 유핵 세포는 부착성 세포이다. 일부 실시양태에서, 유핵 세포는 온코진의 발현에 의해 불멸화된 세포이다. 일부 실시양태에서, 유핵 세포는 인간 텔로머라제 역전사효소(hTERT: human telomerase reverse transcriptase) 또는 임의의 온코진의 발현에 의해 불멸화된다. 일부 실시양태에서, 유핵 세포는 환자 또는 피험체 유래 세포(예컨대, 자가 환자 유래 세포, 또는 동종이계 환자 유래 세포)이다. 일부 실시양태에서, 유핵 세포는 본원에 기술되고, 당업계에 공지된 제핵 기술 중 임의의 것을 사용하는 유핵 세포 제핵 이전에 벡터(예컨대, 바이러스 벡터(예컨대, 레트로바이러스 벡터(예컨대, 렌티바이러스 벡터), 아데노 연관 바이러스(AAV: adeno-associated virus) 벡터, 수포성 바이러스 벡터(예컨대, 수포성 구내염 바이러스(VSV: vesicular stomatitis virus) 벡터), 또는 하이브리드 바이러스 벡터), 플라스미드)로 형질감염된다.
일부 실시양태에서, 세포질체는 피험체의 자가 세포로부터 유래될 수 있다. 일부 실시양태에서, 세포질체는 피험체에 동종이계 세포로부터 유래될 수 있다.
일부 실시양태에서, 세포질체는 면역 세포로부터 유래된다. 일부 실시양태에서, 세포질체는 자연 살해(NK: natural killer) 세포, 호중구, 대식세포, 림프구, 섬유아세포, 성체 줄기 세포(예컨대, 조혈 줄기 세포, 유방 줄기 세포, 장 줄기 세포, 중간엽 줄기 세포, 중간엽 간질 세포, 내피 줄기 세포, 신경 줄기 세포, 후각 성체 줄기 세포, 신경 능선 줄기 세포, 피부 줄기 세포, 또는 고환 세포), 비만 세포, 호염구, 호산구, 또는 유도성 만능 줄기 세포로부터 유래된다.
일부 실시양태에서, 제핵 전에 2개 이상의 세포(예컨대,본원에 개시된 임의의 세포)가 본원에 개시되거나 당업계에 공지된 임의의 방법에 의해 융합된다. 융합 생성물의 제핵 결과로 세포질체가 생성될 수 있다.
일부 실시양태에서, 제1 세포질체는 세포 또는 제2 세포질체에 융합된다. 일부 실시양태에서, 세포는 임의의 유핵 세포(예컨대, 포유동물 세포(예컨대, 인간 세포, 또는 본원에 기술된 임의의 포유동물 세포), 원생동물 세포(예컨대, 아메바 세포), 조류 세포, 식물 세포, 진균 세포, 무척추동물 세포, 어류 세포, 양서류 세포, 파충류 세포, 또는 조류 세포)이다. 일부 실시양태에서, 제2 세포는 합성 세포이다. 따라서, 세포를 본원에 기술된 임의의 세포질체와 융합시키는 단계를 포함하는 세포의 거동을 변경시키는 방법을 제공한다. 또한 본원에서는 세포질체가 융합된 세포를 치료 유효량으로 피험체에게 투여하는 것을 포함하는 방법을 제공한다.
일부 실시양태에서, 제2 세포질체는 제1 세포질체과 동일한 유형의 세포로부터 유래된 것이다. 일부 실시양태에서, 제2 세포질체는 제1 세포질체과 상이한 유형의 세포로부터 유래된 것이다. 일부 실시양태에서, 제2 세포질체는 적어도 하나의 치료 DNA 분자, 치료 RNA 분자, 치료 단백질, 치료 펩티드, 소분자 치료제, 치료 유전자 편집 인자, 치료 나노입자, 또는 제1 세포질체에 함유되어 있거나, 또는 제1 세포질체에 의해 발현되는 치료 DNA 분자, 치료 RNA 분자, 치료 단백질, 치료 펩티드, 소분자 치료제, 치료 유전자 편집 인자, 치료 나노입자와 동일한 또 다른 활성제를 함유하거나, 또는 발현한다. 일부 실시양태에서, 제2 세포질체는 적어도 하나의 치료 DNA 분자, 치료 RNA 분자, 치료 단백질, 치료 펩티드, 소분자 치료제, 치료 유전자 편집 인자, 치료 나노입자, 또는 제1 세포질체에 의해 발현되는 치료 DNA 분자, 치료 RNA 분자, 치료 단백질, 치료 펩티드, 소분자 치료제, 치료 유전자 편집 인자, 치료 나노입자와 상이한 또 다른 활성제를 함유하거나, 또는 발현한다. 일부 실시양태에서, 제1 세포질체는 당업계에 공지된 임의의 방법, 예를 들어, 바이러스-기반 세포 표면 펩티드를 사용한 전기융합 또는 바이러스 융합을 사용하여 세포 또는 제2 세포질체에 융합될 수 있다.
일부 실시양태에서, 세포질체는 자연적으로 발생된 제핵 세포가 아니다. 일부 실시양태에서, 세포질체는 자연적으로 제핵된 세포로부터 수득된 것이 아니다. 일부 실시양태에서, 세포질체는 피험체의 신체에서 제핵된 세포가 아니다. 일부 실시양태에서, 세포질체는 피험체의 신체에서 제핵될 세포로부터 수득된 것이 아니다. 일부 실시양태에서, 세포질체는 적혈구아세포로부터 수득된 것이 아니다. 일부 실시양태에서, 세포질체는 (예컨대, 본원에 기술된 바와 같은 제핵과 같은 조작의 부재하에) 그의 수명 동안 핵을 유지하는 세포로부터 수득된다. 일부 실시양태에서, 세포질체는 무핵 세포(예컨대, 적혈구(적혈구), 혈소판, 수정체 세포, 또는 그의 직계 유핵 전구체)로서 피험체에서 발견되는 세포가 아니다. 일부 실시양태에서, 세포질체는 소포체, 골지체, 미토콘드리아, 리보솜, 프로테아솜 또는 스플라이세오솜으로 구성된 군으로부터 선택되는 하나 이상의 성분을 포함한다. 일부 실시양태에서, 세포질체는 하기 특징: 부착, 터널링 나노튜브 형성, 액틴 매개 스프레딩(2D 및/또는 3D), 이동, 화학유인물질 구배 감지, 미토콘드리아 전달, mRNA 번역, 단백질 합성, 및 엑소좀 및/또는 다른 생체활성 분자의 분비 중 하나 이상의 것을 특징으로 한다. 일부 실시양태에서, 세포질체는 (예컨대, 엑소좀을 사용하여) 단백질을 분비하는 능력을 특징으로 한다. 일부 실시양태에서, 세포질체는 생체외에서 제핵된 것이다. 일부 실시양태에서, 세포질체는 시험관내에서 제핵된 것이다. 일부 실시양태에서, 세포질체는 (예컨대, 원심분리에 의해) 물리적으로 제핵된 것이다. 일부 실시양태에서, 세포질체는 조작된 제핵 세포이다. 일부 실시양태에서, 세포질체는 적혈구가 아니다. 일부 실시양태에서, 세포질체는 헤모글로빈을 함유하지 않는다. 일부 실시양태에서, 세포질체는 양면 오목 형상을 갖지 않는다.
일부 실시양태에서, 세포질체는 적혈구아세포로부터 수득된 것이 아니다. 일부 실시양태에서, 세포질체는 적혈구(RBC)가 되지 않는 세포로부터 수득된 것이다다. RBC와 달리 세포질체는 많은 활성 생물학적 프로세스 및 모든 세포 세포소기관(에컨대, ER/골지체, 미토콘드리아, 엔도솜, 리소솜, 세포골격 등)을 유지할 수 있는 생존가능한 세포 유사 엔티티일 수 있다. 따라서, 세포질체는 유핵 세포처럼 작용할 수 있으며, 예컨대, 부착, 터널링 나노튜브 형성, 액틴 매개 스프레딩(2D 및 3D), 이동, 화학유인물질 구배 감지, 미토콘드리아 전달, mRNA 번역, 단백질 합성, 및 엑소좀 및 다른 생체활성 분자 분비와 같은 중요한 생물학적 기능을 나타낼 수 있다. 이러한 기능 중 하나 이상의 것은 적혈구에 의해 나타나지 않을 수 있다. 적혈구아세포로부터 유래된 RBC와 비교하여, 세포질체는 iPSC(유도 만능 줄기 세포: induced pluripotent stem cell), 임의의 불멸화 세포, 줄기 세포, 1차 세포(예컨대, 숙주 유래 세포), 세포주, 임의의 면역 세포, 암성 세포를 포함하나, 이에 제한되지 않는 임의의 유형의 유핵 세포, 또는 임의의 진핵 세포로부터 유래될 수 있다. 일부 실시양태에서, 세포질체는 림프 전구 세포로부터 수득된다. 일부 실시양태에서, 세포질체는 림프구로부터 수득된다. 일부 실시양태에서, 세포질체는 중간엽 줄기 세포(예컨대, 골수로부터의 것)로부터 수득된다. 일부 실시양태에서, 세포질체는 내피 줄기 세포로부터 수득된다. 일부 실시양태에서, 세포질체는 신경 줄기 세포로부터 수득된다. 일부 실시양태에서, 세포질체 피부 줄기 세포로부터 수득된다.
B. 병원체
일부 실시양태에서, 본원에 기술된 세포질체 및 세포질체를 함유하는 조성물은 병원체를 표적화 및/또는 사멸시키거나, 또는 다르게는 작동불가능하게 만드는 생체분자(예컨대, 백신, 치료제, 표적화 모이어티)를 포함한다. 일부 실시양태에서, 병원체는 박테리아, 바이러스, 진균 또는 독소이다. 일부 실시양태에서, 병원체는 자연적으로 발생된 것이다. 일부 실시양태에서, 병원체는 합성이다.
일부 실시양태에서, 병원체는 바이러스이다. 일부 실시양태에서, 바이러스는 동물 바이러스, 식물 바이러스, 박테리아 바이러스, 또는 고세균 바이러스이다. 일부 실시양태에서, 동물 바이러스는 동일하거나, 또는 상이한 동물에서 질환 또는 병태를 유발한다. 일부 실시양태에서, 바이러스는 RNA 바이러스 또는 DNA 바이러스이다. 일부 실시양태에서, RNA 또는 DNA 바이러스는 단일 가닥 또는 이중 가닥이다. 일부 실시양태에서, DNA 또는 RNA 바이러스는 + 센스 또는 - 센스 바이러스이다.
일부 실시양태에서, 이중 가닥 바이러스(dsDNA) 바이러스는 미오비리대(Myoviridae) 과, 포도비리대(Podoviridae) 과, 시포비리대(Siphoviridae) 과, 알로헤르페스비리대(Alloherpesviridae) 과, 헤르페스비리대(Herpesviridae) 과, 말라코헤르페스비리대(Malacoherpesviridae) 과, 리포트릭스비리대(Lipothrixviridae) 과, 루디비리대(Rudiviridae) 과, 아데노비리대(Adenoviridae) 과, 암풀라비리대(Ampullaviridae) 과, 아스코비리대(Ascoviridae) 과, 아스파비리대(Asfaviridae) 과, 배큘로비리대(Baculoviridae) 과, 비카우다비리대(Bicaudaviridae) 과, 클라바비리대(Clavaviridae) 과, 코르티코비리대(Corticoviridae) 과, 푸셀로비리대(Fuselloviridae) 과, 글로불로비리대(Globuloviridae) 과, 구타비리대(Guttaviridae) 과, 히트로사비리대(Hytrosaviridae) 과, 이리도비리대(Iridoviridae) 과, 마르세일레비리대(Marseilleviridae) 과, 미미비리대(Mimiviridae) 과, 니마비리대(Nimaviridae) 과, 판도라비리대(Pandoraviridae) 과, 파필로마비리대(Papillomaviridae) 과, 피코드나비리대(Phycodnaviridae) 과, 플라스마비리대(Plasmaviridae) 과, 폴리드나바이러스(Polydnaviruse) 과, 폴리오마비리대(Polyomaviridae) 과, 폭스비리대(Poxviridae) 과, 스파에로리포비리대(Sphaerolipoviridae) 과, 및 텍티비리대(Tectiviridae) 과로부터의 것이다.
일부 실시양태에서, 단일 가닥(ssDNA) 바이러스는 아넬로비리대(Anelloviridae) 과, 바실라리오드나비리대(Bacillariodnaviridae) 과, 비드나비리대(Bidnaviridae) 과, 써코비리대(Circoviridae) 과, 게미니비리대(Geminiviridae) 과, 이노비리대(Inoviridae) 과, 마이크로비리대(Microviridae) 과, 나노비리대(Nanoviridae) 과, 파보비리대(Parvoviridae) 과, 및 스피라비리대(Spiraviridae) 과로부터의 것이다.
ss 및 ds DNA 영역 모두를 함유하는 DNA 바이러스는 플레오리포바이러스 군으로부터 유래할 수 있다. 일부 실시양태에서, 플레오리포바이러스는 할로아르쿨라 히스패니카(Haloarcula hispanica) 다형 바이러스 1, 할로게노메트리쿰(Halogeometricum) 다형 바이러스 1, 할로루브룸(Halorubrum) 다형 바이러스 1, 할로루브룸 다형 바이러스 2, 할로루브룸 다형 바이러스 3, 및 할로루브룸 다형 바이러스 6을 포함한다.
일부 실시양태에서, dsRNA 바이러스는 비르나비리대(Birnaviridae) 과, 크르소비리대(Chrysoviridae) 과, 시스토비리대(Cystoviridae) 과, 엔도나비리대(Endornaviridae) 과, 히포비리대(Hypoviridae) 과, 메가비나비리대(Megavirnaviridae) 과, 파티티비리대(Partitiviridae) 과, 피코비나비리대(Picobirnaviridae) 과, 레오비리대(Reoviridae) 과, 로타바이러스 과 및 토티비리대(Totiviridae) 과로부터의 것이다.
일부 실시양태에서, + 센스 ssRNA 바이러스는 알파플렉시비리대(Alphaflexiviridae) 과, 알파테트라비리대(Alphatetraviridae) 과, 알베나비리대(Alvernaviridae) 과, 아르테리비리대(Arteriviridae) 과, 아스트로비리대(Astroviridae) 과, 바나비리대(Barnaviridae) 과, 베타플렉시비리대(Betaflexiviridae) 과, 브로모비리대(Bromoviridae) 과, 카리시비리대(Caliciviridae) 과, 카르모테트라비리대(Carmotetraviridae) 과, 클로스테로비리대(Closteroviridae) 과, 코로나비리대(Coronaviridae) 과, 디시스트로비리대(Dicistroviridae) 과, 플라비비리대(Flaviviridae) 과, 감마플렉시비리대(Gammaflexiviridae) 과, 이플라비리대(Iflaviridae) 과, 레비비리대(Leviviridae) 과, 루테오비리대(Luteoviridae) 과, 마르나비리대(Marnaviridae) 과, 메소니비리대(Mesoniviridae) 과, 나나비리대(Narnaviridae) 과, 노다비리대(Nodaviridae) 과, 페르무토테트라비리대(Permutotetraviridae) 과, 피코나비리대(Picornaviridae) 과, 포티비리대(Potyviridae) 과, 로니비리대(Roniviridae) 과, 세코비리대(Secoviridae) 과, 토가비리대(Togaviridae) 과, 톰부스비리대(Tombusviridae) 과, 티모비리대(Tymoviridae) 과, 및 비가비리대(Virgaviridae) 과로부터의 것일 수 있다.
일부 실시양태에서, - 센스 ssRNA 바이러스는 보나비리대(Bornaviridae) 과, 필로비리대(Filoviridae) 과, 파라믹소비리대(파라믹소viridae) 과, 랍도비리대(Rhabdoviridae) 과, 니아미비리대(Nyamiviridae) 과, 아레나비리대(Arenaviridae) 과, 분야비리대(Bunyaviridae) 과, 오피오비리대(Ophioviridae) 과, 및 오르토믹소비리대(Orthomyxoviridae) 과로부터의 것일 수 있다.
바이러스의 비제한적인 예로는 아벨손 백혈병 바이러스, 아벨손 뮤린 백혈병 바이러스, 아벨손 바이러스, 급성 후두기관기관지염 바이러스, 애들레이드 리버 바이러스, 아데노 연관 바이러스 군, 아데노바이러스, 아프리카 말 병 바이러스, 아프리카 돼지 열 바이러스, AIDS 바이러스, 알류샨 밍크 병 파보바이러스, 알파레트로바이러스, 알파바이러스, ALV 관련 바이러스, 아마파리바이러스, 아프토바이러스, 아쿠아레오바이러스, 아르보바이러스, 아르보바이러스 C, 아르보바이러스 군 A, 아르보바이러스 군 B, 아레나바이러스 군, 아르헨티나 출혈 열 바이러스, 아르헨티나 출혈 열 바이러스, 아르테리바이러스, 아스트로바이러스, 아텔린 헤르페스바이러스 군, 아우제스키병 바이러스, 아우라바이러스, 아우스둑병 바이러스, 호주 박쥐 리사바이러스, 아비아데노모세포증, 조류 적혈구아세포증 바이러스, 조류 감염성 기관지염 바이러스, 조류 백혈병 바이러스, 조류 백혈증 바이러스, 조류 림프종증 바이러스, 조류 골수모세포 백혈증 바이러스, 조류 파라믹소바이러스, 조류 폐렴뇌염 바이러스, 조류 세망내피증 바이러스, 조류 육종 바이러스, 조류 C형 레트로바이러스 군, 아비헤파드나바이러스, 아피복스바이러스, B 바이러스, B19 바이러스, 바반키 바이러스, 개코원숭이 헤르페스바이러스, 배큘로바이러스, 바마 포레스트 바이러스, 베바루바이러스, 베리마바이러스, 베타레트로바이러스, 비나바이러스, 비트너 바이러스, BK 바이러스, 블랙 크릭 카날 바이러스, 청설 바이러스, 볼리비아 출혈 열 바이러스, 보마병 바이러스, 양 바이러스 국경병, 보나바이러스, 소 알파헤르페스바이러스 1, 소 알파헤르페스바이러스 2, 소 코로나 바이러스, 소 유행 열 바이러스, 소 면역결핍 바이러스, 소 백혈병 바이러스, 소 백혈증 바이러스, 소 유선염 바이러스, 소 유두종바이러스, 소 구진 구내염 바이러스, 소 파보바이러스, 소 세포융합 바이러스, 소 C형 온코바이러스, 소 바이러스 설사 바이러스, 버기 크릭 바이러스, 총알 모양의 바이러스 그룹, 부냠웨라 바이러스 상위군, 분야바이러스, 버킷 림프종 바이러스, 브왐바 열, CA 바이러스, 카리시바이러스, 캘리포니아 뇌염 바이러스, 낙타 두창 바이러스, 카나리아 두창 바이러스, 개과 헤르페스바이러스, 개 코로나 바이러스, 개 홍역 바이러스, 개 헤르페스바이러스, 개 미닛 바이러스, 개 파보바이러스, 카노 델가디토 바이러스, 염소 관절염 바이러스, 염소 뇌염 바이러스, 염소 헤르페스바이러스, 염소두창 바이러스, 카디오바이러스, 카비드 헤르페스바이러스 1, 세르코피테시드 헤르페스바이러스 1, 세르코피테신 헤르페스바이러스 1, 세르코피테신 헤르페스바이러스 2, 찬디푸라 바이러스, 창귀놀라 바이러스, 얼룩메기류 바이러스, 샤를빌 바이러스, 수두 바이러스, 치쿤구니야 바이러스, 침팬지 헤르페스바이러스, 처브 레오바이러스, 백 연어 바이러스, 코칼 바이러스, 은연어 레오바이러스, 성교 구진 바이러스, 콜로라도 진드기열 바이러스, 콜티바이러스, 콜롬비아 SK 바이러스, 감기 바이러스, 전염성 농창 바이러스, 전염성 농포성 피부염 바이러스, 코로나바이러스, 코리파르타 바이러스, 코리자 바이러스, 우두 바이러스, 콕사키 바이러스, CPV(세포질 다면체형성 바이러스: cytoplasmic polyhedrosis virus), 귀뚜라미 마비 바이러스, 크림-콩고 출혈 열 바이러스, 크룹 연관 바이러스, 크립토바이러스, 사이포바이러스, 사이토메갈로바이러스, 사이토메갈로바이러스 군, 세포질 다면체형성 바이러스, 사슴 유두종바이러스, 델타레트로바이러스, 뎅기 바이러스, 덴소바이러스, 디펜도바이러스, 도리 바이러스, 디플로마 바이러스, 드로소필라 C 바이러스, 오리 B형 간염 바이러스, 오리 간염 바이러스 1, 오리 간염 바이러스 2, 듀오바이러스, 듀벤헤이즈 바이러스, 변형 날개 바이러스 DWV, 동부 말 뇌염 바이러스, 동부 말 뇌염 바이러스, EB 바이러스, 에볼라 바이러스, 에볼라 유사 바이러스, 에코 바이러스, 에코바이러스, 에코바이러스 10, 에코바이러스 28, 에코바이러스 9, 사지결손증 바이러스, EEE 바이러스, EIA 바이러스, EIA 바이러스, 뇌염 바이러스, 뇌심근염 군 바이러스, 뇌심근염 바이러스, 엔테로바이러스, 효소 상승 바이러스, 상승 바이러스(LDH), 유행성 출혈열 바이러스, 가축 유행성 출혈 병 바이러스, 엡스테인-바 바이러스, 말과 알파헤르페스바이러스 1, 말과 알파헤르페스바이러스 4, 말과 헤르페스바이러스 2, 말 유산 바이러스, 말 동맥염 바이러스, 말 뇌병변 바이러스, 말 감염성 빈혈 바이러스, 말 모르빌리바이러스, 말 비폐렴 바이러스, 말 리노바이러스, 유베난구 바이러스, 유럽 엘크 유두종바이러스, 유럽 돼지 열 바이러스, 에버글레이즈 바이러스, 이야크 바이러스, 고양이과 헤르페스바이러스 1, 고양이 칼리시바이러스, 고양이 섬유육종 바이러스, 고양이 헤르페스바이러스, 고양이 면역결핍 바이러스, 고양이 감염성 복막염 바이러스, 고양이 백혈병/육종 바이러스, 고양이 백혈병 바이러스, 고양이 범백혈구감소증 바이러스, 고양이 파보바이러스, 고양이 육종 바이러스, 고양이 세포융합 바이러스, 필로바이러스, 플란더스 바이러스, 플라비바이러스, 수족구병 바이러스, 포트 모간 바이러스, 포 코너스 한타바이러스, 가금류 아데노바이러스 1, 가금류 두창 바이러스, 프리엔드 바이러스, 감마레트로바이러스, GB 간염 바이러스, GB 바이러스, 풍진 바이러스, 제타 바이러스, 긴팔원숭이 백혈병 바이러스, 선열 바이러스, 염소 두창 바이러스, 황금잉어 바이러스, 고노메타 바이러스, 거위 파보바이러스, 과립증 바이러스,그로스 바이러스, 얼룩 다람쥐 간염 B 바이러스, 군 A 아르보바이러스, 구아나리토 바이러스, 기니아 피그 사이토메갈로바이러스, 기니아 피그 C형 바이러스, 한타안 바이러스, 한타바이러스, 대합조개 레오바이러스, 산토끼 섬유종 바이러스, HCMV(인간 사이토메갈로바이러스), 혈구흡착 바이러스 2, 일본 혈구응집 바이러스, 출혈 열 바이러스, 헨드라 바이러스, 헤니파바이러스, 헤파드나바이러스, A형 간염 바이러스, B형 간염 바이러스 군, 간염 C 바이러스, 간염 D 바이러스, 간염 델타바이러스, 간염 E 바이러스, 간염 F 바이러스, 간염 G 바이러스, 간염 비A 비B 바이러스, 간염 바이러스, 간염 바이러스(비인간), 간뇌척수염 레오바이러스 3, 헤파토바이러스, 왜가리 간염 B 바이러스, 헤르페스 B 바이러스, 단순 헤르페스 바이러스, 단순 헤르페스 바이러스 1, 단순 헤르페스 바이러스 2, 헤르페스바이러스, 헤르페스바이러스 7, 헤르페스바이러스 아텔레스, 헤르페스바이러스 호미니스, 헤르페스바이러스 감염, 헤르페스바이러스 사이미리, 헤르페스바이러스 수이스, 수두 헤르페스바이러스, 하이랜즈 J 바이러스, 히람 랍도바이러스, 돼지 콜레라 바이러스, 인간 아데노바이러스 2, 인간 알파헤르페스바이러스 1, 인간 알파헤르페스바이러스 2, 인간 알파헤르페스바이러스 3, 인간 B 림프친화성 바이러스, 인간 베타헤르페스바이러스 5, 인간 코로나 바이러스, 인간 사이토메갈로바이러스 군, 인간 기포형 바이러스, 인간 감마헤르페스바이러스 4, 인간 감마헤르페스바이러스 6, 인간 A형 간염 바이러스, 인간 헤르페스바이러스 1 군, 인간 헤르페스바이러스 2 군, 인간 헤르페스바이러스 3 군, 인간 헤르페스바이러스 4 군, 인간 헤르페스바이러스 6, 인간 헤르페스바이러스 8, 인간 면역결핍 바이러스, 인간 면역결핍 바이러스 1, 인간 면역결핍 바이러스 2, 인간 유두종바이러스, 인간 T 세포 백혈병 바이러스, 인간 T 세포 백혈병 바이러스 I, 인간 T 세포 백혈병 바이러스 II, 인간 T 세포 백혈병 바이러스 III, 인간 T 세포 림프종 바이러스 I, 인간 T 세포 림프종 바이러스 II, 인간 T 세포 림프친화성 바이러스 타입 1, 인간 T 세포 림프친화성 바이러스 타입 2, 인간 T 림프친화성 바이러스 I, 인간 T 림프친화성 바이러스 II, 인간 T 림프친화성 바이러스 III, 이크노바이러스, 유아 위장염 바이러스, 감염성 소 비기관염 바이러스, 감염성 조혈 괴사 바이러스, 감염성 췌장 괴사 바이러스, 인플루엔자 바이러스 A, 인플루엔자 바이러스 B, 인플루엔자 바이러스 C, 인플루엔자 바이러스 D, 인플루엔자 바이러스 pr8, 곤충 무지개 바이러스, 곤충 바이러스, 이리도바이러스, 일본 B 바이러스, 일본 뇌염 바이러스, JC 바이러스, 주닌 바이러스, 카포시 육종 연관 헤르페스바이러스, 케메로보 바이러스, 킬햄 래트 바이러스, 클라매쓰 바이러스, 콜롱고 바이러스, 한국 출혈 열 바이러스, 쿰바 바이러스, 키사누르 포레스트 질환 바이러스, 키질아가크 바이러스, 라 크로스 바이러스, 락트산 탈수소효소 상승 바이러스, 락트산 탈수소효소 바이러스, 라고스 박쥐 바이러스, 랑구르 바이러스, 라핀 파보바이러스, 라사(Lassa) 열 바이러스, 라사 바이러스, 잠복 래트 바이러스, LCM 바이러스, 리키 바이러스, 렌티바이러스, 레포리폭스바이러스, 백혈병 바이러스, 류코바이러스, 덩어리 피부병 바이러스, 림프절병증 연관 바이러스, 림포크립토바이러스, 림프구 맥락막염 바이러스, 림프증식성 바이러스 군, 마추포(Machupo) 바이러스, 광 소양증 바이러스, 포유동물 타입 B 온코바이러스 군, 포유동물 타입 B 레트로바이러스, 포유동물 타입 C 레트로바이러스 군, 포유동물 타입 D 레트로바이러스, 유선 종양 바이러스, 마푸에라 바이러스, 마버그(Marburg) 바이러스, 마버그 유사 바이러스, 마손 화이자 원숭이 바이러스, 마스트아데노바이러스, 마야로 바이러스, ME 바이러스, 홍역 바이러스, 멘앵글 바이러스, 멘고 바이러스, 멘고바이러스, 미들부르그 바이러스, 착유부결절 바이러스, 밍크 장염 바이러스, 마우스 미닛 바이러스, MLV 관련 바이러스, MM 바이러스, 모콜라 바이러스, 몰루스시폭스바이러스, 전염성 연속종 바이러스, 원숭이 B 바이러스, 원숭이 두창 바이러스, 모노네가비랄레스, 모르빌리바이러스, 마운트 엘곤 박쥐 바이러스, 마우스 사이토메갈로바이러스, 마우스 뇌척수염 바이러스, 마우스 간염 바이러스, 마우스 K 바이러스, 마우스 백혈병 바이러스, 마우스 유선 종양 바이러스, 마우스 미닛 바이러스, 마우스 폐렴 바이러스, 마우스 소아마비 바이러스, 마우스 폴리오마바이러스, 마우스 육종 바이러스, 마우스 두창 바이러스, 모잠비크 바이러스, 무캄보 바이러스, 점막 질환 바이러스, 볼거리 바이러스, 설치류 베타헤르페스바이러스 1, 설치류 사이토메갈로바이러스 2, 뮤린 사이토메갈로바이러스 군, 뮤린 뇌척수염 바이러스, 뮤린 간염 바이러스, 뮤린 백혈병 바이러스, 뮤린 결절 유도 바이러스, 뮤린 폴리오마바이러스, 뮤린 육종 바이러스, 뮤로메갈로바이러스, 뮤레이 발리 뇌염 바이러스, 점액종 바이러스, 믹소바이러스, 다형성 믹소바이러스, 볼거리 믹소바이러스, 나이로비 양 질환 바이러스, 나이로바이러스, 나니르나바이러스, 나리바바이러스, 엔듀모 바이러스, 니틀링 바이러스, 넬슨 베이 바이러스, 신경친화성 바이러스, 뉴 월드 아레나바이러스, 신생아 폐렴 바이러스, 뉴캐슬병 바이러스, 니파 바이러스, 비세포병원성 바이러스, 노르웍 바이러스, 핵 다면체형성 바이러스(NPV: nuclear polyhedrosis virus), 유두 목 바이러스, 오뇽뇽 바이러스, 옥켈보 바이러스, 종양발생성 바이러스, 종양발생성 바이러스 유사 입자, 온코르나바이러스, 오르비바이러스, Orf 바이러스, 오로포우치 바이러스, 오르토헤파드나바이러스, 오르토믹소바이러스, 오르토폭스바이러스, 오르토레오바이러스, 오룬고, 양과 유두종바이러스, 양과 카타르 열 바이러스, 올빼미 원숭이 헤르페스바이러스, 필리얌 바이러스, 유두종바이러스, 유두종바이러스 실빌라기, 파포바바이러스, 파라인플루엔자 바이러스, 파라인플루엔자 바이러스 타입 1, 파라인플루엔자 바이러스 타입 2, 파라인플루엔자 바이러스 타입 3, 파라인플루엔자 바이러스 타입 4, 파라믹소바이러스, 파라폭스바이러스, 파라백시니아 바이러스, 파보바이러스, 파보바이러스 B19, 파보바이러스 군, 페스티바이러스, 플레보바이러스, 포신 디스템버 바이러스, 피코드나바이러스, 피코나바이러스, 돼지 사이토메갈로바이러스-비둘기 두창 바이러스, 피리 바이러스, 픽수나 바이러스, 마우스 폐렴 바이러스, 뉴모바이러스, 소아마비 바이러스, 폴리오바이러스, 폴리드나바이러스, 다면체 바이러스, 폴리오마 바이러스, 폴리오마 바이러스, 폴리오마 바이러스 보비스, 폴리오마 바이러스 세르코피쎄시, 폴리오마 바이러스 호미니스 2, 폴리오마 바이러스 마카캐 1, 폴리오마 바이러스 뮤리스 1, 폴리오마 바이러스 뮤리스 2, 폴리오마 바이러스 파피오니스 1, 폴리오마 바이러스 파피오니스 2, 폴리오마 바이러스 실빌라기, 폰진 헤르페스바이러스 1, 돼지 유행성 설사 바이러스, 돼지 혈구응집 뇌척수염 바이러스, 돼지 파보바이러스, 돼지 전염성 위장염 바이러스, 돼지 타입 C 바이러스, 폭스 바이러스, 폭스바이러스, 두창 폭스바이러스, 프로스펙트 힐 바이러스, 프로바이러스, 가성우두 바이러스, 가성광견병 바이러스, 앵무새 두창 바이러스, 메추라기 두창 바이러스, 토끼 섬유종 바이러스, 토기 신장 공포형성 바이러스, 토끼 유두종바이러스, 광견병 바이러스, 미국 너구리 파보바이러스, 미국 너구리 두창 바이러스, 라닉헷 바이러스, 래트 사이토메갈로바이러스, 래트 파보바이러스, 래트 바이러스, 라우셔 바이러스, 재조합 백시니아 바이러스, 재조합 바이러스, 레오바이러스, 레오바이러스 1, 레오바이러스 2, 레오바이러스 3, 파충류 타입 C 바이러스, 호흡기 감염 바이러스, 호흡기 세포융합 바이러스, 호흡기 바이러스, 망상내피증 바이러스, 랍도바이러스, 랍도바이러스 카르피아, 라디노바이러스, 리노바이러스, 리지디오바이러스, 리프트 밸리 열 바이러스, 릴리 바이러스, 우역 바이러스, RNA 종양 바이러스, 로스 리버 바이러스, 로타바이러스, 로우게올 바이러스, 라우스 육종 바이러스, 풍진 바이러스, 루베올라 바이러스, 루비바이러스, 러시아 가을 뇌염 바이러스, SA 11 시미안 바이러스, SA2 바이러스, 사비아 바이러스, 사기야마 바이러스, 사이미린 헤르페스바이러스 1, 침샘 바이러스, 모래파리 열 바이러스 군, 샌드짐바 바이러스, SARS 바이러스, SDAV (시알로눈물샘염 바이러스), 물개 두창 바이러스, 셈리키 포레스트 바이러스, 서울 바이러스, 양 두창 바이러스, 숍 섬유종 바이러스, 숍 유두종바이러스, 시미안 기포형 바이러스, 시미안 A형 간염 바이러스, 시미안 인간 면역결핍 바이러스, 시미안 면역결핍 바이러스, 시미안 파라인플루엔자 바이러스, 시미안 T 세포 림프친화성 바이러스, 시미안 바이러스, 시미안 바이러스 40, 심플렉스바이러스, 신 놈브레 바이러스, 신드비스 바이러스, 천연두 바이러스, 남아메리카 출혈 열 바이러스, 참새 두창 바이러스, 스푸마바바이러스, 다람쥐 섬유종 바이러스, 다람쥐 원숭이 레트로바이러스, SSV 1 바이러스 군, STLV(시미안 T 림프친화성 바이러스: simian T lymphotropic virus) 타입 I, STLV(시미안 T 림프친화성 바이러스) 타입 II, STLV(시미안 T 림프친화성 바이러스) 타입 III, 구진성 구내염 바이러스, 상악하 바이러스, 돼지과 알파헤르페스바이러스 1, 돼지과 헤르페스바이러스 2, 수이폭스바이러스, 습지 열 바이러스, 돼지 두창 바이러스, 스위스 마우스 백혈병 바이러스, TAC 바이러스, 타카리브 콤플렉스 바이러스, 타카리브 바이러스, 타나폭스 바이러스, 타테라폭스 바이러스, 텐취 레오바이러스, 테일러 뇌척수염 바이러스, 테일러 바이러스, 토고토 바이러스, 토타팔라얌 바이러스, 진드기 매개 뇌염 바이러스, 티오만 바이러스, 토가바이러스, 토로바이러스, 종양 바이러스, 투파이아바이러스, 칠면조 비기관염 바이러스, 칠면조 두창 바이러스, 타입 C 레트로바이러스, 타입 D 온코바이러스, 타입 D 레트로바이러스 군, 궤양성 질환 랍도바이러스, 유나 바이러스, 유우쿠니에미 바이러스 군, 백시니아 바이러스, 공포형성 바이러스, 수두 대상포진 바이러스, 바리셀로바이러스, 바리콜라 바이러스, 대두창 바이러스, 두창 바이러스, 바신 기슈병 바이러스, VEE 바이러스, 베네수엘라 말 뇌염 바이러스, 베네수엘라 말 뇌척수염 바이러스, 베네수엘라 출혈 열 바이러스, 수포성 구내염 바이러스, 베지큘로바이러스, 빌리유이스크 바이러스, 살무사 레트로바이러스, 바이러스성 출혈성 패혈증 바이러스, 비스나 매디 바이러스, 비스나 바이러스, 들쥐 두창 바이러스, VSV(수포성 구내염 바이러스), 왈랄 바이러스, 와레고 바이러스, 사마귀 바이러스, WEE 바이러스, 웨스트 나일 바이러스, 서부 말 뇌염 바이러스, 서부 말 뇌척수염 바이러스, 와타로아 바이러스, 동계 구토증 바이러스, 우드척 B형 간염 바이러스, 털원숭이 육종 바이러스, 상처 종양 바이러스, WRSV 바이러스, 야바 원숭이 종양 바이러스, 야바 바이러스, 야타폭스바이러스, 황열 바이러스, 및 유그 보그다노박 바이러스를 포함한다.
일부 실시양태에서, 바이러스는 코로나 바이러스이다. 일부 실시양태에서, 코로나바이러스는 알파코로나바이러스, 베타코로나바이러스, 델타코로나바이러스, 및 감마코로나바이러스로 구성된 군으로부터 선택된다. 알파코로나바이러스의 예로는 박쥐 코로나바이러스 CDPHE15, 박쥐 코로나바이러스 HKU10, 인간 코로나바이러스 229E, 인간 코로나바이러스 NL63, 긴날개 박쥐 코로나바이러스 1, 긴날개 박쥐 코로나바이러스 HKU8, 밍크 코로나바이러스 1, 돼지 유행성 설사 바이러스, 관박쥐 코로나바이러스 HKU2, 및 노랑박쥐 코로나바이러스 512를 포함할 수 있지만, 이에 제한되지 않는다. 베타코로나바이러스의 예로는 베타코로나바이러스 1, 고슴도치 코로나바이러스 1, 인간 코로나바이러스 HKU1, 중동 호흡기 증후군 관련 코로나 바이러스, 뮤린 코로나 바이러스, 집박쥐 코로나바이러스 HKU5, 루세트박쥐 코로나바이러스 HKU9, 중증 급성 호흡기 증후군 관련 코로나 바이러스, 대나무박쥐 코로나바이러스 HKU4를 포함할 수 있지만, 이에 제한되지 않는다. 델타코로나바이러스의 예로는 제주직박구리 코로나바이러스 HKU11, 쇠물닭 코로나바이러스 HKU21, 코로나바이러스 HKU15, 킨바라 코로나바이러스 HKU13, 해오라기 코로나바이러스 HKU19, 개똥지빠귀 코로나바이러스 HKU12, 동박새 코로나바이러스 HKU16, 홍머리오리 코로나바이러스 HKU20을 포함할 수 있지만, 이에 제한되지 않는다. 감마코로나바이러스의 예로는 조류 코로나 바이러스, 흰돌고래 코로나바이러스 SW1을 포함할 수 있지만, 이에 제한되지 않는다. 코로나바이러스의 추가 예로는 MERS-CoV, SARS-CoV, 및 SARS-CoV-2를 포함할 수 있다. 일부 실시양태에서, 코로나바이러스는 SARS-CoV-2일 수 있다.
일부 실시양태에서, 병원체는 사람에서 사람으로 쉽게 전파되거나, 전염될 수 있고; 높은 사망률을 초래할 수 있고, 공중 보건에 중대한 영향을 미칠 가능성이 있고; 대중의 공황과 사회적 혼란을 야기할 수 있고; 공중 보건 대비를 위한 특별 조치를 필요로 할 수 있다. 이러한 병원체의 예로는 탄저균(Anthrax)(바실러스 안트라시스), 보툴리눔독소증(Botulism)(클로스트리디움 보툴리눔 독소), 역병(역병)(예르시니아 페스티스), 천연두(바리올라 마요르(variola major)), 야토병(Tularemia)(프란시셀라 툴라렌시스), 또는 바이러스성 출혈 열(필로바이러스(에볼라, 마버그) 및 아레나바이러스(라사, 마추포) 포함)를 포함할 수 있다.
일부 실시양태에서, 병원체는 중간 정도로 쉽게 전파될 수 있고; 중등도의 이환율과 낮은 사망률을 초래할 수 있고; 진단 능력의 특정 향상과 질병 감시의 강화가 필요할 수 있다. 이러한 병원체의 예로는 브루셀라병(브루셀라 종), 클로스트리디움 페르프린겐스의 엡실론 독소, 식품 안전 위협(예컨대, 살모넬라 종, 에스케리키아 콜라이 O157:H7, 또는 시겔라), 마비저(부르크홀데리아 말레이), 멜리오이도시스(부르크홀데리아 슈도말레이), 앵무병(클라미디아 시타시), Q 열(콕시엘라 번에티이), 리시누스 코무니스로부터의 리신 독소(피마자), 포도상구균 장독소 B, 발진티프스(리케차 프로와제키), 바이러스 뇌염(알파바이러스, 예컨대, 동부 말 뇌염, 베네수엘라 말 뇌염, 및 서부 말 뇌염), 또는 물 안전 위협(예컨대, 비브리오 콜레라에 및 크립토스포리디움 파르붐)을 포함할 수 있다.
일부 실시양태에서, 병원체는 아직 확인되지 않은 서열을 갖는 신흥 병원체이다. 일부 실시양태에서, 신흥 병원체는 높은 이환율 및 사망률 및 주요 건강 영향에 대한 잠재성을 갖는다. 이러한 병원체의 예로는 니파 바이러스 및 한타바이러스를 포함할 수 있다.
일부 실시양태에서, 병원체는 독소를 포함할 수 있다. 일부 실시양태에서, 독소는 본원에 기술된 병원체 중 어느 하나에 의해 분비될 수 있다.
일부 실시양태에서, 병원체는 박테리아를 포함한다. 일부 실시양태에서, 박테리아는 그람-양성 박테리아일 수 있다. 일부 실시양태에서, 박테리아는 그람-음성 박테리아이다. 일부 실시양태에서, 박테리아는 β-락타마제에 내성인 균주 일부 실시양태에서, 항원은 장독소생성 에스케리키아 콜라이(ETEC: Enterotoxigenic Escherichia coli), 시가 독소 생성 에스케리키아 콜라이(STEC: Shiga toxin-producing Escherichia coli), 캄필로박터 제주니(Campylobacter jejuni), 슈도모나스 아에루기노사(Pseudomonas aeruginosa), 아시네토박터 바우마니이(Acinetobacter baumannii), 스트렙토코쿠스 뮤탄스(Streptococcus mutans), 헬리코박터 파이로리(Helicobacter pylori), 또는 바실러스 안트라시스로부터 유래된 것이다.
본원에 기술된 제핵 세포, 조성물 또는 약학적 조성물로 치료될 수 있는 병원체 및 이들 병원체와 연관된 질환 또는 병태의 예시적인 목록은 표 3-6에서 살펴볼 수 있다.
A. 활성제
본 개시내용의 세포질체는 항바이러스 조성물(예컨대, 백신, 병원체에 대한 중화 항체)과 같은 활성제를 발현하거나 함유한다. 활성제는 치료 DNA 분자, 치료 RNA 분자, 치료 단백질(예컨대, 효소, 항체, 항원, 독소, 사이토카인, 단백질 호르몬, 성장 인자, 세포 표면 수용체, 또는 백신), 치료 펩티드(예컨대, 펩티드 호르몬 또는 항원), 소분자 활성제(예컨대, 스테로이드, 폴리케티드, 알칼로이드, 독소, 항생제, 항바이러스제, 콜히친, 탁솔, 미토마이신 또는 엠탄신), 및 치료 유전자 편집 인자 중 적어도 하나를 포함할 수 있다. 일부 실시양태에서, 세포질체는 치료 DNA 분자, 치료 RNA 분자, 치료 단백질, 치료 펩티드, 치료 소분자, 또는 치료 유전자 편집 성분 중 적어도 하나를 생산(예컨대, 발현, 및 일부 실시양태에서, 분비)하도록 조작될 수 있다. 대안적으로, 또는 추가로, 유핵 세포(본원에서 사용되는 바, "모"세포)는 세포질체로 제핵되기 전에 치료 DNA 분자, 치료 RNA 분자, 치료 단백질, 치료 펩티드, 소분자 활성제, 및 유전자 편집 인자 중 적어도 하나를 생산하도록 조작될 수 있다.
치료 DNA 분자, 치료 RNA 분자, 치료 단백질, 치료 펩티드, 소분자 활성제, 또는 치료 유전자 편집 인자는 표적화 모이어티를 포함할 수 있다. 세포질체에 의해 생산되거나, 또는 세포질체에 함유될 수 있는 비제한적인 예시적인 표적화 모이어티는 케모카인 수용체, 부착 분자, 및 항원을 포함한다.
본 개시내용의 세포질체는 피험체에게 투여될 수 있고, 치료 DNA 분자, 치료 RNA 분자, 치료 단백질(예컨대, 효소, 항체, 항원, 독소, 사이토카인, 단백질 호르몬, 성장 인자, 세포 표면 수용체 또는 백신, 또는 현재 이용 가능하거나, 개발 중인 임의의 치료 단백질), 치료 펩티드(예컨대, 펩티드 호르몬 또는 항원, 또는 현재 이용 가능하거나, 개발 중인 임의의 치료 펩티드), 소분자 활성제(예컨대, 스테로이드, 폴리케티드, 알칼로이드, 독소, 항생제, 항바이러스제, 진통제, 항응고제, 항우울제, 항암제, 항간질제, 항정신병제, 진정제, 콜히친, 탁솔, 미토마이신, 엠탄신, 또는 현재 이용 가능하거나 개발 중인 임의의 소분자 활성제, 치료 유전자 편집 인자, 치료 나노입자, 또는 또 다른 활성제(예컨대, 박테리아, 박테리아 포자, 박테리오파지, 박테리아 성분, 바이러스(예컨대, 종양용해성 바이러스), 엑소좀, 지질 또는 이온)를 함유할 수 있다. 종양용해성 바이러스의 비제한적 예는 탈리모젠 라헤르파렙벡(Talimogene laherparepvec), Onyx-015, GL-ONC1, CV706, 보이저(Voyager)-V1, 및 HSV-1716을 포함한다. 일부 야생형 바이러스는 또한 예컨대, 백시니아 바이러스, 수포성 구내염 바이러스, 폴리오바이러스, 레오바이러스, 세네카바이러스, ECHO-7, 및 셈리키 포레스트 바이러스와 같은 종양용해성 거동을 보인다.
일부 실시양태에서, DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자는 재조합적으로 발현된다. 일부 실시양태에서, 세포질체가 유래되거나, 또는 수득된 세포는 DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자 중 하나 이상의 것을 생산하도록 조작된다. 일부 실시양태에서, 세포질체가 유래되거나, 또는 수득된 세포는 DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자 중 하나 이상의 것을 안정적으로 (예컨대, 영구적으로) 발현하도록 조작된다. 일부 실시양태에서, 세포질체가 유래되거나, 또는 수득된 세포는 DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자 중 하나 이상의 것을 일시적으로 발현하도록 조작된다. 일부 실시양태에서, 세포질체가 유래되거나, 또는 수득된 세포는 제핵 전에 조작된다. 일부 실시양태에서, 세포질체는 DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자 중 하나 이상의 것을 일시적으로 발현하도록 조작된다(예컨대, 제핵 후 조작).
일부 실시양태에서, DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자는 세포질체가 유래되거나, 또는 수득된 세포에서 (예컨대, 조작 부재하에서는) 자연적으로 발현되지 않는다(예컨대, DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자는 세포질체에 대해 외인성이다). 일부 실시양태에서, DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자는 피험체에서 자연적으로 발현되지 않는다(예컨대, DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자는 피험체에게 외인성이다). 일부 실시양태에서, DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자는 피험체의 의도된 치료 부위(예컨대, 종양, 또는 예컨대, 뇌, 장, 폐, 심장, 간, 비장, 췌장, 근육, 눈 등과 같은 특정 조직)에서 자연적으로 발현되지 않는다(예컨대, DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자는 의도된 치료 부위에 대해 외인성이다).
일부 실시양태에서, DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자는 세포질체가 유래되거나, 또는 수득된 세포에서 (예컨대, 조작 부재하에서) 자연적으로 발현된다(예컨대, DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자는 선천적으로 내인성이다)(예컨대, 세포질체가 유래되거나, 또는 수득된 세포의 조작 부재하에서). 일부 실시양태에서, DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자 피험체에서 자연적으로 발현된다(예컨대, DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자는 피험체에게 내인성이다). 일부 실시양태에서, DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자는 피험체의 의도된 치료 부위(예컨대, 종양, 또는 예컨대, 뇌, 장, 폐, 심장, 간, 비장, 췌장, 근육, 눈 등과 같은 특정 조직)에서 자연적으로 발현된다(예컨대, 예컨대, DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자는 의도된 치료 부위에 대해 내인성이다).
일부 실시양태에서, 치료제, 예컨대, DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자는 합성 세포로부터 유래되고. 세포질체 내로 로딩된다.
일부 실시양태에서, 세포질체는 세포질체가 유래되거나, 또는 수득된 세포와 비교하여 DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자의 교정, 말단절단, 비돌연변이 버전 및/또는 카피를 발현한다. 일부 실시양태에서, 세포질체는 임의의 유핵 세포(예컨대, 진핵 세포, 포유동물 세포(예컨대, 인간 세포, 또는 본원에 기술된 임의의 포유동물 세포), 원생동물 세포(예컨대, 아메바 세포), 조류 세포, 식물 세포, 진균 세포, 무척추동물 세포, 어류 세포, 양서류 세포, 파충류 세포, 또는 조류 세포)로부터 수득된다.
일부 실시양태에서, 세포질체는 임의의 조합으로 적어도 2개의(예컨대, 적어도 2, 3, 4, 5 또는 그 초과의) 상이한 치료 DNA 분자, 치료 RNA 분자, 치료 단백질, 치료 펩티드, 소분자 활성제, 또는 치료 유전자 편집 인자를 생산하거나, 또는 함유한다. 예를 들어, 일부 실시양태에서, 세포질체는 치료 DNA 분자 및 소분자 활성제를 생산하거나, 또는 함유할 수 있다. 예를 들어, 일부 실시양태에서, 세포질체는 2개의 상이한 소분자 활성제를 생산하거나, 또는 함유할 수 있다. 예를 들어, 일부 실시양태에서, 세포질체는 (예컨대, 표적화를 위한) 케모카인 수용체 및 소분자 활성제를 생산하거나, 또는 함유할 수 있다.
일부 실시양태에서, 치료 RNA 분자는 메신저 RNA(mRNA: messenger RNA), 짧은 헤어핀 RNA(shRNA: short hairpin RNA), 작은 간섭 RNA(siRNA: small interfering RNA), 마이크로RNA, 긴 비코딩 RNA(lncRNA: long non-coding RNA) 또는 RNA 바이러스이다. 일부 실시양태에서, 치료 DNA 분자는 단일 가닥 DNA, 이중 가닥 DNA, 올리고뉴클레오티드, 플라스미드, 박테리아 DNA 분자 또는 DNA 바이러스이다. 일부 실시양태에서, 치료 단백질은 사이토카인, 성장 인자, 호르몬, 항체, 소형 펩티드 기반 약물, 또는 효소이다. 일부 실시양태에서, 세포질체는 치료 DNA 분자, 치료 RNA 분자, 치료 단백질, 치료 펩티드, 소분자 치료제, 및/또는 치료 유전자 편집 인자를 일시적으로 발현한다. 일부 실시양태에서, 치료 DNA 분자, 치료 RNA 분자, 치료 단백질, 치료 펩티드, 소분자 치료제, 및/또는 치료 유전자 편집 인자의 발현은 유도가능하다. 일부 실시양태에서, 유핵 세포는 치료 DNA 분자, 치료 RNA 분자, 치료 단백질, 치료 펩티드, 소분자 치료제, 및/또는 치료 유전자 편집 인자를 발현하도록 영구적으로 조작된다. 일부 실시양태에서, 치료 DNA 분자, 치료 RNA 분자, 치료 단백질, 치료 펩티드, 소분자 치료제, 및/또는 치료 유전자 편집 인자의 발현. 본원에 기술된 임의의 방법의 일부 실시양태에서, 세포질체는 활성제 또는 나노입자를 포함한다. 일부 실시양태에서, 활성제는 소분자 또는 박테리아 또는 엑소좀이다.
치료 세포의 전신 투여의 경우, 이환 조직으로의 성공적인 귀소에 대한 2가지 주요 문제가 있다. 첫째, 대부분의 세포가 폐 또는 다른 조직의 작은 모세혈관에 포획될 수 있고, 이는 또한 예컨대, 폐색전증과 같은 심각한 부작용을 일으킬 수 있다. 일부 실시양태에서, 세포질체는 그들의 모세포보다 훨씬 작고(예컨대, 모세포 직경의 약 60% 및 부피의 1/8), 강성 핵을 갖지 않으므로, 세포질체는 작은 모세혈관 및 혈관을 그들의 모세포보다 더욱 잘 통과할 수 있다. 둘째, 이환 조직으로의 세포의 특정 귀소는 케모카인 수용체 신호전달, 예컨대, SDF-1α/CXCR4, CCL2/CCR2, 및 부착 분자, 예컨대, PSGL-1에 따라 달라질 수 있다. 본원에 제시된 바와 같이, 세포질체는 조작된 세포질체의 특이적 귀소를 크게 촉진할 수 있는 글리코실화된 PSGL-1 뿐만 아니라, 기능적 CXCR4, CCR2를 특이적으로 발현하도록 조작될 수 있다.
일부 실시양태에서, 세포질체는 세포질체의 세포 표면 상에서 발현되는 표적화 모이어티, 예컨대, CXCR4, CCR2 또는 PSGL-1을 (예컨대, 조작에 의해 또는 이들이 수득된 세포로부터) 추가로 포함할 수 있다. 세포질체의 세포 표면 상에서 발현될 수 있는 세포 표면 단백질의 비제한적인 예로는 케모카인 예컨대, CXCR4, CCR2, CCR1, CCR5, CXCR7, CXCR2, 및 CXCR1을 포함한다. 귀소 수용체로서 세포질체의 세포 표면 상에서 발현될 수 있는 세포 표면 단백질의 다른 예로는 C-X-C 케모카인 수용체 타입 3, 류코시아린, CD44 항원, C-C 케모카인 수용체 타입 7, L-셀렉틴, 림프구 기능 연관 항원 1, 또는 초후기 항원-4, 또는 그의 조합을 포함할 수 있다. 일부 실시양태에서, 세포질체는 세포질체에 의해 분비되거나, 또는 세포외 기질에 테더링된 세포 표적화 모이어티, 예컨대, SDF1α 또는 CCL2를 (예컨대, 조작에 의해 또는 이들이 수득된 세포로부터) 추가로 포함할 수 있다. 세포 귀소를 위해 세포질체에 의해 분비될 수 있는 단백질의 비제한적인 예로는 SDF1α, CCL2, CCL3, CCL5, CCL8, CCL1, CXCL9, CXCL10, CCL11, 및 CXCL12를 포함한다. 표적화 모이어티는 세포질체를 표적 세포, 표적 조직, 또는 표적 환경으로 유도할 수 있다. 일부 실시양태에서, 표적화 모이어티는 케모카인/케모카인 수용체 감지에 기초하여 세포질체를 유도한다. 일부 실시양태에서, 표적화 모이어티는 직접 결합에 기초하여 세포질체를 유도한다. 예를 들어, 표적화 모이어티는 표적 세포에 의해 발현되는 항원에 결합할 수 있는 항체를 포함할 수 있다.
일부 실시양태에서, 세포질체는 4-1BBL, 아실화 자극 단백질, 아디포카인, 알빈터페론, APRIL, Arh, BAFF, Bcl-6, CCL1, CCL1/TCA3, CCL11, CCL12/MCP-5, CCL13/MCP-4, CCL14, CCL15, CCL16, CCL17/TARC, CCL18, CCL19, CCL2, CCL2/MCP-1, CCL20, CCL21, CCL22/MDC, CCL23, CCL24, CCL25, CCL26, CCL27, CCL28, CCL3, CCL3L3, CCL4, CCL4L1/LAG-1, CCL5, CCL6, CCL7, CCL8, CCL9, CCR10, CCR3, CCR4, CCR5, CCR6, CCR7, CCR8, CD153, CD154, CD178, CD40LG, CD70, CD95L/CD178, 서버루스(Cerberus)(단백질), 케모카인, CLCF1, CNTF, 콜로니 자극 인자, 공통 b 쇄 (CD131), 공통 g 쇄(CD132), CX3CL1, CX3CR1, CXCL1, CXCL10, CXCL11, CXCL12, CXCL13, CXCL14, CXCL15, CXCL16, CXCL17, CXCL2, CXCL2/MIP-2, CXCL3, CXCL4, CXCL5, CXCL6, CXCL7, CXCL9, CXCR3, CXCR4, CXCR5, EDA-A1, Epo, 에리트로포이에틴, FAM19A1, FAM19A2, FAM19A3, FAM19A4, FAM19A5, Flt-3L, FMS 유사 티로신 키나제 3 리간드, Foxp3, GATA-3, GcMAF, G-CSF, GITRL, GM-CSF, 과립구 콜로니 자극 인자, 과립구 대식세포 콜로니 자극 인자, 간세포 성장 인자, IFNA1, IFNA10, IFNA13, IFNA14, IFNA2, IFNA4, IFNA5/IFNaG, IFNA7, IFNA8, IFNB1, IFNE, IFNG, IFNZ, IFN-α, IFN-β, IFN-γ, IFNω/IFNW1, IL-1, IL-10, IL-10 패밀리, IL-10 유사, IL-11, IL-12, IL-13, IL-14, IL-15, IL-16, IL-17, IL-17 패밀리, IL-17A-F, IL-18, IL-18BP, IL-19, IL-1A, IL-1B, IL-1F10, IL-1F3/IL-1RA, IL-1F5, IL-1F6, IL-1F7, IL-1F8, IL-1F9, IL-1 유사, IL-1RA, IL-1RL2, IL-1α, IL-1β, IL-2, IL-20, IL-21, IL-22, IL-23, IL-24, IL-28A, IL-28B, IL-29, IL-3, IL-31, IL-33, IL-35, IL-4, IL-5, IL-6, IL-6 유사, IL-7, IL-8/CXCL8, IL-9, 인플라마좀, 인터페롬, 인터페론, 인터페론 베타-1a, 인터페론 베타-1b, 인터페론 감마, 인터페론 유형 I, 인터페론 유형 II, 인터페론 유형 III, 인터페론, 인터루킨, 인터 류킨 1 수용체 길항제, 인터류킨 8, IRF4, 렙틴, 백혈병 억제 인자(LIF: leukemia inhibitory factor), 백혈구 촉진 인자, LIGHT, LTA/TNFB, LT-β, 림포카인, 림프독소, 림프독소 알파, 림프독소 베타, 대식세포 콜로니 자극 인자, 대식세포 염증성 단백질, 대식세포 활성화 인자, M-CSF, MHC 클래스 III, 기타 헤마토포이에틴, 모노카인, MSP, 미오카인, 미오넥틴, 니코틴아미드 포스포리보실트랜스퍼라제, 온코스타틴 M(OSM), 오프렐베킨, OX40L, 혈소판 인자 4, 프로메가포이에틴, RANKL, SCF, STAT3, STAT4, STAT6, 간질 세포 유래 인자 1, TALL-1, TBX21, TGF-α, TGF-β, TGF-β1, TGF-β2, TGF-β3, TNF, TNFSF10, TNFSF11, TNFSF12, TNFSF13, TNFSF14, TNFSF15, TNFSF4, TNFSF8, TNF-α, TNF-β, Tpo, TRAIL, TRANCE, TWEAK, 혈관 내피 성장 억제제, XCL1, 또는 XCL2로 구성된 군으로부터 선택되는 사이토카인 중 적어도 하나를 발현하고/거나, 분비할 수 있다.
일부 실시양태에서, 세포질체는 골수 세포, T 세포, 예컨대, 알파 베타 세포독성 T 세포, 감마 델타 T 세포, 조절 T 세포, 자연 살해 T 세포, B 세포, 자연 살해 세포, 대식세포, 비만 세포, 내피 세포, 섬유아세포, 또는 다양한 간질 세포 중 어느 하나의 생물학적 활성을 조정하기 위한 적어도 하나의 사이토카인을 발현 및/또는 분비할 수 있다.
일부 실시양태에서, 세포질체는 피험체 면역계의 회피를 돕는 표면 마커를 (예컨대, 조작에 의해 또는 이들이 수득된 세포로부터) 추가로 포함할 수 있다. 예를 들어, 일부 실시양태에서, 세포질체는 CD47 마커를 포함할 수 있다. 임의의 특정 이론에 얽매이지 않고, CD47 마커는 세포질체가 대식세포에 의한 식세포화되는 것을 방지하는 데 도움이 된다고 간주된다. 세포-기질 수용체 및 세포-세포 부착 분자의 비제한적인 예는 인테그린, 카드헤린, 당단백질 및 헤파린 술페이트 프로테오글리칸을 포함한다. 치료 분자의 비제한적 예는 종양 항원 및 면역조정 펩티드, 폴리아민 및 ATP를 포함한다.
1.백신
조성물
일부 실시양태에서, 본원에서는 백신 조성물인 활성제를 발현하거나, 전달하도록 조작된 세포질체를 기술한다. 일부 실시양태에서, 백신 조성물을 코딩하는 핵산 분자는 본원에 기술된 방법을 사용하여 세포질체, 또는 그의 모세포 내로 도입된다. 일부 실시양태에서, 백신 조성물은 상응하는 모세포에 내인성인 세포 기계(예컨대, mRNA 번역 기계, 단백질 합성)를 사용하여 세포질체에서 발현된다. 일부 실시양태에서, 피험체에 일단 투여되면, 세포질체는 백신 조성물을 세포외 공간으로 분비하기 위해 상응하는 모세포의 내인성 단백질 분비 기구를 이용한다. 세포질체는 또한 백신 조성물이 분비되는 피험체(예컨대, 폐, 림프)의 표적 조직에 특이적인 귀소 수용체로 조작될 수 있다. 세포질체는 또한 과립구-대식세포 콜로니 자극 인자(GM-CSF) 또는 본원에 기술된 사이토카인 또는 사이토카인에 대한 수용체 중 어느 하나와 같은 면역계 활성화제를 발현하도록 조작될 수 있다.
일부 실시양태에서, 백신 조성물은 병원체의 항원에 대한 것이다. 항원의 비제한적인 예는 천연 서열을 포함하는 단백질, 천연 또는 비천연 아미노산을 포함하고/거나, 예컨대, 글리코실화, 팔미토일화, 미리스토일화 등과 같은 변형이 있는 폴리펩티드, 및 천연 또는 비천연 염기를 포함하는 핵산을 포함한다. 병원체는 포유동물에서 감염을 유발하는 임의의 박테리아, 바이러스 또는 진균일 수 있다. 일부 실시양태에서, 병원체는 바이러스일 수 있다. 일부 실시양태에서, 바이러스 항원은 바이러스 단백질, 바이러스 단백질의 단편, 또는 바이러스 단백질 또는 바이러스 단백질의 단편을 코딩하는 핵산으로부터 제조될 수 있다. 일부 실시양태에서, 백신은 본원에 기술된 바이러스의 불활성화된 버전을 포함한다. 일부 실시양태에서, 백신은 본원에 기술된 바이러스의 생 약독화 버전을 포함한다. 일부 실시양태에서, 생 약독화 바이러스는 살아 있지만, 복제가 결핍된 바이러스이다. 다른 경우에, 생 약독화 바이러스는 살아 있지만, 비감염성인 바이러스이다.
일부 실시양태에서, 본원에 기술된 세포질체를 포함하는 백신은 백신 조성물을 포함하는 세포질체를 피험체에게 투여한 후 피험체에서 적응 면역 반응을 유도한다. 일부 실시양태에서, 본원에 기술된 백신은 피험체를 바이러스 감염에 대해 면역화시키기에 충분한 적응 면역 반응을 유도하거나, 또는 바이러스 감염에 의해 유발되는 질환 또는 병태의 중증도를 감소시킨다.
일부 실시양태에서, 본원에서는 본원에 개시된 병원체의 바이러스 항원에 대한 백신 조성물을 발현하도록 조작된 세포질체를 제공한다. 바이러스는 DNA 바이러스 또는 RNA 바이러스일 수 있다. DNA 바이러스는 단일 가닥(ss) DNA 바이러스, 이중 가닥(ds) DNA 바이러스 또는 ss 및 ds DNA 영역을 모두 포함하는 DNA 바이러스일 수 있다. RNA 바이러스는 단일 가닥(ss) RNA 바이러스 또는 이중 가닥(ds) RNA 바이러스일 수 있다. ssRNA 바이러스는 + 센스 RNA 바이러스 또는 - 센스 RNA 바이러스로 추가로 분류될 수 있다.
일부 실시양태에서, 바이러스 항원은 인플루엔자의 임의의 속, 균주 또는 하위 유형에 의해 코딩되는 인플루엔자 단백질와 적어도 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일하다. 예시적인 인플루엔자 속은 인플루엔자 바이러스 A, 인플루엔자 바이러스 B, 인플루엔자 바이러스 C, 및 인플루엔자 바이러스 D를 포함할 수 있다. 일부 실시양태에서, 본원에 기술된 세포질체는 헤마글루티닌(HA) 및 뉴라미니다제(NA)의 인플루엔자 바이러스 단백질의 조합을 발현하도록 조작될 수 있다. 본원에 기술된 세포질체에 의해 발현될 수 있는 인플루엔자 헤마글루티닌(HA)는 HA 하위유형 H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15, H16, H17, 또는 H18을 포함할 수 있다. 본원에 기술된 세포질체에 의해 발현될 수 있는 인플루엔자 뉴라미니다제(NA)는 NA 하위유형 N1, N2, N3, N4, N5, N6, N7, N8, N9, N10, 또는 N11을 포함할 수 있다. 일부 실시양태에서, 본원에 기술된 세포질체는 본원에 기술된 HA 및 NA 하위유형 중 어느 하나의 조합을 발현할 수 있다. 단일 세포질체에 의해 발현될 수 있는 예시적인 조합은 H1N1, H2N2, H3N2, H5N1, H7N7, H1N2, H9N2, H7N2, H7N3, H10N7, H7N9, 또는 H6N1을 포함할 수 있다. 추가의 다른 예시적인 조합은 H1N1, H1N2, H1N3, H1N4, H1N5, H1NG, H1N7, H1N8, H1N9, H1N10, H1N11, H2N1, H2N2, H2N3, H2N4, H2N5, H2NG, H2N7, H2N8, H2NB, H2N1D, H2N11, H3N1, H3N2, H3N3, H3N4, H3N5, H3NB, H3N7, H3N8, H3NB, H3N1D, H3N11, H4N1, H4N2, H4N3, H4N4, H4N5, H4NB, H4N7, H4N8, H4N9, H4N10, H4N11, H5N1, H5N2, H5N3, H5N4, H5N5, H5NB, H5N7, H5N8, H5N3, H5N1D, H5N11, HBN1, HBN2, HBN3, HBN4, HBN5, HBNB, HBN7, HBN8, HBN9, HBN10, HBN11, H7N1, H7N2, H7N3, H7N4, H7N5, H7NB, H7N7, H7N8, H7N9, H7N10, H7N11, H8N1, H8N2, H8N3, H8N4, H8N5, H8NG, H8N7, H8N8,5 H8N9, H8N10, HBN11, HBN1, H9N2, HBN3, H9N4, H3N5, H3N7, H3N8, H3N3, H9N1D, HBN11, H1DN1, H10N2, H1DN3, H1DN4, H1DN5, H1DNG, H1DN7, H1DN8, H1DN3, H10N10, H1DN11, H11N1, H11N2, H11N3, H11N4, H11N5, HUNG, H11N7, HUNS, H11NS, H11N10, H11N11, H12N1, H12N2, H12N3, H12N4, H12N5, H12NB, H12N7, H12N8, H12N3, H12N1D, H12N11, H13N1, H13N2, H13N3, H13N4, H13N5, H13NB, H13N7, H13N8, H13N3, H13N1D, H13N11, H14N1, H14N2, H14N3, H14N4, H14N5, H14NB, H14N7, H14N8, H14N9, H14N10, H14N11, H15N1, H15N2, H15N3, H15N4, H15N5, H15NB, H15N7, H15N8, H15N3, H15N1D, H15N11, H1BN1, H1BN2, H1BN3, H1BN4, H1BN5, H1BNB, H1BN7, H1BN8, H1GN3, H1BN10, H1BN11, H17N1, H17N2, H17N3, H17N4, H17N5, H17NB, H17N7, H17N8, H17N3, H17N10, H17N11, H1BN1, H18N2, H18N3, H18N4, H18N5, H1BNB, H18N7, H18N8, H18N3, H1BN10, 또는 H1BN11을 포함할 수 있다.
일부 실시양태에서, 본원에서는 박테리아 항원에 대한 백신 조성물을 발현하도록 조작된 세포질체를 제공한다. 일부 실시양태에서, 박테리아 항원은 탄저균(바실러스 안트라시스), 보툴리눔독소증(클로스트리디움 보툴리눔 독소), 역병(예르시니아 페스티스), 야토병(프란시셀라 툴라렌시스), 브루셀라병(브루셀라 종), 클로스트리디움 페르프린겐스의 엡실론 독소, 살모넬라 종, 에스케리키아 콜라이 O157:H7, 시겔라, 마비저(부르크홀데리아 말레이), 멜리오이도시스(부르크홀데리아 슈도말레이), 앵무병(클라미디아 시타시), Q 열(콕시엘라 번에티이), 포도상구균 장독소 B, 발진티프스(리케차 프로와제키), 비브리오 콜레라에, 크립토스포리디움 파르붐으로부터 유래된 것이다. 일부 실시양태에서, 세포질체는 리시누스 코무니스로부터의 리신 독소(피마자)에 대한 백신 조성물을 발현하도록 조작된다.
일부 실시양태에서, 본원에서는 종양 항원에 대한 백신 조성물을 발현하도록 조작된 세포질체를 제공한다. 본원에서 사용되는 바, "종양 항원"은 암 세포에 의해 생산된 항원을 지칭한다. 본 개시내용에서 사용되는 바, 암 세포 또는 종양 세포의 비제한적 예로는 가시세포종, 액상 세포 암종, 음향 신경종, 첨점 흑색종 흑색종, 아크로스피로종, 급성 호산구성 백혈병, 급성 림프아구성 백혈병, 급성 거핵아구성 백혈병, 급성 단핵구 백혈병, 성숙한 급성 골수아구성 백혈병, 급성 골수성 수지상 세포 백혈병, 급성 골수 백혈병, 급성 전골수구성 백혈병, 아다만틴종, 선암종, 선양 낭포 암종, 선종, 선종성 치성 종양, 부신피질 암종, 성체 T 세포 백혈병, 공격성 NK 세포 백혈병, AIDS 관련 암, AIDS 관련 림프종, 폐포 연부 육종, 변색성 섬유종, 항문암, 역형성 대세포 림프종, 역형성 갑상선암, 혈관면역아세포 T 세포 림프종, 혈관근육종, 혈관육종, 충수암, 성상세포종, 비정형 기형 횡문근 종양, 기저 세포 암종, 기저 유사 암종, B 세포 백혈구, B 세포 림프종, 벨리니관 암종, 담도암, 방광암, 아세포종, 골암, 골 종양, 뇌간 신경교종, 뇌종양, 유방암, 브레너 종양, 기관지 종양, 세기관지폐포 암종, 갈색 종양, 버킷 림프종, 원발 부위 미상 암, 카르시노이드 종양, 암종, 상피내 암종, 음경 암종, 원발 부위 미상 암종, 암육종, 캐슬만병, 중추신경계 배아 종양, 소뇌성상세포종, 뇌성상세포종, 자궁경부암, 담관암종, 연골종, 연골육종, 척색종, 융모막암종, 맥락총 유두종, 만성 림프구성 백혈병, 만성 단핵구 백혈병, 만성 골수성 백혈병, 만성 골수증식성 장애, 만성 호중구 백혈병, 투명 세포 종양, 결장암, 결장직장암, 두개인두종, 피부 T 세포 림프종, 데고사르병, 융기성 피부섬유육종, 유피 포낭, 결합조직성 소원형 세포 종양, 미만성 거대 B 세포 림프종, 이형성 신경상피 종양, 배아 암종, 내배엽 부비동 종양, 자궁내막암, 자궁내막 자궁암, 자궁내막양 종양, 장병증 연관 T 세포 림프종, 뇌실상의아세포종, 뇌실막종, 유상피 육종, 적백혈병, 식도암, 감각신경아세포종, 유잉과 종양, 유잉과 육종, 유잉육종, 두개외 생식세포 종양, 성선외 생식세포 종양, 간외 담관암, 유선외 파제트병, 나팔관암, 태아의 태아, 섬유종, 여포성 림프종, 섬유육종, 여포성 림프종, 여포성 갑상선암, 담낭암, 담낭암, 신경교종, 신경절신경아교종, 신경절신경종, 위암, 위 림프종, 위장관암, 위장관 유암종, 위장관 기질 종양, 위장관 기질 종양, 생식 세포 종양, 생식세포종, 임신성 융모막세포종, 임신성 융모성 종양, 골 거대 세포 종양, 다형성 교아세포종, 신경교종, 뇌신경교종증, 사구체 종양, 글루카곤종, 생식선아세포종, 육아종 세포 종양, 모발 세포 백혈병, 모발 세포 백혈병, 두부경부암, 두부경부암, 심장암, 혈관아세포종, 혈관주위세포종, 혈관육종, 혈액암, 간세포 암종, 간비장 T 세포 림프종, 유전성 유방-난소암 증후군, 호지킨 림프종, 호지킨 림프종, 하인두암, 시상하부 신경교종, 염증성 유방암, 안내 흑색종, 췌도 세포 암종, 췌도 세포 종양, 소아 골수단구성 백혈병, 카포시 육종, 신장암, 담관 종양, 크루켄베르그 종양, 후두암, 후두암, 악성 흑색점 흑색종, 백혈병, 백혈병, 구순 및 구강암, 지방육종, 폐암, 황체종, 림프관종, 림프관 육종, 림프 상피종, 림프구종 백혈병, 림프종, 마크로글로불린혈증, 악성 섬유성 조직구종, 악성 섬유성 조직구종, 악성 골 섬유성 조직구종, 악성 신경교종, 악성 중피종, 악성 말초 신경초 종양, 악성 횡문근 종양, 악성 트리톤 종양, MALT 림프종, 외투 세포 림프종, 비만 세포 백혈병, 종격 생식 세포 종양, 종격 종양, 갑상선 수질암, 수아세포종, 수아세포종, 수질상피종, 흑색종, 흑색종, 수막종, 메르켈 세포 암종, 중피종, 중피종, 잠복 원발성 전이성 편평 경부암, 전이성 요로상피 암종, 혼합 뮬러 종양, 단핵구 백혈병, 구강암, 점액성 종양, 다발성 내분비 종양 증후군, 다발성 골수종, 다발성 골수종, 균상 식육종, 균상 식육종, 골수이형성 질환, 골수이형성 증후군, 골수 백혈병, 골수 육종, 골수증식성 질환, 점액종, 비강암, 비인두암, 비인두 암종, 신생물, 신경초종, 신경아세포종, 신경아세포종, 신경섬유종, 신경종, 결절 흑색종, 비호지킨 림프종, 비호지킨 림프종, 비흑색종 피부암, 비소세포폐암, 안구 종양, 핍지성상세포종, 희소돌기아교종, 종양세포종, 시신경초 수막종, 구강암, 구강암, 구인두암, 골육종, 골육종, 난소암, 난소암, 난소 상피암, 난소 생식 세포 종양, 난소 저악성 잠재성 종양, 유방의 파제트병, 판코스트 종양, 췌장암, 췌장암, 췌장암, 갑상선 유두암, 유두종증, 부신경절종, 부비동암, 부갑상선암, 음경암, 혈관주위 상피양 세포 종양, 인두암, 갈색세포종, 중간 분화의 송과체 실질 종양, 송과체종, 뇌하수체 종양, 뇌하수체 선종, 뇌하수체 종양, 형질 세포 신생물, 흉막 폐아세포종, 다배아종, 전구 T-림프아구성 림프종, 원발성 중추 신경계 림프종, 원발성 삼출성 림프종, 원발성 간세포 암, 원발성 간암, 원발성 복막암, 원발성 신경외배엽 종양, 전립선암, 가성 복막종, 직장암, 신장 세포 암종, 15번 염색체의 NUT 유전자 관련 호흡기 암종, 망막아세포종, 횡문근종, 횡문근육종, 리히터의 변형, 천미부 기형종, 침샘암, 육종, 신경초종증, 피지선 암종, 속발성 신생물, 정액종, 장액성 종양, 세르톨리 라이디히 세포 종양, 성대-기질 종양, 세자리 증후군, 반지 세포 암종, 피부암, 작은 청색 원형 세포 종양, 소세포 암종, 소세포 폐암, 소세포 림프종, 소장암, 연조직 육종, 체세포종, 매연성사마귀, 척수 종양, 척추 종양, 비장 변연부 림프종, 편평세포 암종, 위암, 표재 전이 흑색종, 천막상 원시 신경외배엽 종양, 표면 상피 기질 종양, 활막 육종, T 세포 급성 림프아구성 백혈병, T 세포 대과립 림프구 백혈병, T 세포 백혈병, T 세포 림프종, T 세포 전림프구성 백혈병, 기형종, 림프 말기암, 고환암, 포막종, 인후암, 흉선 암종, 흉선종, 갑상선암, 신우 및 요관의 이행 세포암, 이행 세포 암종, 요막관암, 요도암, 비뇨생식기 신생물, 자궁 육종, 포도막 흑색종, 질암, 베르너-모리슨 증후군, 사마귀모양 암종, 시각 경로 신경교종, 외음부암, 발텐스트롬 마크로글로불린혈증, 와르틴 종양, 빌름스 종양, 및 그의 조합을 비롯한 암의 세포를 포함할 수 있다. 일부 실시양태에서, 표적화된 암 세포는 암 줄기 세포와 같은 암 세포 집단 내의 하위집단을 나타낸다. 일부 실시양태에서, 암은 림프종과 같은 조혈 계통의 암이다. 일부 실시양태에서, 암은 비-소세포 폐암(NSCLC: non-small cell lung cancer), 소세포 폐암(SCLC: small cell lung cancer), 또는 임의의 다른 폐암 유형을 포함하는 폐암일 수 있다. 예를 들어, 폐암은 선암종, 편평상피 암종, 대세포(미분화) 암종, 대세포 신경내분비 암종, 선편평 암종, 유육종 암종, 폐 카르시노이드 종양 또는 선양낭성 암종을 포함할 수 있다. 다른 예시적인 폐암은 림프종, 육종, 양성 폐 종양, 또는 과오종을 포함할 수 있다.
a. 항원
일부 실시양태에서, 본원에서는 세포질체에 의해 발현되는 적어도 하나의 항원 또는 그의 일부를 포함하는 세포질체를 기술한다. 일부 실시양태에서, 적어도 하나의 항원은 암 세포에 의해 발현 또는 방출되는 항원일 수 있다. 일부 실시양태에서, 적어도 하나의 항원은 병원체에 의해 발현 또는 방출되는 항원일 수 있다. 일부 실시양태에서, 적어도 하나의 항원은 바이러스에 의해 발현 또는 방출되는 항원일 수 있다. 일부 실시양태에서, 적어도 하나의 항원은 박테리아에 의해 발현 또는 방출되는 항원일 수 있다. 일부 실시양태에서, 적어도 하나의 항원은 진균에 의해 발현 또는 방출되는 항원일 수 있다. 일부 실시양태에서, 적어도 하나의 항원은 적어도 하나의 이종성 폴리뉴클레오티드에 의해 코딩될 수 있고, 여기서, 적어도 하나의 이종성 폴리뉴클레오티드는 세포질체의 카르고일 수 있다. 일부 실시양태에서, 이종성 폴리뉴클레오티드는 바이러스 벡터 또는 플라스미드를 포함할 수 있다. 일부 실시양태에서, 세포질체는 이종성 폴리뉴클레오티드를 표적 조직으로 전달한다. 일부 실시양태에서, 적어도 하나의 항원을 포함하거나, 또는 적어도 하나의 항원을 코딩하는 이종성 폴리뉴클레오티드를 포함하는 세포질체는 본 명세서에 기술된 백신의 일부일 수 있다.
일부 실시양태에서, 적어도 하나의 항원, 또는 그의 일부는 암 세포와 발현되거나, 또는 그와 연관된 암 항원일 수 있다. 일부 실시양태에서, 세포질체는 세포질체의 표면 상에서 적어도 하나의 암 항원을 발현한다. 일부 실시양태에서, 세포질체는 적어도 하나의 암 항원을 방출하거나, 또는 분비한다. 일부 실시양태에서, 적어도 하나의 암 항원은 세포질체의 카르고일 수 있다. 일부 실시양태에서, 세포질체은 적어도 하나의 암 항원을 표적 세포 또는 조직으로 전달한다. 암 항원은 본원에 기술된 암 세포 중 어느 하나에 의해 발현될 수 있다. 일부 실시양태에서, 본원에 기술된 세포질체에 의해 발현 또는 방출된 암 항원은 세포질체가 피험체에게 투여될 때 면역 반응(예컨대, B 세포 활성화)을 유발하기에 충분할 수 있다.
일부 실시양태에서, 세포질체는 적어도 하나의 암 항원, 또는 그의 일부를 포함한다. 일부 실시양태에서, 세포질체는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 100, 200, 500, 1000, 2000, 5000, 10000개 이상의 암 항원을 포함한다. 일부 실시양태에서, 암 항원은 암 세포와 발현되거나, 또는 그와 연관된 항원의 펩티딜 서열과 50%, 60%, 70%, 80%, 90%, 95%, 또는 99% 이상 동일하다.
일부 실시양태에서, 세포질체는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 100, 200, 500, 1000, 2000, 5000, 10000개 이상의 항원을 포함한다. 일부 실시양태에서, 항원은 본원에 기술된 항원의 펩티딜 서열과 약 50%, 60%, 70%, 80%, 90%, 95%, 또는 99% 이상 동일하다. 일부 실시양태에서, 항원 또는 그의 일부는 약 5개의 아미노산 내지 약 5,000개의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 항원 또는 그의 일부는 약 5개의 아미노산 내지 약 10개의 아미노산, 약 5개의 아미노산 내지 약 15개의 아미노산, 약 5개의 아미노산 내지 약 20개의 아미노산, 약 5개의 아미노산 내지 약 25개의 아미노산, 약 5개의 아미노산 내지 약 50개의 아미노산, 약 5개의 아미노산 내지 약 100개의 아미노산, 약 5개의 아미노산 내지 약 200개의 아미노산, 약 5개의 아미노산 내지 약 500개의 아미노산, 약 5개의 아미노산 내지 약 1,000개의 아미노산, 약 5개의 아미노산 내지 약 2,000개의 아미노산, 약 5개의 아미노산 내지 약 5,000개의 아미노산, 약 10 아미노산 내지 약 15개의 아미노산, 약 10 아미노산 내지 약 20개의 아미노산, 약 10 아미노산 내지 약 25개의 아미노산, 약 10 아미노산 내지 약 50개의 아미노산, 약 10 아미노산 내지 약 100개의 아미노산, 약 10 아미노산 내지 약 200개의 아미노산, 약 10 아미노산 내지 약 500개의 아미노산, 약 10 아미노산 내지 약 1,000개의 아미노산, 약 10 아미노산 내지 약 2,000개의 아미노산, 약 10 아미노산 내지 약 5,000개의 아미노산, 약 15개의 아미노산 내지 약 20개의 아미노산, 약 15개의 아미노산 내지 약 25개의 아미노산, 약 15개의 아미노산 내지 약 50개의 아미노산, 약 15개의 아미노산 내지 약 100개의 아미노산, 약 15개의 아미노산 내지 약 200개의 아미노산, 약 15개의 아미노산 내지 약 500개의 아미노산, 약 15개의 아미노산 내지 약 1,000개의 아미노산, 약 15개의 아미노산 내지 약 2,000개의 아미노산, 약 15개의 아미노산 내지 약 5,000개의 아미노산, 약 20 아미노산 내지 약 25개의 아미노산, 약 20 아미노산 내지 약 50개의 아미노산, 약 20 아미노산 내지 약 100개의 아미노산, 약 20 아미노산 내지 약 200개의 아미노산, 약 20 아미노산 내지 약 500개의 아미노산, 약 20 아미노산 내지 약 1,000개의 아미노산, 약 20 아미노산 내지 약 2,000개의 아미노산, 약 20 아미노산 내지 약 5,000개의 아미노산, 약 25개의 아미노산 내지 약 50개의 아미노산, 약 25개의 아미노산 내지 약 100개의 아미노산, 약 25개의 아미노산 내지 약 200개의 아미노산, 약 25개의 아미노산 내지 약 500개의 아미노산, 약 25개의 아미노산 내지 약 1,000개의 아미노산, 약 25개의 아미노산 내지 약 2,000개의 아미노산, 약 25개의 아미노산 내지 약 5,000개의 아미노산, 약 50 아미노산 내지 약 100개의 아미노산, 약 50 아미노산 내지 약 200개의 아미노산, 약 50 아미노산 내지 약 500개의 아미노산, 약 50 아미노산 내지 약 1,000개의 아미노산, 약 50 아미노산 내지 약 2,000개의 아미노산, 약 50 아미노산 내지 약 5,000개의 아미노산, 약 100개의 아미노산 내지 약 200개의 아미노산, 약 100개의 아미노산 내지 약 500개의 아미노산, 약 100개의 아미노산 내지 약 1,000개의 아미노산, 약 100개의 아미노산 내지 약 2,000개의 아미노산, 약 100개의 아미노산 내지 약 5,000개의 아미노산, 약 200개의 아미노산 내지 약 500개의 아미노산, 약 200개의 아미노산 내지 약 1,000개의 아미노산, 약 200개의 아미노산 내지 약 2,000개의 아미노산, 약 200개의 아미노산 내지 약 5,000개의 아미노산, 약 500개의 아미노산 내지 약 1,000개의 아미노산, 약 500개의 아미노산 내지 약 2,000개의 아미노산, 약 500개의 아미노산 내지 약 5,000개의 아미노산, 약 1,000개의 아미노산 내지 약 2,000개의 아미노산, 약 1,000개의 아미노산 내지 약 5,000개의 아미노산, 또는 약 2,000개의 아미노산 내지 약 5,000개의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 암 항원은 약 5개의 아미노산, 약 10개의 아미노산, 약 15개의 아미노산, 약 20개의 아미노산, 약 25개의 아미노산, 약 50개의 아미노산, 약 100개의 아미노산, 약 200개의 아미노산, 약 500개의 아미노산, 약 1,000개의 아미노산, 약 2,000개의 아미노산, 또는 약 5,000개의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 암 항원은 적어도 약 5개의 아미노산, 약 10개의 아미노산, 약 15개의 아미노산, 약 20개의 아미노산, 약 25개의 아미노산, 약 50개의 아미노산, 약 100개의 아미노산, 약 200개의 아미노산, 약 500개의 아미노산, 약 1,000개의 아미노산, 또는 약 2,000개의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 암 항원은 최대 약 10개의 아미노산, 약 15개의 아미노산, 약 20개의 아미노산, 약 25개의 아미노산, 약 50개의 아미노산, 약 100개의 아미노산, 약 200개의 아미노산, 약 500개의 아미노산, 약 1,000개의 아미노산, 약 2,000개의 아미노산, 또는 약 5,000개의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 암 항원은 적어도 약 5개의 아미노산 내지 약 5,000개의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 암 항원은 적어도 약 5개의 아미노산 내지 약 10개의 아미노산, 약 5개의 아미노산 내지 약 15개의 아미노산, 약 5개의 아미노산 내지 약 20개의 아미노산, 약 5개의 아미노산 내지 약 25개의 아미노산, 약 5개의 아미노산 내지 약 50개의 아미노산, 약 5개의 아미노산 내지 약 100개의 아미노산, 약 5개의 아미노산 내지 약 200개의 아미노산, 약 5개의 아미노산 내지 약 500개의 아미노산, 약 5개의 아미노산 내지 약 1,000개의 아미노산, 약 5개의 아미노산 내지 약 2,000개의 아미노산, 약 5개의 아미노산 내지 약 5,000개의 아미노산, 약 10 아미노산 내지 약 15개의 아미노산, 약 10 아미노산 내지 약 20개의 아미노산, 약 10 아미노산 내지 약 25개의 아미노산, 약 10 아미노산 내지 약 50개의 아미노산, 약 10 아미노산 내지 약 100개의 아미노산, 약 10 아미노산 내지 약 200개의 아미노산, 약 10 아미노산 내지 약 500개의 아미노산, 약 10 아미노산 내지 약 1,000개의 아미노산, 약 10 아미노산 내지 약 2,000개의 아미노산, 약 10 아미노산 내지 약 5,000개의 아미노산, 약 15개의 아미노산 내지 약 20개의 아미노산, 약 15개의 아미노산 내지 약 25개의 아미노산, 약 15개의 아미노산 내지 약 50개의 아미노산, 약 15개의 아미노산 내지 약 100개의 아미노산, 약 15개의 아미노산 내지 약 200개의 아미노산, 약 15개의 아미노산 내지 약 500개의 아미노산, 약 15개의 아미노산 내지 약 1,000개의 아미노산, 약 15개의 아미노산 내지 약 2,000개의 아미노산, 약 15개의 아미노산 내지 약 5,000개의 아미노산, 약 20 아미노산 내지 약 25개의 아미노산, 약 20 아미노산 내지 약 50개의 아미노산, 약 20 아미노산 내지 약 100개의 아미노산, 약 20 아미노산 내지 약 200개의 아미노산, 약 20 아미노산 내지 약 500개의 아미노산, 약 20 아미노산 내지 약 1,000개의 아미노산, 약 20 아미노산 내지 약 2,000개의 아미노산, 약 20 아미노산 내지 약 5,000개의 아미노산, 약 25개의 아미노산 내지 약 50개의 아미노산, 약 25개의 아미노산 내지 약 100개의 아미노산, 약 25개의 아미노산 내지 약 200개의 아미노산, 약 25개의 아미노산 내지 약 500개의 아미노산, 약 25개의 아미노산 내지 약 1,000개의 아미노산, 약 25개의 아미노산 내지 약 2,000개의 아미노산, 약 25개의 아미노산 내지 약 5,000개의 아미노산, 약 50 아미노산 내지 약 100개의 아미노산, 약 50 아미노산 내지 약 200개의 아미노산, 약 50 아미노산 내지 약 500개의 아미노산, 약 50 아미노산 내지 약 1,000개의 아미노산, 약 50 아미노산 내지 약 2,000개의 아미노산, 약 50 아미노산 내지 약 5,000개의 아미노산, 약 100개의 아미노산 내지 약 200개의 아미노산, 약 100개의 아미노산 내지 약 500개의 아미노산, 약 100개의 아미노산 내지 약 1,000개의 아미노산, 약 100개의 아미노산 내지 약 2,000개의 아미노산, 약 100개의 아미노산 내지 약 5,000개의 아미노산, 약 200개의 아미노산 내지 약 500개의 아미노산, 약 200개의 아미노산 내지 약 1,000개의 아미노산, 약 200개의 아미노산 내지 약 2,000개의 아미노산, 약 200개의 아미노산 내지 약 5,000개의 아미노산, 약 500개의 아미노산 내지 약 1,000개의 아미노산, 약 500개의 아미노산 내지 약 2,000개의 아미노산, 약 500개의 아미노산 내지 약 5,000개의 아미노산, 약 1,000개의 아미노산 내지 약 2,000개의 아미노산, 약 1,000개의 아미노산 내지 약 5,000개의 아미노산, 또는 약 2,000개의 아미노산 내지 약 5,000개의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 항원 또는 그의 일부는 적어도 약 5개의 아미노산, 약 10개의 아미노산, 약 15개의 아미노산, 약 20개의 아미노산, 약 25개의 아미노산, 약 50개의 아미노산, 약 100개의 아미노산, 약 200개의 아미노산, 약 500개의 아미노산, 약 1,000개의 아미노산, 약 2,000개의 아미노산, 또는 약 5,000개의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 암 항원은 적어도 적어도 약 5개의 아미노산, 약 10개의 아미노산, 약 15개의 아미노산, 약 20개의 아미노산, 약 25개의 아미노산, 약 50개의 아미노산, 약 100개의 아미노산, 약 200개의 아미노산, 약 500개의 아미노산, 약 1,000개의 아미노산, 또는 약 2,000개의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 암 항원은 적어도 최대 약 10개의 아미노산, 약 15개의 아미노산, 약 20개의 아미노산, 약 25개의 아미노산, 약 50개의 아미노산, 약 100개의 아미노산, 약 200개의 아미노산, 약 500개의 아미노산, 약 1,000개의 아미노산, 약 2,000개의 아미노산, 또는 약 5,000개의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 항원 또는 그의 일부는 최대 약 5개의 아미노산 내지 약 5,000개의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 암 항원은 최대 약 5개의 아미노산 내지 약 10개의 아미노산, 약 5개의 아미노산 내지 약 15개의 아미노산, 약 5개의 아미노산 내지 약 20개의 아미노산, 약 5개의 아미노산 내지 약 25개의 아미노산, 약 5개의 아미노산 내지 약 50개의 아미노산, 약 5개의 아미노산 내지 약 100개의 아미노산, 약 5개의 아미노산 내지 약 200개의 아미노산, 약 5개의 아미노산 내지 약 500개의 아미노산, 약 5개의 아미노산 내지 약 1,000개의 아미노산, 약 5개의 아미노산 내지 약 2,000개의 아미노산, 약 5개의 아미노산 내지 약 5,000개의 아미노산, 약 10 아미노산 내지 약 15개의 아미노산, 약 10 아미노산 내지 약 20개의 아미노산, 약 10 아미노산 내지 약 25개의 아미노산, 약 10 아미노산 내지 약 50개의 아미노산, 약 10 아미노산 내지 약 100개의 아미노산, 약 10 아미노산 내지 약 200개의 아미노산, 약 10 아미노산 내지 약 500개의 아미노산, 약 10 아미노산 내지 약 1,000개의 아미노산, 약 10 아미노산 내지 약 2,000개의 아미노산, 약 10 아미노산 내지 약 5,000개의 아미노산, 약 15개의 아미노산 내지 약 20개의 아미노산, 약 15개의 아미노산 내지 약 25개의 아미노산, 약 15개의 아미노산 내지 약 50개의 아미노산, 약 15개의 아미노산 내지 약 100개의 아미노산, 약 15개의 아미노산 내지 약 200개의 아미노산, 약 15개의 아미노산 내지 약 500개의 아미노산, 약 15개의 아미노산 내지 약 1,000개의 아미노산, 약 15개의 아미노산 내지 약 2,000개의 아미노산, 약 15개의 아미노산 내지 약 5,000개의 아미노산, 약 20 아미노산 내지 약 25개의 아미노산, 약 20 아미노산 내지 약 50개의 아미노산, 약 20 아미노산 내지 약 100개의 아미노산, 약 20 아미노산 내지 약 200개의 아미노산, 약 20 아미노산 내지 약 500개의 아미노산, 약 20 아미노산 내지 약 1,000개의 아미노산, 약 20 아미노산 내지 약 2,000개의 아미노산, 약 20 아미노산 내지 약 5,000개의 아미노산, 약 25개의 아미노산 내지 약 50개의 아미노산, 약 25개의 아미노산 내지 약 100개의 아미노산, 약 25개의 아미노산 내지 약 200개의 아미노산, 약 25개의 아미노산 내지 약 500개의 아미노산, 약 25개의 아미노산 내지 약 1,000개의 아미노산, 약 25개의 아미노산 내지 약 2,000개의 아미노산, 약 25개의 아미노산 내지 약 5,000개의 아미노산, 약 50 아미노산 내지 약 100개의 아미노산, 약 50 아미노산 내지 약 200개의 아미노산, 약 50 아미노산 내지 약 500개의 아미노산, 약 50 아미노산 내지 약 1,000개의 아미노산, 약 50 아미노산 내지 약 2,000개의 아미노산, 약 50 아미노산 내지 약 5,000개의 아미노산, 약 100개의 아미노산 내지 약 200개의 아미노산, 약 100개의 아미노산 내지 약 500개의 아미노산, 약 100개의 아미노산 내지 약 1,000개의 아미노산, 약 100개의 아미노산 내지 약 2,000개의 아미노산, 약 100개의 아미노산 내지 약 5,000개의 아미노산, 약 200개의 아미노산 내지 약 500개의 아미노산, 약 200개의 아미노산 내지 약 1,000개의 아미노산, 약 200개의 아미노산 내지 약 2,000개의 아미노산, 약 200개의 아미노산 내지 약 5,000개의 아미노산, 약 500개의 아미노산 내지 약 1,000개의 아미노산, 약 500개의 아미노산 내지 약 2,000개의 아미노산, 약 500개의 아미노산 내지 약 5,000개의 아미노산, 약 1,000개의 아미노산 내지 약 2,000개의 아미노산, 약 1,000개의 아미노산 내지 약 5,000개의 아미노산, 또는 약 2,000개의 아미노산 내지 약 5,000개의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 암 항원은 최대 약 5개의 아미노산, 약 10개의 아미노산, 약 15개의 아미노산, 약 20개의 아미노산, 약 25개의 아미노산, 약 50개의 아미노산, 약 100개의 아미노산, 약 200개의 아미노산, 약 500개의 아미노산, 약 1,000개의 아미노산, 약 2,000개의 아미노산, 또는 약 5,000개의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 암 항원은 최대 적어도 약 5개의 아미노산, 약 10개의 아미노산, 약 15개의 아미노산, 약 20개의 아미노산, 약 25개의 아미노산, 약 50개의 아미노산, 약 100개의 아미노산, 약 200개의 아미노산, 약 500개의 아미노산, 약 1,000개의 아미노산, 또는 약 2,000개의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 암 항원은 최대 최대 약 10개의 아미노산, 약 15개의 아미노산, 약 20개의 아미노산, 약 25개의 아미노산, 약 50개의 아미노산, 약 100개의 아미노산, 약 200개의 아미노산, 약 500개의 아미노산, 약 1,000개의 아미노산, 약 2,000개의 아미노산, 또는 약 5,000개의 아미노산인 아미노산 길이를 포함한다.
일부 실시양태에서, 세포질체는 세포질체의 표면 상에서 항원을 발현한다. 일부 실시양태에서, 세포질체는 항원을 방출하거나 분비한다. 일부 실시양태에서, 항원은 세포질체의 카르고일 수 있다. 일부 실시양태에서, 세포질체는 항원을 표적 세포 또는 조직에 전달한다. 일부 실시양태에서, 본원에 기술된 세포질체에 의해 발현 또는 방출된 항원은 세포질체가 피험체에게 투여될 때 면역 반응(예컨대, B 세포 활성화)을 유발하기에 충분할 수 있다.
일부 실시양태에서, 항원 또는 그의 일부는 암 항원이다. 일부 실시양태에서, 암 항원은 암 세포 내로 도입되는 병원체 항원이다. 예를 들어, 세포질체는 SARS-CoV-2 바이러스의 스파이크 단백질을 암 세포에 도입하도록 조작될 수 있다. 상기 시나리오에서, SARS-CoV-2에 대해 백신 접종을 받은 피험체는 암 세포를 표적화하고, 그를 사멸시킬 수 있는 적응 면역계를 획득하였을 것이다. 일부 실시양태에서, 암 항원은 (세포질체 내로 로딩된) mRNA를 암 세포로 도입하기 위한 벡터로서 종양용해성 바이러스를 이용함으로써 암 세포 내로 도입될 수 있다.
일부 실시양태에서, 적어도 하나의 항원은 병원체 항원일 수 있다. 일부 실시양태에서, 병원체 항원은 바이러스 항원, 박테리아 항원, 진균 항원, 또는 독소 항원이다. 항원은 본원에 기술된 것 중 어느 하나(예컨대, 표 3-6의 병원체 중 어느 하나)에 의해 발현될 수 있다. 일부 실시양태에서, 적어도 하나의 항원은 바이러스 항원일 수 있다. 바이러스 항원은 본원에 기술된 바이러스(예컨대, SARS-CoV-2)의 항원일 수 있다. 일부 실시양태에서, 항원은 코로나바이러스로부터 유래된다. 일부 실시양태에서, 세포질체는 코로나 바이러스의 스파이크 단백질(S 단백질) 또는 스파이크 단백질의 단편인 적어도 하나의 바이러스 항원을 포함한다. 일부 실시양태에서, 스파이크 단백질 또는 그의 단편은 단량체 또는 삼량체일 수 있다. 일부 실시양태에서, 스파이크 단백질은 사전융합 안정화된 스파이크 단백질이다. 일부 실시양태에서, 코로나바이러스는 SARS-CoV-2이다.
일부 실시양태에서, 스파이크 단백질 또는 그의 단편의 바이러스 항원은 서열 번호 2 또는 8과 50%, 60%, 70%, 80%, 90%, 95%, 또는 99% 이상 동일하다. 일부 실시양태에서, 스파이크 단백질 또는 그의 단편을 포함하는 바이러스 항원은 문헌 [da Silva Filipe, A., Shepherd, J.G., Williams, T. et al. Genomic epidemiology reveals multiple introductions of SARS-CoV-2 from mainland Europe into Scotland. Nat Microbiol 6, 112-122 (2021)](본 문헌의 전문이 본원에서 참조로 포함된다)에 기술된 바와 같은 적어도 하나의 돌연변이 또는 변이체를 포함한다. 일부 실시양태에서, 스파이크 단백질 또는 그의 단편을 포함하는 바이러스 항원은 서열 번호 2 기준으로, Asp614Gly를 포함하는 적어도 하나의 돌연변이를 포함한다.
일부 실시양태에서, 스파이크 단백질 또는 그의 단편의 바이러스 항원은 적어도 5개의 아미노산, 10개의 아미노산, 20개의 아미노산, 25개의 아미노산, 50개의 아미노산, 100개의 아미노산, 200개 이상의 아미노산 또는 5개의 아미노산, 10개의 아미노산, 20개의 아미노산, 25개의 아미노산, 50개의 아미노산, 100개의 아미노산, 200개 이상의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 스파이크 단백질 또는 그의 단편은 세포질체의 표면 상에서 발현된다. 일부 실시양태에서, 스파이크 단백질 또는 그의 단편은 세포질체에 의해 분비된다. 일부 실시양태에서, 스파이크 단백질 또는 그의 단편은 세포질체의 카르고이다. 일부 실시양태에서, 스파이크 단백질 또는 그의 단편은 세포질체에 의해 표적 조직으로 전달된다. 일부 실시양태에서, 스파이크 단백질 또는 그의 단편을 포함하는 세포질체는 피험체에서 면역 반응을 유도할 수 있다. 일부 실시양태에서, 스파이크 단백질 또는 그의 단편을 포함하는 세포질체는 SARS-CoV-2 감염에 대한 적응 면역을 유도 및 부여할 수 있다. 일부 실시양태에서, 스파이크 단백질 또는 그의 단편을 포함하는 세포질체는 SARS-CoV-2 감염을 치료하거나, 또는 예방할 수 있다. 일부 실시양태에서, 세포질체는 세포질체의 표면 상에 스파이크 단백질을 발현한다. 일부 실시양태에서, 세포질체는 스파이크 단백질을 분비한다. 일부 실시양태에서, 세포질체는 스파이크 단백질을 표적 조직으로 전달한다. 일부 실시양태에서, 세포질체는 세포질체의 표면 상에 스파이크 단백질을 발현하고/거나, 스파이크 단백질을 분비하고/거나, 스파이크 단백질을 표적 조직으로 전달한다.
일부 실시양태에서, 세포질체는 뉴클레오캡시드 단백질(N 단백질) 또는 n 단백질의 단편의 적어도 하나의 바이러스 항원을 포함한다. 일부 실시양태에서, 뉴클레오캡시드 단백질 또는 그의 단편의 바이러스 항원은 서열 번호 9와 50%, 60%, 70%, 80%, 90%, 95%, 또는 99% 이상 동일하다. 일부 실시양태에서, 뉴클레오캡시드 단백질 또는 그의 단편의 바이러스 항원은 적어도 5개의 아미노산, 10개의 아미노산, 20개의 아미노산, 25개의 아미노산, 50개의 아미노산, 100개의 아미노산, 200개 이상의 아미노산 또는 5개의 아미노산, 10개의 아미노산, 20개의 아미노산, 25개의 아미노산, 50개의 아미노산, 100개의 아미노산, 200개 이상의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 뉴클레오캡시드 단백질 또는 그의 단편은 세포질체의 표면 상에서 발현된다. 일부 실시양태에서, 뉴클레오캡시드 단백질 또는 그의 단편은 세포질체에 의해 분비된다. 일부 실시양태에서, 뉴클레오캡시드 단백질 또는 그의 단편은 세포질체의 카르고이다. 일부 실시양태에서, 뉴클레오캡시드 단백질 또는 그의 단편은 세포질체에 의해 표적 조직으로 전달된다. 일부 실시양태에서, 뉴클레오캡시드 단백질 또는 그의 단편을 포함하는 세포질체는 피험체에서 면역 반응을 유도할 수 있다. 일부 실시양태에서, 뉴클레오캡시드 단백질 또는 그의 단편을 포함하는 세포질체는 SARS-CoV-2 감염에 대한 적응 면역을 유도 및 부여할 수 있다. 일부 실시양태에서, 뉴클레오캡시드 단백질 또는 그의 단편을 포함하는 세포질체는 SARS-CoV-2 감염을 치료하거나, 또는 예방할 수 있다. 일부 실시양태에서, 세포질체는 세포질체의 표면 상에 뉴클레오캡시드 단백질을 발현한다. 일부 실시양태에서, 세포질체는 뉴클레오캡시드 단백질을 분비한다. 일부 실시양태에서, 세포질체는 뉴클레오캡시드 단백질을 표적 조직으로 전달한다. 일부 실시양태에서, 세포질체는 세포질체의 표면 상에 뉴클레오캡시드 단백질을 발현하고/거나, 뉴클레오캡시드 단백질을 분비하고/거나, 뉴클레오캡시드 단백질을 표적 조직으로 전달한다.
일부 실시양태에서, 세포질체는 막 단백질(M 단백질) 또는 n 단백질의 단편인 적어도 하나의 바이러스 항원을 포함한다. 일부 실시양태에서, 막 단백질 또는 그의 단편의 바이러스 항원은 서열 번호 10과 50%, 60%, 70%, 80%, 90%, 95%, 또는 99% 이상 동일하다. 일부 실시양태에서, 막 단백질 또는 그의 단편의 바이러스 항원은 적어도 5개의 아미노산, 10개의 아미노산, 20개의 아미노산, 25개의 아미노산, 50개의 아미노산, 100개의 아미노산, 200개 이상의 아미노산 또는 5개의 아미노산, 10개의 아미노산, 20개의 아미노산, 25개의 아미노산, 50개의 아미노산, 100개의 아미노산, 200개 이상의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 막 단백질 또는 그의 단편은 세포질체의 표면 상에서 발현된다. 일부 실시양태에서, 막 단백질 또는 그의 단편은 세포질체에 의해 분비된다. 일부 실시양태에서, 막 단백질 또는 그의 단편은 세포질체의 카르고이다. 일부 실시양태에서, 막 단백질 또는 그의 단편은 세포질체에 의해 표적 조직으로 전달된다. 일부 실시양태에서, 막 단백질 또는 그의 단편을 포함하는 세포질체는 피험체에서 면역 반응을 유도할 수 있다. 일부 실시양태에서, 막 단백질 또는 그의 단편을 포함하는 세포질체는 SARS-CoV-2 감염에 대한 적응 면역을 유도 및 부여할 수 있다. 일부 실시양태에서, 막 단백질 또는 그의 단편을 포함하는 세포질체는 SARS-CoV-2 감염을 치료하거나, 또는 예방할 수 있다. 일부 실시양태에서, 세포질체는 세포질체의 표면 상에 막 단백질을 발현한다. 일부 실시양태에서, 세포질체는 막 단백질을 분비한다. 일부 실시양태에서, 세포질체는 막 단백질을 표적 조직으로 전달한다. 일부 실시양태에서, 세포질체는 세포질체의 표면 상에 막 단백질을 발현하고/거나, 막 단백질을 분비하고/거나, 막 단백질을 표적 조직으로 전달한다.
일부 실시양태에서, 세포질체는 외피 단백질(E 단백질) 또는 n 단백질의 단편인 적어도 하나의 바이러스 항원을 포함한다. 일부 실시양태에서, 외피 단백질 또는 그의 단편의 바이러스 항원은 서열 번호 11과 50%, 60%, 70%, 80%, 90%, 95%, 또는 99% 이상 동일하다. 일부 실시양태에서, 외피 단백질 또는 그의 단편의 바이러스 항원은 적어도 5개의 아미노산, 10개의 아미노산, 20개의 아미노산, 25개의 아미노산, 50개의 아미노산, 100개의 아미노산, 200개 이상의 아미노산 또는 5개의 아미노산, 10개의 아미노산, 20개의 아미노산, 25개의 아미노산, 50개의 아미노산, 100개의 아미노산, 200개 이상의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 외피 단백질 또는 그의 단편은 세포질체의 표면 상에서 발현된다. 일부 실시양태에서, 외피 단백질 또는 그의 단편은 세포질체에 의해 분비된다. 일부 실시양태에서, 외피 단백질 또는 그의 단편은 세포질체의 카르고이다. 일부 실시양태에서, 외피 단백질 또는 그의 단편은 세포질체에 의해 표적 조직으로 전달된다. 일부 실시양태에서, 외피 단백질 또는 그의 단편을 포함하는 세포질체는 피험체에서 면역 반응을 유도할 수 있다. 일부 실시양태에서, 외피 단백질 또는 그의 단편을 포함하는 세포질체는 SARS-CoV-2 감염에 대한 적응 면역을 유도 및 부여할 수 있다. 일부 실시양태에서, 외피 단백질 또는 그의 단편을 포함하는 세포질체는 SARS-CoV-2 감염을 치료하거나, 또는 예방할 수 있다. 일부 실시양태에서, 세포질체는 세포질체의 표면 상에 외피 단백질을 발현한다. 일부 실시양태에서, 세포질체는 외피 단백질을 분비한다. 일부 실시양태에서, 세포질체는 외피 단백질을 표적 조직으로 전달한다. 일부 실시양태에서, 세포질체는 세포질체의 표면 상에 외피 단백질을 발현하고/거나, 외피 단백질을 분비하고/거나, 외피 단백질을 표적 조직으로 전달한다.
일부 실시양태에서, 바이러스 항원은 서열 번호 4-7 중 어느 하나의 단편과 50%, 60%, 70%, 80%, 90%, 95%, 또는 99% 이상 동일한 핵산 서열에 의해 코딩된다. 일부 실시양태에서, 세포질체는 서열 번호 4-7 중 어느 하나의 단편과 100% 동일한 핵산 서열에 의해 코딩된 적어도 하나의 바이러스 항원을 포함한다.
일부 실시양태에서, 바이러스 항원은 코로나바이러스 변이체로부터 유래된 것이다. 일부 실시양태에서, 일부 실시양태에서, 코로나바이러스 변이체 항원은 서열 번호 401-447 또는 551-562 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 코로나바이러스 변이체 항원은 서열 번호 301-347 또는 501-512 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 핵산 서열로부터 코딩된다. 일부 실시양태에서, 코로나바이러스 변이체로부터 유래된 항원을 발현하는 세포질체의 피험체에게로의 투여는 피험체에서 코로나바이러스 변이체에 의한 감염에 대해 면역을 부여하거나, 또는 코로나바이러스 변이체에 의해 유발된 질환의 중증도를 감소시키는 데 치료적으로 효과적이다.
일부 실시양태에서, 바이러스 항원은 조류 코로나 바이러스로부터 유래된 것이다. 일부 실시양태에서, 일부 실시양태에서, 조류 코로나바이러스 항원은 서열 번호 251-260 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 조류 코로나바이러스 항원은 서열 번호 201-209 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 핵산 서열로부터 코딩된다. 일부 실시양태에서, 조류 코로나바이러스로부터 유래된 항원을 발현하는 세포질체의 피험체에게로의 투여는 피험체에서 조류 코로나 바이러스에 의한 감염에 대해 면역을 부여하거나, 또는 조류 코로나 바이러스에 의해 유발된 질환의 중증도를 감소시키는 데 치료적으로 효과적이다.
일부 실시양태에서, 바이러스 항원은 에볼라바이러스로부터 유래된 것이다. 일부 실시양태에서, 항원은 에볼라바이러스 당단백질, 기질 단백질, 핵단백질, 뉴클레오캡시드 단백질(예컨대, VP30, VP35, 또는 VP24), 또는 폴리머라제 (L) 단백질과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일하다. 일부 실시양태에서, 항원은 서열 번호 851-859 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 항원은 서열 번호 801-809 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 핵산 서열로부터 코딩된다. 일부 실시양태에서, 에볼라바이러스로부터 유래된 항원을 발현하는 세포질체의 피험체에게로의 투여는 피험체에서 에볼라바이러스에 의한 감염에 대해 면역을 부여하거나, 또는 에볼라바이러스에 의해 유발된 질환의 중증도를 감소시키는 데 치료적으로 효과적이다.
일부 실시양태에서, 바이러스 항원은 한타바이러스로부터 유래된 것이다. 일부 실시양태에서, 일부 실시양태에서, 항원은 한타바이러스 폴리머라제와 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일하고, M 세그먼트는 두 바이러스 표면 당단백질(Gn 및 Gc)에 대한 전구체(GPC)를 코딩하고, S 세그먼트는 뉴클레오캡시드(N) 단백질을 코딩한다. 일부 실시양태에서, 항원은 서열 번호 151-154 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 항원은 서열 번호 101-104 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 핵산 서열로부터 코딩된다. 일부 실시양태에서, 한타바이러스로부터 유래된 항원을 발현하는 세포질체의 피험체에게로의 투여는 피험체에서 한타바이러스에 의한 감염에 대해 면역을 부여하거나, 또는 한타바이러스에 의해 유발된 질환의 중증도를 감소시키는 데 치료적으로 효과적이다.
일부 실시양태에서, 바이러스 항원은 인간 면역결핍 바이러스(HIV: human immunodeficiency virus)로부터 유래된 것이다. 일부 실시양태에서, 일부 실시양태에서, HIV 항원은 서열 번호 651-660 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, HIV 항원은 서열 번호 601-610 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 핵산 서열로부터 코딩된다. 일부 실시양태에서, HIV로부터 유래된 항원을 발현하는 세포질체의 피험체에게로의 투여는 피험체에서 HIV에 의한 감염에 대해 면역을 부여하거나, 또는 HIV에 의해 유발된 질환의 중증도를 감소시키는 데 치료적으로 효과적이다.
일부 실시양태에서, 바이러스 항원은 호흡기 세포융합 바이러스(RSV: respiratory syncytial virus), 예컨대, RSV 멤피스(Memphis) 37로부터 유래된 것이다. 일부 실시양태에서, 일부 실시양태에서, RSV 항원은 서열 번호 751-761 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, RSV 항원은 서열 번호 701-711 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 핵산 서열로부터 코딩된다. 일부 실시양태에서, RSV로부터 유래된 항원을 발현하는 세포질체의 피험체에게로의 투여는 피험체에서 RSV에 의한 감염에 대해 면역을 부여하거나, 또는 RSV에 의해 유발된 질환의 중증도를 감소시키는 데 치료적으로 효과적이다.
일부 실시양태에서, 세포질체는 복수의 바이러스 항원을 포함할 수 있고, 여기서, 바이러스 항원은 동일한 것이다(예컨대, 바이러스 항원으로서 스파이크 단백질만을 포함하는 세포질체). 일부 실시양태에서, 세포질체는 복수의 바이러스 항원을 포함할 수 있고, 여기서, 바이러스 항원은 상이한 것이다. 예를 들어, 세포질체는 스파이크 단백질, 뉴클레오캡시드 단백질, 막 단백질, 또는 외피 단백질의 조합을 포함하는 바이러스 항원을 포함할 수 있다. 일부 실시양태에서, 세포질체는 세포질체의 표면 상에 발현될 수 있고/거나, 세포질체에 의해 캡슐화될 수 있고/거나, 세포질체에 의해 분비될 수 있는 바이러스 항원의 조합을 포함할 수 있다.
일부 실시양태에서, 항원은 박테리아로부터 유래된 것이다. 박테리아는 그람-양성 박테리아일 수 있다. 일부 실시양태에서, 박테리아는 그람-음성 박테리아일 수 있다. 일부 실시양태에서, 박테리아는 β-락타마제에 내성인 균주이다. 일부 실시양태에서, 항원은 장독소생성 에스케리키아 콜라이(ETEC), 시가 독소 생성 에스케리키아 콜라이(STEC), 캄필로박터 제주니, 슈도모나스 아에루기노사, 아시네토박터 바우마니이, 스트렙토코쿠스 뮤탄스, 헬리코박터 파이로리, 또는 바실러스 안트라시스로부터 유래된 것이다.
일부 실시양태에서, 박테리아 항원은 바실러스 안트라시스(예컨대, 탄저균)로부터 유래된 것이다. 일부 실시양태에서, 박테리아 항원은 방어 항원(PA: protective antigen), 및 두 효소 성분, 부종 인자(EF: edema factor) 및 치사 인자(LF: lethal factor)와 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일하다. 일부 실시양태에서, 박테리아 항원은 서열 번호 1151-1153 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 박테리아 항원은 서열 번호 1101-1103 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 핵산 서열로부터 코딩된다. 일부 실시양태에서,바실러스 안트라시스로부터 유래된 박테리아 항원을 발현하는 세포질체의 피험체에게로의 투여는 피험체에서 바실러스 안트라시스에 의한 감염에 대해 면역을 부여하거나, 또는 바실러스 안트라시스에 의해 유발된 질환의 중증도를 감소시키는 데 치료적으로 효과적이다.
일부 실시양태에서, 박테리아 항원은 클로스트리디움으로부터 유래된 것이다. 일부 실시양태에서, 일부 실시양태에서, 클로스트리디움 항원은 서열 번호 951-984 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 클로스트리디움 항원은 서열 번호 901-934 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 핵산 서열로부터 코딩된다. 일부 실시양태에서, 클로스트리디움으로부터 유래된 항원을 발현하는 세포질체의 피험체에게로의 투여는 피험체에서 클로스트리디움에 의한 감염에 대해 면역을 부여하거나, 또는 클로스트리디움에 의해 유발된 질환의 중증도를 감소시키는 데 치료적으로 효과적이다.
일부 실시양태에서, 백신 항원은 리신으로부터 유래된 것이다. 일부 실시양태에서, 일부 실시양태에서, 리신 항원은 서열 번호 1051-1057 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 리신 항원은 서열 번호 1001-1007 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 핵산 서열로부터 코딩된다. 일부 실시양태에서, 리신으로부터 유래된 항원을 발현하는 세포질체의 피험체에게로의 투여는 피험체에서 리신에 의한 감염에 대해 면역을 부여하거나, 또는 리신에 의해 유발된 독성 효과를 감소시키는 데 치료적으로 효과적이다.
일부 실시양태에서, 항원은 융합 단백질일 수 있으며, 여기서, 본원에 기술된 단백질 중 어느 하나 또는 그의 단편은 또 다른 펩티드와 융합될 수 있다. 일부 실시양태에서, 본원에 기술된 항원은 세포막 단백질 또는 막횡단 단백질과 융합될 수 있다. 예시적인 세포막 단백질 또는 막횡단 단백질은 CD63, CD81, CD82, CD47, 이종삼량체 G 단백질, MHC 클래스 I, 인테그린, 트랜스페린 수용체(TFR2), LAMP1/2, 헤파란 술페이트 프로테오글리칸, EMMPRIN, ADAM10, GPI 고정 5'뉴클레오티다제, CD73, 보체 결합 단백질 CD55 및 CD59, 소닉 헤지호그(SHH: sonic hedgehog), TSPAN8, CD37, CD53, CD9, PECAM1, ERBB2, EPCAM, CD90, CD45, CD41, CD42a, 글리코포린 A, CD14, MHC 클래스 II, CD3, 아세틸콜린에스터라제/AChE-S, AChE-E, 아밀로이드 베타 A4/APP, 및 다중약물 내성 연관 단백질을 포함할 수 있다.
일부 실시양태에서, 항원은 글리코실-포스파티딜이노시톨(GPI) 또는 B7-1 항원(B7-1) 세포질 테일과 융합될 수 있다. 일부 실시양태에서, 항원은 알부민과 융합될 수 있다. 일부 실시양태에서, 항원은 분자 클램프를 포함하는 폴리펩티드와 함께 발현될 수 있다. 일부 실시양태에서, 분자 클램프는 동일한 세포질체에서 항원과 함께 발현될 때 항원을 사전융합 형태로 유지한다. 일부 실시양태에서, 분자 클램프는 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15개 이상의 아미노산 잔기마다 반복되는 패턴을 코딩하는 폴리펩티드를 포함한다. . 일부 실시양태에서, 분자 클램프를 코딩하는 폴리펩티드의 길이는 적어도 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개 이상의 아미노산 잔기 길이이다. 일부 실시양태에서, 분자 클램프는 한 가닥은 정방향으로 진행되고, 나머지 다른 한 가닥은 역방향으로 진행되는 트윈 나선으로 자가 조립된다. 일부 실시양태에서, 가닥에서 아미노산의 쌍 형성은 소수성 및 친수성 아미노산의 패턴에 의해 보장된다. 일부 실시양태에서, 패턴은 클램프 중 어느 것도 바이러스 항원에 결합하지 않도록 배열된다. 일부 실시양태에서, 분자 클램프는 강성 로드로 자가 조립된다. 일부 실시양태에서, 분자 클램프는 링커에 의해 바이러스 항원의 원하는 부분에 연결되며, 이는 분자 클램프를 발현하는 세포질체가 혼합물로부터 정제되도록 하는 것과 같은 다른 기능을 수행할 수 있다.
일부 실시양태에서, 항원은 종양 항원, 또는 그의 일부, 예컨대, 알파태아단백질(AFP: 알파fetoprotein), 암배아 항원(CEA: carcino배아 antigen), CA0125, MUC-1, 상피 종양 항원(ETA: epithelium tumor antigen)이다. 일부 실시양태에서, 항원은 일반적으로 알려진 임의의 암 에피토프와 적어도 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 일부 실시양태에서, 종양 항원 또는 그의 일부를 발현하는 세포질체의 피험체에게로의 투여는 피험체를 종양바이러스에 의한 감염에 대해 면역화하거나, 또는 종양바이러스에 의해 유발된 암의 중증도를 감소시키는 데 치료적으로 효과적이다.
b. 이종성 핵산
일부 실시양태에서, 본원에서는 적어도 하나의 이종성 폴리뉴클레오티드를 포함하는 백신을 기술한다. 이종성일 수 있는 폴리뉴클레오티드의 비제한적 예는 유전자 또는 유전자 단편의 코딩 또는 비코딩 영역, 연결 분석으로부터 정의된 유전자좌들(유전자좌), 엑손, 인트론, 메신저 RNA(mRNA), 자가 증폭 RNA, 우리딘 함유 RNA(uRNA: uridine containing RNA), 자가 증폭 mRNA, 전달 RNA(tRNA: transfer RNA), 리보솜 RNA(rRNA: ribosomal RNA), 짧은 간섭 RNA(siRNA: short interfering RNA), 짧은 헤어핀 RNA(shRNA), 마이크로RNA(miRNA), 리보자임, cDNA, 재조합 폴리뉴클레오티드, 분지형 폴리뉴클레오티드, 플라스미드, 벡터, 임의의 서열의 단리된 DNA, 임의의 서열의 단리된 RNA, 무세포 DNA(cfDNA: cell-free DNA) 및 무세포 RNA(cfRNA: cell-free RNA)를 비롯한 무세포 폴리뉴클레오티드, 핵산 프로브 및 프라이머를 포함한다. 뉴클레오티드의 서열은 뉴클레오티드가 아닌 성분에 의해 중단될 수 있다. 일부 실시양태에서, 이종성 폴리뉴클레오티드로부터 번역된 항원은 피험체에서 면역 반응을 유도할 수 있다. 일부 실시양태에서, 이종성 폴리뉴클레오티드로부터 번역된 항원은 피험체에서 본원에 기술된 병원체 중 어느 하나에 의해 유발된 감염에 대한 적응 면역을 부여할 수 있다. 일부 실시양태에서, 이종성 폴리뉴클레오티드로부터 번역된 항원은 피험체에서 본원에 기술된 병원체 중 어느 하나에 의해 유발된 병원성 감염을 치료하거나, 또는 예방할 수 있다.
일부 실시양태에서, 이종성 폴리뉴클레오티드는 본원에 기술된 면역조정제 중 하나 이상의 것을 코딩할 수 있다. 일부 실시양태에서, 면역조정제는 본원에 기술된 항원 중 어느 하나에 의해 유도된 면역 반응을 증강시킨다. 일부 실시양태에서, 면역조정제는 Ii-키(Ii-key)/MHC 클래스 II 에피토프 펩티드이다. 일부 실시양태에서, 면역조정제는 본원에 기술된 사이토카인 중 어느 하나이다. 일부 실시양태에서, 이종성 폴리뉴클레오티드는 본원에 기술된 귀소 단백질 중 하나 이상의 것 또는 귀소 수용체 중 하나 이상의 것을 코딩할 수 있다. 일부 실시양태에서, 귀소 단백질은 세포질체에 의해 분비될 수 있다. 일부 실시양태에서, 귀소 수용체는 세포질체의 표면 상에서 발현될 수 있다. 일부 실시양태에서, 하나 이상의 귀소 수용체는 림프 조직의 하나 이상의 세포에서 발현된 하나 이상의 리간드에 특이적일 수 있고, 림프 조직의 세포는 내피 세포, 림프구, 대식세포 또는 망상 세포, 또는 그의 조합을 포함할 수 있다.
일부 실시양태에서, 이종성 폴리뉴클레오티드는 본원에 기술된 표적화 모이어티 중 하나 이상의 것을 코딩할 수 있다. 일부 실시양태에서, 이종성 폴리뉴클레오티드는 본원에 기술된 면역조정제 중 하나 이상의 것을 코딩할 수 있다. 일부 실시양태에서, 이종성 폴리뉴클레오티드는 본원에 기술된 귀소 수용체 중 하나 이상의 것을 코딩할 수 있다. 일부 실시양태에서, 이종성 폴리뉴클레오티드는 본원에 기술된 귀소 단백질 중 하나 이상의 것을 코딩할 수 있다. 일부 실시양태에서, 이종성 폴리뉴클레오티드는 본원에 기술된 항바이러스 조성물 중 하나 이상의 것을 코딩할 수 있다.
일부 실시양태에서, 이종성 폴리뉴클레오티드는 바이러스 항원을 코딩하는 이종성 DNA 서열을 포함한다. 일부 실시양태에서, 이종성 DNA 서열은 orf1a, orf1ab, 스파이크 단백질(S 단백질), 3a, 3b, 외피 단백질(E 단백질), 막 단백질(M 단백질), p6, 7a, 7b, 8b, 9b, 뉴클레오캡시드 단백질(N 단백질), orf14, nsp1(리더 단백질), nsp2, nsp3, nsp4, nsp5(3C 유사 프로테이나제), nsp6, nsp7, nsp8, nsp9, nsp10(성장 인자 유사 단백질), nsp12(RNA 의존성 RNA 폴리머라제, 또는 RdRp), nsp13(RNA 5'-트리포스파타제), nsp14(3'에서 5'로의 엑소뉴클레아제), nsp15(엔도RNAse), 및 nsp16(2'-O-리보스 메틸트랜스퍼라제) 중 어느 하나를 코딩한다. 일부 실시양태에서, 세포질체는 스파이크 단백질 또는 그의 단편을 코딩하는 이종성 DNA 서열을 포함한다. 일부 실시양태에서, 세포질체는 뉴클레오캡시드 단백질 또는 그의 단편을 코딩하는 이종성 DNA 서열을 포함한다. 일부 실시양태에서, 세포질체는 막 단백질 또는 그의 단편을 코딩하는 이종성 DNA 서열을 포함한다. 일부 실시양태에서, 세포질체는 외피 단백질 또는 그의 단편을 코딩하는 이종성 DNA 서열을 포함한다. 일부 실시양태에서, 이종성 폴리뉴클레오티드는 하나 이상의 항원을 코딩하는 하나 이상의 이종성 DNA 서열을 포함할 수 있다. 예를 들어, 이종성 폴리뉴클레오티드는 S 단백질 항원 및 N 단백질 항원을 코딩할 수 있다. 일부 실시양태에서, 이종성 DNA 서열은 본원에 기술된 상이한 바이러스 항원 중 어느 하나를 코딩할 수 있다. 일부 실시양태에서, 세포질체는 이종성 DNA 서열을 바이러스 항원으로 전사 및 번역한다. 일부 실시양태에서, 세포질체는 이종성 DNA 서열을 표적 조직으로 전달하고, 여기서, 이종성 DNA 서열은 전사된 후, 이어서, 표적 조직에 의해 바이러스 항원으로 번역된다. 일부 실시양태에서, 이종성 폴리뉴클레오티드는 본원에 기술된 항원 중 어느 하나를 코딩하는 이종성 DNA 서열을 포함하는 플라스미드를 포함한다. 일부 실시양태에서, 세포질체는 SARS-CoV-2의 스파이크 단백질로부터 유래된 항원을 코딩하는 핵산을 포함하는 DNA 백신(GX-19)을 포함하는 SARS-CoV-2 백신을 포함한다.
일부 실시양태에서, 적어도 하나의 이종성 폴리뉴클레오티드는 서열 번호 4-7 중 어느 하나의 단편과 약 50%, 60%, 70%, 80%, 90%, 95%, 또는 99% 이상 동일하다. 일부 실시양태에서, 적어도 하나의 이종성 폴리뉴클레오티드는 서열 번호 4-7 중 어느 하나의 단편과 약 100% 동일하다. 일부 실시양태에서, 적어도 하나의 이종성 폴리뉴클레오티드는 서열 번호 8의 단편과 약 50%, 60%, 70%, 80%, 90%, 95%, 또는 99% 이상 동일한 바이러스 항원을 코딩한다. 일부 실시양태에서, 적어도 하나의 이종성 폴리뉴클레오티드는 서열 번호 8의 단편과 100% 동일한 바이러스 항원을 코딩한다. 일부 실시양태에서, 적어도 하나의 이종성 폴리뉴클레오티드는 서열 번호 9의 단편과 약 50%, 60%, 70%, 80%, 90%, 95%, 또는 99% 이상 동일한 바이러스 항원을 코딩한다. 일부 실시양태에서, 적어도 하나의 이종성 폴리뉴클레오티드는 서열 번호 9의 단편과 100% 동일한 바이러스 항원을 코딩한다. 일부 실시양태에서, 적어도 하나의 이종성 폴리뉴클레오티드는 서열 번호 10의 단편과 약 50%, 60%, 70%, 80%, 90%, 95%, 또는 99% 이상 동일한 바이러스 항원을 코딩한다. 일부 실시양태에서, 적어도 하나의 이종성 폴리뉴클레오티드는 서열 번호 10의 단편과 100% 동일한 바이러스 항원을 코딩한다. 일부 실시양태에서, 적어도 하나의 이종성 폴리뉴클레오티드는 서열 번호 11의 단편과 약 50%, 60%, 70%, 80%, 90%, 95%, 또는 99% 이상 동일한 바이러스 항원을 코딩한다. 일부 실시양태에서, 적어도 하나의 이종성 폴리뉴클레오티드는 서열 번호 11의 단편과 100% 동일한 바이러스 항원을 코딩한다.
일부 실시양태에서, 일부 실시양태에서, 이종성 폴리뉴클레오티드는 바이러스 항원을 코딩하는 이종성 RNA 서열을 포함한다. 일부 실시양태에서, 이종성 RNA 서열은 바이러스 항원을 코딩하는 mRNA 서열을 포함한다. 일부 실시양태에서, mRNA는 orf1a, orf1ab, 스파이크 단백질(S 단백질), 3a, 3b, 외피 단백질(E 단백질), 막 단백질(M 단백질), p6, 7a, 7b, 8b, 9b, 뉴클레오캡시드 단백질(N 단백질), orf14, nsp1(리더 단백질), nsp2, nsp3, nsp4, nsp5(3C 유사 프로테이나제), nsp6, nsp7, nsp8, nsp9, nsp10(성장 인자 유사 단백질), nsp12(RNA 의존성 RNA 폴리머라제, 또는 RdRp), nsp13(RNA 5'-트리포스파타제), nsp14(3'에서 5'로의 엑소뉴클레아제), nsp15 (endoRNAse), 및 nsp16(2'-O-리보스 메틸트랜스퍼라제) 중 어느 하나를 코딩한다. 일부 실시양태에서, 세포질체는 스파이크 단백질 또는 그의 단편을 코딩하는 mRNA를 포함한다. 일부 실시양태에서, 세포질체는 뉴클레오캡시드 단백질 또는 그의 단편을 코딩하는 mRNA를 포함한다. 일부 실시양태에서, 세포질체는 막 단백질 또는 그의 단편을 코딩하는 mRNA를 포함한다. 일부 실시양태에서, 세포질체는 외피 단백질 또는 그의 단편을 코딩하는 mRNA를 포함한다. 일부 실시양태에서, 이종성 폴리뉴클레오티드는 하나 이상의 mRNA를 포함할 수 있다. 일부 실시양태에서, mRNA 서열은 본원에 기술된 상이한 바이러스 항원 중 어느 하나를 코딩할 수 있다. 일부 실시양태에서, 세포질체는 mRNA를 바이러스 항원으로 번역한다. 일부 실시양태에서, 세포질체는 mRNA를 표적 조직으로 전달하고, 여기서, mRNA는 표적 조직에 의해 바이러스 항원으로 번역된다. 일부 실시양태에서, mRNA는 자가 증폭 mRNA(saRNA: self-amplifying mRNA)이다. 일부 실시양태에서, mRNA는 우리딘을 포함한다(uRNA). 일부 실시양태에서, 세포질체는 전장, 사전융합 안정화된 스파이크(S) 단백질을 코딩하는 mRNA(mRNA-1273)를 포함하는 SARS-CoV-2 백신을 포함한다. 일부 실시양태에서, 이종성 폴리뉴클레오티드는 본원에 기술된 항원 중 하나 이상의 것을 코딩하는 하나 이상의 이종성 RNA 서열을 포함한다. 일부 실시양태에서, 세포질체는 SARS-CoV-2의 단백질로부터 유래된 항원을 코딩하는 mRNA를 포함하는 SARS-CoV-2 백신(mRNA-LNP 백신)을 포함한다. mRNA는 캡슐화되어 지질 나노입자를 사용하여 전달된다.
일부 실시양태에서, 세포질체는 바이러스 항원을 코딩하는 적어도 하나의 이종성 폴리뉴클레오티드를 포함하는 DNA 또는 RNA 벡터를 포함한다. 일부 실시양태에서, DNA 또는 RNA 벡터는 플라스미드일 수 있다. 일부 실시양태에서, DNA 또는 RNA 벡터는 바이러스 벡터일 수 있다. 바이러스 벡터, 특히, 레트로바이러스 벡터는 본원에 기술된 바이러스 항원 중 어느 하나를 코딩하는 핵산 서열을 포함하도록 조작될 수 있고, 세포질체에 의해 표적 조직으로 전달될 수 있다. 일부 실시양태에서, 바이러스 벡터는 렌티바이러스, 폭스바이러스, 단순 헤르페스 바이러스 I, 아데노바이러스 및 아데노 관련 바이러스 등으로부터 유래될 수 있다. 예시적인 바이러스 벡터는 레트로바이러스 벡터, 아데노바이러스 벡터, 아데노 연관 바이러스 벡터(AAV), 복제 결핍 침팬지 아데노바이러스, ChAdOx1, 뉴캐슬병 바이러스 벡터, M2-결핍 단일 복제(M2SR: M2-deficient single replication) 인플루엔자 벡터, 폭스 벡터, 파보바이러스 벡터, 배큘로바이러스 벡터, 홍역 바이러스 벡터, 수포성 구내염 바이러스(VSV) 벡터 또는 단순 헤르페스 바이러스 벡터(HSV)를 포함한다. 일부 실시양태에서, 레트로바이러스 벡터는 감마 레트로바이러스 벡터, 예컨대, 몰로니 뮤린 백혈병 바이러스(MoMLV, MMLV, MuLV, 또는 MLV: Moloney Murine Leukemia Virus) 또는 뮤린 줄기 세포 바이러스(MSCV: Murine Steam cell Virus) 게놈으로부터 유래된 벡터를 포함한다. 일부 실시양태에서, 레트로바이러스 벡터는 또한 렌티바이러스 벡터, 예컨대, 인간 면역결핍 바이러스(HIV) 게놈으로부터 유래된 것을 포함한다. 일부 실시양태에서, AAV 벡터는 AAV1, AAV2, AAV4, AAV5, AAV6, AAV7, AAV8, 또는 AAV9 혈청형을 포함한다. 일부 실시양태에서, 바이러스 벡터는 2개 이상의 바이러스로부터의 바이러스 부분을 포함하는 키메라 바이러스 벡터이다. 추가 경우에, 바이러스 벡터는 재조합 바이러스 벡터이다. 일부 실시양태에서, 세포질체는 SARS-CoV-2의 S 단백질 또는 그의 단편을 코딩하는 핵산을 포함하는 SARS-CoV-2 백신(Gam-COVID-Vac 또는 Gam-COVID-Vac lyo) 비-복제 바이러스 벡터를 포함한다. 일부 실시양태에서, 세포질체는 SARS-CoV-2의 스파이크(S) 단백질 핵산 서열을 포함하는 아데노바이러스 벡터(Ad5-nCoV)를 포함하는 SARS-CoV-2 백신을 포함한다. 일부 실시양태에서, 세포질체는 SARS-CoV-2의 스파이크(S) 단백질을 발현하도록 조작된 복제 결핍 침팬지 아데노바이러스, ChAdOx1을 포함하는 SARS-CoV-2 백신을 포함한다. 일부 실시양태에서, 세포질체는 SARS-CoV-2의 단백질로부터 유래된 항원을 코딩하는 핵산을 포함하는 비복제성 아데노바이러스 벡터(AdVac)를 포함하는 SARS-CoV-2 백신을 포함한다. 일부 실시양태에서, AdVac 백신은 PER.C6 세포로 제조된다. 일부 실시양태에서, 세포질체는 인서트로서 스파이크(S) 단백질을 코딩하는 핵산과 함께 INO-4800 pGX DNA 플라스미드를 포함하는 SARS-CoV-2 백신을 포함한다. 일부 실시양태에서, 세포질체는 SARS-CoV-2(BNT162)의 스파이크(S) 단백질 또는 그의 단편을 발현하는 mRNA 또는 변형된 mRNA를 포함하는 SARS-CoV-2 백신을 포함한다. 일부 실시양태에서, 세포질체는 SARS-CoV-2의 스파이크 단백질 또는 그의 단편을 코딩하는 핵산을 포함하는 홍역 벡터를 포함하는 SARS-CoV-2 백신을 포함한다. 일부 실시양태에서, 세포질체는 주사 후 전기천공을 통해 피험체의 근육으로 전달된 스파이크 단백질을 코딩하는 DNA를 포함하는 SARS-CoV-2 백신을 포함한다.
c. 불활성화된 병원체 및 그의 일부
일부 실시양태에서, 세포질체는 불활성화된 병원체(예컨대, 바이러스, 박테리아, 기생충 또는 진균), 또는 그의 일부를 포함한다. 일부 실시양태에서, 불활성화된 병원체는 불활성화된 바이러스 또는 그의 일부이다. 일부 실시양태에서, 불활성화된 바이러스는 본원에 기술된 바이러스 중 어느 하나이다. 일부 실시양태에서, 불활성화된 바이러스는 코로나 바이러스, 한타바이러스, 에볼라바이러스, 인플루엔자 바이러스, 호흡기 세포융합 바이러스, 로타바이러스, 노로바이러스, 간염 바이러스, 또는 돼지 생식기 및 호흡기 증후군 바이러스로부터 유래된 것이다. 일부 실시양태에서, 불활성화된 바이러스는 코로나바이러스로부터 유래된 것이다. 일부 실시양태에서, 불활성화된 바이러스는 예컨대, SARS-CoV-2와 같은 베타코로나바이러스이다. 일부 실시양태에서, 불활성화된 바이러스는 불활성화된 SARS-CoV-2이다.
일부 실시양태에서, 세포질체는 불활성화된 SARS-CoV-2를 포함한다. 일부 실시양태에서, SARS-CoV-2는 Wuhan 균주에 대한 전장 아미노산 서열과 비교하여 Asp614Gly, Pro323Leu, Ile599Val, pro585Ser,Phe308Tyr, Thr141Ile, Asp248Glu, Thr85Ile, Ala18Val, Asn439Lys, Glu251Val, Pro10Ser, Ser194Leu, Ser197Leu, Gly196Val, Leu108Phe, Gln213Lys, Leu84Ser, Thr175Met, Ser563Leu, Val13Leu, Gln57His, 또는 Thr14Ile를 포함하는 돌연변이를 포함한다.
일부 실시양태에서, 불활성화된 SARS-CoV-2를 포함하는 세포질체는 불활성화된 SARS-CoV-2를 포함하는 세포질체가 피험체의 면역 세포에 의해 포식될 때, 피험체에서 SARS-CoV-2에 대한 면역 반응 및 적응 면역을 유도한다. 세포질체를 포식하면, 면역 세포는 불활성화된 SARS-CoV-2와 접촉한 후, SARS-CoV-2에 대한 적응 면역 반응을 발생시킨다. 일부 실시양태에서, 불활성화된 SARS-CoV-2 바이러스는 포르말린 불활성화된 SARS-CoV-2 바이러스이다. 일부 실시양태에서, 세포질체는 베로 세포 배양물로부터 수득된 포르말린 불활성화된 SARS-CoV-2 바이러스를 포함하는 SARS-CoV-2 백신(PiCoVacc)을 포함한다. 일부 실시양태에서, 세포질체는 바실리 칼메트 구에린(BCG: Bacille Calmette-Guerin)을 포함하는 SARS-CoV-2 백신을 포함한다. 일부 실시양태에서, 세포질체는 SARS0-CoV-2의 스파이크 단백질을 발현하도록 조작된 비피도박테리아를 포함하는 SARS-CoV-2 백신(bacTRL-스파이크)을 포함한다. 일부 실시양태에서, 세포질체는 미세바늘 어레이의 사용을 통해 SARS-CoV-2의 스파이크(S) 단백질 또는 그의 단편을 전달하는 것을 포함하는 SARS-CoV-2 백신(PittCoVacc)을 포함한다. 일부 실시양태에서, 세포질체는 SARS-CoV-2의 스파이크 단백질의 사전융합 형태를 포함하는 다중 재조합 나노입자 백신을 포함하는 SARS-CoV-2 백신(NVX-CoV2373)을 포함한다. 일부 실시양태에서, NVX-CoV2373을 포함하는 세포질체는 애주번트 또는 면역조정제를 포함한다. 일부 실시양태에서, 세포질체는 SARS-CoV-2의 바이러스 구조를 모방하는 바이러스 유사 입자(VLP: virus-like particle)를 포함하는 SARS-CoV-2 백신을 포함하며, 여기서, VLP는 식물 기반 제조산 방법으로부터 제조된다. 일부 실시양태에서, 세포질체는 SARS-CoV-2의 스파이크 단백질을 코딩하는 mRNA를 포함하는 SARS-CoV-2 백신(LUNAR-COV19)을 포함한다. mRNA는 캡슐화되고, 지질 매개 전달 시스템을 통해 전달된다. 일부 실시양태에서, 세포질체는 스파이크 단백질로부터 유래된 항원을 포함하는 SARS-CoV-2 백신을 포함하고, 상기 백신은 T 세포의 공동 자극제인 gp96 및 OX40L을 추가로 포함한다. 일부 실시양태에서, 세포질체는 SARS-CoV-2의 스파이크 단백질 또는 그의 단편을 코딩하는 핵산을 포함하는 복제 결핍 아데노바이러스 5(RD-Ad5) 벡터를 포함하는 SARS-CoV-2 백신(T-COVIDTM)을 포함하고, 여기서, T-COVIDTM 백신은 비강 전달용으로 제조된 것이다. 일부 실시양태에서, SARS-CoV-2 백신을 포함하는 세포질체는 임의의 적합한 경로, 예컨대, 피하, 정맥내, 동맥, 안구, 경구, 근육내, 비강내(예를 들어, 흡입), 복강내, 국소, 점막, 경막외, 설하, 경피, 양막외, 관절간, 진피내, 골내, 척추강내, 자궁내, 질내, 방광내, 유리체내, 혈관주위, 및/또는 직장 투여용으로, 또는 공지된 투여 방법의 임의 조합을 위해 제제화된다.
일부 실시양태에서, 불활성화된 바이러스는 필로바이러스(에볼라, 마버그) 및 아레나바이러스(라사, 마추포)를 비롯한, 바이러스성 출혈 열을 유발하는 바이러스로부터 유래된 것이다. 일부 실시양태에서, 불활성화 바이러스는 바이러스성 뇌염을 유발하는 바이러스(알파바이러스, 예컨대, 동부 말 뇌염, 베네수엘라 말 뇌염, 및 서부 말 뇌염)로부터 유래된 것이다. 일부 실시양태에서, 불활성화된 바이러스는 한타바이러스, 에볼라바이러스, 인플루엔자 바이러스, 호흡기 세포융합 바이러스, 로타바이러스, 노로바이러스, 간염 바이러스, 또는 돼지 생식기 및 호흡기 증후군 바이러스로부터 유래된 것이다.
일부 실시양태에서, 불활성화된 병원체는 불활성화된 박테리아, 또는 그의 일부이다. 일부 실시양태에서, 항원은 불활성화된 박테리아로부터 유래된 것이다.불활성화된 박테리아는 그람-양성 박테리아로부터 유래된 것일 수 있다. 일부 실시양태에서, 불활성화된 박테리아는 그람-음성 박테리아로부터 유래된 것일 수 있다. 일부 실시양태에서, 불활성화된 박테리아는 β-락타마제에 내성인 균주로부터 유래된 것일 수 있다. 일부 실시양태에서, 불활성화된 박테리아는 장독소생성 에스케리키아 콜라이(ETEC), 시가 독소 생성 에스케리키아 콜라이(STEC), 캄필로박터 제주니, 슈도모나스 아에루기노사, 아시네토박터 바우마니이, 스트렙토코쿠스 뮤탄스, 헬리코박터 파이로리, 또는 바실러스 안트라시스로부터 유래된 것일 수 있다. 일부 실시양태에서, 불활성화된 박테리아는 브루셀라병 박테리아(브루셀라 종), 클로스트리디움 페르프린겐스의 엡실론 독소로부터 유래된 것일 수 있다. 식품 안전 위협(살모넬라 종, 에스케리키아 콜라이 O157:H7, 시겔라), 마비저(Glander)(부르크홀데리아 말레이), 멜리오이도시스(Melioidosis)(부르크홀데리아 슈도말레이), 앵무병(Psittacosis)(클라미디아 시타시), Q 열(콕시엘라 번에티이), 리시누스 코무니스로부터의 리신 독소(피마자), 포도상구균 장독소 B, 발진티프스(Typhus fever)(리케차 프로와제키), 물 안전 위협(비브리오 콜레라에, 크립토스포리디움 파르붐), 탄저균(바실러스 안트라시스), 보툴리눔독소증(클로스트리디움 보툴리눔 독소), 역병(예르시니아 페스티스), 천연두(바리올라 마요르), 또는 야토병(프란시셀라 툴라렌시스)
2. 추가의 외인성 작용제
본 개시내용의 세포질체는 예컨대, 면역조정제와 같은 추가의 외인성 작용제를 발현하도록 조작될 수 있다. 일부 실시양태에서, 세포질체는 본원에 기술된 하나 이상의 면역조정제를 포함한다. 면역조정제는 피험체에서 면역 반응을 직접 또는 간접적으로 자극하는 분자일 수 있다. 일부 실시양태에서, 면역조정제는 피험체에서 적응 면역 반응을 유도하기 위한 면역 활성제일 수 있다. 일부 실시양태에서, 면역 활성제는 피험체, 예를 들어, 증식성 질환 또는 장애를 앓는 피험체에서 과민성 면역계를 억제하기 위한 면역 억제제일 수 있다. 일부 실시양태에서, 면역조정제는 세포질체의 표면 상에서 발현될 수 있다. 일부 실시양태에서, 면역조정제는 세포질체에 의해 방출될 수 있다. 일부 실시양태에서, 면역조정제는 세포질체에 의해 분비될 수 있다. 일부 실시양태에서, 면역조정제는 세포질체의 카르고일 수 있다. 일부 실시양태에서, 면역조정제는 본원에 기술된 항원과 융합된 펩티드 또는 단백질일 수 있다. 일부 실시양태에서, 면역조정제는 애주번트일 수 있다.
비제한적 예에서, 면역조정제는 면역 세포 표면 상의 동족 수용체에 결합함으로써 면역 반응을 직접 자극할 수 있으며, 이는 면역 세포가 사이토카인을 방출하도록 유발하여 면역 세포를 활성화시킨다. 일부 실시양태에서, 면역 세포의 활성화는 바이러스에 대한 적응 면역의 발생을 촉진시킨다. 또 다른 예로서, 면역조정제는 표적 세포에 의한 IL-10 생산 및 분비를 억제하고/거나, 조절 T 세포의 활성을 억제함으로써 면역 반응을 간접적으로 자극하여, 그 결과로, 예를 들어, 면역 세포에 의한 항종양 반응을 증가시킨다. 대조적으로, 면역 억제제로 작용하는 면역조정제는 피험체에서 면역 반응을 직접 또는 간접적으로 억제할 수 있다.
특정 실시양태에서, 면역조정제는 패턴 인식 수용체(PRR: pattern recognition receptor)를 표적화한다. 이들 수용체는 병원체와 같은 감염원에 대한 반응으로 면역계의 활성화를 프라이밍할 수 있는 막횡단 또는 엔도솜내 단백질일 수 있다. PRR은 병원체 연관 분자 패턴(PAMP: pathogen-associated molecular pattern) 분자 및 손상 관련 분자 패턴(DAMP: damage-associated molecular pattern) 분자를 인식할 수 있다. PRR은 막 결합 PRR일 수 있다. PRR은 세포질 PRR일 수 있다. 막 결합 PRR에는 톨 유사 수용체 및 만노스 수용체 및 아시알로당단백질 수용체와 같은 C형 렉틴 수용체를 포함한다. 세포질체 PRR은 NOD 유사 수용체 및 RIG-I 유사 수용체를 포함한다.
특정 실시양태에서, 면역조정제는 손상 관련 분자 패턴(DAMP) 분자 또는 병원체 연관 분자 패턴(PAMP) 분자, 예컨대, DAMP 효능제 또는 PAMP 효능제이다. DAMP 분자 및 PAMP 분자는 예컨대, 톨 유사 수용체(TLR: Toll-like receptor), Nod 유사 수용체, C형 렉틴 및 RIG-I 유사 수용체와 같은 선천성 면역계의 수용체에 의해 인식될 수 있다. 특정 실시양태에서, 면역조정제는 톨 유사 수용체 효능제, STING 효능제 또는 RIG-I 효능제이다. DAMP 분자의 예로는 예컨대, 염색질 관련 단백질 고이동성 그룹 박스 1(HMGB1: high-mobility 군 box 1)와 같은 단백질, 히알루로난 단편과 같은 단백질 및 글리칸의 칼슘 조절 패밀리의 S100 분자, 및 글리칸 접합체를 포함할 수 있다. DAMP 분자는 아폽토시스 또는 괴사 후 종양 세포에서 방출될 때 DNA와 같은 핵산일 수도 있다. 추가 DAMP 핵산의 예로는 핵 또는 미토콘드리아 외부에 존재하는 ATP, 아데노신 및 요산과 같은 RNA 및 퓨린 대사산물을 포함할 수 있다.
일부 실시양태에서, 면역조정제는 세포질 DNA 센서로 작용할 수 있는 인터페론 조절 인자(IRF: Interferon Regulatory Factor) 또는 인터페론 유전자의 자극제(STING: stimulator of interferon gene)에 의해 인식되는 사이클릭 디뉴클레오티드로 불리는 세포질 DNA 및 박테리아 핵산이다. 인터페론 조절 인자(IRF)에 의해 인식되는 화합물은 TLR 및 다른 패턴 인식 수용체에 의한 면역조정에 역할을 할 수 있다.
면역조정제는 톨 유사 수용체(TLR) 효능제일 수 있다. 면역조정제는 RIG-I 유사 수용체 리간드일 수 있다. 면역조정제는 C형 렉틴 수용체 리간드일 수 있다. 면역조정제는 NOD 유사 수용체 리간드일 수 있다.
일부 실시양태에서, 면역조정제는 TLR 효능제. 일부 실시양태에서, 면역조정제는 동물 종에 따라 TLR1, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9, TLR10, TLR11, TLR12 또는 TLR13 효능제로 구성된 군으로부터 선택된다.
일부 실시양태에서, 면역조정제 활성제는 (a) 열 사멸 박테리아 생성물, 바람직하게, HKAL, HKEB, HKHP, HKLM, HKLP, HKLR, HKMF, HKPA, HKPG, 또는 HKSA, HKSP, 및 (b) 세포벽 성분 생성물, 바람직하게, LAM, LM, LPS, LIA, LIA, PGN, FSL, Pam2CSK4, Pam3CSK4, 또는 지모산(Zymosan)을 포함하는 TLR2의 리간드이다.
일부 실시양태에서, 면역조정제는 린타톨리모드, 폴리-ICLC, RIBOXXON®, Apoxxim, RIBOXXIM®, IPH-33, MCT-465, MCT-475, 및 ND-1.1로 구성된 군으로부터 선택되는 TLR3의 리간드이다.
일부 실시양태에서, 면역조정제는 LPS, MPLA 또는 피리미도[5,4-b]인돌, 예컨대, WO 2014/052828에 기술된 것(캘리포니아 대학교(U of Cal))에 기술된 것, AZ126(N-(2-(사이클로펜틸아미노)-2-옥소-1-(피리딘-4-일)에틸)-N-(4-메톡시페닐)-3-메틸-5-페닐-1H-피롤-2-카복사미드) 또는 AZ368((E)-3-(4-(2-(사이클로펜틸아미노)-1-(N-(4-이소프로필페닐)-1,5-디페닐-1H-피라졸-3-카복사미도)-2-옥소에틸)페닐)아크릴산)로 구성된 군으로부터 선택되는 TLR4의 리간드이다.
일부 실시양태에서, 면역조정제는 FLA 및 플라젤린(Flagellin)으로 구성된 군으로부터 선택되는 TLR5의 리간드이다. 일부 실시양태에서, 면역조정제는 TLR6의 리간드이다. 특정 실시양태에서, 면역조정제는 TLR7 효능제 및/또는 TLR8 효능제이다. 특정 실시양태에서, 면역조정제는 TLR7 효능제이다. 특정 실시양태에서, 면역조정제는 TLR8 효능제이다. 일부 실시양태에서, 면역조정제는 TLR8이 아닌, TLR7에 대해 선택적으로 효능작용한다. 다른 실시양태에서, 면역자극제는 TLR7이 아닌, TLR8에 대해 효능작용한다.
특정 실시양태에서, 면역조정제는 TLR7 효능제이다. 특정 실시양태에서, TLR7 효능제는 이미다조퀴놀린, 이미다조퀴놀린 아민, 티아조퀴놀린, 아미노퀴놀린, 아미노퀴나졸린, 피리도 [3,2-d]피리미딘-2,4-디아민, 피리미딘-2,4-디아민, 2-아미노이미다졸, 1-알킬-1H-벤즈이미다졸-2-아민, 테트라하이드로피리도피리미딘, 헤테로아로티아디아지드-2,2-디옥시드, 벤조나프티리딘, 구아노신 유사체, 아데노신 유사체, 티미딘 동종중합체, ssRNA, CpG-A, 폴리G10, 및 폴리G3으로부터 선택된다. 특정 실시양태에서, TLR7 효능제는 이미다조퀴놀린, 이미다조퀴놀린 아민, 티아조퀴놀린, 아미노퀴놀린, 아미노퀴나졸린, 피리도 [3,2-d]피리미딘-2,4-디아민, 피리미딘-2,4-디아민, 2-아미노이미다졸, 1-알킬-1H-벤즈이미다졸-2-아민, 테트라하이드로피리도피리미딘, 헤테로아로티아디아지드-2,2-디옥시드 또는 벤조나프티리딘으로부터 선택되되, 구아노신 유사체, 아데노신 유사체, 티미딘 동종중합체, ssRNA, CpG-A, 폴리G10, 및 폴리G3 이외의 것이다. 일부 실시양태에서, TLR7 효능제는 비자연적으로 발생된 화합물이다. TLR7 조정제의 예로는 GS-9620, GSK-2245035, 이미퀴모드, 레시퀴모드, DSR-6434, DSP-3025, IMO-4200, MCT-465, MEDI-9197, 3M-051, SB-9922, 3M-052, Limtop, TMX-30X, TMX-202, RG-7863, RG-7795, 및 US20160168164(Janssen), US 20150299194(Roche), US20110098248(Gilead Sciences), US20100143301(Gilead Sciences), 및 US20090047249(Gilead Sciences)에 개시된 화합물을 포함한다. 일부 실시양태에서, TNF알파 또는 IFN알파 생산을 측정하는 PBMC 검정법에 의하면, TLR7 효능제의 EC50 값은 500 nM 이하이다. 일부 실시양태에서, TNF알파 또는 IFN알파 생산을 측정하는 PBMC 검정법에 의하면, TLR7 효능제의 EC50 값은 100 nM 이하이다. 일부 실시양태에서, TNF알파 또는 IFN알파 생산을 측정하는 PBMC 검정법에 의하면, TLR7 효능제의 EC50 값은 50 nM 이하이다. 일부 실시양태에서, TNF알파 또는 IFN알파 생산을 측정하는 PBMC 검정법에 의하면, TLR7 효능제의 EC50 값은 10 nM 이하이다.
특정 실시양태에서, 면역조정제는 TLR8 효능제이다. 특정 실시양태에서, TLR8 효능제는 벤자제핀, 이미다조퀴놀린, 티아졸로퀴놀린, 아미노퀴놀린, 아미노퀴나졸린, 피리도 [3,2-d]피리미딘-2,4-디아민, 피리미딘-2,4-디아민, 2-아미노이미다졸, 1-알킬-1H-벤즈이미다졸-2-아민, 테트라하이드로피리도피리미딘 또는 ssRNA로 구성된 군으로부터 선택된다. 특정 실시양태에서, TLR8 효능제는 벤자제핀, 이미다조퀴놀린, 티아졸로퀴놀린, 아미노퀴놀린, 아미노퀴나졸린, 피리도 [3,2-d]피리미딘-2,4-디아민, 피리미딘-2,4-디아민, 2-아미노이미다졸, 1-알킬-1H-벤즈이미다졸-2-아민, 테트라하이드로피리도피리미딘으로 구성된 군으로부터 선택되고, ssRNA 이외의 것이다. 일부 실시양태에서, 면역조정제는 자연적으로 발생된 TLR8 효능제 또는 벤자제핀 TLR8의 효능제 이외의 TLR8 효능제.
한 실시양태에서, 본원에 기술된 세포질체는 면역 세포의 완전한 활성화에 중요한 비항원 특이적 신호인 공동 자극성 리간드를 포함하는 적어도 하나의 면역조정제를 발현 및/또는 분비할 수 있다. 공동 자극성 리간드는 제한 없이, 종양 괴사 인자(TNF) 리간드, 사이토카인(예컨대, IL-2, IL-12, 1L-15 또는 IL21) 및 면역글로불린(Ig) 슈퍼패밀리 리간드를 포함한다. 종양 괴사 인자(TNF)는 전신 염증에 관여하는 사이토카인이며, 급성기 반응을 자극한다. 그의 주요 역할은 면역 세포의 조절이다. 종양 괴사 인자(TNF) 리간드는 여러 가지 공통된 특징을 공유한다. 리간드 대부분은 짧은 세포질 세그먼트 및 비교적 긴 세포외 영역을 포함하는 II형 막횡단 단백질로서 합성된다. TNF 리간드는 제한 없이, 신경 성장 인자(NGF: nerve growth factor), CD40L(CD40L)/CD154, CD137L/4-1BBL, 종양 괴사 인자 알파(TNFa), CD134L/OX4OL/CD252, CD27L/CD70, Fas 리간드(FasL), CD3OL/CD153, 종양 괴사 인자 f3(TNF(3)/림프독소-알파(LTa), 림프독소-베타(ur(3), CD257/B 세포 활성화 인자(BAFF)/Blys/THANK/Ta11-1, 글루코코르티코이드 유도 TNF 수용체 리간드(GITRL: glucocorticoid-induced TNF Receptor ligand), 및 TNF 관련 아폽토시스 유도 리간드(TRAIL: TNF related apoptosis-inducing ligand), LIGHT(TNFSF14)를 포함한다. 면역글로불린(Ig) 슈퍼패밀리는 세포의 인지, 결합, 또는 부착 프로세스에 관여하는 세포 표면 및 가용성 단백질의 큰 그룹이다. 이러한 단백질은 면역글로불린과 구조적 특징을 공유하며 면역글로불린 도메인(폴드)을 보유한다. 면역글로불린 슈퍼패밀리 리간드는 제한 없이, CD80 및 CD86, CD28에 대한 두 리간드 모두를 포함한다.
일부 실시양태에서, 면역조정제는 애주번트일 수 있다. 일부 실시양태에서, 애주번트는 진통제 애주번트를 포함할 수 있다. 일부 실시양태에서, 애주번트는 알룸, 수산화알루미늄, 인산알루미늄, 또는 수산화인산칼슘과 같은 무기 화합물을 포함할 수 있다. 일부 실시양태에서, 애주번트는 광유 또는 파라핀 오일을 포함할 수 있다. 일부 실시양태에서, 애주번트는 박테리아 생성물, 예컨대, 불활성화된 보르데텔라 페르투시스(Bordetella pertussis), 마이코박테리움 보비스(Mycobacterium bovis), 토르 옥시드를 포함할 수 있다. 일부 실시양태에서, 애주번트는 스쿠알렌과 같은 비박테리아 유기물을 포함할 수 있다. 일부 실시양태에서, 애주번트는 예컨대, 세제(Quil A)와 같은 전달 시스템의 사용을 포함할 수 있다. 일부 실시양태에서, 애주번트는 퀼라자(Quillaja), 대두, 또는 폴리갈라 세네가(Polygala senega)로부터 유래된 사포닌과 같은 식물 사포닌을 포함할 수 있다. 일부 실시양태에서, 애주번트는 프로인트 완전 애주번트 또는 프로인트 불완전 애주번트를 포함할 수 있다. 일부 실시양태에서, 애주번트는 땅콩유와 같은 식품 기반 오일을 포함할 수 있다.
일부 실시양태에서, 세포질체는 본원에 기술된 항바이러스 조성물과 같은 하나 이상의 추가 치료제를 포함한다. 일부 실시양태에서, 하나 이상의 추가 치료제는 치료 DNA 분자, 치료 RNA 분자, 치료 단백질(예컨대, 효소, 항체, 항원, 독소, 사이토카인, 단백질 호르몬, 성장 인자, 세포 표면 수용체 또는 백신), 치료 펩티드(예컨대, 펩티드 호르몬 또는 항원), 소분자 활성제(예컨대, 스테로이드, 폴리케티드, 알칼로이드, 독소, 항생제, 항바이러스제, 콜히친, 탁솔, 미토마이신 또는 엠탄신) 및 치료 유전자 편집 인자 중 어느 하나 또는 그의 임의의 조합일 수 있다.
D. 약학적 조성물, 제제, 투여량, 및 투여 경로
본원에서는 세포질체(예컨대, 본원에 기술된 임의의 세포로부터 수득된 세포질체)을 포함하는 약학적 조성물을 제공한다. 일부 실시양태에서, 조성물은 상이한 투여 경로(예컨대, 정맥내, 피하, 근육내, 안와후, 복강내, 림프절내)를 위해 제제화된다. 일부 실시양태에서, 조성물은 약학적으로 허용되는 담체(예컨대, 포스페이트 완충처리된 염수)를 포함할 수 있다. 용어 "약학적 조성물"은 희석제 또는 담체와 같은 다른 화학 성분과 본원에 개시된 세포질체의 혼합물을 지칭한다. 약학적 조성물은 유기체에의 화합물의 투여를 용이하게 할 수 있다.
일반적으로, 본원에 개시된 방법은 전신 투여에 의해 세포질체 조성물을 투여하는 것을 포함한다. 일부 실시양태에서, 방법은 경구 투여에 의해 세포질체 조성물을 투여하는 것을 포함한다. 일부 실시양태에서, 방법은 복강내 주사에 의해 세포질체 조성물을 투여하는 것을 포함한다. 일부 실시양태에서, 방법은 항문 좌제의 형태로 세포질체 조성물을 투여하는 것을 포함한다. 일부 실시양태에서, 방법은 정맥내("i.v.") 투여에 의해 세포질체 조성물을 투여하는 것을 포함한다. 피하 주사, 근육내 주사, 진피내 주사, 경피 주사, 경피 투여, 비내 투여, 림프내 주사, 직장 투여, 위내 투여, 안내 투여, 뇌실내 투여, 경막내로, 또는 임의의 다른 적합한 비경구 투여와 같은 다른 경로에 의해 본원에 개시된 세포질체 조성물을 투여할 수도 있다고 생각할 수 있다. 일부 실시양태에서, 손상 또는 염증 부위에 더 가까운 국소 전달을 위한 경로가 전신 경로보다 바람직하다. 치료제의 투여 경로, 투여량, 시점 및 기간이 조정될 수 있다. 일부 실시양태에서, 치료제의 투여는 병원체 연관된 질환 또는 병태의 급성 및 만성 증상 중 하나 또는 둘 모두의 발병 전 또는 후이다.
본원에 개시된 질환 또는 병태를 예방하거나, 또는 치료하기 위한 본원에 개시된 세포질체의 유효 용량 및 투여량은 질환 또는 병태, 또는 질환 또는 병태의 증상과 관련된 관찰된 유익한 반응에 의해 정의된다. 유익한 반응은 질환 또는 병태, 또는 질환 또는 병태의 증상을 예방, 완화, 정지 또는 치료하는 것을 포함한다. 일부 실시양태에서, 유익한 반응은 피험체에서 바이오마커, 전사체 위험 프로파일, 또는 장내 마이크로바이옴의 존재, 수준 또는 활성의 측정가능한 개선을 검출함으로써 측정될 수 있다. 본원에 사용된 "개선"은 상기 존재, 수준 또는 활성이 정상 개체(예컨대, 질환 또는 병태를 앓지 않는 개체)에서 관찰되는 존재, 수준 또는 활성으로 이동하는 것을 지칭한다. 세포질체 조성물이 치료적으로 효과적이지 않거나, 질환 또는 병태, 또는 질환 또는 병태의 증상의 충분한 완화를 제공하지 않는 경우, 투여량 및/또는 투여 경로가 변경될 수 있거나, 추가 작용제가 세포질체 조성물과 함께 피험체에게 투여될 수 있다. 일부 실시양태에서, 환자가 세포질체 조성물의 요법을 시작함에 따라, 환자는 또한 제2 치료 요법을 중단한다(예컨대, 용량의 단계적 감소).
일부 실시양태에서, 본원에서는 본원에 기술된 세포질체 조성물의 전달에 적합한 약학적으로 허용되는 부형제 및 담체 용액의 제제 뿐만 아니라, 다양한 치료 요법에서 본원에 기술된 특정 조성물을 사용하기 위한 적합한 투약 및 치료 요법을 개시한다. 일부 실시양태에서, 각각의 치료적으로 유용한 조성물에서 제조될 수 있는 치료 유전자 발현 생성물의 양은 화합물의 임의의 주어진 단위 용량에서 적합한 투여량이 수득되는 방식이다. 예컨대, 용해도, 생체이용성, 생물학적 반감기, 투여 경로, 제품 저장 수명 뿐만 아니라, 다른 약리학적 고려사항과 같은 인자는 이러한 약학적 제제를 제조하는 기술분야의 숙련가에 의해 고려될 것이며, 그 자체로 다양한 투여량 및 치료 요법이 바람직할 수 있다. 일부 실시양태에서, 세포질체 조성물은 안내, 유리체내, 비경구, 피하, 정맥내, 뇌실내, 근육내, 경막내, 경구, 복강내, 경구 또는 비강 흡입에 의해, 또는 하나 이상의 세포, 조직 또는 기관에 직접 주사에 의해 전달되는 본원에 개시된 약학적 조성물로 적합하게 제제화된다.
일부 실시양태에서, 주사가능한 용도에 적합한 세포질체 조성물의 약학적 형태는 멸균 수용액 또는 분산액, 및 멸균 주사 용액 또는 분산액의 즉석 제조를 위한 멸균 분말을 포함한다. 담체는 예를 들어, 물, 에탄올, 폴리올(예컨대, 글리세롤, 프로필렌 글리콜, 및 액체 폴리에틸렌 글리콜 등), 그의 적합한 혼합물, 및/또는 식물성 오일을 함유하는 용매 또는 분산 매질일 수 있다. 적절한 유동성은 예를 들어, 레시틴과 같은 코팅의 사용, 분산액인 경우, 필요한 입자 크기의 유지 및 계면활성제의 사용에 의해 유지될 수 있다. 미생물 작용의 방지는 다양한 항박테리아제 및 항진균제, 예를 들어, 파라벤, 클로로부탄올, 페놀, 소르브산, 티메로살 등에 의해 이루어질 수 있다. 많은 경우에, 등장제, 예를 들어, 당 또는 염화나트륨을 포함하는 것이 바람직할 것이다. 주사가능한 조성물의 연장된 흡수는 흡수를 지연시키는 작용제, 예를 들어, 알루미늄 모노스테아레이트 및 젤라틴의 조성물에서의 사용에 의해 야기될 수 있다.
일부 실시양태에서, 주사 가능한 수용액의 투여를 위해, 예를 들어, 용액은 필요하다면 적절하게 완충처리될 수 있고, 액체 희석제는 먼저 충분한 염수 또는 당과 등장성이 된다. 이러한 특정 수용액은 정맥내, 근육내, 피하 및 복강내 투여에 특히 적합하다. 투여량의 약간의 변화는 치료받는 피험체의 상태에 따라 필연적으로 이루어질 것이다. 투여 담당자는 어떤 경우에도 개별 피험체에 대한 적절한 용량을 결정할 것이다. 더욱이, 인간 투여의 경우, 제제는 FDA 생물의약품 표준 사무국에서 요구하는 무균, 발열성 및 일반 안전 및 순도 표준을 충족하여야 한다.
다른 약학적 조성물은 임의적으로 미생물 활성을 억제하기 위해 하나 이상의 보존제를 포함한다. 적합한 보존제로는 메르펜 및 티오메르살과 같은 수은 함유 물질; 안정화된 이산화염소; 염화벤즈알코늄, 브롬화세틸트리메틸암모늄, 염화세틸피리디늄 등의 4급 암모늄 화합물 등을 포함한다.
한 실시양태에서, 본원에 기술된 수성 현탁액 및 분산액은 적어도 4시간 동안 균질한 상태로 유지된다. 한 실시양태에서, 수성 현탁액은 1분 미만 동안 지속되는 물리적 교반에 의해 균질한 현탁액으로 재현탁된다. 또 다른 실시양태에서, 균질한 수성 분산액을 유지하기 위해 교반이 필요하지 않다.
비강 투여용 에어로졸 제제는 일반적으로 점적제 또는 스프레이로 비강에 투여되도록 디자인된 수성 액제이다. 비강용 액제는 일반적으로 등장성이고, 약 5.5 내지 약 6.5의 pH를 유지하기 위해 약간 완충처리된다는 점에서 비강 분비물과 유사할 수 있지만, 이 범위 밖의 pH 값이 추가로 사용될 수 있다. 항미생물제 또는 보존제 또한 제제에 포함될 수 있다.
흡입제 및 흡입제용 에어로졸 제제는 비강 또는 구강 호흡 경로에 의해 투여될 때 작용제 또는 작용제의 조합이 피험체의 호흡기계로 운반되도록 디자인될 수 있다. 흡입용 액제는 예를 들어, 분무기에 의해 투여될 수 있다. 미세 분말 또는 액체 약물을 포함하는 흡입 또는 취입은 예를 들어, 분배를 돕기 위해 추진제 내의 제제 또는 제제 조합의 용액 또는 현탁액의 약학적 에어로졸로서 호흡계에 전달될 수 있다. 추진제는 할로겐화탄소, 예를 들어, 플루오르화 염소화 탄화수소, 하이드로클로로플루오로카본 및 하이드로클로로카본과 같은 플루오로카본 뿐만 아니라, 탄화수소 및 탄화수소 에테르를 포함하는 액화 가스일 수 있다.
할로카본 추진제는 모든 수소가 불소로 대체된 플루오로카본 추진제, 모든 수소가 염소 및 적어도 하나의 불소로 대체된 클로로플루오로카본 추진제, 및 수소 함유 플루오로카본 추진제, 및 수소 함유 클로로플루오로카본 추진제를 포함할 수 있다. 유용한 탄화수소 추진제는 예를 들어, 프로판, 이소부탄, n-부탄, 펜탄, 이소펜탄 및 네오펜탄을 포함한다. 탄화수소 혼화물도 추진제로 사용할 수 있다. 에테르 추진제는 예를 들어, 디메틸 에테르 및 에테르를 포함한다. 에어로졸 제제는 또한 1 초과의 추진제를 포함할 수 있다. 예를 들어, 에어로졸 제제는 2개 이상의 플루오로카본과 같은 동일한 부류의 1개 초과의 추진제; 또는 1 초과, 2 초과, 3 초과의 상이한 부류의 추진제, 예컨대, 플루오로탄화수소 및 탄화수소를 포함할 수 있다. 본 개시내용의 약학적 조성물은 또한 압축 기체, 예컨대, 이산화탄소, 아산화질소 또는 질소와 같은 불활성 기체와 함께 분배될 수 있다.
에어로졸 제제는 또한 다른 성분, 예를 들어, 에탄올, 이소프로판올, 프로필렌 글리콜 뿐만 아니라, 계면활성제 또는 다른 성분, 예컨대, 오일 및 세제를 포함할 수 있다. 이러한 성분은 제제를 안정화하고/거나, 밸브 성분을 윤활하는 역할을 할 수 있다.
에어로졸 제제는 압력하에 포장될 수 있고, 액제, 현탁제, 에멀젼, 분말 및 반고체 제제를 사용하여 에어로졸로서 제제화될 수 있다. 예를 들어, 용액 에어로졸 제제는 (실질적으로) 순수한 추진제 또는 추진제와 용매의 혼합물로서 수송체, 담체 또는 이온 채널 억제제와 같은 제제의 용액을 포함할 수 있다. 용매는 작용제를 용해하고/거나, 추진제의 증발을 지연시키는 데 사용될 수 있다. 용매는 예를 들어, 물, 에탄올 및 글리콜을 포함할 수 있다. 적절한 용매의 임의의 조합이 사용될 수 있으며, 임의적으로, 보존제, 항산화제 및/또는 다른 에어로졸 성분과 조합될 수 있다.
에어로졸 제제는 분산제 또는 현탁제일 수 있다. 현탁 에어로졸 제제는 작용제 또는 작용제의 조합, 예를 들어, 수송체, 담체 또는 이온 채널 억제제, 및 분산화제의 현탁액을 포함할 수 있다. 분산화제는 예를 들어, 소르비탄 트리올레에이트, 올레일 알콜, 올레산, 레시틴 및 옥수수유를 포함할 수 있다. 현탁 에어로졸 제제는 또한 활택제, 보존제, 항산화제, 및/또는 다른 에어로졸 성분을 포함할 수 있다.
에어로졸 제제는 유사하게 에멀젼으로 제제화될 수 있다. 에멀젼 에어로졸 제제는 예를 들어, 에탄올과 같은 알콜, 계면활성제, 물 및 추진제 뿐만 아니라, 작용제 또는 작용제의 조합, 예를 들어, 수송체, 담체 또는 이온 채널을 포함할 수 있다. 사용된 계면활성제는 비이온성, 음이온성 또는 양이온성일 수 있다. 에멀젼 에어로졸 제제의 한 예는 예를 들어, 에탄올, 계면활성제, 물 및 추진제를 포함한다. 에멀젼 에어로졸 제제의 또 다른 예는 예를 들어, 식물성 오일, 글리세릴 모노스테아레이트 및 프로판을 포함한다.
본원에서는 세포질체 조성물을 포함하는 멸균 주사액으로서, 필요에 따라 상기 열거된 수개의 다른 성분과 함께 본원에 개시된 세포질체 조성물을 적절한 용매에 필요한 양으로 혼입한 후, 여과 멸균함으로써 제조된 멸균 주사액을 개시한다. 일반적으로, 분산제는 기본 분산 매질 및 상기 열거된 것들로부터 필요한 다른 성분을 함유하는 멸균 비히클에 다양한 멸균된 활성 성분을 혼입함으로써 제조된다. 멸균 주사액의 제조를 위한 멸균 분말의 경우, 바람직한 제조 방법은 사전 멸균 여과된 용액으로부터 활성 성분과 임의의 추가의 원하는 성분의 분말을 생성하는 진공 건조 및 동결 건조 기술이다.
일부 실시양태에서, 본원에 개시된 조성물은 또한 중성 또는 염 형태로 제제화될 수 있다. 약학적으로 허용되는 염에는 산 부가염(단백질의 유리 아미노 기로 형성)이 포함되며, 이는 예를 들어, 염산 또는 인산과 같은 무기산, 또는 아세트산, 옥살산, 타르타르산, 만델산 등과 같은 유기산으로 형성된다. 유리 카복실 기로 형성된 염은 또한 예를 들어, 수산화나트륨, 수산화칼륨, 수산화암모늄, 수산화칼슘 또는 수산화제2철과 같은 무기 염기, 및 이소프로필아민, 트리메틸아민, 히스티딘, 프로카인 등과 같은 유기 염기로부터 유도될 수 있다. 제제화시, 액제는 투여 제제와 양립가능한 방식으로 치료적으로 효과적인 양으로 투여될 것이다. 제제는 예컨대, 주사제, 약물 방출 캡슐 등과 같은 다양한 제형으로 용이하게 투여된다.
피험체에게 투여되는 적절한 용량 및 투여량은 특정 세포질체 조성, 질환 상태 및 그의 중증도, 치료를 필요로 하는 피험체의 아이덴티티(예컨대, 체중, 성별, 연령)를 포함하나, 이에 제한되지 않는 인자에 의해 결정되고, 예를 들어, 투여되는 특정 작용제, 투여 경로, 치료되는 병태, 및 치료되는 피험체 또는 숙주를 포함하는 사례를 둘러싼 특정 상황에 따라 결정될 수 있다.
세포질체 조성물의 양 및 이러한 조성물의 투여 시간은 본 교시의 이점을 갖는 숙련된 기술자의 범위 내에 있을 것이다. 그러나, 개시된 조성물의 치료적 유효량의 투여는 단일 투여, 예를 들어, 그러한 치료를 받는 환자에게 치료적 이점을 제공하기에 충분한 수의 세포질체의 단일 주사에 의해 달성될 수 있을 가능성이 있다.
대안적으로, 일부 상황에서, 세포질체 조성물의 투여를 감독하는 개업의에 의해 결정될 수 있는 바와 같이, 비교적 단기간 또는 비교적 장기간에 걸쳐 세포질체 조성물의 다중 또는 연속 투여를 제공하는 것이 바람직할 수 있다. 예를 들어, 포유동물에게 투여되는 세포질체의 수는 약 107, 108, 109, 1010, 1011, 1012, 1013개 이상일 수 있으며, 치료되는 특정 질환 또는 장애 요법을 달성하는 데 필요할 수 있는 바, 단일 용량으로 제공되거나, 2회 이상의 투여분으로 분할될 수 있다. 사실상, 특정 실시양태에서, 2개 이상의 상이한 세포질체 조성물을 단독으로 또는 하나 이상의 다른 치료 약물과 조합하여 투여하여 특정 치료 요법의 원하는 효과를 달성하는 것이 바람직할 수 있다. 다양한 실시양태에서, 1일 및 단위 투여량은 사용된 세포질체 조성물의 활성, 치료하고자 하는 질환 또는 병태, 투여 모드, 개별 피험체의 요건, 치료되는 질환 또는 병태의 중증도, 및 의사의 판단을 포함하나, 이에 제한되지 않는 다수의 변수에 따라 변경된다.
일부 실시양태에서, 세포질체 조성물 투여는 매시간, 매 2시간, 3시간, 4시간, 5시간, 6시간,7시간, 8시간, 9시간, 10시간, 11시간, 12시간, 13시간, 14시간, 15시간, 16시간, 17시간, 18시간, 19시간, 20시간, 21시간 22시간, 23시간, 1일, 2일, 3일, 4일, 5일, 6일, 7일, 8일, 9일, 10일, 11일, 12일, 13일, 14일, 15일, 1개월, 2개월, 3개월, 4개월, 5개월, 6개월, 7개월, 8개월, 9개월, 10개월, 11개월, 1년, 2년, 3년, 4년, 또는 5년, 또는 10년마다 1회 이루어진다. 유효 투여량 범위는 치료에 대한 피험체의 반응에 따라 조정될 수 있다. 일부 투여 경로는 다른 경로보다 더 높은 농도의 유효량의 치료제를 필요로 할 것이다.
본 개시내용의 이점을 고려할 때 예상되지는 않았지만, 환자의 병태가 개선되지 않는 특정 실시양태에서, 의사의 재량에 따라 세포질체 조성물의 투여는 환자의 질환 또는 병태의 증상을 호전시키거나, 또는 다르게는 제어 또는 제한하기 위해 만성적으로, 즉, 환자의 일생 동안, 그러한 시간을 비롯한 장기간 동안 투여된다. 환자의 병태가 개선되는 특정 실시양태에서, 투여되는 세포질체 조성물의 용량은 특정 기간(즉, "휴약기") 동안 일시적으로 감소되거나 일시적으로 중단될 수 있다. 구체적인 실시양태에서, 휴약기의 길이는 2일 내지 1년이며, 단지 예로서, 2일, 3일, 4일, 5일, 6일, 7일, 10일, 12일, 15일, 20일, 28일 또는 28일 초과를 포함한다. 휴약기 동안의 용량 감소는 단지 예로서, 오직 예로서만 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 및 100%를 비롯한, 10%-100%만큼 이루어진다. 특정 실시양태에서, 투여되는 약물의 용량은 특정 기간 동안 일시적으로 감소되거나, 일시적으로 중단될 수 있다(즉, "약물 전환"). 구체적인 실시양태에서, 약물 전환 기간은 2일 내지 1년으로, 단지 예로서, 2일, 3일, 4일, 5일, 6일, 7일, 10일, 12일, 15일, 20일, 228일 초과를 포함한다. 약물 전환 동안의 용량 감소는 단지 예로서, 오직 예로서만 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 및 100%를 비롯한, 10%-100%만큼 이루어진다. 적합한 시간이 경과한 후, 정상적인 투약 스케줄로 임의적으로 복귀하게 된다.
일부 실시양태에서, 환자의 병태가 개선되고 나면, 필요한 경우 유지 용량이 투여된다. 후속적으로, 구체적인 실시양태에서, 투여량 또는 투여 빈도, 또는 둘 모두는 증상의 함수로서 개선된 질환, 장애 또는 병태가 유지되는 수준으로 감소된다. 그러나, 특정 실시양태에서, 환자는 증상의 임의의 재발에 따라 장기간에 걸친 간헐적 치료를 필요로 한다.
상기 치료 요법의 독성 및 치료 효능은 LD50 및 ED50의 결정을 포함하나, 이에 제한되지 않는 세포 배양 또는 실험 동물에서의 표준 약학적 절차에 의해 결정된다. 독성 효과와 치료 효과 사이의 용량비는 치료 지수이며, LD50과 ED50 사이의 비로 표시된다. 특정 실시양태에서, 세포 배양 검정 및 동물 연구로부터 수득된 데이터는 인간을 비롯한 포유동물에서 사용하기 위한 치료 유효 1일 투여량 범위 및/또는 치료 유효 단위 투여량을 제제화하는 데 사용된다. 일부 실시양태에서, 본원에 기술된 세포질체 조성물의 투여량은 최소 독성을 갖는 ED50을 포함하는 순환 농도 범위 내에 있다. 특정 실시양태에서, 1일 투여량 범위 및/또는 단위 투여량은 사용된 투여 형태 및 사용된 투여 경로에 따라 이 범위 내에서 달라진다.
C. 병원체 포획 세포질체
일부 실시양태에서, 본원에서는 병원체가 세포질체를 감염시키고, 병원체가 세포질체 내에서 증식 또는 복제하는 것을 방지함으로써 병원체를 포획하도록 조작된 세포질체를 개시한다. 세포질체의 제어가능하고, 유한한 수명은 세포질체 사멸시 세포질체에 병원체가 포획된 상태에서 죽을 때 세포질체가 병원체를 사멸시키는 것을 가능하게 한다. 세포질체의 사멸은 아폽토시스 또는 자가포식과 같은 자연적인 프로세스일 수 있다. 병원체를 포획하도록 조작된 세포질체는 병원체에 의한 세포질체의 감염을 조장하는 숙주 수용체와 같은 병원체 인식 모이어티를 발현하도록 조작될 수 있다. 추가로, 또는 대안적으로, 세포질체는 피험체의 세포에서 병원체에 의한 감염을 치료하거나, 또는 예방하는 데 치료적으로 효과적인 본원에 기술된 활성제를 발현하거나 함유하도록 조작될 수 있다. 상기 활성제는 예를 들어, 세포질체로부터 분비될 때, 세포외 공간의 병원체와 숙주 세포 사이의 결합을 기능적으로 차단하는 중화 항체일 수 있다. SARS-CoV-2에 의한 감염을 예방하는 경우, 중화 항체는 SARS-CoV-2 스파이크 단백질과 숙주 세포에 발현되는 인간 안지오텐신 전환 효소 2(ACE2: angiotensin-converting enzyme 2) 간의 결합을 차단하여 감염을 예방한다.
병원체는 본 명세서에 개시된 것과 같이 복제 또는 증식하기 위해 핵 유전 정보를 적어도 부분적으로 필요로 하는, 본원에 기술된 세포를 감염시킬 수 있는 임의의 박테리아, 바이러스 또는 진균일 수 있다. 감염된 세포질체에는 숙주 세포의 핵에 복제 단계를 갖는 병원체의 복제 또는 증식에 필요한 핵 성분이 결여되어 있어 피험체에서 병원체에 의한 감염의 예방 또는 치료를 감소시킨다.
SARS-CoV-2에 의한 감염을 감소 또는 예방하기 위한 경우, 세포질체는 SARS-CoV-2(예컨대, ACE2)에 대한 병원체 인식 모이어티를 발현하도록 조작되며, 세포질체가 스파이크 단백질 및 ACE2 결합을 통해 SARS-CoV-2에 의해 감염될 때, 세포질체는 자연적으로 대식세포 식세포 작용을 위해 대식세포를 동원할 수 있거나, 또는 그와 같이 동원하도록 조작될 수 있다. 도 4에 제시된 바와 같이, 비제한적인 예로서, 감염된 세포질체의 식세포 작용은 헬퍼 T 세포 및 B 세포와 같은 면역 세포를 활성화하여 SARS-CoV-2에 대한 항체를 생성할 수 있다. 일부 실시양태에서, 감염된 세포질체의 식세포 작용은 바이러스 감염을 치료하기 위해 T 세포를 활성화할 수 있다.
일부 실시양태에서, 본원에 기술된 세포질체는 병원체 인식 모이어티를 발현하고, 일부 경우에는 이를 나타내도록 조작된다. 일부 실시양태에서, 병원체 인식 모이어티는 숙주 수용체(관심 병원체에 대한 동족 수용체), 또는 병원체와 숙주 세포 사이의 결합을 촉진하기에 충분한 그의 일부이다. 병원체 인식 모이어티는 세포질체 표면 상에 세포질체에 의해 발현될 수 있다. 일부 실시양태에서, 병원체 인식 모이어티는 세포외 환경에 적어도 부분적으로 노출된 단백질로부터 유래된다. 일부 실시양태에서, 병원체 인식 모이어티는 세포 표면 수용체 또는 막횡단 단백질을 코딩하는 폴리펩티드로부터 유래된다. 일부 실시양태에서, 병원체 인식 모이어티는 바이러스 감염 동안 바이러스 단백질에 의해 결합되는 단백질로부터 유래된다. 예를 들어, 병원체 인식 모이어티는 바이러스 감염 동안 SARS-CoV-2의 스파이크 단백질에 의해 결합되는 안지오텐신 I 전환 효소 2(ACE2)에서 유래 수 있다. 일부 실시양태에서, 병원체 인식 모이어티는 본원에 기술된 바이러스 중 어느 하나에 의해 인식 및 결합될 수 있는 세포 표면 수용체 또는 막횡단 단백질로부터 유래된다. 일부 실시양태에서, 병원체 인식 모이어티는 본원에 기술된 코로나바이러스 중 어느 하나에 의해 인식 및 결합될 수 있는 세포 표면 수용체 또는 막횡단 단백질로부터 유래된다. 일부 실시양태에서, 병원체 인식 모이어티는 당이다. 일부 실시양태에서, 병원체 인식 모이어티는 폴리펩티드이다. 코로나바이러스에 의해 인식되는 비제한적인 수용체에는 ACE2, 알라닌 아미노펩티다제(ANPEP), 암배아 항원 관련 세포 부착 분자(CEACAM1: Carcinoembryonic antigen-related cell adhesion molecule), 디펩티딜 펩티다제-4(DPP4: Dipeptidyl peptidase-4) 또는 당을 포함한다.
일부 실시양태에서, 세포질체는 인간 안지오텐신 전환 효소 2(ACE2)에 특이적인 코로나바이러스, 예를 들어, SARS-CoV, SARS-CoV-2 및 NL63에 의해 인식 및 결합될 수 있는 ACE2, 또는 그의 일부를 발현하도록 조작된다. 일부 실시양태에서, 세포질체는 세포질체의 표면 상에서 ACE2 또는 그의 일부를 발현하도록 조작된다. 일부 실시양태에서, 세포질체는 전장의 ACE2를 발현하도록 조작된다. 일부 실시양태에서, 세포질체는 ACE2의 단편을 발현하도록 조작된다. 일부 실시양태에서, ACE2의 부분은 ACE2 폴리펩티드의 아미노산 서열의 약 5개 아미노산 내지 약 805개 아미노산을 포함한다. 일부 실시양태에서, ACE2의 부분을 포함하는 병원체 인식 모이어티는 세포 외부에서 발현되는 ACE2의 세포외 도메인 또는 부분으로부터 유래된다. 일부 실시양태에서, ACE2의 부분은 ACE2의 아미노산 서열의 N-말단 부분을 포함한다. 일부 실시양태에서, ACE2의 부분은 ACE2의 아미노산 서열의 C-말단 부분을 포함한다. 일부 실시양태에서, ACE2의 부분은 약 5개의 아미노산 내지 약 10개의 아미노산, 약 5개의 아미노산 내지 약 15개의 아미노산, 약 5개의 아미노산 내지 약 20개의 아미노산, 약 5개의 아미노산 내지 약 25개의 아미노산, 약 5개의 아미노산 내지 약 50개의 아미노산, 약 5개의 아미노산 내지 약 100개의 아미노산, 약 5개의 아미노산 내지 약 200개의 아미노산, 약 5개의 아미노산 내지 약 400개의 아미노산, 약 5개의 아미노산 내지 약 500개의 아미노산, 약 5개의 아미노산 내지 약 600개의 아미노산, 약 5개의 아미노산 내지 약 805개의 아미노산, 약 10 아미노산 내지 약 15개의 아미노산, 약 10 아미노산 내지 약 20개의 아미노산, 약 10 아미노산 내지 약 25개의 아미노산, 약 10 아미노산 내지 약 50개의 아미노산, 약 10 아미노산 내지 약 100개의 아미노산, 약 10 아미노산 내지 약 200개의 아미노산, 약 10 아미노산 내지 약 400개의 아미노산, 약 10 아미노산 내지 약 500개의 아미노산, 약 10 아미노산 내지 약 600개의 아미노산, 약 10 아미노산 내지 약 805개의 아미노산, 약 15개의 아미노산 내지 약 20개의 아미노산, 약 15개의 아미노산 내지 약 25개의 아미노산, 약 15개의 아미노산 내지 약 50개의 아미노산, 약 15개의 아미노산 내지 약 100개의 아미노산, 약 15개의 아미노산 내지 약 200개의 아미노산, 약 15개의 아미노산 내지 약 400개의 아미노산, 약 15개의 아미노산 내지 약 500개의 아미노산, 약 15개의 아미노산 내지 약 600개의 아미노산, 약 15개의 아미노산 내지 약 805개의 아미노산, 약 20 아미노산 내지 약 25개의 아미노산, 약 20 아미노산 내지 약 50개의 아미노산, 약 20 아미노산 내지 약 100개의 아미노산, 약 20 아미노산 내지 약 200개의 아미노산, 약 20 아미노산 내지 약 400개의 아미노산, 약 20 아미노산 내지 약 500개의 아미노산, 약 20 아미노산 내지 약 600개의 아미노산, 약 20 아미노산 내지 약 805개의 아미노산, 약 25개의 아미노산 내지 약 50개의 아미노산, 약 25개의 아미노산 내지 약 100개의 아미노산, 약 25개의 아미노산 내지 약 200개의 아미노산, 약 25개의 아미노산 내지 약 400개의 아미노산, 약 25개의 아미노산 내지 약 500개의 아미노산, 약 25개의 아미노산 내지 약 600개의 아미노산, 약 25개의 아미노산 내지 약 805개의 아미노산, 약 50 아미노산 내지 약 100개의 아미노산, 약 50 아미노산 내지 약 200개의 아미노산, 약 50 아미노산 내지 약 400개의 아미노산, 약 50 아미노산 내지 약 500개의 아미노산, 약 50 아미노산 내지 약 600개의 아미노산, 약 50 아미노산 내지 약 805개의 아미노산, 약 100개의 아미노산 내지 약 200개의 아미노산, 약 100개의 아미노산 내지 약 400개의 아미노산, 약 100개의 아미노산 내지 약 500개의 아미노산, 약 100개의 아미노산 내지 약 600개의 아미노산, 약 100개의 아미노산 내지 약 805개의 아미노산, 약 200개의 아미노산 내지 약 400개의 아미노산, 약 200개의 아미노산 내지 약 500개의 아미노산, 약 200개의 아미노산 내지 약 600개의 아미노산, 약 200개의 아미노산 내지 약 805개의 아미노산, 약 400개의 아미노산 내지 약 500개의 아미노산, 약 400개의 아미노산 내지 약 600개의 아미노산, 약 400개의 아미노산 내지 약 805개의 아미노산, 약 500개의 아미노산 내지 약 600개의 아미노산, 약 500개의 아미노산 내지 약 805개의 아미노산, 또는 약 600개의 아미노산 내지 약 805개의 아미노산을 포함하는 ACE2 폴리펩티드의 아미노산 서열을 포함한다. 일부 실시양태에서, ACE2의 부분은 ACE2 폴리펩티드의 아미노산 서열 중 약 5개의 아미노산, 약 10개의 아미노산, 약 15개의 아미노산, 약 20개의 아미노산, 약 25개의 아미노산, 약 50개의 아미노산, 약 100개의 아미노산, 약 200개의 아미노산, 약 400개의 아미노산, 약 500개의 아미노산, 약 600개의 아미노산, 또는 약 805개의 아미노산을 포함한다. 일부 실시양태에서, ACE2의 부분은 ACE2 폴리펩티드의 아미노산 서열 중 적어도 약 5개의 아미노산, 약 10개의 아미노산, 약 15개의 아미노산, 약 20개의 아미노산, 약 25개의 아미노산, 약 50개의 아미노산, 약 100개의 아미노산, 약 200개의 아미노산, 약 400개의 아미노산, 약 500개의 아미노산, 또는 약 600개 이상의 아미노산을 포함한다. 일부 실시양태에서, ACE2의 부분은 ACE2 폴리펩티드의 아미노산 서열 중 최대 약 10개의 아미노산, 약 15개의 아미노산, 약 20개의 아미노산, 약 25개의 아미노산, 약 50개의 아미노산, 약 100개의 아미노산, 약 200개의 아미노산, 약 400개의 아미노산, 약 500개의 아미노산, 약 600개의 아미노산, 또는 약 805개의 아미노산을 포함한다. 일부 실시양태에서, ACE2는 인간 ACE2(huACE2)이다. 일부 실시양태에서, huACE2에 대한 아미노산 서열은 서열 번호 12에 제공되어 있다.
일부 실시양태에서, 세포질체는 서열 번호 12와 50%, 60%, 70%, 80%, 90%, 95%, 또는 99% 이상 동일한 이종성 폴리펩티드를 발현하도록 조작된다. 일부 실시양태에서, 세포질체는 서열 번호 12의 단편과 50%, 60%, 70%, 80%, 90%, 95%, 또는 99% 이상 동일한 이종성 폴리펩티드를 발현하도록 조작된다. 일부 실시양태에서, 세포질체는 서열 번호 12와 100% 동일한 이종성 폴리펩티드를 발현하도록 조작된다. 일부 실시양태에서, 세포질체는 서열 번호 12의 단편과 100% 동일한 이종성 폴리펩티드를 발현하도록 조작된다.
일부 실시양태에서, 세포질체는 내인성 수준으로 ACE2를 발현하고, SARS-CoV-2에 의해 감염될 수 있는 세포와 비교하여 더 많은 ACE2를 발현하도록 조작될 수 있다. 일부 실시양태에서, 세포질체는 내인성 수준으로 ACE2를 발현하는 세포와 비교하여 적어도 10%, 20%, 30% 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99% 또는 그 초과의 ACE2를 발현할 수 있다. 일부 실시양태에서, 세포질체는 내인성 수준으로 ACE2를 발현하고, SARS-CoV-2에 의해 감염될 수 있는 세포와 비교하여 ACE2를 적어도 2배, 5배, 10배, 50배, 100배, 500배, 1000배, 5000배, 10000배 또는 그 초과의 배수로 발현할 수 있다. 일부 실시양태에서, 세포질체는 세포의 표면 상에서 내인성 수준으로 ACE2를 발현하는 세포와 비교하여 세포질체의 표면 상에서 더 많은 ACE2를 발현하도록 조작될 수 있다. 일부 실시양태에서, 세포질체는 세포의 표면 상에서 내인성 수준으로 ACE2를 발현하는 세포와 비교하여 세포질체의 표면 상에서 적어도 10%, 20%, 30% 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99% 또는 그 초과의 ACE2를 발현할 수 있다. 일부 실시양태에서, 세포질체는 세포의 표면 상에서 내인성 수준으로 ACE2를 발현하는 세포와 비교하여 세포질체의 표면 상에서 ACE2를 적어도 2배, 5배, 10배, 50배, 100배, 500배, 1000배, 5000배, 10000배 또는 그 초과의 배수로 발현할 수 있다.
일부 실시양태에서, ACE2를 발현하는 세포질체는 기준 세포와 비교하여 더 높은 바이러스 감염성을 가질 수 있다. 이러한 맥락에서 "기준 세포"는 ((예컨대, ACE2를 자연적으로 발현하는) SARS-CoV-2에 감염될 수 있는 자연적으로 발생된 세포일 수 있다. 일부 실시양태에서, 기준 세포는 세포질체와 동일한 세포 유형이다. 일부 실시양태에서, 기준 세포는 ACE2를 발현하지 않는다는 점을 제외하고는 세포와 동일하다. 바이러스 감염성은 일반적으로 알려진 검정법으로 측정하고, 결정할 수 있다. 바이러스 감염성의 예시적인 측정은 바이러스 플라크 검정법, 형광 초점 검정법(FFA: fluorescent focus assay) 및 종점 희석 검정법(TCID50)을 포함할 수 있다. 이러한 검정법들은 각각 바이러스 감염성을 측정하기 위해 세포질체 및/또는 세포에 첨가된 연속 바이러스 희석액에 의존할 수 있다. 바이러스 감염성을 결정하기 위한 다른 예시적인 측정은 설정된 수의 세포질체 및/또는 세포를 감염시키는 데 필요한 바이러스 게놈 또는 입자의 양을 정량화하기 위한 qPCR 또는 ELISA를 포함할 수 있다. 일부 실시양태에서, ACE2를 발현하는 세포질체는 적어도 약 10%, 20%, 30% 40%, 50%, 60%, 70%, 80%, 90% 이상의 바이러스 감염성을 가질 수 있다. 일부 실시양태에서, ACE2를 발현하는 세포질체는 기준 세포보다 적어도 약 2배, 5배, 10배, 50배, 100배, 500배, 1000배, 5000배, 또는 10000배 이상 더 높은 바이러스 감염성을 가질 수 있다.
일부 실시양태에서, 본원에서는 적어도 하나의 표적화 모이어티, 예컨대, 귀소 단백질 또는 수용체를 발현하도록 조작된 세포질체를 기술한다. 일부 실시양태에서, 표적화 모이어티는 세포질체에 의해 분비된다. 일부 실시양태에서, 표적화 모이어티는 본원에 기술된 케모카인 수용체에 대한 리간드이다. 일부 실시양태에서, 표적화 모이어티는 본원에 기술된 사이토카인이다. 일부 실시양태에서, 표적화 모이어티는 귀소 수용체이다. 일부 실시양태에서, 표적화 모이어티는 세포질체의 표면 상에서 발현된다. 일부 실시양태에서, 표적화 모이어티는 본원에 기술된 케모카인 수용체이다. 일부 실시양태에서, 표적화 모이어티는 본원에 기술된 사이토카인 중 어느 하나에 대한 수용체이다.
일부 실시양태에서, 표적화 모이어티는 림프 조직의 하나 이상의 세포에서 발현된 하나 이상의 리간드에 특이적일 수 있고, 림프 조직의 세포는 내피 세포, 림프구, 대식세포, 또는 망상 세포, 또는 그의 조합을 포함할 수 있다. 분비된 표적화 모이어티의 비제한적인 예로는 SDF1α, CCL2, CCL3, CCL5, CCL8, CCL1, CXCL9, CXCL10, CCL11, CXCL12, 또는 그의 조합을 포함한다. 일부 실시양태에서, 표적화 모이어티는 세포질체의 표면 상에서 발현된다. 세포질체 표면에 발현되는 표적화 모이어티의 비제한적인 예는 CXCR4, CCR2 또는 PSGL-1을 포함한다. 세포 표면 상에서 발현될 수 있는 세포 표면 단백질의 비제한적 예는 CXCR4, CCR2, CCR1, CCR5, CXCR7, CXCR2, CXCR1, C-X-C 케모카인 수용체 타입 3, 류코시아린, CD44 항원, C-C 케모카인 수용체 타입 7, L-셀렉틴, 림프구 기능 연관 항원 1, 또는 초후기 항원-4, 또는 그의 조합을 포함한다.
일부 실시양태에서, 표적화 모이어티(예컨대, 귀소 단백질 또는 귀소 수용체)를 발현하는 세포질체는 또한 본원에 개시된 활성제를 발현한다. 일부 실시양태에서, 활성제는 본원에 기술된 추가의 외인성 작용제이다. 일부 실시양태에서, 활성제는 본원에 기술된 병원체 인식 모이어티이다. 일부 실시양태에서, 활성제는 병원체에 의해 발현되는 에피토프; 병원체와 연관된 미세환경과 연관된 에피토프; 또는 병원체에 의해 방출된 생체분자와 연관된 에피토프에 결합하는 항체 또는 단일 도메인 항체를 포함한다. 일부 실시양태에서, 에피토프에 대한 항체 또는 단일 도메인 항체의 결합은 병원체에 대한 치료 또는 백신접종 특성을 부여한다. 일부 실시양태에서, 에피토프에 대한 항체 또는 단일 도메인 항체의 결합은 면역 세포를 동원하여 면역 반응을 활성화하여 병원체에 대한 치료 특성을 부여한다.
II. 치료 및 예방 방법
본원에서는 본 개시내용의 세포질체, 또는 세포질체를 함유하는 약학적 조성물을 병원체 연관된 질환 또는 병태 치료 또는 예방을 필요로 하는 피험체에게 투여함으로써 병원체 연관된 질환 또는 병태를 치료 또는 예방하는 방법을 제공한다. 일부 실시양태에서, 세포질체 및 그의 약학적 조성물은 본원에 기술된 질환 또는 병태의 치료에 적합하다. 이러한 질환 또는 병태는 일부 경우에 본원에 기술된 병원체에 의한 감염에 의해 (적어도 부분적으로) 유발될 수 있다. 일부 실시양태에서, 질환 또는 병태는 예를 들어, 종양용해성 바이러스에 의한 감염에 의해 유발되는 암이다.
일부 실시양태에서, 방법은 세포질체, 또는 세포질체를 함유하는 약학적 조성물을 피험체에게 전신 투여하는 단계를 포함한다.
일부 실시양태에서, 본원에서는 암 치료를 필요로 하는 피험체에게 세포질체, 또는 세포질체를 함유하는 약학적 조성물을 피험체에게 투여함으로써 암을 치료하는 방법을 개시한다. 일부 실시양태에서, 세포질체는 항암 활성제를 코딩하는 외인성 핵산을 포함한다. 일부 실시양태에서, 항암 활성제는 종양용해성 바이러스에 대한 백신이다. 일부 실시양태에서, 세포질체는 암 세포에 특이적인 항체 또는 소분자를 발현하도록 조작된다. 일부 실시양태에서, 항체는 암 세포를 표적화하고, 이어서, 적응 면역계를 활성화하여 암 세포를 중화시킬 수 있는 중화 항체일 수 있다. 일부 실시양태에서, 항체는 단일 도메인 항체(예컨대, 나노바디)일 수 있다. 일부 실시양태에서, 항체는 세포독성 약물과 같은 약물에 접합되어 항체 약물 접합체(ADC: antibody drug conjugate)를 형성할 수 있다. 일부 실시양태에서, 세포질체는 암 세포와 직접 접촉함으로써 치료 특성을 부여한다. 일부 실시양태에서, 세포질체는 암 세포에 대한 면역 반응(예를 들어, 면역 세포)을 동원하고, 활성화함으로써 치료 특성을 부여한다.
본원에 기술된 병원체에 대해 피험체를 백신접종하는 방법 또한 개시한다. 일부 실시양태에서, 세포질체는 병원체 백신으로서 사용하기 위한 병원체 항원을 발현하도록 조작된다. 일부 실시양태에서, 병원체는 표 3-6으로부터 선택된 병원체 중 어느 하나일 수 있다. 일부 실시양태에서, 세포질체는 표 3-6으로부터 선택된 병원체 중 어느 하나의 항원을 발현하도록 조작된다. 일부 실시양태에서, 항원은 서열 번호 1, 3-7, 151-154, 251-260, 401-447, 551-562, 651-660, 751-761, 851-859, 951-984, 1051-1057, 또는 1151-1153 중 하나 이상의 것과 적어도 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 항원은 서열 번호 2, 8, 101-104, 201-209, 301-347, 501-512, 601-610, 701-711, 801-809, 901-934, 1001-1007, 또는 1101-1103 중 하나 이상의 것과 적어도 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 핵산 서열로부터 코딩된다. 일부 실시양태에서, 세포질체는 바이러스 백신으로서 사용하기 위한 바이러스 항원을 발현하도록 조작된다. 일부 실시양태에서, 세포질체는 박테리아 백신으로서 사용하기 위한 박테리아 항원을 발현하도록 조작된다.
본원에서는 병원체 감염에 대해 피험체를 치료하는 방법 또한 기술한다. 일부 실시양태에서, 세포질체는 그를 필요로 하는 피험체에서 병원체를 감소시키는 데 효과적인 병원체에 특이적인 항체 또는 소분자를 발현하도록 조작된다. 일부 실시양태에서, 항체는 병원체를 표적화한 후, 이어서, 적응 면역계를 활성화하여 병원체를 중화시킬 수 있는 중화 항체일 수 있다. 일부 실시양태에서, 항체는 단일 도메인 항체(예컨대, 나노바디)일 수 있다. 일부 실시양태에서, 항체는 세포독성 약물과 같은 약물에 접합되어 항체 약물 접합체(ADC)를 형성할 수 있다. 일부 실시양태에서, 세포질체는 병원체와 직접 접촉함으로써 치료 특성을 부여한다. 일부 실시양태에서, 세포질체는 병원체에 대한 면역 반응(예컨대, 면역 세포)을 동원하고, 활성화함으로써 치료 특성을 부여한다.
일부 실시양태에서, 본원에서는 피험체에게 세포질체 또는 세포질체를 함유하는 약학적 조성물을 투여함으로써 피험체에서 병원체에 의한 감염을 치료하는 방법으로서, 여기서, 세포질체는 피험체의 임의의 조직(예컨대, 혈액, 근육, 림프)에서 병원체를 포획하도록, 피험체에서 병원체 증식을 방지하도록, 및 임의적으로, 예를 들어, 식세포 작용에 의해 피험체로부터 병원체를 제거하도록 조작된다. 일부 실시양태에서, 세포질체는 병원체 연관 질환 또는 병태를 치료하는 데 효과적인 치료제를 발현하도록 조작된다. 일부 실시양태에서, 세포질체는 암 치료에 효과적인 치료제를 발현하도록 조작된다. 일부 실시양태에서, 방법은 피험체에게 하나 이상의 추가 치료제를 투여하는 단계를 추가로 포함한다. 일부 실시양태에서, 하나 이상의 추가 치료제는 세포 기반 요법, 소분자, 면역 요법, 화학요법, 방사선 요법, 유전자 요법, 및 수술로 구성된 군으로부터 선택된다. 추가 요법은 본 개시내용의 세포질체와 동시에 피험체에게 투여될 수 있다. 추가 요법은 본 개시내용의 세포질체 이전 또는 이후에 투여될 수 있다.
A. 질환 또는
병태
본원에 개시된 병원체 연관된 질환 또는 병태는 바이러스 감염, 박테리아 감염, 진균 감염, 기생충 감염, 및 원생동물 감염, 및 본원에 개시된 감염과 연관된 질환 또는 병태를 포함한다. 일부 실시양태에서, 병원체는 표 3-6에 열거된 병원체 중 어느 하나로부터 선택될 수 있다. 본원에 기술된 조성물 및 방법에 의해 치료되거나, 또는 예방될 수 있는 감염의 비제한적 예로는 아시네토박터 감염, 방선균증, 아프리카 수면병(아프리카 트리파노소마증), AIDS(후천성 면역결핍 증후군: Acquired immunodeficiency syndrome), 아메바증, 아나플라즈마증, 혈관강력증, 아니사키증, 탄저병, 아르카노박테리움 헤몰리티쿰(Arcanobacterium haemolyticum) 감염, 아르헨티나 출혈 열, 아스카리아증, 아스페르길루스증, 아스트로바이러스 감염, 바베시오증, 바실러스 세레우스(Bacillus cereus) 감염, 박테리아성 폐렴, 박테리아성 질염, 박테로이데스(Bacteroides) 감염, 발란티디아증, 바르토넬라증, 바일리자스카리스(Baylisascaris) 감염, BK 바이러스 감염, 흑색 피에드라, 배반포증, 분파균증, 볼리비아 출혈 열, 보툴리눔독소증(및 유아 보툴리눔독소증), 브라질 출혈 열, 브루셀라병, 선페스트, 부르크홀데리아 감염, 부룰리 궤양, 칼리시바이러스 감염(노로바이러스 및 사포바이러스), 캄필로박테리아증, 칸디다증(모닐리아증, 아구창), 모세혈관염, 카리온병, 고양이 긁힘병, 봉와직염, 샤가스병(미국 트리파노소마증), 연성하감, 수두, 치쿤구니야, 클라미디아, 클라미도필라 뉴모니아에(Chlamydophila 폐렴 e) c 감염(대만 급성 호흡기 제제 또는 TWAR), 콜레라, 색소모세포진균증, 키트리디오균증, 간디스토마증, 클로스트리디움 디피실리(Clostridium difficile) 대장염, 콕시디오이데스진균증, 콜로라도 진드기열(CTF: Colorado tick fever), 감기(급성 바이러스성 비인두염; 급성 코감기), 코로나바이러스 감염, 크로이츠펠트-야콥병(CJD: Creutzfeldt-Jakob disease), 크림-콩고 출혈 열(CCHF: Crimean-Congo hemorrhagic fever), 크립토코쿠스증, 크립토스포리디움증, 피부 유충 이행증(CLM: Cutaneous larva migrans), 원포자충증, 낭충증, 사이토메갈로바이러스 감염, 뎅기열, 데스모데스무스 감염, 디엔타메바증, 디프테리아, 디필로보트리아증, 드라쿤쿨리아증, 에볼라 출혈 열, 포충증, 엘리히증, 요충증(요충 감염), 엔테로코쿠스(Enterococcus) 감염, 엔테로바이러스 감염, 유행성 발진티푸스, 전염성 홍반(제5병), 돌발성 발진(제6병), 간질증, 비대흡충증, 치명적 가족성 불면증(FFI: Fatal familial insomnia), 사상충증, 클로스트리디움 페르프린겐스에 의한 식중독, 자유 생활 아메바 감염, 푸소박테리움 감염, 가스 괴저(클로스트리듐 근괴사증), 지오트리쿰진균증, 게르스트만-스트라우슬러-슈나이커 증후군(GSS: Gerstmann-Straussler-Scheinker syndrome), 편모충증, 마비저, 악구충증, 임질, 서혜부 육아종 (Donovanosis), 임질, 사타구니 육아종(도노바노시스), A군 연쇄상구균 감염, B군 연쇄상구균 감염, 헤모필루스(Haemophilus) 감염, 수족구병(HFMD: Hand, foot and mouth disease), 한타바이러스 폐 증후군(HPS: Hantavirus Pulmonary Syndrome), 하트랜드 바이러스병, 헬리코박터 파이로리 감염, 용혈성 요독 증후군(HUS: Hemolytic-uremic syndrome), 신증후군 출혈열(HFRS: Hemorrhagic fever with renal syndrome), A형 간염, B형 간염, C형 간염, D형 간염, E형 간염, 단순 포진, 히스토플라스마증, 구충 감염, 인간 보카바이러스 감염, 인간 인간 에윙이 엘리히증, 인간 과립구 아나플라즈마증(HGA: Human granulocytic anaplasmosis), 인간 면역 결핍 바이러스(HIV) 감염, 인간 메타뉴모바이러스 감염, 인간 단핵구 엘리히증, 인간 유두종 바이러스(HPV: Human papillomavirus) 감염, 인간 파라인플루엔자 바이러스 감염, 선충증, 엡스타인-바 바이러스 감염성 단핵구증(모노), 인플루엔자(플루), 인플루엔자 바이러스 A, 인플루엔자 바이러스 B, 인플루엔자 바이러스 C, 인플루엔자 바이러스 D, 인플루엔자 바이러스 pr8, 이소스포리아증, 가와사키병, 각막염, 킹겔라 킹아에(Kingella kingae) 감염, 쿠루병, 라사 열, 레지오넬라증(레지오넬라병), 레지오넬라증(폰티악 열), 리슈만편모충증, 나병, 렙토스피라증, 리스테리아증, 라임병(라임 보렐리아증), 림프 사상충증(엘리판티아증), 림프구성 맥락막염, 말라리아, 마버그 출혈 열(MHF: Marburg hemorrhagic fever), 홍역, 중동 호흡기 증후군 (MERS: Middle East respiratory syndrome), 멜리오이도시스(휘트모어병), 수막염, 수막구균성 질환, 요코가와흡충증, 미포자충증, 전염성 연속종(MC: Molluscum contagiosum), 원숭이 두창, 볼거리, 뮤린 발진티푸스(풍토성 발진티푸스), 마이코플라스마 폐렴, 마이코플라스마 생식기 감염, 균종(동음이의), 구데기증, 신생아 결막염(신생아 안염), 노로바이러스(소아 및 영유아), (신종) 변종 크로이츠펠트-야콥병(vCJD, nvCJD), 노카르디아증, 온코세르카증(회선 사상충증), 간흡충증, 파라콕시디오이데스진균증(남아메리카 분아균증), 폐흡충증, 파스투렐라병, 두슬증(머릿니), 구슬증(이), 음모슬증(사면발이, 게 이), 골반내 염증 질환(PID: Pelvic inflammatory disease), 백일해(백일 기침), 역병, 폐렴구균 감염, 폐렴포자충 폐렴(PCP: Pneumocystis pneumonia), 폐렴, 소아마비, 프리보텔라(Prevotella) 감염, 원발성 아메바성 수막뇌염(PAM: Primary amoebic meningoencephalitis), 진행성 다초점 백색질뇌병증, 앵무병, Q 열, 광견병, 재발성 열, 호흡기 세포융합 바이러스 감염, 리노스포리디움증, 리노바이러스 감염, 리케차 감염, 리케차두창, 리프트 밸리 열(RVF: Rift Valley fever), 록키산 반점 열(RMSF: Rocky Mountain spotted fever), 로타바이러스 감염, 호흡기 세포융합 바이러스(RSV), 풍진, 살모넬라증, SARS(중증 급성 호흡기 증후군), 옴, 성홍열, 주혈흡충증, 패혈증, 이질균증(세균성 이질), 대상포진(띠 헤르페스), 천연두(바리올라), 스포로트리코시스, 포도상구균 식중독, 포도상구균 감염, 간충증, 아급성 경화성 범뇌염, 매독, 촌충증, 파상풍(파상풍(Lockjaw)), 수염 백선(이발소양진), 두부 백선(두피 링웜), 체부 백선(체부 링웜), 고부 백선(완선), 손 백선(손링웜), 흑색질 백선, 족부 백선(무좀), 조갑 백선(조갑진균증), 백선(전풍), 톡소카리아증(안구 유충 이행증(OLM: Ocular Larva Migrans)), 톡소카리아증(장기 유충 이행증(VLM: Visceral Larva Migrans)), 톡소플라스마증, 트라코마, 선모충증, 트리코모나스증, 선모충증(편충 감염), 결핵, 야토병, 장티푸스, 발진티프스, 우레아플라즈마 유레아라이티쿰(Ureaplasma urealyticum) 감염, 밸리 열, 베네수엘라 말 뇌염, 베네수엘라 출혈 열, 비브리오 불니피쿠스 감염, 비브리오 파라헤몰리티쿠스 장염, 바이러스 폐렴, 웨스트 나일 열, 백색 사모(백색 백선), 예르시니아 슈도투베르쿨로시스(Yersinia pseudotuberculosis) 감염, 예르시니아증, 황열, 지카열, 및 털곰팡이증을 포함할 수 있다.
코로나바이러스 감염은 알파 코로나바이러스 또는 베타 코로나바이러스에 의한 감염일 수 있다. 알파 코로나바이러스의 비제한적인 예는 229E 및 NL63을 포함한다. 베타 코로나바이러스의 비제한적인 예는 OC43, HKU1, 중증 급성 호흡기 증후군(SARS) 코로나바이러스 또는 중동 호흡기 증후군(MERS) 코로나바이러스를 포함한다. 일부 실시양태에서, SARS 코로나바이러스는 SARS-CoV, SARS-CoV-2, 또는 그의 변이체이다. 일부 실시양태에서, MERS 코로나바이러스는 MERS-CoV 또는 그의 변이체이다. 일부 실시양태에서, SARS 코로나바이러스는 질환 또는 병태, 예컨대, 코로나바이러스 질환 2019(COVID-19)를 유발한다.
일부 실시양태에서, 본원에 기술된 코로나바이러스는 서열 번호 1 및 3-7 중 어느 하나에 제공된 핵산 서열에 의해 코딩된다. 일부 실시양태에서, 코로나바이러스(또는 그의 변이체)는 서열 번호 1 및 3-7 중 어느 하나와 적어도 약 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 핵산 서열에 의해 코딩된다.
일부 실시양태에서, 코로나바이러스는 서열 번호 2 또는 8에 제공된 아미노산 서열에 의해 코딩된 스파이크 단백질을 포함한다. 일부 실시양태에서, S 단백질은 서열 번호 2 또는 8과 적어도 약 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 아미노산 서열에 의해 코딩된다.
일부 실시양태에서, 코로나바이러스는 서열 번호 9에 제공된 아미노산 서열에 의해 코딩된 뉴클레오캡시드(N) 단백질을 포함한다. 일부 실시양태에서, N 단백질은 서열 번호 9와 적어도 약 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 아미노산 서열에 의해 코딩된다.
일부 실시양태에서, 코로나바이러스는 서열 번호 10에 제공된 아미노산 서열에 의해 코딩된 막(M) 단백질을 포함한다. 일부 실시양태에서, M 단백질은 서열 번호 10과 적어도 약 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 아미노산 서열에 의해 코딩된다.
일부 실시양태에서, 코로나바이러스는 서열 번호 11에 제공된 아미노산 서열에 의해 코딩된 외피(E) 단백질을 포함한다. 일부 실시양태에서, E 단백질은 서열 번호 11과 적어도 약 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 아미노산 서열에 의해 코딩된다.
B.
피험체
일부 실시양태에서, 피험체는 치료를 필요로 하거나, 치료를 필요로 한 것으로 결정되었거나, 치료를 필요로 하는 것으로 의심된다. 본원에서 사용되는 바, 용어 "피험체"는 임의의 유기체를 지칭한다. 예를 들어, 피험체는 포유동물, 양서류, 어류, 파충류, 무척추동물, 조류, 식물, 고세균, 진균 또는 박테리아일 수 있다. 일부 실시양태에서, 피험체는 포유동물이다. 일부 실시양태에서, 피험체는 설치류(예컨대, 마우스, 래트, 햄스터, 기니피그), 개과(예컨대, 개), 고양이과(예컨대, 고양이), 말과(예컨대, 말), 양, 소, 돼지, 인간이 아닌 영장류, 예컨대, 유인원(예컨대, 원숭이), 유인원(예컨대, 고릴라, 침팬지, 오랑우탄, 긴팔원숭이), 또는 인간일 수 있다. 본원에 기술된 방법 중 임의의 것의 일부 실시양태에서, 피험체는 0 내지 120세(예컨대, 출생부터 1개월(예컨대, 신생아), 1개월 내지 2세(예컨대, 유아), 2세 내지 12세(예컨대, 소아), 12세 내지 16세(예컨대, 청소년), 1 내지 120세, 1 내지 115세, 1 내지 110세, 1 내지 105세, 1 내지 100세, 1 내지 95세, 1 내지 90세 1 내지 85세, 1 내지 80세, 1 내지 75세, 1 내지 70세, 1 내지 65세, 1 내지 60세, 1 내지 50세, 1 내지 40세, 1 내지 30세, 1 내지 25세, 1 내지 20세, 1 내지 15세, 1 내지 10세, 5 내지 120세, 5 내지 110세, 5 내지 100세, 5 내지 90세, 5 내지 60세, 5 내지 50세, 5 내지 40세, 5 내지 30세, 5 내지 20세, 5 내지 10세, 10 내지 120세, 10 내지 110세, 10 내지 100세, 10 내지 90세, 10 내지 80세 10 내지 60세, 10 내지 50세, 10 내지 40세, 10 내지 30세, 10 내지 20년, 20 내지 120세, 20 내지 110세, 20 내지 100세, 20 내지 90세, 20 내지 70세, 20 내지 60세, 20 내지 50세, 20 내지 40세, 20 내지 30세, 30 내지 120세, 30 내지 110세, 30 내지 100세, 30 내지 90세, 30 내지 70세, 30 내지 60년, 30 내지 50세, 40 내지 120세, 40 내지 110세, 40 내지 100세, 40 내지 90세, 40 내지 80세, 40 내지 60세, 40 내지 50세, 50 내지 120세, 50 내지 110세, 50 내지 100세, 50 내지 90세, 50 내지 80세, 50 내지 70세, 50 내지 60세, 60 내지 120세, 60 내지 110세, 60 내지 100세, 60 내지 90세, 60 내지 80세, 60 내지 70세, 70 내지 120세, 70 내지 110세, 70 내지 100세, 70 내지 90세, 70 내지 80세, 80 내지 120세, 80 내지 110세, 80 내지 100세, 80 내지 90세, 90 내지 120세, 90 내지 110세, 90 내지 100세, 100 내지 120세, 또는 110 내지 120세)이다. 본원에 기술된 방법 중 임의의 것의 일부 실시양태에서, 피험체는 아직 태어나지 않은, 예컨대, 자궁 내에 있는 것이다. 본원에 기술된 방법 중 임의의 것의 일부 실시양태에서, 피험체는 적어도 생후 1개월(예컨대, 적어도 2세, 적어도 12세, 적어도 16세, 또는 적어도 18세)이다. 본원에 기술된 방법 중 임의의 것은 피험체, 예컨대, 이환된 피험체(즉, 질환을 앓는 피험체, 예컨대, 질환 진단을 받은 피험체) 또는 무증상 피험체(즉, 임상적으로 건강한 것으로 나타난 피험체, 또는 질환 진단을 받지 않은 피험체)를 치료하는 데 사용될 수 있다. 본원에서 사용되는 바, 치료한다는 것은 질환의 위험이 있는 피험체에서 질환의 징후 또는 증상의 발병을 감소시키거나, 또는 그를 예방하는(또는 그 위험을 감소시키는) 것을 의미하는 "예방적 처치," 및 질환의 징후 또는 증상을 감소시키거나, 질환의 진행을 감소시키거나, 질환의 중증도를 감소시키거나, 질환 진단을 받은 피험체에서의 재발을 감소시키는 것을 의미하는 "치료적 처치"를 포함한다. 본원에서 사용되는 바, "치료하다"라는 용어는 질환의 적어도 하나의 임상 파라미터를 개선하고/거나, 이점(예컨대, 항노화, 흉터 방지, 상처 치유, 항우울제, 항염증제, 체중 감소)을 제공하는 것을 의미한다.
C. 투약 빈도 및 투여
본원에 제공된 방법 중 임의의 것의 일부 실시양태에서, 조성물은 일정 기간 동안 적어도 1회(예컨대, 2, 3, 4, 5, 6,7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 50, 60, 70, 80, 90, 100회) 투여된다(예컨대, 매일, 매 2일마다, 주 2회, 1주 1회, 매주, 월 3회, 월 2회, 월 1회, 매 2개월마다. 매 3개월마다. 매 4개월마다. 매 5개월마다. 매 6개월마다. 매 7개월마다. 매 8개월마다. 매 9개월마다. 매 10개월마다. 매 11개월마다, 연 1회). 또한 월간 치료, 예컨대, 적어도 1개월(예를 들어, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6개월 또는 그 초과, 예컨대, 12개월 또는 그 이상) 동안 적어도 월 1회 투여, 및 연간 치료(예컨대, 1년 이상의 기간 동안 연 1회 투여) 또한 고려된다. 투여 빈도는 특정 이벤트, 예컨대, 예를 들어, 병원체 연관된 질환 또는 장애의 첫 번째 증상, 백신 조성물의 제1 용량, 다른 주, 카운티, 국가 또는 대륙으로의 여행 등과 관련이 있을 수 있다.
투여는 임의의 적합한 경로, 예컨대, 피하, 정맥내, 동맥, 안구, 경구, 근육내, 비내(예컨대, 흡입), 복강내, 국소, 점막, 경막외, 설하, 경피, 양막외, 관절간, 진피내, 골내, 척추강내, 자궁내, 질내, 방광내, 유리체내, 혈관주위, 및/또는 직장 투여, 또는 공지된 투여 방법의 임의의 조합을 통해 이루어질 수 있다.
일부 실시양태에서, 세포질체의 사멸 프로세스는 피험체에 대해 치료 효과를 가질 수 있다. 예를 들어, 일부 실시양태에서, 세포질체의 사멸 프로세스는 면역자극성일 수 있다. 따라서, 본원에서는 세포질체를 피험체에 투여하는 방법을 제공하며, 여기서 세포질체의 사멸은 피험체에 치료 효과를 갖는다. 일부 실시양태에서, 피험체에게 투여된 세포질체는 사멸된 것이다. 일부 실시양태에서, 피험체에게 투여된 세포질체는 투여될 때 잔여 수명이 5일 미만(예를 들어, 4일 미만, 3일 미만, 2일 미만, 36시간 미만, 1일 미만, 18시간 미만, 12시간 미만, 6시간 미만, 2시간 미만 또는 1시간 미만)이다.
일부 실시양태에서, 세포는 피험체로부터 제거되고, 제핵될 수 있다. 일부 실시양태에서, 세포는 제핵 전에 (예컨대, 치료 DNA 분자, 치료 RNA 분자, 치료 단백질, 치료 펩티드, 소분자 치료제, 치료 유전자 편집 인자 치료 나노입자 및/또는 또 다른 치료제를 생산 또는 함유하도록) 조작된다. 일부 실시양태에서, 피험체로부터의 세포는 제핵 후, 이어서, (예컨대, 치료 DNA 분자, 치료 RNA 분자, 치료 단백질, 치료 펩티드, 소분자 치료제, 치료 유전자 편집 인자 치료 나노입자 및/또는 또 다른 치료제를 생산 또는 함유하도록) 조작된다. 일부 실시양태에서, (조작 여부와 상관없이) 세포질체는 세포 제거 기점이 된 피험체에게 투여된다.
일부 실시양태에서, 세포질체가 배양 및/또는 보관된 배지("조절 배지")는 치료 이점을 가질 수 있다. 일부 실시양태에서, 세포질체가 세포와 공동-배양 및/또는 보관된 (예를 들어, 제핵 후) 배지("조절 배지")는 치료 이점을 가질 수 있다. 일부 실시양태에서, 세포와 융합된 세포질체가 세포와 함께 배양 및/또는 보관되는 배지("조절 배지")는 치료 이점을 가질 수 있다.
따라서, 본원에서는 피험체에게 조절 배지를 투여하는 단계를 포함하는, 피험체의 건강을 치료, 예방 또는 예방적으로 처치하거나, 또는 증진시키는 방법을 제공한다. 임의의 특정 이론에 얽매이지 않고, 일부 실시양태에서, 배양 배지의 치료 이점은 세포질체에 의해 분비되는 엑소좀(예컨대, 치료 단백질 함유)의 배지에서의 존재로 인한 것일 수 있다고 간주된다.
본원에 제공된 방법 중 임의의 것의 일부 실시양태에서, 조성물은 하나 이상의 추가 요법(예컨대, 임의의 약물(예컨대, 항생제, 항바이러스제, 항염증 약물) 또는 화학요법(예컨대, 화학요법제(예컨대, 독소루비신, 파클리탁셀, 사이클로포스파미드), 또는 본원에 기술 임의의 소분자 치료제), 세포 기반 요법, 방사선 요법, 면역요법, 소분자, 억제 핵산(예컨대, 안티센스 RNA, 안티센스 DNA, miRNA, siRNA, lncRNA), 엑소좀 기반 요법, 유전자 요법 또는 수술)과 함께 투여된다. 일부 실시양태에서, 하나 이상의 추가 요법은 예컨대, PD-1/PDCD1/CD279, CTLA-4/CD152, TIM-3/HAVCR2, TIGIT, LAG3, VISTA/C10orf54, BTLA/CD272, A2AR, KIR, CD28, ICOS/CD278, CD40L/CD154, CD137/4-1BB, CD27, OX40/CD134/TNFRSF4, GITR, 또는 SIRPα와 같은 면역 체크포인트 단백질을 억제하는 조합 요법을 포함한다.
본원에 제공된 일부 실시양태에서, 조성물은 추가로 하나 이상의 추가 요법(예컨대, 임의의 약물(예컨대, 항생제, 항바이러스제) 또는 화학요법(예컨대, 화학요법제(예컨대, 독소루비신, 파클리탁셀, 사이클로포스파미드)), 세포 기반 요법, 방사선 요법, 면역 요법, 소분자, 억제성 핵산(예컨대, 안티센스 RNA, 안티센스 DNA, miRNA, siRNA, lncRNA) 또는 수술)을 포함한다.
III. 제조 방법
본 개시내용은 본원에 개시된 항바이러스 조성물 및 세포질체의 제조 방법을 제공한다. 일부 실시양태에서, 본 개시내용은 면여계로부터 유래된(수득된) 일반적으로 사용되는 치료 세포(예컨대, 자연 살해(NK) 세포, 호중구, 대식세포, 림프구, 비만 세포, 호염구, 호산구), 줄기 세포(예를 들어, iPSC(유도 만능 줄기 세포), 성인 줄기 세포(예컨대, 중간엽 줄기 세포), 및 배아 줄기 세포 포함), 및 섬유아세포를 포함하나, 이에 제한되지 않는, 정상 또는 암 세포주 또는 신체로부터 제거된 임의의 1차 세포로부터 유래된(예컨대, 수득된) 임의의 유핵 세포로부터 세포 핵을 제거하는 방법(또는 제핵으로 명명)을 제공한다. 세포 제핵은 제한된 시간, 예를 들어, 최대 5일 동안 생존가능한 치료용 세포질체를 생성할 수 있다. 따라서, 일부 측면에서, 본 개시내용은 하기 작용: 증식, 분화, 피험체에 영구적으로 생착, 암화 또는 피험체에게 핵 코딩된 DNA/유전자 전달(예컨대, 위험한 핵 코딩된 DNA/유전자를 피험체에게 전달) 중 하나 이상을 수행할 수 없는 안전한 치료 비히클로서의 세포질체에 대한 새로운 용도를 제공한다.
세포 기반 요법의 경우, 일부 경우에, FDA 승인은, 세포가 일단 피험체 내부에서는 변경되지 않거나, 위험해지지 않는다는 것을 의미하는 것으로 세포가 안정적이라는 증거에 기반을 두고 있다. 그러나, 1차 세포, 방사선 조사된 세포 또는 "사멸 스위치" 제어 세포를 포함한 현재의 세포 제품은 여전히 생체내 미세 환경에 반응하거나, 또는 변화할 가능성이 있다. 중요하게도, 현행 요법은 생체내에서 제어가능한 반응이 아닌 새로운 유전자를 전사할 가능성을 여전히 유지할 수 있다. 이 유전자 전사는 규제 요구 사항을 충족하는 능력을 방해한다. 그에 반해, 핵이 결여된 세포질체는 일반적으로 매우 다른 생체내 미세 환경에서도 새로운 유전자 전사의 가능성이 없으므로 더욱 제거되고, 더욱 안전한 세포 기반 요법이다.
현재까지, 세포 기반 치료제는 일반적으로 정상 또는 조작된 유핵 세포를 사용한다. 일부 세포 기반 요법은 세포 증식 및 유도된 치명적인 DNA 손상을 방지하기 위해 피험체 투여 전에 세포에 조사한다. 그러나, 이 접근법은 돌연변이를 유도하고, 세포 단백질과 DNA를 비가역적으로 손상시킬 수 있는 상당한 양의 활성 산소 종을 생성하여 많은 양의 손상/돌연변이 DNA를 피험체의 신체로 방출할 수 있다. 이러한 생성물은 다른 세포에 통합되거나 원치 않는 항DNA 면역 반응을 유도하는 경우 위험할 수 있다. 조사된 세포는 또한 세포-세포 융합에 의해 돌연변이된 DNA와 유전자를 숙주 세포로 전달할 수 있기 때문에 위험할 수 있다. 세포에서 전체 핵을 제거하는 것은 피험체에 핵 DNA가 도입되는 것을 막을 수 있는 세포 수명을 제한하기 위한 덜 손상되고 상당히 안전한 방법이다. 추가로, 중간엽 줄기 세포(MSC)와 같은 많은 줄기 세포는 방사선 유발 사멸에 대한 저항성이 높기 때문에 이 방법을 사용하여 안전하게 만들 수 없다. 다른 경우에, 치료 세포는 세포 수명을 제한하기 위해 약물 유도성 자살 스위치로 조작되었다. 그러나, 생체내에서 스위치의 활성화는 원치않는 부작용이 있는 강력하고, 잠재적으로 유해한 약물을 피험체에게 투여해야 할 수 있다. 이 방법은 배양 세포에서 자살을 유도할 수 있지만(예컨대, 95% 초과), 임상으로 번역될 때 비효율적일 것으로 예상된다. 임의의 특정 이론에 얽매이지 않고, 피험체의 모든 세포가 약물 유도성 사멸을 겪을 수는 없기 때문에, 약물 유도성 자살 스위치는 임상 실습을 위한 불충분한 안전 조치일 수 있다고 간주된다. 따라서, 광범위하게 조작된 세포 또는 줄기 세포 또는 암 세포의 경우, 약물 유도성 자살 스위치는 임상 실습에 위험하거나 불충분한 것으로 간주될 수 있다. 더욱이, 치료 세포의 사멸은 숙주 세포에 통합되거나, 위험한 전신 항DNA 면역 반응을 유도할 수 있는 다량의 DNA(정상 또는 유전적으로 변경된)를 방출할 수 있다. 세포가 돌연변이화되고/거나, 자살 스위치를 상실하거나, 불활성화시키면, 제어할 수 없는 돌연변이체 세포가 될 수 있다. 추가로, 이들 세포는 피험체의 숙주 세포와 융합할 수 있으므로, DNA(예컨대, 돌연변이체 DNA)를 전달할 수 있다. 이러한 융합된 세포는 모든 숙주 세포가 자살 유전자를 유전으로 이어받는 것은 아니지만, 염색체 재구성 및 세포 하이브리드화 동안 치료 세포의 유전자/DNA 중 일부를 유전으로 이어받을 수 있기 때문에 위험할 수 있다. 추가로, 같은 이유로, 자살 스위치가 있는 치료 세포는 시험관내에서 세포 융합 파트너로 사용하기에 이상적이지 않을 수 있다. 치료 세포 수명을 제한하는 또 다른 방법은 치료 용도(예컨대, 단백질 번역)에 유익한 생물학적 기능을 종료시키는 심각한 손상을 유발하는 열 유발 사멸이다. 세포질체와 달리 유핵 세포 요법 및 심지어는 상기 기술된 방법에 의해 불활성화된 일부 세포는 핵 및 유전 물질을 보유하기 때문에 여전히 피험체에게 DNA를 전달할 수 있다. 화학요법제 약물 및 미토마이신 C 등을 비롯한 수많은 화학물질이 치료 사용 전에 세포 증식을 억제하거나, 세포 사멸을 유발한다. 그러나, 이러한 약물은 세포를 현저하게 손상시키는 상당한 표적외 효과를 가질 수 있으며, 이는 높은 독성에 기인하여 임상 적용에 바람직하지 않다. 많은 항증식제 및 사멸 유도 약물은 내성으로 인해 세포를 100% 효과적으로 억제하지 못하며, 세포질체와 달리 많은 약물 효과가 가역적이다. 따라서, 이 접근법은 생체내에서 불멸화된 세포 또는 암 세포의 세포 성장을 방지하는 데 적합하지 않다.
본원에서는 본 개시내용의 세포질체를 제조하는 방법을 제공한다. 일부 실시양태에서, 유핵 세포(예컨대, 본원에서 "모세포"로 지칭됨)는 피질 액틴 세포골격을 연화시키기 위해 사이토칼라신 B로 처리된다. 일부 실시양태에서, 방법은 예컨대, 바이러스 펩티드 또는 단백질과 같은 활성제를 유핵 세포에 도입하는 단계; 및 모세포로부터 핵을 기계적으로 제거하여 세포질체를 생성하는 단계(핵제거)를 포함한다. 일부 실시양태에서, 모세포는 또한 제핵 전에 제2 활성제에 도입된다. 일부 실시양태에서, 모세포는 제핵 후에 제2 활성제에 도입된다. 제2 활성제는 세포질체에 의해 표적 세포로 전달되는 치료제일 수 있다. 예시적인 표적 세포는 근아세포 또는 성숙한 근육 세포와 같은 근육 세포이다.
활성제는 적절한 일시적 형질감염 방법(예컨대, 전기천공) 또는 형질도입(예컨대, 바이러스 매개)을 사용하여 모세포에 도입된다. 일부 실시양태에서, 활성제를 코딩하는 트랜스진을 포함하는 플라스미드는 모세포 내로 형질감염된다. 일부 실시양태에서, 활성제를 코딩하는 트랜스진을 포함하는 바이러스 벡터는 모세포 내로 형질도입된다. 플라스미드는 박테리아 플라스미드(예컨대, E. 콜라이(E. coli))일 수 있다. 일부 실시양태에서, 모세포는 또한 유사한 방법에 의해 제2 활성제에 도입된다. 일부 실시양태에서, 제2 활성제는 치료제이다.
활성제, 및 임의적으로, 제2 활성제를 발현하는 모세포의 핵은 기계적 제핵을 사용하여 제거된다. 일부 실시양태에서, 모세포 벽은 세포 투과성 진균독소를 사용하여 투과화된다. 기계적 제핵은 세포질체를 형성하기 위해 불연속적인 피콜 구배를 사용한 밀도 구배 원심분리, 고속 원심분리를 수행하는 것을 포함할 수 있다. 세포질체는 표준 정제 프로토콜을 사용하여 분리되고 정제된다. 세포질체는 외인성 핵산(예컨대, mRNA, DNA, 안티센스 올리고뉴클레오티드)으로 추가로 조작될 수 있다.
본 개시내용은 DNA/유전자(예컨대, 플라스미드) RNA(예컨대, mRNA, shRNA, siRNA, miRNA), 단백질, 펩티드, 소분자 치료제(예컨대, 소분자 약물), 유전자 편집 성분, 나노입자, 및 다른 치료제(예컨대, 박테리아, 박테리아 포자, 박테리오파지, 박테리아 성분, 바이러스(예컨대, 종양용해성 바이러스), 엑소좀, 지질 또는 이온)를 포함하나, 이에 제한되지 않는, 치료 기능을 갖는 생체분자의 자연적 또는 유도성 발현 및/또는 흡수를 갖는 세포질체의 제조 방법을 제공한다.
생체분자(예컨대, RNA 분자(예컨대, mRNA, miRNA, siRNA, shRNA, lncRNA), DNA 분자(예컨대, 플라스미드), 단백질, 유전자 편집 인자(예컨대, CRISPR/Cas9 유전자 편집 인자), 펩티드, 플라스미드)를 세포질체(예컨대, 본원에 기술된 임의의 세포로부터 유래된 세포질체) 내로 도입하는 데 사용될 수 있는 다양한 방법이 당업계에 공지되어 있다. 생체분자를 세포질체에 도입하는 데 사용될 수 있는 방법의 비제한적 예로는 전기천공, 미세주입, 리포펙션, 형질감염, 인산칼슘 형질감염, 덴드리머 기반 형질감염, 양이온성 중합체 형질감염, 세포 압착, 초음파천공, 광학 형질감염, 임팰렉션(impalection), 유체역학적 전달, 마그네토펙션 및 나노입자 형질감염을 포함한다. 유전자 편집 인자의 비제한적 예는 CRISPR/Cas9 유전자 편집, 전사 활성제 유사 이펙터 뉴클레아제(TALEN: transcription activator-like effector nuclease), 및 아연 핑거 뉴클레아제를 포함한다.
세포(예컨대, 본원에 기술된 임의의 세포)를 배양하는 방법은 당업계에 널리 공지되어 있다. 세포는 3차원 배양, 저산소 환경, 정의된 세포외 기질 성분, 화학 작용제, 사이토카인, 성장 인자로 처리, 또는 특정 바람직한 세포 반응을 유도하는 천연 또는 합성 외인성 작용제에 대한 노출에서의 배양을 포함하나, 이에 제한되지 않는, 치료 능력/이점을 가진 특정 생물학적 기능의 성장, 증식, 생존능, 분화 및/또는 유도에 바람직한 조건하에 시험관내에서 유지될 수 있다.
방법은 임의의 유핵 세포 유형(예컨대, 포유동물 세포, 인간 세포), 원생동물 세포(예컨대, 아메바 세포), 조류 세포, 식물 세포, 진균 세포, 무척추동물 세포, 어류 세포, 양서류 세포, 파충류 세포, 또는 조류 세포)로부터 유래된 (예컨대, 수득된) 세포질체의 대규모 시험관내 제조를 포함한다. 예를 들어, 세포는 자연적으로 또는 유전 공학에 의해 불멸화 및/또는 발암성 형질전환될 수 있다.
본원에서는 세포질체의 생물학적 활성이 느려지거나 완전히 정지되도록 본 개시내용의 정제 및 단리된 세포질체를 보관하는 방법을 제공한다. 일부 실시양태에서, 세포질체는 최대 10℃인 온도에서 가사 상태로 보관된다. 본원에서는 세포질체의 생물학적 활성이 저속화되거나, 또는 완전히 정지되도록 본 개시내용의 정제 및 단리된 세포질체를 보관하는 방법을 제공한다. 일부 실시양태에서, 세포질체는 최대 10℃인 온도에서 가사 상태로 보관된다. 일부 실시양태에서, 온도는 약 4℃이다. 일부 실시양태에서, 온도는 4℃이다. 일부 실시양태에서, 온도는 최대 4℃이다. 일부 실시양태에서, 세포질체는 최대 약 96시간 동안 보관된다. 일정 시간 후, 세포질체는 세포질체의 생물학적 활성을 회복시키기 위해 가사 상태에서 제거된다. 생성된 세포질체는 생존가능하고, 그를 필요로 하는 피험체에게 전달하기에 적합하다. 일부 실시양태에서, 4℃ 내지 10℃에서 보관된 세포질체는 4℃ 내지 10℃에서 보관되기 전의 세포질체와 비교하여 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상의 생존능을 나타낸다.
본원에 제공된 조성물 및 방법 중 임의의 것의 일부 실시양태에서, 세포질체는 추후 사용을 위해 냉각 또는 동결된다. 극저온에서 혈청(예컨대, 우태아 혈청) 및 디메틸 술폭시드(DMSO)를 사용(동결 동결보존)하거나 4℃에서 보관하기 위한 동면 배지를 사용하는 것(냉동동면)을 포함하나, 이에 제한되지 않는 세포를 보존하는 다양한 방법이 당업계에 알려져 있다. 본원에 제공된 임의의 조성물 및 방법의 일부 실시양태에서, 세포질체는 사용 전에 해동된다.
일부 실시양태에서, 세포질체는 약 -80℃ 내지 약 16℃(예컨대, 약 -80℃ 내지 약 12℃, -80℃ 내지 약 10℃, 약 -80℃ 내지 약 8℃, 약 -80℃ 내지 약 6℃, 약 -80℃ 내지 약 4℃, 약 -80℃ 내지 약 2℃, 약 -80℃ 내지 약 0℃, 약 -80℃ 내지 약 -4℃, 약 -80℃ 내지 약 -10℃, 약 -80℃ 내지 약 -16℃, 약 -80℃ 내지 약 -20℃, 약 -80℃ 내지 약 -25℃, 약 -80℃ 내지 약 -30℃, 약 -80℃ 내지 약 -35℃, 약 -80℃ 내지 약 -40℃, 약 -80℃ 내지 약 -45℃, 약 -80℃ 내지 약 -50℃, 약 -80℃ 내지 약 -55℃, 약 -80℃ 내지 약 -60℃, 약 -80℃ 내지 약 -65℃, 약 -80℃ 내지 약 -70℃, 약 -60℃ 내지 약 16℃, 약 -60℃ 내지 약 12℃, 약 -60℃ 내지 약 10℃, 약 -60℃ 내지 약 8℃, 약 -60℃ 내지 약 6℃, 약 -60℃ 내지 약 4℃, 약 -60℃ 내지 약 2℃, 약 -60℃ 내지 약 0℃, 약 -60℃ 내지 약 -4℃, 약 -60℃ 내지 약 -10℃, 약 - 60℃ 내지 약 -10℃, 약 -60℃ 내지 약 -16℃, 약 -60℃ 내지 약 -20℃, 약 -60℃ 내지 약 -25℃, 약 -60℃ 내지 약 -30℃, 약 -60℃ 내지 약 -35℃, 약 -60℃ 내지 약 -40℃, 약 -60℃ 내지 약 -50℃, 약 -50℃ 내지 약 16℃, 약 -50℃ 내지 약 12℃, 약 -50℃ 내지 약 10℃, 약 -50℃ 내지 약 8℃, 약 -50℃ 내지 약 6℃, 약 -50℃ 내지 약 4℃, 약 -50℃ 내지 약 2℃, 약 -50℃ 내지 약 0℃, 약 -50℃ 내지 약 -4℃, 약 -50℃ 내지 약 -10℃, 약 -50℃ 내지 약 -16℃, 약 -50℃ 내지 약 -20℃, 약 -50℃ 내지 약 -30℃, 약 -50℃ 내지 약 -40℃, 약 -20℃ 내지 약 16℃, 약 -20℃ 내지 약 12℃, 약 -20℃ 내지 약 10℃, 약 -20℃ 내지 약 8℃, 약 -20℃ 내지 약 6℃, 약 -20℃ 내지 약 4℃, 약 -20℃ 내지 약 2℃, -약 20℃ 내지 약 0℃, 약 -20℃ 내지 약 -4℃, 약 -20℃ 내지 약 -10℃, 약 - 20℃ 내지 약 -15℃, 약 -10℃ 내지 약 16℃, 약 -10℃ 내지 약 12℃, 약 -10℃ 내지 약 10℃, 약 -10℃ 내지 약 8℃, 약 -10℃ 내지 약 6℃, 약 -10℃ 내지 약 4℃, 약 -10℃ 내지 약 2℃, 약 -10℃ 내지 약 0℃, 약 -10℃ 내지 약 -4℃, 약 -10℃ 내지 약 -6℃, 약 -4℃ 내지 약 16℃, 약 -4℃ 내지 약 10℃, 약 -4℃ 내지 약 6℃, 약 -4℃ 내지 약 4℃, 약 -4℃ 내지 약 2℃, 약 -4℃ 내지 약 0℃, 약 -2℃ 내지 약 16℃, 약 -2℃ 내지 약 12℃, 약 -2℃ 내지 약 10℃, 약 -2℃ 내지 약 6℃, 약 -2℃ 내지 약 4℃, 약 -2℃ 내지 약 2℃, 약 -2℃ 내지 약 0℃, 약 0℃ 내지 약 16℃, 약 0℃ 내지 약 14℃, 약 0℃ 내지 약 12℃, 약 0℃ 내지 약 10℃, 약 0℃ 내지 약 8℃, 약 0℃ 내지 약 6℃, 약 0℃ 내지 약 4℃, 약 2℃ 내지 약 16℃, 약 2℃ 내지 약 12℃, 약 2℃ 내지 약 10℃, 약 2℃ 내지 약 8℃, 약 2℃ 내지 약 6℃, 약 2℃ 내지 약 4℃, 약 4℃ 내지 약 16℃, 약 4℃ 내지 약 12℃, 약 4℃ 내지 약 10℃, 약 4℃ 내지 약 8℃, 약 4℃ 내지 약 6℃, 약 6℃ 내지 약 16℃, 약 6℃ 내지 약 12℃, 약 6℃ 내지 약 10℃, 약 6℃ 내지 약 8℃, 약 8℃ 내지 약 16℃, 약 8℃ 내지 약 12℃, 약 8℃ 내지 약 10℃, 약 10℃ 내지 약 16℃, 약 10℃ 내지 약 12℃, 또는 약 12℃ 내지 약 16℃) 온도에서 약 1일 내지 약 7일(예컨대, 약 1일 내지 약 6일, 약 1일 내지 약 5일, 약 1일 내지 약 4일, 약 1일 내지 약 3일, 약 1일 내지 약 2일, 약 2일 내지 약 7일, 약 2일 내지 약 6일, 약 2일 내지 약 5일, 약 2일 내지 약 4일, 약 2일 내지 약 3일, 약 3일 내지 약 7일, 약 3일 내지 약 6일, 약 3일 내지 약 5일, 약 3일 내지 약 4일, 약 4일 내지 약 7일, 약 4일 내지 약 6일, 약 4일 내지 약 5일, 약 5일 내지 약 7일, 약 5일 내지 약 6일, 또는 약 6일 내지 약 7일) 동안 보관될 수 있다. 일부 실시양태에서, 본원에 기술된 온도 범위에서 보관된 세포질체는 동일한 온도 범위에서 보관되기 전의 세포질체와 비교하여 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상의 생존능을 나타낸다.
일부 실시양태에서, 세포질체는 동결건조된 것이다. 일부 실시양태에서, 세포질체는 보관을 위해 동결건조된 것이다. 일부 실시양태에서, 세포질체는 적어도 1시간, 2시간, 4시간, 6시간, 8시간, 12시간, 24시간, 2일, 3일, 4일, 5일, 6일, 7일, 8일, 9일, 10일, 12일, 14일, 16일, 18일, 20일, 22일, 24일, 26일, 28일, 30일, 2개월, 3개월, 4개월, 5개월, 6개월, 2개월, 3개월, 4개월, 5개월, 6개월, 7개월, 8개월, 9개월, 10개월, 11개월, 12개월, 18개월, 24개월, 30개월, 3년, 4년, 5년, 또는 10년 이상 동안 동결건조된 것이다. 일부 실시양태에서, 세포질체는 동결건조 이전의 세포질체와 비교하여 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상의 생존능을 나타낸다.
IV.
키트
일부 실시양태에서, 본원에서는 본원에 기술된 조성물, 약학적 조성물, 또는 세포질체를 사용하기 위한 키트를 개시한다. 일부 실시양태에서, 본원에 개시된 키트는 피험체에서 질환 또는 병태를 예방하거나, 또는 치료하는 데; 또는 본원에 개시된 질환 또는 병태에 대한 예방 또는 치료를 위한 피험체를 선별하는 데 사용될 수 있다. 일부 실시양태에서, 키트는 본원에 기술된 방법을 수행하는 데 사용될 수 있는 본원에 기술된 약학적 조성물, 조성물, 또는 세포질체를 포함한다. 키트는 물질 또는 성분의 집합을 포함한다. 따라서, 일부 실시양태에서, 키트는 본원에 기술된 질환 또는 장애의 치료를 위한 약학적 조성물 또는 세포질체를 포함하는 조성물을 함유한다.
일부 실시양태에서, 본원에 기술된 키트는 균질한 세포질체 집단을 선택하기 위한 성분을 포함한다. 일부 실시양태에서, 본원에 기술된 키트는 이종성 세포질체 집단을 선택하기 위한 성분을 포함한다. 일부 실시양태에서, 키트는 세포질체에 의해 합성되거나, 방출된 외인성 치료제의 단위수를 검정하기 위한 성분을 포함한다. 일부 실시양태에서, 키트는 세포질체의 표면 상에 발현된 외인성 치료제의 단위수를 검정하기 위한 성분을 포함한다. 일부 실시양태에서, 키트는 예컨대, 효소 결합 면역 흡착 검정법(ELISA: enzyme-linked immunosorbent assay), 단일 분자 어레이(Simoa: single-molecular array), PCR 및 qPCR과 같은 검정을 수행하기 위한 성분을 포함한다. 키트에 구성된 성분의 정확한 성질은 의도된 목적에 따라 달라진다. 예를 들어, 일부 실시양태는 피험체에서 본원에 개시된 질환 또는 병태(예컨대, 호흡기 질환)를 백신접종하거나, 또는 치료할 목적으로 구성된다. 일부 실시양태에서, 키트는 특히 포유동물 피험체를 백신접종하거나, 또는 치료할 목적으로 구성된다. 일부 실시양태에서, 키트는 특히 인간 피험체를 백신접종하거나, 또는 치료할 목적으로 구성된다.
사용 설명서가 키트에 포함될 수 있다. 예를 들어, 설명서는 의료 시설 또는 현장 진료 능력에서 키트의 성분으로 피험체에 백신접종하는 방법을 의료 제공자에게 지시할 수 있다. 임의적으로, 키트는 예컨대, 희석제, 완충제, 약학적으로 허용되는 담체, 주사기, 카테터, 도포기, 피펫팅 또는 측정 도구, 붕대 물질 또는 다른 유용한 도구와 같은 다른 유용한 성분도 함유한다. 조작성과 유용성을 보존하는 임의의 편리하고 적절한 방식으로 보관된 키트에 조립된 물질 또는 성분은 의사에게 제공될 수 있다. 예를 들어, 성분은 용해, 탈수 또는 동결건조된 형태일 수 있고; 그들은 실온, 냉장 또는 동결 온도에서 제공될 수 있다. 성분은 전형적으로 적합한 포장재(들)에 포함된다. 본원에서 사용되는 바, "포장재"라는 어구는 예컨대, 조성물 등과 같은 키트의 내용물을 수용하는 데 사용되는 하나 이상의 물리적 구조를 지칭한다. 포장재는 널리 공지된 방법으로 구성되며, 바람직하게는 멸균 상태의 오염 물질이 없는 환경을 제공한다. 키트에 사용된 포장재는 유전자 발현 검정법 및 치료제 투여에 관례적으로 사용되는 것이다. 본원에서 사용되는 바, 용어 "패키지"는 개별 키트 성분을 수용할 수 있는 적합한 고체 매트릭스 또는 물질, 예컨대, 유리, 플라스틱, 종이, 호일 등을 지칭한다. 따라서, 예를 들어, 패키지는 적절한 양의 약학적 조성물을 함유하는 데 사용되는 유리 바이알 또는 미리 충전된 시린지일 수 있다. 포장재에는 내용물 및/또는 키트 및 그의 성분의 목적을 나타내는 외부 라벨이 있다.
V. 정의
달리 정의되지 않는 한, 본원에 사용된 모든 기술 용어, 표기법 및 다른 기술 및 과학 용어 또는 용어들은 청구된 주제가 속하는 기술 분야의 통상의 기술자가 일반적으로 이해하는 것과 동일한 의미를 갖는 것으로 의도된다. 일부 실시양태에서, 일반적으로 이해되는 의미를 갖는 용어는 명료성을 위해 및/또는 용이한 참조를 위해 본원에 정의되며, 본원에 이러한 정의를 포함하는 것이 반드시 당업계에서 일반적으로 이해되는 것과 실질적인 차이를 나타내는 것으로 해석되어서는 안 된다.
본 출원 전역에 걸쳐, 다양한 실시양태가 범위 포맷으로 제시될 수 있다. 범위 포맷의 설명은 단지 편의와 간결함을 위한 것이며, 본 개시내용의 범주에 대한 융통성 없는 제한으로 해석되어서는 안된다는 것을 이해하여야 한다. 따라서, 범위에 대한 설명은 가능한 모든 하위범위와 해당 범위 내의 개별 수치를 구체적으로 개시한 것으로 간주되어야 한다. 예를 들어, 예컨대, 1 내지 6과 같은 범위의 설명은 예컨대, 1 내지 3, 1 내지 4, 1 내지 5, 2 내지 4, 2 내지 6, 3 내지 6 등과 같은 하위범위 뿐만 아니라, 해당 범위 내의 개별 수치, 예를 들어, 1, 2, 3, 4, 5, 및 6을 구체적으로 개시한 것으로 간주되어야 한다. 이는 범위의 폭에 관계없이 적용된다.
명세서 및 청구범위에 사용된 바와 같이, "하나"("a," "an") 및 "그"라는 단수 형태는 문맥에서 명백하게 달리 지시하지 않는 한, 복수의 지시 대상을 포함한다. 예를 들어, "한 샘플"이라는 용어는 그의 혼합물을 포함하는 복수의 샘플을 포함한다.
예를 들어 "~할 것이다," "~하지 않을 것이다," "~해야 한다," "~하지 말아야 한다," "~해야 한다," "~하면 안된다," "먼저," "처음에," "다음에," "이어서," "전," "후," "마지막으로" 및 "최종적으로"와 같은 절대적 또는 순차적 용어의 사용은 본원에 개시된 본 실시양태의 범주를 제한하려는 것이 아니라, 예시적인 것으로 의도된다.
본원에서 사용되는 바, "적어도 하나의," "하나 이상의", 및 "및/또는"이라는 어구는 사용시 접속 및 이접 모두인 개방형 표현이다. 예를 들어, "A, B 및 C 중 적어도 하나," "A, B 또는 C 중 적어도 하나," "A, B 및 C 중 하나 이상," "A, B 또는 C 중 하나 이상" 및 "A, B, 및/또는 C"라는 표현은 각각 A, B 또는 C" 및 "A, B 및/또는 C"는 A 단독, B 단독, C 단독, A 및 B 함께, A 및 C 함께, B 및 C 함께 또는 A, B 및 C 함께인 것을 의미한다.
"적어도," "초과" 또는 "이상"이라는 용어가 일련의 2개 이상의 숫자 값에서 첫 번째 숫자 값 앞에 위치할 때마다, "적어도," "초과" 또는 "이상"이라는 용어는 일련의 숫자 값에 있는 각 숫자 값에 적용된다. 예를 들어, 1, 2 또는 3 이상은 이상, 2 이상, 또는 3 이상과 같다.
"이하(no more than)," "미만," "이하" 또는 "이하(less than or equal to)"라는 용어가 일련의 2개 이상의 숫자 값에서 첫 번째 숫자 값 앞에 위치할 때마다, "이하," "미만," "이하" 또는 "이하"라는 용어는 일련의 숫자 값에 있는 각 숫자 값에 적용된다. 예를 들어, 3, 2 또는 1 이하는 3 이하, 2 이하, 또는 1 이하와 같다.
본원에 기술된 모든 시스템, 방법, 소프트웨어, 조성물 및 플랫폼은 모듈식이며, 순차적 단계로 제한되지 않는다. 따라서, "첫 번째" 및 "두 번째"와 같은 용어가 반드시 우선 순위, 중요도 또는 행위 순서를 의미하는 것은 아니다.
본원에서 사용되는 바, "증가된" 또는 "증가"라는 용어는 일반적으로 통계상 유의적인 양만큼의 증가를 의미한다. 일부 실시양태에서, "증가된" 또는 "증가"라는 용어는 기준 수준과 비교하여 적어도 10%의 증가, 예를 들어, 기준 수준, 표준, 또는 대조군과 비교하여 적어도 약 10%, 적어도 약 20%, 또는 적어도 약 30%, 또는 적어도 약 40%, 또는 적어도 약 50%, 또는 적어도 약 60%, 또는 적어도 약 70%, 또는 적어도 약 80%, 또는 적어도 약 90% 또는 최대 100% 증가(및 100% 증가 포함) 또는 10-100% 사이의 임의의 증가를 의미한다. "증가"의 다른 예로는 기준 수준과 비교하여 적어도 2배, 적어도 5배, 적어도 10배, 적어도 20배, 적어도 50배, 적어도 100배, 적어도 1000배 또는 그 초과의 증가를 포함한다.
본원에서 사용되는 바, "감소된" 또는 "감소"라는 용어는 일반적으로 통계상 유의적인 양만큼의 감소를 의미한다. 일부 실시양태에서, "감소된" 또는 "감소"라는 용어는 기준 수준과 비교하여 적어도 10%만큼의 감소, 예를 들어, 기준 수준과 비교하여 적어도 약 20%, 또는 적어도 약 30%, 또는 적어도 약 40%, 또는 적어도 약 50%, 또는 적어도 약 60%, 또는 적어도 약 70%, 또는 적어도 약 80%, 또는 적어도 약 90% 또는 최대 100%만큼의 감소(및 100% 감소 포함)(예컨대, 기준 수준과 비교하여 수준 부재 또는 검출불가능한 수준), 또는 10-100% 사이의 임의의 감소를 의미한다. 마커 또는 증상과 관련하여, 본 용어는 상기 수준의 통계상 유의적인 감소를 의미한다. 감소는 예를 들어, 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40% 또는 그 초과일 수 있고, 바람직하게는 주어진 질환을 앓는 개체에 대한 정상 범위 내에 포함되는 것으로 허용되는 수준까지 하락하는 것이다. "감소"의 다른 예는 기준 수준과 비교하여 적어도 2배, 적어도 5배, 적어도 10배, 적어도 20배, 적어도 50배, 적어도 100배, 적어도 1000배 또는 그 초과의 감소를 포함한다.
본원에서 사용되는 바, "세포"는 일반적으로 살아있는 유기체의 생물학적 단위를 지칭한다.
본원에서 사용되는 바, 용어 "진핵 세포"는 별개의 막 결합 핵을 갖는 세포를 지칭한다. 이러한 세포는 예를 들어, 포유동물(예컨대, 설치류, 인간이 아닌 영장류 또는 인간), 비포유동물(예컨대, 어류, 조류, 파충류 또는 양서류), 무척추동물, 곤충, 진균 또는 식물 세포를 포함할 수 있다. 일부 실시양태에서, 진핵 세포는 효모세포, 예컨대, 사카로마이세스 세레비지아에이다. 일부 실시양태에서, 진핵 세포는 포유동물, 조류, 식물 또는 곤충 세포와 같은 고등 진핵생물이다.
본원에서 사용되는 바, 용어 "세포질체," "핵이 없는 세포," 또는 "제핵 세포"는 이전의 유핵 세포(예컨대, 본원에 기술된 임의의 세포)로부터 수득된 핵이 없는 세포를 지칭하는 것으로 상호교환적으로 사용된다. 일부 실시양태에서, 유핵 세포는 세포 세포소기관을 포함하고, 유핵 세포로부터 유래된 세포질체는 이러한 세포소기관을 보유하고, 이는 일부 경우에 세포 운동성, 단백질 합성, 단백질 분비 등과 같은 세포 기능을 가능하게 한다. 일부 실시양태에서, "수득하는"이라는 것은 자연적 프로세스 또는 다른 방법을 사용하여 유핵 세포를 제핵 세포로 분화시키는 것을 포함하지 않는다.
본원에서 사용되는 바, 용어 "뉴클레오티드"는 일반적으로 염기-당-포스페이트 조합을 지칭한다. 뉴클레오티드는 합성 뉴클레오티드를 포함할 수 있다. 뉴클레오티드는 합성 뉴클레오티드 유사체를 포함할 수 있다. 뉴클레오티드는 핵산 서열의 단량체 단위일 수 있다(예컨대, 데옥시리보핵산(DNA: deoxyribonucleic acid) 및 리보핵산(RNA: ribonucleic acid)). 용어 뉴클레오티드는 리보뉴클레오시드 트리포스페이트 아데노신 트리포스페이트(ATP: adenosine triphosphate), 우리딘 트리포스페이트(UTP: uridine triphosphate), 시토신 트리포스페이트(CTP: cytosine triphosphate), 구아노신 트리포스페이트(GTP: guanosine triphosphate) 및 데옥시리보뉴클레오시드 트리포스페이트, 예컨대, dATP, dCTP, dITP, dUTP, dTTP, 또는 그의 유도체를 포함할 수 있다. 이러한 유도체는 예를 들어, [αS]dATP, 7-데아자-dGTP 및 7-데아자-dATP, 및 그를 함유하는 핵산 분자에 뉴클레아제 내성을 부여하는 뉴클레오티드 유도체를 포함할 수 있다. 본원에서 사용되는 바, 용어 뉴클레오티드는 디데옥시리보뉴클레오시드 트리포스페이트(ddNTP: dideoxyribonucleoside triphosphate) 및 그의 유도체를 지칭할 수 있다. 디데옥시리보뉴클레오시드 트리포스페이트의 예시적인 예는 ddATP, ddCTP, ddGTP, ddITP 및 ddTTP를 포함할 수 있지만, 이에 제한되지 않는다. 뉴클레오티드는 표지되지 않거나, 널리 공지된 기술에 의해 검출가능하게 표지될 수 있다. 표지화는 양자점으로도 수행할 수 있다. 검출가능한 표지는 예를 들어, 방사성 동위원소, 형광 표지, 화학발광 표지, 생물발광 표지 및 효소 표지를 포함할 수 있다. 뉴클레오티드의 형광 표지는 플루오레세인, 5-카복시플루오레세인(FAM), 2'7'-디메톡시-4'5-디클로로-6-카복시플루오레세인(JOE), 로다민, 6-카복시로다민(R6G), N,N,N',N'-테트라메틸-6-카복시로다민(TAMRA), 6-카복시-X-로다민(ROX), 4-(4'디메틸아미노페닐아조) 벤조산(DABCYL), 캐스케이드 블루, 오레곤 그린, 텍사스 레드, 시아닌 및 5-(2'-아미노에틸)아미노나프탈렌-1-술폰산(EDANS)을 포함할 수 있지만, 이에 제한되지 않는다. 표지된 뉴클레오티드의 특정 예는 퍼킨 엘머(Perkin Elmer: 미국 캘리포니아주 포스터 시티 소재)로부터 이용가능한, [R6G]dUTP, [TAMRA]dUTP, [R110]dCTP, [R6G]dCTP, [TAMRA]dCTP, [JOE]ddATP, [R6G]ddATP, [FAM]ddCTP, [R110]ddCTP, [TAMRA]ddGTP, [ROX]ddTTP, [dR6G]ddATP, [dR110]ddCTP, [dTAMRA]ddGTP, 및 [dROX]ddTTP; 아마샴(Amersham: 미국 일리노이주 알링턴 헤이츠 소재)으로부터 이용가능한 플루오로링크(FluoroLink) 데옥시뉴클레오티드, 플루오로링크 Cy3-dCTP, 플루오로링크 Cy5-dCTP, 플루오로링크 Fluor X-dCTP, 플루오로링크 Cy3-dUTP, 및 플루오로링크 Cy5-dUTP; 베링거 만하임(Boehringer Mannheim: 미국 인디애나주 인디애나폴리스 소재)으로부터 이용가능한 플루오레세인-15-dATP, 플루오레세인-12-dUTP, 테트라메틸-로다민-6-dUTP, IR770-9-dATP, 플루오레세인-12-ddUTP, 플루오레세인-12-UTP, 및 플루오레세인-15-2'-dATP; 및 몰레큘라 프로브즈(Molecular Probes: 미국 오레곤주 유진 소재)로부터 이용가능한 염색체 표지된 뉴클레오티드, BODIPY-FL-14-UTP, BODIPY-FL-4-UTP, BODIPY-TMR-14-UTP, BODIPY-TMR-14-dUTP, BODIPY-TR-14-UTP, BODIPY-TR-14-dUTP, 캐스케이드 블루-7-UTP, 캐스케이드 블루-7-dUTP, 플루오레세인-12-UTP, 플루오레세인-12-dUTP, 오레곤 그린 488-5-dUTP, 로다민 그린-5-UTP, 로다민 그린-5-dUTP, 테트라메틸로다민-6-UTP, 테트라메틸로다민-6-dUTP, 텍사스 레드-5-UTP, 텍사스 레드-5-dUTP, 및 텍사스 레드-12-dUTP를 포함할 수 있다. 뉴클레오티드는 또한 화학적 변형에 의해 표지화되거나, 또는 마킹될 수 있다. 화학적으로 변형된 단일 뉴클레오티드는 비오틴-dNTP일 수 있다. 비오티닐화된 dNTP의 일부 비제한적인 예로는 비오틴-dATP(예컨대, bio-N6-ddATP, 비오틴-14-dATP), 비오틴-dCTP(예컨대, 비오틴-11-dCTP, 비오틴-14-dCTP), 및 비오틴-dUTP(예컨대, 비오틴-11-dUTP, 비오틴-16-dUTP, 비오틴-20-dUTP)를 포함할 수 있다.
용어 "폴리뉴클레오티드," "올리고뉴클레오티드," 및 "핵산"은 단일-, 이중-, 또는 다중-가닥 형태의, 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 또는 그의 유사체인 임의의 길이의 뉴클레오티드의 중합체 형태를 지칭하는 것으로 상호교환적으로 사용된다. 폴리뉴클레오티드는 세포에 대해 외인성 또는 내인성일 수 있다. 폴리뉴클레오티드는 무세포 환경에 존재할 수 있다. 폴리뉴클레오티드는 유전자 또는 그의 단편일 수 있다. 폴리뉴클레오티드는 DNA일 수 있다. 폴리뉴클레오티드는 RNA일 수 있다. 폴리뉴클레오티드는 임의의 3차원 구조를 가질 수 있으며, 알려지거나, 또는 알려지지 않은 모든 기능을 수행할 수 있다. 폴리뉴클레오티드는 하나 이상의 유사체(예컨대, 변경된 백본, 당 또는 핵염기)를 포함할 수 있다. 존재하는 경우, 뉴클레오티드 구조에 대한 변형은 중합체의 조립 전 또는 후에 부여될 수 있다. 유사체의 일부 비제한적 예에는 5-브로모우라실, 펩티드 핵산, 제노 핵산, 모르폴리노, 잠긴 핵산, 글리콜 핵산, 트레오스 핵산, 디데옥시뉴클레오티드, 코디세핀, 7-데아자-GTP, 형광단(예컨대, 로다민 또는 당에 연결된 플루오레세인), 티올 함유 뉴클레오티드, 비오틴 연결된 뉴클레오티드, 형광 염기 유사체, CpG 섬, 메틸-7-구아노신, 메틸화된 뉴클레오티드, 이노신, 티오우리딘, 슈도우르딘, 디하이드로우리딘, 큐오신 및 와이오신을 포함한다. 폴리뉴클레오티드의 비제한적인 예는 유전자 또는 유전자 단편의 코딩 또는 비코딩 영역, 연결 분석으로부터 정의된 유전자좌들(유전자좌), 엑손, 인트론, 메신저 RNA(mRNA), 전달 RNA(tRNA), 리보솜 RNA(rRNA), 짧은 간섭 RNA(siRNA), 짧은 헤어핀 RNA(shRNA), 마이크로RNA(miRNA), 리보자임, cDNA, 재조합 폴리뉴클레오티드, 분지형 폴리뉴클레오티드, 플라스미드, 벡터, 임의의 서열의 단리된 DNA, 임의의 서열의 단리된 RNA, 무세포 DNA(cfDNA) 및 무세포 RNA(cfRNA)를 비롯한 무세포 폴리뉴클레오티드, 핵산 프로브 및 프라이머를 포함한다. 뉴클레오티드의 서열은 뉴클레오티드가 아닌 성분에 의해 중단될 수 있다.
용어 "형질감염" 또는 "형질감염된"은 일반적으로 비바이러스 또는 바이러스 기반 방법에 의한 세포 내로의 핵산의 도입을 지칭한다. 핵산 분자는 완전한 단백질 또는 그의 기능적 부분을 코딩하는 유전자 서열일 수 있다. 예컨대, 문헌 [Sambrook et al., 1989, Molecular Cloning: A Laboratory Manual, 18.1-18.88]을 참조한다.
본원에서 사용되는 바, 용어 "유전자"는 임의적으로, 코딩 서열의 상류 또는 하류에 위치할 수 있는, 예컨대, 프로모터, 오퍼레이터, 터미네이터 등과 같은 연관된 조절 영역과 함께 개별 단백질 또는 RNA("코딩 서열" 또는 "코딩 영역"으로도 지칭)를 코딩하는 핵산 세그먼트를 지칭한다. 용어 "유전자"는 광범위하게 해석되어야 하며, mRNA, cDNA, cRNA 및 게놈 DNA 형태의 유전자를 포함할 수 있다. 일부 사용에서, 용어 "유전자"는 5' 및 3' 비번역 영역(5'-UTR 및 3'-UTR), 엑손 및 인트론을 포함하는 전사된 서열을 포함한다. 일부 유전자에서, 전사된 영역은 폴리펩티드를 코딩하는 "오픈 리딩 프레임"을 포함한다. 용어의 일부 사용에서, "유전자"는 폴리펩티드를 코딩하는 데 필요한 코딩 서열(예컨대, "오픈 리딩 프레임" 또는 "코딩 영역")만을 포함한다. 일부 측면에서, 유전자는 폴리펩티드, 예를 들어, 리보솜 RNA 유전자(rRNA) 및 전달 RNA(tRNA) 유전자를 코딩하지 않는다. 일부 측면에서, 용어 "유전자"는 전사된 서열을 포함할 뿐만 아니라, 상류 및 하류 조절 영역, 인핸서 및 프로모터를 포함하는 전사되지 않은 영역도 포함한다. 용어 "유전자"는 mRNA, cDNA 및 게놈 형태의 유전자를 포함할 수 있다.
본원에서 사용되는 바, 용어 "돌연변이"는 서열, 예컨대, 핵산 또는 아미노산 서열 내의 잔기를 또 다른 잔기로 치환, 또는 서열 내의 하나 이상의 잔기의 결실 또는 삽입을 지칭할 수 있다. 하나 이상의 돌연변이는 원래 잔기를 확인하고, 서열내 잔기의 위치와 새로 치환된 잔기의 아이덴티티를 확인함으로써 설명할 수 있다. 돌연변이는 기준 서열 대비 서열(예컨대, 핵산 서열, 게놈 서열, DNA, RNA 또는 단백질 서열과 같은 유전자 서열)의 변화 또는 변경일 수 있다. 기준 서열은 야생형 서열, 건강한 또는 정상 세포의 서열, 또는 질환 또는 장애와 연관되지 않은 서열일 수 있다. 기준 서열은 암과 연관되지 않은 서열일 수 있다. 돌연변이의 비제한적인 예는 점 돌연변이, 하나 이상의 뉴클레오티드의 치환, 하나 이상의 뉴클레오티드의 결실, 하나 이상의 뉴클레오티드의 삽입, 하나 이상의 뉴클레오티드의 융합, 프레임 시프트 돌연변이, 이상, 대안적 스플라이싱, 비정상적인 메틸화, 미스센스 돌연변이, 보존적 돌연변이, 비보존적 돌연변이, 넌센스 돌연변이, 스플라이스 변이체, 대안적 스플라이스 변이, 전이, 전환, 드 노보 돌연변이, 유해 돌연변이, 질환유발 돌연변이, 후성 돌연변이, 창시자 돌연변이, 생식계열 돌연변이, 체세포 돌연변이, 소인 돌연변이, 스플라이스 부위 돌연변이 또는 감수성 유전자 돌연변이를 포함한다. 돌연변이는 특정 질환 또는 장애에 대한 개체의 감수성 또는 소인을 증가시키는 병원성 변이체 또는 돌연변이일 수 있다. 돌연변이는 드라이버 돌연변이일 수 있다(예컨대, 미세환경에서 세포에 적합성 이점을 부여하여 세포 계통을 암으로 유도할 수 있는 돌연변이). 드라이버 돌연변이는 기능 상실 돌연변이일 수 있다. 돌연변이는 기능 상실 돌연변이일 수 있다. 돌연변이는 패신저 돌연변이(예컨대, 드라이버 돌연변이가 있는 게놈에서 발생하고, 클론 확장과 연관될 수 있는 돌연변이)일 수 있다. 본원에서 사용되는 바, 용어 "유전자"는 천연 또는 재조합 방식으로 작동적으로 연결될 때 일부 생성물 또는 기능을 제공하는 폴리뉴클레오티드 요소의 조합을 지칭할 수 있다.
본원에서 사용되는 바, 용어 "폴리펩티드," "펩티드" 및 "단백질"은 아미노산 잔기의 중합체와 관련하여 본원에서 상호교환적으로 사용될 수 있다. 단백질은 코딩 오픈 리딩 프레임에서 번역되거나, 또는 그의 성숙한 형태로 프로세싱된 전장 폴리펩티드를 지칭할 수 있는 반면, 폴리펩티드 또는 펩티드는 그럼에도 불구하고 고유하거나, 또는 식별가능하게 특정 단백질로 맵핑되는 단백질의 분해 단편 또는 프로세싱 단편을 지칭할 수 있다. 폴리펩티드는 인접한 아미노산 잔기의 카복실 기와 아미노 기 사이의 펩티드 결합에 의해 함께 결합된 아미노산의 단일 선형 중합체 쇄일 수 있다. 폴리펩티드는 예를 들어 탄수화물 부가, 인산화 등에 의해 변형될 수 있다. 단백질은 하나 이상의 폴리펩티드를 포함할 수 있다.
본원에서 사용되는 바, 용어 "일부" 또는 "단편" 또는 등가 용어는 엔티티(예컨대, 단백질)의 일부를 나타낼 수 있다. 단백질 또는 폴리펩티드의 경우, 부분 또는 단편은 단백질 또는 폴리펩티드의 전장보다 작다. 일부 실시양태에서, 부분 또는 단편은 전장 단백질의 의도된 기능을 유지한다.
본원에서 사용되는 바, 용어 "상보체," "상보체들," "상보적" 및 "상보성"은 일반적으로 주어진 서열에 완전히 상보적이고, 하이브리드화 가능한 서열을 지칭한다. 일부 실시양태에서, 주어진 영역에 대한 염기의 서열이 그의 결합 파트너의 염기 서열에 상보적으로 결합할 수 있는 경우, 주어진 핵산과 하이브리드화된 서열은 주어진 분자의 "보체" 또는 "역-보체"로 지칭되며, 예를 들어 A-T, A-U, G-C 및 G-U 염기쌍이 형성되도록 한다. 일반적으로, 제2 서열에 하이브리드화할 수 있는 제1 서열은 제2 서열에 특이적으로 또는 선택적으로 하이브리드화 가능하며, 이로써, 하이브리드화 반응 동안 비표적 서열과의 하이브리드화보다 제2 서열 또는 제2 서열 세트에 대한 하이브리드화가 바람직하다(예컨대, 주어진 조건 세트, 예를 들어, 당업계에서 일반적으로 사용되는 엄격한 조건하에서 열역학적으로 더욱 안정적이다). 전형적으로, 일반적으로, 하이브리드화 가능한 서열은 적어도 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 및 100% 서열 상보성을 비롯한 25%-100% 상보성과 같은 각 길이의 전체 또는 일부에 걸쳐 상당한 정도의 서열 상보성을 공유한다. 예컨대, 상보성(%) 평가를 위한 서열 동일성은 니들만-운쉬(Needleman-Wunsch) 알고리즘 (예컨대, 임의적으로, 디폴트 세팅과 함께, www.ebi.ac.uk/Tools/psa/emboss_needle/nucleotide.html에서 이용가능한 EMBOSS Needle 얼라이너 참조), BLAST 알고리즘 (예컨대, 임의적으로, 디폴트 세팅과 함께, blast.ncbi.nlm.nih.gov/Blast.cgi에서 이용가능한 BLAST 정렬 도구 참조), 또는 스미스-워터만(Smith-Waterman) 알고리즘 (예컨대, 임의적으로, 디폴트 세팅과 함께, www.ebi.ac.uk/Tools/psa/emboss_water/nucleotide.html에서 이용가능한 EMBOSS Water 얼라이너 참조)을 포함하나, 이에 제한되지 않는, 임의의 적합한 정렬 알고리즘에 의해 측정될 수 있다. 디폴트 파라미터를 포함하여 선택한 알고리즘의 임의의 적합한 파라미터를 사용하여 최적의 정렬을 평가할 수 있다.
본원에서 사용되는 바, 용어 "동일성(%)"은 서열을 정렬하고, 필요할 경우, 최대 동일성(%)을 달성하도록 갭을 도입한 후, 기준 서열의 아미노산(또는 핵산) 잔기와 동일한 후보 서열의 아미노산(또는 핵산) 잔기의 백분율을 지칭한다(즉, 최정의 정렬을 위해 후보 및 기준 서열 중 하나 또는 둘 모두에 갭이 도입될 수 있고, 비상동성 서열은 비교 목적을 위해서는 무시될 수 있다). 동일성(%) 측정을 위한 정렬은 공개적으로 이용가능한 컴퓨터 소프트웨어, 예컨대, BLAST, ALIGN, 또는 Megalign(DNASTAR) 소프트웨어를 사용하여 당업계의 기술 범위 내의 다양한 방식으로 달성될 수 있다. 두 서열의 동일성(%)은 BLAST를 사용하여 시험 서열을 비교 서열과 정렬하고, 정렬된 시험 서열 중 비교 서열의 동일한 위치에 있는 아미노산 또는 뉴클레오티드와 동일한 아미노산 또는 뉴클레오티드의 수를 측정하고, 동일한 아미노산 또는 뉴클레오티드의 수를 비교 서열의 아미노산 또는 뉴클레오티드의 수로 나눔으로써 계산할 수 있다.
"결정하는," "측정하는," "평가하는(evaluating)," "평가하는(assessing)," "검정하는" 및 "분석하는"이라는 용어는 종종 측정 형태를 지칭하는 것으로 본원에서 상호교환적으로 사용된다. 본 용어는 요소의 존재 여부 결정(예컨대, 검출)을 포함한다. 본 용어는 정량적, 정성적 또는 정량적 및 정성적 결정을 포함할 수 있다. 평가는 상대적이거나, 또는 절대적일 수 있다. "~의 존재를 검출하는 것"은 컨텍스트에 따라 존재하는지 여부를 측정하는 것 외에도 존재하는 것의 양을 결정하는 것을 포함할 수 있다.
용어 "피험체" 및 "개체"는 발현된 유전 물질을 함유하는 생물학적 엔티티를 지칭하는 것으로 본원에서 종종 상호교환적으로 사용된다. 본원에서 사용되는 바, 용어 "피험체"는 임의의 유기체를 지칭한다. 예를 들어, 피험체는 포유동물, 양서류, 어류, 파충류, 무척추동물, 조류, 식물, 고세균, 진균 또는 박테리아일 수 있다. 일부 실시양태에서, 피험체는 포유동물이다. 일부 실시양태에서, 피험체는 설치류(예컨대, 마우스, 래트, 햄스터, 기니피그), 개과(예컨대, 개), 고양이과(예컨대, 고양이), 말과(예컨대, 말), 양, 소, 돼지, 인간이 아닌 영장류, 예컨대, 유인원(예컨대, 원숭이), 유인원(예컨대, 고릴라, 침팬지, 오랑우탄, 긴팔원숭이), 또는 인간일 수 있다. 피험체는 생체내에서 수득되거나, 또는 시험관내에서 배양된 생물학적 엔티티의 조직, 세포 및 이들의 자손일 수 있다. 피험체는 포유동물일 수 있다. 포유동물은 인간일 수 있다. 피험체는 "환자"일 수 있으며, 일부 실시양태에서, 이는 본원에 기술된 질환 또는 병태 진단을 받았거나, 또는 질환 또는 병태를 앓는 피험체를 지칭한다. 일부 실시양태에서, 피험체는 진단을 받지는 않았지만, 질환 또는 병태가 발병되거나, 또는 그를 앓을 위험이 높은 것으로 예측된다.
"생체내"라는 용어는 피험체의 신체에서 발생하는 이벤트를 기술하는 데 사용된다.
"생체외"라는 용어는 피험체의 신체 외부에서 발생하는 이벤트를 기술하는 데 사용된다. 생체외 분석은 피험체에 대해 수행되지 않는다. 오히려 피험체와 별개의 샘플에 대해 수행된다. 샘플에 대해 수행된 생체외 검정법의 예는 "시험관 내" 검정법이다.
"시험관내"라는 용어는 물질이 획득되는 생물학적 공급원으로부터 분리되도록 실험실 시약을 보관하기 위한 용기에 포함된 발생 이벤트를 설명하는 데 사용된다. 시험관내 검정법은 살아있는 세포 또는 죽은 세포가 사용되는 세포 기반 검정법을 포함할 수 있다. 시험관내 검정법은 또한 무손상 세포가 사용되지 않는 무세포 검정법을 포함할 수 있다.
본원에서 사용되는 바, 용어 "약"은 해당 수치 ± 해당 수치의 10%를 지칭한다. "약" 범위라는 용어는 해당 범위에서 가장 낮은 값의 10%를 뺀 값 내지 최대 값의 10%를 더한 값을 나타낸다.
본원에서 사용되는 바, 용어 "치료" 또는 "치료하는"은 수용자에게 유익하거나, 또는 원하는 결과를 얻기 위한 약학적 또는 다른 개입 요법과 관련하여 사용된다. 유익하거나, 또는 원하는 결과로는 치료적 이점 및/또는 예방적 이점을 포함하나, 이에 제한되지 않는다. 치료적 이점은 치료 중인 증상 또는 기저 장애의 근절 또는 개선을 지칭할 수 있다. 또한, 치료적 이점은 피험체가 여전히 기저 장애를 앓고 있을 수 있음에도 불구하고 기저 장애와 연관된 하나 이상의 생리학적 증상의 근절 또는 개선으로 달성될 수 있어 피험체에서 개선이 관찰될 수 있다. 예방 효과는 질환 또는 병태의 출현 지연, 예방 또는 제거, 질환 또는 병태의 증상 발병 지연 또는 제거, 질환 또는 병태의 진행 지연, 정지 또는 역전, 또는 그의 임의의 조합을 포함한다. 예방적 이점을 위해, 특정 질환이 발병할 위험이 있는 피험체 또는 질환의 생리학적 증상 중 하나 이상을 보고하는 피험체에게 이 질환에 대한 진단을 받지 않았더라도 치료를 받을 수 있다.
본원에서 사용되는 바, 용어 "적응 면역 반응"은 항원 제한된 방식으로 반응하는 면역 반응의 성분을 지칭하고, T 림프구에 기인하는 세포성 면역 반응 및 B 세포 및 형질 세포에 기인하는 체액성 또는 항체 반응을 포함한다 . "세포 면역 반응"은 하기: T 세포에 의한 사이토카인/케모카인 방출; 2차 림프 기관으로의 T 세포 귀소; T 세포 증식; 및 세포독성 T 세포 반응 중 임의의 하나 이상의 것으로 나타난다. 몇몇의 방법은 T 림프구의 생체외 항원 자극 검정법 및 T 림프구의 사량체 염색과 같은 생체내 검정법을 비롯한, 항원 특이적 세포 면역 반응을 확인하는 데 사용할 수 있다. "항체 반응"은 하기: B 세포 증식, B 세포 사이토카인/케모카인 방출, 2차 림프 기관으로의 B 세포 귀소, 항체 분비, IgG 유형 항체로의 이소타입 전환 또는 형질 세포 분화 중 임의의 하나 이상의 것으로 나타난다. 항체 반응은 여러 가지 방법으로 확인할 수 있지만, 백신접종 받은 개체의 혈청 또는 혈장 중 항원 특이적 항체를 검출하는 방법이 주된 방법이다.
본원에 기술된 바와 같이, "애주번트"는 항원과 조합하여 항원에 대한 적응 면역 반응을 촉진하는 물질을 지칭한다. "면역 자극 화합물"은 궁극적으로 면역 반응의 적응 성분(예컨대, B 세포, T 세포)의 발생을 유도하는 "위험 신호"를 개시하기 위해 선천성 면역계와 특이적으로 상호작용하는 물질을 지칭한다. 면역 자극 화합물로는 자연 발생 또는 합성의 dsRNA, 지질다당류 및 CpG DNA와 같은 병원체 연관 분자 패턴(PAMP)을 포함한다. 면역 자극 화합물은 톨 유사 수용체(TLR), NOD-유사 수용체, RIG-1 또는 MDA-5 수용체, C형 렉틴 수용체 또는 STING 경로를 비롯한 다양한 선천성 면역 수용체의 효능제이다.
용어 "약학적으로 허용되는 담체," "약학적으로 허용되는 부형제," "생리적으로 허용되는 담체," 또는 "생리적으로 허용되는 부형제"는 약학적으로 허용되는 물질, 조성물, 또는 비히클, 예컨대, 액체 또는 고체 충전제, 희석제, 부형제, 용매 또는 캡슐화 물질을 지칭한다. 성분은 약학적 제제의 다른 성분과 양립할 수 있다는 의미에서 "약학적으로 허용되는" 것일 수 있다. 또한 합리적인 이익/위험비에 비례하여, 과도한 독성, 자극, 알레르기 반응, 면역원성 또는 다른 문제나 합병증 없이, 인간 및 동물의 조직 또는 기관과 접촉하여 사용하기에 적합할 수 있다. 문헌 [Remington: The Science and Practice of Pharmacy, 21st Edition; Lippincott Williams & Wilkins: Philadelphia, PA, 2005]; [Handbook of Pharmaceutical Excipients, 5th Edition"; Rowe et al., Eds., The Pharmaceutical Press and the American Pharmaceutical Association: 2005]; 및 [Handbook of Pharmaceutical Additives, 3rd Edition; Ash and Ash Eds., Gower Publishing Company: 2007]; [Pharmaceutical Preformulation and Formulation, Gibson Ed., CRC Press LLC: Boca Raton, FL, 2004]를 참조한다.
용어 "약학적 조성물"은 희석제 또는 담체와 같은 다른 화학 성분과 본원에 개시된 화합물의 혼합물을 지칭한다. 약학적 조성물은 유기체에 대한 화합물의 투여를 용이하게 할 수 있다. 경구, 주사, 에어로졸, 비경구 및 국소 투여를 포함하나, 이에 제한되지 않는, 화합물을 투여하는 다수의 기술이 당업계에 존재한다. 본원에 사용된 섹션 표제는 단지 조직화 목적으로만 사용되며, 기술된 주제를 제한하는 것으로 해석되지 않아야 한다.
VI. 실시양태
조성물
본원에서는 하기 실시양태에 따른 조성물을 개시한다:
실시양태 1. 제핵되고, 항바이러스제를 포함하는 세포를 포함하는 조성물.
실시양태 2. 실시양태 1에 있어서, 항바이러스제가 약독화된 버전의 바이러스 항원, 바이러스, 또는 바이러스 항원에 특이적인 항체인 것인 조성물.
실시양태 3. 실시양태 2에 있어서, 바이러스 항원이 바이러스 단백질, 펩티드 단편, 핵산, 또는 당 모이어티이고, 여기서, 바이러스 항원에 특이적인 항체는 바이러스 단백질, 펩티드 단편, 핵산, 또는 당 모이어티에 특이적인 것인 조성물.
실시양태 4. 실시양태 2에 있어서, 세포가 항바이러스제의 생체내 단백질 합성 또는 단백질 분비를 위한 하나 이상의 세포내 세포소기관을 포함하는 것인 조성물.
실시양태 5. 실시양태 4에 있어서, 하나 이상의 세포내 세포소기관이 골지체, 리보솜, 소포체로부터 선택되는 것인 조성물.
실시양태 6. 상기 실시양태 중 임의의 것에 있어서, 세포 직경이 약 1 마이크로미터 내지 100 마이크로미터 길이인 것인 조성물.
실시양태 7. 상기 실시양태 중 임의의 것에 있어서, 세포가 줄기 세포인 것인 조성물.
실시양태 8. 실시양태 7에 있어서, 줄기 세포가 중간엽 줄기 세포 또는 유도 만능 줄기 세포인 것인 조성물.
실시양태 9. 실시양태 8에 있어서, 중간엽 줄기 세포가 지방 조직 또는 뼈로부터 유래된 것인 조성물.
실시양태 10. 실시양태 8에 있어서, 유도 만능 줄기 세포가 소변, 타액, 모발, 피부 또는 대변으로부터 유래된 것인 조성물
실시양태 11. 실시양태 2-10에 있어서, 바이러스 항원 또는 바이러스 항원에 특이적인 항체가 세포의 표면에서 발현되거나, 또는 분비되는 것인 조성물.
실시양태 12. 상기 실시양태 중 임의의 것에 있어서, 바이러스의 바이러스 항원이 화학적 링커, 펩티드 링커, 또는 중합체로부터 선택된 링커에 의해 세포의 표면에 테더링된 것인 조성물.
실시양태 13. 상기 실시양태 중 임의의 것에 있어서, 항바이러스제가
b) 이중 가닥(ds) DNA 바이러스(예컨대, 아데노바이러스, 헤르페스바이러스, 폭스바이러스);
c) 단일 가닥(ss) DNA 바이러스(+ 가닥 또는 "센스") DNA(예컨대, 파보바이러스);
d) dsRNA 바이러스(예컨대, 레오바이러스);
e) (+)ssRNA 바이러스(+ 가닥 또는 센스) RNA(예컨대, 피코나바이러스, 토가바이러스);
f) (-)ssRNA 바이러스(- 가닥 또는 안티센스) RNA(예컨대, 오르토믹소바이러스, 랍도바이러스);
g) 라이프 사이클에서 DNA 중간체를 갖는 ssRNA-RT 바이러스(+ 가닥 또는 센스) RNA(예컨대, 레트로바이러스); 또는
h) 라이프 사이클에서 RNA 중간체를 갖는 dsDNA-RT 바이러스 DNA(예컨대, 헤파드나바이러스)로부터 선택되는 바이러스에 특이적이거나, 또는 그로부터 유래된 것인 조성물.
실시양태 14. 상기 실시양태 중 임의의 것에 있어서, 항바이러스제가 호흡기 바이러스, 피부 바이러스, 식품매개 바이러스, 성 매개 바이러스, 또는 종양용해성 바이러스, 또는 그의 조합으로부터 유래된 것인 조성물
실시양태 15. 실시양태 14에 있어서, 호흡기 바이러스는 리노바이러스, 인플루엔자 바이러스, 호흡기 세포융합 바이러스, 및 코로나 바이러스로부터 선택되는 것인 조성물
실시양태 16. 실시양태 14에 있어서, 피부 바이러스가 전염성 연속종, 단순 헤르페스 바이러스-1, 및 수두 대상포진 바이러스로부터 선택되는 것인 조성물.
실시양태 17. 실시양태 14에 있어서, 식품매개 바이러스가 A형 간염, 노로바이러스, 및 로타바이러스로부터 선택되는 것인 조성물.
실시양태 18. 실시양태 14에 있어서, 성 매개 바이러스가 인간 유두종바이러스, B형 간염, 성기 헤르페스, 및 인간 면역결핍 바이러스로부터 선택되는 것인 조성물.
실시양태 19. 실시양태 14에 있어서, 종양용해성 바이러스가 인간 유두종바이러스 또는 B형 간염인 것인 조성물.
실시양태 20. 실시양태 12에 있어서, 링커가 글리코실-포스파티딜이노시톨(GPI) 또는 B7-1 항원(B7-1) 세포질 테일을 포함하는 것인 조성물.
실시양태 21. 실시양태 3에 있어서, 바이러스 항원이 세포에서 발현되는 막횡단 펩티드인 것인 조성물.
실시양태 22. 실시양태 3-21에 있어서, 바이러스 항원이 인간에 대해 면역원성인 것인 조성물.
실시양태 23. 실시양태 3-22에 있어서, 바이러스 항원이 코로나 바이러스로부터 유래된 펩티드인 것인 조성물.
실시양태 24. 실시양태 23에 있어서, 코로나 바이러스가 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2), 또는 그의 변이체인 것인 조성물.
실시양태 25. 실시양태 23 또는 24에 있어서, 펩티드가 코로나 바이러스로부터 유래된 스파이크 단백질, 막 단백질, 또는 핵단백질로부터 선택되는 것인 조성물.
실시양태 26. 실시양태 25에 있어서, 세포가 펩티드를 코딩하는 mRNA를 포함하는 것인 조성물.
실시양태 27. 실시양태 26에 있어서, mRNA가 서열 번호 1과 적어도 80% 동일한 mRNA 서열을 포함하는 것인 조성물.
실시양태 28. 실시양태 26에 있어서, mRNA가 서열 번호 1과 적어도 85% 동일한 mRNA 서열을 포함하는 것인 조성물.
실시양태 29. 실시양태 26에 있어서, mRNA가 서열 번호 1과 적어도 90% 동일한 mRNA 서열을 포함하는 것인 조성물.
실시양태 30. 실시양태 26에 있어서, mRNA가 서열 번호 1과 적어도 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 mRNA 서열을 포함하는 것인 조성물.
실시양태 31. 실시양태 26에 있어서, mRNA가 서열 번호 1과 적어도 100% 동일한 mRNA 서열을 포함하는 것인 조성물.
실시양태 32.실시양태 23-26에 있어서, 펩티드가 서열 번호 2 또는 8과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는 것인 조성물.
실시양태 33. 실시양태 26-32에 있어서, mRNA 반감기가 3-5일인 것인 조성물.
실시양태 34. 실시양태 26-32에 있어서, mRNA가 알부민 펩티드를 포함하는 융합 단백질을 코딩하는 것인 조성물.
실시양태 35. 실시양태 26-32에 있어서, mRNA가 면역조정제를 포함하는 융합 단백질을 코딩하는 것인 조성물.
실시양태 36. 실시양태 35에 있어서, 면역조정제가 피험체에서 면역 반응의 활성제인 것인 조성물.
실시양태 37. 실시양태 36에 있어서, 면역조정제가 과립구-대식세포 콜로니 자극 인자(GM-CSF) 또는 사이토카인, 또는 그의 조합인 것인 조성물.
실시양태 38. 상기 실시양태 중 임의의 것에 있어서, 세포가 하나 이상의 귀소 수용체를 추가로 포함하는 것인 조성물.
실시양태 39. 실시양태 38에 있어서, 하나 이상의 귀소 수용체가 화학적 링커, 펩티드 링커, 또는 중합체로부터 선택되는 링커에 의해 세포의 표면에 테더링된 것인 조성물.
실시양태 40. 실시양태 39에 있어서, 링커가 글리코실-포스파티딜이노시톨(GPI) 또는 B7-1 항원(B7-1) 세포질 테일을 포함하는 것인 조성물.
실시양태 41. 실시양태 38에 있어서, 하나 이상의 귀소 수용체가 세포의 표면 상에서 발현되는 것인 조성물.
실시양태 42. 실시양태 41에 있어서, 하나 이상의 귀소 수용체가 세포의 표면 상에서의 하나 이상의 귀소 수용체의 발현을 증가시키도록 유전적으로 변형된 것인 조성물.
실시양태 43. 실시양태 38-42에 있어서, 하나 이상의 귀소 수용체가 림프 조직 중 하나 이상의 세포 상에서 발현된 하나 이상의 리간드에 특이적인 것인 조성물.
실시양태 44. 실시양태 43에 있어서, 림프 조직 중 하나 이상의 세포가 내피 세포, 림프구, 대식세포, 또는 망상 세포, 또는 그의 조합을 포함하는 것인 조성물.
실시양태 45. 실시양태 38-44에 있어서, 하나 이상의 귀소 수용체가 동일하지 않은 2개 이상의 리간드에 특이적인 2개 이상의 귀소 수용체를 포함하는 것인 조성물.
실시양태 46. 실시양태 38-45에 있어서, 하나 이상의 귀소 수용체가 C-X-C 케모카인 수용체 타입 3(CXCR3), 류코시아린(CD43), CD44 항원(CD44), C-C 케모카인 수용체 타입 7(CCR7), L-셀렉틴(CD62L), 림프구 기능 연관 항원 1(LFA-1), 또는 초후기 항원-4(VLA4)로부터 선택되는 것인 조성물.
실시양태 47. 실시양태 38-46에 있어서, 하나 이상의 귀소 수용체가 L-셀렉틴(CD62L) 및 C-C 케모카인 수용체 타입 7(CCR7)을 포함하는 것인 조성물.
실시양태 48. 실시양태 38-46에 있어서, 하나 이상의 귀소 수용체가 림프 조직의 내피 세포에서 발현된 리간드에 특이적이고, 바이러스 항원은 조성물이 피험체에게 투여되었을 때, 피험체에서 코로나 바이러스에 대한 면역 반응을 활성화시키는 데 효과적인 것인 조성물.
실시양태 49. 상기 실시양태 중 임의의 것에 있어서, 세포가 하나 이상의 면역조정제를 추가로 포함하는 것인 조성물.
실시양태 50. 실시양태 49에 있어서, 하나 이상의 면역조정제가 세포의 표면에 테더링된 것인 조성물.
실시양태 51. 실시양태 50에 있어서, 하나 이상의 면역조정제가 글리코실-포스파티딜이노시톨(GPI) 또는 B7-1 항원(B7-1) 세포질 테일을 포함하는 링커를 사용하여 세포의 표면에 테더링된 것인 조성물.
실시양태 52. 실시양태 49-51에 있어서, 하나 이상의 면역조정제가 세포의 표면 상에서 발현되는 것인 조성물.
실시양태 53. 실시양태 49-52에 있어서, 하나 이상의 면역조정제가 과립구-대식세포 콜로니 자극 인자(GM-CSF), 종양 괴사 인자 알파(TNF-알파), 림프독소 알파(LTA), 림프독소 베타(LTB), TNF 슈퍼패밀리 구성원 4(TNFSF4), CD40 리간드(CD40LG), fas 리간드(FASLG), CD70 분자(CD70), TNF 슈퍼패밀리 구성원 8(TNFSF8), TNF 슈퍼패밀리 구성원 9(TNFSF9), TNF 슈퍼패밀리 구성원 10(TNFSF10), TNF 슈퍼패밀리 구성원 11(TNFSF11), TNF 슈퍼패밀리 구성원 12(TNFSF12), TNF 슈퍼패밀리 구성원 13(TNFSF13), TNF 슈퍼패밀리 구성원 13b(TNFSF13B), TNF 슈퍼패밀리 구성원 14(TNFSF14), TNF 슈퍼패밀리 구성원 15(TNFSF15), TNF 슈퍼패밀리 18(TNFSF18), 엑토디스플라신 A(EDA), 사이토카인, 및 바이러스 항원 단백질로 구성된 군으로부터 선택되는 것인 조성물.
실시양태 54. 실시양태 49-53에 있어서, 하나 이상의 면역조정제가 알부민 펩티드를 포함하는 융합 단백질인 것인 조성물.
실시양태 55. 실시양태 1-54에 있어서, 조성물이 단리된 것인 조성물.
실시양태 56. 실시양태 1-54에 있어서, 조성물이 정제된 것인 조성물.
실시양태 57. 실시양태 1-54에 있어서, 현탁액 중 또는 세포 배양물 중, 또는 그 둘 모두에 복수의 세포를 포함하는 조성물.
실시양태 58. 실시양태 1-57에 있어서, 조성물이 적어도 48시간 동안 동결보존되거나, 또는 미리 동결보존된 것인 조성물.
실시양태 59. 상기 실시양태 중 임의의 것의 조성물을 필요로 하는 피험체에게 상기 조성물을 전신 전달 또는 직접 전달에 의해 투여하는 단계를 포함하는, 상기 실시양태 중 임의의 것의 조성물을 전달하는 방법.
실시양태 60. 실시양태 59에 있어서, 전신 전달이 정맥내 전달 또는 흡입을 포함하고, 여기서, 직접 전달이 근육내, 복강내, 및 림프절내 전달을 포함하는 것인 방법.
실시양태 61. 실시양태 59-60에 있어서, 전달 후 조성물을 구성하는 생 바이러스에 의한 감염으로부터 피험체를 실질적으로 면역화시키는 단계를 추가로 포함하는 방법.
실시양태 62. 실시양태 1-58의 조성물을 피험체에게 투여하여 조성물을 구성하는 생 바이러스에 의한 감염으로부터 피험체를 실질적으로 면역화시키는 단계를 포함하는, 피험체에서 바이러스 감염을 예방하는 방법.
실시양태 63. 실시양태 1-58의 조성물을 피험체에게 투여하여 피험체에서 바이러스 로드를 감소시키는 단계를 포함하는, 피험체에서 급성 바이러스 감염을 치료하는 방법.
실시양태 64. 실시양태 1-58의 조성물을 피험체에게 투여하여 코로나바이러스에 의해 유발되는 질환을 예방하는 단계를 포함하는, 피험체에서 코로나바이러스에 의해 유발되는 질환을 예방하는 방법.
실시양태 65. 실시양태 1-58의 조성물을 피험체에게 투여하여 코로나바이러스에 의해 유발된 질환을 치료하는 단계를 포함하는, 피험체에서 코로나바이러스에 의해 유발된 질환을 치료하는 방법.
실시양태 66. 실시양태 64 및 65에 있어서, 질환이 코로나바이러스 질환 2019(COVID-19)인 것인 방법.
실시양태 67. 실시양태 59-66에 있어서, (a) 적어도 48시간 동안 4℃에서 현탁액에서 보관된 조성물을 받는 단계로서, 여기서, 조성물은 생물학적 활성이 저속화되거나, 정지된 것인 단계; 및 (b) 현탁액으로부터 조성물을 제거하여 조성물의 생물학적 활성을 회복시키는 단계를 추가로 포함하는 방법.
제조 방법
본원에서는 하기 실시양태에 따라 세포질체를 사용하여 조성물을 제조하는 방법을 개시한다:
실시양태 1.
(a) 제1 바이러스 항원 또는 항바이러스 항체를 코딩하는 제1 핵산을 모세포에 도입하는 단계로서, 모세포는
i) 핵; 및
ii) 단백질 합성 또는 단백질 분비를 위한 하나 이상의 세포내 세포소기관을 포함하는 것인 단계; 및
(b) 모 줄기 세포로부터 핵을 기계적으로 제거하여 제핵 줄기 세포를 생성하는 단계로서, 여기서, 제핵 줄기 세포는 하나 이상의 세포내 세포소기관을 포함하는 것인 단계를 포함하는, 조성물을 제조하는 방법.
실시양태 2.
(a) 제1 바이러스 항원 또는 항바이러스 항체를 코딩하는 제1 핵산을 제핵 줄기 세포에 도입하는 단계로서, 제핵 줄기 세포는 제1 바이러스 항원 또는 항바이러스 항체의 단백질 합성 또는 단백질 분비를 위한 하나 이상의 세포내 세포소기관을 포함하는 것인 단계; 및
(b) 제핵 줄기 세포에서 제1 바이러스 항원 또는 항바이러스 항체를 발현하는 단계를 포함하는, 조성물을 제조하는 방법.
실시양태 3. 실시양태 1 및 2에 있어서, 제1 바이러스 항원이 제핵 줄기 세포의 표면에서 발현되는 것인 방법.
실시양태 4. 상기 실시양태 중 임의의 것에 있어서, 제1 바이러스 항원 또는 항바이러스 항체가 분비성인 것인 방법.
실시양태 5. 상기 실시양태 중 임의의 것에 있어서, 제핵 줄기 세포를 현탁액의 동결 온도 미만의 온도에서 적어도 24시간, 48시간, 또는 96시간 동안 현탁액 중에 보관하는 단계를 추가로 포함하는 방법.
실시양태 6. 상기 실시양태 중 임의의 것에 있어서, 제2 바이러스 항원을 코딩하는 제2 핵산을 도입하는 단계를 추가로 포함하고, 여기서, 제1 및 제2 핵산은 동일하지 않고, 제1 및 제2 바이러스 항원은 동일하지 않은 것인 방법.
실시양태 7. 상기 실시양태 중 임의의 것에 있어서, 제1 바이러스 항원과 상이한 복수의 바이러스 항원을 코딩하는 복수의 핵산을 도입하는 단계를 추가로 포함하는 방법.
실시양태 8. 상기 실시양태 중 임의의 것에 있어서, 핵산이 메신저 RNA(mRNA)인 것인 방법.
실시양태 9. 상기 실시양태 중 임의의 것에 있어서, 핵산이 DNA인 것인 방법.
실시양태 10. 상기 실시양태 중 임의의 것에 있어서, 제1 바이러스 항원이 포유동물로부터 유래된 것인 방법.
실시양태 11. 상기 실시양태 중 임의의 것에 있어서, 항바이러스 항체가 코로나 바이러스에 특이적인 것인 방법.
실시양태 12. 상기 실시양태 중 임의의 것에 있어서, 제1 바이러스 항원이 로부터 유래된 약독화된 바이러스 입자인 것인 방법.
실시양태 13. 상기 실시양태 중 임의의 것에 있어서, 제1 바이러스 항원이 화학적 링커, 펩티드 링커, 또는 중합체로부터 선택된 링커에 의해 제핵 줄기 세포의 표면에 테더링된 것인 방법.
실시양태 14. 실시양태 13, 링커가 글리코실-포스파티딜이노시톨(GPI) 또는 B7-1 항원(B7-1) 세포질 테일을 포함하는 것인 방법.
실시양태 15. 상기 실시양태 중 임의의 것에 있어서, 제1 바이러스 항원이 제핵 줄기 세포에서 발현된 막횡단 펩티드인 것인 방법.
실시양태 16. 상기 실시양태 중 임의의 것에 있어서, 제1 바이러스 항원이 인간에 대해 면역원성인 것인 방법.
실시양태 17. 상기 실시양태 중 임의의 것에 있어서, 제1 바이러스 항원이 코로나 바이러스로부터 유래된 펩티드인 것인 방법.
실시양태 18. 실시양태 17에 있어서, 펩티드가 코로나 바이러스로부터 유래된 스파이크 단백질, 막 단백질, 또는 핵단백질로부터 선택되는 것인 방법.
실시양태 19. 실시양태 18에 있어서, 코로나 바이러스가 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2), 또는 그의 변이체인 것인 방법.
실시양태 20. 실시양태 17-19에 있어서, 제핵 줄기 세포가 펩티드를 코딩하는 mRNA를 포함하는 것인 방법.
실시양태 21. 실시양태 20에 있어서, mRNA가 서열 번호 1과 적어도 80% 동일한 mRNA 서열을 포함하는 것인 방법.
실시양태 22. 실시양태 20에 있어서, mRNA가 서열 번호 1과 적어도 85% 동일한 mRNA 서열을 포함하는 것인 방법.
실시양태 23. 실시양태 20에 있어서, mRNA가 서열 번호 1과 적어도 90% 동일한 mRNA 서열을 포함하는 것인 방법.
실시양태 24. 실시양태 20에 있어서, mRNA가 서열 번호 1과 적어도 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 mRNA 서열을 포함하는 것인 방법.
실시양태 25. 실시양태 20에 있어서, mRNA가 서열 번호 1과 적어도 100% 동일한 mRNA 서열을 포함하는 것인 방법.
실시양태 26. 실시양태 17-20에 있어서, 펩티드가 서열 번호 2와 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는 것인 방법.
실시양태 27. 실시양태 20-26에 있어서, mRNA 반감기가 3-5일인 것인 방법.
실시양태 28. 실시양태 20-26에 있어서, mRNA가 알부민 펩티드를 포함하는 융합 단백질을 코딩하는 것인 방법.
실시양태 29. 실시양태 20-26에 있어서, mRNA가 면역조정제를 포함하는 융합 단백질을 코딩하는 것인 방법.
실시양태 30. 실시양태 29에 있어서, 면역조정제가 피험체에서 면역 반응의 활성제인 것인 방법.
실시양태 31. 실시양태 30에 있어서, 면역조정제가 과립구-대식세포 콜로니 자극 인자(GM-CSF) 또는 사이토카인, 또는 그의 조합인 것인 방법.
실시양태 32. 상기 실시양태 중 임의의 것에 있어서, 제핵 줄기 세포가 하나 이상의 귀소 수용체를 추가로 포함하는 것인 방법.
실시양태 33. 실시양태 32에 있어서, 하나 이상의 귀소 수용체가 화학적 링커, 펩티드 링커, 또는 중합체로부터 선택되는 링커에 의해 제핵 줄기 세포의 표면에 테더링된 것인 방법.
실시양태 34. 실시양태 33에 있어서, 링커가 글리코실-포스파티딜이노시톨(GPI) 또는 B7-1 항원(B7-1) 세포질 테일을 포함하는 것인 방법.
실시양태 35. 실시양태 32에 있어서, 하나 이상의 귀소 수용체가 제핵 줄기 세포의 표면 상에서 발현되는 것인 방법.
실시양태 36. 실시양태 32-35에 있어서, 하나 이상의 귀소 수용체가 제핵 줄기 세포의 표면 상에서의 하나 이상의 귀소 수용체의 발현을 증가시키도록 유전적으로 변형된 것인 방법.
실시양태 37. 실시양태 32-36에 있어서, 하나 이상의 귀소 수용체가 림프 조직 중 하나 이상의 세포 상에서 발현된 하나 이상의 리간드에 특이적인 것인 방법.
실시양태 38. 실시양태 37에 있어서, 림프 조직 중 하나 이상의 세포가 내피 세포, 림프구, 대식세포, 또는 망상 세포, 또는 그의 조합으로부터 선택되는 것인 방법.
실시양태 39. 실시양태 32-38에 있어서, 하나 이상의 귀소 수용체가 동일하지 않은 2개 이상의 리간드에 특이적인 2개 이상의 귀소 수용체를 포함하는 것인 방법.
실시양태 40. 실시양태 32-39에 있어서, 하나 이상의 귀소 수용체가 C-X-C 케모카인 수용체 타입 3 (CXCR3), 류코시아린 (CD43), CD44 항원(CD44), C-C 케모카인 수용체 타입 7(CCR7), L-셀렉틴 (CD62L), 림프구 기능 연관 항원 1(LFA-1), 또는 초후기 항원-4(VLA4)로부터 선택되는 것인 방법.
실시양태 41. 실시양태 32-40에 있어서, 하나 이상의 귀소 수용체가 L-셀렉틴(CD62L) 및 C-C 케모카인 수용체 타입 7(CCR7)을 포함하는 것인 방법.
실시양태 42. 실시양태 32-41에 있어서, 하나 이상의 귀소 수용체가 림프 조직의 내피 세포에서 발현된 리간드에 특이적이고, 바이러스 항원은 조성물이 피험체에게 투여되었을 때, 피험체에서 코로나 바이러스에 대한 면역 반응을 활성화시키는 데 효과적인 것인 방법.
실시양태 43. 상기 실시양태 중 임의의 것에 있어서, 제핵 줄기 세포가 하나 이상의 면역조정제를 추가로 포함하는 것인 방법.
실시양태 44. 실시양태 43에 있어서, 하나 이상의 면역조정제가 제핵 줄기 세포의 표면에 테더링된 것인 방법.
실시양태 45. 실시양태 44에 있어서, 하나 이상의 면역조정제가 글리코실-포스파티딜이노시톨(GPI) 또는 B7-1 항원(B7-1) 세포질 테일을 포함하는 링커를 사용하여 제핵 줄기 세포의 표면에 테더링된 것인 방법.
실시양태 46. 실시양태 43-45에 있어서, 하나 이상의 면역조정제가 제핵 줄기 세포의 표면 상에서 발현되는 것인 방법.
실시양태 47. 실시양태 43-46에 있어서, 하나 이상의 면역조정제가 과립구-대식세포 콜로니 자극 인자(GM-CSF), 종양 괴사 인자 알파(TNF-알파), 림프독소 알파(LTA), 림프독소 베타(LTB), TNF 슈퍼패밀리 구성원 4(TNFSF4), CD40 리간드(CD40LG), fas 리간드(FASLG), CD70 분자(CD70), TNF 슈퍼패밀리 구성원 8(TNFSF8), TNF 슈퍼패밀리 구성원 9(TNFSF9), TNF 슈퍼패밀리 구성원 10(TNFSF10), TNF 슈퍼패밀리 구성원 11(TNFSF11), TNF 슈퍼패밀리 구성원 12(TNFSF12), TNF 슈퍼패밀리 구성원 13(TNFSF13), TNF 슈퍼패밀리 구성원 13b(TNFSF13B), TNF 슈퍼패밀리 구성원 14(TNFSF14), TNF 슈퍼패밀리 구성원 15(TNFSF15), TNF 슈퍼패밀리 18(TNFSF18), 엑토디스플라신 A(EDA), 사이토카인, 및 바이러스 항원 단백질로 구성된 군으로부터 선택되는 것인 방법.
실시양태 48. 실시양태 43-47에 있어서, 하나 이상의 면역조정제가 알부민 펩티드를 포함하는 융합 단백질인 것인 방법.
실시양태 49. 실시양태 1-48에 있어서, 방법이 제핵 줄기 세포를 단리시키는 단계를 추가로 포함하는 것인 방법.
실시양태 50. 실시양태 1-48에 있어서, 방법이 제핵 줄기 세포를 정제하는 단계를 추가로 포함하는 것인 방법.
실시양태 51. 실시양태 1-48에 있어서, 제핵 줄기 세포가 현탁액 중 또는 세포 배양물 중, 또는 그 둘 모두 중 복수의 제핵 줄기 세포인 것인 방법.
실시양태 52. 실시양태 1-48에 있어서, 방법이 적어도 48시간 동안 제핵 줄기 세포를 동결보존하는 단계를 추가로 포함하는 것인 방법.
실시양태 53. 실시양태 1-48의 조성물을 피험체에게 투여하여 코로나바이러스에 의해 유발되는 질환을 예방하는 단계를 포함하는, 피험체에서 코로나바이러스에 의해 유발되는 질환을 예방하는 방법.
실시양태 54. 실시양태 1-48의 조성물을 피험체에게 투여하여 코로나바이러스에 의해 유발된 질환을 치료하는 단계를 포함하는, 피험체에서 코로나바이러스에 의해 유발된 질환을 치료하는 방법.
실시양태 55. 실시양태 53 및 54에 있어서, 질환이 코로나바이러스 질환 2019(COVID-19)인 것인 방법.
실시양태 56. 실시양태 1-55에 있어서, (a) 적어도 48시간 동안 4℃에서 현탁액에서 보관된 제핵 줄기 세포를 받는 단계로서, 여기서, 제핵 줄기 세포는 생물학적 활성이 저속화되거나, 정지된 것인 단계; 및 (b) 현탁액으로부터 제핵 줄기 세포를 제거하여 제핵 줄기 세포의 생물학적 활성을 회복시키는 단계를 추가로 포함하는 방법.
바이러스 포획 방법
실시양태 1.
(a) 병원체 제거를 필요로 하는 피험체에게 실질적으로 핵이 없는 복수의 세포를 투여하는 단계;
(b) i. 병원체에 의한, (a)에서 피험체에게 투여된 복수의 세포의 생체내 감염을 허용하고;
ii. 일단 복수의 세포가 감염되고 나면, 병원체의 증식을 방해하고;
iii. 식세포 작용에 의해 복수의 세포를 피험체로부터 제거하여 병원체를 피험체로부터 제거함으로써 피험체의 조직에서 병원체를 격리시키는 단계를 포함하는, 피험체에서 병원체를 제거하는 방법.
실시양태 2. 실시양태 1에 있어서, 병원체의 수가 (a)에서의 복수의 세포의 투여에 대해 용량에 의존하는 방식으로 감소되는 것인 방법.
실시양태 3. 상기 실시양태 중 임의의 것에 있어서, 복수의 세포가 하나 이상의 면역조정제를 발현하고, 여기서, 하나 이상의 면역조정제가 복수의 세포 중 한 세포의 표면에서 발현되거나, 또는 복수의 세포 중 한 세포에 의해 분비되는 것인 방법.
실시양태 4. 실시양태 3에 있어서, 하나 이상의 면역조정제가 복수의 세포 중 한 세포의 표면에 테더링된 것인 방법.
실시양태 5. 실시양태 4에 있어서, 하나 이상의 면역조정제가 글리코실-포스파티딜이노시톨(GPI) 또는 B7-1 항원(B7-1) 세포질 테일을 포함하는 링커를 사용하여 세포의 표면에 테더링된 것인 방법.
실시양태 6. 하나 이상의 면역조정제가 과립구-대식세포 콜로니 자극 인자(GM-CSF), 종양 괴사 인자 알파(TNF-알파), 림프독소 알파(LTA), 림프독소 베타(LTB), TNF 슈퍼패밀리 구성원 4(TNFSF4), CD40 리간드(CD40LG), fas 리간드(FASLG), CD70 분자(CD70), TNF 슈퍼패밀리 구성원 8(TNFSF8), TNF 슈퍼패밀리 구성원 9(TNFSF9), TNF 슈퍼패밀리 구성원 10(TNFSF10), TNF 슈퍼패밀리 구성원 11(TNFSF11), TNF 슈퍼패밀리 구성원 12(TNFSF12), TNF 슈퍼패밀리 구성원 13(TNFSF13), TNF 슈퍼패밀리 구성원 13b(TNFSF13B), TNF 슈퍼패밀리 구성원 14(TNFSF14), TNF 슈퍼패밀리 구성원 15(TNFSF15), TNF 슈퍼패밀리 18(TNFSF18), 엑토디스플라신 A(EDA), 하나 이상의 사이토카인, 및 바이러스 항원 단백질로 구성된 군으로부터 선택되는 것.
실시양태 7. 실시양태 6에 있어서, 하나 이상의 사이토카인이 인터류킨 10 및 인터류킨 12로부터 선택되는 것인 방법.
실시양태 8. 상기 실시양태 중 임의의 것에 있어서, 복수의 세포가 표적 조직에 특이적인 하나 이상의 귀소 수용체를 발현하도록 조작되고, 여기서, 하나 이상의 귀소 수용체는 복수의 세포 중 한 세포의 표면에서 발현되거나, 또는 복수의 세포 중 한 세포에 의해 분비되는 것인 방법.
실시양태 9. 실시양태 8에 있어서, 표적 조직이 폐 또는 림프 조직인 것인 방법.
실시양태 10. 실시양태 9에 있어서, 하나 이상의 귀소 수용체가 림프 조직에서 내피 세포, 림프구, 대식세포, 또는 망상 세포, 또는 그의 조합을 표적화하는 것인 방법.
실시양태 11. 실시양태 8-10에 있어서, 하나 이상의 귀소 수용체가 화학적 링커, 펩티드 링커, 또는 중합체로부터 선택된 링커에 의해 복수의 세포 중 한 세포의 표면에 테더링된 것인 방법.
실시양태 12. 실시양태 11에 있어서, 링커가 글리코실-포스파티딜이노시톨(GPI) 또는 B7-1 항원(B7-1) 세포질 테일을 포함하는 것인 방법.
실시양태 13. 실시양태 8-12에 있어서, 하나 이상의 귀소 수용체가 복수의 세포 중 한 세포의 표면 상에서의 하나 이상의 귀소 수용체의 발현을 증가시키도록 유전적으로 변형된 것인 방법.
실시양태 14. 실시양태 8-13에 있어서, 하나 이상의 귀소 수용체가 동일하지 않은 2개 이상의 표적 조직에 특이적인 2개 이상의 귀소 수용체를 포함하는 것인 방법.
실시양태 15. 실시양태 8-14에 있어서, 하나 이상의 귀소 수용체가 C-X-C 케모카인 수용체 타입 3 (CXCR3), 류코시아린 (CD43), CD44 항원(CD44), C-C 케모카인 수용체 타입 7(CCR7), L-셀렉틴 (CD62L), 림프구 기능 연관 항원 1(LFA-1), 또는 초후기 항원-4(VLA4)로부터 선택되는 것인 방법.
실시양태 16. 실시양태 1에 있어서, 복수의 세포 중 한 세포가 바이러스 항원을 포함하는 것인 방법.
실시양태 17. 실시양태 16에 있어서, 바이러스 항원이 복수의 세포 중 한 세포의 표면 상에서 발현되는 것인 방법.
실시양태 18. 실시양태 16에 있어서, 바이러스 항원이 화학적 링커, 펩티드 링커, 또는 중합체로부터 선택된 링커에 의해 복수의 세포 중 한 세포의 표면에 테더링된 것인 방법.
실시양태 19. 실시양태 18에 있어서, 링커가 글리코실-포스파티딜이노시톨(GPI) 또는 B7-1 항원(B7-1) 세포질 테일을 포함하는 것인 방법.
실시양태 20. 실시양태 16-19에 있어서, 바이러스 항원이 복수의 세포 중 한 세포에서 발현된 막횡단 펩티드인 것인 방법.
실시양태 21. 실시양태 16-20에 있어서, 바이러스 항원이 인간에 대해 면역원성인 것인 방법.
실시양태 22. 실시양태 16-21에 있어서, 바이러스 항원이 코로나 바이러스로부터 유래된 펩티드인 것인 방법.
실시양태 23. 실시양태 22에 있어서, 펩티드가 코로나 바이러스로부터 유래된 스파이크 단백질, 막 단백질, 또는 핵단백질로부터 선택되는 것인 방법.
실시양태 24. 실시양태 23에 있어서, 코로나 바이러스가 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2), 또는 그의 변이체인 것인 방법.
실시양태 25. 실시양태 22-24에 있어서, 복수의 세포 중 세포가 펩티드를 코딩하는 mRNA를 포함하는 것인 방법.
실시양태 26. 실시양태 25에 있어서, mRNA가 서열 번호 1과 적어도 80% 동일한 mRNA 서열을 포함하는 것인 방법.
실시양태 27. 실시양태 25에 있어서, mRNA가 서열 번호 1과 적어도 85% 동일한 mRNA 서열을 포함하는 것인 방법.
실시양태 28. 실시양태 25에 있어서, mRNA가 서열 번호 1과 적어도 90% 동일한 mRNA 서열을 포함하는 것인 방법.
실시양태 29. 실시양태 25에 있어서, mRNA가 서열 번호 1과 적어도 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 mRNA 서열을 포함하는 것인 방법.
실시양태 30. 실시양태 25에 있어서, mRNA가 서열 번호 1과 적어도 100% 동일한 mRNA 서열을 포함하는 것인 방법.
실시양태 31. 실시양태 22-25에 있어서, 펩티드가 서열 번호 2와 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는 것인 방법.
실시양태 32. 실시양태 25-31에 있어서, mRNA 반감기가 3-5일인 것인 방법.
실시양태 33. 실시양태 25-31에 있어서, mRNA가 알부민 펩티드를 포함하는 융합 단백질을 코딩하는 것인 방법.
실시양태 34. 실시양태 25-31에 있어서, mRNA가 면역조정제를 포함하는 융합 단백질을 코딩하는 것인 방법.
실시양태 35. 실시양태 34에 있어서, 면역조정제가 피험체에서 면역 반응의 활성제인 것인 방법.
실시양태 36. 실시양태 34에 있어서, 면역조정제가 과립구-대식세포 콜로니 자극 인자(GM-CSF) 또는 사이토카인, 또는 그의 조합인 것인 방법.
실시양태 37. 상기 실시양태 중 임의의 것에 있어서, 병원체가 호흡기 바이러스, 피부 바이러스, 식품매개 바이러스, 성 매개 바이러스, 또는 종양용해성 바이러스, 또는 그의 조합으로부터 선택되는 생 바이러스인 것인 방법.
실시양태 38. 실시양태 37에 있어서, 호흡기 바이러스가 리노바이러스, 인플루엔자 바이러스, 호흡기 세포융합 바이러스, 및 코로나 바이러스로부터 선택되는 것인 방법.
실시양태 39. 실시양태 38에 있어서, 코로나 바이러스가 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2), 또는 그의 변이체인 것인 방법.
실시양태 40. 실시양태 37에 있어서, 피부 바이러스가 전염성 연속종, 단순 헤르페스 바이러스-1, 및 수두 대상포진 바이러스로부터 선택되는 것인 방법.
실시양태 41. 실시양태 37에 있어서, 식품매개 바이러스가 A형 간염, 노로바이러스, 및 로타바이러스로부터 선택되는 것인 방법.
실시양태 42. 실시양태 37에 있어서, 성 매개 바이러스는 인간 유두종바이러스, B형 간염, 성기 헤르페스, 및 인간 면역결핍 바이러스로부터 선택되는 것인 방법.
실시양태 43. 실시양태 37에 있어서, 종양용해성 바이러스가 인간 유두종바이러스 또는 B형 간염으로부터 선택되는 것인 방법.
실시양태 44. 상기 실시양태 중 임의의 것에 있어서, (a)에서의 투여가 복강내, 종양내, 정맥내, 림프내, 근육내, 또는 흡입인 것인 방법.
실시양태 45. 실시양태 1에 있어서, 병원체가
a) 이중 가닥(ds) DNA 바이러스(예컨대, 아데노바이러스, 헤르페스바이러스, 폭스바이러스);
b) 단일 가닥(ss) DNA 바이러스(+ 가닥 또는 "센스") DNA(예컨대, 파보바이러스);
c) dsRNA 바이러스(예컨대, 레오바이러스);
d) (+)ssRNA 바이러스(+ 가닥 또는 센스) RNA(예컨대, 피코나바이러스, 토가바이러스);
e) (-)ssRNA 바이러스(- 가닥 또는 안티센스) RNA(예컨대, 오르토믹소바이러스, 랍도바이러스);
f) 라이프 사이클에서 DNA 중간체를 갖는 ssRNA-RT 바이러스(+ 가닥 또는 센스) RNA(예컨대, 레트로바이러스); 또는
g) 라이프 사이클에서 RNA 중간체를 갖는 dsDNA-RT 바이러스 DNA(예컨대, 헤파드나바이러스)로부터 선택되는 생 바이러스인 것인 방법.
실시양태 46. 실시양태 1-36에 있어서, 병원체가 박테리아, 바이러스, 기생충, 진균, 자가항체, 항체, 유독 물질, 독성 물질, 또는 그의 조합인 것인 방법.
실시양태 47. 실시양태 1-46에 있어서, (a) 적어도 48시간 동안 4℃에서 현탁액에서 보관된 복수의 세포를 받는 단계로서, 여기서, 복수의 세포는 생물학적 활성이 저속화되거나, 정지된 것인 단계; 및 (b) 현탁액으로부터 복수의 세포를 제거하여 복수의 세포의 생물학적 활성을 회복시키는 단계를 추가로 포함하는 방법.
병원체를 포획
하기
위한 조성물
실시양태 1. 핵의 부재하에서 병원성 항원에 대한 수용체 또는 그의 병원체 항원 결합 단편의 합성을 위한 하나 이상의 세포내 세포소기관을 포함하는 핵이 없는 세포.
실시양태 2. 실시양태 1에 있어서, 하나 이상의 세포내 세포소기관이 소포체 또는 골지체인 것인 핵이 없는 세포.
실시양태 3에 있어서, 실시양태 1-2 중 어느 하나에 있어서, 병원성 항원에 대한 수용체 또는 그의 병원체 항원 결합 단편이 핵이 없는 세포의 표면에 커플링된 것인 핵이 없는 세포.
실시양태 4. 실시양태 1-3 중 어느 하나에 있어서, 병원성 항원에 대한 수용체 또는 그의 병원체 항원 결합 단편이 병원성 항원에 대한 수용체 또는 그의 병원체 항원 결합 단편을 핵이 없는 세포의 표면에 커플링시키는 막횡단 도메인을 포함하는 것인 핵이 없는 세포.
실시양태 5. 실시양태 1-4 중 어느 하나에 있어서, 핵이 없는 세포가 과립구-대식세포 콜로니 자극 인자를 포함하는 면역조정제를 추가로 포함하는 것인 핵이 없는 세포.
실시양태 6. 실시양태 1-5 중 어느 하나에 있어서, 핵이 없는 세포의 직경이 약 1 마이크로미터(㎛) 내지 100 ㎛인 것인 핵이 없는 세포.
실시양태 7. 실시양태 6에 있어서, 직경이 약 8 ㎛인 것인 핵이 없는 세포.
실시양태 8. 실시양태 1-7 중 어느 하나에 있어서, 핵이 없는 세포가 적어도 24시간 동안 냉동동면 후 생존가능한 것인 핵이 없는 세포.
실시양태 9. 실시양태 1-7 중 어느 하나에 있어서, 핵이 없는 세포가 적어도 24시간 동안 동결보존 후 생존가능한 것인 핵이 없는 세포.
실시양태 10. 실시양태 1-9 중 어느 하나에 있어서, 핵이 없는 세포가 동결보존, 냉동동면, 또는 동결건조된 것인 핵이 없는 세포.
실시양태 11. 실시양태 1-10 중 어느 하나에 있어서, 핵이 없는 세포가 단리 또는 정제된 것인 핵이 없는 세포.
실시양태 12. 실시양태 1-11 중 어느 하나에 있어서, 병원성 항원이 코로나 바이러스의 항원인 것인 핵이 없는 세포.
실시양태 13. 실시양태 12에 있어서, 코로나 바이러스가 SARS-CoV-2인 것인 핵이 없는 세포.
실시양태 14. 실시양태 1-13 중 어느 하나에 있어서, 병원체 항원과 숙주 세포에 의해 생산된 그의 천연 수용체 사이의 결합을 차단하는 중화 항체를 추가로 포함하는 핵이 없는 세포.
실시양태 15. 실시양태 1-14 중 어느 하나에 있어서, 하나 이상의 면역조정제를 추가로 포함하는 핵이 없는 세포.
실시양태 16. 실시양태 15에 있어서, 하나 이상의 면역조정제가 글리코실-포스파티딜이노시톨(GPI) 또는 B7-1 항원(B7-1) 세포질 테일을 포함하는 링커를 사용하여 핵이 없는 세포의 표면에 테더링된 것인 핵이 없는 세포.
실시양태 17. 실시양태 15에 있어서, 하나 이상의 면역조정제가 과립구-대식세포 콜로니 자극 인자(GM-CSF), 종양 괴사 인자 알파(TNF-알파), 림프독소 알파(LTA), 림프독소 베타(LTB), TNF 슈퍼패밀리 구성원 4(TNFSF4), CD40 리간드(CD40LG), fas 리간드(FASLG), CD70 분자(CD70), TNF 슈퍼패밀리 구성원 8(TNFSF8), TNF 슈퍼패밀리 구성원 9(TNFSF9), TNF 슈퍼패밀리 구성원 10(TNFSF10), TNF 슈퍼패밀리 구성원 11(TNFSF11), TNF 슈퍼패밀리 구성원 12(TNFSF12), TNF 슈퍼패밀리 구성원 13(TNFSF13), TNF 슈퍼패밀리 구성원 13b(TNFSF13B), TNF 슈퍼패밀리 구성원 14(TNFSF14), TNF 슈퍼패밀리 구성원 15(TNFSF15), TNF 슈퍼패밀리 18(TNFSF18), 엑토디스플라신 A(EDA), 하나 이상의 사이토카인, 및 바이러스 항원 단백질로 구성된 군으로부터 선택되는 것인 핵이 없는 세포.
실시양태 18. 실시양태 1-17 중 어느 하나에 있어서, 표적 조직에 특이적인 하나 이상의 귀소 수용체를 추가로 포함하는 핵이 없는 세포.
실시양태 19. 실시양태 18에 있어서, 하나 이상의 귀소 수용체가 림프 조직 중 내피 세포, 림프구, 대식세포, 또는 망상 세포, 또는 그의 조합을 표적화하는 것인 핵이 없는 세포.
실시양태 20. 실시양태 18에 있어서, 하나 이상의 귀소 수용체가 화학적 링커, 펩티드 링커, 또는 중합체로부터 선택되는 링커에 의해 복수의 세포 중 한 세포의 표면에 테더링된 것인 핵이 없는 세포.
실시양태 21. 실시양태 20에 있어서, 링커가 글리코실-포스파티딜이노시톨(GPI) 또는 B7-1 항원(B7-1) 세포질 테일을 포함하는 것인 핵이 없는 세포.
실시양태 22. 실시양태 18-21 중 어느 하나에 있어서, 하나 이상의 귀소 수용체가 C-X-C 케모카인 수용체 타입 3 (CXCR3), 류코시아린 (CD43), CD44 항원(CD44), C-C 케모카인 수용체 타입 7(CCR7), L-셀렉틴 (CD62L), 림프구 기능 연관 항원 1(LFA-1), 또는 초후기 항원-4(VLA4)로부터 선택되는 것인 핵이 없는 세포.
실시양태 23. 실시양태 1-23 중 어느 하나에 있어서, 바이러스 항원을 추가로 포함하는 핵이 없는 세포.
실시양태 24.
실시양태 1-23 중 어느 하나의 핵이 없는 세포 또는 복수의 실시양태 1-23 중 어느 하나의 핵이 없는 세포; 및
약학적으로 허용되는: 부형제, 희석제, 또는 담체를 포함하는 약학적 제제.
실시양태 25.
피험체에게 실시양태 1-23 중 어느 하나의 핵이 없는 세포, 또는 실시양태 24의 약학적 제제를 투여하여 병원체 항원을 갖는 병원체를 세포에 포획하고, 세포내에서 병원체가 증식하지 못하게 방해하는 단계를 포함하는, 피험체에서 병원체에 의한 감염을 감소시키는 방법.
실시양태 26. 실시양태 25에 있어서, 병원체가 투여 후 14일 이하의 기간 이내에 피험체로부터 제거되는 것인 방법.
실시양태 27. 실시양태 26-27 중 어느 하나에 있어서, 핵이 없는 세포가 중화 항체를 방출하여 병원체 항원과 숙주 세포에 의해 생산된 그의 천연 수용체 사이의 결합을 차단하는 것인 방법.
실시양태 28. 실시양태 26-28 중 어느 하나에 있어서, 핵이 없는 세포가 바이러스 항원을 제시하여 병원체에 의한 감염으로부터 피험체를 면역화시키는 것인 방법.
VII.
실시예
하기 실시예는 예시 목적으로만 포함되며, 본 발명의 범주를 제한하는 것으로 의도되지 않는다.
실시예
1. 코로나바이러스용 항바이러스 조성물의 제조 방법
약독화된 코로나바이러스 항원을 코딩하는 이종성 핵산으로 줄기 세포(예컨대, 중간엽 줄기 세포)의 렌티바이러스 매개 형질감염을 수행한다. 이어서, 실시예 7에 기술된 방법에 의해 줄기 세포의 제핵을 수행한다. 세포 표면에서 약독화된 코로나바이러스 항원을 발현하는 제핵 줄기 세포는 유세포 분석법을 사용하여 검증한다. 약독화된 코로나 바이러스 항원을 발현하는 성공적으로 제핵된 줄기 세포(본 실시예에서 "세포질체"로 지칭)는 공지된 방법에 따라 단리 및 정제된다. 임의적으로, 세포질체는 실시예 4에 제공된 방법을 사용하여 동결보존된다. 상기 기술된 세포질체는 코로나바이러스 감염 예방을 위한 백신으로서 유용하다.
상기와 유사한 방법을 사용하여 코로나바이러스에 대한 제2 항바이러스 조성물은 제조하되, 약독화된 코로나바이러스 항원 대신에, 코로나바이러스에 대한 항체가 줄기 세포에서 발현된다. 대안적으로 또는 추가로, 코로나바이러스에 대한 소분자는 전기천공법(또는 당업계에 공지된 유사한 방법)을 사용하여 제핵 줄기 세포에 로딩된다. 코로나바이러스에 대한 항바이러스 항체, 및/또는 코로나바이러스에 대한 소분자를 발현하는 성공적으로 제핵된 줄기 세포(본 실시예에서 "세포질체"로 지칭)는 공지된 방법에 따라 단리 및 정제된다. 임의적으로, 세포질체는 실시예 4에 제공된 방법을 사용하여 동결보존된다. 상기 기술된 세포질체는 급성 코로나바이러스 감염을 치료하는 데 유용하다.
실시예
2.
피험체에서
코로나바이러스 감염 예방
약독화된 코로나바이러스 또는 코로나바이러스 단백질의 펩티드 단편을 발현하는 실시예 1에 기술된 항바이러스 조성물은 정맥내 투여용으로 제제화된다. 약독화된 코로나바이러스 또는 코로나바이러스 단백질의 펩티드 단편은 본원에 기술된 세포질체에 캡슐화된 mRNA로부터 코딩될 수 있다. 일부 실시양태에서, 항바이러스 조성물은 근육내 투여용으로 제제화된다. 일부 실시양태에서, 피험체는 제1 및 제2 용량의 항바이러스 조성물을 투여받는다. 일부 실시양태에서, 제2 용량의 항바이러스 조성물은 제1 용량 투여 후 적어도 1일, 2일, 3일, 4일, 1주, 2주, 3주, 4주, 1개월, 2개월, 3개월, 또는 4개월 후에 투여된다. 제제는 피험체에게 정맥내로 투여된다. 예를 들어, 인간 피험체에 대한 투여는 피험체가 아동일 때 적어도 5회 수행될 것이다. 일부 실시양태에서, 제제는 피험체가 2개월, 4개월, 6개월, 15-18개월, 및 4-6세 연령일 때 피험체에게 투여된다. 본 실시예에서, 피험체는 코로나바이러스 감염으로부터 면역화된다.
실시예
3.
피험체에서
급성 코로나바이러스 감염 치료
항코로나바이러스 항체(예컨대, 중화 항체), 또는 코로나 바이러스에 대한 소분자를 발현하는, 실시예 1에 기술된 항바이러스 조성물은 정맥내 투여용으로 제제화된다. 제제는 코로나바이러스에 감염되었거나, 또는 감염된 것으로 의심되는 피험체에게 정맥내로 투여된다. 일부 실시양태에서, 투여는 1회 초과로 수행된다. 예를 들어, 투여는 일정 기간 동안(예컨대, 1년 동안) 매일, 이틀마다, 매주, 2주마다, 매월, 2개월마다 수행될 수 있다. 본 실시예에서는 피험체에서 코로나바이러스 감염이 감소된다.
대안적으로 또는 추가로, 페이로드가 없는 제핵 줄기 세포(예컨대, 중간엽 줄기 세포)는 정맥내 투여용으로 제제화된다. 제제는 코로나바이러스에 감염되었거나, 또는 감염된 것으로 의심되는 피험체에게 정맥내로 투여된다. 일부 실시양태에서, 투여는 1회 초과로 수행된다. 예를 들어, 투여는 일정 기간 동안(예컨대, 1년 동안) 매일, 이틀마다, 매주, 2주마다, 매월, 2개월마다 수행될 수 있다. 본 실시예에서, 세포질체는 생체내에서 코로나바이러스로 감염되고, 세포질체에 포획된다. 핵이 없는 세포질체는 코로나바이러스 복제 및 증식에 필요한 유전 물질이 결여되어 있는 바, 코로나바이러스가 추가 감염되는 것을 방지한다. 본 실시예에서는 코로나바이러스 감염이 감소된다.
실시예
4. 포유동물 세포로부터 세포질체 제조
세포질체는 동종이계 또는 자가 공여자 유래 세포로부터 생성될 수 있고, 질환 치료 및 진단에 사용될 수 있다. 개념 증명으로 다양한 유형의 포유동물 세포(예컨대, 중간엽 줄기 세포, 호중구, 섬유아세포, 및 자연 살해 세포)의 제핵 효율 및 회수율을 측정하였다. 세포 배양 플레이트로부터 포유동물 세포를 제거한 후, 불연속 피콜 구배를 사용하는 밀도 구배 원심분리, 고속 원심분리에 의해 포유동물 세포에서 제핵하였다. 표 1에는 부유 프로토콜을 사용한 제핵 결과가 요약되어 있다. 제핵 효율과 세포 생존능은 hTERT 형질전환된 세포와 1차 중간엽 줄기 세포(MSC) 둘 모두 뿐만 아니라, 섬유아세포 및 호중구에서 가장 높았다. 표 2에는 부착 프로토콜을 사용한 제핵 결과가 요약되어 있다. 제핵 효율은 중간엽 줄기 세포 및 대식세포, 둘 모두에서 70% 초과였다. 본 실험은 본원에 기술된 임의의 방법을 사용하여 다양한 유형의 포유동물 세포에서 제핵할 수 있다는 것을 보여주었다.
이어서, 세포질체의 생존을 96시간에 걸쳐 측정하였다. MSC는 시간이 지남에 따라 증식했지만, 세포질체는 증식하지 않았다. 대신, 생존가능한 세포질체의 상대적 변화 배수는 96시간째에 감소하기 전에 72시간 동안 상당히 일정하게 유지되었다. 따라서, 세포질체 생존은 3-4일에 걸쳐 있었다. 대부분의 세포 기반 요법은 즉시 사용되지 않기 때문에, 동결보존 후 세포질체의 생존능을 측정하였다. 놀랍게도, 동결보존 후 세포질체의 생존능은 동결보존 후 MSC의 생존능보다 더 컸다. 제핵 직후에 플레이팅된 세포질체 및 동결보존으로부터 회수된 세포질체는 24시간 후 유사한 상대적 세포 생존능을 보였다. 본 실험은 세포질체의 생존이 동결보존에 의해 영향을 받지 않았다는 것을 보여주었다. 추가로, 냉동동면 후 세포질체의 생존율은 냉동동면 후 MSC의 생존능과 유사하였다(도 6a). 다양한 기간 동안 냉동동면 후 회수된 세포질체는 보이덴 챔버 검정법에서 냉동동면 후 회수된 MSC와 유사한 유도성 이동이 이루어질 수 있었다(도 6b).
이어서, 생체외에서 세포의 대규모 생산을 셋업한 후, 대용량 밀도 구배 원심분리 및 제핵을 수행하여 치료용 세포질체를 생성한다. 한 실시양태에서, 치료용 세포질체에 질환 치료를 위한 치료 카르고(예컨대, mRNA, 약물, 펩티드 등...)를 로딩된다. 또 다른 실시양태에서, 치료용 세포질체는 진단용으로 즉각적인 사용을 위해 (예컨대, 정맥내 주사(IV), 복강내 주사(IP), 조직, 또는 시험관내 적용을 위해) 제조된다.
실시예
5. 세포질체는
세포소기관을
소유하고,
세포외
기질과 상호작용하고, 세포 생물학적 기능을 수행하고, 카르고를 전달한다.
세포질체가 동결보존 후 생존능을 유지할 수 있는지 여부를 측정한 후, MSC 유래 세포질체의 세포 표면 마커 프로파일이 골수 유래 MSC와 다른지 여부를 측정하기 위해 유세포 분석법에 의한 분석을 수행하였다. MSC 유래 세포질체 및 골수 유래 MSC, 둘 모두 CD45, CD90, CD44, CD146 및 CD166의 세포 표면 발현을 유지하였다. 세포질체는 부착되고, 세포골격을 재조직화하고, 2D 및 3D 배양 시스템에서 기질 단백질에 스프레딩하고, 터널링 나노튜브를 형성하여 기원이 동일하거나, 또는 상이한 세포 간에 생물생성물을 전달할 수 있다. 세포소기관 염색은 골지체, ER, F-액틴 세포골격, 리소좀, 엔도솜, 미세소관 및 미토콘드리아가 세포질체에서 무손상 상태 그대로 유지됨을 나타낸다. 추가로, 세포질체는 시험관내에서 귀소 잠재능을 보였다. 세포질체는 세포외 기질 단백질로 쉽게 이동하고, (화학 감지를 통해) 가용성 케모카인 구배를 향해 방향성을 가지고 이동하였다. 특히, 정제된 mRNA로 외인성으로 형질감염된 세포질체는 다양한 임상 용도 및 질환 상태를 위해 개발되고 있는 치료 mRNA 애플리케이션을 모방할 수 있는 기능성 세포내 단백질을 생성했다. 이는 또한 mRNA 번역 및 단백질 합성을 위한 기계가 핵이 없는 세포질체에서 정상적으로 작동하므로 치료적 가치가 있는 생체활성 분자를 생산하는 데 사용될 수 있다는 것을 보여주는 것이다.
공지된 분비 단백질을 코딩하는 정제된 mRNA로 외인성으로 형질감염된 세포질체는 조절 배양 배지에서 기능적 세포외 단백질을 생성하는 데, 이는 ER/골지체 및 분비 경로가 핵의 부재하에 세포질체에서 정상적으로 작동함을 나타낸다. 추가로, 분비 단백질을 함유하는 세포질체 조절 배지로 대식세포 및 내피 세포를 처리하면 이들 세포에서 주요 신호 전달 반응이 활성화되었다. 이는 세포질체를 치료 가치가 있는 분비된 단백질과 생체분자를 생산하고, 전달하는 신규한 비히클로서 사용할 수 있다는 개념 증명을 제공하였다. 세포질체에는 siRNA, shRNA, mRNA, DNA 플라스미드, 펩티드 및 화학요법제를 포함하나, 이에 제한되지 않는 다양한 카르고를 로딩할 수 있다.
실시예
6. 조작된 세포질체는 기능성 세포 표면 단백질을 발현할 수
있다
CXCR4를 발현하는 조작된 MSC 및 CXCR4를 발현하는 조작된 MSC 유래 세포질체는 유세포 분석법에 의해 측정된 바와 같이 유사한 수준의 CXCR4를 발현한다. 조작된 세포질체가 기능적 세포 표면 단백질을 발현할 수 있는지 여부를 측정하기 위해, CXCR4 수용체를 발현하는 MSC 및 MSC 유래 세포질체를 다양한 농도의 SDF-1α로 이동할 수 있도록 하였다. 기능성 CXCR4를 발현하도록 조작된 MSC 유래 세포질체는 SDF-1α로 이동할 수 있으며, 세포 이동은 SDF-1α 농도가 증가함에 따라 증가한다. 추가로, 이동하는 MSC 유래 세포질체의 수는 CXCR4를 발현하는 이동하는 MSC의 수보다 더 많았다.
MSC 유래 세포질체는 염증이 있는 혈관 구조에 대한 세포 부착을 매개하는 것으로 알려진 기능성 세포 부착 단백질을 발현하도록 조작될 수 있다. MSC 유래 세포질체는 치료 세포의 대식세포 상호작용과 식세포 작용을 조절하는 것으로 알려진 세포 단백질을 발현하도록 조작될 수 있다.
실시예
7 -
조작된 세포질체는
시험관내
및
생체내
, 둘 모두에서 작용할 수 있다
이론에 얽매이지 않고, 본 실시예는 "카르고", 예컨대, 외인성 mRNA 분자를 발현하도록 조작된 세포질체가 생성될 수 있음을 보여준다. 도 7b 및 도 7c는 MSC 유래 세포질체가 시험관내 및 정맥내 주사 후 임상전 마우스 모델에서 기능성 항염증성 사이토카인 인터루킨 10(IL-10)을 치료 수준으로 생성 및 분비하도록 조작될 수 있다는 것을 보여주는 것이다. 도 7b는 IL-10 mRNA로 형질감염된 세포질체가 높은 수준의 IL-10을 분비할 수 있다는 것을 보여준다. 분비된 IL-10이 활성인지 여부를 측정하기 위해, 혈청 고갈 대식세포를 비처리 MSC, IL-10을 발현하는 MSC, 비처리 세포질체 및 IL-10을 발현하는 세포질체의 조절 배지(CM)와 함께 인큐베이션시켰다. 인산화된 STAT3은 IL-10을 발현하는 MSC로부터의 CM과 함께 인큐베이션 후 대식세포에서 검출되었고, IL-10을 발현하는 세포질체로부터의 CM과 함께 인큐베이션한 후, 검출되었지만, 비처리 MSC 및 비처리 세포질체로부터의 CM과 함께 인큐베이션한 후 대식세포에서는 STAT3 활성이 검출되지 않았다(도 7c). 세포질체 분비 IL-10이 생체내에서 검출될 수 있는지 여부를 측정하기 위해, C57B1/6 마우스에 IL-10을 발현하는 MSC 또는 MSC 유래 세포질체를 안와후 주사하였다. 주사 2시간 후, 혈액을 수집하고, IL-10의 수준을 측정하였다. 비처리 MSC를 주사맞은 마우스의 혈액에서는 IL-10이 거의 또는 전혀 검출되지 않았다(도 7d). 도 7d에 제시된 바와 같이. 도 7d에 도시된 바와 같이, 비처리 MSC를 주사맞은 마우스의 수준과 비교하여 IL-10을 발현하는 MSC 유래 세포질체를 주사맞은 마우스에서 더 높은 수준의 IL-10이 검출되었다.
이들 데이터는 정상 조직 및 이환 조직을 치료하기 위해 임상적으로 관련된 치료 사이토카인을 생성 및 분비하기 위한 유전적으로 조작된 세포질체 기반 세포 요법의 잠재성을 설명한다.
MSC 유래 세포질체가 기저막을 통해 침법할 수 있는지 여부를 측정하기 위해, MSC 또는 MSC 유래 세포질체를 24시간 동안 10% FBS를 향해 기저막을 통해 침범하도록 하였다. 도 8a 및 도 8a에 제시된 바와 같이, MSC 유래 세포질체는 10% FBS의 존재하에서 비처리 MSC와 같이 기저막을 침범하는 데 효율적이었다. 주목할만한 것은 비처리 MSC가 화학유인물질 부재하에서 기저막을 침범할 수 있는 반면, MSC 처리 세포질체는 화학유인물질 부재하에서 기저막을 훨씬 덜 침범할 수 있다. 본 데이터는 MSC 유래 세포질체가 소화되어 기저막을 통해 침범할 수 있음을 보여준다. 본 데이터는 조직내 그의 카르고(들)를 전달하기 위해 복잡한 세포외 기질 장벽을 통해 침투하고, 이동할 수 있는 세포질체 기반 세포 요법의 선천적인 잠재능을 보여주는 것이다.
도 9a 및 도 9a에 제시된 바와 같이, MSC 유래 세포질체의 평균 직경은 12 ㎛이고, MSC의 평균 직경은 20 ㎛였다. MSC 유래 세포질체의 생체분포를 결정하기 위해, 마우스에 MSC 또는 MSC 유래 세포질체를 안와후 주사하였다. 도 9c 및 도 9d에 제시된 바와 같이, 간에서 검출된 MSC의 수보다 더 많은 MSC 유래 세포질체가 간에서 검출되었다. 본 데이터는 광범위한 질환을 치료하기 위해 순환계에 직접 전달되는 세포질체 기반 세포 요법의 잠재능을 보여주는 것이다.
실시예
8. 세포질체를 생성하는 예시적인 방법
중간엽
줄기 세포(MSC)
제핵
본 프로토콜은 문헌 [Methods in Cell Biology Volume 14, 1976, Pages 87-93 Chapter 7 Enucleation of Mammalian Cells in Suspension (Michael H. Wigler, Alfred I. Neugut, I. Bernard Weinstein)]으로부터 수정되었다.
50% 피콜 용액 제조: 차광 유리 비이커에서, 실온에서 24시간 동안 연속하여 자기 교반함으로써 일정 그램의 피콜(PM400, GE Healthcare 17-0300-500)을 등가 수의 밀리리터 초순수(Invitrogen 10977-015)에 용해시켰다. 이어서, 혼합물을 30분 동안 오토클레이빙하였다. 일단 혼합물이 냉각되면, 균일한 농도를 보장하기 위해 다시 교반하였다. 굴절률은 굴절계(Reichert 13940000)에서 측정하였고, 1.4230-1.4290 범위였다. 분취량을 -20℃에서 보관하였다.
2X MEM 제조: 각 50 ml 양에 대해, 10 mL 10X MEM(Gibco, 11430-030), 2.94 mL 정확히 중탄산나트륨(7.5%, Gibco, 25080-094), 1 mL 100X Pen-Strep(Gibco 15140-122) 및 36 mL의 초순수(Invitrogen 10977-015)를 사용하였다. 이어서, 용액을 0.22 um 막 플라스크(Olympus 25-227)를 통해 여과하고, 4℃에서 보관하였다.
제핵 전날, MSC를 20 mL MSC 배지[MEM 1X(Gibco 12561-056); 16.5% 프리미엄 FBS(Atlanta Biologics S1150); 1% HEPES 1M(Gibco 15630-80); 1% 안티-안티 100X(Gibco 15240-062); 1% 글루타맥스 100X(Gibco 35050-061)] 중 15 cm 플레이트(Olympus 25-203)당 2.5 M으로 시딩하였다. 이어서, 사이토칼라신 B(Sigma Aldrich C6762)를 2X MEM(2 μM/mL 최종 농도)에 첨가하였다.
피콜 구배 제조: 2X CytoB를 50% 피콜 분취량에 1:1 희석률로 첨가하여 25% 피콜 스톡 농도를 만들었다. 이어서, 17%, 16%, 15% 및 12.5% 피콜은 25% 피콜을 적절한 부피의 1X MEM 완충액(1:1 희석률로 초순수에 첨가된 사이토칼라신 B를 포함하는 2X MEM)으로 희석하여 만들었다. 희석액은 마개를 느슨하게 덮은 상태에서 적어도 1시간 동안 CO2 인큐베이터에서 평형을 이루었다. 이어서, 피콜 구배를 13.2 mL 초투명 튜브(Beckman, 344059)에 붓고, CO2 인큐베이터에서 밤새도록(6-18시간) 인큐베이션시켰다.
제핵 당일, 12-25 M MSC(이상적으로는 20 M)를 제핵을 위해 각 튜브에 수집하였다. 배지를 흡인하고, 세포를 포스페이트 완충처리된 염수(PBS)(GIBCO 14190-144)로 1회 세척하였다. 5 mL의 TrypLE-Select(Gibco, 12563011)를 각 플레이트에 첨가하고, 최대 5분 동안 인큐베이션시켰다. 세포 중 90%가 탈착되었을 때, 5 mL의 완전 MSC 배지를 첨가하고 세포를 50 ml 튜브(3-4개 플레이트/튜브)에 수집하였다. 이어서, 튜브를 5분 동안 1,200 rpm으로 원심분리하였다. 펠릿을 10mL PBS에 재현탁시켰다. 세포를 계수하고, 펠릿화하고, 12.5% 피콜로 재현탁시켰다. 이어서, 세포-피콜 혼합물을 40 um 세포 여과기(Falcon 352340)를 통해 새로운 50 mL 튜브에 적가하였다. 시린지를 사용하여 3.2 mL의 세포 현탁액을 미리 만들어진 구배에 천천히 로딩하였다. 1X MEM 완충제 1 mL를 시린지로 마지막(상단) 층에 첨가하였다.이어서, 튜브를 로터 버킷에 로딩하고, 균형을 맞춘 후, 초원심분리기(Beckman, L8M)에서 60분, 26,000rpm, 31℃, Accel 7, Deccel 7에서 실행하였다. 원심분리 종료시, 3개의 층이 존재하는데: 하나는 12.5%의 상단 부근(세포질체 및 파편), 하나는 12.5/15% 경계면 부근(세포질체), 및 하나는 25% 하단의 펠릿(핵체). 15% 피콜 용액 위의 층을 15 ml 원뿔형 튜브에 수집하였다. 이어서, 수집된 층을 4 부피 초과의 가온 무혈청 MSC 배지로 희석한다(즉, 피콜 3 mL 및 최대 15 mL 배지로 충전). 부드럽게 혼합한 후, 혼합물을 1,200 rpm으로 10분 동안 펠릿화하였다. 가온 무혈청 MSC 배지로 3회 세척한 후, 세포를 실험 프로토콜, 예를 들어, 형질감염 배지 대 이동 배지 대 무혈청 배지 대 완전 배지에 따라 배지에 재현탁시켰다. 제핵 효율은 1:2000 희석 바이브란트® 다이사이클™ 그린(Molecular Probes V35004) 또는 1:5000 희석 훽스트 33342와 함께 완전 MSC 배지를 첨가하여 12웰 플레이트에서 측정하였다. 소량의 각 층을 각 웰에 첨가하고, 인큐베이터에서 10분 동안 부착/염색되도록 하였다. 집단당 음성 세포질체의 비율(%)은 표면형광 현미경법에 의해 측정하였다.
세포질체
mRNA
형질감염
1 M 세포질체를 가온 1 ml의 아미노산 무함유 α-MEM 완전 배지(ThermoFisher 12561056; 16.5% 프리미엄 우태아 혈청(FBS: fetal bovine serum), 1% 글루타맥스(Gibco 35050061), 31% Gibco0 8105)에 현탁시켰다. 1 ㎍ mRNA를 가온 opti-MEM으로 희석하고, 피펫으로 적어도 20회 혼합하였다. 4 ㎕ 리포펙타민-3000(ThermoFisher L300015)을 46 ㎕ 가온 opti-MEM(ThermoFisher 31985062)에 첨가하고, 적어도 20회 이상 피펫으로 혼합하였다. mRNA와 리포펙타민-3000의 비는 1:4(w/v)였다. mRNA 및 리포펙타민-3000 희석액을 적어도 20회 이상 피펫으로 혼합하고, 실온에서 15분 동안 인큐베이션시켰다. mRNA 및 리포펙타민-3000 혼합물을 세포질체 현탁액에 첨가하고, 잘 혼합하고, 37℃에서 30분 동안 인큐베이션시켰다. 세포 응집을 방지하기 위해 현탁액을 매 5분마다 진탕시켰다. 인큐베이션 후, 세포를 원심분리하고, 정상 α-MEM 완전 배지(16.5% 프리미엄 FBS, 1% 항생제-항진균제, 1% 글루타맥스, 1% HEPES) 또는 PBS에 재현탁시켰다.
세포질체
siRNA
형질감염
1 M 세포질체를 가온 1 ml의 A/A 무함유 α-MEM 완전 배지(16.5% 프리미엄 FBS, 1% 글루타맥스, 1% HEPES)에 현탁시켰다. 2 ㎕ siRNA를 가온 opti-MEM으로 희석하고, 피펫으로 적어도 20회 혼합하였다. 8 ㎕ 리포펙타민-3000을 92 ㎕ 가온 opti-MEM로 희석하고, 적어도 20회 이상 피펫으로 혼합하였다. siRNA와 리포펙타민-3000의 비는 1:4(w/v)였다. siRNA 및 리포펙타민-3000 희석액을 적어도 20회 이상 피펫으로 혼합하고, 실온에서 15분 동안 인큐베이션시켰다. siRNA 및 리포펙타민-3000 혼합물을 세포질체 현탁액에 첨가하고, 잘 혼합하고, 37℃에서 30분 동안 인큐베이션시켰다. 세포 응집을 방지하기 위해 현탁액을 매 5분마다 진탕시켰다. 20분 인큐베이션 후, 세포를 원심분리하고, 정상 α-MEM 완전 배지(16.5% 프리미엄 FBS, 1% 항생제-항진균제, 1% 글루타맥스, 1% HEPES)에 재현탁시켰다.
종양용해성 바이러스 감염된 세포질체 생성
제핵 하루 전(보통 제핵 18시간 전), 2.5*10^6 hTERT-MSC를 15 cm 디쉬에 시딩하였다. 시딩 후 대략 2시간째, 세포를 PBS로 1회 세척하였다. 이어서, 세포를 8 mL 무혈청 opti-MEM 존재하에 상이한 MOI(예를 들어, 0.05 또는 0.5)로 oHSV-GFP(Imanis OV3001)로 감염시켰다. 이어서, 때때로 진탕시키면서, 세포를 37℃에서 2시간 동안 인큐베이션시켰다. 이어서, 바이러스 접종물을 폐기하였다. 20 mL 사전 가온된 완전 배양 배지(α-MEM, 16.5% 프리미엄 FBS, 1% 항생제-항진균제, 1% 글루타맥스, 1% HEPES)를 각 웰에 첨가하였다. 제핵시까지 세포를 37℃에서 인큐베이션시켰다. 도 11은 폴리펩티드(VSV-GFP)를 모세포 또는 기준 세포(핵이 없는 세포) 및 본원에 기술된 제핵 세포 내로 직접 도입하는 형광 이미지를 도시한 것이다. 도 12는 GFP 항원을 코딩하는 단순 헤르페스 바이러스(oHSV)로 MSC를 감염시키는 것을 도시한 것이다. 도 12c는 제핵 MSC에 의한 표적 암 세포로의 카르고(예컨대, GFP 리포터) 전달 증가를 도시한 것이다. 도 12d는 본원에 기술된 제핵 MSC에 의해 접촉된 표적 암 세포에 대한 면역 세포(예컨대, CD8+ 이펙터 T 세포)의 동원 증가를 도시한 것이다.
세포질체에서 기능성 단백질을 과다발현하는
렌티바이러스
표적 세포를 1-2 Х 105개의 세포/웰의 밀도로 6-웰 플레이트의 1개 웰, 또는 0.5-1 M MSC가 있는 10 cm 플레이트에 플레이팅하였다. 다음날, 농축된 재조합 렌티바이러스를 37℃ 수조에서 해동시키고, 일단 해동되고 나면 즉시 수조에서 제거하였다. 이어서, 세포를 PBS로 3회 세척하였다. 200 ㎕ 무혈청 배지 또는 2 mL 무혈청 배지(1:1250 SureENTRY)를 첨가하였다. 표적 세포를 MOI 10:1로 6웰 플레이트에서 감염시켰다. 다음날, 바이러스 상청액을 제거하고, 적절한 완전 성장 배지를 세포에 첨가하였다. 72시간 인큐베이션 후, 세포를 2x100 mm 디쉬에 계대배양하였다. 안정적인 세포주 생성을 위해 적절한 양의 선별 약물(즉, 퓨로마이신)을 첨가하였다. 선별 10-15일 후, 클론을 확장을 위해 선별하고, 양성 클론에 대해 스크리닝하였다. 선별된 양성 클론은 제핵을 위해 확장시켰다. 조작된 세포질체는 상기에서 개략적으로 설명된 바와 같이 제조하였다. 세포질체 상의 표적 단백질 발현은 일반적인 생화학적 방법 또는 기능적 검정법, 예컨대, 형광 활성화 세포 분류(FACS: fluorescent activated cell sorting), 웨스턴 블롯 또는 보이덴 챔버 검정법에 의해 측정하였다.
세포질체 내로의 펩티드 로딩
웰당 1 x 105/ml를 완전 MSC 배지[MEM 1X(Gibco 12561-056); 16.5% 프리미엄 FBS(Atlanta Biologics S1150); 1% HEPES 1M(Gibco 15630-80); 1% 안티-안티 100X(Gibco 15240-062); 1% 글루타맥스 100X(Gibco 35050-061)] 중 4 챔버 유리 슬라이드(LabTek II 4-챔버 유리 슬라이드, 155383) 상에 플레이팅하였다. 세포를 적어도 1시간 또는 밤새도록 부착되도록 하였다. 이어서, 세포를 PBS(Gibco 14190-144)로 세정하였다. Arg9(FAM)(서열 번호 1154)(10 mM, Anaspec, AS-61207)를 완전 배지에서 1:100(100 uM)의 총 농도로 희석하였다. 이어서, 세포질체를 1 내지 2시간 동안 인큐베이션시키고, PBS로 3회 세정하였다. 훽스트 33342(Invitrogen)를 완전 배지 중 1:5000 희석률로 적어도 10분 동안 첨가하였다. 이어서, 세포를 PBS로 세정하고, 표면형광 현미경법에 의해 이미징하였다. 도 13은 Arg9와 공동 인큐베이션된 경우 관심 폴리펩티드의 로딩 또는 펩티드 흡수가 증가되었다는 것을 도시한 것이다.
실시예
9. 세포질체는
생체내에서
더 우수한 생체분포를
보여준다
MSC를 3D 현적(3D MSC)으로 배양한 후, 제핵하여 3D 세포질체를 생성하였다. 현적에 의한 MSC의 3D 배양 프로토콜은 문헌 [Curr Protoc Stem Cell Biol. 2014 Feb 6; 28: Unit-2B.6.(Thomas J. Bartosh1 and Joni H. Ylostalo)]로부터 수정된 것이다.
건강한 MSC를 트립신에 의해 2D 배양된 플레이트로부터 수확하고, 143만 개의 세포/ml로 신선한 α-MEM(ThermoFisher 12561056) 완전 배지(16.5% 프리미엄 FBS, 1% 항생제-항진균제, 1% 글루타맥스, 1% HEPES)에 재현탁시켰다. 15 cm 플레이트의 뚜껑을 완전히 열고, 20 ml PBS를 플레이트에 첨가하였다. 다채널 피펫을 사용하여 소적당 35 ㎕ (대략 50,000개 세포/소적)로 플레이트 뚜껑에 소적을 만들었다. 약 100-120개의 소적이 각 뚜껑에 배치되었다. 뚜껑을 닫고, 플레이트를 다시 인큐베이터에 넣었다. 소적을 2일 동안 배양한 후, 이어서, 세포 리프터로 수확하고, 15 ml 튜브에 수집하였다 (튜브당 대략 300개의 소적). 튜브를 1,200 rpm으로 5분 동안 원심분리하였다. 상청액을 제거하고, 튜브를 PBS로 2회 세척하였다. 이어서, 모든 PBS를 제거하고, 새로 해동된 0.25% 트립신-EDTA(ThermoFisher 25200114) 7.5 ml를 각 튜브에 첨가하였다. 튜브를 수조에서 4분 동안 인큐베이션시켰다. 소적을 저잔류 팁이 있는 1 ml 피펫으로 약 10-20회 부드럽게 피펫팅하고, 수조에서 추가로 4분 동안 인큐베이션시켰다. 대부분의 소적이 해리될 때까지, 소적을 저잔류 팁이 있는 1 ml 피펫으로 약 10-20회 부드럽게 피펫팅하였다. 7.5 ml의 완전 혈청 배지(GlutaMAX Supplement(Gibco 35050061); Fetal Bovine Serum- Premium Select(Atlanta Biologicals S11550), HEPES(1M)(Gibco 15630080), 항생제-항진균제(100X) (Gibco 15240062))를 각 튜브에 첨가하고, 튜브를 1,200 rpm으로 10분 동안 원심분리하였다. 해리된 세포를 10 ml의 완전 혈청 배지로 세척하고, 세포를 5 ml의 완전 혈청 배지로 재현탁시켰다. 세포를 70 ㎛ 세포 필터에 통과시킨 후, 필터를 5 ml 완전 혈청 배지로 세척하였다. 세포를 계수하고, 10 M/ml 초과로 전처리된 12.5% 피콜로 재현탁시켰다. 30-40 M 세포를 각 제핵 튜브에 사용하였다. 이어서, 상기 기술된 제핵 프로토콜에 따라 수행하였다.
DiD 표지된 정상 2D 배양된 MSC(2D MSC), 3D MSC 또는 3D 세포질체를 각각 BalB/C 마우스에 안와후 주사하였다. 명시된 조직을 주사 후 24시간째에 수거하고, FACS에 의해 DiD 표지된 세포를 분석하였다. 도 10a-10c는 3D 배양된 MSC로부터 3D 유래 세포질체의 성공적인 생성을 보여주고, 또한 3D 유래 세포질체는 순환으로의 주사 후 2D 배양된 세포보다 폐 포획이 적고, 말초 기관에 더 우수한 생체 분포를 가진다는 것을 보여주는 것이다. 이는 조직에 카르고를 국재화하고, 전달하는 그의 치료 능력을 크게 향상시킬 것으로 기대된다.
실시예
10. 감염에 의해 유발된 질환 치료 방법
SARS-CoV-2에 감염된 환자는 코로나바이러스 질환 2019(COVID-19)의 증상을 경험하기 시작한다. COVID-19의 호흡기 증상으로는 숨가쁨 및/또는 호흡 곤란을 포함한다.
피험체에서 COVID-19의 호흡기 증상을 치료하기에 충분한 인터류킨 10의 효능제 (IL-10), 또는 그의 일부를 발현하는 본원에 기술된 세포질체를 함유하는 약학적 제제를 환자에 투여한다. 본 실시예에서, 세포질체는 또한 림프계로의 세포질체의 효율적인 귀소를 가능하게 하기 위해 림프 조직을 표적화하는 귀소 수용체를 발현한다. 세포질체는 또한 예컨대, "날 먹지마" 신호 펩티드와 같은 면역 회피 모이어티를 발현하여 세포질체가 림프계에 도달하기 전에 피험체에서 제거되지 않도록 한다. 피험체의 호흡기 증상은 투여 후 감소되었다.
실시예
11. 종양용해성 바이러스 감염된 세포질체 생성
제핵 하루 전(보통 제핵 118 hr 전), 2.5*10^6 hTERT-MSC를 15 cm 디쉬에 시딩하였다. 시딩 후 대략 2시간째, 세포를 PBS로 1회 세척하였다. 이어서, 세포를 8 mL 무혈청 opti-MEM 존재하에 상이한 MOI(예를 들어, 0.05 또는 0.5)로 oHSV-GFP(Imanis OV3001)로 감염시켰다. 이어서, 때때로 진탕시키면서, 세포를 37℃에서 2시간 동안 인큐베이션시켰다. 이어서, 바이러스 접종물을 폐기하였다. 20 mL 사전 가온된 완전 배양 배지(α-MEM, 16.5% 프리미엄 FBS, 1% 항생제-항진균제, 1% 글루타맥스, 1% HEPES)를 각 웰에 첨가하였다. 제핵시까지 세포를 37℃에서 인큐베이션시켰다. 도 11a-b는 폴리펩티드(VSV-GFP)를 모세포 또는 기준 세포(핵이 없는 세포) 및 본원에 기술된 제핵 세포 내로 직접 도입하는 형광 이미지를 도시한 것이다. 감염 후 12 hr째에 MOI 0.05로 VSV-GFP(화살표)로 감염된 유핵 모 MSC(상단) 및 핵이 없는 MSC 유래 세포(하단)의 표면형광 현미경 이미지는 리포터 펩티드, GFP의 MSC 내로의 도입을 보여주었다. GFP 항원은 핵이 없는 MSC에 의해 명확하고, 강건하게 발현되었으며, 이는 제핵 세포에서의 바이러스 복제 및 항원 생산을 시사하는 것이다. 스케일 바 = 50 ㎛. 도 11b는 감염 후 12 hr째에 MOI 0.1로 VSV-GFP(화살촉)로 감염된 핵이 없는 MSC 유래 세포의 고배율 표면형광 이미지를 도시한 것이다. 제핵 세포를 또한 로다민 팔로이딘(화살표) 및 핵 결여를 나타내기 위해 핵 염색 DAPI를 이용하여 F-액틴 필라멘트에 대해 염색하였다. 도 11은 항원성 펩티드와 같은 외인성 펩티드를 발현하기 위해 세포질체를 조작하고 종양용해성 바이러스로 형질감염시킬 수 있다는 것을 도시한 것이다. 도 11은 또한 세포질체가 바이러스 포획 목적을 위해 바이러스에 의해 감염될 수 있음을 도시한 것이다.
실시예
12. 세포질체에 의해 접촉된 표적
세포에 대한 면역 반응의
동원 및 활성화
제핵 하루 전(보통 제핵 18 hr 전), 2.5*10^6 hTERT-MSC를 15 cm 디쉬에 시딩하였다. 시딩 후 대략 2시간째, 세포를 PBS로 1회 세척하였다. 이어서, 세포를 8 mL 무혈청 opti-MEM 존재하에 상이한 MOI(예를 들어, 0.05 또는 0.5)로 oHSV-GFP(Imanis OV3001)로 감염시켰다. 이어서, 때때로 진탕시키면서, 세포를 37℃에서 2시간 동안 인큐베이션시켰다. 이어서, 바이러스 접종물을 폐기하였다. 20 mL 사전 가온된 완전 배양 배지(α-MEM, 16.5% 프리미엄 FBS, 1% 항생제-항진균제, 1% 글루타맥스, 1% HEPES)를 각 웰에 첨가하였다. 제핵시까지 세포를 37℃에서 인큐베이션시켰다. 도 12a-12bd는 GFP 항원을 코딩하는 종양용해성 단순 헤르페스 바이러스(oHSV)로 MSC를 감염시키는 것을 도시한 것이다. MSC 및 핵이 없는 MSC의 표면형광 현미경 이미지는 감염 후 48 hr째 MOI 0.05로 GFP 항원을 코딩하는 oHSV로의 감염을 보여준다. 핵이 없는 MSC는 oHSV-GFP 접종 18 hr후 MSC로부터 생성되었다. 스케일 바 = 50 ㎛. 도 12b는 라이프액트-RFP를 발현하는 MSC 또는 핵이 없는 MSC를 GFP를 코딩하는 종양용해성 단순 헤르페스 바이러스(oHSV-GFP) 0.05 MOI로 감염시킨 후, 이어서, 누드 마우스에서 성장하는 확립된 U87 교아세포종 종양에 주사한 것을 도시한 것이다. 이미지는 주사 후 7일째에 촬영하였다. 강력한 GFP 신호로 나타난 바와 같이, MSC 및 핵이 없는 MSC는 oHSV를 종양 세포로 전달하였다. 7일 후 종양에서 핵이 없는 MSC는 거의 검출되지 않은 반면, 성장하는 종양의 중앙(주사 부위)과 바깥쪽 가장자리에는 다수의 MSC가 존재한다는 것이 주목할 만하였다. 도 12c는 oHSV-GFP 바이러스를 보유하는 MSC 또는 핵이 없는 MSC에 의해 감염된 종양 세포의 부분을 나타내는 GFP로 커버된 종양 면적의 비율(%)을 보여주는 막대 그래프이다. 도 12d는 PBS 주사 대조군과 비교하여 IL-12(애주번트) 조작된 핵이 없는 MSC 및 oHSV 조작된 핵이 없는 MSC의 조합으로 처리된 확립된 교아세포종 종양에 존재하는 CD8+ 이펙터 T 세포의 비가 증가된 것을 보여주는 그래프이다. 도 12는 본원에 기술된 세포질체가 조작된 세포질체의 부위에 면역 세포를 동원함으로써 충분한 면역 반응을 유도할 수 있다는 것을 도시한 것이다. 상기 시나리오에서, 세포질체 및 세포질체에 의해 캡슐화된 모든 임의의 카르고(예컨대, 세포질체 내부에 포획된 바이러스)은 동원된 면역 반응에 의해 파괴될 것이다.
실시예
13. 세포질체 내로의 펩티드 로딩
웰당 1 x 105/ml를 완전 MSC 배지[MEM 1X(Gibco 12561-056); 16.5% 프리미엄 FBS(Atlanta Biologics S1150); 1% HEPES 1M(Gibco 15630-80); 1% 안티-안티 100X(Gibco 15240-062); 1% 글루타맥스 100X(Gibco 35050-061)] 중 4 챔버 유리 슬라이드(LabTek II 4-챔버 유리 슬라이드, 155383) 상에 플레이팅하였다. 세포를 적어도 1시간 또는 밤새도록 부착되도록 하였다. 이어서, 세포를 PBS(Gibco 14190-144)로 세정하였다. Arg9(FAM)(서열 번호 1154)(10 mM, Anaspec, AS-61207)를 완전 배지에서 1:100(100 uM)의 총 농도로 희석하였다. 이어서, 세포질체를 1 내지 2시간 동안 인큐베이션시키고, PBS로 3회 세정하였다. 훽스트 33342(Invitrogen)를 완전 배지 중 1:5000 희석률로 적어도 10분 동안 첨가하였다. 이어서, 세포를 PBS로 세정하고, 표면형광 현미경법에 의해 이미징하였다. 도 13a-13b는 Arg9와 공동 인큐베이션된 경우 관심 폴리펩티드의 로딩 또는 펩티드 흡수가 증가되었다는 것을 도시한 것이다. 도 13a에 제시된 바와 같이, 100 μM의 세포 투과성 항원 펩티드(Arg)9-FAM(6-카복시플루오르세인, FAM-Arg-Arg-Arg-Arg-Arg-Arg-Arg-Arg-Arg-OH)과 함께 인큐베이션된 MSC(좌측) 및 제핵 MSC(세포질체)(우측)를 보여주는 것이다. 스케일 바 = 50 ㎛. 화살표는 훽스트 염색된 핵을 나타내고, 화살촉은 양성 (Arg)9-FAM을 나타낸다. 도 13b는 이미지J에서 측정된 상대 형광 강도를 나타내는 막대 그래프를 도시한 것이다. 보정된 총 세포 형광 = 적분된 밀도 - (선택한 세포 면적 X 배경 판독값의 평균 형광). 평균 ± SEM; n=10. 전반적으로, 도 13은 본원에 기술된 세포질체(예컨대, 핵이 없는 MSC)에 관심 폴리펩티드를 직접 로딩할 수 있다는 것을 도시한 것이다. 예를 들어, 항원은 세포질체와 함께 항원 및 Arg9(FAM)의 공동 인큐베이션에 의해 세포질체에 도입될 수 있다. 이어서, 이들 세포질체는 본원에 기술된 백신으로서 작용할 수 있다.
본 발명의 바람직한 실시양태가 본원에 제시되고, 기술되었지만, 그러한 실시양태는 단지 예로서 제공된다는 것이 당업자에게 명백할 것이다. 이제, 당업자는 본 발명에서 벗어남 없이 다수의 변형, 변경 및 치환에 대해 착안해 낼 수 있을 것이다. 본원에 기술된 본 발명의 실시양태에 대한 다양한 대안이 본 발명을 실시하는 데 이용될 수 있음을 이해하여야 한다. 하기 청구범위는 본 발명의 범주를 정의하고, 이러한 청구범위의 범주 내의 방법 및 구조 및 그의 등가물은 이에 의해 포함되는 것으로 의도된다.
SEQUENCE LISTING
<110> CYTONUS THERAPEUTICS, INC.
<120> RAPID VACCINE PLATFORM
<130> 53712-706.601
<140>
<141>
<150> 63/014,002
<151> 2020-04-02
<150> 62/975,044
<151> 2020-02-11
<160> 1154
<170> PatentIn version 3.5
<210> 1
<211> 4968
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 1
ttgattggtg attgtgcaac tgtacataca gctaataaat gggatctcat tattagtgat 60
atgtacgacc ctaagactaa aaatgttaca aaagaaaatg actctaaaga gggttttttc 120
acttacattt gtgggtttat acaacaaaag ctagctcttg gaggttccgt ggctataaag 180
ataacagaac attcttggaa tgctgatctt tataagctca tgggacactt cgcatggtgg 240
acagcctttg ttactaatgt gaatgcgtca tcatctgaag catttttaat tggatgtaat 300
tatcttggca aaccacgcga acaaatagat ggttatgtca tgcatgcaaa ttacatattt 360
tggaggaata caaatccaat tcagttgtct tcctattctt tatttgacat gagtaaattt 420
ccccttaaat taaggggtac tgctgttatg tctttaaaag aaggtcaaat caatgatatg 480
attttatctc ttcttagtaa aggtagactt ataattagag aaaacaacag agttgttatt 540
tctagtgatg ttcttgttaa caactaaacg aacaatgttt gtttttcttg ttttattgcc 600
actagtctct agtcagtgtg ttaatcttac aaccagaact caattacccc ctgcatacac 660
taattctttc acacgtggtg tttattaccc tgacaaagtt ttcagatcct cagttttaca 720
ttcaactcag gacttgttct tacctttctt ttccaatgtt acttggttcc atgctataca 780
tgtctctggg accaatggta ctaagaggtt tgataaccct gtcctaccat ttaatgatgg 840
tgtttatttt gcttccactg agaagtctaa cataataaga ggctggattt ttggtactac 900
tttagattcg aagacccagt ccctacttat tgttaataac gctactaatg ttgttattaa 960
agtctgtgaa tttcaatttt gtaatgatcc atttttgggt gtttattacc acaaaaacaa 1020
caaaagttgg atggaaagtg agttcagagt ttattctagt gcgaataatt gcacttttga 1080
atatgtctct cagccttttc ttatggacct tgaaggaaaa cagggtaatt tcaaaaatct 1140
tagggaattt gtgtttaaga atattgatgg ttattttaaa atatattcta agcacacgcc 1200
tattaattta gtgcgtgatc tccctcaggg tttttcggct ttagaaccat tggtagattt 1260
gccaataggt attaacatca ctaggtttca aactttactt gctttacata gaagttattt 1320
gactcctggt gattcttctt caggttggac agctggtgct gcagcttatt atgtgggtta 1380
tcttcaacct aggacttttc tattaaaata taatgaaaat ggaaccatta cagatgctgt 1440
agactgtgca cttgaccctc tctcagaaac aaagtgtacg ttgaaatcct tcactgtaga 1500
aaaaggaatc tatcaaactt ctaactttag agtccaacca acagaatcta ttgttagatt 1560
tcctaatatt acaaacttgt gcccttttgg tgaagttttt aacgccacca gatttgcatc 1620
tgtttatgct tggaacagga agagaatcag caactgtgtt gctgattatt ctgtcctata 1680
taattccgca tcattttcca cttttaagtg ttatggagtg tctcctacta aattaaatga 1740
tctctgcttt actaatgtct atgcagattc atttgtaatt agaggtgatg aagtcagaca 1800
aatcgctcca gggcaaactg gaaagattgc tgattataat tataaattac cagatgattt 1860
tacaggctgc gttatagctt ggaattctaa caatcttgat tctaaggttg gtggtaatta 1920
taattacctg tatagattgt ttaggaagtc taatctcaaa ccttttgaga gagatatttc 1980
aactgaaatc tatcaggccg gtagcacacc ttgtaatggt gttgaaggtt ttaattgtta 2040
ctttccttta caatcatatg gtttccaacc cactaatggt gttggttacc aaccatacag 2100
agtagtagta ctttcttttg aacttctaca tgcaccagca actgtttgtg gacctaaaaa 2160
gtctactaat ttggttaaaa acaaatgtgt caatttcaac ttcaatggtt taacaggcac 2220
aggtgttctt actgagtcta acaaaaagtt tctgcctttc caacaatttg gcagagacat 2280
tgctgacact actgatgctg tccgtgatcc acagacactt gagattcttg acattacacc 2340
atgttctttt ggtggtgtca gtgttataac accaggaaca aatacttcta accaggttgc 2400
tgttctttat caggatgtta actgcacaga agtccctgtt gctattcatg cagatcaact 2460
tactcctact tggcgtgttt attctacagg ttctaatgtt tttcaaacac gtgcaggctg 2520
tttaataggg gctgaacatg tcaacaactc atatgagtgt gacataccca ttggtgcagg 2580
tatatgcgct agttatcaga ctcagactaa ttctcctcgg cgggcacgta gtgtagctag 2640
tcaatccatc attgcctaca ctatgtcact tggtgcagaa aattcagttg cttactctaa 2700
taactctatt gccataccca caaattttac tattagtgtt accacagaaa ttctaccagt 2760
gtctatgacc aagacatcag tagattgtac aatgtacatt tgtggtgatt caactgaatg 2820
cagcaatctt ttgttgcaat atggcagttt ttgtacacaa ttaaaccgtg ctttaactgg 2880
aatagctgtt gaacaagaca aaaacaccca agaagttttt gcacaagtca aacaaattta 2940
caaaacacca ccaattaaag attttggtgg ttttaatttt tcacaaatat taccagatcc 3000
atcaaaacca agcaagaggt catttattga agatctactt ttcaacaaag tgacacttgc 3060
agatgctggc ttcatcaaac aatatggtga ttgccttggt gatattgctg ctagagacct 3120
catttgtgca caaaagttta acggccttac tgttttgcca cctttgctca cagatgaaat 3180
gattgctcaa tacacttctg cactgttagc gggtacaatc acttctggtt ggacctttgg 3240
tgcaggtgct gcattacaaa taccatttgc tatgcaaatg gcttataggt ttaatggtat 3300
tggagttaca cagaatgttc tctatgagaa ccaaaaattg attgccaacc aatttaatag 3360
tgctattggc aaaattcaag actcactttc ttccacagca agtgcacttg gaaaacttca 3420
agatgtggtc aaccaaaatg cacaagcttt aaacacgctt gttaaacaac ttagctccaa 3480
ttttggtgca atttcaagtg ttttaaatga tatcctttca cgtcttgaca aagttgaggc 3540
tgaagtgcaa attgataggt tgatcacagg cagacttcaa agtttgcaga catatgtgac 3600
tcaacaatta attagagctg cagaaatcag agcttctgct aatcttgctg ctactaaaat 3660
gtcagagtgt gtacttggac aatcaaaaag agttgatttt tgtggaaagg gctatcatct 3720
tatgtccttc cctcagtcag cacctcatgg tgtagtcttc ttgcatgtga cttatgtccc 3780
tgcacaagaa aagaacttca caactgctcc tgccatttgt catgatggaa aagcacactt 3840
tcctcgtgaa ggtgtctttg tttcaaatgg cacacactgg tttgtaacac aaaggaattt 3900
ttatgaacca caaatcatta ctacagacaa cacatttgtg tctggtaact gtgatgttgt 3960
aataggaatt gtcaacaaca cagtttatga tcctttgcaa cctgaattag actcattcaa 4020
ggaggagtta gataaatatt ttaagaatca tacatcacca gatgttgatt taggtgacat 4080
ctctggcatt aatgcttcag ttgtaaacat tcaaaaagaa attgaccgcc tcaatgaggt 4140
tgccaagaat ttaaatgaat ctctcatcga tctccaagaa cttggaaagt atgagcagta 4200
tataaaatgg ccatggtaca tttggctagg ttttatagct ggcttgattg ccatagtaat 4260
ggtgacaatt atgctttgct gtatgaccag ttgctgtagt tgtctcaagg gctgttgttc 4320
ttgtggatcc tgctgcaaat ttgatgaaga cgactctgag ccagtgctca aaggagtcaa 4380
attacattac acataaacga acttatggat ttgtttatga gaatcttcac aattggaact 4440
gtaactttga agcaaggtga aatcaaggat gctactcctt cagattttgt tcgcgctact 4500
gcaacgatac cgatacaagc ctcactccct ttcggatggc ttattgttgg cgttgcactt 4560
cttgctgttt ttcagagcgc ttccaaaatc ataaccctca aaaagagatg gcaactagca 4620
ctctccaagg gtgttcactt tgtttgcaac ttgctgttgt tgtttgtaac agtttactca 4680
caccttttgc tcgttgctgc tggccttgaa gccccttttc tctatcttta tgctttagtc 4740
tacttcttgc agagtataaa ctttgtaaga ataataatga ggctttggct ttgctggaaa 4800
tgccgttcca aaaacccatt actttatgat gccaactatt ttctttgctg gcatactaat 4860
tgttacgact attgtatacc ttacaatagt gtaacttctt caattgtcat tacttcaggt 4920
gatggcacaa caagtcctat ttctgaacat gactaccaga ttggtggt 4968
<210> 2
<211> 1273
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 2
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
1145 1150 1155
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn
1160 1165 1170
Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu
1175 1180 1185
Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu
1205 1210 1215
Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met
1220 1225 1230
Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro
1250 1255 1260
Val Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 3
<211> 3822
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 3
atgtttgttt ttcttgtttt attgccacta gtctctagtc agtgtgttaa tcttacaacc 60
agaactcaat taccccctgc atacactaat tctttcacac gtggtgttta ttaccctgac 120
aaagttttca gatcctcagt tttacattca actcaggact tgttcttacc tttcttttcc 180
aatgttactt ggttccatgc tatacatgtc tctgggacca atggtactaa gaggtttgat 240
aaccctgtcc taccatttaa tgatggtgtt tattttgctt ccactgagaa gtctaacata 300
ataagaggct ggatttttgg tactacttta gattcgaaga cccagtccct acttattgtt 360
aataacgcta ctaatgttgt tattaaagtc tgtgaatttc aattttgtaa tgatccattt 420
ttgggtgttt attaccacaa aaacaacaaa agttggatgg aaagtgagtt cagagtttat 480
tctagtgcga ataattgcac ttttgaatat gtctctcagc cttttcttat ggaccttgaa 540
ggaaaacagg gtaatttcaa aaatcttagg gaatttgtgt ttaagaatat tgatggttat 600
tttaaaatat attctaagca cacgcctatt aatttagtgc gtgatctccc tcagggtttt 660
tcggctttag aaccattggt agatttgcca ataggtatta acatcactag gtttcaaact 720
ttacttgctt tacatagaag ttatttgact cctggtgatt cttcttcagg ttggacagct 780
ggtgctgcag cttattatgt gggttatctt caacctagga cttttctatt aaaatataat 840
gaaaatggaa ccattacaga tgctgtagac tgtgcacttg accctctctc agaaacaaag 900
tgtacgttga aatccttcac tgtagaaaaa ggaatctatc aaacttctaa ctttagagtc 960
caaccaacag aatctattgt tagatttcct aatattacaa acttgtgccc ttttggtgaa 1020
gtttttaacg ccaccagatt tgcatctgtt tatgcttgga acaggaagag aatcagcaac 1080
tgtgttgctg attattctgt cctatataat tccgcatcat tttccacttt taagtgttat 1140
ggagtgtctc ctactaaatt aaatgatctc tgctttacta atgtctatgc agattcattt 1200
gtaattagag gtgatgaagt cagacaaatc gctccagggc aaactggaaa gattgctgat 1260
tataattata aattaccaga tgattttaca ggctgcgtta tagcttggaa ttctaacaat 1320
cttgattcta aggttggtgg taattataat tacctgtata gattgtttag gaagtctaat 1380
ctcaaacctt ttgagagaga tatttcaact gaaatctatc aggccggtag cacaccttgt 1440
aatggtgttg aaggttttaa ttgttacttt cctttacaat catatggttt ccaacccact 1500
aatggtgttg gttaccaacc atacagagta gtagtacttt cttttgaact tctacatgca 1560
ccagcaactg tttgtggacc taaaaagtct actaatttgg ttaaaaacaa atgtgtcaat 1620
ttcaacttca atggtttaac aggcacaggt gttcttactg agtctaacaa aaagtttctg 1680
cctttccaac aatttggcag agacattgct gacactactg atgctgtccg tgatccacag 1740
acacttgaga ttcttgacat tacaccatgt tcttttggtg gtgtcagtgt tataacacca 1800
ggaacaaata cttctaacca ggttgctgtt ctttatcagg atgttaactg cacagaagtc 1860
cctgttgcta ttcatgcaga tcaacttact cctacttggc gtgtttattc tacaggttct 1920
aatgtttttc aaacacgtgc aggctgttta ataggggctg aacatgtcaa caactcatat 1980
gagtgtgaca tacccattgg tgcaggtata tgcgctagtt atcagactca gactaattct 2040
cctcggcggg cacgtagtgt agctagtcaa tccatcattg cctacactat gtcacttggt 2100
gcagaaaatt cagttgctta ctctaataac tctattgcca tacccacaaa ttttactatt 2160
agtgttacca cagaaattct accagtgtct atgaccaaga catcagtaga ttgtacaatg 2220
tacatttgtg gtgattcaac tgaatgcagc aatcttttgt tgcaatatgg cagtttttgt 2280
acacaattaa accgtgcttt aactggaata gctgttgaac aagacaaaaa cacccaagaa 2340
gtttttgcac aagtcaaaca aatttacaaa acaccaccaa ttaaagattt tggtggtttt 2400
aatttttcac aaatattacc agatccatca aaaccaagca agaggtcatt tattgaagat 2460
ctacttttca acaaagtgac acttgcagat gctggcttca tcaaacaata tggtgattgc 2520
cttggtgata ttgctgctag agacctcatt tgtgcacaaa agtttaacgg ccttactgtt 2580
ttgccacctt tgctcacaga tgaaatgatt gctcaataca cttctgcact gttagcgggt 2640
acaatcactt ctggttggac ctttggtgca ggtgctgcat tacaaatacc atttgctatg 2700
caaatggctt ataggtttaa tggtattgga gttacacaga atgttctcta tgagaaccaa 2760
aaattgattg ccaaccaatt taatagtgct attggcaaaa ttcaagactc actttcttcc 2820
acagcaagtg cacttggaaa acttcaagat gtggtcaacc aaaatgcaca agctttaaac 2880
acgcttgtta aacaacttag ctccaatttt ggtgcaattt caagtgtttt aaatgatatc 2940
ctttcacgtc ttgacaaagt tgaggctgaa gtgcaaattg ataggttgat cacaggcaga 3000
cttcaaagtt tgcagacata tgtgactcaa caattaatta gagctgcaga aatcagagct 3060
tctgctaatc ttgctgctac taaaatgtca gagtgtgtac ttggacaatc aaaaagagtt 3120
gatttttgtg gaaagggcta tcatcttatg tccttccctc agtcagcacc tcatggtgta 3180
gtcttcttgc atgtgactta tgtccctgca caagaaaaga acttcacaac tgctcctgcc 3240
atttgtcatg atggaaaagc acactttcct cgtgaaggtg tctttgtttc aaatggcaca 3300
cactggtttg taacacaaag gaatttttat gaaccacaaa tcattactac agacaacaca 3360
tttgtgtctg gtaactgtga tgttgtaata ggaattgtca acaacacagt ttatgatcct 3420
ttgcaacctg aattagactc attcaaggag gagttagata aatattttaa gaatcataca 3480
tcaccagatg ttgatttagg tgacatctct ggcattaatg cttcagttgt aaacattcaa 3540
aaagaaattg accgcctcaa tgaggttgcc aagaatttaa atgaatctct catcgatctc 3600
caagaacttg gaaagtatga gcagtatata aaatggccat ggtacatttg gctaggtttt 3660
atagctggct tgattgccat agtaatggtg acaattatgc tttgctgtat gaccagttgc 3720
tgtagttgtc tcaagggctg ttgttcttgt ggatcctgct gcaaatttga tgaagacgac 3780
tctgagccag tgctcaaagg agtcaaatta cattacacat aa 3822
<210> 4
<211> 29902
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 4
attaaaggtt tataccttcc caggtaacaa accaaccaac tttcgatctc ttgtagatct 60
gttctctaaa cgaactttaa aatctgtgtg gctgtcactc ggctgcatgc ttagtgcact 120
cacgcagtat aattaataac taattactgt cgttgacagg acacgagtaa ctcgtctatc 180
ttctgcaggc tgcttacggt ttcgtccgtg ttgcagccga tcatcagcac atctaggttt 240
cgtccgggtg tgaccgaaag gtaagatgga gagccttgtc cctggtttca acgagaaaac 300
acacgtccaa ctcagtttgc ctgttttaca ggttcgcgac gtgctcgtac gtggctttgg 360
agactccgtg gaggaggtct tatcagaggc acgtcaacat cttaaagatg gcacttgtgg 420
cttagtagaa gttgaaaaag gcgttttgcc tcaacttgaa cagccctatg tgttcatcaa 480
acgttcggat gctcgaactg cacctcatgg tcatgttatg gttgagctgg tagcagaact 540
cgaaggcatt cagtacggtc gtagtggtga gacacttggt gtccttgtcc ctcatgtggg 600
cgaaatacca gtggcttacc gcaaggttct tcttcgtaag aacggtaata aaggagctgg 660
tggccatagt tacggcgccg atctaaagtc atttgactta ggcgacgagc ttggcactga 720
tccttatgaa gattttcaag aaaactggaa cactaaacat agcagtggtg ttacccgtga 780
actcatgcgt gagcttaacg gaggggcata cactcgctat gtcgataaca acttctgtgg 840
ccctgatggc taccctcttg agtgcattaa agaccttcta gcacgtgctg gtaaagcttc 900
atgcactttg tccgaacaac tggactttat tgacactaag aggggtgtat actgctgccg 960
tgaacatgag catgaaattg cttggtacac ggaacgttct gaaaagagct atgaattgca 1020
gacacctttt gaaattaaat tggcaaagaa atttgacacc ttcaatgggg aatgtccaaa 1080
ttttgtattt cccttaaatt ccataatcaa gactattcaa ccaagggttg aaaagaaaaa 1140
gcttgatggc tttatgggta gaattcgatc tgtctatcca gttgcgtcac caaatgaatg 1200
caaccaaatg tgcctttcaa ctctcatgaa gtgtgatcat tgtggtgaaa cttcatggca 1260
gacgggcgat tttgttaaag ccacttgcga attttgtggc actgagaatt tgactaaaga 1320
aggtgccact acttgtggtt acttacccca aaatgctgtt gttaaaattt attgtccagc 1380
atgtcacaat tcagaagtag gacctgagca tagtcttgcc gaataccata atgaatctgg 1440
cttgaaaacc attcttcgta agggtggtcg cactattgcc tttggaggct gtgtgttctc 1500
ttatgttggt tgccataaca agtgtgccta ttgggttcca cgtgctagcg ctaacatagg 1560
ttgtaaccat acaggtgttg ttggagaagg ttccgaaggt cttaatgaca accttcttga 1620
aatactccaa aaagagaaag tcaacatcaa tattgttggt gactttaaac ttaatgaaga 1680
gatcgccatt attttggcat ctttttctgc ttccacaagt gcttttgtgg aaactgtgaa 1740
aggtttggat tataaagcat tcaaacaaat tgttgaatcc tgtggtaatt ttaaagttac 1800
aaaaggaaaa gctaaaaaag gtgcctggaa tattggtgaa cagaaatcaa tactgagtcc 1860
tctttatgca tttgcatcag aggctgctcg tgttgtacga tcaattttct cccgcactct 1920
tgaaactgct caaaattctg tgcgtgtttt acagaaggcc gctataacaa tactagatgg 1980
aatttcacag tattcactga gactcattga tgctatgatg ttcacatctg atttggctac 2040
taacaatcta gttgtaatgg cctacattac aggtggtgtt gttcagttga cttcgcagtg 2100
gctaactaac atctttggca ctgtttatga aaaactcaaa cccgtccttg attggcttga 2160
agagaagttt aaggaaggtg tagagtttct tagagacggt tgggaaattg ttaaatttat 2220
ctcaacctgt gcttgtgaaa ttgtcggtgg acaaattgtc acctgtgcaa aggaaattaa 2280
ggagagtgtt cagacattct ttaagcttgt aaataaattt ttggctttgt gtgctgactc 2340
tatcattatt ggtggagcta aacttaaagc cttgaattta ggtgaaacat ttgtcacgca 2400
ctcaaaggga ttgtacagaa agtgtgttaa atccagagaa gaaactggcc tactcatgcc 2460
tctaaaagcc ccaaaagaaa ttatcttctt agagggagaa acacttccca cagaagtgtt 2520
aacagaggaa gttgtcttga aaactggtga tttacaacca ttagaacaac ctactagtga 2580
agctgttgaa gctccattgg ttggtacacc agtttgtatt aacgggctta tgttgctcga 2640
aatcaaagac acagaaaagt actgtgccct tgcacctaat atgatggtaa caaacaatac 2700
cttcacactc aaaggcggtg caccaacaaa ggttactttt ggtgatgaca ctgtgataga 2760
agtgcaaggt tacaagagtg tgaatatcac ttttgaactt gatgaaagga ttgataaagt 2820
acttaatgag aagtgctctg cctatacagt tgaactcggt acagaagtaa atgagttcgc 2880
ctgtgttgtg gcagatgctg tcataaaaac tttgcaacca gtatctgaat tacttacacc 2940
actgggcatt gatttagatg agtggagtat ggctacatac tacttatttg atgagtctgg 3000
tgagtttaaa ttggcttcac atatgtattg ttctttctac cctccagatg aggatgaaga 3060
agaaggtgat tgtgaagaag aagagtttga gccatcaact caatatgagt atggtactga 3120
agatgattac caaggtaaac ctttggaatt tggtgccact tctgctgctc ttcaacctga 3180
agaagagcaa gaagaagatt ggttagatga tgatagtcaa caaactgttg gtcaacaaga 3240
cggcagtgag gacaatcaga caactactat tcaaacaatt gttgaggttc aacctcaatt 3300
agagatggaa cttacaccag ttgttcagac tattgaagtg aatagtttta gtggttattt 3360
aaaacttact gacaatgtat acattaaaaa tgcagacatt gtggaagaag ctaaaaaggt 3420
aaaaccaaca gtggttgtta atgcagccaa tgtttacctt aaacatggag gaggtgttgc 3480
aggagcctta aataaggcta ctaacaatgc catgcaagtt gaatctgatg attacatagc 3540
tactaatgga ccacttaaag tgggtggtag ttgtgtttta agcggacaca atcttgctaa 3600
acactgtctt catgttgtcg gcccaaatgt taacaaaggt gaagacattc aacttcttaa 3660
gagtgcttat gaaaatttta atcagcacga agttctactt gcaccattat tatcagctgg 3720
tatttttggt gctgacccta tacattcttt aagagtttgt gtagatactg ttcgcacaaa 3780
tgtctactta gctgtctttg ataaaaatct ctatgacaaa cttgtttcaa gctttttgga 3840
aatgaagagt gaaaagcaag ttgaacaaaa gatcgctgag attcctaaag aggaagttaa 3900
gccatttata actgaaagta aaccttcagt tgaacagaga aaacaagatg ataagaaaat 3960
caaagcttgt gttgaagaag ttacaacaac tctggaagaa actaagttcc tcacagaaaa 4020
cttgttactt tatattgaca ttaatggcaa tcttcatcca gattctgcca ctcttgttag 4080
tgacattgac atcactttct taaagaaaga tgctccatat atagtgggtg atgttgttca 4140
agagggtgtt ttaactgctg tggttatacc tactaaaaag gctggtggca ctactgaaat 4200
gctagcgaaa gctttgagaa aagtgccaac agacaattat ataaccactt acccgggtca 4260
gggtttaaat ggttacactg tagaggaggc aaagacagtg cttaaaaagt gtaaaagtgc 4320
cttttacatt ctaccatcta ttatctctaa tgagaagcaa gaaattcttg gaactgtttc 4380
ttggaatttg cgagaaatgc ttgcacatgc agaagaaaca cgcaaattaa tgcctgtctg 4440
tgtggaaact aaagccatag tttcaactat acagcgtaaa tataagggta ttaaaataca 4500
agagggtgtg gttgattatg gtgctagatt ttacttttac accagtaaaa caactgtagc 4560
gtcacttatc aacacactta acgatctaaa tgaaactctt gttacaatgc cacttggcta 4620
tgtaacacat ggcttaaatt tggaagaagc tgctcggtat atgagatctc tcaaagtgcc 4680
agctacagtt tctgtttctt cacctgatgc tgttacagcg tataatggtt atcttacttc 4740
ttcttctaaa acacctgaag aacattttat tgaaaccatc tcacttgctg gttcctataa 4800
agattggtcc tattctggac aatctacaca actaggtata gaatttctta agagaggtga 4860
taaaagtgta tattacacta gtaatcctac cacattccac ctagatggtg aagttatcac 4920
ctttgacaat cttaagacac ttctttcttt gagagaagtg aggactatta aggtgtttac 4980
aacagtagac aacattaacc tccacacgca agttgtggac atgtcaatga catatggaca 5040
acagtttggt ccaacttatt tggatggagc tgatgttact aaaataaaac ctcataattc 5100
acatgaaggt aaaacatttt atgttttacc taatgatgac actctacgtg ttgaggcttt 5160
tgagtactac cacacaactg atcctagttt tctgggtagg tacatgtcag cattaaatca 5220
cactaaaaag tggaaatacc cacaagttaa tggtttaact tctattaaat gggcagataa 5280
caactgttat cttgccactg cattgttaac actccaacaa atagagttga agtttaatcc 5340
acctgctcta caagatgctt attacagagc aagggctggt gaagctgcta acttttgtgc 5400
acttatctta gcctactgta ataagacagt aggtgagtta ggtgatgtta gagaaacaat 5460
gagttacttg tttcaacatg ccaatttaga ttcttgcaaa agagtcttga acgtggtgtg 5520
taaaacttgt ggacaacagc agacaaccct taagggtgta gaagctgtta tgtacatggg 5580
cacactttct tatgaacaat ttaagaaagg tgttcagata ccttgtacgt gtggtaaaca 5640
agctacaaaa tatctagtac aacaggagtc accttttgtt atgatgtcag caccacctgc 5700
tcagtatgaa cttaagcatg gtacatttac ttgtgctagt gagtacactg gtaattacca 5760
gtgtggtcac tataaacata taacttctaa agaaactttg tattgcatag acggtgcttt 5820
acttacaaag tcctcagaat acaaaggtcc tattacggat gttttctaca aagaaaacag 5880
ttacacaaca accataaaac cagttactta taaattggat ggtgttgttt gtacagaaat 5940
tgaccctaag ttggacaatt attataagaa agacaattct tatttcacag agcaaccaat 6000
tgatcttgta ccaaaccaac catatccaaa cgcaagcttc gataatttta agtttgtatg 6060
tgataatatc aaatttgctg atgatttaaa ccagttaact ggttataaga aacctgcttc 6120
aagagagctt aaagttacat ttttccctga cttaaatggt gatgtggtgg ctattgatta 6180
taaacactac acaccctctt ttaagaaagg agctaaattg ttacataaac ctattgtttg 6240
gcatgttaac aatgcaacta ataaagccac gtataaacca aatacctggt gtatacgttg 6300
tctttggagc acaaaaccag ttgaaacatc aaattcgttt gatgtactga agtcagagga 6360
cgcgcaggga atggataatc ttgcctgcga agatctaaaa ccagtctctg aagaagtagt 6420
ggaaaatcct accatacaga aagacgttct tgagtgtaat gtgaaaacta ccgaagttgt 6480
aggagacatt atacttaaac cagcaaataa tagtttaaaa attacagaag aggttggcca 6540
cacagatcta atggctgctt atgtagacaa ttctagtctt actattaaga aacctaatga 6600
attatctaga gtattaggtt tgaaaaccct tgctactcat ggtttagctg ctgttaatag 6660
tgtcccttgg gatactatag ctaattatgc taagcctttt cttaacaaag ttgttagtac 6720
aactactaac atagttacac ggtgtttaaa ccgtgtttgt actaattata tgccttattt 6780
ctttacttta ttgctacaat tgtgtacttt tactagaagt acaaattcta gaattaaagc 6840
atctatgccg actactatag caaagaatac tgttaagagt gtcggtaaat tttgtctaga 6900
ggcttcattt aattatttga agtcacctaa tttttctaaa ctgataaata ttataatttg 6960
gtttttacta ttaagtgttt gcctaggttc tttaatctac tcaaccgctg ctttaggtgt 7020
tttaatgtct aatttaggca tgccttctta ctgtactggt tacagagaag gctatttgaa 7080
ctctactaat gtcactattg caacctactg tactggttct ataccttgta gtgtttgtct 7140
tagtggttta gattctttag acacctatcc ttctttagaa actatacaaa ttaccatttc 7200
atcttttaaa tgggatttaa ctgcttttgg cttagttgca gagtggtttt tggcatatat 7260
tcttttcact aggtttttct atgtacttgg attggctgca atcatgcaat tgtttttcag 7320
ctattttgca gtacatttta ttagtaattc ttggcttatg tggttaataa ttaatcttgt 7380
acaaatggcc ccgatttcag ctatggttag aatgtacatc ttctttgcat cattttatta 7440
tgtatggaaa agttatgtgc atgttgtaga cggttgtaat tcatcaactt gtatgatgtg 7500
ttacaaacgt aatagagcaa caagagtcga atgtacaact attgttaatg gtgttagaag 7560
gtccttttat gtctatgcta atggaggtaa aggcttttgc aaactacaca attggaattg 7620
tgttaattgt gatacattct gtgctggtag tacatttatt agtgatgaag ttgcgagaga 7680
cttgtcacta cagtttaaaa gaccaataaa tcctactgac cagtcttctt acatcgttga 7740
tagtgttaca gtgaagaatg gttccatcca tctttacttt gataaagctg gtcaaaagac 7800
ttatgaaaga cattctctct ctcattttgt taacttagac aacctgagag ctaataacac 7860
taaaggttca ttgcctatta atgttatagt ttttgatggt aaatcaaaat gtgaagaatc 7920
atctgcaaaa tcagcgtctg tttactacag tcagcttatg tgtcaaccta tactgttact 7980
agatcaggca ttagtgtctg atgttggtga tagtgcggaa gttgcagtta aaatgtttga 8040
tgcttacgtt aatacgtttt catcaacttt taacgtacca atggaaaaac tcaaaacact 8100
agttgcaact gcagaagctg aacttgcaaa gaatgtgtcc ttagacaatg tcttatctac 8160
ttttatttca gcagctcggc aagggtttgt tgattcagat gtagaaacta aagatgttgt 8220
tgaatgtctt aaattgtcac atcaatctga catagaagtt actggcgata gttgtaataa 8280
ctatatgctc acctataaca aagttgaaaa catgacaccc cgtgaccttg gtgcttgtat 8340
tgactgtagt gcgcgtcata ttaatgcgca ggtagcaaaa agtcacaaca ttgctttgat 8400
atggaacgtt aaagatttca tgtcattgtc tgaacaacta cgaaaacaaa tacgtagtgc 8460
tgctaaaaag aataacttac cttttaagtt gacatgtgca actactagac aagttgttaa 8520
tgttgtaaca acaaagatag cacttaaggg tggtaaaatt gttaataatt ggttgaagca 8580
gttaattaaa gttacacttg tgttcctttt tgttgctgct attttctatt taataacacc 8640
tgttcatgtc atgtctaaac atactgactt ttcaagtgaa atcataggat acaaggctat 8700
tgatggtggt gtcactcgtg acatagcatc tacagatact tgttttgcta acaaacatgc 8760
tgattttgac acatggttta gccagcgtgg tggtagttat actaatgaca aagcttgccc 8820
attgattgct gcagtcataa caagagaagt gggttttgtc gtgcctggtt tgcctggcac 8880
gatattacgc acaactaatg gtgacttttt gcatttctta cctagagttt ttagtgcagt 8940
tggtaacatc tgttacacac catcaaaact tatagagtac actgactttg caacatcagc 9000
ttgtgttttg gctgctgaat gtacaatttt taaagatgct tctggtaagc cagtaccata 9060
ttgttatgat accaatgtac tagaaggttc tgttgcttat gaaagtttac gccctgacac 9120
acgttatgtg ctcatggatg gctctattat tcaatttcct aacacctacc ttgaaggttc 9180
tgttagagtg gtaacaactt ttgattctga gtactgtagg cacggcactt gtgaaagatc 9240
agaagctggt gtttgtgtat ctactagtgg tagatgggta cttaacaatg attattacag 9300
atctttacca ggagttttct gtggtgtaga tgctgtaaat ttacttacta atatgtttac 9360
accactaatt caacctattg gtgctttgga catatcagca tctatagtag ctggtggtat 9420
tgtagctatc gtagtaacat gccttgccta ctattttatg aggtttagaa gagcttttgg 9480
tgaatacagt catgtagttg cctttaatac tttactattc cttatgtcat tcactgtact 9540
ctgtttaaca ccagtttact cattcttacc tggtgtttat tctgttattt acttgtactt 9600
gacattttat cttactaatg atgtttcttt tttagcacat attcagtgga tggttatgtt 9660
cacaccttta gtacctttct ggataacaat tgcttatatc atttgtattt ccacaaagca 9720
tttctattgg ttctttagta attacctaaa gagacgtgta gtctttaatg gtgtttcctt 9780
tagtactttt gaagaagctg cgctgtgcac ctttttgtta aataaagaaa tgtatctaaa 9840
gttgcgtagt gatgtgctat tacctcttac gcaatataat agatacttag ctctttataa 9900
taagtacaag tattttagtg gagcaatgga tacaactagc tacagagaag ctgcttgttg 9960
tcatctcgca aaggctctca atgacttcag taactcaggt tctgatgttc tttaccaacc 10020
accacaaacc tctatcacct cagctgtttt gcagagtggt tttagaaaaa tggcattccc 10080
atctggtaaa gttgagggtt gtatggtaca agtaacttgt ggtacaacta cacttaacgg 10140
tctttggctt gatgacgtag tttactgtcc aagacatgtg atctgcacct ctgaagacat 10200
gcttaaccct aattatgaag atttactcat tcgtaagtct aatcataatt tcttggtaca 10260
ggctggtaat gttcaactca gggttattgg acattctatg caaaattgtg tacttaagct 10320
taaggttgat acagccaatc ctaagacacc taagtataag tttgttcgca ttcaaccagg 10380
acagactttt tcagtgttag cttgttacaa tggttcacca tctggtgttt accaatgtgc 10440
tatgaggccc aatttcacta ttaagggttc attccttaat ggttcatgtg gtagtgttgg 10500
ttttaacata gattatgact gtgtctcttt ttgttacatg caccatatgg aattaccaac 10560
tggagttcat gctggcacag acttagaagg taacttttat ggaccttttg ttgacaggca 10620
aacagcacaa gcagctggta cggacacaac tattacagtt aatgttttag cttggttgta 10680
cgctgctgtt ataaatggag acaggtggtt tctcaatcga tttaccacaa ctcttaatga 10740
ctttaacctt gtggctatga agtacaatta tgaacctcta acacaagacc atgttgacat 10800
actaggacct ctttctgctc aaactggaat tgccgtttta gatatgtgtg cttcattaaa 10860
agaattactg caaaatggta tgaatggacg taccatattg ggtagtgctt tattagaaga 10920
tgaatttaca ccttttgatg ttgttagaca atgctcaggt gttactttcc aaagtgcagt 10980
gaaaagaaca atcaagggta cacaccactg gttgttactc acaattttga cttcactttt 11040
agttttagtc cagagtactc aatggtcttt gttctttttt ttgtatgaaa atgccttttt 11100
accttttgct atgggtatta ttgctatgtc tgcttttgca atgatgtttg tcaaacataa 11160
gcatgcattt ctctgtttgt ttttgttacc ttctcttgcc actgtagctt attttaatat 11220
ggtctatatg cctgctagtt gggtgatgcg tattatgaca tggttggata tggttgatac 11280
tagtttgtct ggttttaagc taaaagactg tgttatgtat gcatcagctg tagtgttact 11340
aatccttatg acagcaagaa ctgtgtatga tgatggtgct aggagagtgt ggacacttat 11400
gaatgtcttg acactcgttt ataaagttta ttatggtaat gctttagatc aagccatttc 11460
catgtgggct cttataatct ctgttacttc taactactca ggtgtagtta caactgtcat 11520
gtttttggcc agaggtattg tttttatgtg tgttgagtat tgccctattt tcttcataac 11580
tggtaataca cttcagtgta taatgctagt ttattgtttc ttaggctatt tttgtacttg 11640
ttactttggc ctcttttgtt tactcaaccg ctactttaga ctgactcttg gtgtttatga 11700
ttacttagtt tctacacagg agtttagata tatgaattca cagggactac tcccacccaa 11760
gaatagcata gatgccttca aactcaacat taaattgttg ggtgttggtg gcaaaccttg 11820
tatcaaagta gccactgtac agtctaaaat gtcagatgta aagtgcacat cagtagtctt 11880
actctcagtt ttgcaacaac tcagagtaga atcatcatct aaattgtggg ctcaatgtgt 11940
ccagttacac aatgacattc tcttagctaa agatactact gaagcctttg aaaaaatggt 12000
ttcactactt tctgttttgc tttccatgca gggtgctgta gacataaaca agctttgtga 12060
agaaatgctg gacaacaggg caaccttaca agctatagcc tcagagttta gttcccttcc 12120
atcatatgca gcttttgcta ctgctcaaga agcttatgag caggctgttg ctaatggtga 12180
ttctgaagtt gttcttaaaa agttgaagaa gtctttgaat gtggctaaat ctgaatttga 12240
ccgtgatgca gccatgcaac gtaagttgga aaagatggct gatcaagcta tgacccaaat 12300
gtataaacag gctagatctg aggacaagag ggcaaaagtt actagtgcta tgcagacaat 12360
gcttttcact atgcttagaa agttggataa tgatgcactc aacaacatta tcaacaatgc 12420
aagagatggt tgtgttccct tgaacataat acctcttaca acagcagcca aactaatggt 12480
tgtcatacca gactataaca catataaaaa tacgtgtgat ggtacaacat ttacttatgc 12540
atcagcattg tgggaaatcc aacaggttgt agatgcagat agtaaaattg ttcaacttag 12600
tgaaattagt atggacaatt cacctaattt agcatggcct cttattgtaa cagctttaag 12660
ggccaattct gctgtcaaat tacagaataa tgagcttagt cctgttgcac tacgacagat 12720
gtcttgtgct gccggtacta cacaaactgc ttgcactgat gacaatgcgt tagcttacta 12780
caacacaaca aagggaggta ggtttgtact tgcactgtta tccgatttac aggatttgaa 12840
atgggctaga ttccctaaga gtgatggaac tggtactatc tatacagaac tggaaccacc 12900
ttgtaggttt gttacagaca cacctaaagg tcctaaagtg aagtatttat actttattaa 12960
aggattaaac aacctaaata gaggtatggt acttggtagt ttagctgcca cagtacgtct 13020
acaagctggt aatgcaacag aagtgcctgc caattcaact gtattatctt tctgtgcttt 13080
tgctgtagat gctgctaaag cttacaaaga ttatctagct agtgggggac aaccaatcac 13140
taattgtgtt aagatgttgt gtacacacac tggtactggt caggcaataa cagttacacc 13200
ggaagccaat atggatcaag aatcctttgg tggtgcatcg tgttgtctgt actgccgttg 13260
ccacatagat catccaaatc ctaaaggatt ttgtgactta aaaggtaagt atgtacaaat 13320
acctacaact tgtgctaatg accctgtggg ttttacactt aaaaacacag tctgtaccgt 13380
ctgcggtatg tggaaaggtt atggctgtag ttgtgatcaa ctccgcgaac ccatgcttca 13440
gtcagctgat gcacaatcgt ttttaaacgg gtttgcggtg taagtgcagc ccgtcttaca 13500
ccgtgcggca caggcactag tactgatgtc gtatacaggg cttttgacat ctacaatgat 13560
aaagtagctg gttttgctaa attcctaaaa actaattgtt gtcgcttcca agaaaaggac 13620
gaagatgaca atttaattga ttcttacttt gtagttaaga gacacacttt ctctaactac 13680
caacatgaag aaacaattta taatttactt aaggattgtc cagctgttgc taaacatgac 13740
ttctttaagt ttagaataga cggtgacatg gtaccacata tatcacgtca acgtcttact 13800
aaatacacaa tggcagacct cgtctatgct ttaaggcatt ttgatgaagg taattgtgac 13860
acattaaaag aaatacttgt cacatacaat tgttgtgatg atgattattt caataaaaag 13920
gactggtatg attttgtaga aaacccagat atattacgcg tatacgccaa cttaggtgaa 13980
cgtgtacgcc aagctttgtt aaaaacagta caattctgtg atgccatgcg aaatgctggt 14040
attgttggtg tactgacatt agataatcaa gatctcaatg gtaactggta tgatttcggt 14100
gatttcatac aaaccacgcc aggtagtgga gttcctgttg tagattctta ttattcattg 14160
ttaatgccta tattaacctt gaccagggct ttaactgcag agtcacatgt tgacactgac 14220
ttaacaaagc cttacattaa gtgggatttg ttaaaatatg acttcacgga agagaggtta 14280
aaactctttg accgttattt taaatattgg gatcagacat accacccaaa ttgtgttaac 14340
tgtttggatg acagatgcat tctgcattgt gcaaacttta atgttttatt ctctacagtg 14400
ttcccaccta caagttttgg accactagtg agaaaaatat ttgttgatgg tgttccattt 14460
gtagtttcaa ctggatacca cttcagagag ctaggtgttg tacataatca ggatgtaaac 14520
ttacatagct ctagacttag ttttaaggaa ttacttgtgt atgctgctga ccctgctatg 14580
cacgctgctt ctggtaatct attactagat aaacgcacta cgtgcttttc agtagctgca 14640
cttactaaca atgttgcttt tcaaactgtc aaacccggta attttaacaa agacttctat 14700
gactttgctg tgtctaaggg tttctttaag gaaggaagtt ctgttgaatt aaaacacttc 14760
ttctttgctc aggatggtaa tgctgctatc agcgattatg actactatcg ttataatcta 14820
ccaacaatgt gtgatatcag acaactacta tttgtagttg aagttgttga taagtacttt 14880
gattgttacg atggtggctg tattaatgct aaccaagtca tcgtcaacaa cctagacaaa 14940
tcagctggtt ttccatttaa taaatggggt aaggctagac tttattatga ttcaatgagt 15000
tatgaggatc aagatgcact tttcgcatat acaaaacgta atgtcatccc tactataact 15060
caaatgaatc ttaagtatgc cattagtgca aagaatagag ctcgcaccgt agctggtgtc 15120
tctatctgta gtactatgac caatagacag tttcatcaaa aattattgaa atcaatagcc 15180
gccactagag gagctactgt agtaattgga acaagcaaat tctatggtgg ttggcacaac 15240
atgttaaaaa ctgtttatag tgatgtagaa aaccctcacc ttatgggttg ggattatcct 15300
aaatgtgata gagccatgcc taacatgctt agaattatgg cctcacttgt tcttgctcgc 15360
aaacatacaa cgtgttgtag cttgtcacac cgtttctata gattagctaa tgagtgtgct 15420
caagtattga gtgaaatggt catgtgtggc ggttcactat atgttaaacc aggtggaacc 15480
tcatcaggag atgccacaac tgcttatgct aatagtgttt ttaacatttg tcaagctgtc 15540
acggccaatg ttaatgcact tttatctact gatggtaaca aaattgccga taagtatgtc 15600
cgcaatttac aacacagact ttatgagtgt ctctatagaa atagagatgt tgacacagac 15660
tttgtgaatg agttttacgc atatttgcgt aaacatttct caatgatgat actctctgac 15720
gatgctgttg tgtgtttcaa tagcacttat gcatctcaag gtctagtggc tagcataaag 15780
aactttaagt cagttcttta ttatcaaaac aatgttttta tgtctgaagc aaaatgttgg 15840
actgagactg accttactaa aggacctcat gaattttgct ctcaacatac aatgctagtt 15900
aaacagggtg atgattatgt gtaccttcct tacccagatc catcaagaat cctaggggcc 15960
ggctgttttg tagatgatat cgtaaaaaca gatggtacac ttatgattga acggttcgtg 16020
tctttagcta tagatgctta cccacttact aaacatccta atcaggagta tgctgatgtc 16080
tttcatttgt acttacaata cataagaaag ctacatgatg agttaacagg acacatgtta 16140
gacatgtatt ctgttatgct tactaatgat aacacttcaa ggtattggga acctgagttt 16200
tatgaggcta tgtacacacc gcatacagtc ttacaggctg ttggggcttg tgttctttgc 16260
aattcacaga cttcattaag atgtggtgct tgcatacgta gaccattctt atgttgtaaa 16320
tgctgttacg accatgtcat atcaacatca cataaattag tcttgtctgt taatccgtat 16380
gtttgcaatg ctccaggttg tgatgtcaca gatgtgactc aactttactt aggaggtatg 16440
agctattatt gtaaatcaca taaaccaccc attagttttc cattgtgtgc taatggacaa 16500
gtttttggtt tatataaaaa tacatgtgtt ggtagcgata atgttactga ctttaatgca 16560
attgcaacat gtgactggac aaatgctggt gattacattt tagctaacac ctgtactgaa 16620
agactcaagc tttttgcagc agaaacgctc aaagctactg aggagacatt taaactgtct 16680
tatggtattg ctactgtacg tgaagtgctg tctgacagag aattacatct ttcatgggaa 16740
gttggtaaac ctagaccacc acttaaccga aattatgtct ttactggtta tcgtgtaact 16800
aaaaacagta aagtacaaat aggagagtac acctttgaaa aaggtgacta tggtgatgct 16860
gttgtttacc gaggtacaac aacttacaaa ttaaatgttg gtgattattt tgtgctgaca 16920
tcacatacag taatgccatt aagtgcacct acactagtgc cacaagagca ctatgttaga 16980
attactggct tatacccaac actcaatatc tcagatgagt tttctagcaa tgttgcaaat 17040
tatcaaaagg ttggtatgca aaagtattct acactccagg gaccacctgg tactggtaag 17100
agtcattttg ctattggcct agctctctac tacccttctg ctcgcatagt gtatacagct 17160
tgctctcatg ccgctgttga tgcactatgt gagaaggcat taaaatattt gcctatagat 17220
aaatgtagta gaattatacc tgcacgtgct cgtgtagagt gttttgataa attcaaagtg 17280
aattcaacat tagaacagta tgtcttttgt actgtaaatg cattgcctga gacgacagca 17340
gatatagttg tctttgatga aatttcaatg gccacaaatt atgatttgag tgttgtcaat 17400
gccagattac gtgctaagca ctatgtgtac attggcgacc ctgctcaatt acctgcacca 17460
cgcacattgc taactaaggg cacactagaa ccagaatatt tcaattcagt gtgtagactt 17520
atgaaaacta taggtccaga catgttcctc ggaacttgtc ggcgttgtcc tgctgaaatt 17580
gttgacactg tgagtgcttt ggtttatgat aataagctta aagcacataa agacaaatca 17640
gctcaatgct ttaaaatgtt ttataagggt gttatcacgc atgatgtttc atctgcaatt 17700
aacaggccac aaataggcgt ggtaagagaa ttccttacac gtaaccctgc ttggagaaaa 17760
gctgtcttta tttcacctta taattcacag aatgctgtag cctcaaagat tttgggacta 17820
ccaactcaaa ctgttgattc atcacagggc tcagaatatg actatgtcat attcactcaa 17880
accactgaaa cagctcactc ttgtaatgta aacagattta atgttgctat taccagagca 17940
aaagtaggca tactttgcat aatgtctgat agagaccttt atgacaagtt gcaatttaca 18000
agtcttgaaa ttccacgtag gaatgtggca actttacaag ctgaaaatgt aacaggactc 18060
tttaaagatt gtagtaaggt aatcactggg ttacatccta cacaggcacc tacacacctc 18120
agtgttgaca ctaaattcaa aactgaaggt ttatgtgttg acatacctgg catacctaag 18180
gacatgacct atagaagact catctctatg atgggtttta aaatgaatta tcaagttaat 18240
ggttacccta acatgtttat cacccgcgaa gaagctataa gacatgtacg tgcatggatt 18300
ggcttcgatg tcgaggggtg tcatgctact agagaagctg ttggtaccaa tttaccttta 18360
cagctaggtt tttctacagg tgttaaccta gttgctgtac ctacaggtta tgttgataca 18420
cctaataata cagatttttc cagagttagt gctaaaccac cgcctggaga tcaatttaaa 18480
cacctcatac cacttatgta caaaggactt ccttggaatg tagtgcgtat aaagattgta 18540
caaatgttaa gtgacacact taaaaatctc tctgacagag tcgtatttgt cttatgggca 18600
catggctttg agttgacatc tatgaagtat tttgtgaaaa taggacctga gcgcacctgt 18660
tgtctatgtg atagacgtgc cacatgcttt tccactgctt cagacactta tgcctgttgg 18720
catcattcta ttggatttga ttacgtctat aatccgttta tgattgatgt tcaacaatgg 18780
ggttttacag gtaacctaca aagcaaccat gatctgtatt gtcaagtcca tggtaatgca 18840
catgtagcta gttgtgatgc aatcatgact aggtgtctag ctgtccacga gtgctttgtt 18900
aagcgtgttg actggactat tgaatatcct ataattggtg atgaactgaa gattaatgcg 18960
gcttgtagaa aggttcaaca catggttgtt aaagctgcat tattagcaga caaattccca 19020
gttcttcacg acattggtaa ccctaaagct attaagtgtg tacctcaagc tgatgtagaa 19080
tggaagttct atgatgcaca gccttgtagt gacaaagctt ataaaataga agaattattc 19140
tattcttatg ccacacattc tgacaaattc acagatggtg tatgcctatt ttggaattgc 19200
aatgtcgata gatatcctgc taattccatt gtttgtagat ttgacactag agtgctatct 19260
aaccttaact tgcctggttg tgatggtggc agtttgtatg taaataaaca tgcattccac 19320
acaccagctt ttgataaaag tgcttttgtt aatttaaaac aattaccatt tttctattac 19380
tctgacagtc catgtgagtc tcatggaaaa caagtagtgt cagatataga ttatgtacca 19440
ctaaagtctg ctacgtgtat aacacgttgc aatttaggtg gtgctgtctg tagacatcat 19500
gctaatgagt acagattgta tctcgatgct tataacatga tgatctcagc tggctttagc 19560
ttgtgggttt acaaacaatt tgatacttat aacctctgga acacttttac aagacttcag 19620
agtttagaaa atgtggcttt taatgttgta aataagggac actttgatgg acaacagggt 19680
gaagtaccag tttctatcat taataacact gtttacacaa aagttgatgg tgttgatgta 19740
gaattgtttg aaaataaaac aacattacct gttaatgtag catttgagct ttgggctaag 19800
cgcaacatta aaccagtacc agaggtgaaa atactcaata atttgggtgt ggacattgct 19860
gctaatactg tgatctggga ctacaaaaga gatgctccag cacatatatc tactattggt 19920
gtttgttcta tgactgacat agccaagaaa ccaactgaaa cgatttgtgc accactcact 19980
gtcttttttg atggtagagt tgatggtcaa gtagacttat ttagaaatgc ccgtaatggt 20040
gttcttatta cagaaggtag tgttaaaggt ttacaaccat ctgtaggtcc caaacaagct 20100
agtcttaatg gagtcacatt aattggagaa gccgtaaaaa cacagttcaa ttattataag 20160
aaagttgatg gtgttgtcca acaattacct gaaacttact ttactcagag tagaaattta 20220
caagaattta aacccaggag tcaaatggaa attgatttct tagaattagc tatggatgaa 20280
ttcattgaac ggtataaatt agaaggctat gccttcgaac atatcgttta tggagatttt 20340
agtcatagtc agttaggtgg tttacatcta ctgattggac tagctaaacg ttttaaggaa 20400
tcaccttttg aattagaaga ttttattcct atggacagta cagttaaaaa ctatttcata 20460
acagatgcgc aaacaggttc atctaagtgt gtgtgttctg ttattgattt attacttgat 20520
gattttgttg aaataataaa atcccaagat ttatctgtag tttctaaggt tgtcaaagtg 20580
actattgact atacagaaat ttcatttatg ctttggtgta aagatggcca tgtagaaaca 20640
ttttacccaa aattacaatc tagtcaagcg tggcaaccgg gtgttgctat gcctaatctt 20700
tacaaaatgc aaagaatgct attagaaaag tgtgaccttc aaaattatgg tgatagtgca 20760
acattaccta aaggcataat gatgaatgtc gcaaaatata ctcaactgtg tcaatattta 20820
aacacattaa cattagctgt accctataat atgagagtta tacattttgg tgctggttct 20880
gataaaggag ttgcaccagg tacagctgtt ttaagacagt ggttgcctac gggtacgctg 20940
cttgtcgatt cagatcttaa tgactttgtc tctgatgcag attcaacttt gattggtgat 21000
tgtgcaactg tacatacagc taataaatgg gatctcatta ttagtgatat gtacgaccct 21060
aagactaaaa atgttacaaa agaaaatgac tctaaagagg gttttttcac ttacatttgt 21120
gggtttatac aacaaaagct agctcttgga ggttccgtgg ctataaagat aacagaacat 21180
tcttggaatg ctgatcttta taagctcatg ggacacttcg catggtggac agcctttgtt 21240
actaatgtga atgcgtcatc atctgaagca tttttaattg gatgtaatta tcttggcaaa 21300
ccacgcgaac aaatagatgg ttatgtcatg catgcaaatt acatattttg gaggaataca 21360
aatccaattc agttgtcttc ctattcttta tttgacatga gtaaatttcc ccttaaatta 21420
aggggtactg ctgttatgtc tttaaaagaa ggtcaaatca atgatatgat tttatctctt 21480
cttagtaaag gtagacttat aattagagaa aacaacagag ttgttatttc tagtgatgtt 21540
cttgttaaca actaaacgaa caatgtttgt ttttcttgtt ttattgccac tagtctctag 21600
tcagtgtgtt aatcttacaa ccagaactca attaccccct gcatacacta attctttcac 21660
acgtggtgtt tattaccctg acaaagtttt cagatcctca gttttacatt caactcagga 21720
cttgttctta cctttctttt ccaatgttac ttggttccat gctatacatg tctctgggac 21780
caatggtact aagaggtttg ataaccctgt cctaccattt aatgatggtg tttattttgc 21840
ttccactgag aagtctaaca taataagagg ctggattttt ggtactactt tagattcgaa 21900
gacccagtcc ctacttattg ttaataacgc tactaatgtt gttattaaag tctgtgaatt 21960
tcaattttgt aatgatccat ttttgggtgt ttattaccac aaaaacaaca aaagttggat 22020
ggaaagtgag ttcagagttt attctagtgc gaataattgc acttttgaat atgtctctca 22080
gccttttctt atggaccttg aaggaaaaca gggtaatttc aaaaatctta gggaatttgt 22140
gtttaagaat attgatggtt attttaaaat atattctaag cacacgccta ttaatttagt 22200
gcgtgatctc cctcagggtt tttcggcttt agaaccattg gtagatttgc caataggtat 22260
taacatcact aggtttcaaa ctttacttgc tttacataga agttatttga ctcctggtga 22320
ttcttcttca ggttggacag ctggtgctgc agcttattat gtgggttatc ttcaacctag 22380
gacttttcta ttaaaatata atgaaaatgg aaccattaca gatgctgtag actgtgcact 22440
tgaccctctc tcagaaacaa agtgtacgtt gaaatccttc actgtagaaa aaggaatcta 22500
tcaaacttct aactttagag tccaaccaac agaatctatt gttagatttc ctaatattac 22560
aaacttgtgc ccttttggtg aagtttttaa cgccaccaga tttgcatctg tttatgcttg 22620
gaacaggaag agaatcagca actgtgttgc tgattattct gtcctatata attccgcatc 22680
attttccact tttaagtgtt atggagtgtc tcctactaaa ttaaatgatc tctgctttac 22740
taatgtctat gcagattcat ttgtaattag aggtgatgaa gtcagacaaa tcgctccagg 22800
gcaaactgga aagattgctg attataatta taaattacca gatgatttta caggctgcgt 22860
tatagcttgg aattctaaca atcttgattc taaggttggt ggtaattata attacctgta 22920
tagattgttt aggaagtcta atctcaaacc ttttgagaga gatatttcaa ctgaaatcta 22980
tcaggccggt agcacacctt gtaatggtgt tgaaggtttt aattgttact ttcctttaca 23040
atcatatggt ttccaaccca ctaatggtgt tggttaccaa ccatacagag tagtagtact 23100
ttcttttgaa cttctacatg caccagcaac tgtttgtgga cctaaaaagt ctactaattt 23160
ggttaaaaac aaatgtgtca atttcaactt caatggttta acaggcacag gtgttcttac 23220
tgagtctaac aaaaagtttc tgcctttcca acaatttggc agagacattg ctgacactac 23280
tgatgctgtc cgtgatccac agacacttga gattcttgac attacaccat gttcttttgg 23340
tggtgtcagt gttataacac caggaacaaa tacttctaac caggttgctg ttctttatca 23400
ggatgttaac tgcacagaag tccctgttgc tattcatgca gatcaactta ctcctacttg 23460
gcgtgtttat tctacaggtt ctaatgtttt tcaaacacgt gcaggctgtt taataggggc 23520
tgaacatgtc aacaactcat atgagtgtga catacccatt ggtgcaggta tatgcgctag 23580
ttatcagact cagactaatt ctcctcggcg ggcacgtagt gtagctagtc aatccatcat 23640
tgcctacact atgtcacttg gtgcagaaaa ttcagttgct tactctaata actctattgc 23700
catacccaca aattttacta ttagtgttac cacagaaatt ctaccagtgt ctatgaccaa 23760
gacatcagta gattgtacaa tgtacatttg tggtgattca actgaatgca gcaatctttt 23820
gttgcaatat ggcagttttt gtacacaatt aaaccgtgct ttaactggaa tagctgttga 23880
acaagacaaa aacacccaag aagtttttgc acaagtcaaa caaatttaca aaacaccacc 23940
aattaaagat tttggtggtt ttaatttttc acaaatatta ccagatccat caaaaccaag 24000
caagaggtca tttattgaag atctactttt caacaaagtg acacttgcag atgctggctt 24060
catcaaacaa tatggtgatt gccttggtga tattgctgct agagacctca tttgtgcaca 24120
aaagtttaac ggccttactg ttttgccacc tttgctcaca gatgaaatga ttgctcaata 24180
cacttctgca ctgttagcgg gtacaatcac ttctggttgg acctttggtg caggtgctgc 24240
attacaaata ccatttgcta tgcaaatggc ttataggttt aatggtattg gagttacaca 24300
gaatgttctc tatgagaacc aaaaattgat tgccaaccaa tttaatagtg ctattggcaa 24360
aattcaagac tcactttctt ccacagcaag tgcacttgga aaacttcaag atgtggtcaa 24420
ccaaaatgca caagctttaa acacgcttgt taaacaactt agctccaatt ttggtgcaat 24480
ttcaagtgtt ttaaatgata tcctttcacg tcttgacaaa gttgaggctg aagtgcaaat 24540
tgataggttg atcacaggca gacttcaaag tttgcagaca tatgtgactc aacaattaat 24600
tagagctgca gaaatcagag cttctgctaa tcttgctgct actaaaatgt cagagtgtgt 24660
acttggacaa tcaaaaagag ttgatttttg tggaaagggc tatcatctta tgtccttccc 24720
tcagtcagca cctcatggtg tagtcttctt gcatgtgact tatgtccctg cacaagaaaa 24780
gaacttcaca actgctcctg ccatttgtca tgatggaaaa gcacactttc ctcgtgaagg 24840
tgtctttgtt tcaaatggca cacactggtt tgtaacacaa aggaattttt atgaaccaca 24900
aatcattact acagacaaca catttgtgtc tggtaactgt gatgttgtaa taggaattgt 24960
caacaacaca gtttatgatc ctttgcaacc tgaattagac tcattcaagg aggagttaga 25020
taaatatttt aagaatcata catcaccaga tgttgattta ggtgacatct ctggcattaa 25080
tgcttcagtt gtaaacattc aaaaagaaat tgaccgcctc aatgaggttg ccaagaattt 25140
aaatgaatct ctcatcgatc tccaagaact tggaaagtat gagcagtata taaaatggcc 25200
atggtacatt tggctaggtt ttatagctgg cttgattgcc atagtaatgg tgacaattat 25260
gctttgctgt atgaccagtt gctgtagttg tctcaagggc tgttgttctt gtggatcctg 25320
ctgcaaattt gatgaagacg actctgagcc agtgctcaaa ggagtcaaat tacattacac 25380
ataaacgaac ttatggattt gtttatgaga atcttcacaa ttggaactgt aactttgaag 25440
caaggtgaaa tcaaggatgc tactccttca gattttgttc gcgctactgc aacgataccg 25500
atacaagcct cactcccttt cggatggctt attgttggcg ttgcacttct tgctgttttt 25560
cagagcgctt ccaaaatcat aaccctcaaa aagagatggc aactagcact ctccaagggt 25620
gttcactttg tttgcaactt gctgttgttg tttgtaacag tttactcaca ccttttgctc 25680
gttgctgctg gccttgaagc cccttttctc tatctttatg ctttagtcta cttcttgcag 25740
agtataaact ttgtaagaat aataatgagg ctttggcttt gctggaaatg ccgttccaaa 25800
aacccattac tttatgatgc caactatttt ctttgctggc atactaattg ttacgactat 25860
tgtatacctt acaatagtgt aacttcttca attgtcatta cttcaggtga tggcacaaca 25920
agtcctattt ctgaacatga ctaccagatt ggtggttata ctgaaaaatg ggaatctgga 25980
gtaaaagact gtgttgtatt acacagttac ttcacttcag actattacca gctgtactca 26040
actcaattga gtacagacac tggtgttgaa catgttacct tcttcatcta caataaaatt 26100
ttgatgagcc tgaagaacat gtccaaattc acacaatcga cggttcatcc ggagttgtta 26160
atccagtaat ggaaccaatt tatgatgaac cgacgacgac tactagcgtg cctttgtaag 26220
cacaagctga tgagtacgaa cttatgtact cattcgtttc ggaagagaca ggtacgttaa 26280
tagttaatag cgtacttctt tttcttgctt tcgtggtatt cttgctagtt acactagcca 26340
tccttactgc gcttcgattg tgtgcgtact gctgcaatat tgttaacgtg agtcttgtaa 26400
aaccttcttt ttacgtttac tctcgtgtta aaaatctgaa ttcttctaga gttcctgatc 26460
ttctggtcta aacgaactaa atattatatt agtttttctg tttggaactt taattttagc 26520
catggcagat tccaacggta ctattaccgt tgaagagctt aaaaagctcc ttgaacaatg 26580
gaacctagta ataggtttcc tattccttac atggatttgt cttctacaat ttgcctatgc 26640
caacaggaat aggtttttgt atataattaa gttaattttc ctctggctgt tatggccagt 26700
aactttagct tgttttgtgc ttgctgctgt ttacagaata aattggatca ccggtggaat 26760
tgctatcgca atggcttgtc ttgtaggctt gatgtggctc agctacttca ttgcttcttt 26820
cagactgttt gcgcgtacgc gttccatgtg gtcattcaat ccagaaacta acattcttct 26880
caacgtgcca ctccatggca ctattctgac cagaccgctt ctagaaagtg aactcgtaat 26940
cggagctgtg atccttcgtg gacatcttcg tattgctgga caccatctag gacgctgtga 27000
catcaaggac ctgcctaaag aaatcactgt tgctacatca cgaacgcttt cttattacaa 27060
attgggagct tcgcagcgtg tagcaggtga ctcaggtttt gctgcataca gtcgctacag 27120
gattggcaac tataaattaa acacagacca ttccagtagc agtgacaata ttgctttgct 27180
tgtacagtaa gtgacaacag atgtttcatc tcgttgactt tcaggttact atagcagaga 27240
tattactaat tattatgagg acttttaaag tttccatttg gaatcttgat tacatcataa 27300
acctcataat taaaaattta tctaagtcac taactgagaa taaatattct caattagatg 27360
aagagcaacc aatggagatt gattaaacga acatgaaaat tattcttttc ttggcactga 27420
taacactcgc tacttgtgag ctttatcact accaagagtg tgttagaggt acaacagtac 27480
ttttaaaaga accttgctct tctggaacat acgagggcaa ttcaccattt catcctctag 27540
ctgataacaa atttgcactg acttgcttta gcactcaatt tgcttttgct tgtcctgacg 27600
gcgtaaaaca cgtctatcag ttacgtgcca gatcagtttc acctaaactg ttcatcagac 27660
aagaggaagt tcaagaactt tactctccaa tttttcttat tgttgcggca atagtgttta 27720
taacactttg cttcacactc aaaagaaaga cagaatgatt gaactttcat taattgactt 27780
ctatttgtgc tttttagcct ttctgctatt ccttgtttta attatgctta ttatcttttg 27840
gttctcactt gaactgcaag atcataatga aacttgtcac gcctaaacga acatgaaatt 27900
tcttgttttc ttaggaatca tcacaactgt agctgcattt caccaagaat gtagtttaca 27960
gtcatgtact caacatcaac catatgtagt tgatgacccg tgtcctattc acttctattc 28020
taaatggtat attagagtag gagctagaaa atcagcacct ttaattgaat tgtgcgtgga 28080
tgaggctggt tctaaatcac ccattcagta catcgatatc ggtaattata cagtttcctg 28140
tttacctttt acaattaatt gccaggaacc taaattgggt agtcttgtag tgcgttgttc 28200
gttctatgaa gactttttag agtatcatga cgttcgtgtt gttttagatt tcatctaaac 28260
gaacaaacta aaatgtctga taatggaccc caaaatcagc gaaatgcacc ccgcattacg 28320
tttggtggac cctcagattc aactggcagt aaccagaatg gagaacgcag tggggcgcga 28380
tcaaaacaac gtcggcccca aggtttaccc aataatactg cgtcttggtt caccgctctc 28440
actcaacatg gcaaggaaga ccttaaattc cctcgaggac aaggcgttcc aattaacacc 28500
aatagcagtc cagatgacca aattggctac taccgaagag ctaccagacg aattcgtggt 28560
ggtgacggta aaatgaaaga tctcagtcca agatggtatt tctactacct aggaactggg 28620
ccagaagctg gacttcccta tggtgctaac aaagacggca tcatatgggt tgcaactgag 28680
ggagccttga atacaccaaa agatcacatt ggcacccgca atcctgctaa caatgctgca 28740
atcgtgctac aacttcctca aggaacaaca ttgccaaaag gcttctacgc agaagggagc 28800
agaggcggca gtcaagcctc ttctcgttcc tcatcacgta gtcgcaacag ttcaagaaat 28860
tcaactccag gcagcagtag gggaacttct cctgctagaa tggctggcaa tggcggtgat 28920
gctgctcttg ctttgctgct gcttgacaga ttgaaccagc ttgagagcaa aatgtctggt 28980
aaaggccaac aacaacaagg ccaaactgtc actaagaaat ctgctgctga ggcttctaag 29040
aagcctcggc aaaaacgtac tgccactaaa gcatacaatg taacacaagc tttcggcaga 29100
cgtggtccag aacaaaccca aggaaatttt ggggaccagg aactaatcag acaaggaact 29160
gattacaaac attggccgca aattgcacaa tttgccccca gcgcttcagc gttcttcgga 29220
atgtcgcgca ttggcatgga agtcacacct tcgggaacgt ggttgaccta cacaggtgcc 29280
atcaaattgg atgacaaaga tccaaatttc aaagatcaag tcattttgct gaataagcat 29340
attgacgcat acaaaacatt cccaccaaca gagcctaaaa aggacaaaaa gaagaaggct 29400
gatgaaactc aagccttacc gcagagacag aagaaacagc aaactgtgac tcttcttcct 29460
gctgcagatt tggatgattt ctccaaacaa ttgcaacaat ccatgagcag tgctgactca 29520
actcaggcct aaactcatgc agaccacaca aggcagatgg gctatataaa cgttttcgct 29580
tttccgttta cgatatatag tctactcttg tgcagaatga attctcgtaa ctacatagca 29640
caagtagatg tagttaactt taatctcaca tagcaatctt taatcagtgt gtaacattag 29700
ggaggacttg aaagagccac cacattttca ccgaggccac gcggagtacg atcgagtgta 29760
cagtgaacaa tgctagggag agctgcctat atggaagagc cctaatgtgt aaaattaatt 29820
ttagtagtgc tatccccatg tgattttaat agcttcttag gagaatgaca aaaaaaaaaa 29880
aaaaaaaaaa aaaaaaaaaa aa 29902
<210> 5
<211> 29903
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 5
tttttttttt tttttttttt tttttttttt tttgtcattc tcctaagaag ctattaaaat 60
cacatgggga tagcactact aaaattaatt ttacacatta gggctcttcc atataggcag 120
ctctccctag cattgttcac tgtacactcg atcgtactcc gcgtggcctc ggtgaaaatg 180
tggtggctct ttcaagtcct ccctaatgtt acacactgat taaagattgc tatgtgagat 240
taaagttaac tacatctact tgtgctatgt agttacgaga attcattctg cacaagagta 300
gactatatat cgtaaacgga aaagcgaaaa cgtttatata gcccatctgc cttgtgtggt 360
ctgcatgagt ttaggcctga gttgagtcag cactgctcat ggattgttgc aattgtttgg 420
agaaatcatc caaatctgca gcaggaagaa gagtcacagt ttgctgtttc ttctgtctct 480
gcggtaaggc ttgagtttca tcagccttct tctttttgtc ctttttaggc tctgttggtg 540
ggaatgtttt gtatgcgtca atatgcttat tcagcaaaat gacttgatct ttgaaatttg 600
gatctttgtc atccaatttg atggcacctg tgtaggtcaa ccacgttccc gaaggtgtga 660
cttccatgcc aatgcgcgac attccgaaga acgctgaagc gctgggggca aattgtgcaa 720
tttgcggcca atgtttgtaa tcagttcctt gtctgattag ttcctggtcc ccaaaatttc 780
cttgggtttg ttctggacca cgtctgccga aagcttgtgt tacattgtat gctttagtgg 840
cagtacgttt ttgccgaggc ttcttagaag cctcagcagc agatttctta gtgacagttt 900
ggccttgttg ttgttggcct ttaccagaca ttttgctctc aagctggttc aatctgtcaa 960
gcagcagcaa agcaagagca gcatcaccgc cattgccagc cattctagca ggagaagttc 1020
ccctactgct gcctggagtt gaatttcttg aactgttgcg actacgtgat gaggaacgag 1080
aagaggcttg actgccgcct ctgctccctt ctgcgtagaa gccttttggc aatgttgttc 1140
cttgaggaag ttgtagcacg attgcagcat tgttagcagg attgcgggtg ccaatgtgat 1200
cttttggtgt attcaaggct ccctcagttg caacccatat gatgccgtct ttgttagcac 1260
catagggaag tccagcttct ggcccagttc ctaggtagta gaaataccat cttggactga 1320
gatctttcat tttaccgtca ccaccacgaa ttcgtctggt agctcttcgg tagtagccaa 1380
tttggtcatc tggactgcta ttggtgttaa ttggaacgcc ttgtcctcga gggaatttaa 1440
ggtcttcctt gccatgttga gtgagagcgg tgaaccaaga cgcagtatta ttgggtaaac 1500
cttggggccg acgttgtttt gatcgcgccc cactgcgttc tccattctgg ttactgccag 1560
ttgaatctga gggtccacca aacgtaatgc ggggtgcatt tcgctgattt tggggtccat 1620
tatcagacat tttagtttgt tcgtttagat gaaatctaaa acaacacgaa cgtcatgata 1680
ctctaaaaag tcttcataga acgaacaacg cactacaaga ctacccaatt taggttcctg 1740
gcaattaatt gtaaaaggta aacaggaaac tgtataatta ccgatatcga tgtactgaat 1800
gggtgattta gaaccagcct catccacgca caattcaatt aaaggtgctg attttctagc 1860
tcctactcta atataccatt tagaatagaa gtgaatagga cacgggtcat caactacata 1920
tggttgatgt tgagtacatg actgtaaact acattcttgg tgaaatgcag ctacagttgt 1980
gatgattcct aagaaaacaa gaaatttcat gttcgtttag gcgtgacaag tttcattatg 2040
atcttgcagt tcaagtgaga accaaaagat aataagcata attaaaacaa ggaatagcag 2100
aaaggctaaa aagcacaaat agaagtcaat taatgaaagt tcaatcattc tgtctttctt 2160
ttgagtgtga agcaaagtgt tataaacact attgccgcaa caataagaaa aattggagag 2220
taaagttctt gaacttcctc ttgtctgatg aacagtttag gtgaaactga tctggcacgt 2280
aactgataga cgtgttttac gccgtcagga caagcaaaag caaattgagt gctaaagcaa 2340
gtcagtgcaa atttgttatc agctagagga tgaaatggtg aattgccctc gtatgttcca 2400
gaagagcaag gttcttttaa aagtactgtt gtacctctaa cacactcttg gtagtgataa 2460
agctcacaag tagcgagtgt tatcagtgcc aagaaaagaa taattttcat gttcgtttaa 2520
tcaatctcca ttggttgctc ttcatctaat tgagaatatt tattctcagt tagtgactta 2580
gataaatttt taattatgag gtttatgatg taatcaagat tccaaatgga aactttaaaa 2640
gtcctcataa taattagtaa tatctctgct atagtaacct gaaagtcaac gagatgaaac 2700
atctgttgtc acttactgta caagcaaagc aatattgtca ctgctactgg aatggtctgt 2760
gtttaattta tagttgccaa tcctgtagcg actgtatgca gcaaaacctg agtcacctgc 2820
tacacgctgc gaagctccca atttgtaata agaaagcgtt cgtgatgtag caacagtgat 2880
ttctttaggc aggtccttga tgtcacagcg tcctagatgg tgtccagcaa tacgaagatg 2940
tccacgaagg atcacagctc cgattacgag ttcactttct agaagcggtc tggtcagaat 3000
agtgccatgg agtggcacgt tgagaagaat gttagtttct ggattgaatg accacatgga 3060
acgcgtacgc gcaaacagtc tgaaagaagc aatgaagtag ctgagccaca tcaagcctac 3120
aagacaagcc attgcgatag caattccacc ggtgatccaa tttattctgt aaacagcagc 3180
aagcacaaaa caagctaaag ttactggcca taacagccag aggaaaatta acttaattat 3240
atacaaaaac ctattcctgt tggcataggc aaattgtaga agacaaatcc atgtaaggaa 3300
taggaaacct attactaggt tccattgttc aaggagcttt ttaagctctt caacggtaat 3360
agtaccgttg gaatctgcca tggctaaaat taaagttcca aacagaaaaa ctaatataat 3420
atttagttcg tttagaccag aagatcagga actctagaag aattcagatt tttaacacga 3480
gagtaaacgt aaaaagaagg ttttacaaga ctcacgttaa caatattgca gcagtacgca 3540
cacaatcgaa gcgcagtaag gatggctagt gtaactagca agaataccac gaaagcaaga 3600
aaaagaagta cgctattaac tattaacgta cctgtctctt ccgaaacgaa tgagtacata 3660
agttcgtact catcagcttg tgcttacaaa ggcacgctag tagtcgtcgt cggttcatca 3720
taaattggtt ccattactgg attaacaact ccggatgaac cgtcgattgt gtgaatttgg 3780
acatgttctt caggctcatc aacaatttta ttgtagatga agaaggtaac atgttcaaca 3840
ccagtgtctg tactcaattg agttgagtac agctggtaat agtctgaagt gaagtaactg 3900
tgtaatacaa cacagtcttt tactccagat tcccattttt cagtataacc accaatctgg 3960
tagtcatgtt cagaaatagg acttgttgtg ccatcacctg aagtaatgac aattgaagaa 4020
gttacactat tgtaaggtat acaatagtcg taacaattag tatgccagca aagaaaatag 4080
ttggcatcat aaagtaatgg gtttttggaa cggcatttcc agcaaagcca aagcctcatt 4140
attattctta caaagtttat actctgcaag aagtagacta aagcataaag atagagaaaa 4200
ggggcttcaa ggccagcagc aacgagcaaa aggtgtgagt aaactgttac aaacaacaac 4260
agcaagttgc aaacaaagtg aacacccttg gagagtgcta gttgccatct ctttttgagg 4320
gttatgattt tggaagcgct ctgaaaaaca gcaagaagtg caacgccaac aataagccat 4380
ccgaaaggga gtgaggcttg tatcggtatc gttgcagtag cgcgaacaaa atctgaagga 4440
gtagcatcct tgatttcacc ttgcttcaaa gttacagttc caattgtgaa gattctcata 4500
aacaaatcca taagttcgtt tatgtgtaat gtaatttgac tcctttgagc actggctcag 4560
agtcgtcttc atcaaatttg cagcaggatc cacaagaaca acagcccttg agacaactac 4620
agcaactggt catacagcaa agcataattg tcaccattac tatggcaatc aagccagcta 4680
taaaacctag ccaaatgtac catggccatt ttatatactg ctcatacttt ccaagttctt 4740
ggagatcgat gagagattca tttaaattct tggcaacctc attgaggcgg tcaatttctt 4800
tttgaatgtt tacaactgaa gcattaatgc cagagatgtc acctaaatca acatctggtg 4860
atgtatgatt cttaaaatat ttatctaact cctccttgaa tgagtctaat tcaggttgca 4920
aaggatcata aactgtgttg ttgacaattc ctattacaac atcacagtta ccagacacaa 4980
atgtgttgtc tgtagtaatg atttgtggtt cataaaaatt cctttgtgtt acaaaccagt 5040
gtgtgccatt tgaaacaaag acaccttcac gaggaaagtg tgcttttcca tcatgacaaa 5100
tggcaggagc agttgtgaag ttcttttctt gtgcagggac ataagtcaca tgcaagaaga 5160
ctacaccatg aggtgctgac tgagggaagg acataagatg atagcccttt ccacaaaaat 5220
caactctttt tgattgtcca agtacacact ctgacatttt agtagcagca agattagcag 5280
aagctctgat ttctgcagct ctaattaatt gttgagtcac atatgtctgc aaactttgaa 5340
gtctgcctgt gatcaaccta tcaatttgca cttcagcctc aactttgtca agacgtgaaa 5400
ggatatcatt taaaacactt gaaattgcac caaaattgga gctaagttgt ttaacaagcg 5460
tgtttaaagc ttgtgcattt tggttgacca catcttgaag ttttccaagt gcacttgctg 5520
tggaagaaag tgagtcttga attttgccaa tagcactatt aaattggttg gcaatcaatt 5580
tttggttctc atagagaaca ttctgtgtaa ctccaatacc attaaaccta taagccattt 5640
gcatagcaaa tggtatttgt aatgcagcac ctgcaccaaa ggtccaacca gaagtgattg 5700
tacccgctaa cagtgcagaa gtgtattgag caatcatttc atctgtgagc aaaggtggca 5760
aaacagtaag gccgttaaac ttttgtgcac aaatgaggtc tctagcagca atatcaccaa 5820
ggcaatcacc atattgtttg atgaagccag catctgcaag tgtcactttg ttgaaaagta 5880
gatcttcaat aaatgacctc ttgcttggtt ttgatggatc tggtaatatt tgtgaaaaat 5940
taaaaccacc aaaatcttta attggtggtg ttttgtaaat ttgtttgact tgtgcaaaaa 6000
cttcttgggt gtttttgtct tgttcaacag ctattccagt taaagcacgg tttaattgtg 6060
tacaaaaact gccatattgc aacaaaagat tgctgcattc agttgaatca ccacaaatgt 6120
acattgtaca atctactgat gtcttggtca tagacactgg tagaatttct gtggtaacac 6180
taatagtaaa atttgtgggt atggcaatag agttattaga gtaagcaact gaattttctg 6240
caccaagtga catagtgtag gcaatgatgg attgactagc tacactacgt gcccgccgag 6300
gagaattagt ctgagtctga taactagcgc atatacctgc accaatgggt atgtcacact 6360
catatgagtt gttgacatgt tcagccccta ttaaacagcc tgcacgtgtt tgaaaaacat 6420
tagaacctgt agaataaaca cgccaagtag gagtaagttg atctgcatga atagcaacag 6480
ggacttctgt gcagttaaca tcctgataaa gaacagcaac ctggttagaa gtatttgttc 6540
ctggtgttat aacactgaca ccaccaaaag aacatggtgt aatgtcaaga atctcaagtg 6600
tctgtggatc acggacagca tcagtagtgt cagcaatgtc tctgccaaat tgttggaaag 6660
gcagaaactt tttgttagac tcagtaagaa cacctgtgcc tgttaaacca ttgaagttga 6720
aattgacaca tttgttttta accaaattag tagacttttt aggtccacaa acagttgctg 6780
gtgcatgtag aagttcaaaa gaaagtacta ctactctgta tggttggtaa ccaacaccat 6840
tagtgggttg gaaaccatat gattgtaaag gaaagtaaca attaaaacct tcaacaccat 6900
tacaaggtgt gctaccggcc tgatagattt cagttgaaat atctctctca aaaggtttga 6960
gattagactt cctaaacaat ctatacaggt aattataatt accaccaacc ttagaatcaa 7020
gattgttaga attccaagct ataacgcagc ctgtaaaatc atctggtaat ttataattat 7080
aatcagcaat ctttccagtt tgccctggag cgatttgtct gacttcatca cctctaatta 7140
caaatgaatc tgcatagaca ttagtaaagc agagatcatt taatttagta ggagacactc 7200
cataacactt aaaagtggaa aatgatgcgg aattatatag gacagaataa tcagcaacac 7260
agttgctgat tctcttcctg ttccaagcat aaacagatgc aaatctggtg gcgttaaaaa 7320
cttcaccaaa agggcacaag tttgtaatat taggaaatct aacaatagat tctgttggtt 7380
ggactctaaa gttagaagtt tgatagattc ctttttctac agtgaaggat ttcaacgtac 7440
actttgtttc tgagagaggg tcaagtgcac agtctacagc atctgtaatg gttccatttt 7500
cattatattt taatagaaaa gtcctaggtt gaagataacc cacataataa gctgcagcac 7560
cagctgtcca acctgaagaa gaatcaccag gagtcaaata acttctatgt aaagcaagta 7620
aagtttgaaa cctagtgatg ttaataccta ttggcaaatc taccaatggt tctaaagccg 7680
aaaaaccctg agggagatca cgcactaaat taataggcgt gtgcttagaa tatattttaa 7740
aataaccatc aatattctta aacacaaatt ccctaagatt tttgaaatta ccctgttttc 7800
cttcaaggtc cataagaaaa ggctgagaga catattcaaa agtgcaatta ttcgcactag 7860
aataaactct gaactcactt tccatccaac ttttgttgtt tttgtggtaa taaacaccca 7920
aaaatggatc attacaaaat tgaaattcac agactttaat aacaacatta gtagcgttat 7980
taacaataag tagggactgg gtcttcgaat ctaaagtagt accaaaaatc cagcctctta 8040
ttatgttaga cttctcagtg gaagcaaaat aaacaccatc attaaatggt aggacagggt 8100
tatcaaacct cttagtacca ttggtcccag agacatgtat agcatggaac caagtaacat 8160
tggaaaagaa aggtaagaac aagtcctgag ttgaatgtaa aactgaggat ctgaaaactt 8220
tgtcagggta ataaacacca cgtgtgaaag aattagtgta tgcagggggt aattgagttc 8280
tggttgtaag attaacacac tgactagaga ctagtggcaa taaaacaaga aaaacaaaca 8340
ttgttcgttt agttgttaac aagaacatca ctagaaataa caactctgtt gttttctcta 8400
attataagtc tacctttact aagaagagat aaaatcatat cattgatttg accttctttt 8460
aaagacataa cagcagtacc ccttaattta aggggaaatt tactcatgtc aaataaagaa 8520
taggaagaca actgaattgg atttgtattc ctccaaaata tgtaatttgc atgcatgaca 8580
taaccatcta tttgttcgcg tggtttgcca agataattac atccaattaa aaatgcttca 8640
gatgatgacg cattcacatt agtaacaaag gctgtccacc atgcgaagtg tcccatgagc 8700
ttataaagat cagcattcca agaatgttct gttatcttta tagccacgga acctccaaga 8760
gctagctttt gttgtataaa cccacaaatg taagtgaaaa aaccctcttt agagtcattt 8820
tcttttgtaa catttttagt cttagggtcg tacatatcac taataatgag atcccattta 8880
ttagctgtat gtacagttgc acaatcacca atcaaagttg aatctgcatc agagacaaag 8940
tcattaagat ctgaatcgac aagcagcgta cccgtaggca accactgtct taaaacagct 9000
gtacctggtg caactccttt atcagaacca gcaccaaaat gtataactct catattatag 9060
ggtacagcta atgttaatgt gtttaaatat tgacacagtt gagtatattt tgcgacattc 9120
atcattatgc ctttaggtaa tgttgcacta tcaccataat tttgaaggtc acacttttct 9180
aatagcattc tttgcatttt gtaaagatta ggcatagcaa cacccggttg ccacgcttga 9240
ctagattgta attttgggta aaatgtttct acatggccat ctttacacca aagcataaat 9300
gaaatttctg tatagtcaat agtcactttg acaaccttag aaactacaga taaatcttgg 9360
gattttatta tttcaacaaa atcatcaagt aataaatcaa taacagaaca cacacactta 9420
gatgaacctg tttgcgcatc tgttatgaaa tagtttttaa ctgtactgtc cataggaata 9480
aaatcttcta attcaaaagg tgattcctta aaacgtttag ctagtccaat cagtagatgt 9540
aaaccaccta actgactatg actaaaatct ccataaacga tatgttcgaa ggcatagcct 9600
tctaatttat accgttcaat gaattcatcc atagctaatt ctaagaaatc aatttccatt 9660
tgactcctgg gtttaaattc ttgtaaattt ctactctgag taaagtaagt ttcaggtaat 9720
tgttggacaa caccatcaac tttcttataa taattgaact gtgtttttac ggcttctcca 9780
attaatgtga ctccattaag actagcttgt ttgggaccta cagatggttg taaaccttta 9840
acactacctt ctgtaataag aacaccatta cgggcatttc taaataagtc tacttgacca 9900
tcaactctac catcaaaaaa gacagtgagt ggtgcacaaa tcgtttcagt tggtttcttg 9960
gctatgtcag tcatagaaca aacaccaata gtagatatat gtgctggagc atctcttttg 10020
tagtcccaga tcacagtatt agcagcaatg tccacaccca aattattgag tattttcacc 10080
tctggtactg gtttaatgtt gcgcttagcc caaagctcaa atgctacatt aacaggtaat 10140
gttgttttat tttcaaacaa ttctacatca acaccatcaa cttttgtgta aacagtgtta 10200
ttaatgatag aaactggtac ttcaccctgt tgtccatcaa agtgtccctt atttacaaca 10260
ttaaaagcca cattttctaa actctgaagt cttgtaaaag tgttccagag gttataagta 10320
tcaaattgtt tgtaaaccca caagctaaag ccagctgaga tcatcatgtt ataagcatcg 10380
agatacaatc tgtactcatt agcatgatgt ctacagacag caccacctaa attgcaacgt 10440
gttatacacg tagcagactt tagtggtaca taatctatat ctgacactac ttgttttcca 10500
tgagactcac atggactgtc agagtaatag aaaaatggta attgttttaa attaacaaaa 10560
gcacttttat caaaagctgg tgtgtggaat gcatgtttat ttacatacaa actgccacca 10620
tcacaaccag gcaagttaag gttagatagc actctagtgt caaatctaca aacaatggaa 10680
ttagcaggat atctatcgac attgcaattc caaaataggc atacaccatc tgtgaatttg 10740
tcagaatgtg tggcataaga atagaataat tcttctattt tataagcttt gtcactacaa 10800
ggctgtgcat catagaactt ccattctaca tcagcttgag gtacacactt aatagcttta 10860
gggttaccaa tgtcgtgaag aactgggaat ttgtctgcta ataatgcagc tttaacaacc 10920
atgtgttgaa cctttctaca agccgcatta atcttcagtt catcaccaat tataggatat 10980
tcaatagtcc agtcaacacg cttaacaaag cactcgtgga cagctagaca cctagtcatg 11040
attgcatcac aactagctac atgtgcatta ccatggactt gacaatacag atcatggttg 11100
ctttgtaggt tacctgtaaa accccattgt tgaacatcaa tcataaacgg attatagacg 11160
taatcaaatc caatagaatg atgccaacag gcataagtgt ctgaagcagt ggaaaagcat 11220
gtggcacgtc tatcacatag acaacaggtg cgctcaggtc ctattttcac aaaatacttc 11280
atagatgtca actcaaagcc atgtgcccat aagacaaata cgactctgtc agagagattt 11340
ttaagtgtgt cacttaacat ttgtacaatc tttatacgca ctacattcca aggaagtcct 11400
ttgtacataa gtggtatgag gtgtttaaat tgatctccag gcggtggttt agcactaact 11460
ctggaaaaat ctgtattatt aggtgtatca acataacctg taggtacagc aactaggtta 11520
acacctgtag aaaaacctag ctgtaaaggt aaattggtac caacagcttc tctagtagca 11580
tgacacccct cgacatcgaa gccaatccat gcacgtacat gtcttatagc ttcttcgcgg 11640
gtgataaaca tgttagggta accattaact tgataattca ttttaaaacc catcatagag 11700
atgagtcttc tataggtcat gtccttaggt atgccaggta tgtcaacaca taaaccttca 11760
gttttgaatt tagtgtcaac actgaggtgt gtaggtgcct gtgtaggatg taacccagtg 11820
attaccttac tacaatcttt aaagagtcct gttacatttt cagcttgtaa agttgccaca 11880
ttcctacgtg gaatttcaag acttgtaaat tgcaacttgt cataaaggtc tctatcagac 11940
attatgcaaa gtatgcctac ttttgctctg gtaatagcaa cattaaatct gtttacatta 12000
caagagtgag ctgtttcagt ggtttgagtg aatatgacat agtcatattc tgagccctgt 12060
gatgaatcaa cagtttgagt tggtagtccc aaaatctttg aggctacagc attctgtgaa 12120
ttataaggtg aaataaagac agcttttctc caagcagggt tacgtgtaag gaattctctt 12180
accacgccta tttgtggcct gttaattgca gatgaaacat catgcgtgat aacaccctta 12240
taaaacattt taaagcattg agctgatttg tctttatgtg ctttaagctt attatcataa 12300
accaaagcac tcacagtgtc aacaatttca gcaggacaac gccgacaagt tccgaggaac 12360
atgtctggac ctatagtttt cataagtcta cacactgaat tgaaatattc tggttctagt 12420
gtgcccttag ttagcaatgt gcgtggtgca ggtaattgag cagggtcgcc aatgtacaca 12480
tagtgcttag cacgtaatct ggcattgaca acactcaaat cataatttgt ggccattgaa 12540
atttcatcaa agacaactat atctgctgtc gtctcaggca atgcatttac agtacaaaag 12600
acatactgtt ctaatgttga attcactttg aatttatcaa aacactctac acgagcacgt 12660
gcaggtataa ttctactaca tttatctata ggcaaatatt ttaatgcctt ctcacatagt 12720
gcatcaacag cggcatgaga gcaagctgta tacactatgc gagcagaagg gtagtagaga 12780
gctaggccaa tagcaaaatg actcttacca gtaccaggtg gtccctggag tgtagaatac 12840
ttttgcatac caaccttttg ataatttgca acattgctag aaaactcatc tgagatattg 12900
agtgttgggt ataagccagt aattctaaca tagtgctctt gtggcactag tgtaggtgca 12960
cttaatggca ttactgtatg tgatgtcagc acaaaataat caccaacatt taatttgtaa 13020
gttgttgtac ctcggtaaac aacagcatca ccatagtcac ctttttcaaa ggtgtactct 13080
cctatttgta ctttactgtt tttagttaca cgataaccag taaagacata atttcggtta 13140
agtggtggtc taggtttacc aacttcccat gaaagatgta attctctgtc agacagcact 13200
tcacgtacag tagcaatacc ataagacagt ttaaatgtct cctcagtagc tttgagcgtt 13260
tctgctgcaa aaagcttgag tctttcagta caggtgttag ctaaaatgta atcaccagca 13320
tttgtccagt cacatgttgc aattgcatta aagtcagtaa cattatcgct accaacacat 13380
gtatttttat ataaaccaaa aacttgtcca ttagcacaca atggaaaact aatgggtggt 13440
ttatgtgatt tacaataata gctcatacct cctaagtaaa gttgagtcac atctgtgaca 13500
tcacaacctg gagcattgca aacatacgga ttaacagaca agactaattt atgtgatgtt 13560
gatatgacat ggtcgtaaca gcatttacaa cataagaatg gtctacgtat gcaagcacca 13620
catcttaatg aagtctgtga attgcaaaga acacaagccc caacagcctg taagactgta 13680
tgcggtgtgt acatagcctc ataaaactca ggttcccaat accttgaagt gttatcatta 13740
gtaagcataa cagaatacat gtctaacatg tgtcctgtta actcatcatg tagctttctt 13800
atgtattgta agtacaaatg aaagacatca gcatactcct gattaggatg tttagtaagt 13860
gggtaagcat ctatagctaa agacacgaac cgttcaatca taagtgtacc atctgttttt 13920
acgatatcat ctacaaaaca gccggcccct aggattcttg atggatctgg gtaaggaagg 13980
tacacataat catcaccctg tttaactagc attgtatgtt gagagcaaaa ttcatgaggt 14040
cctttagtaa ggtcagtctc agtccaacat tttgcttcag acataaaaac attgttttga 14100
taataaagaa ctgacttaaa gttctttatg ctagccacta gaccttgaga tgcataagtg 14160
ctattgaaac acacaacagc atcgtcagag agtatcatca ttgagaaatg tttacgcaaa 14220
tatgcgtaaa actcattcac aaagtctgtg tcaacatctc tatttctata gagacactca 14280
taaagtctgt gttgtaaatt gcggacatac ttatcggcaa ttttgttacc atcagtagat 14340
aaaagtgcat taacattggc cgtgacagct tgacaaatgt taaaaacact attagcataa 14400
gcagttgtgg catctcctga tgaggttcca cctggtttaa catatagtga accgccacac 14460
atgaccattt cactcaatac ttgagcacac tcattagcta atctatagaa acggtgtgac 14520
aagctacaac acgttgtatg tttgcgagca agaacaagtg aggccataat tctaagcatg 14580
ttaggcatgg ctctatcaca tttaggataa tcccaaccca taaggtgagg gttttctaca 14640
tcactataaa cagtttttaa catgttgtgc caaccaccat agaatttgct tgttccaatt 14700
actacagtag ctcctctagt ggcggctatt gatttcaata atttttgatg aaactgtcta 14760
ttggtcatag tactacagat agagacacca gctacggtgc gagctctatt ctttgcacta 14820
atggcatact taagattcat ttgagttata gtagggatga cattacgttt tgtatatgcg 14880
aaaagtgcat cttgatcctc ataactcatt gaatcataat aaagtctagc cttaccccat 14940
ttattaaatg gaaaaccagc tgatttgtct aggttgttga cgatgacttg gttagcatta 15000
atacagccac catcgtaaca atcaaagtac ttatcaacaa cttcaactac aaatagtagt 15060
tgtctgatat cacacattgt tggtagatta taacgatagt agtcataatc gctgatagca 15120
gcattaccat cctgagcaaa gaagaagtgt tttaattcaa cagaacttcc ttccttaaag 15180
aaacccttag acacagcaaa gtcatagaag tctttgttaa aattaccggg tttgacagtt 15240
tgaaaagcaa cattgttagt aagtgcagct actgaaaagc acgtagtgcg tttatctagt 15300
aatagattac cagaagcagc gtgcatagca gggtcagcag catacacaag taattcctta 15360
aaactaagtc tagagctatg taagtttaca tcctgattat gtacaacacc tagctctctg 15420
aagtggtatc cagttgaaac tacaaatgga acaccatcaa caaatatttt tctcactagt 15480
ggtccaaaac ttgtaggtgg gaacactgta gagaataaaa cattaaagtt tgcacaatgc 15540
agaatgcatc tgtcatccaa acagttaaca caatttgggt ggtatgtctg atcccaatat 15600
ttaaaataac ggtcaaagag ttttaacctc tcttccgtga agtcatattt taacaaatcc 15660
cacttaatgt aaggctttgt taagtcagtg tcaacatgtg actctgcagt taaagccctg 15720
gtcaaggtta atataggcat taacaatgaa taataagaat ctacaacagg aactccacta 15780
cctggcgtgg tttgtatgaa atcaccgaaa tcataccagt taccattgag atcttgatta 15840
tctaatgtca gtacaccaac aataccagca tttcgcatgg catcacagaa ttgtactgtt 15900
tttaacaaag cttggcgtac acgttcacct aagttggcgt atacgcgtaa tatatctggg 15960
ttttctacaa aatcatacca gtccttttta ttgaaataat catcatcaca acaattgtat 16020
gtgacaagta tttcttttaa tgtgtcacaa ttaccttcat caaaatgcct taaagcatag 16080
acgaggtctg ccattgtgta tttagtaaga cgttgacgtg atatatgtgg taccatgtca 16140
ccgtctattc taaacttaaa gaagtcatgt ttagcaacag ctggacaatc cttaagtaaa 16200
ttataaattg tttcttcatg ttggtagtta gagaaagtgt gtctcttaac tacaaagtaa 16260
gaatcaatta aattgtcatc ttcgtccttt tcttggaagc gacaacaatt agtttttagg 16320
aatttagcaa aaccagctac tttatcattg tagatgtcaa aagccctgta tacgacatca 16380
gtactagtgc ctgtgccgca cggtgtaaga cgggctgcac ttacaccgca aacccgttta 16440
aaaacgattg tgcatcagct gactgaagca tgggttcgcg gagttgatca caactacagc 16500
cataaccttt ccacataccg cagacggtac agactgtgtt tttaagtgta aaacccacag 16560
ggtcattagc acaagttgta ggtatttgta catacttacc ttttaagtca caaaatcctt 16620
taggatttgg atgatctatg tggcaacggc agtacagaca acacgatgca ccaccaaagg 16680
attcttgatc catattggct tccggtgtaa ctgttattgc ctgaccagta ccagtgtgtg 16740
tacacaacat cttaacacaa ttagtgattg gttgtccccc actagctaga taatctttgt 16800
aagctttagc agcatctaca gcaaaagcac agaaagataa tacagttgaa ttggcaggca 16860
cttctgttgc attaccagct tgtagacgta ctgtggcagc taaactacca agtaccatac 16920
ctctatttag gttgtttaat cctttaataa agtataaata cttcacttta ggacctttag 16980
gtgtgtctgt aacaaaccta caaggtggtt ccagttctgt atagatagta ccagttccat 17040
cactcttagg gaatctagcc catttcaaat cctgtaaatc ggataacagt gcaagtacaa 17100
acctacctcc ctttgttgtg ttgtagtaag ctaacgcatt gtcatcagtg caagcagttt 17160
gtgtagtacc ggcagcacaa gacatctgtc gtagtgcaac aggactaagc tcattattct 17220
gtaatttgac agcagaattg gcccttaaag ctgttacaat aagaggccat gctaaattag 17280
gtgaattgtc catactaatt tcactaagtt gaacaatttt actatctgca tctacaacct 17340
gttggatttc ccacaatgct gatgcataag taaatgttgt accatcacac gtatttttat 17400
atgtgttata gtctggtatg acaaccatta gtttggctgc tgttgtaaga ggtattatgt 17460
tcaagggaac acaaccatct cttgcattgt tgataatgtt gttgagtgca tcattatcca 17520
actttctaag catagtgaaa agcattgtct gcatagcact agtaactttt gccctcttgt 17580
cctcagatct agcctgttta tacatttggg tcatagcttg atcagccatc ttttccaact 17640
tacgttgcat ggctgcatca cggtcaaatt cagatttagc cacattcaaa gacttcttca 17700
actttttaag aacaacttca gaatcaccat tagcaacagc ctgctcataa gcttcttgag 17760
cagtagcaaa agctgcatat gatggaaggg aactaaactc tgaggctata gcttgtaagg 17820
ttgccctgtt gtccagcatt tcttcacaaa gcttgtttat gtctacagca ccctgcatgg 17880
aaagcaaaac agaaagtagt gaaaccattt tttcaaaggc ttcagtagta tctttagcta 17940
agagaatgtc attgtgtaac tggacacatt gagcccacaa tttagatgat gattctactc 18000
tgagttgttg caaaactgag agtaagacta ctgatgtgca ctttacatct gacattttag 18060
actgtacagt ggctactttg atacaaggtt tgccaccaac acccaacaat ttaatgttga 18120
gtttgaaggc atctatgcta ttcttgggtg ggagtagtcc ctgtgaattc atatatctaa 18180
actcctgtgt agaaactaag taatcataaa caccaagagt cagtctaaag tagcggttga 18240
gtaaacaaaa gaggccaaag taacaagtac aaaaatagcc taagaaacaa taaactagca 18300
ttatacactg aagtgtatta ccagttatga agaaaatagg gcaatactca acacacataa 18360
aaacaatacc tctggccaaa aacatgacag ttgtaactac acctgagtag ttagaagtaa 18420
cagagattat aagagcccac atggaaatgg cttgatctaa agcattacca taataaactt 18480
tataaacgag tgtcaagaca ttcataagtg tccacactct cctagcacca tcatcataca 18540
cagttcttgc tgtcataagg attagtaaca ctacagctga tgcatacata acacagtctt 18600
ttagcttaaa accagacaaa ctagtatcaa ccatatccaa ccatgtcata atacgcatca 18660
cccaactagc aggcatatag accatattaa aataagctac agtggcaaga gaaggtaaca 18720
aaaacaaaca gagaaatgca tgcttatgtt tgacaaacat cattgcaaaa gcagacatag 18780
caataatacc catagcaaaa ggtaaaaagg cattttcata caaaaaaaag aacaaagacc 18840
attgagtact ctggactaaa actaaaagtg aagtcaaaat tgtgagtaac aaccagtggt 18900
gtgtaccctt gattgttctt ttcactgcac tttggaaagt aacacctgag cattgtctaa 18960
caacatcaaa aggtgtaaat tcatcttcta ataaagcact acccaatatg gtacgtccat 19020
tcataccatt ttgcagtaat tcttttaatg aagcacacat atctaaaacg gcaattccag 19080
tttgagcaga aagaggtcct agtatgtcaa catggtcttg tgttagaggt tcataattgt 19140
acttcatagc cacaaggtta aagtcattaa gagttgtggt aaatcgattg agaaaccacc 19200
tgtctccatt tataacagca gcgtacaacc aagctaaaac attaactgta atagttgtgt 19260
ccgtaccagc tgcttgtgct gtttgcctgt caacaaaagg tccataaaag ttaccttcta 19320
agtctgtgcc agcatgaact ccagttggta attccatatg gtgcatgtaa caaaaagaga 19380
cacagtcata atctatgtta aaaccaacac taccacatga accattaagg aatgaaccct 19440
taatagtgaa attgggcctc atagcacatt ggtaaacacc agatggtgaa ccattgtaac 19500
aagctaacac tgaaaaagtc tgtcctggtt gaatgcgaac aaacttatac ttaggtgtct 19560
taggattggc tgtatcaacc ttaagcttaa gtacacaatt ttgcatagaa tgtccaataa 19620
ccctgagttg aacattacca gcctgtacca agaaattatg attagactta cgaatgagta 19680
aatcttcata attagggtta agcatgtctt cagaggtgca gatcacatgt cttggacagt 19740
aaactacgtc atcaagccaa agaccgttaa gtgtagttgt accacaagtt acttgtacca 19800
tacaaccctc aactttacca gatgggaatg ccatttttct aaaaccactc tgcaaaacag 19860
ctgaggtgat agaggtttgt ggtggttggt aaagaacatc agaacctgag ttactgaagt 19920
cattgagagc ctttgcgaga tgacaacaag cagcttctct gtagctagtt gtatccattg 19980
ctccactaaa atacttgtac ttattataaa gagctaagta tctattatat tgcgtaagag 20040
gtaatagcac atcactacgc aactttagat acatttcttt atttaacaaa aaggtgcaca 20100
gcgcagcttc ttcaaaagta ctaaaggaaa caccattaaa gactacacgt ctctttaggt 20160
aattactaaa gaaccaatag aaatgctttg tggaaataca aatgatataa gcaattgtta 20220
tccagaaagg tactaaaggt gtgaacataa ccatccactg aatatgtgct aaaaaagaaa 20280
catcattagt aagataaaat gtcaagtaca agtaaataac agaataaaca ccaggtaaga 20340
atgagtaaac tggtgttaaa cagagtacag tgaatgacat aaggaatagt aaagtattaa 20400
aggcaactac atgactgtat tcaccaaaag ctcttctaaa cctcataaaa tagtaggcaa 20460
ggcatgttac tacgatagct acaataccac cagctactat agatgctgat atgtccaaag 20520
caccaatagg ttgaattagt ggtgtaaaca tattagtaag taaatttaca gcatctacac 20580
cacagaaaac tcctggtaaa gatctgtaat aatcattgtt aagtacccat ctaccactag 20640
tagatacaca aacaccagct tctgatcttt cacaagtgcc gtgcctacag tactcagaat 20700
caaaagttgt taccactcta acagaacctt caaggtaggt gttaggaaat tgaataatag 20760
agccatccat gagcacataa cgtgtgtcag ggcgtaaact ttcataagca acagaacctt 20820
ctagtacatt ggtatcataa caatatggta ctggcttacc agaagcatct ttaaaaattg 20880
tacattcagc agccaaaaca caagctgatg ttgcaaagtc agtgtactct ataagttttg 20940
atggtgtgta acagatgtta ccaactgcac taaaaactct aggtaagaaa tgcaaaaagt 21000
caccattagt tgtgcgtaat atcgtgccag gcaaaccagg cacgacaaaa cccacttctc 21060
ttgttatgac tgcagcaatc aatgggcaag ctttgtcatt agtataacta ccaccacgct 21120
ggctaaacca tgtgtcaaaa tcagcatgtt tgttagcaaa acaagtatct gtagatgcta 21180
tgtcacgagt gacaccacca tcaatagcct tgtatcctat gatttcactt gaaaagtcag 21240
tatgtttaga catgacatga acaggtgtta ttaaatagaa aatagcagca acaaaaagga 21300
acacaagtgt aactttaatt aactgcttca accaattatt aacaatttta ccacccttaa 21360
gtgctatctt tgttgttaca acattaacaa cttgtctagt agttgcacat gtcaacttaa 21420
aaggtaagtt attcttttta gcagcactac gtatttgttt tcgtagttgt tcagacaatg 21480
acatgaaatc tttaacgttc catatcaaag caatgttgtg actttttgct acctgcgcat 21540
taatatgacg cgcactacag tcaatacaag caccaaggtc acggggtgtc atgttttcaa 21600
ctttgttata ggtgagcata tagttattac aactatcgcc agtaacttct atgtcagatt 21660
gatgtgacaa tttaagacat tcaacaacat ctttagtttc tacatctgaa tcaacaaacc 21720
cttgccgagc tgctgaaata aaagtagata agacattgtc taaggacaca ttctttgcaa 21780
gttcagcttc tgcagttgca actagtgttt tgagtttttc cattggtacg ttaaaagttg 21840
atgaaaacgt attaacgtaa gcatcaaaca ttttaactgc aacttccgca ctatcaccaa 21900
catcagacac taatgcctga tctagtaaca gtataggttg acacataagc tgactgtagt 21960
aaacagacgc tgattttgca gatgattctt cacattttga tttaccatca aaaactataa 22020
cattaatagg caatgaacct ttagtgttat tagctctcag gttgtctaag ttaacaaaat 22080
gagagagaga atgtctttca taagtctttt gaccagcttt atcaaagtaa agatggatgg 22140
aaccattctt cactgtaaca ctatcaacga tgtaagaaga ctggtcagta ggatttattg 22200
gtcttttaaa ctgtagtgac aagtctctcg caacttcatc actaataaat gtactaccag 22260
cacagaatgt atcacaatta acacaattcc aattgtgtag tttgcaaaag cctttacctc 22320
cattagcata gacataaaag gaccttctaa caccattaac aatagttgta cattcgactc 22380
ttgttgctct attacgtttg taacacatca tacaagttga tgaattacaa ccgtctacaa 22440
catgcacata acttttccat acataataaa atgatgcaaa gaagatgtac attctaacca 22500
tagctgaaat cggggccatt tgtacaagat taattattaa ccacataagc caagaattac 22560
taataaaatg tactgcaaaa tagctgaaaa acaattgcat gattgcagcc aatccaagta 22620
catagaaaaa cctagtgaaa agaatatatg ccaaaaacca ctctgcaact aagccaaaag 22680
cagttaaatc ccatttaaaa gatgaaatgg taatttgtat agtttctaaa gaaggatagg 22740
tgtctaaaga atctaaacca ctaagacaaa cactacaagg tatagaacca gtacagtagg 22800
ttgcaatagt gacattagta gagttcaaat agccttctct gtaaccagta cagtaagaag 22860
gcatgcctaa attagacatt aaaacaccta aagcagcggt tgagtagatt aaagaaccta 22920
ggcaaacact taatagtaaa aaccaaatta taatatttat cagtttagaa aaattaggtg 22980
acttcaaata attaaatgaa gcctctagac aaaatttacc gacactctta acagtattct 23040
ttgctatagt agtcggcata gatgctttaa ttctagaatt tgtacttcta gtaaaagtac 23100
acaattgtag caataaagta aagaaataag gcatataatt agtacaaaca cggtttaaac 23160
accgtgtaac tatgttagta gttgtactaa caactttgtt aagaaaaggc ttagcataat 23220
tagctatagt atcccaaggg acactattaa cagcagctaa accatgagta gcaagggttt 23280
tcaaacctaa tactctagat aattcattag gtttcttaat agtaagacta gaattgtcta 23340
cataagcagc cattagatct gtgtggccaa cctcttctgt aatttttaaa ctattatttg 23400
ctggtttaag tataatgtct cctacaactt cggtagtttt cacattacac tcaagaacgt 23460
ctttctgtat ggtaggattt tccactactt cttcagagac tggttttaga tcttcgcagg 23520
caagattatc cattccctgc gcgtcctctg acttcagtac atcaaacgaa tttgatgttt 23580
caactggttt tgtgctccaa agacaacgta tacaccaggt atttggttta tacgtggctt 23640
tattagttgc attgttaaca tgccaaacaa taggtttatg taacaattta gctcctttct 23700
taaaagaggg tgtgtagtgt ttataatcaa tagccaccac atcaccattt aagtcaggga 23760
aaaatgtaac tttaagctct cttgaagcag gtttcttata accagttaac tggtttaaat 23820
catcagcaaa tttgatatta tcacatacaa acttaaaatt atcgaagctt gcgtttggat 23880
atggttggtt tggtacaaga tcaattggtt gctctgtgaa ataagaattg tctttcttat 23940
aataattgtc caacttaggg tcaatttctg tacaaacaac accatccaat ttataagtaa 24000
ctggttttat ggttgttgtg taactgtttt ctttgtagaa aacatccgta ataggacctt 24060
tgtattctga ggactttgta agtaaagcac cgtctatgca atacaaagtt tctttagaag 24120
ttatatgttt atagtgacca cactggtaat taccagtgta ctcactagca caagtaaatg 24180
taccatgctt aagttcatac tgagcaggtg gtgctgacat cataacaaaa ggtgactcct 24240
gttgtactag atattttgta gcttgtttac cacacgtaca aggtatctga acacctttct 24300
taaattgttc ataagaaagt gtgcccatgt acataacagc ttctacaccc ttaagggttg 24360
tctgctgttg tccacaagtt ttacacacca cgttcaagac tcttttgcaa gaatctaaat 24420
tggcatgttg aaacaagtaa ctcattgttt ctctaacatc acctaactca cctactgtct 24480
tattacagta ggctaagata agtgcacaaa agttagcagc ttcaccagcc cttgctctgt 24540
aataagcatc ttgtagagca ggtggattaa acttcaactc tatttgttgg agtgttaaca 24600
atgcagtggc aagataacag ttgttatctg cccatttaat agaagttaaa ccattaactt 24660
gtgggtattt ccacttttta gtgtgattta atgctgacat gtacctaccc agaaaactag 24720
gatcagttgt gtggtagtac tcaaaagcct caacacgtag agtgtcatca ttaggtaaaa 24780
cataaaatgt tttaccttca tgtgaattat gaggttttat tttagtaaca tcagctccat 24840
ccaaataagt tggaccaaac tgttgtccat atgtcattga catgtccaca acttgcgtgt 24900
ggaggttaat gttgtctact gttgtaaaca ccttaatagt cctcacttct ctcaaagaaa 24960
gaagtgtctt aagattgtca aaggtgataa cttcaccatc taggtggaat gtggtaggat 25020
tactagtgta atatacactt ttatcacctc tcttaagaaa ttctatacct agttgtgtag 25080
attgtccaga ataggaccaa tctttatagg aaccagcaag tgagatggtt tcaataaaat 25140
gttcttcagg tgttttagaa gaagaagtaa gataaccatt atacgctgta acagcatcag 25200
gtgaagaaac agaaactgta gctggcactt tgagagatct catataccga gcagcttctt 25260
ccaaatttaa gccatgtgtt acatagccaa gtggcattgt aacaagagtt tcatttagat 25320
cgttaagtgt gttgataagt gacgctacag ttgttttact ggtgtaaaag taaaatctag 25380
caccataatc aaccacaccc tcttgtattt taataccctt atatttacgc tgtatagttg 25440
aaactatggc tttagtttcc acacagacag gcattaattt gcgtgtttct tctgcatgtg 25500
caagcatttc tcgcaaattc caagaaacag ttccaagaat ttcttgcttc tcattagaga 25560
taatagatgg tagaatgtaa aaggcacttt tacacttttt aagcactgtc tttgcctcct 25620
ctacagtgta accatttaaa ccctgacccg ggtaagtggt tatataattg tctgttggca 25680
cttttctcaa agctttcgct agcatttcag tagtgccacc agccttttta gtaggtataa 25740
ccacagcagt taaaacaccc tcttgaacaa catcacccac tatatatgga gcatctttct 25800
ttaagaaagt gatgtcaatg tcactaacaa gagtggcaga atctggatga agattgccat 25860
taatgtcaat ataaagtaac aagttttctg tgaggaactt agtttcttcc agagttgttg 25920
taacttcttc aacacaagct ttgattttct tatcatcttg ttttctctgt tcaactgaag 25980
gtttactttc agttataaat ggcttaactt cctctttagg aatctcagcg atcttttgtt 26040
caacttgctt ttcactcttc atttccaaaa agcttgaaac aagtttgtca tagagatttt 26100
tatcaaagac agctaagtag acatttgtgc gaacagtatc tacacaaact cttaaagaat 26160
gtatagggtc agcaccaaaa ataccagctg ataataatgg tgcaagtaga acttcgtgct 26220
gattaaaatt ttcataagca ctcttaagaa gttgaatgtc ttcacctttg ttaacatttg 26280
ggccgacaac atgaagacag tgtttagcaa gattgtgtcc gcttaaaaca caactaccac 26340
ccactttaag tggtccatta gtagctatgt aatcatcaga ttcaacttgc atggcattgt 26400
tagtagcctt atttaaggct cctgcaacac ctcctccatg tttaaggtaa acattggctg 26460
cattaacaac cactgttggt tttacctttt tagcttcttc cacaatgtct gcatttttaa 26520
tgtatacatt gtcagtaagt tttaaataac cactaaaact attcacttca atagtctgaa 26580
caactggtgt aagttccatc tctaattgag gttgaacctc aacaattgtt tgaatagtag 26640
ttgtctgatt gtcctcactg ccgtcttgtt gaccaacagt ttgttgacta tcatcatcta 26700
accaatcttc ttcttgctct tcttcaggtt gaagagcagc agaagtggca ccaaattcca 26760
aaggtttacc ttggtaatca tcttcagtac catactcata ttgagttgat ggctcaaact 26820
cttcttcttc acaatcacct tcttcttcat cctcatctgg agggtagaaa gaacaataca 26880
tatgtgaagc caatttaaac tcaccagact catcaaataa gtagtatgta gccatactcc 26940
actcatctaa atcaatgccc agtggtgtaa gtaattcaga tactggttgc aaagttttta 27000
tgacagcatc tgccacaaca caggcgaact catttacttc tgtaccgagt tcaactgtat 27060
aggcagagca cttctcatta agtactttat caatcctttc atcaagttca aaagtgatat 27120
tcacactctt gtaaccttgc acttctatca cagtgtcatc accaaaagta acctttgttg 27180
gtgcaccgcc tttgagtgtg aaggtattgt ttgttaccat catattaggt gcaagggcac 27240
agtacttttc tgtgtctttg atttcgagca acataagccc gttaatacaa actggtgtac 27300
caaccaatgg agcttcaaca gcttcactag taggttgttc taatggttgt aaatcaccag 27360
ttttcaagac aacttcctct gttaacactt ctgtgggaag tgtttctccc tctaagaaga 27420
taatttcttt tggggctttt agaggcatga gtaggccagt ttcttctctg gatttaacac 27480
actttctgta caatcccttt gagtgcgtga caaatgtttc acctaaattc aaggctttaa 27540
gtttagctcc accaataatg atagagtcag cacacaaagc caaaaattta tttacaagct 27600
taaagaatgt ctgaacactc tccttaattt cctttgcaca ggtgacaatt tgtccaccga 27660
caatttcaca agcacaggtt gagataaatt taacaatttc ccaaccgtct ctaagaaact 27720
ctacaccttc cttaaacttc tcttcaagcc aatcaaggac gggtttgagt ttttcataaa 27780
cagtgccaaa gatgttagtt agccactgcg aagtcaactg aacaacacca cctgtaatgt 27840
aggccattac aactagattg ttagtagcca aatcagatgt gaacatcata gcatcaatga 27900
gtctcagtga atactgtgaa attccatcta gtattgttat agcggccttc tgtaaaacac 27960
gcacagaatt ttgagcagtt tcaagagtgc gggagaaaat tgatcgtaca acacgagcag 28020
cctctgatgc aaatgcataa agaggactca gtattgattt ctgttcacca atattccagg 28080
cacctttttt agcttttcct tttgtaactt taaaattacc acaggattca acaatttgtt 28140
tgaatgcttt ataatccaaa cctttcacag tttccacaaa agcacttgtg gaagcagaaa 28200
aagatgccaa aataatggcg atctcttcat taagtttaaa gtcaccaaca atattgatgt 28260
tgactttctc tttttggagt atttcaagaa ggttgtcatt aagaccttcg gaaccttctc 28320
caacaacacc tgtatggtta caacctatgt tagcgctagc acgtggaacc caataggcac 28380
acttgttatg gcaaccaaca taagagaaca cacagcctcc aaaggcaata gtgcgaccac 28440
ccttacgaag aatggttttc aagccagatt cattatggta ttcggcaaga ctatgctcag 28500
gtcctacttc tgaattgtga catgctggac aataaatttt aacaacagca ttttggggta 28560
agtaaccaca agtagtggca ccttctttag tcaaattctc agtgccacaa aattcgcaag 28620
tggctttaac aaaatcgccc gtctgccatg aagtttcacc acaatgatca cacttcatga 28680
gagttgaaag gcacatttgg ttgcattcat ttggtgacgc aactggatag acagatcgaa 28740
ttctacccat aaagccatca agctttttct tttcaaccct tggttgaata gtcttgatta 28800
tggaatttaa gggaaataca aaatttggac attccccatt gaaggtgtca aatttctttg 28860
ccaatttaat ttcaaaaggt gtctgcaatt catagctctt ttcagaacgt tccgtgtacc 28920
aagcaatttc atgctcatgt tcacggcagc agtatacacc cctcttagtg tcaataaagt 28980
ccagttgttc ggacaaagtg catgaagctt taccagcacg tgctagaagg tctttaatgc 29040
actcaagagg gtagccatca gggccacaga agttgttatc gacatagcga gtgtatgccc 29100
ctccgttaag ctcacgcatg agttcacggg taacaccact gctatgttta gtgttccagt 29160
tttcttgaaa atcttcataa ggatcagtgc caagctcgtc gcctaagtca aatgacttta 29220
gatcggcgcc gtaactatgg ccaccagctc ctttattacc gttcttacga agaagaacct 29280
tgcggtaagc cactggtatt tcgcccacat gagggacaag gacaccaagt gtctcaccac 29340
tacgaccgta ctgaatgcct tcgagttctg ctaccagctc aaccataaca tgaccatgag 29400
gtgcagttcg agcatccgaa cgtttgatga acacataggg ctgttcaagt tgaggcaaaa 29460
cgcctttttc aacttctact aagccacaag tgccatcttt aagatgttga cgtgcctctg 29520
ataagacctc ctccacggag tctccaaagc cacgtacgag cacgtcgcga acctgtaaaa 29580
caggcaaact gagttggacg tgtgttttct cgttgaaacc agggacaagg ctctccatct 29640
tacctttcgg tcacacccgg acgaaaccta gatgtgctga tgatcggctg caacacggac 29700
gaaaccgtaa gcagcctgca gaagatagac gagttactcg tgtcctgtca acgacagtaa 29760
ttagttatta attatactgc gtgagtgcac taagcatgca gccgagtgac agccacacag 29820
attttaaagt tcgtttagag aacagatcta caagagatcg aaagttggtt ggtttgttac 29880
ctgggaaggt ataaaccttt aat 29903
<210> 6
<211> 29903
<212> RNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 6
auuaaagguu uauaccuucc cagguaacaa accaaccaac uuucgaucuc uuguagaucu 60
guucucuaaa cgaacuuuaa aaucugugug gcugucacuc ggcugcaugc uuagugcacu 120
cacgcaguau aauuaauaac uaauuacugu cguugacagg acacgaguaa cucgucuauc 180
uucugcaggc ugcuuacggu uucguccgug uugcagccga ucaucagcac aucuagguuu 240
cguccgggug ugaccgaaag guaagaugga gagccuuguc ccugguuuca acgagaaaac 300
acacguccaa cucaguuugc cuguuuuaca gguucgcgac gugcucguac guggcuuugg 360
agacuccgug gaggaggucu uaucagaggc acgucaacau cuuaaagaug gcacuugugg 420
cuuaguagaa guugaaaaag gcguuuugcc ucaacuugaa cagcccuaug uguucaucaa 480
acguucggau gcucgaacug caccucaugg ucauguuaug guugagcugg uagcagaacu 540
cgaaggcauu caguacgguc guagugguga gacacuuggu guccuugucc cucauguggg 600
cgaaauacca guggcuuacc gcaagguucu ucuucguaag aacgguaaua aaggagcugg 660
uggccauagu uacggcgccg aucuaaaguc auuugacuua ggcgacgagc uuggcacuga 720
uccuuaugaa gauuuucaag aaaacuggaa cacuaaacau agcaguggug uuacccguga 780
acucaugcgu gagcuuaacg gaggggcaua cacucgcuau gucgauaaca acuucugugg 840
cccugauggc uacccucuug agugcauuaa agaccuucua gcacgugcug guaaagcuuc 900
augcacuuug uccgaacaac uggacuuuau ugacacuaag agggguguau acugcugccg 960
ugaacaugag caugaaauug cuugguacac ggaacguucu gaaaagagcu augaauugca 1020
gacaccuuuu gaaauuaaau uggcaaagaa auuugacacc uucaaugggg aauguccaaa 1080
uuuuguauuu cccuuaaauu ccauaaucaa gacuauucaa ccaaggguug aaaagaaaaa 1140
gcuugauggc uuuaugggua gaauucgauc ugucuaucca guugcgucac caaaugaaug 1200
caaccaaaug ugccuuucaa cucucaugaa gugugaucau uguggugaaa cuucauggca 1260
gacgggcgau uuuguuaaag ccacuugcga auuuuguggc acugagaauu ugacuaaaga 1320
aggugccacu acuugugguu acuuacccca aaaugcuguu guuaaaauuu auuguccagc 1380
augucacaau ucagaaguag gaccugagca uagucuugcc gaauaccaua augaaucugg 1440
cuugaaaacc auucuucgua aggguggucg cacuauugcc uuuggaggcu guguguucuc 1500
uuauguuggu ugccauaaca agugugccua uuggguucca cgugcuagcg cuaacauagg 1560
uuguaaccau acagguguug uuggagaagg uuccgaaggu cuuaaugaca accuucuuga 1620
aauacuccaa aaagagaaag ucaacaucaa uauuguuggu gacuuuaaac uuaaugaaga 1680
gaucgccauu auuuuggcau cuuuuucugc uuccacaagu gcuuuugugg aaacugugaa 1740
agguuuggau uauaaagcau ucaaacaaau uguugaaucc ugugguaauu uuaaaguuac 1800
aaaaggaaaa gcuaaaaaag gugccuggaa uauuggugaa cagaaaucaa uacugagucc 1860
ucuuuaugca uuugcaucag aggcugcucg uguuguacga ucaauuuucu cccgcacucu 1920
ugaaacugcu caaaauucug ugcguguuuu acagaaggcc gcuauaacaa uacuagaugg 1980
aauuucacag uauucacuga gacucauuga ugcuaugaug uucacaucug auuuggcuac 2040
uaacaaucua guuguaaugg ccuacauuac aggugguguu guucaguuga cuucgcagug 2100
gcuaacuaac aucuuuggca cuguuuauga aaaacucaaa cccguccuug auuggcuuga 2160
agagaaguuu aaggaaggug uagaguuucu uagagacggu ugggaaauug uuaaauuuau 2220
cucaaccugu gcuugugaaa uugucggugg acaaauuguc accugugcaa aggaaauuaa 2280
ggagaguguu cagacauucu uuaagcuugu aaauaaauuu uuggcuuugu gugcugacuc 2340
uaucauuauu gguggagcua aacuuaaagc cuugaauuua ggugaaacau uugucacgca 2400
cucaaaggga uuguacagaa aguguguuaa auccagagaa gaaacuggcc uacucaugcc 2460
ucuaaaagcc ccaaaagaaa uuaucuucuu agagggagaa acacuuccca cagaaguguu 2520
aacagaggaa guugucuuga aaacugguga uuuacaacca uuagaacaac cuacuaguga 2580
agcuguugaa gcuccauugg uugguacacc aguuuguauu aacgggcuua uguugcucga 2640
aaucaaagac acagaaaagu acugugcccu ugcaccuaau augaugguaa caaacaauac 2700
cuucacacuc aaaggcggug caccaacaaa gguuacuuuu ggugaugaca cugugauaga 2760
agugcaaggu uacaagagug ugaauaucac uuuugaacuu gaugaaagga uugauaaagu 2820
acuuaaugag aagugcucug ccuauacagu ugaacucggu acagaaguaa augaguucgc 2880
cuguguugug gcagaugcug ucauaaaaac uuugcaacca guaucugaau uacuuacacc 2940
acugggcauu gauuuagaug aguggaguau ggcuacauac uacuuauuug augagucugg 3000
ugaguuuaaa uuggcuucac auauguauug uucuuucuac ccuccagaug aggaugaaga 3060
agaaggugau ugugaagaag aagaguuuga gccaucaacu caauaugagu augguacuga 3120
agaugauuac caagguaaac cuuuggaauu uggugccacu ucugcugcuc uucaaccuga 3180
agaagagcaa gaagaagauu gguuagauga ugauagucaa caaacuguug gucaacaaga 3240
cggcagugag gacaaucaga caacuacuau ucaaacaauu guugagguuc aaccucaauu 3300
agagauggaa cuuacaccag uuguucagac uauugaagug aauaguuuua gugguuauuu 3360
aaaacuuacu gacaauguau acauuaaaaa ugcagacauu guggaagaag cuaaaaaggu 3420
aaaaccaaca gugguuguua augcagccaa uguuuaccuu aaacauggag gagguguugc 3480
aggagccuua aauaaggcua cuaacaaugc caugcaaguu gaaucugaug auuacauagc 3540
uacuaaugga ccacuuaaag ugggugguag uuguguuuua agcggacaca aucuugcuaa 3600
acacugucuu cauguugucg gcccaaaugu uaacaaaggu gaagacauuc aacuucuuaa 3660
gagugcuuau gaaaauuuua aucagcacga aguucuacuu gcaccauuau uaucagcugg 3720
uauuuuuggu gcugacccua uacauucuuu aagaguuugu guagauacug uucgcacaaa 3780
ugucuacuua gcugucuuug auaaaaaucu cuaugacaaa cuuguuucaa gcuuuuugga 3840
aaugaagagu gaaaagcaag uugaacaaaa gaucgcugag auuccuaaag aggaaguuaa 3900
gccauuuaua acugaaagua aaccuucagu ugaacagaga aaacaagaug auaagaaaau 3960
caaagcuugu guugaagaag uuacaacaac ucuggaagaa acuaaguucc ucacagaaaa 4020
cuuguuacuu uauauugaca uuaauggcaa ucuucaucca gauucugcca cucuuguuag 4080
ugacauugac aucacuuucu uaaagaaaga ugcuccauau auagugggug auguuguuca 4140
agaggguguu uuaacugcug ugguuauacc uacuaaaaag gcugguggca cuacugaaau 4200
gcuagcgaaa gcuuugagaa aagugccaac agacaauuau auaaccacuu acccggguca 4260
ggguuuaaau gguuacacug uagaggaggc aaagacagug cuuaaaaagu guaaaagugc 4320
cuuuuacauu cuaccaucua uuaucucuaa ugagaagcaa gaaauucuug gaacuguuuc 4380
uuggaauuug cgagaaaugc uugcacaugc agaagaaaca cgcaaauuaa ugccugucug 4440
uguggaaacu aaagccauag uuucaacuau acagcguaaa uauaagggua uuaaaauaca 4500
agagggugug guugauuaug gugcuagauu uuacuuuuac accaguaaaa caacuguagc 4560
gucacuuauc aacacacuua acgaucuaaa ugaaacucuu guuacaaugc cacuuggcua 4620
uguaacacau ggcuuaaauu uggaagaagc ugcucgguau augagaucuc ucaaagugcc 4680
agcuacaguu ucuguuucuu caccugaugc uguuacagcg uauaaugguu aucuuacuuc 4740
uucuucuaaa acaccugaag aacauuuuau ugaaaccauc ucacuugcug guuccuauaa 4800
agauuggucc uauucuggac aaucuacaca acuagguaua gaauuucuua agagagguga 4860
uaaaagugua uauuacacua guaauccuac cacauuccac cuagauggug aaguuaucac 4920
cuuugacaau cuuaagacac uucuuucuuu gagagaagug aggacuauua agguguuuac 4980
aacaguagac aacauuaacc uccacacgca aguuguggac augucaauga cauauggaca 5040
acaguuuggu ccaacuuauu uggauggagc ugauguuacu aaaauaaaac cucauaauuc 5100
acaugaaggu aaaacauuuu auguuuuacc uaaugaugac acucuacgug uugaggcuuu 5160
ugaguacuac cacacaacug auccuaguuu ucuggguagg uacaugucag cauuaaauca 5220
cacuaaaaag uggaaauacc cacaaguuaa ugguuuaacu ucuauuaaau gggcagauaa 5280
caacuguuau cuugccacug cauuguuaac acuccaacaa auagaguuga aguuuaaucc 5340
accugcucua caagaugcuu auuacagagc aagggcuggu gaagcugcua acuuuugugc 5400
acuuaucuua gccuacugua auaagacagu aggugaguua ggugauguua gagaaacaau 5460
gaguuacuug uuucaacaug ccaauuuaga uucuugcaaa agagucuuga acguggugug 5520
uaaaacuugu ggacaacagc agacaacccu uaagggugua gaagcuguua uguacauggg 5580
cacacuuucu uaugaacaau uuaagaaagg uguucagaua ccuuguacgu gugguaaaca 5640
agcuacaaaa uaucuaguac aacaggaguc accuuuuguu augaugucag caccaccugc 5700
ucaguaugaa cuuaagcaug guacauuuac uugugcuagu gaguacacug guaauuacca 5760
guguggucac uauaaacaua uaacuucuaa agaaacuuug uauugcauag acggugcuuu 5820
acuuacaaag uccucagaau acaaaggucc uauuacggau guuuucuaca aagaaaacag 5880
uuacacaaca accauaaaac caguuacuua uaaauuggau gguguuguuu guacagaaau 5940
ugacccuaag uuggacaauu auuauaagaa agacaauucu uauuucacag agcaaccaau 6000
ugaucuugua ccaaaccaac cauauccaaa cgcaagcuuc gauaauuuua aguuuguaug 6060
ugauaauauc aaauuugcug augauuuaaa ccaguuaacu gguuauaaga aaccugcuuc 6120
aagagagcuu aaaguuacau uuuucccuga cuuaaauggu gauguggugg cuauugauua 6180
uaaacacuac acacccucuu uuaagaaagg agcuaaauug uuacauaaac cuauuguuug 6240
gcauguuaac aaugcaacua auaaagccac guauaaacca aauaccuggu guauacguug 6300
ucuuuggagc acaaaaccag uugaaacauc aaauucguuu gauguacuga agucagagga 6360
cgcgcaggga auggauaauc uugccugcga agaucuaaaa ccagucucug aagaaguagu 6420
ggaaaauccu accauacaga aagacguucu ugaguguaau gugaaaacua ccgaaguugu 6480
aggagacauu auacuuaaac cagcaaauaa uaguuuaaaa auuacagaag agguuggcca 6540
cacagaucua auggcugcuu auguagacaa uucuagucuu acuauuaaga aaccuaauga 6600
auuaucuaga guauuagguu ugaaaacccu ugcuacucau gguuuagcug cuguuaauag 6660
ugucccuugg gauacuauag cuaauuaugc uaagccuuuu cuuaacaaag uuguuaguac 6720
aacuacuaac auaguuacac gguguuuaaa ccguguuugu acuaauuaua ugccuuauuu 6780
cuuuacuuua uugcuacaau uguguacuuu uacuagaagu acaaauucua gaauuaaagc 6840
aucuaugccg acuacuauag caaagaauac uguuaagagu gucgguaaau uuugucuaga 6900
ggcuucauuu aauuauuuga agucaccuaa uuuuucuaaa cugauaaaua uuauaauuug 6960
guuuuuacua uuaaguguuu gccuagguuc uuuaaucuac ucaaccgcug cuuuaggugu 7020
uuuaaugucu aauuuaggca ugccuucuua cuguacuggu uacagagaag gcuauuugaa 7080
cucuacuaau gucacuauug caaccuacug uacugguucu auaccuugua guguuugucu 7140
uagugguuua gauucuuuag acaccuaucc uucuuuagaa acuauacaaa uuaccauuuc 7200
aucuuuuaaa ugggauuuaa cugcuuuugg cuuaguugca gagugguuuu uggcauauau 7260
ucuuuucacu agguuuuucu auguacuugg auuggcugca aucaugcaau uguuuuucag 7320
cuauuuugca guacauuuua uuaguaauuc uuggcuuaug ugguuaauaa uuaaucuugu 7380
acaaauggcc ccgauuucag cuaugguuag aauguacauc uucuuugcau cauuuuauua 7440
uguauggaaa aguuaugugc auguuguaga cgguuguaau ucaucaacuu guaugaugug 7500
uuacaaacgu aauagagcaa caagagucga auguacaacu auuguuaaug guguuagaag 7560
guccuuuuau gucuaugcua auggagguaa aggcuuuugc aaacuacaca auuggaauug 7620
uguuaauugu gauacauucu gugcugguag uacauuuauu agugaugaag uugcgagaga 7680
cuugucacua caguuuaaaa gaccaauaaa uccuacugac cagucuucuu acaucguuga 7740
uaguguuaca gugaagaaug guuccaucca ucuuuacuuu gauaaagcug gucaaaagac 7800
uuaugaaaga cauucucucu cucauuuugu uaacuuagac aaccugagag cuaauaacac 7860
uaaagguuca uugccuauua auguuauagu uuuugauggu aaaucaaaau gugaagaauc 7920
aucugcaaaa ucagcgucug uuuacuacag ucagcuuaug ugucaaccua uacuguuacu 7980
agaucaggca uuagugucug auguugguga uagugcggaa guugcaguua aaauguuuga 8040
ugcuuacguu aauacguuuu caucaacuuu uaacguacca auggaaaaac ucaaaacacu 8100
aguugcaacu gcagaagcug aacuugcaaa gaaugugucc uuagacaaug ucuuaucuac 8160
uuuuauuuca gcagcucggc aaggguuugu ugauucagau guagaaacua aagauguugu 8220
ugaaugucuu aaauugucac aucaaucuga cauagaaguu acuggcgaua guuguaauaa 8280
cuauaugcuc accuauaaca aaguugaaaa caugacaccc cgugaccuug gugcuuguau 8340
ugacuguagu gcgcgucaua uuaaugcgca gguagcaaaa agucacaaca uugcuuugau 8400
auggaacguu aaagauuuca ugucauuguc ugaacaacua cgaaaacaaa uacguagugc 8460
ugcuaaaaag aauaacuuac cuuuuaaguu gacaugugca acuacuagac aaguuguuaa 8520
uguuguaaca acaaagauag cacuuaaggg ugguaaaauu guuaauaauu gguugaagca 8580
guuaauuaaa guuacacuug uguuccuuuu uguugcugcu auuuucuauu uaauaacacc 8640
uguucauguc augucuaaac auacugacuu uucaagugaa aucauaggau acaaggcuau 8700
ugaugguggu gucacucgug acauagcauc uacagauacu uguuuugcua acaaacaugc 8760
ugauuuugac acaugguuua gccagcgugg ugguaguuau acuaaugaca aagcuugccc 8820
auugauugcu gcagucauaa caagagaagu ggguuuuguc gugccugguu ugccuggcac 8880
gauauuacgc acaacuaaug gugacuuuuu gcauuucuua ccuagaguuu uuagugcagu 8940
ugguaacauc uguuacacac caucaaaacu uauagaguac acugacuuug caacaucagc 9000
uuguguuuug gcugcugaau guacaauuuu uaaagaugcu ucugguaagc caguaccaua 9060
uuguuaugau accaauguac uagaagguuc uguugcuuau gaaaguuuac gcccugacac 9120
acguuaugug cucauggaug gcucuauuau ucaauuuccu aacaccuacc uugaagguuc 9180
uguuagagug guaacaacuu uugauucuga guacuguagg cacggcacuu gugaaagauc 9240
agaagcuggu guuuguguau cuacuagugg uagaugggua cuuaacaaug auuauuacag 9300
aucuuuacca ggaguuuucu gugguguaga ugcuguaaau uuacuuacua auauguuuac 9360
accacuaauu caaccuauug gugcuuugga cauaucagca ucuauaguag cuggugguau 9420
uguagcuauc guaguaacau gccuugccua cuauuuuaug agguuuagaa gagcuuuugg 9480
ugaauacagu cauguaguug ccuuuaauac uuuacuauuc cuuaugucau ucacuguacu 9540
cuguuuaaca ccaguuuacu cauucuuacc ugguguuuau ucuguuauuu acuuguacuu 9600
gacauuuuau cuuacuaaug auguuucuuu uuuagcacau auucagugga ugguuauguu 9660
cacaccuuua guaccuuucu ggauaacaau ugcuuauauc auuuguauuu ccacaaagca 9720
uuucuauugg uucuuuagua auuaccuaaa gagacgugua gucuuuaaug guguuuccuu 9780
uaguacuuuu gaagaagcug cgcugugcac cuuuuuguua aauaaagaaa uguaucuaaa 9840
guugcguagu gaugugcuau uaccucuuac gcaauauaau agauacuuag cucuuuauaa 9900
uaaguacaag uauuuuagug gagcaaugga uacaacuagc uacagagaag cugcuuguug 9960
ucaucucgca aaggcucuca augacuucag uaacucaggu ucugauguuc uuuaccaacc 10020
accacaaacc ucuaucaccu cagcuguuuu gcagaguggu uuuagaaaaa uggcauuccc 10080
aucugguaaa guugaggguu guaugguaca aguaacuugu gguacaacua cacuuaacgg 10140
ucuuuggcuu gaugacguag uuuacugucc aagacaugug aucugcaccu cugaagacau 10200
gcuuaacccu aauuaugaag auuuacucau ucguaagucu aaucauaauu ucuugguaca 10260
ggcugguaau guucaacuca ggguuauugg acauucuaug caaaauugug uacuuaagcu 10320
uaagguugau acagccaauc cuaagacacc uaaguauaag uuuguucgca uucaaccagg 10380
acagacuuuu ucaguguuag cuuguuacaa ugguucacca ucugguguuu accaaugugc 10440
uaugaggccc aauuucacua uuaaggguuc auuccuuaau gguucaugug guaguguugg 10500
uuuuaacaua gauuaugacu gugucucuuu uuguuacaug caccauaugg aauuaccaac 10560
uggaguucau gcuggcacag acuuagaagg uaacuuuuau ggaccuuuug uugacaggca 10620
aacagcacaa gcagcuggua cggacacaac uauuacaguu aauguuuuag cuugguugua 10680
cgcugcuguu auaaauggag acaggugguu ucucaaucga uuuaccacaa cucuuaauga 10740
cuuuaaccuu guggcuauga aguacaauua ugaaccucua acacaagacc auguugacau 10800
acuaggaccu cuuucugcuc aaacuggaau ugccguuuua gauaugugug cuucauuaaa 10860
agaauuacug caaaauggua ugaauggacg uaccauauug gguagugcuu uauuagaaga 10920
ugaauuuaca ccuuuugaug uuguuagaca augcucaggu guuacuuucc aaagugcagu 10980
gaaaagaaca aucaagggua cacaccacug guuguuacuc acaauuuuga cuucacuuuu 11040
aguuuuaguc cagaguacuc aauggucuuu guucuuuuuu uuguaugaaa augccuuuuu 11100
accuuuugcu auggguauua uugcuauguc ugcuuuugca augauguuug ucaaacauaa 11160
gcaugcauuu cucuguuugu uuuuguuacc uucucuugcc acuguagcuu auuuuaauau 11220
ggucuauaug ccugcuaguu gggugaugcg uauuaugaca ugguuggaua ugguugauac 11280
uaguuugucu gguuuuaagc uaaaagacug uguuauguau gcaucagcug uaguguuacu 11340
aauccuuaug acagcaagaa cuguguauga ugauggugcu aggagagugu ggacacuuau 11400
gaaugucuug acacucguuu auaaaguuua uuaugguaau gcuuuagauc aagccauuuc 11460
caugugggcu cuuauaaucu cuguuacuuc uaacuacuca gguguaguua caacugucau 11520
guuuuuggcc agagguauug uuuuuaugug uguugaguau ugcccuauuu ucuucauaac 11580
ugguaauaca cuucagugua uaaugcuagu uuauuguuuc uuaggcuauu uuuguacuug 11640
uuacuuuggc cucuuuuguu uacucaaccg cuacuuuaga cugacucuug guguuuauga 11700
uuacuuaguu ucuacacagg aguuuagaua uaugaauuca cagggacuac ucccacccaa 11760
gaauagcaua gaugccuuca aacucaacau uaaauuguug gguguuggug gcaaaccuug 11820
uaucaaagua gccacuguac agucuaaaau gucagaugua aagugcacau caguagucuu 11880
acucucaguu uugcaacaac ucagaguaga aucaucaucu aaauuguggg cucaaugugu 11940
ccaguuacac aaugacauuc ucuuagcuaa agauacuacu gaagccuuug aaaaaauggu 12000
uucacuacuu ucuguuuugc uuuccaugca gggugcugua gacauaaaca agcuuuguga 12060
agaaaugcug gacaacaggg caaccuuaca agcuauagcc ucagaguuua guucccuucc 12120
aucauaugca gcuuuugcua cugcucaaga agcuuaugag caggcuguug cuaaugguga 12180
uucugaaguu guucuuaaaa aguugaagaa gucuuugaau guggcuaaau cugaauuuga 12240
ccgugaugca gccaugcaac guaaguugga aaagauggcu gaucaagcua ugacccaaau 12300
guauaaacag gcuagaucug aggacaagag ggcaaaaguu acuagugcua ugcagacaau 12360
gcuuuucacu augcuuagaa aguuggauaa ugaugcacuc aacaacauua ucaacaaugc 12420
aagagauggu uguguucccu ugaacauaau accucuuaca acagcagcca aacuaauggu 12480
ugucauacca gacuauaaca cauauaaaaa uacgugugau gguacaacau uuacuuaugc 12540
aucagcauug ugggaaaucc aacagguugu agaugcagau aguaaaauug uucaacuuag 12600
ugaaauuagu auggacaauu caccuaauuu agcauggccu cuuauuguaa cagcuuuaag 12660
ggccaauucu gcugucaaau uacagaauaa ugagcuuagu ccuguugcac uacgacagau 12720
gucuugugcu gccgguacua cacaaacugc uugcacugau gacaaugcgu uagcuuacua 12780
caacacaaca aagggaggua gguuuguacu ugcacuguua uccgauuuac aggauuugaa 12840
augggcuaga uucccuaaga gugauggaac ugguacuauc uauacagaac uggaaccacc 12900
uuguagguuu guuacagaca caccuaaagg uccuaaagug aaguauuuau acuuuauuaa 12960
aggauuaaac aaccuaaaua gagguauggu acuugguagu uuagcugcca caguacgucu 13020
acaagcuggu aaugcaacag aagugccugc caauucaacu guauuaucuu ucugugcuuu 13080
ugcuguagau gcugcuaaag cuuacaaaga uuaucuagcu agugggggac aaccaaucac 13140
uaauuguguu aagauguugu guacacacac ugguacuggu caggcaauaa caguuacacc 13200
ggaagccaau auggaucaag aauccuuugg uggugcaucg uguugucugu acugccguug 13260
ccacauagau cauccaaauc cuaaaggauu uugugacuua aaagguaagu auguacaaau 13320
accuacaacu ugugcuaaug acccuguggg uuuuacacuu aaaaacacag ucuguaccgu 13380
cugcgguaug uggaaagguu auggcuguag uugugaucaa cuccgcgaac ccaugcuuca 13440
gucagcugau gcacaaucgu uuuuaaacgg guuugcggug uaagugcagc ccgucuuaca 13500
ccgugcggca caggcacuag uacugauguc guauacaggg cuuuugacau cuacaaugau 13560
aaaguagcug guuuugcuaa auuccuaaaa acuaauuguu gucgcuucca agaaaaggac 13620
gaagaugaca auuuaauuga uucuuacuuu guaguuaaga gacacacuuu cucuaacuac 13680
caacaugaag aaacaauuua uaauuuacuu aaggauuguc cagcuguugc uaaacaugac 13740
uucuuuaagu uuagaauaga cggugacaug guaccacaua uaucacguca acgucuuacu 13800
aaauacacaa uggcagaccu cgucuaugcu uuaaggcauu uugaugaagg uaauugugac 13860
acauuaaaag aaauacuugu cacauacaau uguugugaug augauuauuu caauaaaaag 13920
gacugguaug auuuuguaga aaacccagau auauuacgcg uauacgccaa cuuaggugaa 13980
cguguacgcc aagcuuuguu aaaaacagua caauucugug augccaugcg aaaugcuggu 14040
auuguuggug uacugacauu agauaaucaa gaucucaaug guaacuggua ugauuucggu 14100
gauuucauac aaaccacgcc agguagugga guuccuguug uagauucuua uuauucauug 14160
uuaaugccua uauuaaccuu gaccagggcu uuaacugcag agucacaugu ugacacugac 14220
uuaacaaagc cuuacauuaa gugggauuug uuaaaauaug acuucacgga agagagguua 14280
aaacucuuug accguuauuu uaaauauugg gaucagacau accacccaaa uuguguuaac 14340
uguuuggaug acagaugcau ucugcauugu gcaaacuuua auguuuuauu cucuacagug 14400
uucccaccua caaguuuugg accacuagug agaaaaauau uuguugaugg uguuccauuu 14460
guaguuucaa cuggauacca cuucagagag cuagguguug uacauaauca ggauguaaac 14520
uuacauagcu cuagacuuag uuuuaaggaa uuacuugugu augcugcuga cccugcuaug 14580
cacgcugcuu cugguaaucu auuacuagau aaacgcacua cgugcuuuuc aguagcugca 14640
cuuacuaaca auguugcuuu ucaaacuguc aaacccggua auuuuaacaa agacuucuau 14700
gacuuugcug ugucuaaggg uuucuuuaag gaaggaaguu cuguugaauu aaaacacuuc 14760
uucuuugcuc aggaugguaa ugcugcuauc agcgauuaug acuacuaucg uuauaaucua 14820
ccaacaaugu gugauaucag acaacuacua uuuguaguug aaguuguuga uaaguacuuu 14880
gauuguuacg augguggcug uauuaaugcu aaccaaguca ucgucaacaa ccuagacaaa 14940
ucagcugguu uuccauuuaa uaaauggggu aaggcuagac uuuauuauga uucaaugagu 15000
uaugaggauc aagaugcacu uuucgcauau acaaaacgua augucauccc uacuauaacu 15060
caaaugaauc uuaaguaugc cauuagugca aagaauagag cucgcaccgu agcugguguc 15120
ucuaucugua guacuaugac caauagacag uuucaucaaa aauuauugaa aucaauagcc 15180
gccacuagag gagcuacugu aguaauugga acaagcaaau ucuauggugg uuggcacaac 15240
auguuaaaaa cuguuuauag ugauguagaa aacccucacc uuauggguug ggauuauccu 15300
aaaugugaua gagccaugcc uaacaugcuu agaauuaugg ccucacuugu ucuugcucgc 15360
aaacauacaa cguguuguag cuugucacac cguuucuaua gauuagcuaa ugagugugcu 15420
caaguauuga gugaaauggu cauguguggc gguucacuau auguuaaacc agguggaacc 15480
ucaucaggag augccacaac ugcuuaugcu aauaguguuu uuaacauuug ucaagcuguc 15540
acggccaaug uuaaugcacu uuuaucuacu gaugguaaca aaauugccga uaaguauguc 15600
cgcaauuuac aacacagacu uuaugagugu cucuauagaa auagagaugu ugacacagac 15660
uuugugaaug aguuuuacgc auauuugcgu aaacauuucu caaugaugau acucucugac 15720
gaugcuguug uguguuucaa uagcacuuau gcaucucaag gucuaguggc uagcauaaag 15780
aacuuuaagu caguucuuua uuaucaaaac aauguuuuua ugucugaagc aaaauguugg 15840
acugagacug accuuacuaa aggaccucau gaauuuugcu cucaacauac aaugcuaguu 15900
aaacagggug augauuaugu guaccuuccu uacccagauc caucaagaau ccuaggggcc 15960
ggcuguuuug uagaugauau cguaaaaaca gaugguacac uuaugauuga acgguucgug 16020
ucuuuagcua uagaugcuua cccacuuacu aaacauccua aucaggagua ugcugauguc 16080
uuucauuugu acuuacaaua cauaagaaag cuacaugaug aguuaacagg acacauguua 16140
gacauguauu cuguuaugcu uacuaaugau aacacuucaa gguauuggga accugaguuu 16200
uaugaggcua uguacacacc gcauacaguc uuacaggcug uuggggcuug uguucuuugc 16260
aauucacaga cuucauuaag auguggugcu ugcauacgua gaccauucuu auguuguaaa 16320
ugcuguuacg accaugucau aucaacauca cauaaauuag ucuugucugu uaauccguau 16380
guuugcaaug cuccagguug ugaugucaca gaugugacuc aacuuuacuu aggagguaug 16440
agcuauuauu guaaaucaca uaaaccaccc auuaguuuuc cauugugugc uaauggacaa 16500
guuuuugguu uauauaaaaa uacauguguu gguagcgaua auguuacuga cuuuaaugca 16560
auugcaacau gugacuggac aaaugcuggu gauuacauuu uagcuaacac cuguacugaa 16620
agacucaagc uuuuugcagc agaaacgcuc aaagcuacug aggagacauu uaaacugucu 16680
uaugguauug cuacuguacg ugaagugcug ucugacagag aauuacaucu uucaugggaa 16740
guugguaaac cuagaccacc acuuaaccga aauuaugucu uuacugguua ucguguaacu 16800
aaaaacagua aaguacaaau aggagaguac accuuugaaa aaggugacua uggugaugcu 16860
guuguuuacc gagguacaac aacuuacaaa uuaaauguug gugauuauuu ugugcugaca 16920
ucacauacag uaaugccauu aagugcaccu acacuagugc cacaagagca cuauguuaga 16980
auuacuggcu uauacccaac acucaauauc ucagaugagu uuucuagcaa uguugcaaau 17040
uaucaaaagg uugguaugca aaaguauucu acacuccagg gaccaccugg uacugguaag 17100
agucauuuug cuauuggccu agcucucuac uacccuucug cucgcauagu guauacagcu 17160
ugcucucaug ccgcuguuga ugcacuaugu gagaaggcau uaaaauauuu gccuauagau 17220
aaauguagua gaauuauacc ugcacgugcu cguguagagu guuuugauaa auucaaagug 17280
aauucaacau uagaacagua ugucuuuugu acuguaaaug cauugccuga gacgacagca 17340
gauauaguug ucuuugauga aauuucaaug gccacaaauu augauuugag uguugucaau 17400
gccagauuac gugcuaagca cuauguguac auuggcgacc cugcucaauu accugcacca 17460
cgcacauugc uaacuaaggg cacacuagaa ccagaauauu ucaauucagu guguagacuu 17520
augaaaacua uagguccaga cauguuccuc ggaacuuguc ggcguugucc ugcugaaauu 17580
guugacacug ugagugcuuu gguuuaugau aauaagcuua aagcacauaa agacaaauca 17640
gcucaaugcu uuaaaauguu uuauaagggu guuaucacgc augauguuuc aucugcaauu 17700
aacaggccac aaauaggcgu gguaagagaa uuccuuacac guaacccugc uuggagaaaa 17760
gcugucuuua uuucaccuua uaauucacag aaugcuguag ccucaaagau uuugggacua 17820
ccaacucaaa cuguugauuc aucacagggc ucagaauaug acuaugucau auucacucaa 17880
accacugaaa cagcucacuc uuguaaugua aacagauuua auguugcuau uaccagagca 17940
aaaguaggca uacuuugcau aaugucugau agagaccuuu augacaaguu gcaauuuaca 18000
agucuugaaa uuccacguag gaauguggca acuuuacaag cugaaaaugu aacaggacuc 18060
uuuaaagauu guaguaaggu aaucacuggg uuacauccua cacaggcacc uacacaccuc 18120
aguguugaca cuaaauucaa aacugaaggu uuauguguug acauaccugg cauaccuaag 18180
gacaugaccu auagaagacu caucucuaug auggguuuua aaaugaauua ucaaguuaau 18240
gguuacccua acauguuuau cacccgcgaa gaagcuauaa gacauguacg ugcauggauu 18300
ggcuucgaug ucgaggggug ucaugcuacu agagaagcug uugguaccaa uuuaccuuua 18360
cagcuagguu uuucuacagg uguuaaccua guugcuguac cuacagguua uguugauaca 18420
ccuaauaaua cagauuuuuc cagaguuagu gcuaaaccac cgccuggaga ucaauuuaaa 18480
caccucauac cacuuaugua caaaggacuu ccuuggaaug uagugcguau aaagauugua 18540
caaauguuaa gugacacacu uaaaaaucuc ucugacagag ucguauuugu cuuaugggca 18600
cauggcuuug aguugacauc uaugaaguau uuugugaaaa uaggaccuga gcgcaccugu 18660
ugucuaugug auagacgugc cacaugcuuu uccacugcuu cagacacuua ugccuguugg 18720
caucauucua uuggauuuga uuacgucuau aauccguuua ugauugaugu ucaacaaugg 18780
gguuuuacag guaaccuaca aagcaaccau gaucuguauu gucaagucca ugguaaugca 18840
cauguagcua guugugaugc aaucaugacu aggugucuag cuguccacga gugcuuuguu 18900
aagcguguug acuggacuau ugaauauccu auaauuggug augaacugaa gauuaaugcg 18960
gcuuguagaa agguucaaca caugguuguu aaagcugcau uauuagcaga caaauuccca 19020
guucuucacg acauugguaa cccuaaagcu auuaagugug uaccucaagc ugauguagaa 19080
uggaaguucu augaugcaca gccuuguagu gacaaagcuu auaaaauaga agaauuauuc 19140
uauucuuaug ccacacauuc ugacaaauuc acagauggug uaugccuauu uuggaauugc 19200
aaugucgaua gauauccugc uaauuccauu guuuguagau uugacacuag agugcuaucu 19260
aaccuuaacu ugccugguug ugaugguggc aguuuguaug uaaauaaaca ugcauuccac 19320
acaccagcuu uugauaaaag ugcuuuuguu aauuuaaaac aauuaccauu uuucuauuac 19380
ucugacaguc caugugaguc ucauggaaaa caaguagugu cagauauaga uuauguacca 19440
cuaaagucug cuacguguau aacacguugc aauuuaggug gugcugucug uagacaucau 19500
gcuaaugagu acagauugua ucucgaugcu uauaacauga ugaucucagc uggcuuuagc 19560
uuguggguuu acaaacaauu ugauacuuau aaccucugga acacuuuuac aagacuucag 19620
aguuuagaaa auguggcuuu uaauguugua aauaagggac acuuugaugg acaacagggu 19680
gaaguaccag uuucuaucau uaauaacacu guuuacacaa aaguugaugg uguugaugua 19740
gaauuguuug aaaauaaaac aacauuaccu guuaauguag cauuugagcu uugggcuaag 19800
cgcaacauua aaccaguacc agaggugaaa auacucaaua auuugggugu ggacauugcu 19860
gcuaauacug ugaucuggga cuacaaaaga gaugcuccag cacauauauc uacuauuggu 19920
guuuguucua ugacugacau agccaagaaa ccaacugaaa cgauuugugc accacucacu 19980
gucuuuuuug augguagagu ugauggucaa guagacuuau uuagaaaugc ccguaauggu 20040
guucuuauua cagaagguag uguuaaaggu uuacaaccau cuguaggucc caaacaagcu 20100
agucuuaaug gagucacauu aauuggagaa gccguaaaaa cacaguucaa uuauuauaag 20160
aaaguugaug guguugucca acaauuaccu gaaacuuacu uuacucagag uagaaauuua 20220
caagaauuua aacccaggag ucaaauggaa auugauuucu uagaauuagc uauggaugaa 20280
uucauugaac gguauaaauu agaaggcuau gccuucgaac auaucguuua uggagauuuu 20340
agucauaguc aguuaggugg uuuacaucua cugauuggac uagcuaaacg uuuuaaggaa 20400
ucaccuuuug aauuagaaga uuuuauuccu auggacagua caguuaaaaa cuauuucaua 20460
acagaugcgc aaacagguuc aucuaagugu guguguucug uuauugauuu auuacuugau 20520
gauuuuguug aaauaauaaa aucccaagau uuaucuguag uuucuaaggu ugucaaagug 20580
acuauugacu auacagaaau uucauuuaug cuuuggugua aagauggcca uguagaaaca 20640
uuuuacccaa aauuacaauc uagucaagcg uggcaaccgg guguugcuau gccuaaucuu 20700
uacaaaaugc aaagaaugcu auuagaaaag ugugaccuuc aaaauuaugg ugauagugca 20760
acauuaccua aaggcauaau gaugaauguc gcaaaauaua cucaacugug ucaauauuua 20820
aacacauuaa cauuagcugu acccuauaau augagaguua uacauuuugg ugcugguucu 20880
gauaaaggag uugcaccagg uacagcuguu uuaagacagu gguugccuac ggguacgcug 20940
cuugucgauu cagaucuuaa ugacuuuguc ucugaugcag auucaacuuu gauuggugau 21000
ugugcaacug uacauacagc uaauaaaugg gaucucauua uuagugauau guacgacccu 21060
aagacuaaaa auguuacaaa agaaaaugac ucuaaagagg guuuuuucac uuacauuugu 21120
ggguuuauac aacaaaagcu agcucuugga gguuccgugg cuauaaagau aacagaacau 21180
ucuuggaaug cugaucuuua uaagcucaug ggacacuucg caugguggac agccuuuguu 21240
acuaauguga augcgucauc aucugaagca uuuuuaauug gauguaauua ucuuggcaaa 21300
ccacgcgaac aaauagaugg uuaugucaug caugcaaauu acauauuuug gaggaauaca 21360
aauccaauuc aguugucuuc cuauucuuua uuugacauga guaaauuucc ccuuaaauua 21420
agggguacug cuguuauguc uuuaaaagaa ggucaaauca augauaugau uuuaucucuu 21480
cuuaguaaag guagacuuau aauuagagaa aacaacagag uuguuauuuc uagugauguu 21540
cuuguuaaca acuaaacgaa caauguuugu uuuucuuguu uuauugccac uagucucuag 21600
ucaguguguu aaucuuacaa ccagaacuca auuacccccu gcauacacua auucuuucac 21660
acgugguguu uauuacccug acaaaguuuu cagauccuca guuuuacauu caacucagga 21720
cuuguucuua ccuuucuuuu ccaauguuac uugguuccau gcuauacaug ucucugggac 21780
caaugguacu aagagguuug auaacccugu ccuaccauuu aaugauggug uuuauuuugc 21840
uuccacugag aagucuaaca uaauaagagg cuggauuuuu gguacuacuu uagauucgaa 21900
gacccagucc cuacuuauug uuaauaacgc uacuaauguu guuauuaaag ucugugaauu 21960
ucaauuuugu aaugauccau uuuugggugu uuauuaccac aaaaacaaca aaaguuggau 22020
ggaaagugag uucagaguuu auucuagugc gaauaauugc acuuuugaau augucucuca 22080
gccuuuucuu auggaccuug aaggaaaaca ggguaauuuc aaaaaucuua gggaauuugu 22140
guuuaagaau auugaugguu auuuuaaaau auauucuaag cacacgccua uuaauuuagu 22200
gcgugaucuc ccucaggguu uuucggcuuu agaaccauug guagauuugc caauagguau 22260
uaacaucacu agguuucaaa cuuuacuugc uuuacauaga aguuauuuga cuccugguga 22320
uucuucuuca gguuggacag cuggugcugc agcuuauuau guggguuauc uucaaccuag 22380
gacuuuucua uuaaaauaua augaaaaugg aaccauuaca gaugcuguag acugugcacu 22440
ugacccucuc ucagaaacaa aguguacguu gaaauccuuc acuguagaaa aaggaaucua 22500
ucaaacuucu aacuuuagag uccaaccaac agaaucuauu guuagauuuc cuaauauuac 22560
aaacuugugc ccuuuuggug aaguuuuuaa cgccaccaga uuugcaucug uuuaugcuug 22620
gaacaggaag agaaucagca acuguguugc ugauuauucu guccuauaua auuccgcauc 22680
auuuuccacu uuuaaguguu auggaguguc uccuacuaaa uuaaaugauc ucugcuuuac 22740
uaaugucuau gcagauucau uuguaauuag aggugaugaa gucagacaaa ucgcuccagg 22800
gcaaacugga aagauugcug auuauaauua uaaauuacca gaugauuuua caggcugcgu 22860
uauagcuugg aauucuaaca aucuugauuc uaagguuggu gguaauuaua auuaccugua 22920
uagauuguuu aggaagucua aucucaaacc uuuugagaga gauauuucaa cugaaaucua 22980
ucaggccggu agcacaccuu guaauggugu ugaagguuuu aauuguuacu uuccuuuaca 23040
aucauauggu uuccaaccca cuaauggugu ugguuaccaa ccauacagag uaguaguacu 23100
uucuuuugaa cuucuacaug caccagcaac uguuugugga ccuaaaaagu cuacuaauuu 23160
gguuaaaaac aaauguguca auuucaacuu caaugguuua acaggcacag guguucuuac 23220
ugagucuaac aaaaaguuuc ugccuuucca acaauuuggc agagacauug cugacacuac 23280
ugaugcuguc cgugauccac agacacuuga gauucuugac auuacaccau guucuuuugg 23340
uggugucagu guuauaacac caggaacaaa uacuucuaac cagguugcug uucuuuauca 23400
ggauguuaac ugcacagaag ucccuguugc uauucaugca gaucaacuua cuccuacuug 23460
gcguguuuau ucuacagguu cuaauguuuu ucaaacacgu gcaggcuguu uaauaggggc 23520
ugaacauguc aacaacucau augaguguga cauacccauu ggugcaggua uaugcgcuag 23580
uuaucagacu cagacuaauu cuccucggcg ggcacguagu guagcuaguc aauccaucau 23640
ugccuacacu augucacuug gugcagaaaa uucaguugcu uacucuaaua acucuauugc 23700
cauacccaca aauuuuacua uuaguguuac cacagaaauu cuaccagugu cuaugaccaa 23760
gacaucagua gauuguacaa uguacauuug uggugauuca acugaaugca gcaaucuuuu 23820
guugcaauau ggcaguuuuu guacacaauu aaaccgugcu uuaacuggaa uagcuguuga 23880
acaagacaaa aacacccaag aaguuuuugc acaagucaaa caaauuuaca aaacaccacc 23940
aauuaaagau uuuggugguu uuaauuuuuc acaaauauua ccagauccau caaaaccaag 24000
caagagguca uuuauugaag aucuacuuuu caacaaagug acacuugcag augcuggcuu 24060
caucaaacaa uauggugauu gccuugguga uauugcugcu agagaccuca uuugugcaca 24120
aaaguuuaac ggccuuacug uuuugccacc uuugcucaca gaugaaauga uugcucaaua 24180
cacuucugca cuguuagcgg guacaaucac uucugguugg accuuuggug caggugcugc 24240
auuacaaaua ccauuugcua ugcaaauggc uuauagguuu aaugguauug gaguuacaca 24300
gaauguucuc uaugagaacc aaaaauugau ugccaaccaa uuuaauagug cuauuggcaa 24360
aauucaagac ucacuuucuu ccacagcaag ugcacuugga aaacuucaag auguggucaa 24420
ccaaaaugca caagcuuuaa acacgcuugu uaaacaacuu agcuccaauu uuggugcaau 24480
uucaaguguu uuaaaugaua uccuuucacg ucuugacaaa guugaggcug aagugcaaau 24540
ugauagguug aucacaggca gacuucaaag uuugcagaca uaugugacuc aacaauuaau 24600
uagagcugca gaaaucagag cuucugcuaa ucuugcugcu acuaaaaugu cagagugugu 24660
acuuggacaa ucaaaaagag uugauuuuug uggaaagggc uaucaucuua uguccuuccc 24720
ucagucagca ccucauggug uagucuucuu gcaugugacu uaugucccug cacaagaaaa 24780
gaacuucaca acugcuccug ccauuuguca ugauggaaaa gcacacuuuc cucgugaagg 24840
ugucuuuguu ucaaauggca cacacugguu uguaacacaa aggaauuuuu augaaccaca 24900
aaucauuacu acagacaaca cauuuguguc ugguaacugu gauguuguaa uaggaauugu 24960
caacaacaca guuuaugauc cuuugcaacc ugaauuagac ucauucaagg aggaguuaga 25020
uaaauauuuu aagaaucaua caucaccaga uguugauuua ggugacaucu cuggcauuaa 25080
ugcuucaguu guaaacauuc aaaaagaaau ugaccgccuc aaugagguug ccaagaauuu 25140
aaaugaaucu cucaucgauc uccaagaacu uggaaaguau gagcaguaua uaaaauggcc 25200
augguacauu uggcuagguu uuauagcugg cuugauugcc auaguaaugg ugacaauuau 25260
gcuuugcugu augaccaguu gcuguaguug ucucaagggc uguuguucuu guggauccug 25320
cugcaaauuu gaugaagacg acucugagcc agugcucaaa ggagucaaau uacauuacac 25380
auaaacgaac uuauggauuu guuuaugaga aucuucacaa uuggaacugu aacuuugaag 25440
caaggugaaa ucaaggaugc uacuccuuca gauuuuguuc gcgcuacugc aacgauaccg 25500
auacaagccu cacucccuuu cggauggcuu auuguuggcg uugcacuucu ugcuguuuuu 25560
cagagcgcuu ccaaaaucau aacccucaaa aagagauggc aacuagcacu cuccaagggu 25620
guucacuuug uuugcaacuu gcuguuguug uuuguaacag uuuacucaca ccuuuugcuc 25680
guugcugcug gccuugaagc cccuuuucuc uaucuuuaug cuuuagucua cuucuugcag 25740
aguauaaacu uuguaagaau aauaaugagg cuuuggcuuu gcuggaaaug ccguuccaaa 25800
aacccauuac uuuaugaugc caacuauuuu cuuugcuggc auacuaauug uuacgacuau 25860
uguauaccuu acaauagugu aacuucuuca auugucauua cuucagguga uggcacaaca 25920
aguccuauuu cugaacauga cuaccagauu ggugguuaua cugaaaaaug ggaaucugga 25980
guaaaagacu guguuguauu acacaguuac uucacuucag acuauuacca gcuguacuca 26040
acucaauuga guacagacac ugguguugaa cauguuaccu ucuucaucua caauaaaauu 26100
guugaugagc cugaagaaca uguccaaauu cacacaaucg acgguucauc cggaguuguu 26160
aauccaguaa uggaaccaau uuaugaugaa ccgacgacga cuacuagcgu gccuuuguaa 26220
gcacaagcug augaguacga acuuauguac ucauucguuu cggaagagac agguacguua 26280
auaguuaaua gcguacuucu uuuucuugcu uucgugguau ucuugcuagu uacacuagcc 26340
auccuuacug cgcuucgauu gugugcguac ugcugcaaua uuguuaacgu gagucuugua 26400
aaaccuucuu uuuacguuua cucucguguu aaaaaucuga auucuucuag aguuccugau 26460
cuucuggucu aaacgaacua aauauuauau uaguuuuucu guuuggaacu uuaauuuuag 26520
ccauggcaga uuccaacggu acuauuaccg uugaagagcu uaaaaagcuc cuugaacaau 26580
ggaaccuagu aauagguuuc cuauuccuua cauggauuug ucuucuacaa uuugccuaug 26640
ccaacaggaa uagguuuuug uauauaauua aguuaauuuu ccucuggcug uuauggccag 26700
uaacuuuagc uuguuuugug cuugcugcug uuuacagaau aaauuggauc accgguggaa 26760
uugcuaucgc aauggcuugu cuuguaggcu ugauguggcu cagcuacuuc auugcuucuu 26820
ucagacuguu ugcgcguacg cguuccaugu ggucauucaa uccagaaacu aacauucuuc 26880
ucaacgugcc acuccauggc acuauucuga ccagaccgcu ucuagaaagu gaacucguaa 26940
ucggagcugu gauccuucgu ggacaucuuc guauugcugg acaccaucua ggacgcugug 27000
acaucaagga ccugccuaaa gaaaucacug uugcuacauc acgaacgcuu ucuuauuaca 27060
aauugggagc uucgcagcgu guagcaggug acucagguuu ugcugcauac agucgcuaca 27120
ggauuggcaa cuauaaauua aacacagacc auuccaguag cagugacaau auugcuuugc 27180
uuguacagua agugacaaca gauguuucau cucguugacu uucagguuac uauagcagag 27240
auauuacuaa uuauuaugag gacuuuuaaa guuuccauuu ggaaucuuga uuacaucaua 27300
aaccucauaa uuaaaaauuu aucuaaguca cuaacugaga auaaauauuc ucaauuagau 27360
gaagagcaac caauggagau ugauuaaacg aacaugaaaa uuauucuuuu cuuggcacug 27420
auaacacucg cuacuuguga gcuuuaucac uaccaagagu guguuagagg uacaacagua 27480
cuuuuaaaag aaccuugcuc uucuggaaca uacgagggca auucaccauu ucauccucua 27540
gcugauaaca aauuugcacu gacuugcuuu agcacucaau uugcuuuugc uuguccugac 27600
ggcguaaaac acgucuauca guuacgugcc agaucaguuu caccuaaacu guucaucaga 27660
caagaggaag uucaagaacu uuacucucca auuuuucuua uuguugcggc aauaguguuu 27720
auaacacuuu gcuucacacu caaaagaaag acagaaugau ugaacuuuca uuaauugacu 27780
ucuauuugug cuuuuuagcc uuucugcuau uccuuguuuu aauuaugcuu auuaucuuuu 27840
gguucucacu ugaacugcaa gaucauaaug aaacuuguca cgccuaaacg aacaugaaau 27900
uucuuguuuu cuuaggaauc aucacaacug uagcugcauu ucaccaagaa uguaguuuac 27960
agucauguac ucaacaucaa ccauauguag uugaugaccc guguccuauu cacuucuauu 28020
cuaaauggua uauuagagua ggagcuagaa aaucagcacc uuuaauugaa uugugcgugg 28080
augaggcugg uucuaaauca cccauucagu acaucgauau cgguaauuau acaguuuccu 28140
guuuaccuuu uacaauuaau ugccaggaac cuaaauuggg uagucuugua gugcguuguu 28200
cguucuauga agacuuuuua gaguaucaug acguucgugu uguuuuagau uucaucuaaa 28260
cgaacaaacu aaaaugucug auaauggacc ccaaaaucag cgaaaugcac cccgcauuac 28320
guuuggugga cccucagauu caacuggcag uaaccagaau ggagaacgca guggggcgcg 28380
aucaaaacaa cgucggcccc aagguuuacc caauaauacu gcgucuuggu ucaccgcucu 28440
cacucaacau ggcaaggaag accuuaaauu cccucgagga caaggcguuc caauuaacac 28500
caauagcagu ccagaugacc aaauuggcua cuaccgaaga gcuaccagac gaauucgugg 28560
uggugacggu aaaaugaaag aucucagucc aagaugguau uucuacuacc uaggaacugg 28620
gccagaagcu ggacuucccu auggugcuaa caaagacggc aucauauggg uugcaacuga 28680
gggagccuug aauacaccaa aagaucacau uggcacccgc aauccugcua acaaugcugc 28740
aaucgugcua caacuuccuc aaggaacaac auugccaaaa ggcuucuacg cagaagggag 28800
cagaggcggc agucaagccu cuucucguuc cucaucacgu agucgcaaca guucaagaaa 28860
uucaacucca ggcagcagua ggggaacuuc uccugcuaga auggcuggca auggcgguga 28920
ugcugcucuu gcuuugcugc ugcuugacag auugaaccag cuugagagca aaaugucugg 28980
uaaaggccaa caacaacaag gccaaacugu cacuaagaaa ucugcugcug aggcuucuaa 29040
gaagccucgg caaaaacgua cugccacuaa agcauacaau guaacacaag cuuucggcag 29100
acguggucca gaacaaaccc aaggaaauuu uggggaccag gaacuaauca gacaaggaac 29160
ugauuacaaa cauuggccgc aaauugcaca auuugccccc agcgcuucag cguucuucgg 29220
aaugucgcgc auuggcaugg aagucacacc uucgggaacg ugguugaccu acacaggugc 29280
caucaaauug gaugacaaag auccaaauuu caaagaucaa gucauuuugc ugaauaagca 29340
uauugacgca uacaaaacau ucccaccaac agagccuaaa aaggacaaaa agaagaaggc 29400
ugaugaaacu caagccuuac cgcagagaca gaagaaacag caaacuguga cucuucuucc 29460
ugcugcagau uuggaugauu ucuccaaaca auugcaacaa uccaugagca gugcugacuc 29520
aacucaggcc uaaacucaug cagaccacac aaggcagaug ggcuauauaa acguuuucgc 29580
uuuuccguuu acgauauaua gucuacucuu gugcagaaug aauucucgua acuacauagc 29640
acaaguagau guaguuaacu uuaaucucac auagcaaucu uuaaucagug uguaacauua 29700
gggaggacuu gaaagagcca ccacauuuuc accgaggcca cgcggaguac gaucgagugu 29760
acagugaaca augcuaggga gagcugccua uauggaagag cccuaaugug uaaaauuaau 29820
uuuaguagug cuauccccau gugauuuuaa uagcuucuua ggagaaugac aaaaaaaaaa 29880
aaaaaaaaaa aaaaaaaaaa aaa 29903
<210> 7
<211> 29903
<212> RNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 7
uuuuuuuuuu uuuuuuuuuu uuuuuuuuuu uuugucauuc uccuaagaag cuauuaaaau 60
cacaugggga uagcacuacu aaaauuaauu uuacacauua gggcucuucc auauaggcag 120
cucucccuag cauuguucac uguacacucg aucguacucc gcguggccuc ggugaaaaug 180
ugguggcucu uucaaguccu cccuaauguu acacacugau uaaagauugc uaugugagau 240
uaaaguuaac uacaucuacu ugugcuaugu aguuacgaga auucauucug cacaagagua 300
gacuauauau cguaaacgga aaagcgaaaa cguuuauaua gcccaucugc cuuguguggu 360
cugcaugagu uuaggccuga guugagucag cacugcucau ggauuguugc aauuguuugg 420
agaaaucauc caaaucugca gcaggaagaa gagucacagu uugcuguuuc uucugucucu 480
gcgguaaggc uugaguuuca ucagccuucu ucuuuuuguc cuuuuuaggc ucuguuggug 540
ggaauguuuu guaugcguca auaugcuuau ucagcaaaau gacuugaucu uugaaauuug 600
gaucuuuguc auccaauuug auggcaccug uguaggucaa ccacguuccc gaagguguga 660
cuuccaugcc aaugcgcgac auuccgaaga acgcugaagc gcugggggca aauugugcaa 720
uuugcggcca auguuuguaa ucaguuccuu gucugauuag uuccuggucc ccaaaauuuc 780
cuuggguuug uucuggacca cgucugccga aagcuugugu uacauuguau gcuuuagugg 840
caguacguuu uugccgaggc uucuuagaag ccucagcagc agauuucuua gugacaguuu 900
ggccuuguug uuguuggccu uuaccagaca uuuugcucuc aagcugguuc aaucugucaa 960
gcagcagcaa agcaagagca gcaucaccgc cauugccagc cauucuagca ggagaaguuc 1020
cccuacugcu gccuggaguu gaauuucuug aacuguugcg acuacgugau gaggaacgag 1080
aagaggcuug acugccgccu cugcucccuu cugcguagaa gccuuuuggc aauguuguuc 1140
cuugaggaag uuguagcacg auugcagcau uguuagcagg auugcgggug ccaaugugau 1200
cuuuuggugu auucaaggcu cccucaguug caacccauau gaugccgucu uuguuagcac 1260
cauagggaag uccagcuucu ggcccaguuc cuagguagua gaaauaccau cuuggacuga 1320
gaucuuucau uuuaccguca ccaccacgaa uucgucuggu agcucuucgg uaguagccaa 1380
uuuggucauc uggacugcua uugguguuaa uuggaacgcc uuguccucga gggaauuuaa 1440
ggucuuccuu gccauguuga gugagagcgg ugaaccaaga cgcaguauua uuggguaaac 1500
cuuggggccg acguuguuuu gaucgcgccc cacugcguuc uccauucugg uuacugccag 1560
uugaaucuga ggguccacca aacguaaugc ggggugcauu ucgcugauuu ugggguccau 1620
uaucagacau uuuaguuugu ucguuuagau gaaaucuaaa acaacacgaa cgucaugaua 1680
cucuaaaaag ucuucauaga acgaacaacg cacuacaaga cuacccaauu uagguuccug 1740
gcaauuaauu guaaaaggua aacaggaaac uguauaauua ccgauaucga uguacugaau 1800
gggugauuua gaaccagccu cauccacgca caauucaauu aaaggugcug auuuucuagc 1860
uccuacucua auauaccauu uagaauagaa gugaauagga cacgggucau caacuacaua 1920
ugguugaugu ugaguacaug acuguaaacu acauucuugg ugaaaugcag cuacaguugu 1980
gaugauuccu aagaaaacaa gaaauuucau guucguuuag gcgugacaag uuucauuaug 2040
aucuugcagu ucaagugaga accaaaagau aauaagcaua auuaaaacaa ggaauagcag 2100
aaaggcuaaa aagcacaaau agaagucaau uaaugaaagu ucaaucauuc ugucuuucuu 2160
uugaguguga agcaaagugu uauaaacacu auugccgcaa caauaagaaa aauuggagag 2220
uaaaguucuu gaacuuccuc uugucugaug aacaguuuag gugaaacuga ucuggcacgu 2280
aacugauaga cguguuuuac gccgucagga caagcaaaag caaauugagu gcuaaagcaa 2340
gucagugcaa auuuguuauc agcuagagga ugaaauggug aauugcccuc guauguucca 2400
gaagagcaag guucuuuuaa aaguacuguu guaccucuaa cacacucuug guagugauaa 2460
agcucacaag uagcgagugu uaucagugcc aagaaaagaa uaauuuucau guucguuuaa 2520
ucaaucucca uugguugcuc uucaucuaau ugagaauauu uauucucagu uagugacuua 2580
gauaaauuuu uaauuaugag guuuaugaug uaaucaagau uccaaaugga aacuuuaaaa 2640
guccucauaa uaauuaguaa uaucucugcu auaguaaccu gaaagucaac gagaugaaac 2700
aucuguuguc acuuacugua caagcaaagc aauauuguca cugcuacugg aauggucugu 2760
guuuaauuua uaguugccaa uccuguagcg acuguaugca gcaaaaccug agucaccugc 2820
uacacgcugc gaagcuccca auuuguaaua agaaagcguu cgugauguag caacagugau 2880
uucuuuaggc agguccuuga ugucacagcg uccuagaugg uguccagcaa uacgaagaug 2940
uccacgaagg aucacagcuc cgauuacgag uucacuuucu agaagcgguc uggucagaau 3000
agugccaugg aguggcacgu ugagaagaau guuaguuucu ggauugaaug accacaugga 3060
acgcguacgc gcaaacaguc ugaaagaagc aaugaaguag cugagccaca ucaagccuac 3120
aagacaagcc auugcgauag caauuccacc ggugauccaa uuuauucugu aaacagcagc 3180
aagcacaaaa caagcuaaag uuacuggcca uaacagccag aggaaaauua acuuaauuau 3240
auacaaaaac cuauuccugu uggcauaggc aaauuguaga agacaaaucc auguaaggaa 3300
uaggaaaccu auuacuaggu uccauuguuc aaggagcuuu uuaagcucuu caacgguaau 3360
aguaccguug gaaucugcca uggcuaaaau uaaaguucca aacagaaaaa cuaauauaau 3420
auuuaguucg uuuagaccag aagaucagga acucuagaag aauucagauu uuuaacacga 3480
gaguaaacgu aaaaagaagg uuuuacaaga cucacguuaa caauauugca gcaguacgca 3540
cacaaucgaa gcgcaguaag gauggcuagu guaacuagca agaauaccac gaaagcaaga 3600
aaaagaagua cgcuauuaac uauuaacgua ccugucucuu ccgaaacgaa ugaguacaua 3660
aguucguacu caucagcuug ugcuuacaaa ggcacgcuag uagucgucgu cgguucauca 3720
uaaauugguu ccauuacugg auuaacaacu ccggaugaac cgucgauugu gugaauuugg 3780
acauguucuu caggcucauc aacaauuuua uuguagauga agaagguaac auguucaaca 3840
ccagugucug uacucaauug aguugaguac agcugguaau agucugaagu gaaguaacug 3900
uguaauacaa cacagucuuu uacuccagau ucccauuuuu caguauaacc accaaucugg 3960
uagucauguu cagaaauagg acuuguugug ccaucaccug aaguaaugac aauugaagaa 4020
guuacacuau uguaagguau acaauagucg uaacaauuag uaugccagca aagaaaauag 4080
uuggcaucau aaaguaaugg guuuuuggaa cggcauuucc agcaaagcca aagccucauu 4140
auuauucuua caaaguuuau acucugcaag aaguagacua aagcauaaag auagagaaaa 4200
ggggcuucaa ggccagcagc aacgagcaaa aggugugagu aaacuguuac aaacaacaac 4260
agcaaguugc aaacaaagug aacacccuug gagagugcua guugccaucu cuuuuugagg 4320
guuaugauuu uggaagcgcu cugaaaaaca gcaagaagug caacgccaac aauaagccau 4380
ccgaaaggga gugaggcuug uaucgguauc guugcaguag cgcgaacaaa aucugaagga 4440
guagcauccu ugauuucacc uugcuucaaa guuacaguuc caauugugaa gauucucaua 4500
aacaaaucca uaaguucguu uauguguaau guaauuugac uccuuugagc acuggcucag 4560
agucgucuuc aucaaauuug cagcaggauc cacaagaaca acagcccuug agacaacuac 4620
agcaacuggu cauacagcaa agcauaauug ucaccauuac uauggcaauc aagccagcua 4680
uaaaaccuag ccaaauguac cauggccauu uuauauacug cucauacuuu ccaaguucuu 4740
ggagaucgau gagagauuca uuuaaauucu uggcaaccuc auugaggcgg ucaauuucuu 4800
uuugaauguu uacaacugaa gcauuaaugc cagagauguc accuaaauca acaucuggug 4860
auguaugauu cuuaaaauau uuaucuaacu ccuccuugaa ugagucuaau ucagguugca 4920
aaggaucaua aacuguguug uugacaauuc cuauuacaac aucacaguua ccagacacaa 4980
auguguuguc uguaguaaug auuugugguu cauaaaaauu ccuuuguguu acaaaccagu 5040
gugugccauu ugaaacaaag acaccuucac gaggaaagug ugcuuuucca ucaugacaaa 5100
uggcaggagc aguugugaag uucuuuucuu gugcagggac auaagucaca ugcaagaaga 5160
cuacaccaug aggugcugac ugagggaagg acauaagaug auagcccuuu ccacaaaaau 5220
caacucuuuu ugauugucca aguacacacu cugacauuuu aguagcagca agauuagcag 5280
aagcucugau uucugcagcu cuaauuaauu guugagucac auaugucugc aaacuuugaa 5340
gucugccugu gaucaaccua ucaauuugca cuucagccuc aacuuuguca agacgugaaa 5400
ggauaucauu uaaaacacuu gaaauugcac caaaauugga gcuaaguugu uuaacaagcg 5460
uguuuaaagc uugugcauuu ugguugacca caucuugaag uuuuccaagu gcacuugcug 5520
uggaagaaag ugagucuuga auuuugccaa uagcacuauu aaauugguug gcaaucaauu 5580
uuugguucuc auagagaaca uucuguguaa cuccaauacc auuaaaccua uaagccauuu 5640
gcauagcaaa ugguauuugu aaugcagcac cugcaccaaa gguccaacca gaagugauug 5700
uacccgcuaa cagugcagaa guguauugag caaucauuuc aucugugagc aaagguggca 5760
aaacaguaag gccguuaaac uuuugugcac aaaugagguc ucuagcagca auaucaccaa 5820
ggcaaucacc auauuguuug augaagccag caucugcaag ugucacuuug uugaaaagua 5880
gaucuucaau aaaugaccuc uugcuugguu uugauggauc ugguaauauu ugugaaaaau 5940
uaaaaccacc aaaaucuuua auugguggug uuuuguaaau uuguuugacu ugugcaaaaa 6000
cuucuugggu guuuuugucu uguucaacag cuauuccagu uaaagcacgg uuuaauugug 6060
uacaaaaacu gccauauugc aacaaaagau ugcugcauuc aguugaauca ccacaaaugu 6120
acauuguaca aucuacugau gucuugguca uagacacugg uagaauuucu gugguaacac 6180
uaauaguaaa auuugugggu auggcaauag aguuauuaga guaagcaacu gaauuuucug 6240
caccaaguga cauaguguag gcaaugaugg auugacuagc uacacuacgu gcccgccgag 6300
gagaauuagu cugagucuga uaacuagcgc auauaccugc accaaugggu augucacacu 6360
cauaugaguu guugacaugu ucagccccua uuaaacagcc ugcacguguu ugaaaaacau 6420
uagaaccugu agaauaaaca cgccaaguag gaguaaguug aucugcauga auagcaacag 6480
ggacuucugu gcaguuaaca uccugauaaa gaacagcaac cugguuagaa guauuuguuc 6540
cugguguuau aacacugaca ccaccaaaag aacauggugu aaugucaaga aucucaagug 6600
ucuguggauc acggacagca ucaguagugu cagcaauguc ucugccaaau uguuggaaag 6660
gcagaaacuu uuuguuagac ucaguaagaa caccugugcc uguuaaacca uugaaguuga 6720
aauugacaca uuuguuuuua accaaauuag uagacuuuuu agguccacaa acaguugcug 6780
gugcauguag aaguucaaaa gaaaguacua cuacucugua ugguugguaa ccaacaccau 6840
uaguggguug gaaaccauau gauuguaaag gaaaguaaca auuaaaaccu ucaacaccau 6900
uacaaggugu gcuaccggcc ugauagauuu caguugaaau aucucucuca aaagguuuga 6960
gauuagacuu ccuaaacaau cuauacaggu aauuauaauu accaccaacc uuagaaucaa 7020
gauuguuaga auuccaagcu auaacgcagc cuguaaaauc aucugguaau uuauaauuau 7080
aaucagcaau cuuuccaguu ugcccuggag cgauuugucu gacuucauca ccucuaauua 7140
caaaugaauc ugcauagaca uuaguaaagc agagaucauu uaauuuagua ggagacacuc 7200
cauaacacuu aaaaguggaa aaugaugcgg aauuauauag gacagaauaa ucagcaacac 7260
aguugcugau ucucuuccug uuccaagcau aaacagaugc aaaucuggug gcguuaaaaa 7320
cuucaccaaa agggcacaag uuuguaauau uaggaaaucu aacaauagau ucuguugguu 7380
ggacucuaaa guuagaaguu ugauagauuc cuuuuucuac agugaaggau uucaacguac 7440
acuuuguuuc ugagagaggg ucaagugcac agucuacagc aucuguaaug guuccauuuu 7500
cauuauauuu uaauagaaaa guccuagguu gaagauaacc cacauaauaa gcugcagcac 7560
cagcugucca accugaagaa gaaucaccag gagucaaaua acuucuaugu aaagcaagua 7620
aaguuugaaa ccuagugaug uuaauaccua uuggcaaauc uaccaauggu ucuaaagccg 7680
aaaaacccug agggagauca cgcacuaaau uaauaggcgu gugcuuagaa uauauuuuaa 7740
aauaaccauc aauauucuua aacacaaauu cccuaagauu uuugaaauua cccuguuuuc 7800
cuucaagguc cauaagaaaa ggcugagaga cauauucaaa agugcaauua uucgcacuag 7860
aauaaacucu gaacucacuu uccauccaac uuuuguuguu uuugugguaa uaaacaccca 7920
aaaauggauc auuacaaaau ugaaauucac agacuuuaau aacaacauua guagcguuau 7980
uaacaauaag uagggacugg gucuucgaau cuaaaguagu accaaaaauc cagccucuua 8040
uuauguuaga cuucucagug gaagcaaaau aaacaccauc auuaaauggu aggacagggu 8100
uaucaaaccu cuuaguacca uuggucccag agacauguau agcauggaac caaguaacau 8160
uggaaaagaa agguaagaac aaguccugag uugaauguaa aacugaggau cugaaaacuu 8220
ugucagggua auaaacacca cgugugaaag aauuagugua ugcagggggu aauugaguuc 8280
ugguuguaag auuaacacac ugacuagaga cuaguggcaa uaaaacaaga aaaacaaaca 8340
uuguucguuu aguuguuaac aagaacauca cuagaaauaa caacucuguu guuuucucua 8400
auuauaaguc uaccuuuacu aagaagagau aaaaucauau cauugauuug accuucuuuu 8460
aaagacauaa cagcaguacc ccuuaauuua aggggaaauu uacucauguc aaauaaagaa 8520
uaggaagaca acugaauugg auuuguauuc cuccaaaaua uguaauuugc augcaugaca 8580
uaaccaucua uuuguucgcg ugguuugcca agauaauuac auccaauuaa aaaugcuuca 8640
gaugaugacg cauucacauu aguaacaaag gcuguccacc augcgaagug ucccaugagc 8700
uuauaaagau cagcauucca agaauguucu guuaucuuua uagccacgga accuccaaga 8760
gcuagcuuuu guuguauaaa cccacaaaug uaagugaaaa aacccucuuu agagucauuu 8820
ucuuuuguaa cauuuuuagu cuuagggucg uacauaucac uaauaaugag aucccauuua 8880
uuagcuguau guacaguugc acaaucacca aucaaaguug aaucugcauc agagacaaag 8940
ucauuaagau cugaaucgac aagcagcgua cccguaggca accacugucu uaaaacagcu 9000
guaccuggug caacuccuuu aucagaacca gcaccaaaau guauaacucu cauauuauag 9060
gguacagcua auguuaaugu guuuaaauau ugacacaguu gaguauauuu ugcgacauuc 9120
aucauuaugc cuuuagguaa uguugcacua ucaccauaau uuugaagguc acacuuuucu 9180
aauagcauuc uuugcauuuu guaaagauua ggcauagcaa cacccgguug ccacgcuuga 9240
cuagauugua auuuugggua aaauguuucu acauggccau cuuuacacca aagcauaaau 9300
gaaauuucug uauagucaau agucacuuug acaaccuuag aaacuacaga uaaaucuugg 9360
gauuuuauua uuucaacaaa aucaucaagu aauaaaucaa uaacagaaca cacacacuua 9420
gaugaaccug uuugcgcauc uguuaugaaa uaguuuuuaa cuguacuguc cauaggaaua 9480
aaaucuucua auucaaaagg ugauuccuua aaacguuuag cuaguccaau caguagaugu 9540
aaaccaccua acugacuaug acuaaaaucu ccauaaacga uauguucgaa ggcauagccu 9600
ucuaauuuau accguucaau gaauucaucc auagcuaauu cuaagaaauc aauuuccauu 9660
ugacuccugg guuuaaauuc uuguaaauuu cuacucugag uaaaguaagu uucagguaau 9720
uguuggacaa caccaucaac uuucuuauaa uaauugaacu guguuuuuac ggcuucucca 9780
auuaauguga cuccauuaag acuagcuugu uugggaccua cagaugguug uaaaccuuua 9840
acacuaccuu cuguaauaag aacaccauua cgggcauuuc uaaauaaguc uacuugacca 9900
ucaacucuac caucaaaaaa gacagugagu ggugcacaaa ucguuucagu ugguuucuug 9960
gcuaugucag ucauagaaca aacaccaaua guagauauau gugcuggagc aucucuuuug 10020
uagucccaga ucacaguauu agcagcaaug uccacaccca aauuauugag uauuuucacc 10080
ucugguacug guuuaauguu gcgcuuagcc caaagcucaa augcuacauu aacagguaau 10140
guuguuuuau uuucaaacaa uucuacauca acaccaucaa cuuuugugua aacaguguua 10200
uuaaugauag aaacugguac uucacccugu uguccaucaa agugucccuu auuuacaaca 10260
uuaaaagcca cauuuucuaa acucugaagu cuuguaaaag uguuccagag guuauaagua 10320
ucaaauuguu uguaaaccca caagcuaaag ccagcugaga ucaucauguu auaagcaucg 10380
agauacaauc uguacucauu agcaugaugu cuacagacag caccaccuaa auugcaacgu 10440
guuauacacg uagcagacuu uagugguaca uaaucuauau cugacacuac uuguuuucca 10500
ugagacucac auggacuguc agaguaauag aaaaauggua auuguuuuaa auuaacaaaa 10560
gcacuuuuau caaaagcugg uguguggaau gcauguuuau uuacauacaa acugccacca 10620
ucacaaccag gcaaguuaag guuagauagc acucuagugu caaaucuaca aacaauggaa 10680
uuagcaggau aucuaucgac auugcaauuc caaaauaggc auacaccauc ugugaauuug 10740
ucagaaugug uggcauaaga auagaauaau ucuucuauuu uauaagcuuu gucacuacaa 10800
ggcugugcau cauagaacuu ccauucuaca ucagcuugag guacacacuu aauagcuuua 10860
ggguuaccaa ugucgugaag aacugggaau uugucugcua auaaugcagc uuuaacaacc 10920
auguguugaa ccuuucuaca agccgcauua aucuucaguu caucaccaau uauaggauau 10980
ucaauagucc agucaacacg cuuaacaaag cacucgugga cagcuagaca ccuagucaug 11040
auugcaucac aacuagcuac augugcauua ccauggacuu gacaauacag aucaugguug 11100
cuuuguaggu uaccuguaaa accccauugu ugaacaucaa ucauaaacgg auuauagacg 11160
uaaucaaauc caauagaaug augccaacag gcauaagugu cugaagcagu ggaaaagcau 11220
guggcacguc uaucacauag acaacaggug cgcucagguc cuauuuucac aaaauacuuc 11280
auagauguca acucaaagcc augugcccau aagacaaaua cgacucuguc agagagauuu 11340
uuaagugugu cacuuaacau uuguacaauc uuuauacgca cuacauucca aggaaguccu 11400
uuguacauaa gugguaugag guguuuaaau ugaucuccag gcggugguuu agcacuaacu 11460
cuggaaaaau cuguauuauu agguguauca acauaaccug uagguacagc aacuagguua 11520
acaccuguag aaaaaccuag cuguaaaggu aaauugguac caacagcuuc ucuaguagca 11580
ugacaccccu cgacaucgaa gccaauccau gcacguacau gucuuauagc uucuucgcgg 11640
gugauaaaca uguuagggua accauuaacu ugauaauuca uuuuaaaacc caucauagag 11700
augagucuuc uauaggucau guccuuaggu augccaggua ugucaacaca uaaaccuuca 11760
guuuugaauu uagugucaac acugaggugu guaggugccu guguaggaug uaacccagug 11820
auuaccuuac uacaaucuuu aaagaguccu guuacauuuu cagcuuguaa aguugccaca 11880
uuccuacgug gaauuucaag acuuguaaau ugcaacuugu cauaaagguc ucuaucagac 11940
auuaugcaaa guaugccuac uuuugcucug guaauagcaa cauuaaaucu guuuacauua 12000
caagagugag cuguuucagu gguuugagug aauaugacau agucauauuc ugagcccugu 12060
gaugaaucaa caguuugagu ugguaguccc aaaaucuuug aggcuacagc auucugugaa 12120
uuauaaggug aaauaaagac agcuuuucuc caagcagggu uacguguaag gaauucucuu 12180
accacgccua uuuguggccu guuaauugca gaugaaacau caugcgugau aacacccuua 12240
uaaaacauuu uaaagcauug agcugauuug ucuuuaugug cuuuaagcuu auuaucauaa 12300
accaaagcac ucacaguguc aacaauuuca gcaggacaac gccgacaagu uccgaggaac 12360
augucuggac cuauaguuuu cauaagucua cacacugaau ugaaauauuc ugguucuagu 12420
gugcccuuag uuagcaaugu gcguggugca gguaauugag cagggucgcc aauguacaca 12480
uagugcuuag cacguaaucu ggcauugaca acacucaaau cauaauuugu ggccauugaa 12540
auuucaucaa agacaacuau aucugcuguc gucucaggca augcauuuac aguacaaaag 12600
acauacuguu cuaauguuga auucacuuug aauuuaucaa aacacucuac acgagcacgu 12660
gcagguauaa uucuacuaca uuuaucuaua ggcaaauauu uuaaugccuu cucacauagu 12720
gcaucaacag cggcaugaga gcaagcugua uacacuaugc gagcagaagg guaguagaga 12780
gcuaggccaa uagcaaaaug acucuuacca guaccaggug gucccuggag uguagaauac 12840
uuuugcauac caaccuuuug auaauuugca acauugcuag aaaacucauc ugagauauug 12900
aguguugggu auaagccagu aauucuaaca uagugcucuu guggcacuag uguaggugca 12960
cuuaauggca uuacuguaug ugaugucagc acaaaauaau caccaacauu uaauuuguaa 13020
guuguuguac cucgguaaac aacagcauca ccauagucac cuuuuucaaa gguguacucu 13080
ccuauuugua cuuuacuguu uuuaguuaca cgauaaccag uaaagacaua auuucgguua 13140
aguggugguc uagguuuacc aacuucccau gaaagaugua auucucuguc agacagcacu 13200
ucacguacag uagcaauacc auaagacagu uuaaaugucu ccucaguagc uuugagcguu 13260
ucugcugcaa aaagcuugag ucuuucagua cagguguuag cuaaaaugua aucaccagca 13320
uuuguccagu cacauguugc aauugcauua aagucaguaa cauuaucgcu accaacacau 13380
guauuuuuau auaaaccaaa aacuugucca uuagcacaca auggaaaacu aauggguggu 13440
uuaugugauu uacaauaaua gcucauaccu ccuaaguaaa guugagucac aucugugaca 13500
ucacaaccug gagcauugca aacauacgga uuaacagaca agacuaauuu augugauguu 13560
gauaugacau ggucguaaca gcauuuacaa cauaagaaug gucuacguau gcaagcacca 13620
caucuuaaug aagucuguga auugcaaaga acacaagccc caacagccug uaagacugua 13680
ugcggugugu acauagccuc auaaaacuca gguucccaau accuugaagu guuaucauua 13740
guaagcauaa cagaauacau gucuaacaug uguccuguua acucaucaug uagcuuucuu 13800
auguauugua aguacaaaug aaagacauca gcauacuccu gauuaggaug uuuaguaagu 13860
ggguaagcau cuauagcuaa agacacgaac cguucaauca uaaguguacc aucuguuuuu 13920
acgauaucau cuacaaaaca gccggccccu aggauucuug auggaucugg guaaggaagg 13980
uacacauaau caucacccug uuuaacuagc auuguauguu gagagcaaaa uucaugaggu 14040
ccuuuaguaa ggucagucuc aguccaacau uuugcuucag acauaaaaac auuguuuuga 14100
uaauaaagaa cugacuuaaa guucuuuaug cuagccacua gaccuugaga ugcauaagug 14160
cuauugaaac acacaacagc aucgucagag aguaucauca uugagaaaug uuuacgcaaa 14220
uaugcguaaa acucauucac aaagucugug ucaacaucuc uauuucuaua gagacacuca 14280
uaaagucugu guuguaaauu gcggacauac uuaucggcaa uuuuguuacc aucaguagau 14340
aaaagugcau uaacauuggc cgugacagcu ugacaaaugu uaaaaacacu auuagcauaa 14400
gcaguugugg caucuccuga ugagguucca ccugguuuaa cauauaguga accgccacac 14460
augaccauuu cacucaauac uugagcacac ucauuagcua aucuauagaa acggugugac 14520
aagcuacaac acguuguaug uuugcgagca agaacaagug aggccauaau ucuaagcaug 14580
uuaggcaugg cucuaucaca uuuaggauaa ucccaaccca uaaggugagg guuuucuaca 14640
ucacuauaaa caguuuuuaa cauguugugc caaccaccau agaauuugcu uguuccaauu 14700
acuacaguag cuccucuagu ggcggcuauu gauuucaaua auuuuugaug aaacugucua 14760
uuggucauag uacuacagau agagacacca gcuacggugc gagcucuauu cuuugcacua 14820
auggcauacu uaagauucau uugaguuaua guagggauga cauuacguuu uguauaugcg 14880
aaaagugcau cuugauccuc auaacucauu gaaucauaau aaagucuagc cuuaccccau 14940
uuauuaaaug gaaaaccagc ugauuugucu agguuguuga cgaugacuug guuagcauua 15000
auacagccac caucguaaca aucaaaguac uuaucaacaa cuucaacuac aaauaguagu 15060
ugucugauau cacacauugu ugguagauua uaacgauagu agucauaauc gcugauagca 15120
gcauuaccau ccugagcaaa gaagaagugu uuuaauucaa cagaacuucc uuccuuaaag 15180
aaacccuuag acacagcaaa gucauagaag ucuuuguuaa aauuaccggg uuugacaguu 15240
ugaaaagcaa cauuguuagu aagugcagcu acugaaaagc acguagugcg uuuaucuagu 15300
aauagauuac cagaagcagc gugcauagca gggucagcag cauacacaag uaauuccuua 15360
aaacuaaguc uagagcuaug uaaguuuaca uccugauuau guacaacacc uagcucucug 15420
aagugguauc caguugaaac uacaaaugga acaccaucaa caaauauuuu ucucacuagu 15480
gguccaaaac uuguaggugg gaacacugua gagaauaaaa cauuaaaguu ugcacaaugc 15540
agaaugcauc ugucauccaa acaguuaaca caauuugggu gguaugucug aucccaauau 15600
uuaaaauaac ggucaaagag uuuuaaccuc ucuuccguga agucauauuu uaacaaaucc 15660
cacuuaaugu aaggcuuugu uaagucagug ucaacaugug acucugcagu uaaagcccug 15720
gucaagguua auauaggcau uaacaaugaa uaauaagaau cuacaacagg aacuccacua 15780
ccuggcgugg uuuguaugaa aucaccgaaa ucauaccagu uaccauugag aucuugauua 15840
ucuaauguca guacaccaac aauaccagca uuucgcaugg caucacagaa uuguacuguu 15900
uuuaacaaag cuuggcguac acguucaccu aaguuggcgu auacgcguaa uauaucuggg 15960
uuuucuacaa aaucauacca guccuuuuua uugaaauaau caucaucaca acaauuguau 16020
gugacaagua uuucuuuuaa ugugucacaa uuaccuucau caaaaugccu uaaagcauag 16080
acgaggucug ccauugugua uuuaguaaga cguugacgug auauaugugg uaccauguca 16140
ccgucuauuc uaaacuuaaa gaagucaugu uuagcaacag cuggacaauc cuuaaguaaa 16200
uuauaaauug uuucuucaug uugguaguua gagaaagugu gucucuuaac uacaaaguaa 16260
gaaucaauua aauugucauc uucguccuuu ucuuggaagc gacaacaauu aguuuuuagg 16320
aauuuagcaa aaccagcuac uuuaucauug uagaugucaa aagcccugua uacgacauca 16380
guacuagugc cugugccgca cgguguaaga cgggcugcac uuacaccgca aacccguuua 16440
aaaacgauug ugcaucagcu gacugaagca uggguucgcg gaguugauca caacuacagc 16500
cauaaccuuu ccacauaccg cagacgguac agacuguguu uuuaagugua aaacccacag 16560
ggucauuagc acaaguugua gguauuugua cauacuuacc uuuuaaguca caaaauccuu 16620
uaggauuugg augaucuaug uggcaacggc aguacagaca acacgaugca ccaccaaagg 16680
auucuugauc cauauuggcu uccgguguaa cuguuauugc cugaccagua ccagugugug 16740
uacacaacau cuuaacacaa uuagugauug guuguccccc acuagcuaga uaaucuuugu 16800
aagcuuuagc agcaucuaca gcaaaagcac agaaagauaa uacaguugaa uuggcaggca 16860
cuucuguugc auuaccagcu uguagacgua cuguggcagc uaaacuacca aguaccauac 16920
cucuauuuag guuguuuaau ccuuuaauaa aguauaaaua cuucacuuua ggaccuuuag 16980
gugugucugu aacaaaccua caaggugguu ccaguucugu auagauagua ccaguuccau 17040
cacucuuagg gaaucuagcc cauuucaaau ccuguaaauc ggauaacagu gcaaguacaa 17100
accuaccucc cuuuguugug uuguaguaag cuaacgcauu gucaucagug caagcaguuu 17160
guguaguacc ggcagcacaa gacaucuguc guagugcaac aggacuaagc ucauuauucu 17220
guaauuugac agcagaauug gcccuuaaag cuguuacaau aagaggccau gcuaaauuag 17280
gugaauuguc cauacuaauu ucacuaaguu gaacaauuuu acuaucugca ucuacaaccu 17340
guuggauuuc ccacaaugcu gaugcauaag uaaauguugu accaucacac guauuuuuau 17400
auguguuaua gucugguaug acaaccauua guuuggcugc uguuguaaga gguauuaugu 17460
ucaagggaac acaaccaucu cuugcauugu ugauaauguu guugagugca ucauuaucca 17520
acuuucuaag cauagugaaa agcauugucu gcauagcacu aguaacuuuu gcccucuugu 17580
ccucagaucu agccuguuua uacauuuggg ucauagcuug aucagccauc uuuuccaacu 17640
uacguugcau ggcugcauca cggucaaauu cagauuuagc cacauucaaa gacuucuuca 17700
acuuuuuaag aacaacuuca gaaucaccau uagcaacagc cugcucauaa gcuucuugag 17760
caguagcaaa agcugcauau gauggaaggg aacuaaacuc ugaggcuaua gcuuguaagg 17820
uugcccuguu guccagcauu ucuucacaaa gcuuguuuau gucuacagca cccugcaugg 17880
aaagcaaaac agaaaguagu gaaaccauuu uuucaaaggc uucaguagua ucuuuagcua 17940
agagaauguc auuguguaac uggacacauu gagcccacaa uuuagaugau gauucuacuc 18000
ugaguuguug caaaacugag aguaagacua cugaugugca cuuuacaucu gacauuuuag 18060
acuguacagu ggcuacuuug auacaagguu ugccaccaac acccaacaau uuaauguuga 18120
guuugaaggc aucuaugcua uucuugggug ggaguagucc cugugaauuc auauaucuaa 18180
acuccugugu agaaacuaag uaaucauaaa caccaagagu cagucuaaag uagcgguuga 18240
guaaacaaaa gaggccaaag uaacaaguac aaaaauagcc uaagaaacaa uaaacuagca 18300
uuauacacug aaguguauua ccaguuauga agaaaauagg gcaauacuca acacacauaa 18360
aaacaauacc ucuggccaaa aacaugacag uuguaacuac accugaguag uuagaaguaa 18420
cagagauuau aagagcccac auggaaaugg cuugaucuaa agcauuacca uaauaaacuu 18480
uauaaacgag ugucaagaca uucauaagug uccacacucu ccuagcacca ucaucauaca 18540
caguucuugc ugucauaagg auuaguaaca cuacagcuga ugcauacaua acacagucuu 18600
uuagcuuaaa accagacaaa cuaguaucaa ccauauccaa ccaugucaua auacgcauca 18660
cccaacuagc aggcauauag accauauuaa aauaagcuac aguggcaaga gaagguaaca 18720
aaaacaaaca gagaaaugca ugcuuauguu ugacaaacau cauugcaaaa gcagacauag 18780
caauaauacc cauagcaaaa gguaaaaagg cauuuucaua caaaaaaaag aacaaagacc 18840
auugaguacu cuggacuaaa acuaaaagug aagucaaaau ugugaguaac aaccaguggu 18900
guguacccuu gauuguucuu uucacugcac uuuggaaagu aacaccugag cauugucuaa 18960
caacaucaaa agguguaaau ucaucuucua auaaagcacu acccaauaug guacguccau 19020
ucauaccauu uugcaguaau ucuuuuaaug aagcacacau aucuaaaacg gcaauuccag 19080
uuugagcaga aagagguccu aguaugucaa cauggucuug uguuagaggu ucauaauugu 19140
acuucauagc cacaagguua aagucauuaa gaguuguggu aaaucgauug agaaaccacc 19200
ugucuccauu uauaacagca gcguacaacc aagcuaaaac auuaacugua auaguugugu 19260
ccguaccagc ugcuugugcu guuugccugu caacaaaagg uccauaaaag uuaccuucua 19320
agucugugcc agcaugaacu ccaguuggua auuccauaug gugcauguaa caaaaagaga 19380
cacagucaua aucuauguua aaaccaacac uaccacauga accauuaagg aaugaacccu 19440
uaauagugaa auugggccuc auagcacauu gguaaacacc agauggugaa ccauuguaac 19500
aagcuaacac ugaaaaaguc uguccugguu gaaugcgaac aaacuuauac uuaggugucu 19560
uaggauuggc uguaucaacc uuaagcuuaa guacacaauu uugcauagaa uguccaauaa 19620
cccugaguug aacauuacca gccuguacca agaaauuaug auuagacuua cgaaugagua 19680
aaucuucaua auuaggguua agcaugucuu cagaggugca gaucacaugu cuuggacagu 19740
aaacuacguc aucaagccaa agaccguuaa guguaguugu accacaaguu acuuguacca 19800
uacaacccuc aacuuuacca gaugggaaug ccauuuuucu aaaaccacuc ugcaaaacag 19860
cugaggugau agagguuugu ggugguuggu aaagaacauc agaaccugag uuacugaagu 19920
cauugagagc cuuugcgaga ugacaacaag cagcuucucu guagcuaguu guauccauug 19980
cuccacuaaa auacuuguac uuauuauaaa gagcuaagua ucuauuauau ugcguaagag 20040
guaauagcac aucacuacgc aacuuuagau acauuucuuu auuuaacaaa aaggugcaca 20100
gcgcagcuuc uucaaaagua cuaaaggaaa caccauuaaa gacuacacgu cucuuuaggu 20160
aauuacuaaa gaaccaauag aaaugcuuug uggaaauaca aaugauauaa gcaauuguua 20220
uccagaaagg uacuaaaggu gugaacauaa ccauccacug aauaugugcu aaaaaagaaa 20280
caucauuagu aagauaaaau gucaaguaca aguaaauaac agaauaaaca ccagguaaga 20340
augaguaaac ugguguuaaa cagaguacag ugaaugacau aaggaauagu aaaguauuaa 20400
aggcaacuac augacuguau ucaccaaaag cucuucuaaa ccucauaaaa uaguaggcaa 20460
ggcauguuac uacgauagcu acaauaccac cagcuacuau agaugcugau auguccaaag 20520
caccaauagg uugaauuagu gguguaaaca uauuaguaag uaaauuuaca gcaucuacac 20580
cacagaaaac uccugguaaa gaucuguaau aaucauuguu aaguacccau cuaccacuag 20640
uagauacaca aacaccagcu ucugaucuuu cacaagugcc gugccuacag uacucagaau 20700
caaaaguugu uaccacucua acagaaccuu caagguaggu guuaggaaau ugaauaauag 20760
agccauccau gagcacauaa cgugugucag ggcguaaacu uucauaagca acagaaccuu 20820
cuaguacauu gguaucauaa caauauggua cuggcuuacc agaagcaucu uuaaaaauug 20880
uacauucagc agccaaaaca caagcugaug uugcaaaguc aguguacucu auaaguuuug 20940
auggugugua acagauguua ccaacugcac uaaaaacucu agguaagaaa ugcaaaaagu 21000
caccauuagu ugugcguaau aucgugccag gcaaaccagg cacgacaaaa cccacuucuc 21060
uuguuaugac ugcagcaauc aaugggcaag cuuugucauu aguauaacua ccaccacgcu 21120
ggcuaaacca ugugucaaaa ucagcauguu uguuagcaaa acaaguaucu guagaugcua 21180
ugucacgagu gacaccacca ucaauagccu uguauccuau gauuucacuu gaaaagucag 21240
uauguuuaga caugacauga acagguguua uuaaauagaa aauagcagca acaaaaagga 21300
acacaagugu aacuuuaauu aacugcuuca accaauuauu aacaauuuua ccacccuuaa 21360
gugcuaucuu uguuguuaca acauuaacaa cuugucuagu aguugcacau gucaacuuaa 21420
aagguaaguu auucuuuuua gcagcacuac guauuuguuu ucguaguugu ucagacaaug 21480
acaugaaauc uuuaacguuc cauaucaaag caauguugug acuuuuugcu accugcgcau 21540
uaauaugacg cgcacuacag ucaauacaag caccaagguc acgggguguc auguuuucaa 21600
cuuuguuaua ggugagcaua uaguuauuac aacuaucgcc aguaacuucu augucagauu 21660
gaugugacaa uuuaagacau ucaacaacau cuuuaguuuc uacaucugaa ucaacaaacc 21720
cuugccgagc ugcugaaaua aaaguagaua agacauuguc uaaggacaca uucuuugcaa 21780
guucagcuuc ugcaguugca acuaguguuu ugaguuuuuc cauugguacg uuaaaaguug 21840
augaaaacgu auuaacguaa gcaucaaaca uuuuaacugc aacuuccgca cuaucaccaa 21900
caucagacac uaaugccuga ucuaguaaca guauagguug acacauaagc ugacuguagu 21960
aaacagacgc ugauuuugca gaugauucuu cacauuuuga uuuaccauca aaaacuauaa 22020
cauuaauagg caaugaaccu uuaguguuau uagcucucag guugucuaag uuaacaaaau 22080
gagagagaga augucuuuca uaagucuuuu gaccagcuuu aucaaaguaa agauggaugg 22140
aaccauucuu cacuguaaca cuaucaacga uguaagaaga cuggucagua ggauuuauug 22200
gucuuuuaaa cuguagugac aagucucucg caacuucauc acuaauaaau guacuaccag 22260
cacagaaugu aucacaauua acacaauucc aauuguguag uuugcaaaag ccuuuaccuc 22320
cauuagcaua gacauaaaag gaccuucuaa caccauuaac aauaguugua cauucgacuc 22380
uuguugcucu auuacguuug uaacacauca uacaaguuga ugaauuacaa ccgucuacaa 22440
caugcacaua acuuuuccau acauaauaaa augaugcaaa gaagauguac auucuaacca 22500
uagcugaaau cggggccauu uguacaagau uaauuauuaa ccacauaagc caagaauuac 22560
uaauaaaaug uacugcaaaa uagcugaaaa acaauugcau gauugcagcc aauccaagua 22620
cauagaaaaa ccuagugaaa agaauauaug ccaaaaacca cucugcaacu aagccaaaag 22680
caguuaaauc ccauuuaaaa gaugaaaugg uaauuuguau aguuucuaaa gaaggauagg 22740
ugucuaaaga aucuaaacca cuaagacaaa cacuacaagg uauagaacca guacaguagg 22800
uugcaauagu gacauuagua gaguucaaau agccuucucu guaaccagua caguaagaag 22860
gcaugccuaa auuagacauu aaaacaccua aagcagcggu ugaguagauu aaagaaccua 22920
ggcaaacacu uaauaguaaa aaccaaauua uaauauuuau caguuuagaa aaauuaggug 22980
acuucaaaua auuaaaugaa gccucuagac aaaauuuacc gacacucuua acaguauucu 23040
uugcuauagu agucggcaua gaugcuuuaa uucuagaauu uguacuucua guaaaaguac 23100
acaauuguag caauaaagua aagaaauaag gcauauaauu aguacaaaca cgguuuaaac 23160
accguguaac uauguuagua guuguacuaa caacuuuguu aagaaaaggc uuagcauaau 23220
uagcuauagu aucccaaggg acacuauuaa cagcagcuaa accaugagua gcaaggguuu 23280
ucaaaccuaa uacucuagau aauucauuag guuucuuaau aguaagacua gaauugucua 23340
cauaagcagc cauuagaucu guguggccaa ccucuucugu aauuuuuaaa cuauuauuug 23400
cugguuuaag uauaaugucu ccuacaacuu cgguaguuuu cacauuacac ucaagaacgu 23460
cuuucuguau gguaggauuu uccacuacuu cuucagagac ugguuuuaga ucuucgcagg 23520
caagauuauc cauucccugc gcguccucug acuucaguac aucaaacgaa uuugauguuu 23580
caacugguuu ugugcuccaa agacaacgua uacaccaggu auuugguuua uacguggcuu 23640
uauuaguugc auuguuaaca ugccaaacaa uagguuuaug uaacaauuua gcuccuuucu 23700
uaaaagaggg uguguagugu uuauaaucaa uagccaccac aucaccauuu aagucaggga 23760
aaaauguaac uuuaagcucu cuugaagcag guuucuuaua accaguuaac ugguuuaaau 23820
caucagcaaa uuugauauua ucacauacaa acuuaaaauu aucgaagcuu gcguuuggau 23880
augguugguu ugguacaaga ucaauugguu gcucugugaa auaagaauug ucuuucuuau 23940
aauaauuguc caacuuaggg ucaauuucug uacaaacaac accauccaau uuauaaguaa 24000
cugguuuuau gguuguugug uaacuguuuu cuuuguagaa aacauccgua auaggaccuu 24060
uguauucuga ggacuuugua aguaaagcac cgucuaugca auacaaaguu ucuuuagaag 24120
uuauauguuu auagugacca cacugguaau uaccagugua cucacuagca caaguaaaug 24180
uaccaugcuu aaguucauac ugagcaggug gugcugacau cauaacaaaa ggugacuccu 24240
guuguacuag auauuuugua gcuuguuuac cacacguaca agguaucuga acaccuuucu 24300
uaaauuguuc auaagaaagu gugcccaugu acauaacagc uucuacaccc uuaaggguug 24360
ucugcuguug uccacaaguu uuacacacca cguucaagac ucuuuugcaa gaaucuaaau 24420
uggcauguug aaacaaguaa cucauuguuu cucuaacauc accuaacuca ccuacugucu 24480
uauuacagua ggcuaagaua agugcacaaa aguuagcagc uucaccagcc cuugcucugu 24540
aauaagcauc uuguagagca gguggauuaa acuucaacuc uauuuguugg aguguuaaca 24600
augcaguggc aagauaacag uuguuaucug cccauuuaau agaaguuaaa ccauuaacuu 24660
guggguauuu ccacuuuuua gugugauuua augcugacau guaccuaccc agaaaacuag 24720
gaucaguugu gugguaguac ucaaaagccu caacacguag agugucauca uuagguaaaa 24780
cauaaaaugu uuuaccuuca ugugaauuau gagguuuuau uuuaguaaca ucagcuccau 24840
ccaaauaagu uggaccaaac uguuguccau augucauuga cauguccaca acuugcgugu 24900
ggagguuaau guugucuacu guuguaaaca ccuuaauagu ccucacuucu cucaaagaaa 24960
gaagugucuu aagauuguca aaggugauaa cuucaccauc uagguggaau gugguaggau 25020
uacuagugua auauacacuu uuaucaccuc ucuuaagaaa uucuauaccu aguuguguag 25080
auuguccaga auaggaccaa ucuuuauagg aaccagcaag ugagaugguu ucaauaaaau 25140
guucuucagg uguuuuagaa gaagaaguaa gauaaccauu auacgcugua acagcaucag 25200
gugaagaaac agaaacugua gcuggcacuu ugagagaucu cauauaccga gcagcuucuu 25260
ccaaauuuaa gccauguguu acauagccaa guggcauugu aacaagaguu ucauuuagau 25320
cguuaagugu guugauaagu gacgcuacag uuguuuuacu gguguaaaag uaaaaucuag 25380
caccauaauc aaccacaccc ucuuguauuu uaauacccuu auauuuacgc uguauaguug 25440
aaacuauggc uuuaguuucc acacagacag gcauuaauuu gcguguuucu ucugcaugug 25500
caagcauuuc ucgcaaauuc caagaaacag uuccaagaau uucuugcuuc ucauuagaga 25560
uaauagaugg uagaauguaa aaggcacuuu uacacuuuuu aagcacuguc uuugccuccu 25620
cuacagugua accauuuaaa cccugacccg gguaaguggu uauauaauug ucuguuggca 25680
cuuuucucaa agcuuucgcu agcauuucag uagugccacc agccuuuuua guagguauaa 25740
ccacagcagu uaaaacaccc ucuugaacaa caucacccac uauauaugga gcaucuuucu 25800
uuaagaaagu gaugucaaug ucacuaacaa gaguggcaga aucuggauga agauugccau 25860
uaaugucaau auaaaguaac aaguuuucug ugaggaacuu aguuucuucc agaguuguug 25920
uaacuucuuc aacacaagcu uugauuuucu uaucaucuug uuuucucugu ucaacugaag 25980
guuuacuuuc aguuauaaau ggcuuaacuu ccucuuuagg aaucucagcg aucuuuuguu 26040
caacuugcuu uucacucuuc auuuccaaaa agcuugaaac aaguuuguca uagagauuuu 26100
uaucaaagac agcuaaguag acauuugugc gaacaguauc uacacaaacu cuuaaagaau 26160
guauaggguc agcaccaaaa auaccagcug auaauaaugg ugcaaguaga acuucgugcu 26220
gauuaaaauu uucauaagca cucuuaagaa guugaauguc uucaccuuug uuaacauuug 26280
ggccgacaac augaagacag uguuuagcaa gauugugucc gcuuaaaaca caacuaccac 26340
ccacuuuaag ugguccauua guagcuaugu aaucaucaga uucaacuugc auggcauugu 26400
uaguagccuu auuuaaggcu ccugcaacac cuccuccaug uuuaagguaa acauuggcug 26460
cauuaacaac cacuguuggu uuuaccuuuu uagcuucuuc cacaaugucu gcauuuuuaa 26520
uguauacauu gucaguaagu uuuaaauaac cacuaaaacu auucacuuca auagucugaa 26580
caacuggugu aaguuccauc ucuaauugag guugaaccuc aacaauuguu ugaauaguag 26640
uugucugauu guccucacug ccgucuuguu gaccaacagu uuguugacua ucaucaucua 26700
accaaucuuc uucuugcucu ucuucagguu gaagagcagc agaaguggca ccaaauucca 26760
aagguuuacc uugguaauca ucuucaguac cauacucaua uugaguugau ggcucaaacu 26820
cuucuucuuc acaaucaccu ucuucuucau ccucaucugg aggguagaaa gaacaauaca 26880
uaugugaagc caauuuaaac ucaccagacu caucaaauaa guaguaugua gccauacucc 26940
acucaucuaa aucaaugccc agugguguaa guaauucaga uacugguugc aaaguuuuua 27000
ugacagcauc ugccacaaca caggcgaacu cauuuacuuc uguaccgagu ucaacuguau 27060
aggcagagca cuucucauua aguacuuuau caauccuuuc aucaaguuca aaagugauau 27120
ucacacucuu guaaccuugc acuucuauca cagugucauc accaaaagua accuuuguug 27180
gugcaccgcc uuugagugug aagguauugu uuguuaccau cauauuaggu gcaagggcac 27240
aguacuuuuc ugugucuuug auuucgagca acauaagccc guuaauacaa acugguguac 27300
caaccaaugg agcuucaaca gcuucacuag uagguuguuc uaaugguugu aaaucaccag 27360
uuuucaagac aacuuccucu guuaacacuu cugugggaag uguuucuccc ucuaagaaga 27420
uaauuucuuu uggggcuuuu agaggcauga guaggccagu uucuucucug gauuuaacac 27480
acuuucugua caaucccuuu gagugcguga caaauguuuc accuaaauuc aaggcuuuaa 27540
guuuagcucc accaauaaug auagagucag cacacaaagc caaaaauuua uuuacaagcu 27600
uaaagaaugu cugaacacuc uccuuaauuu ccuuugcaca ggugacaauu uguccaccga 27660
caauuucaca agcacagguu gagauaaauu uaacaauuuc ccaaccgucu cuaagaaacu 27720
cuacaccuuc cuuaaacuuc ucuucaagcc aaucaaggac ggguuugagu uuuucauaaa 27780
cagugccaaa gauguuaguu agccacugcg aagucaacug aacaacacca ccuguaaugu 27840
aggccauuac aacuagauug uuaguagcca aaucagaugu gaacaucaua gcaucaauga 27900
gucucaguga auacugugaa auuccaucua guauuguuau agcggccuuc uguaaaacac 27960
gcacagaauu uugagcaguu ucaagagugc gggagaaaau ugaucguaca acacgagcag 28020
ccucugaugc aaaugcauaa agaggacuca guauugauuu cuguucacca auauuccagg 28080
caccuuuuuu agcuuuuccu uuuguaacuu uaaaauuacc acaggauuca acaauuuguu 28140
ugaaugcuuu auaauccaaa ccuuucacag uuuccacaaa agcacuugug gaagcagaaa 28200
aagaugccaa aauaauggcg aucucuucau uaaguuuaaa gucaccaaca auauugaugu 28260
ugacuuucuc uuuuuggagu auuucaagaa gguugucauu aagaccuucg gaaccuucuc 28320
caacaacacc uguaugguua caaccuaugu uagcgcuagc acguggaacc caauaggcac 28380
acuuguuaug gcaaccaaca uaagagaaca cacagccucc aaaggcaaua gugcgaccac 28440
ccuuacgaag aaugguuuuc aagccagauu cauuauggua uucggcaaga cuaugcucag 28500
guccuacuuc ugaauuguga caugcuggac aauaaauuuu aacaacagca uuuuggggua 28560
aguaaccaca aguaguggca ccuucuuuag ucaaauucuc agugccacaa aauucgcaag 28620
uggcuuuaac aaaaucgccc gucugccaug aaguuucacc acaaugauca cacuucauga 28680
gaguugaaag gcacauuugg uugcauucau uuggugacgc aacuggauag acagaucgaa 28740
uucuacccau aaagccauca agcuuuuucu uuucaacccu ugguugaaua gucuugauua 28800
uggaauuuaa gggaaauaca aaauuuggac auuccccauu gaagguguca aauuucuuug 28860
ccaauuuaau uucaaaaggu gucugcaauu cauagcucuu uucagaacgu uccguguacc 28920
aagcaauuuc augcucaugu ucacggcagc aguauacacc ccucuuagug ucaauaaagu 28980
ccaguuguuc ggacaaagug caugaagcuu uaccagcacg ugcuagaagg ucuuuaaugc 29040
acucaagagg guagccauca gggccacaga aguuguuauc gacauagcga guguaugccc 29100
cuccguuaag cucacgcaug aguucacggg uaacaccacu gcuauguuua guguuccagu 29160
uuucuugaaa aucuucauaa ggaucagugc caagcucguc gccuaaguca aaugacuuua 29220
gaucggcgcc guaacuaugg ccaccagcuc cuuuauuacc guucuuacga agaagaaccu 29280
ugcgguaagc cacugguauu ucgcccacau gagggacaag gacaccaagu gucucaccac 29340
uacgaccgua cugaaugccu ucgaguucug cuaccagcuc aaccauaaca ugaccaugag 29400
gugcaguucg agcauccgaa cguuugauga acacauaggg cuguucaagu ugaggcaaaa 29460
cgccuuuuuc aacuucuacu aagccacaag ugccaucuuu aagauguuga cgugccucug 29520
auaagaccuc cuccacggag ucuccaaagc cacguacgag cacgucgcga accuguaaaa 29580
caggcaaacu gaguuggacg uguguuuucu cguugaaacc agggacaagg cucuccaucu 29640
uaccuuucgg ucacacccgg acgaaaccua gaugugcuga ugaucggcug caacacggac 29700
gaaaccguaa gcagccugca gaagauagac gaguuacucg uguccuguca acgacaguaa 29760
uuaguuauua auuauacugc gugagugcac uaagcaugca gccgagugac agccacacag 29820
auuuuaaagu ucguuuagag aacagaucua caagagaucg aaaguugguu gguuuguuac 29880
cugggaaggu auaaaccuuu aau 29903
<210> 8
<211> 1255
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 8
Met Phe Ile Phe Leu Leu Phe Leu Thr Leu Thr Ser Gly Ser Asp Leu
1 5 10 15
Asp Arg Cys Thr Thr Phe Asp Asp Val Gln Ala Pro Asn Tyr Thr Gln
20 25 30
His Thr Ser Ser Met Arg Gly Val Tyr Tyr Pro Asp Glu Ile Phe Arg
35 40 45
Ser Asp Thr Leu Tyr Leu Thr Gln Asp Leu Phe Leu Pro Phe Tyr Ser
50 55 60
Asn Val Thr Gly Phe His Thr Ile Asn His Thr Phe Gly Asn Pro Val
65 70 75 80
Ile Pro Phe Lys Asp Gly Ile Tyr Phe Ala Ala Thr Glu Lys Ser Asn
85 90 95
Val Val Arg Gly Trp Val Phe Gly Ser Thr Met Asn Asn Lys Ser Gln
100 105 110
Ser Val Ile Ile Ile Asn Asn Ser Thr Asn Val Val Ile Arg Ala Cys
115 120 125
Asn Phe Glu Leu Cys Asp Asn Pro Phe Phe Ala Val Ser Lys Pro Met
130 135 140
Gly Thr Gln Thr His Thr Met Ile Phe Asp Asn Ala Phe Asn Cys Thr
145 150 155 160
Phe Glu Tyr Ile Ser Asp Ala Phe Ser Leu Asp Val Ser Glu Lys Ser
165 170 175
Gly Asn Phe Lys His Leu Arg Glu Phe Val Phe Lys Asn Lys Asp Gly
180 185 190
Phe Leu Tyr Val Tyr Lys Gly Tyr Gln Pro Ile Asp Val Val Arg Asp
195 200 205
Leu Pro Ser Gly Phe Asn Thr Leu Lys Pro Ile Phe Lys Leu Pro Leu
210 215 220
Gly Ile Asn Ile Thr Asn Phe Arg Ala Ile Leu Thr Ala Phe Ser Pro
225 230 235 240
Ala Gln Asp Ile Trp Gly Thr Ser Ala Ala Ala Tyr Phe Val Gly Tyr
245 250 255
Leu Lys Pro Thr Thr Phe Met Leu Lys Tyr Asp Glu Asn Gly Thr Ile
260 265 270
Thr Asp Ala Val Asp Cys Ser Gln Asn Pro Leu Ala Glu Leu Lys Cys
275 280 285
Ser Val Lys Ser Phe Glu Ile Asp Lys Gly Ile Tyr Gln Thr Ser Asn
290 295 300
Phe Arg Val Val Pro Ser Gly Asp Val Val Arg Phe Pro Asn Ile Thr
305 310 315 320
Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Lys Phe Pro Ser
325 330 335
Val Tyr Ala Trp Glu Arg Lys Lys Ile Ser Asn Cys Val Ala Asp Tyr
340 345 350
Ser Val Leu Tyr Asn Ser Thr Phe Phe Ser Thr Phe Lys Cys Tyr Gly
355 360 365
Val Ser Ala Thr Lys Leu Asn Asp Leu Cys Phe Ser Asn Val Tyr Ala
370 375 380
Asp Ser Phe Val Val Lys Gly Asp Asp Val Arg Gln Ile Ala Pro Gly
385 390 395 400
Gln Thr Gly Val Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe
405 410 415
Met Gly Cys Val Leu Ala Trp Asn Thr Arg Asn Ile Asp Ala Thr Ser
420 425 430
Thr Gly Asn Tyr Asn Tyr Lys Tyr Arg Tyr Leu Arg His Gly Lys Leu
435 440 445
Arg Pro Phe Glu Arg Asp Ile Ser Asn Val Pro Phe Ser Pro Asp Gly
450 455 460
Lys Pro Cys Thr Pro Pro Ala Leu Asn Cys Tyr Trp Pro Leu Asn Asp
465 470 475 480
Tyr Gly Phe Tyr Thr Thr Thr Gly Ile Gly Tyr Gln Pro Tyr Arg Val
485 490 495
Val Val Leu Ser Phe Glu Leu Leu Asn Ala Pro Ala Thr Val Cys Gly
500 505 510
Pro Lys Leu Ser Thr Asp Leu Ile Lys Asn Gln Cys Val Asn Phe Asn
515 520 525
Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Pro Ser Ser Lys Arg
530 535 540
Phe Gln Pro Phe Gln Gln Phe Gly Arg Asp Val Ser Asp Phe Thr Asp
545 550 555 560
Ser Val Arg Asp Pro Lys Thr Ser Glu Ile Leu Asp Ile Ser Pro Cys
565 570 575
Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Ala Ser Ser
580 585 590
Glu Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Asp Val Ser Thr
595 600 605
Ala Ile His Ala Asp Gln Leu Thr Pro Ala Trp Arg Ile Tyr Ser Thr
610 615 620
Gly Asn Asn Val Phe Gln Thr Gln Ala Gly Cys Leu Ile Gly Ala Glu
625 630 635 640
His Val Asp Thr Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile
645 650 655
Cys Ala Ser Tyr His Thr Val Ser Leu Leu Arg Ser Thr Ser Gln Lys
660 665 670
Ser Ile Val Ala Tyr Thr Met Ser Leu Gly Ala Asp Ser Ser Ile Ala
675 680 685
Tyr Ser Asn Asn Thr Ile Ala Ile Pro Thr Asn Phe Ser Ile Ser Ile
690 695 700
Thr Thr Glu Val Met Pro Val Ser Met Ala Lys Thr Ser Val Asp Cys
705 710 715 720
Asn Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ala Asn Leu Leu Leu
725 730 735
Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Ser Gly Ile
740 745 750
Ala Ala Glu Gln Asp Arg Asn Thr Arg Glu Val Phe Ala Gln Val Lys
755 760 765
Gln Met Tyr Lys Thr Pro Thr Leu Lys Tyr Phe Gly Gly Phe Asn Phe
770 775 780
Ser Gln Ile Leu Pro Asp Pro Leu Lys Pro Thr Lys Arg Ser Phe Ile
785 790 795 800
Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Met
805 810 815
Lys Gln Tyr Gly Glu Cys Leu Gly Asp Ile Asn Ala Arg Asp Leu Ile
820 825 830
Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr
835 840 845
Asp Asp Met Ile Ala Ala Tyr Thr Ala Ala Leu Val Ser Gly Thr Ala
850 855 860
Thr Ala Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe
865 870 875 880
Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn
885 890 895
Val Leu Tyr Glu Asn Gln Lys Gln Ile Ala Asn Gln Phe Asn Lys Ala
900 905 910
Ile Ser Gln Ile Gln Glu Ser Leu Thr Thr Thr Ser Thr Ala Leu Gly
915 920 925
Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu
930 935 940
Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn
945 950 955 960
Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp
965 970 975
Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln
980 985 990
Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala
995 1000 1005
Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp
1010 1015 1020
Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ala Ala
1025 1030 1035
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ser Gln
1040 1045 1050
Glu Arg Asn Phe Thr Thr Ala Pro Ala Ile Cys His Glu Gly Lys
1055 1060 1065
Ala Tyr Phe Pro Arg Glu Gly Val Phe Val Phe Asn Gly Thr Ser
1070 1075 1080
Trp Phe Ile Thr Gln Arg Asn Phe Phe Ser Pro Gln Ile Ile Thr
1085 1090 1095
Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly
1100 1105 1110
Ile Ile Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp
1115 1120 1125
Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser
1130 1135 1140
Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val
1145 1150 1155
Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys
1160 1165 1170
Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr
1175 1180 1185
Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Val Trp Leu Gly Phe Ile
1190 1195 1200
Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Leu Leu Cys Cys
1205 1210 1215
Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Ala Cys Ser Cys Gly
1220 1225 1230
Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys
1235 1240 1245
Gly Val Lys Leu His Tyr Thr
1250 1255
<210> 9
<211> 422
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 9
Met Ser Asp Asn Gly Pro Gln Ser Asn Gln Arg Ser Ala Pro Arg Ile
1 5 10 15
Thr Phe Gly Gly Pro Thr Asp Ser Thr Asp Asn Asn Gln Asn Gly Gly
20 25 30
Arg Asn Gly Ala Arg Pro Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn
35 40 45
Asn Thr Ala Ser Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Glu
50 55 60
Leu Arg Phe Pro Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Gly
65 70 75 80
Pro Asp Asp Gln Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Val Arg
85 90 95
Gly Gly Asp Gly Lys Met Lys Glu Leu Ser Pro Arg Trp Tyr Phe Tyr
100 105 110
Tyr Leu Gly Thr Gly Pro Glu Ala Ser Leu Pro Tyr Gly Ala Asn Lys
115 120 125
Glu Gly Ile Val Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys
130 135 140
Asp His Ile Gly Thr Arg Asn Pro Asn Asn Asn Ala Ala Thr Val Leu
145 150 155 160
Gln Leu Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly
165 170 175
Ser Arg Gly Gly Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg
180 185 190
Gly Asn Ser Arg Asn Ser Thr Pro Gly Ser Ser Arg Gly Asn Ser Pro
195 200 205
Ala Arg Met Ala Ser Gly Gly Gly Glu Thr Ala Leu Ala Leu Leu Leu
210 215 220
Leu Asp Arg Leu Asn Gln Leu Glu Ser Lys Val Ser Gly Lys Gly Gln
225 230 235 240
Gln Gln Gln Gly Gln Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser
245 250 255
Lys Lys Pro Arg Gln Lys Arg Thr Ala Thr Lys Gln Tyr Asn Val Thr
260 265 270
Gln Ala Phe Gly Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly
275 280 285
Asp Gln Asp Leu Ile Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln
290 295 300
Ile Ala Gln Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg
305 310 315 320
Ile Gly Met Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr His Gly
325 330 335
Ala Ile Lys Leu Asp Asp Lys Asp Pro Gln Phe Lys Asp Asn Val Ile
340 345 350
Leu Leu Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu
355 360 365
Pro Lys Lys Asp Lys Lys Lys Lys Thr Asp Glu Ala Gln Pro Leu Pro
370 375 380
Gln Arg Gln Lys Lys Gln Pro Thr Val Thr Leu Leu Pro Ala Ala Asp
385 390 395 400
Met Asp Asp Phe Ser Arg Gln Leu Gln Asn Ser Met Ser Gly Ala Ser
405 410 415
Ala Asp Ser Thr Gln Ala
420
<210> 10
<211> 221
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 10
Met Ala Asp Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Gln Leu Leu
1 5 10 15
Glu Gln Trp Asn Leu Val Ile Gly Phe Leu Phe Leu Ala Trp Ile Met
20 25 30
Leu Leu Gln Phe Ala Tyr Ser Asn Arg Asn Arg Phe Leu Tyr Ile Ile
35 40 45
Lys Leu Val Phe Leu Trp Leu Leu Trp Pro Val Thr Leu Ala Cys Phe
50 55 60
Val Leu Ala Ala Val Tyr Arg Ile Asn Trp Val Thr Gly Gly Ile Ala
65 70 75 80
Ile Ala Met Ala Cys Ile Val Gly Leu Met Trp Leu Ser Tyr Phe Val
85 90 95
Ala Ser Phe Arg Leu Phe Ala Arg Thr Arg Ser Met Trp Ser Phe Asn
100 105 110
Pro Glu Thr Asn Ile Leu Leu Asn Val Pro Leu Arg Gly Thr Ile Val
115 120 125
Thr Arg Pro Leu Met Glu Ser Glu Leu Val Ile Gly Ala Val Ile Ile
130 135 140
Arg Gly His Leu Arg Met Ala Gly His Ser Leu Gly Arg Cys Asp Ile
145 150 155 160
Lys Asp Leu Pro Lys Glu Ile Thr Val Ala Thr Ser Arg Thr Leu Ser
165 170 175
Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Gly Thr Asp Ser Gly Phe
180 185 190
Ala Ala Tyr Asn Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr Asp
195 200 205
His Ala Gly Ser Asn Asp Asn Ile Ala Leu Leu Val Gln
210 215 220
<210> 11
<211> 76
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 11
Met Tyr Ser Phe Val Ser Glu Glu Thr Gly Thr Leu Ile Val Asn Ser
1 5 10 15
Val Leu Leu Phe Leu Ala Phe Val Val Phe Leu Leu Val Thr Leu Ala
20 25 30
Ile Leu Thr Ala Leu Arg Leu Cys Ala Tyr Cys Cys Asn Ile Val Asn
35 40 45
Val Ser Leu Val Lys Pro Thr Val Tyr Val Tyr Ser Arg Val Lys Asn
50 55 60
Leu Asn Ser Ser Glu Gly Val Pro Asp Leu Leu Val
65 70 75
<210> 12
<211> 805
<212> PRT
<213> Homo sapiens
<400> 12
Met Ser Ser Ser Ser Trp Leu Leu Leu Ser Leu Val Ala Val Thr Ala
1 5 10 15
Ala Gln Ser Thr Ile Glu Glu Gln Ala Lys Thr Phe Leu Asp Lys Phe
20 25 30
Asn His Glu Ala Glu Asp Leu Phe Tyr Gln Ser Ser Leu Ala Ser Trp
35 40 45
Asn Tyr Asn Thr Asn Ile Thr Glu Glu Asn Val Gln Asn Met Asn Asn
50 55 60
Ala Gly Asp Lys Trp Ser Ala Phe Leu Lys Glu Gln Ser Thr Leu Ala
65 70 75 80
Gln Met Tyr Pro Leu Gln Glu Ile Gln Asn Leu Thr Val Lys Leu Gln
85 90 95
Leu Gln Ala Leu Gln Gln Asn Gly Ser Ser Val Leu Ser Glu Asp Lys
100 105 110
Ser Lys Arg Leu Asn Thr Ile Leu Asn Thr Met Ser Thr Ile Tyr Ser
115 120 125
Thr Gly Lys Val Cys Asn Pro Asp Asn Pro Gln Glu Cys Leu Leu Leu
130 135 140
Glu Pro Gly Leu Asn Glu Ile Met Ala Asn Ser Leu Asp Tyr Asn Glu
145 150 155 160
Arg Leu Trp Ala Trp Glu Ser Trp Arg Ser Glu Val Gly Lys Gln Leu
165 170 175
Arg Pro Leu Tyr Glu Glu Tyr Val Val Leu Lys Asn Glu Met Ala Arg
180 185 190
Ala Asn His Tyr Glu Asp Tyr Gly Asp Tyr Trp Arg Gly Asp Tyr Glu
195 200 205
Val Asn Gly Val Asp Gly Tyr Asp Tyr Ser Arg Gly Gln Leu Ile Glu
210 215 220
Asp Val Glu His Thr Phe Glu Glu Ile Lys Pro Leu Tyr Glu His Leu
225 230 235 240
His Ala Tyr Val Arg Ala Lys Leu Met Asn Ala Tyr Pro Ser Tyr Ile
245 250 255
Ser Pro Ile Gly Cys Leu Pro Ala His Leu Leu Gly Asp Met Trp Gly
260 265 270
Arg Phe Trp Thr Asn Leu Tyr Ser Leu Thr Val Pro Phe Gly Gln Lys
275 280 285
Pro Asn Ile Asp Val Thr Asp Ala Met Val Asp Gln Ala Trp Asp Ala
290 295 300
Gln Arg Ile Phe Lys Glu Ala Glu Lys Phe Phe Val Ser Val Gly Leu
305 310 315 320
Pro Asn Met Thr Gln Gly Phe Trp Glu Asn Ser Met Leu Thr Asp Pro
325 330 335
Gly Asn Val Gln Lys Ala Val Cys His Pro Thr Ala Trp Asp Leu Gly
340 345 350
Lys Gly Asp Phe Arg Ile Leu Met Cys Thr Lys Val Thr Met Asp Asp
355 360 365
Phe Leu Thr Ala His His Glu Met Gly His Ile Gln Tyr Asp Met Ala
370 375 380
Tyr Ala Ala Gln Pro Phe Leu Leu Arg Asn Gly Ala Asn Glu Gly Phe
385 390 395 400
His Glu Ala Val Gly Glu Ile Met Ser Leu Ser Ala Ala Thr Pro Lys
405 410 415
His Leu Lys Ser Ile Gly Leu Leu Ser Pro Asp Phe Gln Glu Asp Asn
420 425 430
Glu Thr Glu Ile Asn Phe Leu Leu Lys Gln Ala Leu Thr Ile Val Gly
435 440 445
Thr Leu Pro Phe Thr Tyr Met Leu Glu Lys Trp Arg Trp Met Val Phe
450 455 460
Lys Gly Glu Ile Pro Lys Asp Gln Trp Met Lys Lys Trp Trp Glu Met
465 470 475 480
Lys Arg Glu Ile Val Gly Val Val Glu Pro Val Pro His Asp Glu Thr
485 490 495
Tyr Cys Asp Pro Ala Ser Leu Phe His Val Ser Asn Asp Tyr Ser Phe
500 505 510
Ile Arg Tyr Tyr Thr Arg Thr Leu Tyr Gln Phe Gln Phe Gln Glu Ala
515 520 525
Leu Cys Gln Ala Ala Lys His Glu Gly Pro Leu His Lys Cys Asp Ile
530 535 540
Ser Asn Ser Thr Glu Ala Gly Gln Lys Leu Phe Asn Met Leu Arg Leu
545 550 555 560
Gly Lys Ser Glu Pro Trp Thr Leu Ala Leu Glu Asn Val Val Gly Ala
565 570 575
Lys Asn Met Asn Val Arg Pro Leu Leu Asn Tyr Phe Glu Pro Leu Phe
580 585 590
Thr Trp Leu Lys Asp Gln Asn Lys Asn Ser Phe Val Gly Trp Ser Thr
595 600 605
Asp Trp Ser Pro Tyr Ala Asp Gln Ser Ile Lys Val Arg Ile Ser Leu
610 615 620
Lys Ser Ala Leu Gly Asp Lys Ala Tyr Glu Trp Asn Asp Asn Glu Met
625 630 635 640
Tyr Leu Phe Arg Ser Ser Val Ala Tyr Ala Met Arg Gln Tyr Phe Leu
645 650 655
Lys Val Lys Asn Gln Met Ile Leu Phe Gly Glu Glu Asp Val Arg Val
660 665 670
Ala Asn Leu Lys Pro Arg Ile Ser Phe Asn Phe Phe Val Thr Ala Pro
675 680 685
Lys Asn Val Ser Asp Ile Ile Pro Arg Thr Glu Val Glu Lys Ala Ile
690 695 700
Arg Met Ser Arg Ser Arg Ile Asn Asp Ala Phe Arg Leu Asn Asp Asn
705 710 715 720
Ser Leu Glu Phe Leu Gly Ile Gln Pro Thr Leu Gly Pro Pro Asn Gln
725 730 735
Pro Pro Val Ser Ile Trp Leu Ile Val Phe Gly Val Val Met Gly Val
740 745 750
Ile Val Val Gly Ile Val Ile Leu Ile Phe Thr Gly Ile Arg Asp Arg
755 760 765
Lys Lys Lys Asn Lys Ala Arg Ser Gly Glu Asn Pro Tyr Ala Ser Ile
770 775 780
Asp Ile Ser Lys Gly Glu Asn Asn Pro Gly Phe Gln Asn Thr Asp Asp
785 790 795 800
Val Gln Thr Ser Phe
805
<210> 13
<211> 178
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
IL-10 sequence
<400> 13
Met His Ser Ser Ala Leu Leu Cys Cys Leu Val Leu Leu Thr Gly Val
1 5 10 15
Arg Ala Ser Pro Gly Gln Gly Thr Gln Ser Glu Asn Ser Cys Thr His
20 25 30
Phe Pro Gly Asn Leu Pro Asn Met Leu Arg Asp Leu Arg Asp Ala Phe
35 40 45
Ser Arg Val Lys Thr Phe Phe Gln Met Lys Asp Gln Leu Asp Asn Leu
50 55 60
Leu Leu Lys Glu Ser Leu Leu Glu Asp Phe Lys Gly Tyr Leu Gly Cys
65 70 75 80
Gln Ala Leu Ser Glu Met Ile Gln Phe Tyr Leu Glu Glu Val Met Pro
85 90 95
Gln Ala Glu Asn Gln Asp Pro Asp Ile Lys Ala His Val Asn Ser Leu
100 105 110
Gly Glu Asn Leu Lys Thr Leu Arg Leu Arg Leu Arg Arg Cys His Arg
115 120 125
Phe Leu Pro Cys Glu Asn Lys Ser Lys Ala Val Glu Gln Val Lys Asn
130 135 140
Ala Phe Asn Lys Leu Gln Glu Lys Gly Ile Tyr Lys Ala Met Ser Glu
145 150 155 160
Phe Asp Ile Phe Ile Asn Tyr Ile Glu Ala Tyr Met Thr Met Lys Ile
165 170 175
Arg Asn
<210> 14
<211> 212
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
IL-6 sequence
<400> 14
Met Asn Ser Phe Ser Thr Ser Ala Phe Gly Pro Val Ala Phe Ser Leu
1 5 10 15
Gly Leu Leu Leu Val Leu Pro Ala Ala Phe Pro Ala Pro Val Pro Pro
20 25 30
Gly Glu Asp Ser Lys Asp Val Ala Ala Pro His Arg Gln Pro Leu Thr
35 40 45
Ser Ser Glu Arg Ile Asp Lys Gln Ile Arg Tyr Ile Leu Asp Gly Ile
50 55 60
Ser Ala Leu Arg Lys Glu Thr Cys Asn Lys Ser Asn Met Cys Glu Ser
65 70 75 80
Ser Lys Glu Ala Leu Ala Glu Asn Asn Leu Asn Leu Pro Lys Met Ala
85 90 95
Glu Lys Asp Gly Cys Phe Gln Ser Gly Phe Asn Glu Glu Thr Cys Leu
100 105 110
Val Lys Ile Ile Thr Gly Leu Leu Glu Phe Glu Val Tyr Leu Glu Tyr
115 120 125
Leu Gln Asn Arg Phe Glu Ser Ser Glu Glu Gln Ala Arg Ala Val Gln
130 135 140
Met Ser Thr Lys Val Leu Ile Gln Phe Leu Gln Lys Lys Ala Lys Asn
145 150 155 160
Leu Asp Ala Ile Thr Thr Pro Asp Pro Thr Thr Asn Ala Ser Leu Leu
165 170 175
Thr Lys Leu Gln Ala Gln Asn Gln Trp Leu Gln Asp Met Thr Thr His
180 185 190
Leu Ile Leu Arg Ser Phe Lys Glu Phe Leu Gln Ser Ser Leu Arg Ala
195 200 205
Leu Arg Gln Met
210
<210> 15
<211> 233
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
TNF-a sequence
<400> 15
Met Ser Thr Glu Ser Met Ile Arg Asp Val Glu Leu Ala Glu Glu Ala
1 5 10 15
Leu Pro Lys Lys Thr Gly Gly Pro Gln Gly Ser Arg Arg Cys Leu Phe
20 25 30
Leu Ser Leu Phe Ser Phe Leu Ile Val Ala Gly Ala Thr Thr Leu Phe
35 40 45
Cys Leu Leu His Phe Gly Val Ile Gly Pro Gln Arg Glu Glu Phe Pro
50 55 60
Arg Asp Leu Ser Leu Ile Ser Pro Leu Ala Gln Ala Val Arg Ser Ser
65 70 75 80
Ser Arg Thr Pro Ser Asp Lys Pro Val Ala His Val Val Ala Asn Pro
85 90 95
Gln Ala Glu Gly Gln Leu Gln Trp Leu Asn Arg Arg Ala Asn Ala Leu
100 105 110
Leu Ala Asn Gly Val Glu Leu Arg Asp Asn Gln Leu Val Val Pro Ser
115 120 125
Glu Gly Leu Tyr Leu Ile Tyr Ser Gln Val Leu Phe Lys Gly Gln Gly
130 135 140
Cys Pro Ser Thr His Val Leu Leu Thr His Thr Ile Ser Arg Ile Ala
145 150 155 160
Val Ser Tyr Gln Thr Lys Val Asn Leu Leu Ser Ala Ile Lys Ser Pro
165 170 175
Cys Gln Arg Glu Thr Pro Glu Gly Ala Glu Ala Lys Pro Trp Tyr Glu
180 185 190
Pro Ile Tyr Leu Gly Gly Val Phe Gln Leu Glu Lys Gly Asp Arg Leu
195 200 205
Ser Ala Glu Ile Asn Arg Pro Asp Tyr Leu Asp Phe Ala Glu Ser Gly
210 215 220
Gln Val Tyr Phe Gly Ile Ile Ala Leu
225 230
<210> 16
<400> 16
000
<210> 17
<400> 17
000
<210> 18
<400> 18
000
<210> 19
<400> 19
000
<210> 20
<400> 20
000
<210> 21
<400> 21
000
<210> 22
<400> 22
000
<210> 23
<400> 23
000
<210> 24
<400> 24
000
<210> 25
<400> 25
000
<210> 26
<400> 26
000
<210> 27
<400> 27
000
<210> 28
<400> 28
000
<210> 29
<400> 29
000
<210> 30
<400> 30
000
<210> 31
<400> 31
000
<210> 32
<400> 32
000
<210> 33
<400> 33
000
<210> 34
<400> 34
000
<210> 35
<400> 35
000
<210> 36
<400> 36
000
<210> 37
<400> 37
000
<210> 38
<400> 38
000
<210> 39
<400> 39
000
<210> 40
<400> 40
000
<210> 41
<400> 41
000
<210> 42
<400> 42
000
<210> 43
<400> 43
000
<210> 44
<400> 44
000
<210> 45
<400> 45
000
<210> 46
<400> 46
000
<210> 47
<400> 47
000
<210> 48
<400> 48
000
<210> 49
<400> 49
000
<210> 50
<400> 50
000
<210> 51
<400> 51
000
<210> 52
<400> 52
000
<210> 53
<400> 53
000
<210> 54
<400> 54
000
<210> 55
<400> 55
000
<210> 56
<400> 56
000
<210> 57
<400> 57
000
<210> 58
<400> 58
000
<210> 59
<400> 59
000
<210> 60
<400> 60
000
<210> 61
<400> 61
000
<210> 62
<400> 62
000
<210> 63
<400> 63
000
<210> 64
<400> 64
000
<210> 65
<400> 65
000
<210> 66
<400> 66
000
<210> 67
<400> 67
000
<210> 68
<400> 68
000
<210> 69
<400> 69
000
<210> 70
<400> 70
000
<210> 71
<400> 71
000
<210> 72
<400> 72
000
<210> 73
<400> 73
000
<210> 74
<400> 74
000
<210> 75
<400> 75
000
<210> 76
<400> 76
000
<210> 77
<400> 77
000
<210> 78
<400> 78
000
<210> 79
<400> 79
000
<210> 80
<400> 80
000
<210> 81
<400> 81
000
<210> 82
<400> 82
000
<210> 83
<400> 83
000
<210> 84
<400> 84
000
<210> 85
<400> 85
000
<210> 86
<400> 86
000
<210> 87
<400> 87
000
<210> 88
<400> 88
000
<210> 89
<400> 89
000
<210> 90
<400> 90
000
<210> 91
<400> 91
000
<210> 92
<400> 92
000
<210> 93
<400> 93
000
<210> 94
<400> 94
000
<210> 95
<400> 95
000
<210> 96
<400> 96
000
<210> 97
<400> 97
000
<210> 98
<400> 98
000
<210> 99
<400> 99
000
<210> 100
<400> 100
000
<210> 101
<211> 6462
<212> DNA
<213> Sin Nombre orthohantavirus
<400> 101
atggaaaaat atagggagat tcatcaaaga gtcaaggaga ttcctcctgg gggggcttct 60
gcattagaat gtttagattt gcttgaccgt ctttatgcag tcagacatga tgtagttgat 120
cagatgatca agcatgattg gtctgacaat aaagatatgg aaagacctat aggtcaagtt 180
ctgttaatgg ctggtgtacc aaatgatgtg attcaaggta tggagaagaa agttatacct 240
acaagccctt caggacagat tttaaaaagc tttttccgca tgacacctga taattataaa 300
atcacaggtg ccttaattga gtttatcgag gtaacagtga ctgcagatgt tgctaaaggt 360
atccgtgaaa agaaattaaa gtatgagagt ggtcttcagt ttgtggagtc tttattaagt 420
caagaacaca aaaaaggtaa tataaatcaa gcttataaga tcacatttga tgttgtggct 480
gtaaagacgg atggttcaaa catatcaact caatggccta gtcggcgtaa tgatggtgtt 540
gttcaacata tgaggcttgt tcaggctgat attaattatg ttagagaaca tctcattaag 600
cctgatgaac gtgcatcatt agaagccatg tttaatctta agtttcatgt aggaggccct 660
aaactgaggt attttaatat accagattac aagcctcagt cattatgtca acctgagatt 720
acgaatttaa ttcaatattg caagcactgg ctcacagaag atcatgattt tgtttttaag 780
gaagtcacgg gtaataatgt tatgaactca tttgagaata atgaaagtgt atatatgtct 840
agatacaggg agtctcgtaa accacgtaat ttcttattaa ttcaaggttc tattcaaggt 900
ccttatttac catcaactat tagctctgac cagtgtgaca caagaattgg ctgtttggag 960
gtgttaaaag tacatccaga gacaccagta caagcaattg cagtggatat ggcatataag 1020
tatatggagt taaatagaga tgagatcatc aactactaca atcctagagt tcattttcaa 1080
gcaactcagt cagtgaagga accaggtaca ttcaaattag gactttctca actaaatccg 1140
atgtctaaat caatattgga ccaggttggg aaacacaagt cagaaaaggg cctttttggt 1200
gaaccattag agagtataaa catatcaagc cagattcaac agaatgagtg ttcacgtatt 1260
atagaatcaa tactttcaaa tctcgaaata aatgttggtg aggtaacaat gagtctagct 1320
aatcctcgta aaactacagg tgtagatgag ttgttaggta agttctatga gaatgaactg 1380
tctaagtatt tgatcagcat attacgaaaa actgcagcct ggcatattgg gcatttaata 1440
agagatataa cagaaagtct cattgctcat gcaggtttaa agcggtctaa atactggtca 1500
atccatgctt atgatcatgg tggggtaata ttgttcatcc ttccttcaaa gtctttagag 1560
gttgtcggat cttatattcg gtatttcaca gtattcaaag atggtatagg gcttatagat 1620
gaggaaaatt tagactcaaa ggtagacatc gacggtgtgc agtggtgttt ttcaaaagta 1680
atgagtattg acttaaacag gttgttagct ttaaatattg cctttgaaaa ggcacttctt 1740
gctactgcca cttggtttca atattacaca gaagaccaag ggcattttcc attacaacat 1800
gcattaaggt ctgtgttctc ttttcatttt ttattatgtg tttctcagaa aatgaagata 1860
tgtgcaattt ttgataattt acgctatttg atcccagctg tcacatcatt atattcaggt 1920
tatgagctct taatagaaaa attctttgag cggccgttta agagtgcctt agaagtatat 1980
ttatataata taataaaagc attgcttata agcctagcac aaaataataa ggtacgattc 2040
tactctaaag tgcgtcttct tggcctcact gtcgatcact caactgtagg tgcaagtgga 2100
gtttatcctt cattgatgtc tagagttgtt tataagcact atcgtagtct tatttctgaa 2160
gcaacaacat gtttctttct ttttgaaaag ggcctacacg gaaatctaaa tgaggaggct 2220
aaaatacatc ttgagactgt agagtgggca agaaaatttg aggcaaaaga gagaaaatat 2280
ggagacatat taatgaggga aggttacacg attgatgcta tacgtgttgg tgatgtgcag 2340
gtagaacaac aattattttg tcaagaggtt gtggagttaa gtgcagaaga actcaacaag 2400
tatttacaag caaaaagtca ggtcttatca tccaatatca tgaataaaca ttgggataag 2460
ccgtatttta gtcagacaag gaatataagt ttaaagggta tgtctggagc attgcaagaa 2520
gatggacatc ttgcagcaag tgttacgtta attgaggcaa ttagattttt aaatagatca 2580
cagactaatc caaacgttat tgacatgtat gaacagacaa agcagcacaa agctcaagca 2640
cgtattgtga ggaaatatca gcggaccgaa gctgatagag gttttttcat cactactctc 2700
ccgacaagag tcaggttaga aattatagaa gattattatg atgcaatagc tagagttgtc 2760
ccagaggaat atatatcata cggaggagac aagaaaattc taaatataca gactgcatta 2820
gagaaggcat tacgatgggc ttcaggatca tcagaggtca taacaagcac aggaaatgta 2880
attaaattca agaggaggct gatgtatgtg agtgctgatg ccacgaaatg gtcaccagga 2940
gataattcgg caaagtttaa gagattcaca caggcattat atgatggctt gtcagatgag 3000
aagttaaaat gttgcgttgt tgatgccctt agacatgttt atgaaacaga gttctttatg 3060
tccagaaaac ttcatcgcta tatagattct atggatgagc attctgaggc tgtccaagat 3120
ttcctcgatt tttttaaggg tggagtgtct gctacagtca aaggtaattg gctccaaggt 3180
aacttgaaca aatgttcttc attgtttggg gctgcagtgt cactgctgtt taggcgtatt 3240
tgggcagagt tatttccaga attagaatgc ttttttgagt ttgcacatca ctcagatgat 3300
gccctcttta tttatggtta tttagagcca gaagatgatg gaactgattg gtttttatat 3360
gtatctcaac agatacaggc tggtaattat cactggcatg ctgttaacca agagatgtgg 3420
aagagcatgt ttaatttgca tgagcattta ctgctgatgg gctccataaa ggtatcccca 3480
aaaaagacaa cagtttctcc tacaaatgca gaatttcttt ccacattttt tgaaggttgt 3540
gcggtgtcaa tcccttttat aaaaatactg cttggatcgt tatcagattt accaggatta 3600
ggattctttg atgatctggc tgctgcacaa agtagatgtg tcaaagcaat ggacttaggg 3660
gcatccccac agttggcaca attagctgtt gttatttgca ctagtaaagt tgagagatta 3720
tacggcactg cagatgggat ggttaatagt ccagtggcat ttttaaaggt aacgaaggcc 3780
catgtaccca tacctttagg aggtgatggc tcaatgtcta ttatggagct tgccacagca 3840
ggtataggta tggctgataa aaatattctc aagcaagcat tttattctta caagcataca 3900
agacgtgatg gggataggta tgttttgggt cttttcaagt tcttaatgtc tcttagtgaa 3960
gatgtttttc agcatgatag actaggtgag tttagttttg ttggtaaagt tcagtggaag 4020
gtattcacac ctaaaaatga gtttgaattc tttgatcaat tttcacagtc ctacttaaag 4080
agttggacaa atcaacaccc agtatatgat tatattatac ctagaggtag ggataatctt 4140
ttagtctatt tagtcagaaa attaaatgac cctagtattg tcacagctat gacaatgcaa 4200
tctccattac aacttagatt caggatgcag gcaaagcagc acatgaaagt gtgtaagctt 4260
gaaggggaat gggtgacatt cagagaagtt ttagctgcag cagacagttt tgcaactaag 4320
tacaatccca cagaaaagga cttagatctg tttaatacat tagttagttg tacattttct 4380
aaagagtatg catggaaaga tttcttgaac gaagttaggt gtgaagtggt acctacaaaa 4440
catgtccatc ggtcaaaaat cgcaagaact tttacagtgc gtgagaagga tcaagctatt 4500
cagaatccaa ttactgctgt tatagggtat aaatatgctt caactgtaga tgaaatcagt 4560
gatgttttag atagttcctt ttttcctgat tcattatctg ctgaccttca agtcatgaag 4620
gaaggtgtgt atagagagct gggtttagat ataggtcttc ctgaggtgtt gaagcgaata 4680
gcaccacttt tgtacaaagc tgggagatct agagttgtta tagtggaagg caacgtagag 4740
ggcacagcag aatcaatttg tagctattgg cttcgtagca tgtcattggt caaaacaatc 4800
aaagtacgtc caaaaaaaga agtgctcaga gcagtttcac tatatagcac aaaggaaaat 4860
attgggttac aagatgatgt tgcagctaca cgattgtgta tagaagtctg gagatggtgc 4920
aaagctaatg atcagaatgt aaatgactgg ttaaatgcac tgtactttga aaagcaaact 4980
ctcatggatt gggtagaaag gttccgtaga aaaggagtgg ttcctattga ccctgaaatt 5040
cagtgtattg ccttactact ttatgatgtg ttaggttata agagtgtatt gcagatgcag 5100
gcaaataggc gagcatattc agggaaacag tatgatgcat attgtgttca aacgtataat 5160
gaagaaacaa gactctatga gggagattta agggtcacat ttaattttgg ccttgattgt 5220
gcaaggttgg aaatcttttg ggataagaaa gaatatattc ttgaaacatc aattacgcaa 5280
cgtcatgttt taaagttgat gatggaggaa gtcacacaag aattgttaag gtgtgggatg 5340
agatttaaga cagagcaagt aagtcatacg aggagtttgg ttttattcaa aacggaatca 5400
gggtttgagt ggggtaaacc aaatgtgccg tgtatagtct tcaagcattg tgctttgcgt 5460
acaggtttaa ggactaagca agctattaat aaagagttca tgataaatgt ccaagcagat 5520
gggtttagag ctatagcaca gatggatatg gaaagtccga gatttctatt agcacatgct 5580
tatcatacat tacgtgatgt gcgttaccaa gctgtgcagg ctgtaggcaa tgtgtggttt 5640
caaactgctc aacataaatt attcataaat ccaataatat catccgggtt gttagaaaac 5700
tttatgaaag gcttgccagc agcaattcct cctgcagctt attctttaat tatgaataag 5760
gctaagatat ctgtagattt atttatgttc aatgagttgc tggctttagt taacccaaga 5820
aatgttctca atttggacgg aatagaagag acttcagaag gatatagtac agtaacctct 5880
atatctagcc gacaatggtc tgaagaggta agtcttatgg ctgatgatga cattgatgat 5940
gaagaagaat ttacaatagc tcttgatgat atagactttg agcagatcaa tcttgatgag 6000
gacatccaac attttttgca agatgaatca gcttatactg gtgatttaac aatacaaaca 6060
gaggaagttg aggtaaaaag gataaggggt gtaacgcgcg tgcttgaacc agttaagcta 6120
attaagagct gggtttcgaa agggcttgct atcgataaag tgtataaccc tatagggata 6180
gtgctgatgg caaggtacat gtcaaagaat tatgatttta gcaaaattcc cctagcttta 6240
ttaaacccat atgatttaac tgagtttgaa agtgttgtca aaggctgggg tgaaactgtt 6300
aatgacagat ttctagaggt tgacaatgat gcacaacggt tggtccgaga gaaaaacata 6360
ttgcccgaag acatattacc agattcatta ttttctttta ggcacgttga tgtgttgtta 6420
aagagactat tccctcatga ccctgtgtct tcattctatt aa 6462
<210> 102
<211> 1287
<212> DNA
<213> Sin Nombre orthohantavirus
<400> 102
atgagcaccc tcaaagaagt gcaagacaac atcactctcc acgaacaaca actcgtgact 60
gccaggcaga agctcaaaga tgcagaaaga gcggtggaat tggaccccga tgatgttaac 120
aaaagcacat tacagagcag acgggcagct gtgtctgcat tggagaccaa actcggagaa 180
cttaagcggg aactggctga tcttattgca gctcagaaat tggcttcaaa acctgttgat 240
ccaacaggga ttgaacctga tgaccatcta aaggaaaagt catcattgag atatggaaat 300
gtccttgatg taaattccat tgacttagaa gagccaagtg ggcaaacagc tgattggaaa 360
tccatcggac tctacattct aagtttcgca ttaccgatta ttcttaaagc cttgtacatg 420
ttatctacta ggggccgtca aacaatcaaa gaaaacaagg gaacaagaat tcgattcaag 480
gatgattcat cttatgaaga agtcaatggg atacgtaagc caagacatct gtatgtttct 540
atgccaactg cccagtctac aatgaaagca gatgagatta ctcccgggag gttccgtaca 600
attgcttgtg gattattccc agcccaagtc aaagcaagga atattatcag tcctgtcatg 660
ggtgtgattg gctttagttt ttttgtgaaa gattggatgg aaaggattga tgacttcctg 720
gctgcacgtt gcccatttct gcctgagcag aaagacccta gagatgctgc attggcaact 780
aatagagcct attttataac acgtcaatta caggttgatg agtcaaaggt tagtgatatt 840
gaggacctga ttgctgatgc aagggctgag tctgccacta tattcgcaga tattgctact 900
cctcattcag tttgggtctt tgcatgtgct ccagatcgtt gtccacctac agcattatat 960
gtggccggga tgccggaact gggtgcattt tttgctattc tccaggatat gaggaacacc 1020
ataatggcat ccaaatctgt ggggacatct gaagagaaat tgaagaagaa atcagcattc 1080
taccagtcat acttaagacg tactcagtca atgggaattc aactggacca gaagataatc 1140
atcttataca tgagccattg gggaagagag gccgtgaatc acttccatct tggagatgat 1200
atggatcctg agcttaggga acttgcccag acccttgtag atatcaaggt cagggaaatc 1260
tctaaccaag aaccacttaa actttaa 1287
<210> 103
<211> 192
<212> DNA
<213> Sin Nombre orthohantavirus
<400> 103
atgcagaaag agcggtggaa ttggaccccg atgatgttaa caaaagcaca ttacagagca 60
gacgggcagc tgtgtctgca ttggagacca aactcggaga acttaagcgg gaactggctg 120
atcttattgc agctcagaaa ttggcttcaa aacctgttga tccaacaggg attgaacctg 180
atgaccatct aa 192
<210> 104
<211> 3423
<212> DNA
<213> Sin Nombre orthohantavirus
<400> 104
atggtagggt gggtttgcat cttcctcgtg gtccttacta ctgcaactgc tgggctaaca 60
cggaatcttt atgagttgaa gatagaatgt ccacatactg tgggtttagg tcagggttac 120
gtgacaggtt cagtggaaat tacacctatt ctcttaacgc aggtagctga tctgaagatt 180
gagagttctt gtaatttcga tttgcatgtc ccggctacca ctacccaaaa atacaatcag 240
gttgactgga ccaaaaaaag ttcaactaca gaaagcacaa atgcaggtgc aactacattt 300
gaggctaaaa caaaagagat aaatttgaaa ggcacatgta atattcctcc aactacattt 360
gaagctgcat ataaatcaag gaagacagta atttgttatg atttagcctg taatcaaaca 420
cattgtcttc ctacggtcca tttgattgct cctgttcaaa cgtgcatgtc tgtgcggagc 480
tgtatgatag gtttgctgtc aagcaggatt caagtgatat atgagaagac atactgcgtt 540
acaggtcaat taatagaggg gctatgtttc atcccaacac atacaattgc actcacacaa 600
cctggtcata cctatgatac tatgacattg ccagtgactt gttttttagt agctaaaaag 660
ttgggaacac agcttaagct ggctgttgag ttagagaaac tgattactgg tgtaagttgc 720
acagaaaaca gctttcaagg ttactacatc tgttttatcg ggaaacattc agagccctta 780
tttgtgccaa caatggagga ttataggtca gctgagttat ttacccgtat ggttttaaat 840
ccgagaggtg aagatcatga ccctgatcaa aatggacaag gtttaatgag aatagctggg 900
cctgttacag ctaaggtgcc atctacagaa acaactgaaa caatgcaagg aattgcattt 960
gctggagcac caatgtatag ctctttctca accctcgtga ggaaggctga tcctgagtat 1020
gtcttctcac caggtataat tgcagaatca aatcatagtg tttgtgataa aaaaacagta 1080
ccccttacat ggacagggtt tttggcagtt tctggagaga tagagaaaat aacaggctgt 1140
acagtcttct gtacattggc tggacctggt gctagttgtg aagcatactc agaaacagga 1200
atctttaata taagttctcc tacttgtcta gtgaataaag ttcaaaaatt cagaggctca 1260
gaacagagga ttaacttcat gtgccaaaga gttgatcaag atgtagttgt ctattgtaat 1320
ggacaaaaga aagtcattct taccaaaact ctggtcatag gccaatgcat ttatacattc 1380
actagtttat tctcactaat cccaggagtt gcccattctc ttgctgtaga gctatgtgtt 1440
ccaggccttc atggctgggc tacaacggca ttactgatta ctttttgctt tggctggctc 1500
cttataccgg cagtcacctt aattatactg aagatcctga ggttgctcac tttctcatgc 1560
tcacattatt ccacagaatc aaaattcaaa gttatcttag aaagggttaa ggttgaatat 1620
cagaaaacaa tgggctctat ggtgtgtgat atttgccacc acgaatgcga aacagcaaaa 1680
gaacttgaaa cacataagaa aagctgtcca gaaggtcaat gcccgtattg tatgacaata 1740
actgaatcca ctgagagtgc tctccaagcc cattttgcaa tctgtaagct aacaaacagg 1800
tttcaggaaa acttaaaaaa gtcattgaaa cgcccagaag tacggaaagg ttgttacagg 1860
acactgggag tttttagata caagagcaga tgttatgttg gtttagtatg gggaattctt 1920
ttaacaactg aactgatcat atgggcagcc agtgcagaca cccctttaat ggagtctggt 1980
tggtctgaca cagcacatgg tgtgggcata attcctatga agacagattt ggagcttgat 2040
tttgcattgg cctcatcatc ttcttacagt tataggcgaa agcttgttaa tcctgctaat 2100
caagaagaaa cactcccttt tcatttccag ttagataaac aagtagtgca tgcagagatc 2160
cagaacctag gacattggat ggatggcaca ttcaacataa aaactgcttt tcactgttat 2220
ggggagtgta aaaaatatgc ctatccttgg caaacagcca agtgtttctt tgaaaaggat 2280
tatcaatatg aaacaagttg gggctgtaat ccaccagact gtccaggggt aggtacaggt 2340
tgtacagctt gtggggtgta ccttgataag ctccgttcgg ttgggaaagc gtacaagata 2400
gtatcactca aatatacacg gaaggtgtgt attcaattag gaacagaaca aacttgtaaa 2460
catatagatg taaatgattg cctggttacc ccttctgtca aagtttgtat gattggtact 2520
atatcaaagc tccagccagg tgataccttg ttgttcttag gtcctttaga gcagggtggg 2580
atcattctta agcaatggtg tacaacatca tgtgtgtttg gagatcccgg tgatattatg 2640
tcaacaacaa gtgggatgcg gtgcccagaa catactggat cttttagaaa gatctgtggg 2700
tttgctacga caccaacatg tgagtatcaa ggcaacacag tgtctggatt ccaacgcatg 2760
atggcaactc gagattcttt ccagtcattc aatgtgacag aaccacatat cactagcaac 2820
cgacttgagt ggattgatcc agatagcagt atcaaagatc acattaatat ggttttaaat 2880
cgagatgttt cctttcagga tctaagtgat aacccatgca aggttgacct gcatacacaa 2940
tcaattgacg gggcctgggg ttcaggagta ggttttacgt tggtatgtac tgtggggctt 3000
acagagtgtg caaattttat aacttcaatt aaagcatgtg attctgccat gtgttatgga 3060
gccacagtga caaatctgct tagagggtct aacacagtta aagttgttgg taaaggtggg 3120
cattctggat ctttgtttaa atgctgccat gatactgact gtaccgaaga agggttagca 3180
gcatctccac cacatttaga cagggttaca ggctataatc aaatagattc tgataaagtt 3240
tatgatgacg gtgcaccgcc ctgtacaatc aagtgctggt tcaccaagtc aggtgaatgg 3300
ctgttgggaa tccttaatgg caattgggtg gtagttgctg ttctgattgt aattttgata 3360
ttatcgatac tcctttttag ctttttttgt cctgtcagaa gtagaaagaa taaagctaat 3420
tag 3423
<210> 105
<400> 105
000
<210> 106
<400> 106
000
<210> 107
<400> 107
000
<210> 108
<400> 108
000
<210> 109
<400> 109
000
<210> 110
<400> 110
000
<210> 111
<400> 111
000
<210> 112
<400> 112
000
<210> 113
<400> 113
000
<210> 114
<400> 114
000
<210> 115
<400> 115
000
<210> 116
<400> 116
000
<210> 117
<400> 117
000
<210> 118
<400> 118
000
<210> 119
<400> 119
000
<210> 120
<400> 120
000
<210> 121
<400> 121
000
<210> 122
<400> 122
000
<210> 123
<400> 123
000
<210> 124
<400> 124
000
<210> 125
<400> 125
000
<210> 126
<400> 126
000
<210> 127
<400> 127
000
<210> 128
<400> 128
000
<210> 129
<400> 129
000
<210> 130
<400> 130
000
<210> 131
<400> 131
000
<210> 132
<400> 132
000
<210> 133
<400> 133
000
<210> 134
<400> 134
000
<210> 135
<400> 135
000
<210> 136
<400> 136
000
<210> 137
<400> 137
000
<210> 138
<400> 138
000
<210> 139
<400> 139
000
<210> 140
<400> 140
000
<210> 141
<400> 141
000
<210> 142
<400> 142
000
<210> 143
<400> 143
000
<210> 144
<400> 144
000
<210> 145
<400> 145
000
<210> 146
<400> 146
000
<210> 147
<400> 147
000
<210> 148
<400> 148
000
<210> 149
<400> 149
000
<210> 150
<400> 150
000
<210> 151
<211> 2153
<212> PRT
<213> Sin Nombre orthohantavirus
<400> 151
Met Glu Lys Tyr Arg Glu Ile His Gln Arg Val Lys Glu Ile Pro Pro
1 5 10 15
Gly Gly Ala Ser Ala Leu Glu Cys Leu Asp Leu Leu Asp Arg Leu Tyr
20 25 30
Ala Val Arg His Asp Val Val Asp Gln Met Ile Lys His Asp Trp Ser
35 40 45
Asp Asn Lys Asp Met Glu Arg Pro Ile Gly Gln Val Leu Leu Met Ala
50 55 60
Gly Val Pro Asn Asp Val Ile Gln Gly Met Glu Lys Lys Val Ile Pro
65 70 75 80
Thr Ser Pro Ser Gly Gln Ile Leu Lys Ser Phe Phe Arg Met Thr Pro
85 90 95
Asp Asn Tyr Lys Ile Thr Gly Ala Leu Ile Glu Phe Ile Glu Val Thr
100 105 110
Val Thr Ala Asp Val Ala Lys Gly Ile Arg Glu Lys Lys Leu Lys Tyr
115 120 125
Glu Ser Gly Leu Gln Phe Val Glu Ser Leu Leu Ser Gln Glu His Lys
130 135 140
Lys Gly Asn Ile Asn Gln Ala Tyr Lys Ile Thr Phe Asp Val Val Ala
145 150 155 160
Val Lys Thr Asp Gly Ser Asn Ile Ser Thr Gln Trp Pro Ser Arg Arg
165 170 175
Asn Asp Gly Val Val Gln His Met Arg Leu Val Gln Ala Asp Ile Asn
180 185 190
Tyr Val Arg Glu His Leu Ile Lys Pro Asp Glu Arg Ala Ser Leu Glu
195 200 205
Ala Met Phe Asn Leu Lys Phe His Val Gly Gly Pro Lys Leu Arg Tyr
210 215 220
Phe Asn Ile Pro Asp Tyr Lys Pro Gln Ser Leu Cys Gln Pro Glu Ile
225 230 235 240
Thr Asn Leu Ile Gln Tyr Cys Lys His Trp Leu Thr Glu Asp His Asp
245 250 255
Phe Val Phe Lys Glu Val Thr Gly Asn Asn Val Met Asn Ser Phe Glu
260 265 270
Asn Asn Glu Ser Val Tyr Met Ser Arg Tyr Arg Glu Ser Arg Lys Pro
275 280 285
Arg Asn Phe Leu Leu Ile Gln Gly Ser Ile Gln Gly Pro Tyr Leu Pro
290 295 300
Ser Thr Ile Ser Ser Asp Gln Cys Asp Thr Arg Ile Gly Cys Leu Glu
305 310 315 320
Val Leu Lys Val His Pro Glu Thr Pro Val Gln Ala Ile Ala Val Asp
325 330 335
Met Ala Tyr Lys Tyr Met Glu Leu Asn Arg Asp Glu Ile Ile Asn Tyr
340 345 350
Tyr Asn Pro Arg Val His Phe Gln Ala Thr Gln Ser Val Lys Glu Pro
355 360 365
Gly Thr Phe Lys Leu Gly Leu Ser Gln Leu Asn Pro Met Ser Lys Ser
370 375 380
Ile Leu Asp Gln Val Gly Lys His Lys Ser Glu Lys Gly Leu Phe Gly
385 390 395 400
Glu Pro Leu Glu Ser Ile Asn Ile Ser Ser Gln Ile Gln Gln Asn Glu
405 410 415
Cys Ser Arg Ile Ile Glu Ser Ile Leu Ser Asn Leu Glu Ile Asn Val
420 425 430
Gly Glu Val Thr Met Ser Leu Ala Asn Pro Arg Lys Thr Thr Gly Val
435 440 445
Asp Glu Leu Leu Gly Lys Phe Tyr Glu Asn Glu Leu Ser Lys Tyr Leu
450 455 460
Ile Ser Ile Leu Arg Lys Thr Ala Ala Trp His Ile Gly His Leu Ile
465 470 475 480
Arg Asp Ile Thr Glu Ser Leu Ile Ala His Ala Gly Leu Lys Arg Ser
485 490 495
Lys Tyr Trp Ser Ile His Ala Tyr Asp His Gly Gly Val Ile Leu Phe
500 505 510
Ile Leu Pro Ser Lys Ser Leu Glu Val Val Gly Ser Tyr Ile Arg Tyr
515 520 525
Phe Thr Val Phe Lys Asp Gly Ile Gly Leu Ile Asp Glu Glu Asn Leu
530 535 540
Asp Ser Lys Val Asp Ile Asp Gly Val Gln Trp Cys Phe Ser Lys Val
545 550 555 560
Met Ser Ile Asp Leu Asn Arg Leu Leu Ala Leu Asn Ile Ala Phe Glu
565 570 575
Lys Ala Leu Leu Ala Thr Ala Thr Trp Phe Gln Tyr Tyr Thr Glu Asp
580 585 590
Gln Gly His Phe Pro Leu Gln His Ala Leu Arg Ser Val Phe Ser Phe
595 600 605
His Phe Leu Leu Cys Val Ser Gln Lys Met Lys Ile Cys Ala Ile Phe
610 615 620
Asp Asn Leu Arg Tyr Leu Ile Pro Ala Val Thr Ser Leu Tyr Ser Gly
625 630 635 640
Tyr Glu Leu Leu Ile Glu Lys Phe Phe Glu Arg Pro Phe Lys Ser Ala
645 650 655
Leu Glu Val Tyr Leu Tyr Asn Ile Ile Lys Ala Leu Leu Ile Ser Leu
660 665 670
Ala Gln Asn Asn Lys Val Arg Phe Tyr Ser Lys Val Arg Leu Leu Gly
675 680 685
Leu Thr Val Asp His Ser Thr Val Gly Ala Ser Gly Val Tyr Pro Ser
690 695 700
Leu Met Ser Arg Val Val Tyr Lys His Tyr Arg Ser Leu Ile Ser Glu
705 710 715 720
Ala Thr Thr Cys Phe Phe Leu Phe Glu Lys Gly Leu His Gly Asn Leu
725 730 735
Asn Glu Glu Ala Lys Ile His Leu Glu Thr Val Glu Trp Ala Arg Lys
740 745 750
Phe Glu Ala Lys Glu Arg Lys Tyr Gly Asp Ile Leu Met Arg Glu Gly
755 760 765
Tyr Thr Ile Asp Ala Ile Arg Val Gly Asp Val Gln Val Glu Gln Gln
770 775 780
Leu Phe Cys Gln Glu Val Val Glu Leu Ser Ala Glu Glu Leu Asn Lys
785 790 795 800
Tyr Leu Gln Ala Lys Ser Gln Val Leu Ser Ser Asn Ile Met Asn Lys
805 810 815
His Trp Asp Lys Pro Tyr Phe Ser Gln Thr Arg Asn Ile Ser Leu Lys
820 825 830
Gly Met Ser Gly Ala Leu Gln Glu Asp Gly His Leu Ala Ala Ser Val
835 840 845
Thr Leu Ile Glu Ala Ile Arg Phe Leu Asn Arg Ser Gln Thr Asn Pro
850 855 860
Asn Val Ile Asp Met Tyr Glu Gln Thr Lys Gln His Lys Ala Gln Ala
865 870 875 880
Arg Ile Val Arg Lys Tyr Gln Arg Thr Glu Ala Asp Arg Gly Phe Phe
885 890 895
Ile Thr Thr Leu Pro Thr Arg Val Arg Leu Glu Ile Ile Glu Asp Tyr
900 905 910
Tyr Asp Ala Ile Ala Arg Val Val Pro Glu Glu Tyr Ile Ser Tyr Gly
915 920 925
Gly Asp Lys Lys Ile Leu Asn Ile Gln Thr Ala Leu Glu Lys Ala Leu
930 935 940
Arg Trp Ala Ser Gly Ser Ser Glu Val Ile Thr Ser Thr Gly Asn Val
945 950 955 960
Ile Lys Phe Lys Arg Arg Leu Met Tyr Val Ser Ala Asp Ala Thr Lys
965 970 975
Trp Ser Pro Gly Asp Asn Ser Ala Lys Phe Lys Arg Phe Thr Gln Ala
980 985 990
Leu Tyr Asp Gly Leu Ser Asp Glu Lys Leu Lys Cys Cys Val Val Asp
995 1000 1005
Ala Leu Arg His Val Tyr Glu Thr Glu Phe Phe Met Ser Arg Lys
1010 1015 1020
Leu His Arg Tyr Ile Asp Ser Met Asp Glu His Ser Glu Ala Val
1025 1030 1035
Gln Asp Phe Leu Asp Phe Phe Lys Gly Gly Val Ser Ala Thr Val
1040 1045 1050
Lys Gly Asn Trp Leu Gln Gly Asn Leu Asn Lys Cys Ser Ser Leu
1055 1060 1065
Phe Gly Ala Ala Val Ser Leu Leu Phe Arg Arg Ile Trp Ala Glu
1070 1075 1080
Leu Phe Pro Glu Leu Glu Cys Phe Phe Glu Phe Ala His His Ser
1085 1090 1095
Asp Asp Ala Leu Phe Ile Tyr Gly Tyr Leu Glu Pro Glu Asp Asp
1100 1105 1110
Gly Thr Asp Trp Phe Leu Tyr Val Ser Gln Gln Ile Gln Ala Gly
1115 1120 1125
Asn Tyr His Trp His Ala Val Asn Gln Glu Met Trp Lys Ser Met
1130 1135 1140
Phe Asn Leu His Glu His Leu Leu Leu Met Gly Ser Ile Lys Val
1145 1150 1155
Ser Pro Lys Lys Thr Thr Val Ser Pro Thr Asn Ala Glu Phe Leu
1160 1165 1170
Ser Thr Phe Phe Glu Gly Cys Ala Val Ser Ile Pro Phe Ile Lys
1175 1180 1185
Ile Leu Leu Gly Ser Leu Ser Asp Leu Pro Gly Leu Gly Phe Phe
1190 1195 1200
Asp Asp Leu Ala Ala Ala Gln Ser Arg Cys Val Lys Ala Met Asp
1205 1210 1215
Leu Gly Ala Ser Pro Gln Leu Ala Gln Leu Ala Val Val Ile Cys
1220 1225 1230
Thr Ser Lys Val Glu Arg Leu Tyr Gly Thr Ala Asp Gly Met Val
1235 1240 1245
Asn Ser Pro Val Ala Phe Leu Lys Val Thr Lys Ala His Val Pro
1250 1255 1260
Ile Pro Leu Gly Gly Asp Gly Ser Met Ser Ile Met Glu Leu Ala
1265 1270 1275
Thr Ala Gly Ile Gly Met Ala Asp Lys Asn Ile Leu Lys Gln Ala
1280 1285 1290
Phe Tyr Ser Tyr Lys His Thr Arg Arg Asp Gly Asp Arg Tyr Val
1295 1300 1305
Leu Gly Leu Phe Lys Phe Leu Met Ser Leu Ser Glu Asp Val Phe
1310 1315 1320
Gln His Asp Arg Leu Gly Glu Phe Ser Phe Val Gly Lys Val Gln
1325 1330 1335
Trp Lys Val Phe Thr Pro Lys Asn Glu Phe Glu Phe Phe Asp Gln
1340 1345 1350
Phe Ser Gln Ser Tyr Leu Lys Ser Trp Thr Asn Gln His Pro Val
1355 1360 1365
Tyr Asp Tyr Ile Ile Pro Arg Gly Arg Asp Asn Leu Leu Val Tyr
1370 1375 1380
Leu Val Arg Lys Leu Asn Asp Pro Ser Ile Val Thr Ala Met Thr
1385 1390 1395
Met Gln Ser Pro Leu Gln Leu Arg Phe Arg Met Gln Ala Lys Gln
1400 1405 1410
His Met Lys Val Cys Lys Leu Glu Gly Glu Trp Val Thr Phe Arg
1415 1420 1425
Glu Val Leu Ala Ala Ala Asp Ser Phe Ala Thr Lys Tyr Asn Pro
1430 1435 1440
Thr Glu Lys Asp Leu Asp Leu Phe Asn Thr Leu Val Ser Cys Thr
1445 1450 1455
Phe Ser Lys Glu Tyr Ala Trp Lys Asp Phe Leu Asn Glu Val Arg
1460 1465 1470
Cys Glu Val Val Pro Thr Lys His Val His Arg Ser Lys Ile Ala
1475 1480 1485
Arg Thr Phe Thr Val Arg Glu Lys Asp Gln Ala Ile Gln Asn Pro
1490 1495 1500
Ile Thr Ala Val Ile Gly Tyr Lys Tyr Ala Ser Thr Val Asp Glu
1505 1510 1515
Ile Ser Asp Val Leu Asp Ser Ser Phe Phe Pro Asp Ser Leu Ser
1520 1525 1530
Ala Asp Leu Gln Val Met Lys Glu Gly Val Tyr Arg Glu Leu Gly
1535 1540 1545
Leu Asp Ile Gly Leu Pro Glu Val Leu Lys Arg Ile Ala Pro Leu
1550 1555 1560
Leu Tyr Lys Ala Gly Arg Ser Arg Val Val Ile Val Glu Gly Asn
1565 1570 1575
Val Glu Gly Thr Ala Glu Ser Ile Cys Ser Tyr Trp Leu Arg Ser
1580 1585 1590
Met Ser Leu Val Lys Thr Ile Lys Val Arg Pro Lys Lys Glu Val
1595 1600 1605
Leu Arg Ala Val Ser Leu Tyr Ser Thr Lys Glu Asn Ile Gly Leu
1610 1615 1620
Gln Asp Asp Val Ala Ala Thr Arg Leu Cys Ile Glu Val Trp Arg
1625 1630 1635
Trp Cys Lys Ala Asn Asp Gln Asn Val Asn Asp Trp Leu Asn Ala
1640 1645 1650
Leu Tyr Phe Glu Lys Gln Thr Leu Met Asp Trp Val Glu Arg Phe
1655 1660 1665
Arg Arg Lys Gly Val Val Pro Ile Asp Pro Glu Ile Gln Cys Ile
1670 1675 1680
Ala Leu Leu Leu Tyr Asp Val Leu Gly Tyr Lys Ser Val Leu Gln
1685 1690 1695
Met Gln Ala Asn Arg Arg Ala Tyr Ser Gly Lys Gln Tyr Asp Ala
1700 1705 1710
Tyr Cys Val Gln Thr Tyr Asn Glu Glu Thr Arg Leu Tyr Glu Gly
1715 1720 1725
Asp Leu Arg Val Thr Phe Asn Phe Gly Leu Asp Cys Ala Arg Leu
1730 1735 1740
Glu Ile Phe Trp Asp Lys Lys Glu Tyr Ile Leu Glu Thr Ser Ile
1745 1750 1755
Thr Gln Arg His Val Leu Lys Leu Met Met Glu Glu Val Thr Gln
1760 1765 1770
Glu Leu Leu Arg Cys Gly Met Arg Phe Lys Thr Glu Gln Val Ser
1775 1780 1785
His Thr Arg Ser Leu Val Leu Phe Lys Thr Glu Ser Gly Phe Glu
1790 1795 1800
Trp Gly Lys Pro Asn Val Pro Cys Ile Val Phe Lys His Cys Ala
1805 1810 1815
Leu Arg Thr Gly Leu Arg Thr Lys Gln Ala Ile Asn Lys Glu Phe
1820 1825 1830
Met Ile Asn Val Gln Ala Asp Gly Phe Arg Ala Ile Ala Gln Met
1835 1840 1845
Asp Met Glu Ser Pro Arg Phe Leu Leu Ala His Ala Tyr His Thr
1850 1855 1860
Leu Arg Asp Val Arg Tyr Gln Ala Val Gln Ala Val Gly Asn Val
1865 1870 1875
Trp Phe Gln Thr Ala Gln His Lys Leu Phe Ile Asn Pro Ile Ile
1880 1885 1890
Ser Ser Gly Leu Leu Glu Asn Phe Met Lys Gly Leu Pro Ala Ala
1895 1900 1905
Ile Pro Pro Ala Ala Tyr Ser Leu Ile Met Asn Lys Ala Lys Ile
1910 1915 1920
Ser Val Asp Leu Phe Met Phe Asn Glu Leu Leu Ala Leu Val Asn
1925 1930 1935
Pro Arg Asn Val Leu Asn Leu Asp Gly Ile Glu Glu Thr Ser Glu
1940 1945 1950
Gly Tyr Ser Thr Val Thr Ser Ile Ser Ser Arg Gln Trp Ser Glu
1955 1960 1965
Glu Val Ser Leu Met Ala Asp Asp Asp Ile Asp Asp Glu Glu Glu
1970 1975 1980
Phe Thr Ile Ala Leu Asp Asp Ile Asp Phe Glu Gln Ile Asn Leu
1985 1990 1995
Asp Glu Asp Ile Gln His Phe Leu Gln Asp Glu Ser Ala Tyr Thr
2000 2005 2010
Gly Asp Leu Thr Ile Gln Thr Glu Glu Val Glu Val Lys Arg Ile
2015 2020 2025
Arg Gly Val Thr Arg Val Leu Glu Pro Val Lys Leu Ile Lys Ser
2030 2035 2040
Trp Val Ser Lys Gly Leu Ala Ile Asp Lys Val Tyr Asn Pro Ile
2045 2050 2055
Gly Ile Val Leu Met Ala Arg Tyr Met Ser Lys Asn Tyr Asp Phe
2060 2065 2070
Ser Lys Ile Pro Leu Ala Leu Leu Asn Pro Tyr Asp Leu Thr Glu
2075 2080 2085
Phe Glu Ser Val Val Lys Gly Trp Gly Glu Thr Val Asn Asp Arg
2090 2095 2100
Phe Leu Glu Val Asp Asn Asp Ala Gln Arg Leu Val Arg Glu Lys
2105 2110 2115
Asn Ile Leu Pro Glu Asp Ile Leu Pro Asp Ser Leu Phe Ser Phe
2120 2125 2130
Arg His Val Asp Val Leu Leu Lys Arg Leu Phe Pro His Asp Pro
2135 2140 2145
Val Ser Ser Phe Tyr
2150
<210> 152
<211> 428
<212> PRT
<213> Sin Nombre orthohantavirus
<400> 152
Met Ser Thr Leu Lys Glu Val Gln Asp Asn Ile Thr Leu His Glu Gln
1 5 10 15
Gln Leu Val Thr Ala Arg Gln Lys Leu Lys Asp Ala Glu Arg Ala Val
20 25 30
Glu Leu Asp Pro Asp Asp Val Asn Lys Ser Thr Leu Gln Ser Arg Arg
35 40 45
Ala Ala Val Ser Ala Leu Glu Thr Lys Leu Gly Glu Leu Lys Arg Glu
50 55 60
Leu Ala Asp Leu Ile Ala Ala Gln Lys Leu Ala Ser Lys Pro Val Asp
65 70 75 80
Pro Thr Gly Ile Glu Pro Asp Asp His Leu Lys Glu Lys Ser Ser Leu
85 90 95
Arg Tyr Gly Asn Val Leu Asp Val Asn Ser Ile Asp Leu Glu Glu Pro
100 105 110
Ser Gly Gln Thr Ala Asp Trp Lys Ser Ile Gly Leu Tyr Ile Leu Ser
115 120 125
Phe Ala Leu Pro Ile Ile Leu Lys Ala Leu Tyr Met Leu Ser Thr Arg
130 135 140
Gly Arg Gln Thr Ile Lys Glu Asn Lys Gly Thr Arg Ile Arg Phe Lys
145 150 155 160
Asp Asp Ser Ser Tyr Glu Glu Val Asn Gly Ile Arg Lys Pro Arg His
165 170 175
Leu Tyr Val Ser Met Pro Thr Ala Gln Ser Thr Met Lys Ala Asp Glu
180 185 190
Ile Thr Pro Gly Arg Phe Arg Thr Ile Ala Cys Gly Leu Phe Pro Ala
195 200 205
Gln Val Lys Ala Arg Asn Ile Ile Ser Pro Val Met Gly Val Ile Gly
210 215 220
Phe Ser Phe Phe Val Lys Asp Trp Met Glu Arg Ile Asp Asp Phe Leu
225 230 235 240
Ala Ala Arg Cys Pro Phe Leu Pro Glu Gln Lys Asp Pro Arg Asp Ala
245 250 255
Ala Leu Ala Thr Asn Arg Ala Tyr Phe Ile Thr Arg Gln Leu Gln Val
260 265 270
Asp Glu Ser Lys Val Ser Asp Ile Glu Asp Leu Ile Ala Asp Ala Arg
275 280 285
Ala Glu Ser Ala Thr Ile Phe Ala Asp Ile Ala Thr Pro His Ser Val
290 295 300
Trp Val Phe Ala Cys Ala Pro Asp Arg Cys Pro Pro Thr Ala Leu Tyr
305 310 315 320
Val Ala Gly Met Pro Glu Leu Gly Ala Phe Phe Ala Ile Leu Gln Asp
325 330 335
Met Arg Asn Thr Ile Met Ala Ser Lys Ser Val Gly Thr Ser Glu Glu
340 345 350
Lys Leu Lys Lys Lys Ser Ala Phe Tyr Gln Ser Tyr Leu Arg Arg Thr
355 360 365
Gln Ser Met Gly Ile Gln Leu Asp Gln Lys Ile Ile Ile Leu Tyr Met
370 375 380
Ser His Trp Gly Arg Glu Ala Val Asn His Phe His Leu Gly Asp Asp
385 390 395 400
Met Asp Pro Glu Leu Arg Glu Leu Ala Gln Thr Leu Val Asp Ile Lys
405 410 415
Val Arg Glu Ile Ser Asn Gln Glu Pro Leu Lys Leu
420 425
<210> 153
<211> 63
<212> PRT
<213> Sin Nombre orthohantavirus
<400> 153
Met Gln Lys Glu Arg Trp Asn Trp Thr Pro Met Met Leu Thr Lys Ala
1 5 10 15
His Tyr Arg Ala Asp Gly Gln Leu Cys Leu His Trp Arg Pro Asn Ser
20 25 30
Glu Asn Leu Ser Gly Asn Trp Leu Ile Leu Leu Gln Leu Arg Asn Trp
35 40 45
Leu Gln Asn Leu Leu Ile Gln Gln Gly Leu Asn Leu Met Thr Ile
50 55 60
<210> 154
<211> 1140
<212> PRT
<213> Sin Nombre orthohantavirus
<400> 154
Met Val Gly Trp Val Cys Ile Phe Leu Val Val Leu Thr Thr Ala Thr
1 5 10 15
Ala Gly Leu Thr Arg Asn Leu Tyr Glu Leu Lys Ile Glu Cys Pro His
20 25 30
Thr Val Gly Leu Gly Gln Gly Tyr Val Thr Gly Ser Val Glu Ile Thr
35 40 45
Pro Ile Leu Leu Thr Gln Val Ala Asp Leu Lys Ile Glu Ser Ser Cys
50 55 60
Asn Phe Asp Leu His Val Pro Ala Thr Thr Thr Gln Lys Tyr Asn Gln
65 70 75 80
Val Asp Trp Thr Lys Lys Ser Ser Thr Thr Glu Ser Thr Asn Ala Gly
85 90 95
Ala Thr Thr Phe Glu Ala Lys Thr Lys Glu Ile Asn Leu Lys Gly Thr
100 105 110
Cys Asn Ile Pro Pro Thr Thr Phe Glu Ala Ala Tyr Lys Ser Arg Lys
115 120 125
Thr Val Ile Cys Tyr Asp Leu Ala Cys Asn Gln Thr His Cys Leu Pro
130 135 140
Thr Val His Leu Ile Ala Pro Val Gln Thr Cys Met Ser Val Arg Ser
145 150 155 160
Cys Met Ile Gly Leu Leu Ser Ser Arg Ile Gln Val Ile Tyr Glu Lys
165 170 175
Thr Tyr Cys Val Thr Gly Gln Leu Ile Glu Gly Leu Cys Phe Ile Pro
180 185 190
Thr His Thr Ile Ala Leu Thr Gln Pro Gly His Thr Tyr Asp Thr Met
195 200 205
Thr Leu Pro Val Thr Cys Phe Leu Val Ala Lys Lys Leu Gly Thr Gln
210 215 220
Leu Lys Leu Ala Val Glu Leu Glu Lys Leu Ile Thr Gly Val Ser Cys
225 230 235 240
Thr Glu Asn Ser Phe Gln Gly Tyr Tyr Ile Cys Phe Ile Gly Lys His
245 250 255
Ser Glu Pro Leu Phe Val Pro Thr Met Glu Asp Tyr Arg Ser Ala Glu
260 265 270
Leu Phe Thr Arg Met Val Leu Asn Pro Arg Gly Glu Asp His Asp Pro
275 280 285
Asp Gln Asn Gly Gln Gly Leu Met Arg Ile Ala Gly Pro Val Thr Ala
290 295 300
Lys Val Pro Ser Thr Glu Thr Thr Glu Thr Met Gln Gly Ile Ala Phe
305 310 315 320
Ala Gly Ala Pro Met Tyr Ser Ser Phe Ser Thr Leu Val Arg Lys Ala
325 330 335
Asp Pro Glu Tyr Val Phe Ser Pro Gly Ile Ile Ala Glu Ser Asn His
340 345 350
Ser Val Cys Asp Lys Lys Thr Val Pro Leu Thr Trp Thr Gly Phe Leu
355 360 365
Ala Val Ser Gly Glu Ile Glu Lys Ile Thr Gly Cys Thr Val Phe Cys
370 375 380
Thr Leu Ala Gly Pro Gly Ala Ser Cys Glu Ala Tyr Ser Glu Thr Gly
385 390 395 400
Ile Phe Asn Ile Ser Ser Pro Thr Cys Leu Val Asn Lys Val Gln Lys
405 410 415
Phe Arg Gly Ser Glu Gln Arg Ile Asn Phe Met Cys Gln Arg Val Asp
420 425 430
Gln Asp Val Val Val Tyr Cys Asn Gly Gln Lys Lys Val Ile Leu Thr
435 440 445
Lys Thr Leu Val Ile Gly Gln Cys Ile Tyr Thr Phe Thr Ser Leu Phe
450 455 460
Ser Leu Ile Pro Gly Val Ala His Ser Leu Ala Val Glu Leu Cys Val
465 470 475 480
Pro Gly Leu His Gly Trp Ala Thr Thr Ala Leu Leu Ile Thr Phe Cys
485 490 495
Phe Gly Trp Leu Leu Ile Pro Ala Val Thr Leu Ile Ile Leu Lys Ile
500 505 510
Leu Arg Leu Leu Thr Phe Ser Cys Ser His Tyr Ser Thr Glu Ser Lys
515 520 525
Phe Lys Val Ile Leu Glu Arg Val Lys Val Glu Tyr Gln Lys Thr Met
530 535 540
Gly Ser Met Val Cys Asp Ile Cys His His Glu Cys Glu Thr Ala Lys
545 550 555 560
Glu Leu Glu Thr His Lys Lys Ser Cys Pro Glu Gly Gln Cys Pro Tyr
565 570 575
Cys Met Thr Ile Thr Glu Ser Thr Glu Ser Ala Leu Gln Ala His Phe
580 585 590
Ala Ile Cys Lys Leu Thr Asn Arg Phe Gln Glu Asn Leu Lys Lys Ser
595 600 605
Leu Lys Arg Pro Glu Val Arg Lys Gly Cys Tyr Arg Thr Leu Gly Val
610 615 620
Phe Arg Tyr Lys Ser Arg Cys Tyr Val Gly Leu Val Trp Gly Ile Leu
625 630 635 640
Leu Thr Thr Glu Leu Ile Ile Trp Ala Ala Ser Ala Asp Thr Pro Leu
645 650 655
Met Glu Ser Gly Trp Ser Asp Thr Ala His Gly Val Gly Ile Ile Pro
660 665 670
Met Lys Thr Asp Leu Glu Leu Asp Phe Ala Leu Ala Ser Ser Ser Ser
675 680 685
Tyr Ser Tyr Arg Arg Lys Leu Val Asn Pro Ala Asn Gln Glu Glu Thr
690 695 700
Leu Pro Phe His Phe Gln Leu Asp Lys Gln Val Val His Ala Glu Ile
705 710 715 720
Gln Asn Leu Gly His Trp Met Asp Gly Thr Phe Asn Ile Lys Thr Ala
725 730 735
Phe His Cys Tyr Gly Glu Cys Lys Lys Tyr Ala Tyr Pro Trp Gln Thr
740 745 750
Ala Lys Cys Phe Phe Glu Lys Asp Tyr Gln Tyr Glu Thr Ser Trp Gly
755 760 765
Cys Asn Pro Pro Asp Cys Pro Gly Val Gly Thr Gly Cys Thr Ala Cys
770 775 780
Gly Val Tyr Leu Asp Lys Leu Arg Ser Val Gly Lys Ala Tyr Lys Ile
785 790 795 800
Val Ser Leu Lys Tyr Thr Arg Lys Val Cys Ile Gln Leu Gly Thr Glu
805 810 815
Gln Thr Cys Lys His Ile Asp Val Asn Asp Cys Leu Val Thr Pro Ser
820 825 830
Val Lys Val Cys Met Ile Gly Thr Ile Ser Lys Leu Gln Pro Gly Asp
835 840 845
Thr Leu Leu Phe Leu Gly Pro Leu Glu Gln Gly Gly Ile Ile Leu Lys
850 855 860
Gln Trp Cys Thr Thr Ser Cys Val Phe Gly Asp Pro Gly Asp Ile Met
865 870 875 880
Ser Thr Thr Ser Gly Met Arg Cys Pro Glu His Thr Gly Ser Phe Arg
885 890 895
Lys Ile Cys Gly Phe Ala Thr Thr Pro Thr Cys Glu Tyr Gln Gly Asn
900 905 910
Thr Val Ser Gly Phe Gln Arg Met Met Ala Thr Arg Asp Ser Phe Gln
915 920 925
Ser Phe Asn Val Thr Glu Pro His Ile Thr Ser Asn Arg Leu Glu Trp
930 935 940
Ile Asp Pro Asp Ser Ser Ile Lys Asp His Ile Asn Met Val Leu Asn
945 950 955 960
Arg Asp Val Ser Phe Gln Asp Leu Ser Asp Asn Pro Cys Lys Val Asp
965 970 975
Leu His Thr Gln Ser Ile Asp Gly Ala Trp Gly Ser Gly Val Gly Phe
980 985 990
Thr Leu Val Cys Thr Val Gly Leu Thr Glu Cys Ala Asn Phe Ile Thr
995 1000 1005
Ser Ile Lys Ala Cys Asp Ser Ala Met Cys Tyr Gly Ala Thr Val
1010 1015 1020
Thr Asn Leu Leu Arg Gly Ser Asn Thr Val Lys Val Val Gly Lys
1025 1030 1035
Gly Gly His Ser Gly Ser Leu Phe Lys Cys Cys His Asp Thr Asp
1040 1045 1050
Cys Thr Glu Glu Gly Leu Ala Ala Ser Pro Pro His Leu Asp Arg
1055 1060 1065
Val Thr Gly Tyr Asn Gln Ile Asp Ser Asp Lys Val Tyr Asp Asp
1070 1075 1080
Gly Ala Pro Pro Cys Thr Ile Lys Cys Trp Phe Thr Lys Ser Gly
1085 1090 1095
Glu Trp Leu Leu Gly Ile Leu Asn Gly Asn Trp Val Val Val Ala
1100 1105 1110
Val Leu Ile Val Ile Leu Ile Leu Ser Ile Leu Leu Phe Ser Phe
1115 1120 1125
Phe Cys Pro Val Arg Ser Arg Lys Asn Lys Ala Asn
1130 1135 1140
<210> 155
<400> 155
000
<210> 156
<400> 156
000
<210> 157
<400> 157
000
<210> 158
<400> 158
000
<210> 159
<400> 159
000
<210> 160
<400> 160
000
<210> 161
<400> 161
000
<210> 162
<400> 162
000
<210> 163
<400> 163
000
<210> 164
<400> 164
000
<210> 165
<400> 165
000
<210> 166
<400> 166
000
<210> 167
<400> 167
000
<210> 168
<400> 168
000
<210> 169
<400> 169
000
<210> 170
<400> 170
000
<210> 171
<400> 171
000
<210> 172
<400> 172
000
<210> 173
<400> 173
000
<210> 174
<400> 174
000
<210> 175
<400> 175
000
<210> 176
<400> 176
000
<210> 177
<400> 177
000
<210> 178
<400> 178
000
<210> 179
<400> 179
000
<210> 180
<400> 180
000
<210> 181
<400> 181
000
<210> 182
<400> 182
000
<210> 183
<400> 183
000
<210> 184
<400> 184
000
<210> 185
<400> 185
000
<210> 186
<400> 186
000
<210> 187
<400> 187
000
<210> 188
<400> 188
000
<210> 189
<400> 189
000
<210> 190
<400> 190
000
<210> 191
<400> 191
000
<210> 192
<400> 192
000
<210> 193
<400> 193
000
<210> 194
<400> 194
000
<210> 195
<400> 195
000
<210> 196
<400> 196
000
<210> 197
<400> 197
000
<210> 198
<400> 198
000
<210> 199
<400> 199
000
<210> 200
<400> 200
000
<210> 201
<211> 20019
<212> DNA
<213> Avian coronavirus
<400> 201
atggccccag gccttagcaa gggagtatct cccaataaaa agaatgtcat ttttgttttg 60
aaggacattc aacctgcatt gtgtgatgct ttgttctttt atacatcaca cactcctcgc 120
gactttgctg atgctcatgc cgttcgtgaa cggtttgatc gcaatttaca gagtggtcgc 180
gtttttaaat ttgaaactgt gtgtggccct gtttatttac agggtgtacc ctcagtcccg 240
ccgggtgtga aagctttggg ttctgaatcc aagcttgcag atttggaaag cctttttggt 300
gtgtctcctc tgtctaggcg ttatagagat ttgttgaaga cggcacccca gtggtcgcta 360
aatgttgaat ctcttgatgc tcaggcagaa aaattggaca ctctttttaa ttcttcagag 420
attttgtggc ttcaggtcgc cgctaaggtc caagtgtctg ctatggcact acgccttatg 480
gctaatgatg ttgttaacct tgtaattgaa gcattgggcc aagaatttgc ttctatgttt 540
gctattgttc gcaagcaagt tagagcagtt ttggacaaat gtcttatggt ttttgaaaat 600
gtcaaggagc tcccacagcg cattgcagca cttaaagctg cattcgctgc ttgtgtgaag 660
cgcatgactg ttgtggttgt tgacaagtgt ctcatgattc gtgagtttgc aggtacctgc 720
ctagccagtg tgaatgcgac aatggcagca tggtgtcgtg aattgccaac tggttttatg 780
gggtctaaag tttttgacaa actcgccttc tttaaggagg ctgttgttaa aactgtaaaa 840
aatgttgccc atgcaccgga tggtgttact ggttatagtg tcattggcaa tgcccgcggt 900
acgcaggttg tcattcgtgg tatgcgtaat gacctcactc tgcttgaaca acgtgcagat 960
gtctctgttg aaaaagaagg ttggtctgct gtctttgacg gtagattaac ctatgttttt 1020
aagagtggtg agtgttatta tgcagcacca cttgcaggaa attttgttct taatgatgtc 1080
tattgttgtg agcgtgtagt cctccttagc gatggctaca ctcctgaaat taatgatggt 1140
ttgcttttgg cagcgctcta cacgtcatct aatgtggctg atgtgttggc tgcgctgaag 1200
aaaggtgaac catttaagtt tttgggacac tcatttgtct atgttaagga cgctgccgtg 1260
tcttttactt tggcaaaggg tgcatctata gcagatgttt ttaaactttt tgttaaagaa 1320
gctgttgatg tatggtctgt ttttaacgaa aagtctcatg aattttggac taaagctcac 1380
aataaatgtc gtaatcttaa agatcttgtg gcgacacatt gttgtaaggc gcaagtgact 1440
tttgttgtgc ttgctatagc ccttggtgtg acagtttggg aaattgtcaa acaggttttg 1500
tttaaagttg ctggtctttt tacagccgtt gtggactttt gtagtaaggc ttggaatgga 1560
ttttgtgacc aactaatcca tgctaaactt tttgtgaatg aattgggctg tgttttggtt 1620
ggtgttaaaa atcactgttt tcaacttttg cttatagcag tccatgcctt ttataaaacc 1680
ttggagaagt gtgccatagg tcgtatctgg aatggtgatt tgcttttttg ggctggtgga 1740
gcccataaag taagtgaaga caatggtgaa gtttggtttg atgctgtaga cacaatgcaa 1800
gttgacgaac agggcactgt tgttgaagac aatgtgcctg attttgttgt ttgtcatgat 1860
gtgtctatac cagagcgtca aaaaggttat atagtgcaaa ttgctgctga tggtaaaaac 1920
tatatgtttt ttaggtatga acagggtgtt aatacctatt atgccccaat gtcacaggtt 1980
ggtgcagtta atgtggtttg cagggctggt ggtaagactg tgacctttgg tgatgaccag 2040
gttaaagagc taccaccccc agatgttaag tgtatctata ttgatattga gtgttgtggt 2100
gaaccttgga ctagtgtctt taagcgtgtc tataaagacc cagttgaagt tgagacatct 2160
ttgactgtag aggagttgag agcagttgtc tatgagatga tgtgtgacag tttaaaactg 2220
tttcctggtg cccctcaacc tccaccatat gataatgtag ctttggttga caaccaaggt 2280
cgtgatttgc aaaacattga ttcttgtcat ttggtttatg tggattatga cagtgacggt 2340
gcagtttctg atgaagaaga agaagatgtg tctgacactg aagatgttaa tgaagaggat 2400
gaacgtttgg catgtctctt gaagaattca gctaatttta aatatccact tccttatgat 2460
gatgagtata gtgtcttttg tggtcgtttg gtacacaagg atgctataga cacccttcat 2520
tacccatctg gtgatgacat gtatgttatt aataacgcct ttgagggtgc tgttaaggct 2580
ttacctcaga gtgttgttga tgttttggga gattggggtg tcgctgttga taatcaggag 2640
cgcgctatga acaaggaaat tcctgttgag attcctaagg aagaaactca gaaacctcaa 2700
aaggtggaag aacagaagcc tagagaaact cttgttgaga tttctaagga agaaactcag 2760
aaacctcaaa aggtggaaga gcagaagcct aaggaaaccc ttgttgagat tcctaaggaa 2820
gaaactcaga aacctcaaaa ggtggaagag cagaagccta aggaaactcc tgttgagaty 2880
cctaaggaag aaactcagaa acctcaaaag gtggaagagc agaagcctag ggaaactcct 2940
gttgagactc ctaaggaaga aactcagaaa cctcaaaagg tggaagagca gaarcctaag 3000
gagactcttt taaataaaca attcttttct gatagttctt cggatgaaga gccaaagaaa 3060
aagttgttta ggtttaaatt gaagcctact aagtgtaaag tacctagtaa tgttgagtat 3120
tctacatgtg taggcgactt gtctgtagtt gttgccaaag ctatggactc ttttgaagac 3180
tttgtcttgg ttaacgccgc caatgaacat atgtgtcatg caggtggtgt tgccaaggct 3240
attgcagatt tttgtggtaa caagtttgta gactattgtg acacttttgt tggtaaaaat 3300
ggtcctcaac aacagttgtt ggccccctct ggtgttgcta gaatgcaagc tgttaataat 3360
gtagtcggac ccagacacgg gcaacctgac ttgtttgaca agttggttgc tgcctataaa 3420
aaggttgttg ttgttggtgc tgttaattat gttgtccctg tcctttctgc aggaatcttt 3480
ggtgttgatt ataaaatgtc tattgacgct atgcgcaagg cattttgtga tatgaaaatt 3540
cgtgtgttgt tgttttctct taatcaagaa cacattgatt attttaatgc cacttgtaaa 3600
cagaagactg tttaccttac tgaagatggc acttctttta aaactctggt cttgaggccg 3660
ggtgacacat tgggccacct tggaggtgtt tttgcgcgta acaagactgt ttttactgct 3720
gacgatgtta gtgataaaga ggttttgttt ttgcctacaa cagacaagaa tgtgctggag 3780
cattatgatt tagatgccca gaaatatgtc ttgtttttga ctacactttc gcaaaagtgg 3840
gaagtgtttt ttaaaggtgg tgttttgcaa cttgtttggc gtgatggtaa ctgctgggtt 3900
aatgcagtta ttacactgtt gcaagctgca aaaataaaat ttaaaggtta tttggcaaca 3960
gcatgggcac aacttttggg tggtgaccct actgagtttg tagcatggtg ttatgctagc 4020
actaatacta aggtgggtga ctttggtgat tccaatgttc tcttgttgac cttggcgcac 4080
cattttagtg tagattacac taaagccctt atagttaggc gtgttgtgtg taaatgtggt 4140
gttaatacgc aacaagtcta tggcattaat gcttgtgtgc agcatgtttg tgccactaat 4200
atgttaaatt ttatgaaaca gtatggtgac tgttctgtct gtggtgaaaa gtatgttgat 4260
gaagtcgtca acataaatgt accatatttg atgttgcttg caggtggtgg accgcagaat 4320
gtggaccgcg atgagacagt ggttgctaat atagtttttg ttgggactat tgatagtggc 4380
cactgttata ctcagactgc gaataatgtt tttgacaatc ttgttcaaaa tagacagttc 4440
tctaagaggg ctccctatat aactgctttc taccctcaat tttctcttaa gagtaaaaat 4500
tctctgtctg ttgctaaaaa gagtaagagc aagagtgatg tagtaaaaga agatgtttct 4560
aatctcgcta caggttccga cgttgaggtt gaagatattt ctaattttga acgttggtat 4620
tctgacaatt attatgattg tttgactgtg caggaagact ctagccttcc tgttgacaat 4680
actaattttg actttgttgt agattctaaa ttgcctctta cactcactgt tcgtggtgtg 4740
tctagagatg tgaattttaa atctgcagaa ggttttacgt acattttgac gccagagcgc 4800
ggtcaaacat gtaattcacc tgtttattac tcttctcttg atttggttag ccttagagct 4860
atctgggtca atggggatag taattatgta gttggtaatc ccaattatta tagtaggctt 4920
ttgcgcattc caactttgta tgagaatgct gaaaagtttg ttaatattgg tgaacgtgtg 4980
gggaatgtta cttatggcgt ttggcgtgcc aaaagtttga ataaacccca gttgtctact 5040
gtaatggctt ctgttaaagc aattataggc gttgcaaacc cagtttctaa tgttgtagga 5100
aataccgtca agaaggttgt tgctgttagt gacggcttag gtgatggtgt ttttggcaac 5160
atgtggggtg gagtatgtgg ccttataggt ggcacttgta agtttgtcta tgataaagtt 5220
tcattgcact ttataagaac catgttgttg tttttgtttt acttttgtaa agcaggtttt 5280
aaaaaatttt cttctaatta ccgtagtgta attactaagg tagttatgac tgctttgttg 5340
ttgtgttggt ttgtgtatac ttatgaagct attcactttg tgggtatacg catattagat 5400
tttttgtttg agggatcttt ttgtggtaat tatactggtt atggtaaaga ttcctttgac 5460
atgttgcggt attgcggaga cgatgctgtc tgtcgtgttt gtttgcactc tgtagactcg 5520
ttgcatcttt ataaacatgc gtatagtgta gagcaggttt ataaagatgc tgttgcagag 5580
tttaagttta cttggaattg gctttatcta gtgtttttgg tactatttgt aaagccagtt 5640
gcactatttg ttatagtttg ttattgtctc aagtaccttg tattaggcgc tgaggtgttg 5700
caaactggta ttacaattgt ggactggtgt gttgctacat tttttagtca ctttaatttt 5760
atgggtgcta gtttttatgt gtggattttg tggaaagttt atacatatgt ccatcatata 5820
atgtattgta aagacataac atgtgacatt tgtagacgcg tggctcgcaa tagtcgacat 5880
gaagttagtg ttattgttaa tgggcgtaag cagtcagtgt atgtttatac taattctggt 5940
tttacttttt gtaagaaaca taattggtat tgtaaaggtt gtgacacttt tgggcatcag 6000
aacactttta tttcacctga agttgcaggt gagttgtctg ataaacttaa gcgtcatgtt 6060
aagcctactt ctagtgcata ttttcttgtt gatactgcac aattagttgg tgactttgtt 6120
aatcttaact atagttctaa ggctcctggt ttagaatcta caaagcagca agttaagtgt 6180
tttacagttt cagattttct taagaatgct gtttttctta aggatgctgt aaaatgtgaa 6240
cgtatggcta atgatagctt tattgtttgt aatacacaga gtttgcatga tttggaggct 6300
gctaagaatg ccgcggttta ttatgcacac tacctgtgta agcccattct tattttggac 6360
caagttctct atgatacatt ggcttgcgag cctgtttcta agagtcttgt agacaaagtg 6420
tgtggtgtat tggcaaatat tgttgaagtt gattttgcca atcttaatta taaggcaggt 6480
tctttgcgtg acgctctttt gtctgtcaca tcagatgaag aagctgttga tatggctata 6540
ttttgtcata attatgacct taattatact agtgatggtt ttactaatgt tgtaccttct 6600
tatgggtttg accttggtaa attgtcacca cgtgataagg gttttcttat aaatgctgat 6660
gcatgtatag ccaatcttaa ggttagaaat gccccagctg ttgtttggaa ttattatgac 6720
cttataaaat tgtctgataa ctgtcttaaa tttttggtgt ctggtgttat aaagtcaggc 6780
gctaaatttt atgtaacacg ttctggtgct aaacaagtta ttacttgtca tacacagaag 6840
ctgttgttgg ataaaaaggc tggtggtatt cttaaggata ctatgtcttg gttttggttt 6900
atggttaagt ttgtggttgt ttgttatctt atttttacag caggttgttt gtatgtgtat 6960
catacggatt attatggtgc aaagatgcac ccgatgtatg atataaatgc aacttttcct 7020
gttgaaaatt ttaaggttat tgaaaatggt gttcttagag acctagtttc tgaggacagt 7080
tgtttttcaa ataagttttt aggttttgat gacttttggg ctaaaaccta cactaatagt 7140
agggattgtc caatagttac agctcttata gatggtactg gttttgttgc tgcaggtgtc 7200
cctggtcatg ttcactgggt tatggacaat actatgtttg tacatacagc acaggctgaa 7260
gcaaaaccat ggtatgcacc tagttggttc cctcaagatg atgttgtcgg ctatacaata 7320
gactctgttg ttacacaggg tgaattttat agttcaattg cgacttttcc agcacgttgt 7380
atgtatttgg caactagtgc aagtccgcaa ttgtattgtt atggtggtga aaatgatgca 7440
cctggtgcaa tgtcatatga tagtgtgcaa ccgcatcgtg tctattttca accaaataat 7500
gtaaggtttt ctattccaca acagattatg tacacacctt atatagttaa attggcttct 7560
gacaattatt gtagaggtag tgtttgtgaa aagacaaaac ttggttattg ttattcatgg 7620
aatcctcgat gggtccttta taatgatgac tatgttagtt tgcctggtgt ttattgtggg 7680
tctactatta gagaacttgt gttttctatg ttaggttcat tttttacagg tgttagtcct 7740
aatttgtata tacacttgac aactatgttt ttggtgttgt tgggtgttat gattatcttc 7800
gcattggtta ttaggtttca aggtgttttt aaagcctata caccagttgt ctttgcagtc 7860
attatggttt ggggcctaaa tgtttttatg ttgtgtgttt atagctataa cccttttgtg 7920
gctgttatgc tattagcact gtattgttac atgtcactca tggttgggcg tactgtttca 7980
acagttatgc acttgtgggt tgtatttaca tttataatgg ttgtgccgtg gtggttggcc 8040
tgtgtttata tagcctttgt tgcttatatg tataccccgt ttgctatgtg gtgttatggt 8100
actgctaaac aaactcgtaa actttatgaa ggtaatgagt ttgttggtaa ttatgattta 8160
gcagctcaga gtacatttgt tatacgtaat gtagagtttg ttaaactttg taatgaagtt 8220
ggcgacaagc ttgacattta tttgtcggct tacgctagac taaagtatta ttcaggtact 8280
ggtggtgagc aagattactt gcatgcttgc cgggcttggt tggcctatgc tttggatcaa 8340
ttccgtgcta atggtgttga agtactttat acaccaccta aattttcaat gggtgttact 8400
agattacaag caggctttaa gaagtttgtt tcacctagta gtgctgttga aaaatgtgtt 8460
gttatggtac gttataaagg tacagtcctt aatgggctgt ggcttaatga ttgtgtgtat 8520
tgtccacgtc atgttatggg caagtttagt ggagatgaat ggcaagatgt gttaagcttg 8580
gctagtaacc atgaatttga agttactgga ccagacggat catctttgca agttgttagt 8640
aggaaattgc agggtgctgt tttgatactt caaactgctg tggttaatgt taatactcct 8700
aagtataaat ttgttcaggc acagtgtgga gacactttca caatagcttg ttcatataat 8760
ggtaatgtgg ttggccttta tcctgttact atgagagcta atggtactat tagagcttca 8820
ttcgcttgtg gctcgtgtgg ttccgttggt tttaatatgg acggtggtgt tgtagcattt 8880
tgttatatgc atcacttaga attacctaac gctatacata ctggcactga tttggctggt 8940
aatttttatg gtggttttat agatgaggag tgtgcacaac gtgttgagcc agaccctcgt 9000
attactaata atgtggttgc atggttttat gccgctatta ttagtattaa ggaaagtagt 9060
tttagcctgc caaagtgggt tgaaagtaca cctattagtg ttgatgatta taataagtgg 9120
gctgcagata gtggcttcac tccttatgtt gatagtattg cagttaataa acttgctgct 9180
ataacgtctg ttgatgttgg tagggttttg cgtactatta ttgtaaaaaa tacacactgg 9240
ggtacagacc ccataatggg tgtttttaat tttgatgatg aattgacacc tgagtctatt 9300
tttaatcaaa taggcggtgt taagttacaa tcttctatta ttaagcgcac gatttcttgg 9360
ttttggtcta gactcgtgtt ggctatgttt ctgtttgttt tgtgtgcaat ggttttgttt 9420
actgttgtgc cttataaata ttttatatac gctgctatta ttttgtttgt tgctgttttt 9480
atagccgcgt ttactattaa gcatgtgttg gcatatttgg atactttcct tttgcctact 9540
ctttgtactg ttatgatagg ggtgtgtatg gaagttcctt tcatatacaa cacttatatt 9600
tatgactttt tgaaaggtct ttttagtcct tggtacaatg ttgaggttgt tgacactgtt 9660
gtgccctgga tgtttatgcc aattatagtg tataccactt ttaggtgtat acagggttgt 9720
tatgctattg actctttttc tgcagcgcta acaggtgcct accaagtagt aaaattgggt 9780
tttacaattt atacgtcttg gaatactggg catgcttata gtgctggtga ctgggatttg 9840
ttttttgagc ttttgcatac gactatgttg gccaatatta gtagtaattc tttggttggc 9900
ataattgttt ttaatgttgc taagtggtgt ttgcgttatt gcaatctcac ttatgtgaac 9960
tcttatgttt taatggctat atttgttaat gttatgggtt ggatgtttac ttgttatttt 10020
ggagtctatt ggtggcttaa taaagtcttt gggctcactt gtggcaagta tacgtataaa 10080
gttagtgttg agcagtataa gtatatgtgt gtacatcgta tccccagtcc gaagagtgct 10140
tgggatatat ttgttactaa tatgcttata caaggtatag gtggtgagcg taaacttcct 10200
attgctactg tgcagtcgaa acttactgat gttaagtgta ctgctgttgt gttgatgcaa 10260
ttgttgacaa agcttaatgt tgaagctaac tcaaaaatgc ataaacatct tgtagaattg 10320
cataataaga ttcttgcctc agaagatctt gttgagtgta tggataactt acttggtatg 10380
ttggttacct tgttgtgtgt agattcaact gtggatctta gtgagtattg tgaagatgtt 10440
ttgggtaaag ttactgtttt acagtctgtg gcccaagagt tttcacatat tccatcttat 10500
gctgagtatg agcgtgctaa ggatttgtat gagcgcgttt tggcagattc gaagagtggc 10560
aatgtcacac aacaagaggt ggctgcatat agaaaggctg ctaatatagc gaagtctgtt 10620
tttgatagag atctttctgt acaaaagaag ttggatgcca tggctgagcg tgccatgaca 10680
actatgtaca aggaagctcg tgttacggac aggcgtgcta agttggtctc ttcacttcat 10740
gctttgttgt tttctatgct taagaagata gattctgaca agcttacatc tctttttgaa 10800
caagcgcgtg atggtgttgt acctctcgcg acagttccta ttgtttgtag taataaactc 10860
accttggtaa tacctgatgc aggtacttgg acaaagtgtg ttgaaggtac atttgttact 10920
tattccactg ttgtgtggaa tattgatact gtctttgacg ctgatggcgt ggaaattcaa 10980
cctagttcta atggtcagag tcttgtttac cacattggag gtgacaggat tgcatggcca 11040
cttaaagtta atcttacgcg taatgttcat aataaagtag aggcttctct ccaaaacaat 11100
gaacttatgc ctcaaggtat aaaaactaag gcttgtgttg cagggactga tcaagcccac 11160
tgtaatgttg agtctaagtg ttactatact aatattaatg gtagctcggt tgtagctgcc 11220
attacttcac ataatccaaa tttgaaagtg gcatcatttt tgagtgatgc tggtaatcaa 11280
atttttgtag accttgaccc accatgtaag tttggtatga aggttggtgg caaggttgaa 11340
gttgtttacc tttattttct taaaaataca aggtctatta ttagaggtat ggttcttgga 11400
gccatttcca atgttgttgt attgcaatct aaaggacacg aaactgaaga gcttgagtct 11460
gttggtatct tgtcactttg tgcttttgct gtggaccctg ctgaaacata tttgaaatat 11520
gtgtcggcag gaaatcagcc acttggaaat tgtgttaaaa tgttgactgt gcataatggt 11580
aatggttttg ccataactac taagccaagt ccaacaccgg aacaagactc ctatggtggt 11640
gcatctgtgt gtttatattg tagggcacac atagcacacc ctggagcttc tggtactttg 11700
gatggtcgtt gtccgttcaa aggttctttt gttcaaatac ctacttctga aaaagacccc 11760
gttggttttt gtctcagaaa taaggtttgt aaagtctgtc agtgttgggt tggttttggt 11820
tgtcagtgtg attttttgcg ccagccagtt gctaacatgc aaagcactta tgttgctcct 11880
gttgttagta ctaactctga taagaattat ttaaacgggt tcggggtagc agtgaggctc 11940
gacctgatac ccctatctga tggaaaccaa cctcatattg taaaacgagc ctttgatgtt 12000
tgcaataagg agtctgcagg tatgtttcag aatatgaagc ataactgtgc caggtttcaa 12060
gaagtggtag aaggcgaaga cagctggaaa cacggtcttg aatacaaaga ctcttatttt 12120
gttgtgaaac agacgactcc ctctaattat gtccatgaac aggcgtgtta tgaggatttg 12180
aagtcggatg ttgttgcagt tcatgatttc tttgtcttta ataagactat ttataatgtt 12240
agtaggcagc gtcttactaa atatactatg atggaccttt gctatgcttt gcgtcatttt 12300
gaccctaagg attgtgaggt tcttaaagaa atacttgtcc tcaatgattg cattgaggat 12360
tggtactgga tgcagggtgg acaaggccaa gccccaggta attggtttga ccacaaccct 12420
acttggtacg acccaattga aaacccttca tattatgcta ttttagctaa tttaggccac 12480
attgtacgtc gtgccttatt gaatgctgtt aagtttggtg atctcatggt cgaaaaaggc 12540
tatgtgggtg ttgtcactct tgacaaccag gatcttaacg gcaagtttta tgactttggt 12600
gactttcaaa agacaacgcc tggtgcaggt gttcctattt ttgatagtta ttattcttat 12660
cttatgccta ttataaccat gactgacgca ctggcaacag agcgttttta tgagttcgat 12720
aggcacaagg gttttaaatc ttatgatctc cttaagtatg attatactga ggagaagtta 12780
gaattgtttt ctaagtactt taagtactgg gaccaagagt accaccctaa ttgtagcgaa 12840
tgtgctgacg ataggtgttt gatacattgt gctaacttta atatactctt ttcaacactc 12900
atacctcaaa cttcttttgg taatctgtgt agaaaagtgt atgttgatgg tgtccctttt 12960
atagctactt gtggttatca ttctaaagaa cttggtgtta taatgaatca agataatacc 13020
ttgtcatttt ctaagatggg cttgggtcaa cttatgaagt ttgttggtga cccggcattg 13080
cttgtcggaa cttctaacaa cttggttgac ctacgcacct cttgttttag tatctgtgct 13140
ttagcatctg gtataactca ccagacagtc aagccaggac attttaataa agatttctat 13200
gactttgcag agaaagcagg gatgtttaaa gagggatctt ctatacctct taaacacttc 13260
ttttttccac aaactggtag tgctgctata gacgattatg attactatcg ctataacagg 13320
cctactatgt ttgatatacg tcagctcctg ttctgtctag aggtgacttc taaatacttt 13380
gagtgctatg agggtggttg catatctgct agtcaggttg ttgtaactaa cctggataag 13440
agtgcaggct atccttttaa taaatttggt aaagcccgcc tttattatga aatgagtttt 13500
gaagaacaag accagctctt tgaatcaaca aagaaaaatg tcttgcctac tataactcag 13560
atgaatttga agtatgccat ttcagccaag aatagggctc gtactgtggc aggtgtttct 13620
attctttcta ctatgactaa tagacagtat caccagaagg tgcttaagtc tatagttaat 13680
actagaaatg ctcctgtggt tattggcaca accaagtttt acggtggttg ggacaatatg 13740
ttgagaaatc ttattaaagg tgttgatgac ccaattctta tgggttggga ttatcctaaa 13800
tgtgacagag caatgcctaa tttgttgcgt attgcagcat ctttggtcct tgctcgtaag 13860
cacactaatt gttgtacttg gtctgaccgc gtttataggc tttataatga gtgtgcccaa 13920
gtactttctg agtctgttct tgctacaggt ggtatttatg ttaaacctgg tggcactagc 13980
agtggtgatg ccacaactgc ttatgctaac agtgttttta acataattca ggctacgtct 14040
gccaatgttg cacgtctggt tagtaccatt acgcgcgaca ttgtgtatga tgatgttaga 14100
gctatgcagc acgaactgta tcagcaggtt tataggcgtg tcaatcctga cgctgccttt 14160
gttgagaagt tttattctta tttgaataag cacttttctt tgatgattct gtctgacgac 14220
ggtgttgttt gttataacaa cacgtatgcc aagcagggtc ttgttgcaga catttctgct 14280
tttagagaag tcctctatta tcagaataat gtttatatgg ctgattccaa atgttgggtt 14340
gaacccgacc ttgaaaaagg ccctcatgaa ttttgttcac aacacactat gcttgtagac 14400
gtggatggcg agcctaaata cttgccatat ccagatcctt cacgcatctt gggtgcttgt 14460
gtttttgttg atgatgttga caagactgag cctgtggctg ttatggagcg ttatgtagct 14520
cttgccattg atgcttatcc gcttgtctat cacgaaaatg aagagtataa gaaggttttt 14580
tatgttcttc tttcttatat taggaagctc tatcaagaac tttctaagaa catgttgact 14640
gactattcct ttgttcttga tatagacaag ggtagtaagt tttgggagga ggagttttat 14700
tctaatatgt atagagctcc taccactttg cagtcctgtg gcgtttgtgt tgtttgccag 14760
agtcaaacca ttttgcgctg tgggaattgt gttcgtaaac catttttgtg ctgtaagtgt 14820
tgttatgacc atgtcatgaa cacaaatcac aaaaatgttc tttctataaa tccttacatc 14880
tgcacacacc ctggttgtgg tgaagcagat gtaactaaac tctatctcgg tggtatgtcc 14940
tatttttgtg ttaatcacaa acctaggctt tctatacctt tggtttcaaa tggtactgtg 15000
tttggtattt acagagccaa ctgtgcaggt agtgagaatg ttgatgattt caaccagctt 15060
gccaccacta attggtctac tgtagaacct tatattttgg caaatagttg tagtgatact 15120
cttaggcgtt tcgctgctga aacggtgaaa gccactgaag agttgcacaa acagcaatat 15180
gccagtgctg aagtgaaaga agttctttct gataaagagc ttattctctc gtgggaacca 15240
aataaggctc gcccaccatt gaataggaat tatgttttca caggttttca cttcactaga 15300
aatagtaagg tgcagcttgg tgattttact tttgaaaaag gtgatggcaa agacgttgtc 15360
ttttataaag ccacatctac tgcaaaattg tccgttggcg acatttttgt tttaacttca 15420
cacaatgtgg tatcgcttac agcgcctaca ttgtgtcctc agcaaacttt ttctaggttt 15480
gttaatttgc accccaatgt gatggtacca gagtgttttg ttaataacat accattgtat 15540
catctagtgg gtaaacaaaa gcgtactaca gtacaggggc ctcctggtag tggtaagtct 15600
cactttgcca taggtcttgc tgcttacttt agtaacgctc gtgttgtgtt tacagcttgt 15660
tcacatgctg ctgttgatgc gctgtgtgaa aaagctttta aattcttgaa gattgatgat 15720
tgcactcgca tagttccgca gagagctact gtagagtgct tttctaaatt taaacctaat 15780
gacacaggca aaaagtacat ttttagtact ataaatgcct tgccagaggt tagttgtgat 15840
atcttgttgg ttgacgagat tagtatgtta accaattatg atttgtcttt tgttaatggt 15900
aagattaatt accagtatgt tgtatacgtg ggtgatcctg ctcaattgcc agccccccgt 15960
actcttttga atggatcact ttcacccaag gattataacg ttgtcaccaa ccttatggtt 16020
tgtgtcaaac cagatatatt ccttgcaaag tgttaccgtt gtcctaaaga aattgttgat 16080
acagtttctt ctcttgttta tgatggtaaa tttattgcta acaaccctga atcgcgtcag 16140
tgtttcaagg ttgtcgtcaa taaaggtaat tccgatgttg gtcatgaaag tggttcagct 16200
tataacatga cacaactcga gtttgttaaa gattttattt ctcgtaataa ggagtggaag 16260
ggtgctacct ttatttctcc ttataatgct atgaaccaga gagcgtaccg catgttggga 16320
cttagtgttc agactgtcga ttcatctcaa ggttcagaat atgattatgt tatattttgt 16380
gtgacagcag attctgctca tgcactcaat attaacaggt ttaatgttgc tcttacacga 16440
gcaaagattg gaatactcgt tgtcatgaga caacgggacg aattgtataa tgcactccgg 16500
tttgtagagc ttgacagtaa tgtcgcacta cagtctactg gtttgtttaa aatttgcaat 16560
aaagaattta gtggtgtttc acccgcttat gcagttacca ctaaagctct ttctgcaact 16620
tataaggtta atgatgaact agctgcactt gttaatgttg aagctggctc acagattcct 16680
tataaacact tgatttccct tttgggtttc aaaatgagtg tcaatgttga gggttgtcac 16740
aacatgttta taacacgtga tgcggcaatt cgcaatgtta gaggttgggt tgggttcgat 16800
gttgaggcca cacatgcttg tggacccaat attggtacta acctaccctt tcaagtgggc 16860
ttttctactg gtgctgactt tgttgtcacg ccagaaggcc ttattgacac acctactggt 16920
aataattttg agccagttaa ttctaaagct cctcctggtg aacaatttaa ccatttgagg 16980
acgctattta gaagtgctaa gccctggact gtcataagac caaggattgt gcaaatgctt 17040
gcagacaatt tgaataatgt ttcagattgt gttgtttttg taacctggtg ccacggttta 17100
gaacttacta ctctgcgcta ttttgttaag ataggtgcag aagaagtatg ttcttgtggt 17160
gctagagcta ctaccttcaa ttcttccacg ctggcctacg cctgttggaa gcattgttta 17220
ggttttgatt ttgtctataa tccatttatt atagacatac agcaatgggg ttattctgga 17280
aatctccagt ctaaccatga tttgtattgt gatgtgcatg gacgtgctca tgttgcgtcg 17340
gctgatgcta ttatgacgcg ttgtcttgca atcaacaatg ctttttgtca agatgtcaac 17400
tgggatatta cttatcctca tattgctaat gaggatgaag tgaattctag ttgtagattt 17460
ttgcagcgca tgtattttaa tgcatgtgtt gatgctctta aagttaaggt tgtttatgat 17520
ataggcaacc ctaaaggtat taaatgtgtt aggcgtgggg atgttacttt taagttcttt 17580
gataagaacc caatcgtccc caatgtcaaa caattttgtt atgattatga ccaacacaaa 17640
gacaggtttg ttgatggtct ttgtatgttt tggaattgta atgtggattg ttatcctgac 17700
aattctcttg tttgtaggta tgacactaga aatcttagtg tctttaacct gcctggttgt 17760
aatggtggta gtttgtatgt gaataaacat gccttccaca cacctaaatt tgatcgcatt 17820
agcttccgca atttgaaagc tatgccgttt ttcttttatg atgcatcgcc ttgtgacacc 17880
gttcaagttg atggtgtagc gcaagacctt gtgtcattgt ctactaaaga ctgtattaca 17940
aagtgtaaca tcggcggtgc tgtttgtaaa aagcatgcac aaatgtacgc cgaatttgtt 18000
acttcttata atgcagctgt tactgctggt tttacttttt gggttactaa tcagtttaac 18060
ccttataatt tgtggaaatt gttttcttca cttcagtcta ttgacaacat tgcttataat 18120
atgtataagc gtggtcatta tgatgcagtt gttggtgaaa taccaacagt tgtgactgga 18180
gataaagttt ttgttattga caagggtgtt gagaaggcag tgtttgtgaa tcagtctaca 18240
ttgcctactt cagtggcttt tgagttgttt gcgaagagaa acattcgcac actacccaat 18300
aatcgtattt tgagtggtct tggtgttgat atagcctata agtttgtcat atgggattat 18360
accaaccaaa cgccattgta tcgtaacacc gttaatgtgt gtccttatac tgacattgaa 18420
cctaaggggc ttgttgtttt gtatgatgac cgtaatggtg attatcaatc ttttcttgct 18480
gctgatgatg ctgttcttgt ttcaacacag tgttataagc ggtatcctta tgctgagatt 18540
ccatcacact tgcttgcgca gaatgggctc ccacttaaag atggtgcgaa cttgtatgtt 18600
tataagcgta gtaagggtat gtttgttacc cttcctgaaa cgcttaacac acaagggcgc 18660
agttacgaaa ctttcgaacc acgcagtgat gttgaaagag agtttttgtc attgtctgaa 18720
caagactttg ttgtaaagta tggtaaagac cttggtcttg aacacatact gtatggtgaa 18780
gtagacaaac cacaattagg tggtttacac actgttatag gtatgtacag gcttttgcgc 18840
gacaataagt tgtctgccaa atctgtaaca gactcagatt gtgaagtcat gcaaaactat 18900
tttgttcttg cagacaatgg ttcctacaaa caagtttgca ctgttgtaga cttgttgttg 18960
gatgactttt tagacttact taggaacata ctccaagagt atggttcagg taagtctaag 19020
gtagttacag tacccattga ctaccacaac atatctttta tgacgtggtt tgaaaatggt 19080
tctattaaaa catgctatcc acagcttcag tcagcttgga agtgtggtta taatttgcct 19140
gaactttata aagttcagac ttgtgttatg gaaccttgta acattccaaa ctatggtgtt 19200
ggaataatgt tgcctgatgg tattatgatg aatgtggcga agtatactca actttgtcag 19260
tatttgtcta aaaccaccat gtgtgtgccg cataatatgc gtgtcatgca ttttggtgca 19320
ggaagtgaca agggtgttgc tccgggaacc actgttctta aacaatggct tcctgaaggc 19380
acacttcttg tagataatga cattgacagt tacgtttcag atgcacacgt gtctgtcatt 19440
gatgattgta ataaatttag aacggaacac aagttcgatc ttgtgatatc cgatatgtac 19500
acagataatg attcaaagaa gaaacatgaa ggcaaggtgg ccaataatgg aaacactgat 19560
gtgttcatgt atcttactaa tttccttcgt aacaacttag cgcttggtgg cagctttgct 19620
gtaaaaataa ctgagacgag ctggtatgaa ggtctttatg aaatagcaca agattgttcc 19680
tggtggactc ttttttgtac tgcagtaaat gcatcatcat cagaagcatt cttggttggt 19740
gttaattact taggtgagag cgaaaaacac aaaataagtg gaaggacgct tcacgccaat 19800
tatatatttt ggcggaatgt tagttattta caaacatccg cgtttactat atttgacgtt 19860
gcgaaatttg gattaaaaac aaaagcaacg ccagttgtaa atttgaaaaa agaattacaa 19920
accgacttag ttcttaattt aattaggaac ggtaaattgg ttgttaggga tgttggcaac 19980
gttggttttg ttgacgacag ttttgtttgt gcccattaa 20019
<210> 202
<211> 3543
<212> DNA
<213> Avian coronavirus
<400> 202
ttgttaggga tgttggcaac gttggttttg ttgacgacag ttttgtttgt gcccattaat 60
tctctttcag gagacaattg ggtttattac tacccatcag cttttaggcc ttctaatggc 120
tggcataagc aagaaggtgc ctattctgtt gttggtattc agtctactaa tgtcactggc 180
aattcagcag gttgtcctta tatgttcaac actacatctc aacttattgc cagtgatgct 240
gttgctatta tgtctaaatt tcctactact tggacaaaca ataacggtca gatttatgtt 300
catatgattg gttgtactat ggccaatcat actttttatg tatggggccc tttgaaaagt 360
ggtaactcac gacctggtgt tcctaatggc ctcttgtttc aagtctactc ttccaacttc 420
actcttcttt ataataagac ttggttgggt tggaaagaac atactcgttt tgaatcactt 480
cagtgtgttt ctttatttgg tagtgtctat tttaatggcg atcttattta tcagctaggt 540
tataatgccc aagtacagaa tgtgtcattt gtttattgtg gcactgtaac agggtattat 600
tatttttcaa aacagttcca atcattggtt tatttccaaa atggcactgc tttggacctt 660
atattgtgtg atgacactcc ccgtggtatt ttagcctgtc aatatggaac aggtaatttt 720
actgatggat tgtacccttt tactcattcc agtgttgtta ataaaacttt ggaggtgtat 780
ctcaccaata gtgttgttaa taacactgtg tatggccaac ttgttaacgt aactttttat 840
aatcagacta atgttcaagt tggcaattta agtggctcgc aactgggtaa ccttaatcaa 900
ttaaggcttt atcaagacaa agtttttgat gctccttatt ataatcttaa tttttctttt 960
ttggattcgc ctgactttga gtttcgacca caaggtggtg gctggacacc agaggcagac 1020
tcccaattta cacaatgtcc ttttactatt aatagtatta ataatggtca ttgttttaat 1080
tctttacgcg tagccattac ttacgtcccc ggttatagag ggtgttatta tgctatgcgt 1140
cactttggag cccagtgttg ttatatgtat tatatgaaca accaacctct ttgtgctggt 1200
atagaccctg ttgagtataa ccgcacttgg cgttgtgcgt tagctgtgct tgtttttatg 1260
caatctggtt cccgcatttg tacatctgaa acggttccaa ttaatactgt ttctactgtt 1320
ttaaacaaca cttttgtcct ggacacttgt gttaattata ctatttatag tagatatggt 1380
gttggtctag ttactaatgt cactgaccaa gttacaccag gtaccttttt aaatgatggt 1440
ggtcttgttg tgttggattc tagtggtgcc atagacatct ttgctgttaa tgaagttgtt 1500
ggtaggcact actttaaagt caatccttgt agtgatgtga accaacagta tgttgtctct 1560
ggtggcaaca tagttgggcg tcttacatct gttaatgaat ctggttctca atttttagac 1620
aatcagtatt atgttccact tattaatagc actcgttcta aacgttctgt tcagaacagt 1680
actgttacta gttgtgctta tgtttcatac ggccagtatt gtatcaagcc tgatgccagt 1740
gttgtacaaa tacagcctga tacttttgat ggttttgtaa cacctctttt aaatgctact 1800
gagtatgttc tcataccaga tagttttaac ttgactgtta cagatgagta tatccaaact 1860
cgcatggagc agattcaaat taactgtatt caatatgtct gcggtagttc agtgcagtgc 1920
agacaattgt ttcaacagta tggttctgtt tgtgacaata ttttgtctat tgttaatggt 1980
ctggctcagc aggataatgc agaacttatc tctctttatt cttctactca acctggtcag 2040
aattacccac ccgtattcaa taatcttgat acaggtggtt ttaatatttc tttgctctta 2100
cctcaaaata agagtggtgt ccaatcaagg tcttttatag aagacctttt gtttactaaa 2160
atcgaatctg ttggactacc tactgatgct gagtaccaga agtgtacttc aggtctttta 2220
ggttgggtta aagatttggt ttgtgcgcaa tactataatg gtattatggt tttgccacct 2280
gttataacaa atgaaatgca gtttatgtac actagctcac ttgttgcatc tatggcgttt 2340
ggtggtttaa catcagcagg ggctattcct tttgcaacac aagttcaggc tagaattaat 2400
catttgggaa ttacgcagac actccttctt aagaatcagg agttgcttgc taattctttt 2460
aataatgcac ttcaatatat gcagcagggt tttgaagcca cttcccaggc tcttcagcag 2520
attcaggatg tggtaaatca acaggctgct gttcttacag aagtaatgag ctcacttaat 2580
aaaaactttg gtgccatttc ttctgttatt caagacattt acaaacagct agatgagctg 2640
tctgctaatg ctcaagttga taggcttatt acaggccggc tttcctcctt atctgtccta 2700
gcttcatcta aacaagctga gtaccttaga gtagctcagc agagacagtt ggcacaggat 2760
aaaattaatg agtgtgtacg ctcacaatcc actaggaatt ctttctgtgg taatggcatg 2820
catgtcttgt ccataccaca gtcagctcct aatggaatag cgttcataca ctttacatac 2880
acaccgcaaa catataaaaa tgtcactgcg gttgttggtt tttgtgttac taccaatggt 2940
agtggatatg gcttggtgcc tgttaatggt agaggcatct ttatttatgt tgacgatgca 3000
tattatatca cgtcacgtga tatgtatatg ccccgcaaca taacttcagg tgatgtggtt 3060
gtcttaacgt cttgtcaggc caattatgtc actgtcaata ggacagtcgt tacaaccttt 3120
gttgatgatg actttgattt tgatgatgag tttgagaagt ggtggaatca gactgaccat 3180
gtcattccag acctggacga gtttaattac accattccta ttcttgatat taataatgaa 3240
attgaccgta tccagcaggc aatacaaggg ttgaatcaat cctatgtaga cctggagtca 3300
ctgtcaattc tcacaactta tattaagtgg ccttggtatg tgtggttagc catagccttt 3360
gccactatca tatttatcct cattttgtgt tggattttct ttatgactgg ctgctgtggc 3420
tgttgctgcg gttgttttgg tcttatccct ctaatgtcta agtgtagaaa gaaatcttct 3480
tactacacca catttgatga tgatattgtt ggtgaacaaa tcagacctaa aaagtctgtt 3540
taa 3543
<210> 203
<211> 306
<212> DNA
<213> Avian coronavirus
<400> 203
atggcaccaa agaaattctt tgtgcgctgt tacaagcgaa ttcgctcctt atttcgttca 60
cgaaacagca gctcaagaat agaggactac cttttgggca gttctctgac tgttagttgt 120
ttcaatgaag tttgcttttg catgcaacca gaatgttctg tttgcaatgt tacttgtgat 180
tgttgtggag gttgtggtga ctggttgtgt aaaacctgta attacattcc acttaataat 240
tttgatgctg atgcttatat cttaaagcac cagcagtcaa tgattaactt agttctgcaa 300
ttgtaa 306
<210> 204
<211> 306
<212> DNA
<213> Avian coronavirus
<400> 204
atgcttgcca taattgaaaa cggttttaaa accgtttgtt tggcaggtgt agtttttgtc 60
acaattgatg ctttactatc cacttcttta agtggtttac aatttcaaca cgtcatgcta 120
gagagaggtg aagatgcaat gtgtgatgca agtcgcatag cgcacctcat ctcattacta 180
gctgactgtc gtgtttatga tccttttgct gaagcatttt attgtaacgg cagcttttgg 240
gaagtagatt ctatggaaga ggacggaagc attttgactt cagactcgga catagatttg 300
tattag 306
<210> 205
<211> 303
<212> DNA
<213> Avian coronavirus
<400> 205
atggacatac tcagtaaatc tgttgaagac aatggtgcct tcctcactgc tgtttatgtc 60
tttgttggtt ttattgctct ctacttatta ggtagagctt tacaagcatt cactcaagca 120
gcagatgcat gtttcttgtt ttggtacacc tggtttgcac ttccaacagg gcgtggcata 180
gcctttgtgt accgaaatac atatggtaga aaaattaaca atccggaatt agaagcggtt 240
attgttaatc agtttccaaa gaacggtcct aataacaagt tgcctgcaaa tttcgcatca 300
tga 303
<210> 206
<211> 681
<212> DNA
<213> Avian coronavirus
<400> 206
atgagtaatg atagtgcgaa ttgcacactt ggttatgaag aggcggtttg ggtttttaaa 60
gagtataacc tctttctcac tgcctttttg ctttttatgt ccatgattct gcagtatggc 120
tatgccacac gtagcagatt catgtatgtc ataaaaatga tagtgctgtg gctgttttgg 180
cctctgaaca ttgctgtggg tgttatatcc tgtatatatc ctgtaggaac tggcggtctt 240
gtagcagcta ttgtcctgac aatttttgca tgcctgtcat ttgttggtta ttgggtccag 300
agtattagac tctttaagcg ctgtaaatct ttttgggctt ttaaccctga gagtgatgca 360
gtgggatcca tttccctaac aactggccaa acatgtactt tctctataga gagtgtccct 420
atggtactct cacccattat taaggctgga gtgctgtatt gtgagggtca atggcttgct 480
aagtgcacac cctcggaagt gccgcagcac atttacgttt gcacacctga tagacgtaac 540
gtctacaaaa gagtagcagc gtactcaggt gataacaaag caaacaaaaa atcatttgct 600
acttttgtct tcactaagga gtctgttgac tcaggtgatc tggacagtgt ggcaacatct 660
ggtggtagcc tctactctta a 681
<210> 207
<211> 198
<212> DNA
<213> Avian coronavirus
<400> 207
atgagttttt gctctaggtt tactaaggcg actatctctt tttataaatc actcctactc 60
tttgaactta gagttttgga taaatttatt ttaaattacg gacccacttg cttccttctt 120
agttgcaaga ggttcctatt gtttcaagtt aatattttgt atagattggt atttacacca 180
aaaaattcgc tggtatga 198
<210> 208
<211> 270
<212> DNA
<213> Avian coronavirus
<400> 208
atgaacaacc ctttttccac tgcgacagca cgtaaagcgc gtgtttttat tagaggtgga 60
ttaaatagtg tgtttttcct taacgaaaag ggacaaccag aagtttgtcc tttttgcact 120
gccttagtag cccgtgggca actttgtcag gagcatttgt ttaataacaa cattttatca 180
tggcatcgcg tgacgcgtct aagtcaaaaa ataagaccga tgcgccagca ccagtgctca 240
agttgggagg tccagcacca cctaaaatag 270
<210> 209
<211> 1257
<212> DNA
<213> Avian coronavirus
<400> 209
atggcatcgc gtgacgcgtc taagtcaaaa aataagaccg atgcgccagc accagtgctc 60
aagttgggag gtccagcacc acctaaaata ggttcttctg gcaccgcatc atggtttcag 120
ccaataaagg agaagaagat gactcacaat cctcccacct ttactggaag tggtgttcca 180
gagaatgaca atgtcaagaa accagcgcgt catggttact ggaagcgcca acgcaggtac 240
aaacctggta aaggcaagag aactccagtc actgatgcct ggtatttcta ttacactggc 300
acaggcccgt ttgctgacct taaatggggt cagcctcatg acgatattgt ctgggttgct 360
gttgacggtg ctgatgttga tgcaaaatct ggtcaaggaa ctagagaccc tgataagttc 420
gaccaattcc ctcttcgctt tgctgaaggt ggtcctgacg ataatttccg ctgggacttt 480
atacctgtag gcgggcgcgg taggagtggg agatcttcag ttgcaacatc cagagagtct 540
agtagacctg ggtctcgcga aggttcaaga gggcgcaggc agatgggtcc taatgaggat 600
ctaattgctc gtgctgcaag gattattgag gagcagcaga agcgtggcgg tcgcatcact 660
aaggctaagg ctaatgagat ggcggaacgt cgctactgca aaagaactct tgctcctgga 720
aagactgtag accaggtttt tggtacacgt cagaagggcc gtgagcgcaa cttcggtgat 780
gatagaatgg tagaggaagg cattagggat gggcgtacta cagcaatgct caacctgatt 840
ccgtcttcgc atgcaatgct ctttggcagt catgtccagg caaaattgca gccagaaggg 900
ctcctcgtca ctttcagttt tacaactgta gtgccgcgtg atgaccctca gtttgaaaat 960
tatagacaaa tttgtgatga gtgtgttgac ggtgttggaa cacgtcctaa gaatgaaccc 1020
aaacccagat cacgctcttc ttcaaaacct gcttctcgtg cggcttcccc ggcgccaaaa 1080
caacagcgcc ctaagaagga gaagaagccg aagaatcagg ataaagataa aactgatggt 1140
gcaatgtctc aagaagagaa ggcagtgaat gatcagctgg aatttgatga tgcagaccaa 1200
ggtatgcctg ataaaataga ttggggatcc tctgctcttg gtgatactga gatttag 1257
<210> 210
<400> 210
000
<210> 211
<400> 211
000
<210> 212
<400> 212
000
<210> 213
<400> 213
000
<210> 214
<400> 214
000
<210> 215
<400> 215
000
<210> 216
<400> 216
000
<210> 217
<400> 217
000
<210> 218
<400> 218
000
<210> 219
<400> 219
000
<210> 220
<400> 220
000
<210> 221
<400> 221
000
<210> 222
<400> 222
000
<210> 223
<400> 223
000
<210> 224
<400> 224
000
<210> 225
<400> 225
000
<210> 226
<400> 226
000
<210> 227
<400> 227
000
<210> 228
<400> 228
000
<210> 229
<400> 229
000
<210> 230
<400> 230
000
<210> 231
<400> 231
000
<210> 232
<400> 232
000
<210> 233
<400> 233
000
<210> 234
<400> 234
000
<210> 235
<400> 235
000
<210> 236
<400> 236
000
<210> 237
<400> 237
000
<210> 238
<400> 238
000
<210> 239
<400> 239
000
<210> 240
<400> 240
000
<210> 241
<400> 241
000
<210> 242
<400> 242
000
<210> 243
<400> 243
000
<210> 244
<400> 244
000
<210> 245
<400> 245
000
<210> 246
<400> 246
000
<210> 247
<400> 247
000
<210> 248
<400> 248
000
<210> 249
<400> 249
000
<210> 250
<400> 250
000
<210> 251
<211> 6672
<212> PRT
<213> Avian coronavirus
<400> 251
Met Ala Pro Gly Leu Ser Lys Gly Val Ser Pro Asn Lys Lys Asn Val
1 5 10 15
Ile Phe Val Leu Lys Asp Ile Gln Pro Ala Leu Cys Asp Ala Leu Phe
20 25 30
Phe Tyr Thr Ser His Thr Pro Arg Asp Phe Ala Asp Ala His Ala Val
35 40 45
Arg Glu Arg Phe Asp Arg Asn Leu Gln Ser Gly Arg Val Phe Lys Phe
50 55 60
Glu Thr Val Cys Gly Pro Val Tyr Leu Gln Gly Val Pro Ser Val Pro
65 70 75 80
Pro Gly Val Lys Ala Leu Gly Ser Glu Ser Lys Leu Ala Asp Leu Glu
85 90 95
Ser Leu Phe Gly Val Ser Pro Leu Ser Arg Arg Tyr Arg Asp Leu Leu
100 105 110
Lys Thr Ala Pro Gln Trp Ser Leu Asn Val Glu Ser Leu Asp Ala Gln
115 120 125
Ala Glu Lys Leu Asp Thr Leu Phe Asn Ser Ser Glu Ile Leu Trp Leu
130 135 140
Gln Val Ala Ala Lys Val Gln Val Ser Ala Met Ala Leu Arg Leu Met
145 150 155 160
Ala Asn Asp Val Val Asn Leu Val Ile Glu Ala Leu Gly Gln Glu Phe
165 170 175
Ala Ser Met Phe Ala Ile Val Arg Lys Gln Val Arg Ala Val Leu Asp
180 185 190
Lys Cys Leu Met Val Phe Glu Asn Val Lys Glu Leu Pro Gln Arg Ile
195 200 205
Ala Ala Leu Lys Ala Ala Phe Ala Ala Cys Val Lys Arg Met Thr Val
210 215 220
Val Val Val Asp Lys Cys Leu Met Ile Arg Glu Phe Ala Gly Thr Cys
225 230 235 240
Leu Ala Ser Val Asn Ala Thr Met Ala Ala Trp Cys Arg Glu Leu Pro
245 250 255
Thr Gly Phe Met Gly Ser Lys Val Phe Asp Lys Leu Ala Phe Phe Lys
260 265 270
Glu Ala Val Val Lys Thr Val Lys Asn Val Ala His Ala Pro Asp Gly
275 280 285
Val Thr Gly Tyr Ser Val Ile Gly Asn Ala Arg Gly Thr Gln Val Val
290 295 300
Ile Arg Gly Met Arg Asn Asp Leu Thr Leu Leu Glu Gln Arg Ala Asp
305 310 315 320
Val Ser Val Glu Lys Glu Gly Trp Ser Ala Val Phe Asp Gly Arg Leu
325 330 335
Thr Tyr Val Phe Lys Ser Gly Glu Cys Tyr Tyr Ala Ala Pro Leu Ala
340 345 350
Gly Asn Phe Val Leu Asn Asp Val Tyr Cys Cys Glu Arg Val Val Leu
355 360 365
Leu Ser Asp Gly Tyr Thr Pro Glu Ile Asn Asp Gly Leu Leu Leu Ala
370 375 380
Ala Leu Tyr Thr Ser Ser Asn Val Ala Asp Val Leu Ala Ala Leu Lys
385 390 395 400
Lys Gly Glu Pro Phe Lys Phe Leu Gly His Ser Phe Val Tyr Val Lys
405 410 415
Asp Ala Ala Val Ser Phe Thr Leu Ala Lys Gly Ala Ser Ile Ala Asp
420 425 430
Val Phe Lys Leu Phe Val Lys Glu Ala Val Asp Val Trp Ser Val Phe
435 440 445
Asn Glu Lys Ser His Glu Phe Trp Thr Lys Ala His Asn Lys Cys Arg
450 455 460
Asn Leu Lys Asp Leu Val Ala Thr His Cys Cys Lys Ala Gln Val Thr
465 470 475 480
Phe Val Val Leu Ala Ile Ala Leu Gly Val Thr Val Trp Glu Ile Val
485 490 495
Lys Gln Val Leu Phe Lys Val Ala Gly Leu Phe Thr Ala Val Val Asp
500 505 510
Phe Cys Ser Lys Ala Trp Asn Gly Phe Cys Asp Gln Leu Ile His Ala
515 520 525
Lys Leu Phe Val Asn Glu Leu Gly Cys Val Leu Val Gly Val Lys Asn
530 535 540
His Cys Phe Gln Leu Leu Leu Ile Ala Val His Ala Phe Tyr Lys Thr
545 550 555 560
Leu Glu Lys Cys Ala Ile Gly Arg Ile Trp Asn Gly Asp Leu Leu Phe
565 570 575
Trp Ala Gly Gly Ala His Lys Val Ser Glu Asp Asn Gly Glu Val Trp
580 585 590
Phe Asp Ala Val Asp Thr Met Gln Val Asp Glu Gln Gly Thr Val Val
595 600 605
Glu Asp Asn Val Pro Asp Phe Val Val Cys His Asp Val Ser Ile Pro
610 615 620
Glu Arg Gln Lys Gly Tyr Ile Val Gln Ile Ala Ala Asp Gly Lys Asn
625 630 635 640
Tyr Met Phe Phe Arg Tyr Glu Gln Gly Val Asn Thr Tyr Tyr Ala Pro
645 650 655
Met Ser Gln Val Gly Ala Val Asn Val Val Cys Arg Ala Gly Gly Lys
660 665 670
Thr Val Thr Phe Gly Asp Asp Gln Val Lys Glu Leu Pro Pro Pro Asp
675 680 685
Val Lys Cys Ile Tyr Ile Asp Ile Glu Cys Cys Gly Glu Pro Trp Thr
690 695 700
Ser Val Phe Lys Arg Val Tyr Lys Asp Pro Val Glu Val Glu Thr Ser
705 710 715 720
Leu Thr Val Glu Glu Leu Arg Ala Val Val Tyr Glu Met Met Cys Asp
725 730 735
Ser Leu Lys Leu Phe Pro Gly Ala Pro Gln Pro Pro Pro Tyr Asp Asn
740 745 750
Val Ala Leu Val Asp Asn Gln Gly Arg Asp Leu Gln Asn Ile Asp Ser
755 760 765
Cys His Leu Val Tyr Val Asp Tyr Asp Ser Asp Gly Ala Val Ser Asp
770 775 780
Glu Glu Glu Glu Asp Val Ser Asp Thr Glu Asp Val Asn Glu Glu Asp
785 790 795 800
Glu Arg Leu Ala Cys Leu Leu Lys Asn Ser Ala Asn Phe Lys Tyr Pro
805 810 815
Leu Pro Tyr Asp Asp Glu Tyr Ser Val Phe Cys Gly Arg Leu Val His
820 825 830
Lys Asp Ala Ile Asp Thr Leu His Tyr Pro Ser Gly Asp Asp Met Tyr
835 840 845
Val Ile Asn Asn Ala Phe Glu Gly Ala Val Lys Ala Leu Pro Gln Ser
850 855 860
Val Val Asp Val Leu Gly Asp Trp Gly Val Ala Val Asp Asn Gln Glu
865 870 875 880
Arg Ala Met Asn Lys Glu Ile Pro Val Glu Ile Pro Lys Glu Glu Thr
885 890 895
Gln Lys Pro Gln Lys Val Glu Glu Gln Lys Pro Arg Glu Thr Leu Val
900 905 910
Glu Ile Ser Lys Glu Glu Thr Gln Lys Pro Gln Lys Val Glu Glu Gln
915 920 925
Lys Pro Lys Glu Thr Leu Val Glu Ile Pro Lys Glu Glu Thr Gln Lys
930 935 940
Pro Gln Lys Val Glu Glu Gln Lys Pro Lys Glu Thr Pro Val Glu Ile
945 950 955 960
Pro Lys Glu Glu Thr Gln Lys Pro Gln Lys Val Glu Glu Gln Lys Pro
965 970 975
Arg Glu Thr Pro Val Glu Thr Pro Lys Glu Glu Thr Gln Lys Pro Gln
980 985 990
Lys Val Glu Glu Gln Lys Pro Lys Glu Thr Leu Leu Asn Lys Gln Phe
995 1000 1005
Phe Ser Asp Ser Ser Ser Asp Glu Glu Pro Lys Lys Lys Leu Phe
1010 1015 1020
Arg Phe Lys Leu Lys Pro Thr Lys Cys Lys Val Pro Ser Asn Val
1025 1030 1035
Glu Tyr Ser Thr Cys Val Gly Asp Leu Ser Val Val Val Ala Lys
1040 1045 1050
Ala Met Asp Ser Phe Glu Asp Phe Val Leu Val Asn Ala Ala Asn
1055 1060 1065
Glu His Met Cys His Ala Gly Gly Val Ala Lys Ala Ile Ala Asp
1070 1075 1080
Phe Cys Gly Asn Lys Phe Val Asp Tyr Cys Asp Thr Phe Val Gly
1085 1090 1095
Lys Asn Gly Pro Gln Gln Gln Leu Leu Ala Pro Ser Gly Val Ala
1100 1105 1110
Arg Met Gln Ala Val Asn Asn Val Val Gly Pro Arg His Gly Gln
1115 1120 1125
Pro Asp Leu Phe Asp Lys Leu Val Ala Ala Tyr Lys Lys Val Val
1130 1135 1140
Val Val Gly Ala Val Asn Tyr Val Val Pro Val Leu Ser Ala Gly
1145 1150 1155
Ile Phe Gly Val Asp Tyr Lys Met Ser Ile Asp Ala Met Arg Lys
1160 1165 1170
Ala Phe Cys Asp Met Lys Ile Arg Val Leu Leu Phe Ser Leu Asn
1175 1180 1185
Gln Glu His Ile Asp Tyr Phe Asn Ala Thr Cys Lys Gln Lys Thr
1190 1195 1200
Val Tyr Leu Thr Glu Asp Gly Thr Ser Phe Lys Thr Leu Val Leu
1205 1210 1215
Arg Pro Gly Asp Thr Leu Gly His Leu Gly Gly Val Phe Ala Arg
1220 1225 1230
Asn Lys Thr Val Phe Thr Ala Asp Asp Val Ser Asp Lys Glu Val
1235 1240 1245
Leu Phe Leu Pro Thr Thr Asp Lys Asn Val Leu Glu His Tyr Asp
1250 1255 1260
Leu Asp Ala Gln Lys Tyr Val Leu Phe Leu Thr Thr Leu Ser Gln
1265 1270 1275
Lys Trp Glu Val Phe Phe Lys Gly Gly Val Leu Gln Leu Val Trp
1280 1285 1290
Arg Asp Gly Asn Cys Trp Val Asn Ala Val Ile Thr Leu Leu Gln
1295 1300 1305
Ala Ala Lys Ile Lys Phe Lys Gly Tyr Leu Ala Thr Ala Trp Ala
1310 1315 1320
Gln Leu Leu Gly Gly Asp Pro Thr Glu Phe Val Ala Trp Cys Tyr
1325 1330 1335
Ala Ser Thr Asn Thr Lys Val Gly Asp Phe Gly Asp Ser Asn Val
1340 1345 1350
Leu Leu Leu Thr Leu Ala His His Phe Ser Val Asp Tyr Thr Lys
1355 1360 1365
Ala Leu Ile Val Arg Arg Val Val Cys Lys Cys Gly Val Asn Thr
1370 1375 1380
Gln Gln Val Tyr Gly Ile Asn Ala Cys Val Gln His Val Cys Ala
1385 1390 1395
Thr Asn Met Leu Asn Phe Met Lys Gln Tyr Gly Asp Cys Ser Val
1400 1405 1410
Cys Gly Glu Lys Tyr Val Asp Glu Val Val Asn Ile Asn Val Pro
1415 1420 1425
Tyr Leu Met Leu Leu Ala Gly Gly Gly Pro Gln Asn Val Asp Arg
1430 1435 1440
Asp Glu Thr Val Val Ala Asn Ile Val Phe Val Gly Thr Ile Asp
1445 1450 1455
Ser Gly His Cys Tyr Thr Gln Thr Ala Asn Asn Val Phe Asp Asn
1460 1465 1470
Leu Val Gln Asn Arg Gln Phe Ser Lys Arg Ala Pro Tyr Ile Thr
1475 1480 1485
Ala Phe Tyr Pro Gln Phe Ser Leu Lys Ser Lys Asn Ser Leu Ser
1490 1495 1500
Val Ala Lys Lys Ser Lys Ser Lys Ser Asp Val Val Lys Glu Asp
1505 1510 1515
Val Ser Asn Leu Ala Thr Gly Ser Asp Val Glu Val Glu Asp Ile
1520 1525 1530
Ser Asn Phe Glu Arg Trp Tyr Ser Asp Asn Tyr Tyr Asp Cys Leu
1535 1540 1545
Thr Val Gln Glu Asp Ser Ser Leu Pro Val Asp Asn Thr Asn Phe
1550 1555 1560
Asp Phe Val Val Asp Ser Lys Leu Pro Leu Thr Leu Thr Val Arg
1565 1570 1575
Gly Val Ser Arg Asp Val Asn Phe Lys Ser Ala Glu Gly Phe Thr
1580 1585 1590
Tyr Ile Leu Thr Pro Glu Arg Gly Gln Thr Cys Asn Ser Pro Val
1595 1600 1605
Tyr Tyr Ser Ser Leu Asp Leu Val Ser Leu Arg Ala Ile Trp Val
1610 1615 1620
Asn Gly Asp Ser Asn Tyr Val Val Gly Asn Pro Asn Tyr Tyr Ser
1625 1630 1635
Arg Leu Leu Arg Ile Pro Thr Leu Tyr Glu Asn Ala Glu Lys Phe
1640 1645 1650
Val Asn Ile Gly Glu Arg Val Gly Asn Val Thr Tyr Gly Val Trp
1655 1660 1665
Arg Ala Lys Ser Leu Asn Lys Pro Gln Leu Ser Thr Val Met Ala
1670 1675 1680
Ser Val Lys Ala Ile Ile Gly Val Ala Asn Pro Val Ser Asn Val
1685 1690 1695
Val Gly Asn Thr Val Lys Lys Val Val Ala Val Ser Asp Gly Leu
1700 1705 1710
Gly Asp Gly Val Phe Gly Asn Met Trp Gly Gly Val Cys Gly Leu
1715 1720 1725
Ile Gly Gly Thr Cys Lys Phe Val Tyr Asp Lys Val Ser Leu His
1730 1735 1740
Phe Ile Arg Thr Met Leu Leu Phe Leu Phe Tyr Phe Cys Lys Ala
1745 1750 1755
Gly Phe Lys Lys Phe Ser Ser Asn Tyr Arg Ser Val Ile Thr Lys
1760 1765 1770
Val Val Met Thr Ala Leu Leu Leu Cys Trp Phe Val Tyr Thr Tyr
1775 1780 1785
Glu Ala Ile His Phe Val Gly Ile Arg Ile Leu Asp Phe Leu Phe
1790 1795 1800
Glu Gly Ser Phe Cys Gly Asn Tyr Thr Gly Tyr Gly Lys Asp Ser
1805 1810 1815
Phe Asp Met Leu Arg Tyr Cys Gly Asp Asp Ala Val Cys Arg Val
1820 1825 1830
Cys Leu His Ser Val Asp Ser Leu His Leu Tyr Lys His Ala Tyr
1835 1840 1845
Ser Val Glu Gln Val Tyr Lys Asp Ala Val Ala Glu Phe Lys Phe
1850 1855 1860
Thr Trp Asn Trp Leu Tyr Leu Val Phe Leu Val Leu Phe Val Lys
1865 1870 1875
Pro Val Ala Leu Phe Val Ile Val Cys Tyr Cys Leu Lys Tyr Leu
1880 1885 1890
Val Leu Gly Ala Glu Val Leu Gln Thr Gly Ile Thr Ile Val Asp
1895 1900 1905
Trp Cys Val Ala Thr Phe Phe Ser His Phe Asn Phe Met Gly Ala
1910 1915 1920
Ser Phe Tyr Val Trp Ile Leu Trp Lys Val Tyr Thr Tyr Val His
1925 1930 1935
His Ile Met Tyr Cys Lys Asp Ile Thr Cys Asp Ile Cys Arg Arg
1940 1945 1950
Val Ala Arg Asn Ser Arg His Glu Val Ser Val Ile Val Asn Gly
1955 1960 1965
Arg Lys Gln Ser Val Tyr Val Tyr Thr Asn Ser Gly Phe Thr Phe
1970 1975 1980
Cys Lys Lys His Asn Trp Tyr Cys Lys Gly Cys Asp Thr Phe Gly
1985 1990 1995
His Gln Asn Thr Phe Ile Ser Pro Glu Val Ala Gly Glu Leu Ser
2000 2005 2010
Asp Lys Leu Lys Arg His Val Lys Pro Thr Ser Ser Ala Tyr Phe
2015 2020 2025
Leu Val Asp Thr Ala Gln Leu Val Gly Asp Phe Val Asn Leu Asn
2030 2035 2040
Tyr Ser Ser Lys Ala Pro Gly Leu Glu Ser Thr Lys Gln Gln Val
2045 2050 2055
Lys Cys Phe Thr Val Ser Asp Phe Leu Lys Asn Ala Val Phe Leu
2060 2065 2070
Lys Asp Ala Val Lys Cys Glu Arg Met Ala Asn Asp Ser Phe Ile
2075 2080 2085
Val Cys Asn Thr Gln Ser Leu His Asp Leu Glu Ala Ala Lys Asn
2090 2095 2100
Ala Ala Val Tyr Tyr Ala His Tyr Leu Cys Lys Pro Ile Leu Ile
2105 2110 2115
Leu Asp Gln Val Leu Tyr Asp Thr Leu Ala Cys Glu Pro Val Ser
2120 2125 2130
Lys Ser Leu Val Asp Lys Val Cys Gly Val Leu Ala Asn Ile Val
2135 2140 2145
Glu Val Asp Phe Ala Asn Leu Asn Tyr Lys Ala Gly Ser Leu Arg
2150 2155 2160
Asp Ala Leu Leu Ser Val Thr Ser Asp Glu Glu Ala Val Asp Met
2165 2170 2175
Ala Ile Phe Cys His Asn Tyr Asp Leu Asn Tyr Thr Ser Asp Gly
2180 2185 2190
Phe Thr Asn Val Val Pro Ser Tyr Gly Phe Asp Leu Gly Lys Leu
2195 2200 2205
Ser Pro Arg Asp Lys Gly Phe Leu Ile Asn Ala Asp Ala Cys Ile
2210 2215 2220
Ala Asn Leu Lys Val Arg Asn Ala Pro Ala Val Val Trp Asn Tyr
2225 2230 2235
Tyr Asp Leu Ile Lys Leu Ser Asp Asn Cys Leu Lys Phe Leu Val
2240 2245 2250
Ser Gly Val Ile Lys Ser Gly Ala Lys Phe Tyr Val Thr Arg Ser
2255 2260 2265
Gly Ala Lys Gln Val Ile Thr Cys His Thr Gln Lys Leu Leu Leu
2270 2275 2280
Asp Lys Lys Ala Gly Gly Ile Leu Lys Asp Thr Met Ser Trp Phe
2285 2290 2295
Trp Phe Met Val Lys Phe Val Val Val Cys Tyr Leu Ile Phe Thr
2300 2305 2310
Ala Gly Cys Leu Tyr Val Tyr His Thr Asp Tyr Tyr Gly Ala Lys
2315 2320 2325
Met His Pro Met Tyr Asp Ile Asn Ala Thr Phe Pro Val Glu Asn
2330 2335 2340
Phe Lys Val Ile Glu Asn Gly Val Leu Arg Asp Leu Val Ser Glu
2345 2350 2355
Asp Ser Cys Phe Ser Asn Lys Phe Leu Gly Phe Asp Asp Phe Trp
2360 2365 2370
Ala Lys Thr Tyr Thr Asn Ser Arg Asp Cys Pro Ile Val Thr Ala
2375 2380 2385
Leu Ile Asp Gly Thr Gly Phe Val Ala Ala Gly Val Pro Gly His
2390 2395 2400
Val His Trp Val Met Asp Asn Thr Met Phe Val His Thr Ala Gln
2405 2410 2415
Ala Glu Ala Lys Pro Trp Tyr Ala Pro Ser Trp Phe Pro Gln Asp
2420 2425 2430
Asp Val Val Gly Tyr Thr Ile Asp Ser Val Val Thr Gln Gly Glu
2435 2440 2445
Phe Tyr Ser Ser Ile Ala Thr Phe Pro Ala Arg Cys Met Tyr Leu
2450 2455 2460
Ala Thr Ser Ala Ser Pro Gln Leu Tyr Cys Tyr Gly Gly Glu Asn
2465 2470 2475
Asp Ala Pro Gly Ala Met Ser Tyr Asp Ser Val Gln Pro His Arg
2480 2485 2490
Val Tyr Phe Gln Pro Asn Asn Val Arg Phe Ser Ile Pro Gln Gln
2495 2500 2505
Ile Met Tyr Thr Pro Tyr Ile Val Lys Leu Ala Ser Asp Asn Tyr
2510 2515 2520
Cys Arg Gly Ser Val Cys Glu Lys Thr Lys Leu Gly Tyr Cys Tyr
2525 2530 2535
Ser Trp Asn Pro Arg Trp Val Leu Tyr Asn Asp Asp Tyr Val Ser
2540 2545 2550
Leu Pro Gly Val Tyr Cys Gly Ser Thr Ile Arg Glu Leu Val Phe
2555 2560 2565
Ser Met Leu Gly Ser Phe Phe Thr Gly Val Ser Pro Asn Leu Tyr
2570 2575 2580
Ile His Leu Thr Thr Met Phe Leu Val Leu Leu Gly Val Met Ile
2585 2590 2595
Ile Phe Ala Leu Val Ile Arg Phe Gln Gly Val Phe Lys Ala Tyr
2600 2605 2610
Thr Pro Val Val Phe Ala Val Ile Met Val Trp Gly Leu Asn Val
2615 2620 2625
Phe Met Leu Cys Val Tyr Ser Tyr Asn Pro Phe Val Ala Val Met
2630 2635 2640
Leu Leu Ala Leu Tyr Cys Tyr Met Ser Leu Met Val Gly Arg Thr
2645 2650 2655
Val Ser Thr Val Met His Leu Trp Val Val Phe Thr Phe Ile Met
2660 2665 2670
Val Val Pro Trp Trp Leu Ala Cys Val Tyr Ile Ala Phe Val Ala
2675 2680 2685
Tyr Met Tyr Thr Pro Phe Ala Met Trp Cys Tyr Gly Thr Ala Lys
2690 2695 2700
Gln Thr Arg Lys Leu Tyr Glu Gly Asn Glu Phe Val Gly Asn Tyr
2705 2710 2715
Asp Leu Ala Ala Gln Ser Thr Phe Val Ile Arg Asn Val Glu Phe
2720 2725 2730
Val Lys Leu Cys Asn Glu Val Gly Asp Lys Leu Asp Ile Tyr Leu
2735 2740 2745
Ser Ala Tyr Ala Arg Leu Lys Tyr Tyr Ser Gly Thr Gly Gly Glu
2750 2755 2760
Gln Asp Tyr Leu His Ala Cys Arg Ala Trp Leu Ala Tyr Ala Leu
2765 2770 2775
Asp Gln Phe Arg Ala Asn Gly Val Glu Val Leu Tyr Thr Pro Pro
2780 2785 2790
Lys Phe Ser Met Gly Val Thr Arg Leu Gln Ala Gly Phe Lys Lys
2795 2800 2805
Phe Val Ser Pro Ser Ser Ala Val Glu Lys Cys Val Val Met Val
2810 2815 2820
Arg Tyr Lys Gly Thr Val Leu Asn Gly Leu Trp Leu Asn Asp Cys
2825 2830 2835
Val Tyr Cys Pro Arg His Val Met Gly Lys Phe Ser Gly Asp Glu
2840 2845 2850
Trp Gln Asp Val Leu Ser Leu Ala Ser Asn His Glu Phe Glu Val
2855 2860 2865
Thr Gly Pro Asp Gly Ser Ser Leu Gln Val Val Ser Arg Lys Leu
2870 2875 2880
Gln Gly Ala Val Leu Ile Leu Gln Thr Ala Val Val Asn Val Asn
2885 2890 2895
Thr Pro Lys Tyr Lys Phe Val Gln Ala Gln Cys Gly Asp Thr Phe
2900 2905 2910
Thr Ile Ala Cys Ser Tyr Asn Gly Asn Val Val Gly Leu Tyr Pro
2915 2920 2925
Val Thr Met Arg Ala Asn Gly Thr Ile Arg Ala Ser Phe Ala Cys
2930 2935 2940
Gly Ser Cys Gly Ser Val Gly Phe Asn Met Asp Gly Gly Val Val
2945 2950 2955
Ala Phe Cys Tyr Met His His Leu Glu Leu Pro Asn Ala Ile His
2960 2965 2970
Thr Gly Thr Asp Leu Ala Gly Asn Phe Tyr Gly Gly Phe Ile Asp
2975 2980 2985
Glu Glu Cys Ala Gln Arg Val Glu Pro Asp Pro Arg Ile Thr Asn
2990 2995 3000
Asn Val Val Ala Trp Phe Tyr Ala Ala Ile Ile Ser Ile Lys Glu
3005 3010 3015
Ser Ser Phe Ser Leu Pro Lys Trp Val Glu Ser Thr Pro Ile Ser
3020 3025 3030
Val Asp Asp Tyr Asn Lys Trp Ala Ala Asp Ser Gly Phe Thr Pro
3035 3040 3045
Tyr Val Asp Ser Ile Ala Val Asn Lys Leu Ala Ala Ile Thr Ser
3050 3055 3060
Val Asp Val Gly Arg Val Leu Arg Thr Ile Ile Val Lys Asn Thr
3065 3070 3075
His Trp Gly Thr Asp Pro Ile Met Gly Val Phe Asn Phe Asp Asp
3080 3085 3090
Glu Leu Thr Pro Glu Ser Ile Phe Asn Gln Ile Gly Gly Val Lys
3095 3100 3105
Leu Gln Ser Ser Ile Ile Lys Arg Thr Ile Ser Trp Phe Trp Ser
3110 3115 3120
Arg Leu Val Leu Ala Met Phe Leu Phe Val Leu Cys Ala Met Val
3125 3130 3135
Leu Phe Thr Val Val Pro Tyr Lys Tyr Phe Ile Tyr Ala Ala Ile
3140 3145 3150
Ile Leu Phe Val Ala Val Phe Ile Ala Ala Phe Thr Ile Lys His
3155 3160 3165
Val Leu Ala Tyr Leu Asp Thr Phe Leu Leu Pro Thr Leu Cys Thr
3170 3175 3180
Val Met Ile Gly Val Cys Met Glu Val Pro Phe Ile Tyr Asn Thr
3185 3190 3195
Tyr Ile Tyr Asp Phe Leu Lys Gly Leu Phe Ser Pro Trp Tyr Asn
3200 3205 3210
Val Glu Val Val Asp Thr Val Val Pro Trp Met Phe Met Pro Ile
3215 3220 3225
Ile Val Tyr Thr Thr Phe Arg Cys Ile Gln Gly Cys Tyr Ala Ile
3230 3235 3240
Asp Ser Phe Ser Ala Ala Leu Thr Gly Ala Tyr Gln Val Val Lys
3245 3250 3255
Leu Gly Phe Thr Ile Tyr Thr Ser Trp Asn Thr Gly His Ala Tyr
3260 3265 3270
Ser Ala Gly Asp Trp Asp Leu Phe Phe Glu Leu Leu His Thr Thr
3275 3280 3285
Met Leu Ala Asn Ile Ser Ser Asn Ser Leu Val Gly Ile Ile Val
3290 3295 3300
Phe Asn Val Ala Lys Trp Cys Leu Arg Tyr Cys Asn Leu Thr Tyr
3305 3310 3315
Val Asn Ser Tyr Val Leu Met Ala Ile Phe Val Asn Val Met Gly
3320 3325 3330
Trp Met Phe Thr Cys Tyr Phe Gly Val Tyr Trp Trp Leu Asn Lys
3335 3340 3345
Val Phe Gly Leu Thr Cys Gly Lys Tyr Thr Tyr Lys Val Ser Val
3350 3355 3360
Glu Gln Tyr Lys Tyr Met Cys Val His Arg Ile Pro Ser Pro Lys
3365 3370 3375
Ser Ala Trp Asp Ile Phe Val Thr Asn Met Leu Ile Gln Gly Ile
3380 3385 3390
Gly Gly Glu Arg Lys Leu Pro Ile Ala Thr Val Gln Ser Lys Leu
3395 3400 3405
Thr Asp Val Lys Cys Thr Ala Val Val Leu Met Gln Leu Leu Thr
3410 3415 3420
Lys Leu Asn Val Glu Ala Asn Ser Lys Met His Lys His Leu Val
3425 3430 3435
Glu Leu His Asn Lys Ile Leu Ala Ser Glu Asp Leu Val Glu Cys
3440 3445 3450
Met Asp Asn Leu Leu Gly Met Leu Val Thr Leu Leu Cys Val Asp
3455 3460 3465
Ser Thr Val Asp Leu Ser Glu Tyr Cys Glu Asp Val Leu Gly Lys
3470 3475 3480
Val Thr Val Leu Gln Ser Val Ala Gln Glu Phe Ser His Ile Pro
3485 3490 3495
Ser Tyr Ala Glu Tyr Glu Arg Ala Lys Asp Leu Tyr Glu Arg Val
3500 3505 3510
Leu Ala Asp Ser Lys Ser Gly Asn Val Thr Gln Gln Glu Val Ala
3515 3520 3525
Ala Tyr Arg Lys Ala Ala Asn Ile Ala Lys Ser Val Phe Asp Arg
3530 3535 3540
Asp Leu Ser Val Gln Lys Lys Leu Asp Ala Met Ala Glu Arg Ala
3545 3550 3555
Met Thr Thr Met Tyr Lys Glu Ala Arg Val Thr Asp Arg Arg Ala
3560 3565 3570
Lys Leu Val Ser Ser Leu His Ala Leu Leu Phe Ser Met Leu Lys
3575 3580 3585
Lys Ile Asp Ser Asp Lys Leu Thr Ser Leu Phe Glu Gln Ala Arg
3590 3595 3600
Asp Gly Val Val Pro Leu Ala Thr Val Pro Ile Val Cys Ser Asn
3605 3610 3615
Lys Leu Thr Leu Val Ile Pro Asp Ala Gly Thr Trp Thr Lys Cys
3620 3625 3630
Val Glu Gly Thr Phe Val Thr Tyr Ser Thr Val Val Trp Asn Ile
3635 3640 3645
Asp Thr Val Phe Asp Ala Asp Gly Val Glu Ile Gln Pro Ser Ser
3650 3655 3660
Asn Gly Gln Ser Leu Val Tyr His Ile Gly Gly Asp Arg Ile Ala
3665 3670 3675
Trp Pro Leu Lys Val Asn Leu Thr Arg Asn Val His Asn Lys Val
3680 3685 3690
Glu Ala Ser Leu Gln Asn Asn Glu Leu Met Pro Gln Gly Ile Lys
3695 3700 3705
Thr Lys Ala Cys Val Ala Gly Thr Asp Gln Ala His Cys Asn Val
3710 3715 3720
Glu Ser Lys Cys Tyr Tyr Thr Asn Ile Asn Gly Ser Ser Val Val
3725 3730 3735
Ala Ala Ile Thr Ser His Asn Pro Asn Leu Lys Val Ala Ser Phe
3740 3745 3750
Leu Ser Asp Ala Gly Asn Gln Ile Phe Val Asp Leu Asp Pro Pro
3755 3760 3765
Cys Lys Phe Gly Met Lys Val Gly Gly Lys Val Glu Val Val Tyr
3770 3775 3780
Leu Tyr Phe Leu Lys Asn Thr Arg Ser Ile Ile Arg Gly Met Val
3785 3790 3795
Leu Gly Ala Ile Ser Asn Val Val Val Leu Gln Ser Lys Gly His
3800 3805 3810
Glu Thr Glu Glu Leu Glu Ser Val Gly Ile Leu Ser Leu Cys Ala
3815 3820 3825
Phe Ala Val Asp Pro Ala Glu Thr Tyr Leu Lys Tyr Val Ser Ala
3830 3835 3840
Gly Asn Gln Pro Leu Gly Asn Cys Val Lys Met Leu Thr Val His
3845 3850 3855
Asn Gly Asn Gly Phe Ala Ile Thr Thr Lys Pro Ser Pro Thr Pro
3860 3865 3870
Glu Gln Asp Ser Tyr Gly Gly Ala Ser Val Cys Leu Tyr Cys Arg
3875 3880 3885
Ala His Ile Ala His Pro Gly Ala Ser Gly Thr Leu Asp Gly Arg
3890 3895 3900
Cys Pro Phe Lys Gly Ser Phe Val Gln Ile Pro Thr Ser Glu Lys
3905 3910 3915
Asp Pro Val Gly Phe Cys Leu Arg Asn Lys Val Cys Lys Val Cys
3920 3925 3930
Gln Cys Trp Val Gly Phe Gly Cys Gln Cys Asp Phe Leu Arg Gln
3935 3940 3945
Pro Val Ala Asn Met Gln Ser Thr Tyr Val Ala Pro Val Val Ser
3950 3955 3960
Thr Asn Ser Asp Lys Asn Tyr Leu Asn Gly Phe Gly Val Ala Val
3965 3970 3975
Arg Leu Asp Leu Ile Pro Leu Ser Asp Gly Asn Gln Pro His Ile
3980 3985 3990
Val Lys Arg Ala Phe Asp Val Cys Asn Lys Glu Ser Ala Gly Met
3995 4000 4005
Phe Gln Asn Met Lys His Asn Cys Ala Arg Phe Gln Glu Val Val
4010 4015 4020
Glu Gly Glu Asp Ser Trp Lys His Gly Leu Glu Tyr Lys Asp Ser
4025 4030 4035
Tyr Phe Val Val Lys Gln Thr Thr Pro Ser Asn Tyr Val His Glu
4040 4045 4050
Gln Ala Cys Tyr Glu Asp Leu Lys Ser Asp Val Val Ala Val His
4055 4060 4065
Asp Phe Phe Val Phe Asn Lys Thr Ile Tyr Asn Val Ser Arg Gln
4070 4075 4080
Arg Leu Thr Lys Tyr Thr Met Met Asp Leu Cys Tyr Ala Leu Arg
4085 4090 4095
His Phe Asp Pro Lys Asp Cys Glu Val Leu Lys Glu Ile Leu Val
4100 4105 4110
Leu Asn Asp Cys Ile Glu Asp Trp Tyr Trp Met Gln Gly Gly Gln
4115 4120 4125
Gly Gln Ala Pro Gly Asn Trp Phe Asp His Asn Pro Thr Trp Tyr
4130 4135 4140
Asp Pro Ile Glu Asn Pro Ser Tyr Tyr Ala Ile Leu Ala Asn Leu
4145 4150 4155
Gly His Ile Val Arg Arg Ala Leu Leu Asn Ala Val Lys Phe Gly
4160 4165 4170
Asp Leu Met Val Glu Lys Gly Tyr Val Gly Val Val Thr Leu Asp
4175 4180 4185
Asn Gln Asp Leu Asn Gly Lys Phe Tyr Asp Phe Gly Asp Phe Gln
4190 4195 4200
Lys Thr Thr Pro Gly Ala Gly Val Pro Ile Phe Asp Ser Tyr Tyr
4205 4210 4215
Ser Tyr Leu Met Pro Ile Ile Thr Met Thr Asp Ala Leu Ala Thr
4220 4225 4230
Glu Arg Phe Tyr Glu Phe Asp Arg His Lys Gly Phe Lys Ser Tyr
4235 4240 4245
Asp Leu Leu Lys Tyr Asp Tyr Thr Glu Glu Lys Leu Glu Leu Phe
4250 4255 4260
Ser Lys Tyr Phe Lys Tyr Trp Asp Gln Glu Tyr His Pro Asn Cys
4265 4270 4275
Ser Glu Cys Ala Asp Asp Arg Cys Leu Ile His Cys Ala Asn Phe
4280 4285 4290
Asn Ile Leu Phe Ser Thr Leu Ile Pro Gln Thr Ser Phe Gly Asn
4295 4300 4305
Leu Cys Arg Lys Val Tyr Val Asp Gly Val Pro Phe Ile Ala Thr
4310 4315 4320
Cys Gly Tyr His Ser Lys Glu Leu Gly Val Ile Met Asn Gln Asp
4325 4330 4335
Asn Thr Leu Ser Phe Ser Lys Met Gly Leu Gly Gln Leu Met Lys
4340 4345 4350
Phe Val Gly Asp Pro Ala Leu Leu Val Gly Thr Ser Asn Asn Leu
4355 4360 4365
Val Asp Leu Arg Thr Ser Cys Phe Ser Ile Cys Ala Leu Ala Ser
4370 4375 4380
Gly Ile Thr His Gln Thr Val Lys Pro Gly His Phe Asn Lys Asp
4385 4390 4395
Phe Tyr Asp Phe Ala Glu Lys Ala Gly Met Phe Lys Glu Gly Ser
4400 4405 4410
Ser Ile Pro Leu Lys His Phe Phe Phe Pro Gln Thr Gly Ser Ala
4415 4420 4425
Ala Ile Asp Asp Tyr Asp Tyr Tyr Arg Tyr Asn Arg Pro Thr Met
4430 4435 4440
Phe Asp Ile Arg Gln Leu Leu Phe Cys Leu Glu Val Thr Ser Lys
4445 4450 4455
Tyr Phe Glu Cys Tyr Glu Gly Gly Cys Ile Ser Ala Ser Gln Val
4460 4465 4470
Val Val Thr Asn Leu Asp Lys Ser Ala Gly Tyr Pro Phe Asn Lys
4475 4480 4485
Phe Gly Lys Ala Arg Leu Tyr Tyr Glu Met Ser Phe Glu Glu Gln
4490 4495 4500
Asp Gln Leu Phe Glu Ser Thr Lys Lys Asn Val Leu Pro Thr Ile
4505 4510 4515
Thr Gln Met Asn Leu Lys Tyr Ala Ile Ser Ala Lys Asn Arg Ala
4520 4525 4530
Arg Thr Val Ala Gly Val Ser Ile Leu Ser Thr Met Thr Asn Arg
4535 4540 4545
Gln Tyr His Gln Lys Val Leu Lys Ser Ile Val Asn Thr Arg Asn
4550 4555 4560
Ala Pro Val Val Ile Gly Thr Thr Lys Phe Tyr Gly Gly Trp Asp
4565 4570 4575
Asn Met Leu Arg Asn Leu Ile Lys Gly Val Asp Asp Pro Ile Leu
4580 4585 4590
Met Gly Trp Asp Tyr Pro Lys Cys Asp Arg Ala Met Pro Asn Leu
4595 4600 4605
Leu Arg Ile Ala Ala Ser Leu Val Leu Ala Arg Lys His Thr Asn
4610 4615 4620
Cys Cys Thr Trp Ser Asp Arg Val Tyr Arg Leu Tyr Asn Glu Cys
4625 4630 4635
Ala Gln Val Leu Ser Glu Ser Val Leu Ala Thr Gly Gly Ile Tyr
4640 4645 4650
Val Lys Pro Gly Gly Thr Ser Ser Gly Asp Ala Thr Thr Ala Tyr
4655 4660 4665
Ala Asn Ser Val Phe Asn Ile Ile Gln Ala Thr Ser Ala Asn Val
4670 4675 4680
Ala Arg Leu Val Ser Thr Ile Thr Arg Asp Ile Val Tyr Asp Asp
4685 4690 4695
Val Arg Ala Met Gln His Glu Leu Tyr Gln Gln Val Tyr Arg Arg
4700 4705 4710
Val Asn Pro Asp Ala Ala Phe Val Glu Lys Phe Tyr Ser Tyr Leu
4715 4720 4725
Asn Lys His Phe Ser Leu Met Ile Leu Ser Asp Asp Gly Val Val
4730 4735 4740
Cys Tyr Asn Asn Thr Tyr Ala Lys Gln Gly Leu Val Ala Asp Ile
4745 4750 4755
Ser Ala Phe Arg Glu Val Leu Tyr Tyr Gln Asn Asn Val Tyr Met
4760 4765 4770
Ala Asp Ser Lys Cys Trp Val Glu Pro Asp Leu Glu Lys Gly Pro
4775 4780 4785
His Glu Phe Cys Ser Gln His Thr Met Leu Val Asp Val Asp Gly
4790 4795 4800
Glu Pro Lys Tyr Leu Pro Tyr Pro Asp Pro Ser Arg Ile Leu Gly
4805 4810 4815
Ala Cys Val Phe Val Asp Asp Val Asp Lys Thr Glu Pro Val Ala
4820 4825 4830
Val Met Glu Arg Tyr Val Ala Leu Ala Ile Asp Ala Tyr Pro Leu
4835 4840 4845
Val Tyr His Glu Asn Glu Glu Tyr Lys Lys Val Phe Tyr Val Leu
4850 4855 4860
Leu Ser Tyr Ile Arg Lys Leu Tyr Gln Glu Leu Ser Lys Asn Met
4865 4870 4875
Leu Thr Asp Tyr Ser Phe Val Leu Asp Ile Asp Lys Gly Ser Lys
4880 4885 4890
Phe Trp Glu Glu Glu Phe Tyr Ser Asn Met Tyr Arg Ala Pro Thr
4895 4900 4905
Thr Leu Gln Ser Cys Gly Val Cys Val Val Cys Gln Ser Gln Thr
4910 4915 4920
Ile Leu Arg Cys Gly Asn Cys Val Arg Lys Pro Phe Leu Cys Cys
4925 4930 4935
Lys Cys Cys Tyr Asp His Val Met Asn Thr Asn His Lys Asn Val
4940 4945 4950
Leu Ser Ile Asn Pro Tyr Ile Cys Thr His Pro Gly Cys Gly Glu
4955 4960 4965
Ala Asp Val Thr Lys Leu Tyr Leu Gly Gly Met Ser Tyr Phe Cys
4970 4975 4980
Val Asn His Lys Pro Arg Leu Ser Ile Pro Leu Val Ser Asn Gly
4985 4990 4995
Thr Val Phe Gly Ile Tyr Arg Ala Asn Cys Ala Gly Ser Glu Asn
5000 5005 5010
Val Asp Asp Phe Asn Gln Leu Ala Thr Thr Asn Trp Ser Thr Val
5015 5020 5025
Glu Pro Tyr Ile Leu Ala Asn Ser Cys Ser Asp Thr Leu Arg Arg
5030 5035 5040
Phe Ala Ala Glu Thr Val Lys Ala Thr Glu Glu Leu His Lys Gln
5045 5050 5055
Gln Tyr Ala Ser Ala Glu Val Lys Glu Val Leu Ser Asp Lys Glu
5060 5065 5070
Leu Ile Leu Ser Trp Glu Pro Asn Lys Ala Arg Pro Pro Leu Asn
5075 5080 5085
Arg Asn Tyr Val Phe Thr Gly Phe His Phe Thr Arg Asn Ser Lys
5090 5095 5100
Val Gln Leu Gly Asp Phe Thr Phe Glu Lys Gly Asp Gly Lys Asp
5105 5110 5115
Val Val Phe Tyr Lys Ala Thr Ser Thr Ala Lys Leu Ser Val Gly
5120 5125 5130
Asp Ile Phe Val Leu Thr Ser His Asn Val Val Ser Leu Thr Ala
5135 5140 5145
Pro Thr Leu Cys Pro Gln Gln Thr Phe Ser Arg Phe Val Asn Leu
5150 5155 5160
His Pro Asn Val Met Val Pro Glu Cys Phe Val Asn Asn Ile Pro
5165 5170 5175
Leu Tyr His Leu Val Gly Lys Gln Lys Arg Thr Thr Val Gln Gly
5180 5185 5190
Pro Pro Gly Ser Gly Lys Ser His Phe Ala Ile Gly Leu Ala Ala
5195 5200 5205
Tyr Phe Ser Asn Ala Arg Val Val Phe Thr Ala Cys Ser His Ala
5210 5215 5220
Ala Val Asp Ala Leu Cys Glu Lys Ala Phe Lys Phe Leu Lys Ile
5225 5230 5235
Asp Asp Cys Thr Arg Ile Val Pro Gln Arg Ala Thr Val Glu Cys
5240 5245 5250
Phe Ser Lys Phe Lys Pro Asn Asp Thr Gly Lys Lys Tyr Ile Phe
5255 5260 5265
Ser Thr Ile Asn Ala Leu Pro Glu Val Ser Cys Asp Ile Leu Leu
5270 5275 5280
Val Asp Glu Ile Ser Met Leu Thr Asn Tyr Asp Leu Ser Phe Val
5285 5290 5295
Asn Gly Lys Ile Asn Tyr Gln Tyr Val Val Tyr Val Gly Asp Pro
5300 5305 5310
Ala Gln Leu Pro Ala Pro Arg Thr Leu Leu Asn Gly Ser Leu Ser
5315 5320 5325
Pro Lys Asp Tyr Asn Val Val Thr Asn Leu Met Val Cys Val Lys
5330 5335 5340
Pro Asp Ile Phe Leu Ala Lys Cys Tyr Arg Cys Pro Lys Glu Ile
5345 5350 5355
Val Asp Thr Val Ser Ser Leu Val Tyr Asp Gly Lys Phe Ile Ala
5360 5365 5370
Asn Asn Pro Glu Ser Arg Gln Cys Phe Lys Val Val Val Asn Lys
5375 5380 5385
Gly Asn Ser Asp Val Gly His Glu Ser Gly Ser Ala Tyr Asn Met
5390 5395 5400
Thr Gln Leu Glu Phe Val Lys Asp Phe Ile Ser Arg Asn Lys Glu
5405 5410 5415
Trp Lys Gly Ala Thr Phe Ile Ser Pro Tyr Asn Ala Met Asn Gln
5420 5425 5430
Arg Ala Tyr Arg Met Leu Gly Leu Ser Val Gln Thr Val Asp Ser
5435 5440 5445
Ser Gln Gly Ser Glu Tyr Asp Tyr Val Ile Phe Cys Val Thr Ala
5450 5455 5460
Asp Ser Ala His Ala Leu Asn Ile Asn Arg Phe Asn Val Ala Leu
5465 5470 5475
Thr Arg Ala Lys Ile Gly Ile Leu Val Val Met Arg Gln Arg Asp
5480 5485 5490
Glu Leu Tyr Asn Ala Leu Arg Phe Val Glu Leu Asp Ser Asn Val
5495 5500 5505
Ala Leu Gln Ser Thr Gly Leu Phe Lys Ile Cys Asn Lys Glu Phe
5510 5515 5520
Ser Gly Val Ser Pro Ala Tyr Ala Val Thr Thr Lys Ala Leu Ser
5525 5530 5535
Ala Thr Tyr Lys Val Asn Asp Glu Leu Ala Ala Leu Val Asn Val
5540 5545 5550
Glu Ala Gly Ser Gln Ile Pro Tyr Lys His Leu Ile Ser Leu Leu
5555 5560 5565
Gly Phe Lys Met Ser Val Asn Val Glu Gly Cys His Asn Met Phe
5570 5575 5580
Ile Thr Arg Asp Ala Ala Ile Arg Asn Val Arg Gly Trp Val Gly
5585 5590 5595
Phe Asp Val Glu Ala Thr His Ala Cys Gly Pro Asn Ile Gly Thr
5600 5605 5610
Asn Leu Pro Phe Gln Val Gly Phe Ser Thr Gly Ala Asp Phe Val
5615 5620 5625
Val Thr Pro Glu Gly Leu Ile Asp Thr Pro Thr Gly Asn Asn Phe
5630 5635 5640
Glu Pro Val Asn Ser Lys Ala Pro Pro Gly Glu Gln Phe Asn His
5645 5650 5655
Leu Arg Thr Leu Phe Arg Ser Ala Lys Pro Trp Thr Val Ile Arg
5660 5665 5670
Pro Arg Ile Val Gln Met Leu Ala Asp Asn Leu Asn Asn Val Ser
5675 5680 5685
Asp Cys Val Val Phe Val Thr Trp Cys His Gly Leu Glu Leu Thr
5690 5695 5700
Thr Leu Arg Tyr Phe Val Lys Ile Gly Ala Glu Glu Val Cys Ser
5705 5710 5715
Cys Gly Ala Arg Ala Thr Thr Phe Asn Ser Ser Thr Leu Ala Tyr
5720 5725 5730
Ala Cys Trp Lys His Cys Leu Gly Phe Asp Phe Val Tyr Asn Pro
5735 5740 5745
Phe Ile Ile Asp Ile Gln Gln Trp Gly Tyr Ser Gly Asn Leu Gln
5750 5755 5760
Ser Asn His Asp Leu Tyr Cys Asp Val His Gly Arg Ala His Val
5765 5770 5775
Ala Ser Ala Asp Ala Ile Met Thr Arg Cys Leu Ala Ile Asn Asn
5780 5785 5790
Ala Phe Cys Gln Asp Val Asn Trp Asp Ile Thr Tyr Pro His Ile
5795 5800 5805
Ala Asn Glu Asp Glu Val Asn Ser Ser Cys Arg Phe Leu Gln Arg
5810 5815 5820
Met Tyr Phe Asn Ala Cys Val Asp Ala Leu Lys Val Lys Val Val
5825 5830 5835
Tyr Asp Ile Gly Asn Pro Lys Gly Ile Lys Cys Val Arg Arg Gly
5840 5845 5850
Asp Val Thr Phe Lys Phe Phe Asp Lys Asn Pro Ile Val Pro Asn
5855 5860 5865
Val Lys Gln Phe Cys Tyr Asp Tyr Asp Gln His Lys Asp Arg Phe
5870 5875 5880
Val Asp Gly Leu Cys Met Phe Trp Asn Cys Asn Val Asp Cys Tyr
5885 5890 5895
Pro Asp Asn Ser Leu Val Cys Arg Tyr Asp Thr Arg Asn Leu Ser
5900 5905 5910
Val Phe Asn Leu Pro Gly Cys Asn Gly Gly Ser Leu Tyr Val Asn
5915 5920 5925
Lys His Ala Phe His Thr Pro Lys Phe Asp Arg Ile Ser Phe Arg
5930 5935 5940
Asn Leu Lys Ala Met Pro Phe Phe Phe Tyr Asp Ala Ser Pro Cys
5945 5950 5955
Asp Thr Val Gln Val Asp Gly Val Ala Gln Asp Leu Val Ser Leu
5960 5965 5970
Ser Thr Lys Asp Cys Ile Thr Lys Cys Asn Ile Gly Gly Ala Val
5975 5980 5985
Cys Lys Lys His Ala Gln Met Tyr Ala Glu Phe Val Thr Ser Tyr
5990 5995 6000
Asn Ala Ala Val Thr Ala Gly Phe Thr Phe Trp Val Thr Asn Gln
6005 6010 6015
Phe Asn Pro Tyr Asn Leu Trp Lys Leu Phe Ser Ser Leu Gln Ser
6020 6025 6030
Ile Asp Asn Ile Ala Tyr Asn Met Tyr Lys Arg Gly His Tyr Asp
6035 6040 6045
Ala Val Val Gly Glu Ile Pro Thr Val Val Thr Gly Asp Lys Val
6050 6055 6060
Phe Val Ile Asp Lys Gly Val Glu Lys Ala Val Phe Val Asn Gln
6065 6070 6075
Ser Thr Leu Pro Thr Ser Val Ala Phe Glu Leu Phe Ala Lys Arg
6080 6085 6090
Asn Ile Arg Thr Leu Pro Asn Asn Arg Ile Leu Ser Gly Leu Gly
6095 6100 6105
Val Asp Ile Ala Tyr Lys Phe Val Ile Trp Asp Tyr Thr Asn Gln
6110 6115 6120
Thr Pro Leu Tyr Arg Asn Thr Val Asn Val Cys Pro Tyr Thr Asp
6125 6130 6135
Ile Glu Pro Lys Gly Leu Val Val Leu Tyr Asp Asp Arg Asn Gly
6140 6145 6150
Asp Tyr Gln Ser Phe Leu Ala Ala Asp Asp Ala Val Leu Val Ser
6155 6160 6165
Thr Gln Cys Tyr Lys Arg Tyr Pro Tyr Ala Glu Ile Pro Ser His
6170 6175 6180
Leu Leu Ala Gln Asn Gly Leu Pro Leu Lys Asp Gly Ala Asn Leu
6185 6190 6195
Tyr Val Tyr Lys Arg Ser Lys Gly Met Phe Val Thr Leu Pro Glu
6200 6205 6210
Thr Leu Asn Thr Gln Gly Arg Ser Tyr Glu Thr Phe Glu Pro Arg
6215 6220 6225
Ser Asp Val Glu Arg Glu Phe Leu Ser Leu Ser Glu Gln Asp Phe
6230 6235 6240
Val Val Lys Tyr Gly Lys Asp Leu Gly Leu Glu His Ile Leu Tyr
6245 6250 6255
Gly Glu Val Asp Lys Pro Gln Leu Gly Gly Leu His Thr Val Ile
6260 6265 6270
Gly Met Tyr Arg Leu Leu Arg Asp Asn Lys Leu Ser Ala Lys Ser
6275 6280 6285
Val Thr Asp Ser Asp Cys Glu Val Met Gln Asn Tyr Phe Val Leu
6290 6295 6300
Ala Asp Asn Gly Ser Tyr Lys Gln Val Cys Thr Val Val Asp Leu
6305 6310 6315
Leu Leu Asp Asp Phe Leu Asp Leu Leu Arg Asn Ile Leu Gln Glu
6320 6325 6330
Tyr Gly Ser Gly Lys Ser Lys Val Val Thr Val Pro Ile Asp Tyr
6335 6340 6345
His Asn Ile Ser Phe Met Thr Trp Phe Glu Asn Gly Ser Ile Lys
6350 6355 6360
Thr Cys Tyr Pro Gln Leu Gln Ser Ala Trp Lys Cys Gly Tyr Asn
6365 6370 6375
Leu Pro Glu Leu Tyr Lys Val Gln Thr Cys Val Met Glu Pro Cys
6380 6385 6390
Asn Ile Pro Asn Tyr Gly Val Gly Ile Met Leu Pro Asp Gly Ile
6395 6400 6405
Met Met Asn Val Ala Lys Tyr Thr Gln Leu Cys Gln Tyr Leu Ser
6410 6415 6420
Lys Thr Thr Met Cys Val Pro His Asn Met Arg Val Met His Phe
6425 6430 6435
Gly Ala Gly Ser Asp Lys Gly Val Ala Pro Gly Thr Thr Val Leu
6440 6445 6450
Lys Gln Trp Leu Pro Glu Gly Thr Leu Leu Val Asp Asn Asp Ile
6455 6460 6465
Asp Ser Tyr Val Ser Asp Ala His Val Ser Val Ile Asp Asp Cys
6470 6475 6480
Asn Lys Phe Arg Thr Glu His Lys Phe Asp Leu Val Ile Ser Asp
6485 6490 6495
Met Tyr Thr Asp Asn Asp Ser Lys Lys Lys His Glu Gly Lys Val
6500 6505 6510
Ala Asn Asn Gly Asn Thr Asp Val Phe Met Tyr Leu Thr Asn Phe
6515 6520 6525
Leu Arg Asn Asn Leu Ala Leu Gly Gly Ser Phe Ala Val Lys Ile
6530 6535 6540
Thr Glu Thr Ser Trp Tyr Glu Gly Leu Tyr Glu Ile Ala Gln Asp
6545 6550 6555
Cys Ser Trp Trp Thr Leu Phe Cys Thr Ala Val Asn Ala Ser Ser
6560 6565 6570
Ser Glu Ala Phe Leu Val Gly Val Asn Tyr Leu Gly Glu Ser Glu
6575 6580 6585
Lys His Lys Ile Ser Gly Arg Thr Leu His Ala Asn Tyr Ile Phe
6590 6595 6600
Trp Arg Asn Val Ser Tyr Leu Gln Thr Ser Ala Phe Thr Ile Phe
6605 6610 6615
Asp Val Ala Lys Phe Gly Leu Lys Thr Lys Ala Thr Pro Val Val
6620 6625 6630
Asn Leu Lys Lys Glu Leu Gln Thr Asp Leu Val Leu Asn Leu Ile
6635 6640 6645
Arg Asn Gly Lys Leu Val Val Arg Asp Val Gly Asn Val Gly Phe
6650 6655 6660
Val Asp Asp Ser Phe Val Cys Ala His
6665 6670
<210> 252
<211> 1180
<212> PRT
<213> Avian coronavirus
<400> 252
Met Leu Gly Met Leu Ala Thr Leu Val Leu Leu Thr Thr Val Leu Phe
1 5 10 15
Val Pro Ile Asn Ser Leu Ser Gly Asp Asn Trp Val Tyr Tyr Tyr Pro
20 25 30
Ser Ala Phe Arg Pro Ser Asn Gly Trp His Lys Gln Glu Gly Ala Tyr
35 40 45
Ser Val Val Gly Ile Gln Ser Thr Asn Val Thr Gly Asn Ser Ala Gly
50 55 60
Cys Pro Tyr Met Phe Asn Thr Thr Ser Gln Leu Ile Ala Ser Asp Ala
65 70 75 80
Val Ala Ile Met Ser Lys Phe Pro Thr Thr Trp Thr Asn Asn Asn Gly
85 90 95
Gln Ile Tyr Val His Met Ile Gly Cys Thr Met Ala Asn His Thr Phe
100 105 110
Tyr Val Trp Gly Pro Leu Lys Ser Gly Asn Ser Arg Pro Gly Val Pro
115 120 125
Asn Gly Leu Leu Phe Gln Val Tyr Ser Ser Asn Phe Thr Leu Leu Tyr
130 135 140
Asn Lys Thr Trp Leu Gly Trp Lys Glu His Thr Arg Phe Glu Ser Leu
145 150 155 160
Gln Cys Val Ser Leu Phe Gly Ser Val Tyr Phe Asn Gly Asp Leu Ile
165 170 175
Tyr Gln Leu Gly Tyr Asn Ala Gln Val Gln Asn Val Ser Phe Val Tyr
180 185 190
Cys Gly Thr Val Thr Gly Tyr Tyr Tyr Phe Ser Lys Gln Phe Gln Ser
195 200 205
Leu Val Tyr Phe Gln Asn Gly Thr Ala Leu Asp Leu Ile Leu Cys Asp
210 215 220
Asp Thr Pro Arg Gly Ile Leu Ala Cys Gln Tyr Gly Thr Gly Asn Phe
225 230 235 240
Thr Asp Gly Leu Tyr Pro Phe Thr His Ser Ser Val Val Asn Lys Thr
245 250 255
Leu Glu Val Tyr Leu Thr Asn Ser Val Val Asn Asn Thr Val Tyr Gly
260 265 270
Gln Leu Val Asn Val Thr Phe Tyr Asn Gln Thr Asn Val Gln Val Gly
275 280 285
Asn Leu Ser Gly Ser Gln Leu Gly Asn Leu Asn Gln Leu Arg Leu Tyr
290 295 300
Gln Asp Lys Val Phe Asp Ala Pro Tyr Tyr Asn Leu Asn Phe Ser Phe
305 310 315 320
Leu Asp Ser Pro Asp Phe Glu Phe Arg Pro Gln Gly Gly Gly Trp Thr
325 330 335
Pro Glu Ala Asp Ser Gln Phe Thr Gln Cys Pro Phe Thr Ile Asn Ser
340 345 350
Ile Asn Asn Gly His Cys Phe Asn Ser Leu Arg Val Ala Ile Thr Tyr
355 360 365
Val Pro Gly Tyr Arg Gly Cys Tyr Tyr Ala Met Arg His Phe Gly Ala
370 375 380
Gln Cys Cys Tyr Met Tyr Tyr Met Asn Asn Gln Pro Leu Cys Ala Gly
385 390 395 400
Ile Asp Pro Val Glu Tyr Asn Arg Thr Trp Arg Cys Ala Leu Ala Val
405 410 415
Leu Val Phe Met Gln Ser Gly Ser Arg Ile Cys Thr Ser Glu Thr Val
420 425 430
Pro Ile Asn Thr Val Ser Thr Val Leu Asn Asn Thr Phe Val Leu Asp
435 440 445
Thr Cys Val Asn Tyr Thr Ile Tyr Ser Arg Tyr Gly Val Gly Leu Val
450 455 460
Thr Asn Val Thr Asp Gln Val Thr Pro Gly Thr Phe Leu Asn Asp Gly
465 470 475 480
Gly Leu Val Val Leu Asp Ser Ser Gly Ala Ile Asp Ile Phe Ala Val
485 490 495
Asn Glu Val Val Gly Arg His Tyr Phe Lys Val Asn Pro Cys Ser Asp
500 505 510
Val Asn Gln Gln Tyr Val Val Ser Gly Gly Asn Ile Val Gly Arg Leu
515 520 525
Thr Ser Val Asn Glu Ser Gly Ser Gln Phe Leu Asp Asn Gln Tyr Tyr
530 535 540
Val Pro Leu Ile Asn Ser Thr Arg Ser Lys Arg Ser Val Gln Asn Ser
545 550 555 560
Thr Val Thr Ser Cys Ala Tyr Val Ser Tyr Gly Gln Tyr Cys Ile Lys
565 570 575
Pro Asp Ala Ser Val Val Gln Ile Gln Pro Asp Thr Phe Asp Gly Phe
580 585 590
Val Thr Pro Leu Leu Asn Ala Thr Glu Tyr Val Leu Ile Pro Asp Ser
595 600 605
Phe Asn Leu Thr Val Thr Asp Glu Tyr Ile Gln Thr Arg Met Glu Gln
610 615 620
Ile Gln Ile Asn Cys Ile Gln Tyr Val Cys Gly Ser Ser Val Gln Cys
625 630 635 640
Arg Gln Leu Phe Gln Gln Tyr Gly Ser Val Cys Asp Asn Ile Leu Ser
645 650 655
Ile Val Asn Gly Leu Ala Gln Gln Asp Asn Ala Glu Leu Ile Ser Leu
660 665 670
Tyr Ser Ser Thr Gln Pro Gly Gln Asn Tyr Pro Pro Val Phe Asn Asn
675 680 685
Leu Asp Thr Gly Gly Phe Asn Ile Ser Leu Leu Leu Pro Gln Asn Lys
690 695 700
Ser Gly Val Gln Ser Arg Ser Phe Ile Glu Asp Leu Leu Phe Thr Lys
705 710 715 720
Ile Glu Ser Val Gly Leu Pro Thr Asp Ala Glu Tyr Gln Lys Cys Thr
725 730 735
Ser Gly Leu Leu Gly Trp Val Lys Asp Leu Val Cys Ala Gln Tyr Tyr
740 745 750
Asn Gly Ile Met Val Leu Pro Pro Val Ile Thr Asn Glu Met Gln Phe
755 760 765
Met Tyr Thr Ser Ser Leu Val Ala Ser Met Ala Phe Gly Gly Leu Thr
770 775 780
Ser Ala Gly Ala Ile Pro Phe Ala Thr Gln Val Gln Ala Arg Ile Asn
785 790 795 800
His Leu Gly Ile Thr Gln Thr Leu Leu Leu Lys Asn Gln Glu Leu Leu
805 810 815
Ala Asn Ser Phe Asn Asn Ala Leu Gln Tyr Met Gln Gln Gly Phe Glu
820 825 830
Ala Thr Ser Gln Ala Leu Gln Gln Ile Gln Asp Val Val Asn Gln Gln
835 840 845
Ala Ala Val Leu Thr Glu Val Met Ser Ser Leu Asn Lys Asn Phe Gly
850 855 860
Ala Ile Ser Ser Val Ile Gln Asp Ile Tyr Lys Gln Leu Asp Glu Leu
865 870 875 880
Ser Ala Asn Ala Gln Val Asp Arg Leu Ile Thr Gly Arg Leu Ser Ser
885 890 895
Leu Ser Val Leu Ala Ser Ser Lys Gln Ala Glu Tyr Leu Arg Val Ala
900 905 910
Gln Gln Arg Gln Leu Ala Gln Asp Lys Ile Asn Glu Cys Val Arg Ser
915 920 925
Gln Ser Thr Arg Asn Ser Phe Cys Gly Asn Gly Met His Val Leu Ser
930 935 940
Ile Pro Gln Ser Ala Pro Asn Gly Ile Ala Phe Ile His Phe Thr Tyr
945 950 955 960
Thr Pro Gln Thr Tyr Lys Asn Val Thr Ala Val Val Gly Phe Cys Val
965 970 975
Thr Thr Asn Gly Ser Gly Tyr Gly Leu Val Pro Val Asn Gly Arg Gly
980 985 990
Ile Phe Ile Tyr Val Asp Asp Ala Tyr Tyr Ile Thr Ser Arg Asp Met
995 1000 1005
Tyr Met Pro Arg Asn Ile Thr Ser Gly Asp Val Val Val Leu Thr
1010 1015 1020
Ser Cys Gln Ala Asn Tyr Val Thr Val Asn Arg Thr Val Val Thr
1025 1030 1035
Thr Phe Val Asp Asp Asp Phe Asp Phe Asp Asp Glu Phe Glu Lys
1040 1045 1050
Trp Trp Asn Gln Thr Asp His Val Ile Pro Asp Leu Asp Glu Phe
1055 1060 1065
Asn Tyr Thr Ile Pro Ile Leu Asp Ile Asn Asn Glu Ile Asp Arg
1070 1075 1080
Ile Gln Gln Ala Ile Gln Gly Leu Asn Gln Ser Tyr Val Asp Leu
1085 1090 1095
Glu Ser Leu Ser Ile Leu Thr Thr Tyr Ile Lys Trp Pro Trp Tyr
1100 1105 1110
Val Trp Leu Ala Ile Ala Phe Ala Thr Ile Ile Phe Ile Leu Ile
1115 1120 1125
Leu Cys Trp Ile Phe Phe Met Thr Gly Cys Cys Gly Cys Cys Cys
1130 1135 1140
Gly Cys Phe Gly Leu Ile Pro Leu Met Ser Lys Cys Arg Lys Lys
1145 1150 1155
Ser Ser Tyr Tyr Thr Thr Phe Asp Asp Asp Ile Val Gly Glu Gln
1160 1165 1170
Ile Arg Pro Lys Lys Ser Val
1175 1180
<210> 253
<211> 101
<212> PRT
<213> Avian coronavirus
<400> 253
Met Ala Pro Lys Lys Phe Phe Val Arg Cys Tyr Lys Arg Ile Arg Ser
1 5 10 15
Leu Phe Arg Ser Arg Asn Ser Ser Ser Arg Ile Glu Asp Tyr Leu Leu
20 25 30
Gly Ser Ser Leu Thr Val Ser Cys Phe Asn Glu Val Cys Phe Cys Met
35 40 45
Gln Pro Glu Cys Ser Val Cys Asn Val Thr Cys Asp Cys Cys Gly Gly
50 55 60
Cys Gly Asp Trp Leu Cys Lys Thr Cys Asn Tyr Ile Pro Leu Asn Asn
65 70 75 80
Phe Asp Ala Asp Ala Tyr Ile Leu Lys His Gln Gln Ser Met Ile Asn
85 90 95
Leu Val Leu Gln Leu
100
<210> 254
<211> 101
<212> PRT
<213> Avian coronavirus
<400> 254
Met Leu Ala Ile Ile Glu Asn Gly Phe Lys Thr Val Cys Leu Ala Gly
1 5 10 15
Val Val Phe Val Thr Ile Asp Ala Leu Leu Ser Thr Ser Leu Ser Gly
20 25 30
Leu Gln Phe Gln His Val Met Leu Glu Arg Gly Glu Asp Ala Met Cys
35 40 45
Asp Ala Ser Arg Ile Ala His Leu Ile Ser Leu Leu Ala Asp Cys Arg
50 55 60
Val Tyr Asp Pro Phe Ala Glu Ala Phe Tyr Cys Asn Gly Ser Phe Trp
65 70 75 80
Glu Val Asp Ser Met Glu Glu Asp Gly Ser Ile Leu Thr Ser Asp Ser
85 90 95
Asp Ile Asp Leu Tyr
100
<210> 255
<211> 100
<212> PRT
<213> Avian coronavirus
<400> 255
Met Asp Ile Leu Ser Lys Ser Val Glu Asp Asn Gly Ala Phe Leu Thr
1 5 10 15
Ala Val Tyr Val Phe Val Gly Phe Ile Ala Leu Tyr Leu Leu Gly Arg
20 25 30
Ala Leu Gln Ala Phe Thr Gln Ala Ala Asp Ala Cys Phe Leu Phe Trp
35 40 45
Tyr Thr Trp Phe Ala Leu Pro Thr Gly Arg Gly Ile Ala Phe Val Tyr
50 55 60
Arg Asn Thr Tyr Gly Arg Lys Ile Asn Asn Pro Glu Leu Glu Ala Val
65 70 75 80
Ile Val Asn Gln Phe Pro Lys Asn Gly Pro Asn Asn Lys Leu Pro Ala
85 90 95
Asn Phe Ala Ser
100
<210> 256
<211> 226
<212> PRT
<213> Avian coronavirus
<400> 256
Met Ser Asn Asp Ser Ala Asn Cys Thr Leu Gly Tyr Glu Glu Ala Val
1 5 10 15
Trp Val Phe Lys Glu Tyr Asn Leu Phe Leu Thr Ala Phe Leu Leu Phe
20 25 30
Met Ser Met Ile Leu Gln Tyr Gly Tyr Ala Thr Arg Ser Arg Phe Met
35 40 45
Tyr Val Ile Lys Met Ile Val Leu Trp Leu Phe Trp Pro Leu Asn Ile
50 55 60
Ala Val Gly Val Ile Ser Cys Ile Tyr Pro Val Gly Thr Gly Gly Leu
65 70 75 80
Val Ala Ala Ile Val Leu Thr Ile Phe Ala Cys Leu Ser Phe Val Gly
85 90 95
Tyr Trp Val Gln Ser Ile Arg Leu Phe Lys Arg Cys Lys Ser Phe Trp
100 105 110
Ala Phe Asn Pro Glu Ser Asp Ala Val Gly Ser Ile Ser Leu Thr Thr
115 120 125
Gly Gln Thr Cys Thr Phe Ser Ile Glu Ser Val Pro Met Val Leu Ser
130 135 140
Pro Ile Ile Lys Ala Gly Val Leu Tyr Cys Glu Gly Gln Trp Leu Ala
145 150 155 160
Lys Cys Thr Pro Ser Glu Val Pro Gln His Ile Tyr Val Cys Thr Pro
165 170 175
Asp Arg Arg Asn Val Tyr Lys Arg Val Ala Ala Tyr Ser Gly Asp Asn
180 185 190
Lys Ala Asn Lys Lys Ser Phe Ala Thr Phe Val Phe Thr Lys Glu Ser
195 200 205
Val Asp Ser Gly Asp Leu Asp Ser Val Ala Thr Ser Gly Gly Ser Leu
210 215 220
Tyr Ser
225
<210> 257
<211> 65
<212> PRT
<213> Avian coronavirus
<400> 257
Met Ser Phe Cys Ser Arg Phe Thr Lys Ala Thr Ile Ser Phe Tyr Lys
1 5 10 15
Ser Leu Leu Leu Phe Glu Leu Arg Val Leu Asp Lys Phe Ile Leu Asn
20 25 30
Tyr Gly Pro Thr Cys Phe Leu Leu Ser Cys Lys Arg Phe Leu Leu Phe
35 40 45
Gln Val Asn Ile Leu Tyr Arg Leu Val Phe Thr Pro Lys Asn Ser Leu
50 55 60
Val
65
<210> 258
<211> 89
<212> PRT
<213> Avian coronavirus
<400> 258
Met Asn Asn Pro Phe Ser Thr Ala Thr Ala Arg Lys Ala Arg Val Phe
1 5 10 15
Ile Arg Gly Gly Leu Asn Ser Val Phe Phe Leu Asn Glu Lys Gly Gln
20 25 30
Pro Glu Val Cys Pro Phe Cys Thr Ala Leu Val Ala Arg Gly Gln Leu
35 40 45
Cys Gln Glu His Leu Phe Asn Asn Asn Ile Leu Ser Trp His Arg Val
50 55 60
Thr Arg Leu Ser Gln Lys Ile Arg Pro Met Arg Gln His Gln Cys Ser
65 70 75 80
Ser Trp Glu Val Gln His His Leu Lys
85
<210> 259
<211> 418
<212> PRT
<213> Avian coronavirus
<400> 259
Met Ala Ser Arg Asp Ala Ser Lys Ser Lys Asn Lys Thr Asp Ala Pro
1 5 10 15
Ala Pro Val Leu Lys Leu Gly Gly Pro Ala Pro Pro Lys Ile Gly Ser
20 25 30
Ser Gly Thr Ala Ser Trp Phe Gln Pro Ile Lys Glu Lys Lys Met Thr
35 40 45
His Asn Pro Pro Thr Phe Thr Gly Ser Gly Val Pro Glu Asn Asp Asn
50 55 60
Val Lys Lys Pro Ala Arg His Gly Tyr Trp Lys Arg Gln Arg Arg Tyr
65 70 75 80
Lys Pro Gly Lys Gly Lys Arg Thr Pro Val Thr Asp Ala Trp Tyr Phe
85 90 95
Tyr Tyr Thr Gly Thr Gly Pro Phe Ala Asp Leu Lys Trp Gly Gln Pro
100 105 110
His Asp Asp Ile Val Trp Val Ala Val Asp Gly Ala Asp Val Asp Ala
115 120 125
Lys Ser Gly Gln Gly Thr Arg Asp Pro Asp Lys Phe Asp Gln Phe Pro
130 135 140
Leu Arg Phe Ala Glu Gly Gly Pro Asp Asp Asn Phe Arg Trp Asp Phe
145 150 155 160
Ile Pro Val Gly Gly Arg Gly Arg Ser Gly Arg Ser Ser Val Ala Thr
165 170 175
Ser Arg Glu Ser Ser Arg Pro Gly Ser Arg Glu Gly Ser Arg Gly Arg
180 185 190
Arg Gln Met Gly Pro Asn Glu Asp Leu Ile Ala Arg Ala Ala Arg Ile
195 200 205
Ile Glu Glu Gln Gln Lys Arg Gly Gly Arg Ile Thr Lys Ala Lys Ala
210 215 220
Asn Glu Met Ala Glu Arg Arg Tyr Cys Lys Arg Thr Leu Ala Pro Gly
225 230 235 240
Lys Thr Val Asp Gln Val Phe Gly Thr Arg Gln Lys Gly Arg Glu Arg
245 250 255
Asn Phe Gly Asp Asp Arg Met Val Glu Glu Gly Ile Arg Asp Gly Arg
260 265 270
Thr Thr Ala Met Leu Asn Leu Ile Pro Ser Ser His Ala Met Leu Phe
275 280 285
Gly Ser His Val Gln Ala Lys Leu Gln Pro Glu Gly Leu Leu Val Thr
290 295 300
Phe Ser Phe Thr Thr Val Val Pro Arg Asp Asp Pro Gln Phe Glu Asn
305 310 315 320
Tyr Arg Gln Ile Cys Asp Glu Cys Val Asp Gly Val Gly Thr Arg Pro
325 330 335
Lys Asn Glu Pro Lys Pro Arg Ser Arg Ser Ser Ser Lys Pro Ala Ser
340 345 350
Arg Ala Ala Ser Pro Ala Pro Lys Gln Gln Arg Pro Lys Lys Glu Lys
355 360 365
Lys Pro Lys Asn Gln Asp Lys Asp Lys Thr Asp Gly Ala Met Ser Gln
370 375 380
Glu Glu Lys Ala Val Asn Asp Gln Leu Glu Phe Asp Asp Ala Asp Gln
385 390 395 400
Gly Met Pro Asp Lys Ile Asp Trp Gly Ser Ser Ala Leu Gly Asp Thr
405 410 415
Glu Ile
<210> 260
<211> 7096
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<220>
<221> MOD_RES
<222> (6969)..(6972)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (6980)..(6980)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (6984)..(6995)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (7002)..(7006)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (7008)..(7010)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (7018)..(7031)
<223> Any amino acid
<400> 260
Met Glu Ser Leu Val Pro Gly Phe Asn Glu Lys Thr His Val Gln Leu
1 5 10 15
Ser Leu Pro Val Leu Gln Val Arg Asp Val Leu Val Arg Gly Phe Gly
20 25 30
Asp Ser Val Glu Glu Val Leu Ser Glu Ala Arg Gln His Leu Lys Asp
35 40 45
Gly Thr Cys Gly Leu Val Glu Val Glu Lys Gly Val Leu Pro Gln Leu
50 55 60
Glu Gln Pro Tyr Val Phe Ile Lys Arg Ser Asp Ala Arg Thr Ala Pro
65 70 75 80
His Gly His Val Met Val Glu Leu Val Ala Glu Leu Glu Gly Ile Gln
85 90 95
Tyr Gly Arg Ser Gly Glu Thr Leu Gly Val Leu Val Pro His Val Gly
100 105 110
Glu Ile Pro Val Ala Tyr Arg Lys Val Leu Leu Arg Lys Asn Gly Asn
115 120 125
Lys Gly Ala Gly Gly His Ser Tyr Gly Ala Asp Leu Lys Ser Phe Asp
130 135 140
Leu Gly Asp Glu Leu Gly Thr Asp Pro Tyr Glu Asp Phe Gln Glu Asn
145 150 155 160
Trp Asn Thr Lys His Ser Ser Gly Val Thr Arg Glu Leu Met Arg Glu
165 170 175
Leu Asn Gly Gly Ala Tyr Thr Arg Tyr Val Asp Asn Asn Phe Cys Gly
180 185 190
Pro Asp Gly Tyr Pro Leu Glu Cys Ile Lys Asp Leu Leu Ala Arg Ala
195 200 205
Gly Lys Ala Ser Cys Thr Leu Ser Glu Gln Leu Asp Phe Ile Asp Thr
210 215 220
Lys Arg Gly Val Tyr Cys Cys Arg Glu His Glu His Glu Ile Ala Trp
225 230 235 240
Tyr Thr Glu Arg Ser Glu Lys Ser Tyr Glu Leu Gln Thr Pro Phe Glu
245 250 255
Ile Lys Leu Ala Lys Lys Phe Asp Ile Phe Asn Gly Glu Cys Pro Asn
260 265 270
Phe Val Phe Pro Leu Asn Ser Ile Ile Lys Thr Ile Gln Pro Arg Val
275 280 285
Glu Lys Lys Lys Leu Asp Gly Phe Met Gly Arg Ile Arg Ser Val Tyr
290 295 300
Pro Val Ala Ser Pro Asn Glu Cys Asn Gln Met Cys Leu Ser Thr Leu
305 310 315 320
Met Lys Cys Asp His Cys Gly Glu Thr Ser Trp Gln Thr Gly Asp Phe
325 330 335
Val Lys Ala Thr Cys Glu Phe Cys Gly Thr Glu Asn Leu Thr Lys Glu
340 345 350
Gly Ala Thr Thr Cys Gly Tyr Leu Thr Gln Asn Ala Val Val Lys Ile
355 360 365
Tyr Cys Pro Ala Cys His Asn Ser Glu Val Gly Pro Glu His Ser Leu
370 375 380
Ala Glu Tyr His Asn Glu Ser Gly Leu Lys Thr Ile Leu Arg Lys Gly
385 390 395 400
Gly Arg Thr Ile Ala Phe Gly Gly Cys Val Phe Ser Tyr Val Gly Cys
405 410 415
His Asn Lys Cys Ala Tyr Trp Val Pro Arg Ala Ser Ala Asn Ile Gly
420 425 430
Cys Asn His Thr Gly Val Val Gly Glu Gly Ser Glu Gly Leu Asn Asp
435 440 445
Asn Leu Leu Glu Ile Leu Gln Lys Glu Lys Val Asn Ile Asn Ile Val
450 455 460
Gly Asp Phe Lys Leu Asn Glu Glu Ile Ala Ile Ile Leu Ala Ser Phe
465 470 475 480
Ser Ala Ser Thr Ser Ala Phe Val Glu Thr Val Lys Gly Leu Asp Tyr
485 490 495
Lys Ala Phe Lys Gln Ile Val Glu Ser Cys Gly Asn Phe Lys Val Thr
500 505 510
Lys Gly Lys Ala Lys Lys Gly Ala Trp Asn Ile Gly Glu Gln Lys Ser
515 520 525
Ile Leu Ser Pro Leu Tyr Ala Phe Ala Ser Glu Ala Ala Arg Val Val
530 535 540
Arg Ser Ile Phe Ser Arg Thr Leu Glu Thr Ala Gln Asn Ser Val Arg
545 550 555 560
Val Leu Gln Lys Ala Ala Ile Thr Ile Leu Asp Gly Ile Ser Gln Tyr
565 570 575
Ser Leu Arg Leu Ile Asp Ala Met Met Phe Thr Ser Asp Leu Ala Thr
580 585 590
Asn Asn Leu Val Val Met Ala Tyr Ile Thr Gly Gly Val Val Gln Leu
595 600 605
Thr Ser Gln Trp Leu Thr Asn Ile Phe Gly Thr Val Tyr Glu Lys Leu
610 615 620
Lys Pro Val Leu Asp Trp Leu Glu Glu Lys Phe Lys Glu Gly Val Glu
625 630 635 640
Phe Leu Arg Asp Gly Trp Glu Ile Val Lys Phe Ile Ser Thr Cys Ala
645 650 655
Cys Glu Ile Val Gly Gly Gln Ile Val Thr Cys Ala Lys Glu Ile Lys
660 665 670
Glu Ser Val Gln Thr Phe Phe Lys Leu Val Asn Lys Phe Leu Ala Leu
675 680 685
Cys Ala Asp Ser Ile Ile Ile Gly Gly Ala Lys Leu Lys Ala Leu Asn
690 695 700
Leu Gly Glu Thr Phe Val Thr His Ser Lys Gly Leu Tyr Arg Lys Cys
705 710 715 720
Val Lys Ser Arg Glu Glu Thr Gly Leu Leu Met Pro Leu Lys Ala Pro
725 730 735
Lys Glu Ile Ile Phe Leu Glu Gly Glu Thr Leu Pro Thr Glu Val Leu
740 745 750
Thr Glu Glu Val Val Leu Lys Thr Gly Asp Leu Gln Pro Leu Glu Gln
755 760 765
Pro Thr Ser Glu Ala Val Glu Ala Pro Leu Val Gly Thr Pro Val Cys
770 775 780
Ile Asn Gly Leu Met Leu Leu Glu Ile Lys Asp Thr Glu Lys Tyr Cys
785 790 795 800
Ala Leu Ala Pro Asn Met Met Val Thr Asn Asn Thr Phe Thr Leu Lys
805 810 815
Gly Gly Ala Pro Thr Lys Val Thr Phe Gly Asp Asp Thr Val Ile Glu
820 825 830
Val Gln Gly Tyr Lys Ser Val Asn Ile Thr Phe Glu Leu Asp Glu Arg
835 840 845
Ile Asp Lys Val Leu Asn Glu Lys Cys Ser Ala Tyr Thr Val Glu Leu
850 855 860
Gly Thr Glu Val Asn Glu Phe Ala Cys Val Val Ala Asp Ala Val Ile
865 870 875 880
Lys Thr Leu Gln Pro Val Ser Glu Leu Leu Thr Pro Leu Gly Ile Asp
885 890 895
Leu Asp Glu Trp Ser Met Ala Thr Tyr Tyr Leu Phe Asp Glu Ser Gly
900 905 910
Glu Phe Lys Leu Ala Ser His Met Tyr Cys Ser Phe Tyr Pro Pro Asp
915 920 925
Glu Asp Glu Glu Glu Gly Asp Cys Glu Glu Glu Glu Phe Glu Pro Ser
930 935 940
Thr Gln Tyr Glu Tyr Gly Thr Glu Asp Asp Tyr Gln Gly Lys Pro Leu
945 950 955 960
Glu Phe Gly Ala Thr Ser Ala Ala Leu Gln Pro Glu Glu Glu Gln Glu
965 970 975
Glu Asp Trp Leu Asp Asp Asp Ser Gln Gln Thr Val Gly Gln Gln Asp
980 985 990
Gly Ser Glu Asp Asn Gln Thr Thr Thr Ile Gln Thr Ile Val Glu Val
995 1000 1005
Gln Pro Gln Leu Glu Met Glu Leu Thr Pro Val Val Gln Thr Ile
1010 1015 1020
Glu Val Asn Ser Phe Ser Gly Tyr Leu Lys Leu Thr Asp Asn Val
1025 1030 1035
Tyr Ile Lys Asn Ala Asp Ile Val Glu Glu Ala Lys Lys Val Lys
1040 1045 1050
Pro Thr Val Val Val Asn Ala Ala Asn Val Tyr Leu Lys His Gly
1055 1060 1065
Gly Gly Val Ala Gly Ala Leu Asn Lys Ala Thr Asn Asn Ala Met
1070 1075 1080
Gln Val Glu Ser Asp Asp Tyr Ile Ala Thr Asn Gly Pro Leu Lys
1085 1090 1095
Val Gly Gly Ser Cys Val Leu Ser Gly His Asn Leu Ala Lys His
1100 1105 1110
Cys Leu His Val Val Gly Pro Asn Val Asn Lys Gly Glu Asp Ile
1115 1120 1125
Gln Leu Leu Lys Ser Ala Tyr Glu Asn Phe Asn Gln His Glu Val
1130 1135 1140
Leu Leu Ala Pro Leu Leu Ser Ala Gly Ile Phe Gly Ala Asp Pro
1145 1150 1155
Ile His Ser Leu Arg Val Cys Val Asp Thr Val Arg Thr Asn Val
1160 1165 1170
Tyr Leu Ala Val Phe Asp Lys Asn Leu Tyr Asp Lys Leu Val Ser
1175 1180 1185
Ser Phe Leu Glu Met Lys Ser Glu Lys Gln Val Glu Gln Lys Ile
1190 1195 1200
Ala Glu Ile Pro Lys Glu Glu Val Lys Pro Phe Ile Thr Glu Ser
1205 1210 1215
Lys Pro Ser Val Glu Gln Arg Lys Gln Asp Asp Lys Lys Ile Lys
1220 1225 1230
Ala Cys Val Glu Glu Val Thr Thr Thr Leu Glu Glu Thr Lys Phe
1235 1240 1245
Leu Thr Glu Asn Leu Leu Leu Tyr Ile Asp Ile Asn Gly Asn Leu
1250 1255 1260
His Pro Asp Ser Ala Thr Leu Val Ser Asp Ile Asp Ile Thr Phe
1265 1270 1275
Leu Lys Lys Asp Ala Pro Tyr Ile Val Gly Asp Val Val Gln Glu
1280 1285 1290
Gly Val Leu Thr Ala Val Val Ile Pro Thr Lys Lys Ala Gly Gly
1295 1300 1305
Thr Thr Glu Met Leu Ala Lys Ala Leu Arg Lys Val Pro Thr Asp
1310 1315 1320
Asn Tyr Ile Thr Thr Tyr Pro Gly Gln Gly Leu Asn Gly Tyr Thr
1325 1330 1335
Val Glu Glu Ala Lys Thr Val Leu Lys Lys Cys Lys Ser Ala Phe
1340 1345 1350
Tyr Ile Leu Pro Ser Ile Ile Ser Asn Glu Lys Gln Glu Ile Leu
1355 1360 1365
Gly Thr Val Ser Trp Asn Leu Arg Glu Met Leu Ala His Ala Glu
1370 1375 1380
Glu Thr Arg Lys Leu Met Pro Val Cys Val Glu Thr Lys Ala Ile
1385 1390 1395
Val Ser Thr Ile Gln Arg Lys Tyr Lys Gly Ile Lys Ile Gln Glu
1400 1405 1410
Gly Val Val Asp Tyr Gly Ala Arg Phe Tyr Phe Tyr Thr Ser Lys
1415 1420 1425
Thr Thr Val Ala Ser Leu Ile Asn Thr Leu Asn Asp Leu Asn Glu
1430 1435 1440
Thr Leu Val Thr Met Pro Leu Gly Tyr Val Thr His Gly Leu Asn
1445 1450 1455
Leu Glu Glu Ala Ala Arg Tyr Met Arg Ser Leu Lys Val Pro Ala
1460 1465 1470
Thr Val Ser Val Ser Ser Pro Asp Ala Val Thr Ala Tyr Asn Gly
1475 1480 1485
Tyr Leu Thr Ser Ser Ser Lys Thr Pro Glu Glu His Phe Ile Glu
1490 1495 1500
Thr Ile Ser Leu Ala Gly Ser Tyr Lys Asp Trp Ser Tyr Ser Gly
1505 1510 1515
Gln Ser Thr Gln Leu Gly Ile Glu Phe Leu Lys Arg Gly Asp Lys
1520 1525 1530
Ser Val Tyr Tyr Thr Ser Asn Pro Thr Thr Phe His Leu Asp Gly
1535 1540 1545
Glu Val Ile Thr Phe Asp Asn Leu Lys Thr Leu Leu Ser Leu Arg
1550 1555 1560
Glu Val Arg Thr Ile Lys Val Phe Thr Thr Val Asp Asn Ile Asn
1565 1570 1575
Leu His Thr Gln Val Val Asp Met Ser Met Thr Tyr Gly Gln Gln
1580 1585 1590
Phe Gly Pro Thr Tyr Leu Asp Gly Ala Asp Val Thr Lys Ile Lys
1595 1600 1605
Pro His Asn Ser His Glu Gly Lys Thr Phe Tyr Val Leu Pro Asn
1610 1615 1620
Asp Asp Thr Leu Arg Val Glu Ala Phe Glu Tyr Tyr His Thr Thr
1625 1630 1635
Asp Pro Ser Phe Leu Gly Arg Tyr Met Ser Ala Leu Asn His Thr
1640 1645 1650
Lys Lys Trp Lys Tyr Pro Gln Val Asn Gly Leu Thr Ser Ile Lys
1655 1660 1665
Trp Ala Asp Asn Asn Cys Tyr Leu Ala Thr Ala Leu Leu Thr Leu
1670 1675 1680
Gln Gln Ile Glu Leu Lys Phe Asn Pro Pro Ala Leu Gln Asp Ala
1685 1690 1695
Tyr Tyr Arg Ala Arg Ala Gly Glu Ala Ala Asn Phe Cys Ala Leu
1700 1705 1710
Ile Leu Ala Tyr Cys Asn Lys Thr Val Gly Glu Leu Gly Asp Val
1715 1720 1725
Arg Glu Thr Met Ser Tyr Leu Phe Gln His Ala Asn Leu Asp Ser
1730 1735 1740
Cys Lys Arg Val Leu Asn Val Val Cys Lys Thr Cys Gly Gln Gln
1745 1750 1755
Gln Thr Thr Leu Lys Gly Val Glu Ala Val Met Tyr Met Gly Thr
1760 1765 1770
Leu Ser Tyr Glu Gln Phe Lys Lys Gly Val Gln Ile Pro Cys Thr
1775 1780 1785
Cys Gly Lys Gln Ala Thr Lys Tyr Leu Val Gln Gln Glu Ser Pro
1790 1795 1800
Phe Val Met Met Ser Ala Pro Pro Ala Gln Tyr Glu Leu Lys His
1805 1810 1815
Gly Thr Phe Thr Cys Ala Ser Glu Tyr Ala Gly Asn Tyr Gln Cys
1820 1825 1830
Gly His Tyr Lys His Ile Thr Ser Lys Glu Thr Leu Tyr Cys Ile
1835 1840 1845
Asp Gly Ala Leu Leu Thr Lys Ser Ser Glu Tyr Lys Gly Pro Ile
1850 1855 1860
Thr Asp Val Phe Tyr Lys Glu Asn Ser Tyr Thr Thr Thr Ile Lys
1865 1870 1875
Pro Val Thr Tyr Lys Leu Asp Gly Val Val Cys Thr Glu Ile Asp
1880 1885 1890
Pro Lys Leu Asp Asn Tyr Tyr Lys Lys Asp Asn Ser Tyr Phe Thr
1895 1900 1905
Glu Gln Pro Ile Asp Leu Val Pro Asn Gln Pro Tyr Pro Asn Ala
1910 1915 1920
Ser Phe Asp Asn Phe Lys Phe Val Cys Asp Asn Ile Lys Phe Ala
1925 1930 1935
Asp Asp Leu Asn Gln Leu Thr Gly Tyr Lys Lys Pro Ala Ser Arg
1940 1945 1950
Glu Leu Lys Val Thr Phe Phe Pro Asp Leu Asn Gly Asp Val Val
1955 1960 1965
Ala Ile Asp Tyr Lys His Tyr Thr Pro Ser Phe Lys Lys Gly Ala
1970 1975 1980
Lys Leu Leu His Lys Pro Ile Val Trp His Val Asn Asn Ala Thr
1985 1990 1995
Asn Lys Ala Thr Tyr Lys Pro Asn Thr Trp Cys Ile Arg Cys Leu
2000 2005 2010
Trp Ser Thr Lys Pro Val Glu Thr Ser Asn Ser Phe Asp Val Leu
2015 2020 2025
Lys Ser Glu Asp Ala Gln Gly Met Asp Asn Leu Ala Cys Glu Asp
2030 2035 2040
Leu Lys Pro Val Ser Glu Glu Val Val Glu Asn Pro Thr Ile Gln
2045 2050 2055
Lys Asp Val Leu Glu Cys Asn Val Lys Thr Thr Glu Val Val Gly
2060 2065 2070
Asp Ile Ile Leu Lys Pro Ala Asn Asn Ser Leu Lys Ile Thr Glu
2075 2080 2085
Glu Val Gly His Thr Asp Leu Met Ala Ala Tyr Val Asp Asn Ser
2090 2095 2100
Ser Leu Thr Ile Lys Lys Pro Asn Glu Leu Ser Arg Val Leu Gly
2105 2110 2115
Leu Lys Thr Leu Ala Thr His Gly Leu Ala Ala Val Asn Ser Val
2120 2125 2130
Pro Trp Asp Thr Ile Ala Asn Tyr Ala Lys Pro Phe Leu Asn Lys
2135 2140 2145
Val Val Ser Thr Thr Thr Asn Ile Val Thr Arg Cys Leu Asn Arg
2150 2155 2160
Val Cys Thr Asn Tyr Met Pro Tyr Phe Phe Thr Leu Leu Leu Gln
2165 2170 2175
Leu Cys Thr Phe Thr Arg Ser Thr Asn Ser Arg Ile Lys Ala Ser
2180 2185 2190
Met Pro Thr Thr Ile Ala Lys Asn Thr Val Lys Ser Val Gly Lys
2195 2200 2205
Phe Cys Leu Glu Ala Ser Phe Asn Tyr Leu Lys Ser Pro Asn Phe
2210 2215 2220
Ser Lys Leu Ile Asn Ile Ile Ile Trp Phe Leu Leu Leu Ser Val
2225 2230 2235
Cys Leu Gly Ser Leu Ile Tyr Ser Thr Ala Ala Leu Gly Val Leu
2240 2245 2250
Met Ser Asn Leu Gly Met Pro Ser Tyr Cys Thr Gly Tyr Arg Glu
2255 2260 2265
Gly Tyr Leu Asn Ser Thr Asn Val Thr Ile Ala Thr Tyr Cys Thr
2270 2275 2280
Gly Ser Ile Pro Cys Ser Val Cys Leu Ser Gly Leu Asp Ser Leu
2285 2290 2295
Asp Thr Tyr Pro Ser Leu Glu Thr Ile Gln Ile Thr Ile Ser Ser
2300 2305 2310
Phe Lys Trp Asp Leu Thr Ala Phe Gly Leu Val Ala Glu Trp Phe
2315 2320 2325
Leu Ala Tyr Ile Leu Phe Thr Arg Phe Phe Tyr Val Leu Gly Leu
2330 2335 2340
Ala Ala Ile Met Gln Leu Phe Phe Ser Tyr Phe Ala Val His Phe
2345 2350 2355
Ile Ser Asn Ser Trp Leu Met Trp Leu Ile Ile Asn Leu Val Gln
2360 2365 2370
Met Ala Pro Ile Ser Ala Met Val Arg Met Tyr Ile Phe Phe Ala
2375 2380 2385
Ser Phe Tyr Tyr Val Trp Lys Ser Tyr Val His Val Val Asp Gly
2390 2395 2400
Cys Asn Ser Ser Thr Cys Met Met Cys Tyr Lys Arg Asn Arg Ala
2405 2410 2415
Thr Arg Val Glu Cys Thr Thr Ile Val Asn Gly Val Arg Arg Ser
2420 2425 2430
Phe Tyr Val Tyr Ala Asn Gly Gly Lys Gly Phe Cys Lys Leu His
2435 2440 2445
Asn Trp Asn Cys Val Asn Cys Asp Thr Phe Cys Ala Gly Ser Thr
2450 2455 2460
Phe Ile Ser Asp Glu Val Ala Arg Asp Leu Ser Leu Gln Phe Lys
2465 2470 2475
Arg Pro Ile Asn Pro Thr Asp Gln Ser Ser Tyr Ile Val Asp Ser
2480 2485 2490
Val Thr Val Lys Asn Gly Ser Ile His Leu Tyr Phe Asp Lys Ala
2495 2500 2505
Gly Gln Lys Thr Tyr Glu Arg His Ser Leu Ser His Phe Val Asn
2510 2515 2520
Leu Asp Asn Leu Arg Ala Asn Asn Thr Lys Gly Ser Leu Pro Ile
2525 2530 2535
Asn Val Ile Val Phe Asp Gly Lys Ser Lys Cys Glu Glu Ser Ser
2540 2545 2550
Ala Lys Ser Ala Ser Val Tyr Tyr Ser Gln Leu Met Cys Gln Pro
2555 2560 2565
Ile Leu Leu Leu Asp Gln Ala Leu Val Ser Asp Val Gly Asp Ser
2570 2575 2580
Ala Glu Val Ala Val Lys Met Phe Asp Ala Tyr Val Asn Thr Phe
2585 2590 2595
Ser Ser Thr Phe Asn Val Pro Met Glu Lys Leu Lys Thr Leu Val
2600 2605 2610
Ala Thr Ala Glu Ala Glu Leu Ala Lys Asn Val Ser Leu Asp Asn
2615 2620 2625
Val Leu Ser Thr Phe Ile Ser Ala Ala Arg Gln Gly Phe Val Asp
2630 2635 2640
Ser Asp Val Glu Thr Lys Asp Val Val Glu Cys Leu Lys Leu Ser
2645 2650 2655
His Gln Ser Asp Ile Glu Val Thr Gly Asp Ser Cys Asn Asn Tyr
2660 2665 2670
Met Leu Thr Tyr Asn Lys Val Glu Asn Met Thr Pro Arg Asp Leu
2675 2680 2685
Gly Ala Cys Ile Asp Cys Ser Ala Arg His Ile Asn Ala Gln Val
2690 2695 2700
Ala Lys Ser His Asn Ile Ala Leu Ile Trp Asn Val Lys Asp Phe
2705 2710 2715
Met Ser Leu Ser Glu Gln Leu Arg Lys Gln Ile Arg Ser Ala Ala
2720 2725 2730
Lys Lys Asn Asn Leu Pro Phe Lys Leu Thr Cys Ala Thr Thr Arg
2735 2740 2745
Gln Val Val Asn Val Val Thr Thr Lys Ile Ala Leu Lys Gly Gly
2750 2755 2760
Lys Ile Val Asn Asn Trp Leu Lys Gln Leu Ile Lys Val Thr Leu
2765 2770 2775
Val Phe Leu Phe Val Ala Ala Ile Phe Tyr Leu Ile Thr Pro Val
2780 2785 2790
His Val Met Ser Lys His Thr Asp Phe Ser Ser Glu Ile Ile Gly
2795 2800 2805
Tyr Lys Ala Ile Asp Gly Gly Val Thr Arg Asp Ile Ala Ser Thr
2810 2815 2820
Asp Thr Cys Phe Ala Asn Lys His Ala Asp Phe Asp Thr Trp Phe
2825 2830 2835
Ser Gln Arg Gly Gly Ser Tyr Thr Asn Asp Lys Ala Cys Pro Leu
2840 2845 2850
Ile Ala Ala Val Ile Thr Arg Glu Val Gly Phe Val Val Pro Gly
2855 2860 2865
Leu Pro Gly Thr Ile Leu Arg Thr Thr Asn Gly Asp Phe Leu His
2870 2875 2880
Phe Leu Pro Arg Val Phe Ser Ala Val Gly Asn Ile Cys Tyr Thr
2885 2890 2895
Pro Ser Lys Leu Ile Glu Tyr Thr Asp Phe Ala Thr Ser Ala Cys
2900 2905 2910
Val Leu Ala Ala Glu Cys Thr Ile Phe Lys Asp Ala Ser Gly Lys
2915 2920 2925
Pro Val Pro Tyr Cys Tyr Asp Thr Asn Val Leu Glu Gly Ser Val
2930 2935 2940
Ala Tyr Glu Ser Leu Arg Pro Asp Thr Arg Tyr Val Leu Met Asp
2945 2950 2955
Gly Ser Ile Ile Gln Phe Pro Asn Thr Tyr Leu Glu Gly Ser Val
2960 2965 2970
Arg Val Val Thr Thr Phe Asp Ser Glu Tyr Cys Arg His Gly Thr
2975 2980 2985
Cys Glu Arg Ser Glu Ala Gly Val Cys Val Ser Thr Ser Gly Arg
2990 2995 3000
Trp Val Leu Asn Asn Asp Tyr Tyr Arg Ser Leu Pro Gly Val Phe
3005 3010 3015
Cys Gly Val Asp Ala Val Asn Leu Leu Thr Asn Met Phe Thr Pro
3020 3025 3030
Leu Ile Gln Pro Ile Gly Ala Leu Asp Ile Ser Ala Ser Ile Val
3035 3040 3045
Ala Gly Gly Ile Val Ala Ile Val Val Thr Cys Leu Ala Tyr Tyr
3050 3055 3060
Phe Met Arg Phe Arg Arg Ala Phe Gly Glu Tyr Ser His Val Val
3065 3070 3075
Ala Phe Asn Thr Leu Leu Phe Leu Met Ser Phe Thr Val Leu Cys
3080 3085 3090
Leu Thr Pro Val Tyr Ser Phe Leu Pro Gly Val Tyr Ser Val Ile
3095 3100 3105
Tyr Leu Tyr Leu Thr Phe Tyr Leu Thr Asn Asp Val Ser Phe Leu
3110 3115 3120
Ala His Ile Gln Trp Met Val Met Phe Thr Pro Leu Val Pro Phe
3125 3130 3135
Trp Ile Thr Ile Ala Tyr Ile Ile Cys Ile Ser Thr Lys His Phe
3140 3145 3150
Tyr Trp Phe Phe Ser Asn Tyr Leu Lys Arg Arg Val Val Phe Asn
3155 3160 3165
Gly Val Ser Phe Ser Thr Phe Glu Glu Ala Ala Leu Cys Thr Phe
3170 3175 3180
Leu Leu Asn Lys Glu Met Tyr Leu Lys Leu Arg Ser Asp Val Leu
3185 3190 3195
Leu Pro Leu Thr Gln Tyr Asn Arg Tyr Leu Ala Leu Tyr Asn Lys
3200 3205 3210
Tyr Lys Tyr Phe Ser Gly Ala Met Asp Thr Thr Ser Tyr Arg Glu
3215 3220 3225
Ala Ala Cys Cys His Leu Ala Lys Ala Leu Asn Asp Phe Ser Asn
3230 3235 3240
Ser Gly Ser Asp Val Leu Tyr Gln Pro Pro Gln Thr Ser Ile Thr
3245 3250 3255
Ser Ala Val Leu Gln Ser Gly Phe Arg Lys Met Ala Phe Pro Ser
3260 3265 3270
Gly Lys Val Glu Gly Cys Met Val Gln Val Thr Cys Gly Thr Thr
3275 3280 3285
Thr Leu Asn Gly Leu Trp Leu Asp Asp Val Val Tyr Cys Pro Arg
3290 3295 3300
His Val Ile Cys Thr Ser Glu Asp Met Leu Asn Pro Asn Tyr Glu
3305 3310 3315
Asp Leu Leu Ile Arg Lys Ser Asn His Asn Phe Leu Val Gln Ala
3320 3325 3330
Gly Asn Val Gln Leu Arg Val Ile Gly His Ser Met Gln Asn Cys
3335 3340 3345
Val Leu Lys Leu Lys Val Asp Thr Ala Asn Pro Lys Thr Pro Lys
3350 3355 3360
Tyr Lys Phe Val Arg Ile Gln Pro Gly Gln Thr Phe Ser Val Leu
3365 3370 3375
Ala Cys Tyr Asn Gly Ser Pro Ser Gly Val Tyr Gln Cys Ala Met
3380 3385 3390
Arg Pro Asn Phe Thr Ile Lys Gly Ser Phe Leu Asn Gly Ser Cys
3395 3400 3405
Gly Ser Val Gly Phe Asn Ile Asp Tyr Asp Cys Val Ser Phe Cys
3410 3415 3420
Tyr Met His His Met Glu Leu Pro Thr Gly Val His Ala Gly Thr
3425 3430 3435
Asp Leu Glu Gly Asn Phe Tyr Gly Pro Phe Val Asp Arg Gln Thr
3440 3445 3450
Ala Gln Ala Ala Gly Thr Asp Thr Thr Ile Thr Val Asn Val Leu
3455 3460 3465
Ala Trp Leu Tyr Ala Ala Val Ile Asn Gly Asp Arg Trp Phe Leu
3470 3475 3480
Asn Arg Phe Thr Thr Thr Leu Asn Asp Phe Asn Leu Val Ala Met
3485 3490 3495
Lys Tyr Asn Tyr Glu Pro Leu Thr Gln Asp His Val Asp Ile Leu
3500 3505 3510
Gly Pro Leu Ser Ala Gln Thr Gly Ile Ala Val Leu Asp Met Cys
3515 3520 3525
Ala Ser Leu Lys Glu Leu Leu Gln Asn Gly Met Asn Gly Arg Thr
3530 3535 3540
Ile Leu Gly Ser Ala Leu Leu Glu Asp Glu Phe Thr Pro Phe Asp
3545 3550 3555
Val Val Arg Gln Cys Ser Gly Val Thr Phe Gln Ser Ala Val Lys
3560 3565 3570
Arg Thr Ile Lys Gly Thr His His Trp Leu Leu Leu Thr Ile Leu
3575 3580 3585
Thr Ser Leu Leu Val Leu Val Gln Ser Thr Gln Trp Ser Leu Phe
3590 3595 3600
Phe Phe Leu Tyr Glu Asn Ala Phe Leu Pro Phe Ala Met Gly Ile
3605 3610 3615
Ile Ala Met Ser Ala Phe Ala Met Met Phe Val Lys His Lys His
3620 3625 3630
Ala Phe Leu Cys Leu Phe Leu Leu Pro Ser Leu Ala Thr Val Ala
3635 3640 3645
Tyr Phe Asn Met Val Tyr Met Pro Ala Ser Trp Val Met Arg Ile
3650 3655 3660
Met Thr Trp Leu Asp Met Val Asp Thr Ser Leu Ser Gly Phe Lys
3665 3670 3675
Leu Lys Asp Cys Val Met Tyr Ala Ser Ala Val Val Leu Leu Ile
3680 3685 3690
Leu Met Thr Ala Arg Thr Val Tyr Asp Asp Gly Ala Arg Arg Val
3695 3700 3705
Trp Thr Leu Met Asn Val Leu Thr Leu Val Tyr Lys Val Tyr Tyr
3710 3715 3720
Gly Asn Ala Leu Asp Gln Ala Ile Ser Met Trp Ala Leu Ile Ile
3725 3730 3735
Ser Val Thr Ser Asn Tyr Ser Gly Val Val Thr Thr Val Met Phe
3740 3745 3750
Leu Ala Arg Gly Ile Val Phe Met Cys Val Glu Tyr Cys Pro Ile
3755 3760 3765
Phe Phe Ile Thr Gly Asn Thr Leu Gln Cys Ile Met Leu Val Tyr
3770 3775 3780
Cys Phe Leu Gly Tyr Phe Cys Thr Cys Tyr Phe Gly Leu Phe Cys
3785 3790 3795
Leu Leu Asn Arg Tyr Phe Arg Leu Thr Leu Gly Val Tyr Asp Tyr
3800 3805 3810
Leu Val Ser Thr Gln Glu Phe Arg Tyr Met Asn Ser Gln Gly Leu
3815 3820 3825
Leu Pro Pro Lys Asn Ser Ile Asp Ala Phe Lys Leu Asn Ile Lys
3830 3835 3840
Leu Leu Gly Val Gly Gly Lys Pro Cys Ile Lys Val Ala Thr Val
3845 3850 3855
Gln Ser Lys Met Ser Asp Val Lys Cys Thr Ser Val Val Leu Leu
3860 3865 3870
Ser Val Leu Gln Gln Leu Arg Val Glu Ser Ser Ser Lys Leu Trp
3875 3880 3885
Ala Gln Cys Val Gln Leu His Asn Asp Ile Leu Leu Ala Lys Asp
3890 3895 3900
Thr Thr Glu Ala Phe Glu Lys Met Val Ser Leu Leu Ser Val Leu
3905 3910 3915
Leu Ser Met Gln Gly Ala Val Asp Ile Asn Lys Leu Cys Glu Glu
3920 3925 3930
Met Leu Asp Asn Arg Ala Thr Leu Gln Ala Ile Ala Ser Glu Phe
3935 3940 3945
Ser Ser Leu Pro Ser Tyr Ala Ala Phe Ala Thr Ala Gln Glu Ala
3950 3955 3960
Tyr Glu Gln Ala Val Ala Asn Gly Asp Ser Glu Val Val Leu Lys
3965 3970 3975
Lys Leu Lys Lys Ser Leu Asn Val Ala Lys Ser Glu Phe Asp Arg
3980 3985 3990
Asp Ala Ala Met Gln Arg Lys Leu Glu Lys Met Ala Asp Gln Ala
3995 4000 4005
Met Thr Gln Met Tyr Lys Gln Ala Arg Ser Glu Asp Lys Arg Ala
4010 4015 4020
Lys Val Thr Ser Ala Met Gln Thr Met Leu Phe Thr Met Leu Arg
4025 4030 4035
Lys Leu Asp Asn Asp Ala Leu Asn Asn Ile Ile Asn Asn Ala Arg
4040 4045 4050
Asp Gly Cys Val Pro Leu Asn Ile Ile Pro Leu Thr Thr Ala Ala
4055 4060 4065
Lys Leu Met Val Val Ile Pro Asp Tyr Asn Thr Tyr Lys Asn Thr
4070 4075 4080
Cys Asp Gly Thr Thr Phe Thr Tyr Ala Ser Ala Leu Trp Glu Ile
4085 4090 4095
Gln Gln Val Val Asp Ala Asp Ser Lys Ile Val Gln Leu Ser Glu
4100 4105 4110
Ile Ser Met Asp Asn Ser Pro Asn Leu Ala Trp Pro Leu Ile Val
4115 4120 4125
Thr Ala Leu Arg Ala Asn Ser Ala Val Lys Leu Gln Asn Asn Glu
4130 4135 4140
Leu Ser Pro Val Ala Leu Arg Gln Met Ser Cys Ala Ala Gly Thr
4145 4150 4155
Thr Gln Thr Ala Cys Thr Asp Asp Asn Ala Leu Ala Tyr Tyr Asn
4160 4165 4170
Thr Thr Lys Gly Gly Arg Phe Val Leu Ala Leu Leu Ser Asp Leu
4175 4180 4185
Gln Asp Leu Lys Trp Ala Arg Phe Pro Lys Ser Asp Gly Thr Gly
4190 4195 4200
Thr Ile Tyr Thr Glu Leu Glu Pro Pro Cys Arg Phe Val Thr Asp
4205 4210 4215
Thr Pro Lys Gly Pro Lys Val Lys Tyr Leu Tyr Phe Ile Lys Gly
4220 4225 4230
Leu Asn Asn Leu Asn Arg Gly Met Val Leu Gly Ser Leu Ala Ala
4235 4240 4245
Thr Val Arg Leu Gln Ala Gly Asn Ala Thr Glu Val Pro Ala Asn
4250 4255 4260
Ser Thr Val Leu Ser Phe Cys Ala Phe Ala Val Asp Ala Ala Lys
4265 4270 4275
Ala Tyr Lys Asp Tyr Leu Ala Ser Gly Gly Gln Pro Ile Thr Asn
4280 4285 4290
Cys Val Lys Met Leu Cys Thr His Thr Gly Thr Gly Gln Ala Ile
4295 4300 4305
Thr Val Thr Pro Glu Ala Asn Met Asp Gln Glu Ser Phe Gly Gly
4310 4315 4320
Ala Ser Cys Cys Leu Tyr Cys Arg Cys His Ile Asp His Pro Asn
4325 4330 4335
Pro Lys Gly Phe Cys Asp Leu Lys Gly Lys Tyr Val Gln Ile Pro
4340 4345 4350
Thr Thr Cys Val Asn Asp Pro Val Gly Phe Thr Leu Lys Asn Thr
4355 4360 4365
Val Cys Thr Val Cys Gly Met Trp Lys Gly Tyr Gly Cys Ser Cys
4370 4375 4380
Asp Gln Leu Arg Glu Pro Met Leu Gln Ser Ala Asp Ala Gln Ser
4385 4390 4395
Phe Leu Asn Arg Val Cys Gly Val Ser Ala Ala Arg Leu Thr Pro
4400 4405 4410
Cys Gly Thr Gly Thr Ser Thr Asp Val Val Tyr Arg Ala Phe Asp
4415 4420 4425
Ile Tyr Asn Asp Lys Val Ala Gly Phe Ala Lys Phe Leu Lys Thr
4430 4435 4440
Asn Cys Cys Arg Phe Gln Glu Lys Asp Glu Asp Asp Asn Leu Ile
4445 4450 4455
Asp Ser Tyr Phe Val Val Lys Arg His Thr Phe Ser Asn Tyr Gln
4460 4465 4470
His Glu Glu Thr Ile Tyr Asn Leu Leu Lys Asp Cys Pro Ala Val
4475 4480 4485
Ala Lys His Asp Phe Phe Lys Phe Arg Ile Asp Gly Asp Met Val
4490 4495 4500
Pro His Ile Ser Arg Gln Arg Leu Thr Lys Tyr Thr Met Ala Asp
4505 4510 4515
Leu Val Tyr Ala Leu Arg His Phe Asp Glu Gly Asn Cys Asp Thr
4520 4525 4530
Leu Lys Glu Ile Leu Val Thr Tyr Asn Cys Cys Asp Asp Asp Tyr
4535 4540 4545
Phe Asn Lys Lys Asp Trp Tyr Asp Phe Val Glu Asn Pro Asp Ile
4550 4555 4560
Leu Arg Val Tyr Ala Asn Leu Gly Glu Arg Val Arg Gln Ala Leu
4565 4570 4575
Leu Lys Thr Val Gln Phe Cys Asp Ala Met Arg Asn Ala Gly Ile
4580 4585 4590
Val Gly Val Leu Thr Leu Asp Asn Gln Asp Leu Asn Gly Asn Trp
4595 4600 4605
Tyr Asp Phe Gly Asp Phe Ile Gln Thr Thr Pro Gly Ser Gly Val
4610 4615 4620
Pro Val Val Asp Ser Tyr Tyr Ser Leu Leu Met Pro Ile Leu Thr
4625 4630 4635
Leu Thr Arg Ala Leu Thr Ala Glu Ser His Val Asp Thr Asp Leu
4640 4645 4650
Thr Lys Pro Tyr Ile Lys Trp Asp Leu Leu Lys Tyr Asp Phe Thr
4655 4660 4665
Glu Glu Arg Leu Lys Leu Phe Asp Arg Tyr Phe Lys Tyr Trp Asp
4670 4675 4680
Gln Thr Tyr His Pro Asn Cys Val Asn Cys Leu Asp Asp Arg Cys
4685 4690 4695
Ile Leu His Cys Ala Asn Phe Asn Val Leu Phe Ser Thr Val Phe
4700 4705 4710
Pro Leu Thr Ser Phe Gly Pro Leu Val Arg Lys Ile Phe Val Asp
4715 4720 4725
Gly Val Pro Phe Val Val Ser Thr Gly Tyr His Phe Arg Glu Leu
4730 4735 4740
Gly Val Val His Asn Gln Asp Val Asn Leu His Ser Ser Arg Leu
4745 4750 4755
Ser Phe Lys Glu Leu Leu Val Tyr Ala Ala Asp Pro Ala Met His
4760 4765 4770
Ala Ala Ser Gly Asn Leu Leu Leu Asp Lys Arg Thr Thr Cys Phe
4775 4780 4785
Ser Val Ala Ala Leu Thr Asn Asn Val Ala Phe Gln Thr Val Lys
4790 4795 4800
Pro Gly Asn Phe Asn Lys Asp Phe Tyr Asp Phe Ala Val Ser Lys
4805 4810 4815
Gly Phe Phe Lys Glu Gly Ser Ser Val Glu Leu Lys His Phe Phe
4820 4825 4830
Phe Ala Gln Asp Gly Asn Ala Ala Ile Ser Asp Tyr Asp Tyr Tyr
4835 4840 4845
Arg Tyr Asn Leu Pro Thr Met Cys Asp Ile Arg Gln Leu Leu Phe
4850 4855 4860
Val Val Glu Val Val Asp Lys Tyr Phe Asp Cys Tyr Asp Gly Gly
4865 4870 4875
Cys Ile Asn Ala Asn Gln Val Ile Val Asn Asn Leu Asp Lys Ser
4880 4885 4890
Ala Gly Phe Pro Phe Asn Lys Trp Gly Lys Ala Arg Leu Tyr Tyr
4895 4900 4905
Asp Ser Met Ser Tyr Glu Asp Gln Asp Ala Leu Phe Ala Tyr Thr
4910 4915 4920
Lys Arg Asn Val Ile Pro Thr Ile Thr Gln Met Asn Leu Lys Tyr
4925 4930 4935
Ala Ile Ser Ala Lys Asn Arg Ala Arg Thr Val Ala Gly Val Ser
4940 4945 4950
Ile Cys Ser Thr Met Thr Asn Arg Gln Phe His Gln Lys Leu Leu
4955 4960 4965
Lys Ser Ile Ala Ala Thr Arg Gly Ala Thr Val Val Ile Gly Thr
4970 4975 4980
Ser Lys Phe Tyr Gly Gly Trp His Asn Met Leu Lys Thr Val Tyr
4985 4990 4995
Ser Asp Val Glu Asn Pro His Leu Met Gly Trp Asp Tyr Pro Lys
5000 5005 5010
Cys Asp Arg Ala Met Pro Asn Met Leu Arg Ile Met Ala Ser Leu
5015 5020 5025
Val Leu Ala Arg Lys His Thr Thr Cys Cys Ser Leu Ser His Arg
5030 5035 5040
Phe Tyr Arg Leu Ala Asn Glu Cys Ala Gln Val Leu Ser Glu Met
5045 5050 5055
Val Met Cys Gly Gly Ser Leu Tyr Val Lys Pro Gly Gly Thr Ser
5060 5065 5070
Ser Gly Asp Ala Thr Thr Ala Tyr Ala Asn Ser Val Phe Asn Ile
5075 5080 5085
Cys Gln Ala Val Thr Ala Asn Val Asn Ala Leu Leu Ser Thr Asp
5090 5095 5100
Gly Asn Lys Ile Ala Asp Lys Tyr Val Arg Asn Leu Gln His Arg
5105 5110 5115
Leu Tyr Glu Cys Leu Tyr Arg Asn Arg Asp Val Asp Thr Asp Phe
5120 5125 5130
Val Asn Glu Phe Tyr Ala Tyr Leu Arg Lys His Phe Ser Met Met
5135 5140 5145
Ile Leu Ser Asp Asp Ala Val Val Cys Phe Asn Ser Thr Tyr Ala
5150 5155 5160
Ser Gln Gly Leu Val Ala Ser Ile Lys Asn Phe Lys Ser Val Leu
5165 5170 5175
Tyr Tyr Gln Asn Asn Val Phe Met Ser Glu Ala Lys Cys Trp Thr
5180 5185 5190
Glu Thr Asp Leu Thr Lys Gly Pro His Glu Phe Cys Ser Gln His
5195 5200 5205
Thr Met Leu Val Lys Gln Gly Asp Asp Tyr Val Tyr Leu Pro Tyr
5210 5215 5220
Pro Asp Pro Ser Arg Ile Leu Gly Ala Gly Cys Phe Val Asp Asp
5225 5230 5235
Ile Val Lys Thr Asp Gly Thr Leu Met Ile Glu Arg Phe Val Ser
5240 5245 5250
Leu Ala Ile Asp Ala Tyr Pro Leu Thr Lys His Pro Asn Gln Glu
5255 5260 5265
Tyr Ala Asp Val Phe His Leu Tyr Leu Gln Tyr Ile Arg Lys Leu
5270 5275 5280
His Asp Glu Leu Thr Gly His Met Leu Asp Met Tyr Ser Val Met
5285 5290 5295
Leu Thr Asn Asp Asn Thr Ser Arg Tyr Trp Glu Pro Glu Phe Tyr
5300 5305 5310
Glu Ala Met Tyr Thr Pro His Thr Val Leu Gln Ala Val Gly Ala
5315 5320 5325
Cys Val Leu Cys Asn Ser Gln Thr Ser Leu Arg Cys Gly Ala Cys
5330 5335 5340
Ile Arg Arg Pro Phe Leu Cys Cys Lys Cys Cys Tyr Asp His Val
5345 5350 5355
Ile Ser Thr Ser His Lys Leu Val Leu Ser Val Asn Pro Tyr Val
5360 5365 5370
Cys Asn Ala Pro Gly Cys Asp Val Thr Asp Val Thr Gln Leu Tyr
5375 5380 5385
Leu Gly Gly Met Ser Tyr Tyr Cys Lys Ser His Lys Pro Pro Ile
5390 5395 5400
Ser Phe Pro Leu Cys Ala Asn Gly Gln Val Phe Gly Leu Tyr Lys
5405 5410 5415
Asn Thr Cys Val Gly Ser Asp Asn Val Thr Asp Phe Asn Ala Ile
5420 5425 5430
Ala Thr Cys Asp Trp Thr Asn Ala Gly Asp Tyr Ile Leu Ala Asn
5435 5440 5445
Thr Cys Thr Glu Arg Leu Lys Leu Phe Ala Ala Glu Thr Leu Lys
5450 5455 5460
Ala Thr Glu Glu Thr Phe Lys Leu Ser Tyr Gly Ile Ala Thr Val
5465 5470 5475
Arg Glu Val Leu Ser Asp Arg Glu Leu His Leu Ser Trp Glu Val
5480 5485 5490
Gly Lys Pro Arg Pro Pro Leu Asn Arg Asn Tyr Val Phe Thr Gly
5495 5500 5505
Tyr Arg Val Thr Lys Asn Ser Lys Val Gln Ile Gly Glu Tyr Thr
5510 5515 5520
Phe Glu Lys Gly Asp Tyr Gly Asp Ala Val Val Tyr Arg Gly Thr
5525 5530 5535
Thr Thr Tyr Lys Leu Asn Val Gly Asp Tyr Phe Val Leu Thr Ser
5540 5545 5550
His Thr Val Met Pro Leu Ser Ala Pro Thr Leu Val Pro Gln Glu
5555 5560 5565
His Tyr Val Arg Ile Thr Gly Leu Tyr Pro Thr Leu Asn Ile Ser
5570 5575 5580
Asp Glu Phe Ser Ser Asn Val Ala Asn Tyr Gln Lys Val Gly Met
5585 5590 5595
Gln Lys Tyr Ser Thr Leu Gln Gly Pro Pro Gly Thr Gly Lys Ser
5600 5605 5610
His Phe Ala Ile Gly Leu Ala Leu Tyr Tyr Pro Ser Ala Arg Ile
5615 5620 5625
Val Tyr Thr Ala Cys Ser His Ala Ala Val Asp Ala Leu Cys Glu
5630 5635 5640
Lys Ala Leu Lys Tyr Leu Pro Ile Asp Lys Cys Ser Arg Ile Ile
5645 5650 5655
Pro Ala Arg Ala Arg Val Asp Cys Phe Asp Lys Phe Lys Val Asn
5660 5665 5670
Ser Thr Leu Glu Gln Tyr Val Phe Cys Thr Val Asn Ala Leu Pro
5675 5680 5685
Glu Thr Thr Ala Asp Ile Val Val Phe Asp Glu Ile Ser Met Ala
5690 5695 5700
Thr Asn Tyr Asp Leu Ser Val Val Asn Ala Arg Leu Arg Ala Lys
5705 5710 5715
His Tyr Val Tyr Ile Gly Asp Pro Ala Gln Leu Pro Ala Pro Arg
5720 5725 5730
Thr Leu Leu Thr Lys Gly Thr Leu Glu Pro Glu Tyr Phe Asn Ser
5735 5740 5745
Val Cys Arg Leu Met Lys Thr Ile Gly Pro Asp Met Phe Leu Gly
5750 5755 5760
Thr Cys Arg Arg Cys Pro Ala Glu Ile Val Asp Thr Val Ser Ala
5765 5770 5775
Leu Val Tyr Asp Asn Lys Leu Lys Ala His Lys Asp Lys Ser Ala
5780 5785 5790
Gln Cys Phe Lys Met Phe Tyr Lys Gly Val Ile Thr His Asp Val
5795 5800 5805
Ser Ser Ala Ile Asn Arg Pro Gln Ile Gly Val Val Arg Glu Phe
5810 5815 5820
Leu Thr Arg Asn Pro Ala Trp Arg Lys Ala Val Phe Ile Ser Pro
5825 5830 5835
Tyr Asn Ser Gln Asn Ala Val Ala Ser Lys Ile Leu Gly Leu Pro
5840 5845 5850
Thr Gln Thr Val Asp Ser Ser Gln Gly Ser Glu Tyr Asp Tyr Val
5855 5860 5865
Ile Phe Thr Gln Thr Thr Glu Thr Ala His Ser Cys Asn Val Asn
5870 5875 5880
Arg Phe Asn Val Ala Ile Thr Arg Ala Lys Val Gly Ile Leu Cys
5885 5890 5895
Ile Met Ser Asp Arg Asp Leu Tyr Asp Lys Leu Gln Phe Thr Ser
5900 5905 5910
Leu Glu Ile Pro Arg Arg Asn Val Ala Thr Leu Gln Ala Glu Asn
5915 5920 5925
Val Thr Gly Leu Phe Lys Asp Cys Ser Lys Val Ile Thr Gly Leu
5930 5935 5940
His Pro Thr Gln Ala Pro Thr His Leu Ser Val Asp Thr Lys Phe
5945 5950 5955
Lys Thr Glu Gly Leu Cys Val Asp Ile Pro Gly Ile Pro Lys Asp
5960 5965 5970
Met Thr Tyr Arg Arg Leu Ile Ser Met Met Gly Phe Lys Met Asn
5975 5980 5985
Tyr Gln Val Asn Gly Tyr Pro Asn Met Phe Ile Thr Arg Glu Glu
5990 5995 6000
Ala Ile Arg His Val Arg Ala Trp Ile Gly Phe Asp Val Glu Gly
6005 6010 6015
Cys His Ala Thr Arg Glu Ala Val Gly Thr Asn Leu Pro Leu Gln
6020 6025 6030
Leu Gly Phe Ser Thr Gly Val Asn Leu Val Ala Val Pro Thr Gly
6035 6040 6045
Tyr Val Asp Thr Pro Asn Asn Thr Asp Phe Ser Arg Val Ser Ala
6050 6055 6060
Lys Pro Pro Pro Gly Asp Gln Phe Lys His Leu Ile Pro Leu Met
6065 6070 6075
Tyr Lys Gly Leu Pro Trp Asn Val Val Arg Ile Lys Ile Val Gln
6080 6085 6090
Met Leu Ser Asp Thr Leu Arg Asn Leu Ser Asp Arg Val Val Phe
6095 6100 6105
Val Leu Trp Ala His Gly Phe Glu Leu Thr Ser Met Lys Tyr Phe
6110 6115 6120
Val Lys Ile Gly Pro Glu Arg Thr Cys Cys Leu Cys Asp Arg Arg
6125 6130 6135
Ala Thr Cys Phe Ser Thr Ala Ser Asp Thr Tyr Ala Cys Trp His
6140 6145 6150
His Ser Ile Gly Phe Asp Tyr Val Tyr Asn Pro Phe Met Ile Asp
6155 6160 6165
Val Gln Gln Trp Gly Phe Thr Gly Asn Leu Gln Ser Asn His Asp
6170 6175 6180
Leu Tyr Cys Gln Val His Gly Asn Ala His Val Ala Ser Cys Asp
6185 6190 6195
Ala Ile Met Thr Arg Cys Leu Ala Val His Glu Cys Phe Val Lys
6200 6205 6210
Arg Val Asp Trp Thr Ile Glu Tyr Pro Ile Ile Gly Asp Glu Leu
6215 6220 6225
Lys Ile Asn Ala Ala Cys Arg Lys Val Gln His Met Val Val Lys
6230 6235 6240
Ala Ala Leu Leu Ala Asp Lys Phe Pro Val Leu His Asp Ile Gly
6245 6250 6255
Asn Pro Lys Ala Ile Lys Cys Val Pro Gln Ala Asp Val Glu Trp
6260 6265 6270
Lys Phe Tyr Asp Ala Gln Pro Cys Ser Asp Lys Ala Tyr Lys Ile
6275 6280 6285
Glu Glu Leu Phe Tyr Ser Tyr Ala Thr His Ser Asp Lys Phe Thr
6290 6295 6300
Asp Gly Val Cys Leu Phe Trp Asn Cys Asn Val Asp Arg Tyr Pro
6305 6310 6315
Ala Asn Ser Ile Val Cys Arg Phe Asp Thr Arg Val Leu Ser Asn
6320 6325 6330
Leu Asn Leu Pro Gly Cys Asp Gly Gly Ser Leu Tyr Val Asn Lys
6335 6340 6345
His Ala Phe His Thr Pro Ala Phe Asp Lys Ser Ala Phe Val Asn
6350 6355 6360
Leu Lys Gln Leu Pro Phe Phe Tyr Tyr Ser Asp Ser Pro Cys Glu
6365 6370 6375
Ser His Gly Lys Gln Val Val Ser Asp Ile Asp Tyr Val Pro Leu
6380 6385 6390
Lys Ser Ala Thr Cys Ile Thr Arg Cys Asn Leu Gly Gly Ala Val
6395 6400 6405
Cys Arg His His Ala Asn Glu Tyr Arg Leu Tyr Leu Asp Ala Tyr
6410 6415 6420
Asn Met Met Ile Ser Ala Gly Phe Ser Leu Trp Val Tyr Lys Gln
6425 6430 6435
Phe Asp Thr Tyr Asn Leu Trp Asn Thr Phe Thr Arg Leu Gln Ser
6440 6445 6450
Leu Glu Asn Val Ala Phe Asn Val Val Asn Lys Gly His Phe Asp
6455 6460 6465
Gly Gln Gln Gly Glu Val Pro Val Ser Ile Ile Asn Asn Thr Val
6470 6475 6480
Tyr Thr Lys Val Asp Gly Val Asp Val Glu Leu Phe Glu Asn Lys
6485 6490 6495
Thr Thr Leu Pro Val Asn Val Ala Phe Glu Leu Trp Ala Lys Arg
6500 6505 6510
Asn Ile Lys Pro Val Pro Glu Val Lys Ile Leu Asn Asn Leu Gly
6515 6520 6525
Val Asp Ile Ala Ala Asn Thr Val Ile Trp Asp Tyr Lys Arg Asp
6530 6535 6540
Ala Pro Ala His Ile Ser Thr Ile Gly Val Cys Ser Met Thr Asp
6545 6550 6555
Ile Ala Lys Lys Pro Thr Glu Thr Ile Cys Ala Pro Leu Thr Val
6560 6565 6570
Phe Phe Asp Gly Arg Val Asp Gly Gln Val Asp Leu Phe Arg Asn
6575 6580 6585
Ala Arg Asn Gly Val Leu Ile Thr Glu Gly Ser Val Lys Gly Leu
6590 6595 6600
Gln Pro Ser Val Gly Pro Lys Gln Ala Ser Leu Asn Gly Val Thr
6605 6610 6615
Leu Ile Gly Glu Ala Val Lys Thr Gln Phe Asn Tyr Tyr Lys Lys
6620 6625 6630
Val Asp Gly Val Val Gln Gln Leu Pro Glu Thr Tyr Phe Thr Gln
6635 6640 6645
Ser Arg Asn Leu Gln Glu Phe Lys Pro Arg Ser Gln Met Glu Ile
6650 6655 6660
Asp Phe Leu Glu Leu Ala Met Asp Glu Phe Ile Glu Arg Tyr Lys
6665 6670 6675
Leu Glu Gly Tyr Ala Phe Glu His Ile Val Tyr Gly Asp Phe Ser
6680 6685 6690
His Ser Gln Leu Gly Gly Leu His Leu Leu Ile Gly Leu Ala Lys
6695 6700 6705
Arg Phe Lys Glu Ser Pro Phe Glu Leu Glu Asp Phe Ile Pro Met
6710 6715 6720
Asp Ser Thr Val Lys Asn Tyr Phe Ile Thr Asp Ala Gln Thr Gly
6725 6730 6735
Ser Ser Lys Cys Val Cys Ser Val Ile Asp Leu Leu Leu Asp Asp
6740 6745 6750
Phe Val Glu Ile Ile Lys Ser Gln Asp Leu Ser Val Val Ser Lys
6755 6760 6765
Val Val Lys Val Thr Ile Asp Tyr Thr Glu Ile Ser Phe Met Leu
6770 6775 6780
Trp Cys Lys Asp Gly His Val Glu Thr Phe Tyr Pro Lys Leu Gln
6785 6790 6795
Ser Ser Gln Ala Trp Gln Pro Gly Val Ala Met Pro Asn Leu Tyr
6800 6805 6810
Lys Met Gln Arg Met Leu Leu Glu Lys Cys Asp Leu Gln Asn Tyr
6815 6820 6825
Gly Asp Ser Ala Thr Leu Pro Lys Gly Ile Met Met Asn Val Ala
6830 6835 6840
Lys Tyr Thr Gln Leu Cys Gln Tyr Leu Asn Thr Leu Thr Leu Ala
6845 6850 6855
Val Pro Tyr Asn Met Arg Val Ile His Phe Gly Ala Gly Ser Asp
6860 6865 6870
Lys Gly Val Ala Pro Gly Thr Ala Val Leu Arg Gln Trp Leu Pro
6875 6880 6885
Thr Gly Thr Leu Leu Val Asp Ser Asp Leu Asn Asp Phe Val Ser
6890 6895 6900
Asp Ala Asp Ser Thr Leu Ile Gly Asp Cys Ala Thr Val His Thr
6905 6910 6915
Ala Asn Lys Trp Asp Leu Ile Ile Ser Asp Met Tyr Asp Pro Lys
6920 6925 6930
Thr Lys Asn Val Thr Lys Glu Asn Asp Ser Lys Glu Gly Phe Phe
6935 6940 6945
Thr Tyr Ile Cys Gly Phe Ile Gln Gln Lys Leu Ala Leu Gly Gly
6950 6955 6960
Ser Val Ala Ile Lys Xaa Xaa Xaa Xaa Ser Trp Asn Ala Asp Leu
6965 6970 6975
Tyr Xaa Leu Met Gly Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
6980 6985 6990
Xaa Xaa Asn Ala Ser Ser Ser Glu Xaa Xaa Xaa Xaa Xaa Cys Xaa
6995 7000 7005
Xaa Xaa Gly Lys Pro Arg Glu Gln Ile Xaa Xaa Xaa Xaa Xaa Xaa
7010 7015 7020
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Thr Asn Pro Ile Gln Leu Ser
7025 7030 7035
Ser Tyr Ser Leu Phe Asp Met Ser Lys Phe Pro Leu Lys Leu Arg
7040 7045 7050
Gly Thr Val Val Met Ser Leu Lys Glu Gly Gln Ile Asn Asp Met
7055 7060 7065
Ile Leu Ser Leu Leu Ser Lys Gly Arg Leu Ile Ile Arg Glu Asn
7070 7075 7080
Asn Arg Val Val Ile Ser Ser Asp Val Leu Val Asn Asn
7085 7090 7095
<210> 261
<400> 261
000
<210> 262
<400> 262
000
<210> 263
<400> 263
000
<210> 264
<400> 264
000
<210> 265
<400> 265
000
<210> 266
<400> 266
000
<210> 267
<400> 267
000
<210> 268
<400> 268
000
<210> 269
<400> 269
000
<210> 270
<400> 270
000
<210> 271
<400> 271
000
<210> 272
<400> 272
000
<210> 273
<400> 273
000
<210> 274
<400> 274
000
<210> 275
<400> 275
000
<210> 276
<400> 276
000
<210> 277
<400> 277
000
<210> 278
<400> 278
000
<210> 279
<400> 279
000
<210> 280
<400> 280
000
<210> 281
<400> 281
000
<210> 282
<400> 282
000
<210> 283
<400> 283
000
<210> 284
<400> 284
000
<210> 285
<400> 285
000
<210> 286
<400> 286
000
<210> 287
<400> 287
000
<210> 288
<400> 288
000
<210> 289
<400> 289
000
<210> 290
<400> 290
000
<210> 291
<400> 291
000
<210> 292
<400> 292
000
<210> 293
<400> 293
000
<210> 294
<400> 294
000
<210> 295
<400> 295
000
<210> 296
<400> 296
000
<210> 297
<400> 297
000
<210> 298
<400> 298
000
<210> 299
<400> 299
000
<210> 300
<400> 300
000
<210> 301
<211> 21282
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 301
atggagagcc ttgtccctgg tttcaacgag aaaacacacg tccaactcag tttgcctgtt 60
ttacaggttc gcgacgtgct cgtacgtggc tttggagact ccgtggagga ggtcttatca 120
gaggcacgtc aacatcttaa agatggcact tgtggcttag tagaagttga aaaaggcgtt 180
ttgcctcaac ttgaacagcc ctatgtgttc atcaaacgtt cggatgctcg aactgcacct 240
catggtcatg ttatggttga gctggtagca gaactcgaag gcattcagta cggtcgtagt 300
ggtgagacac ttggtgtcct tgtccctcat gtgggcgaaa taccagtggc ttaccgcaag 360
gttcttcttc gtaagaacgg taataaagga gctggtggcc atagttacgg cgccgatcta 420
aagtcatttg acttaggcga cgagcttggc actgatcctt atgaagattt tcaagaaaac 480
tggaacacta aacatagcag tggtgttacc cgtgaactca tgcgtgagct taacggaggg 540
gcatacactc gctatgtcga taacaacttc tgtggccctg atggctaccc tcttgagtgc 600
attaaagacc ttctagcacg tgctggtaaa gcttcatgca ctttgtctga acaactggac 660
tttattgaca ctaagagggg tgtatactgc tgccgtgaac atgagcatga aattgcttgg 720
tacacggaac gttctgaaaa gagctatgaa ttgcagacac cttttgaaat taaattggca 780
aagaaatttg acaccttcaa tggggaatgt ccaaattttg tatttccctt aaattccata 840
atcaagacta ttcaaccaag ggttgaaaag aaaaagcttg atggctttat gggtagaatt 900
cgatctgtct atccagttgc gtcaccaaat gaatgcaacc aaatgtgcct ttcaactctc 960
atgaagtgtg atcattgtgg tgaaacttca tggcagacgg gcgattttgt taaagccact 1020
tgcgaatttt gtggcactga gaatttgact aaagaaggtg ccactacttg tggttactta 1080
ccccaaaatg ctgttgttaa aatttattgt ccagcatgtc acaattcaga agtaggacct 1140
gagcatagtc ttgccgaata ccataatgaa tctggcttga aaaccattct tcgtaagggt 1200
ggtcgcacta ttgcctttgg aggctgtgtg ttctcttatg ttggttgcca taacaagtgt 1260
gcctattggg ttccacgtgc tagcgctaac ataggttgta accatacagg tgttgttgga 1320
gaaggttccg aaggtcttaa tgacaacctt cttgaaatac tccaaaaaga gaaagtcaac 1380
atcaatattg ttggtgactt taaacttaat gaagagatcg ccattatttt ggcatctttt 1440
tctgcttcca caagtgcttt tgtggaaact gtgaaaggtt tggattataa agcattcaaa 1500
caaattgttg aatcctgtgg taattttaaa gttacaaaag gaaaagctaa aaaaggtgcc 1560
tggaatattg gtgaacagaa atcaatactg agtcctcttt atgcatttgc atcagaggct 1620
gctcgtgttg tacgatcaat tttctcccgc actcttgaaa ctgctcaaaa ttctgtgcgt 1680
gttttacaga aggccgctat aacaatacta gatggaattt cacagtattc actgagactc 1740
attgatgcta tgatgttcac atctgatttg gctactaaca atctagttgt aatggcctac 1800
attacaggtg gtgttgttca gttgacttcg cagtggctaa ctaacatctt tggcactgtt 1860
tatgaaaaac tcaaacccgt ccttgattgg cttgaagaga agtttaagga aggtgtagag 1920
tttcttagag acggttggga aattgttaaa tttatctcaa cctgtgcttg tgaaattgtc 1980
ggtggacaaa ttgtcacctg tgcaaaggaa attaaggaga gtgttcagac attctttaag 2040
cttgtaaata aatttttggc tttgtgtgct gactctatca ttattggtgg agctaaactt 2100
aaagccttga atttaggtga aacatttgtc acgcactcaa agggattgta cagaaagtgt 2160
gttaaatcca gagaagaaac tggcctactc atgcctctaa aagccccaaa agaaattatc 2220
ttcttagagg gagaaacact tcccacagaa gtgttaacag aggaagttgt cttgaaaact 2280
ggtgatttac aaccattaga acaacctact agtgaagctg ttgaagctcc attggttggt 2340
acaccagttt gtattaacgg gcttatgttg ctcgaaatca aagacacaga aaagtactgt 2400
gcccttgcac ctaatatgat ggtaacaaac aataccttca cactcaaagg cggtgcacca 2460
acaaaggtta cttttggtga tgacactgtg atagaagtgc aaggttacaa gagtgtgaat 2520
atcacttttg aacttgatga aaggattgat aaagtactta atgagaagtg ctctgcctat 2580
acagttgaac tcggtacaga agtaaatgag ttcgcctgtg ttgtggcaga tgctgtcata 2640
aaaactttgc aaccagtatc tgaattactt acaccactgg gcattgattt agatgagtgg 2700
agtatggcta catactactt atttgatgag tctggtgagt ttaaattggc ttcacatatg 2760
tattgttctt tttaccctcc agatgaggat gaagaagaag gtgattgtga agaagaagag 2820
tttgagccat caactcaata tgagtatggt actgaagatg attaccaagg taaacctttg 2880
gaatttggtg ccacttctgc tgctcttcaa cctgaagaag agcaagaaga agattggtta 2940
gatgatgata gtcaacaaac tgttggtcaa caagacggca gtgaggacaa tcagacaact 3000
attattcaaa caattgttga ggttcaacct caattagaga tggaacttac accagttgtt 3060
cagactattg aagtgaatag ttttagtggt tatttaaaac ttactgacaa tgtatacatt 3120
aaaaatgcag acattgtgga agaagctaaa aaggtaaaac caacagtggt tgttaatgca 3180
gccaatgttt accttaaaca tggaggaggt gttgcaggag ccttaaataa ggctactaac 3240
aatgccatgc aagttgaatc tgatgattac atagctacta atggaccact taaagtgggt 3300
ggtagttgtg ttttaagcgg acacaatctt gctaaacact gtcttcatgt tgtcggccca 3360
aatgttaaca aaggtgaaga cattcaactt cttaagagtg cttatgaaaa ttttaatcag 3420
cacgaagttc tacttgcacc attattatca gctggtattt ttggtgctga ccctatacat 3480
tctttaagag tttgtgtaga tactgttcgc acaaatgtct acttagctgt ctttgataaa 3540
aatctctatg acaaacttgt ttcaagcttt ttggaaatga agagtgaaaa gcaagttgaa 3600
caaaagatcg ctgagattcc taaagaggaa gttaagccat ttataactga aagtaaacct 3660
tcagttgaac agagaaaaca agatgataag aaaatcaaag cttgtgttga agaagttaca 3720
acaactctgg aagaaactaa gttcctcaca gaaaacttgt tactttatat tgacattaat 3780
ggcaatcttc atccagattc tgccactctt gttagtgaca ttgacatcac tttcttaaag 3840
aaagatgctc catatatagt gggtgatgtt gttcaagagg gtgttttaac tgctgtggtt 3900
atacctacta aaaaggctgg tggcactact gaaatgctag cgaaagcttt gagaaaagtg 3960
ccaacagaca attatataac cacttacccg ggtcagggtt taaatggtta cactgtagag 4020
gaggcaaaga cagtgcttaa aaagtgtaaa agtgcctttt acattctacc atctattatc 4080
tctaatgaga agcaagaaat tcttggaact gtttcttgga atttgcgaga aatgcttgca 4140
catgcagaag aaacacgcaa attaatgcct gtctgtgtgg aaactaaagc catagtttca 4200
actatacagc gtaaatataa gggtattaaa atacaagagg gtgtggttga ttatggtgct 4260
agattttact tttacaccag taaaacaact gtagcgtcac ttatcaacac acttaacgat 4320
ctaaatgaaa ctcttgttac aatgccactt ggctatgtaa cacatggctt aaatttggaa 4380
gaagctgctc ggtatatgag atctctcaaa gtgccagcta cagtttctgt ttcttcacct 4440
gatgctgtta cagcgtataa tggttatctt acttcttctt ctaaaacacc tgaagaacat 4500
tttattgaaa ccatctcact tgctggttcc tataaagatt ggtcctattc tggacaatct 4560
acacaactag gtatagaatt tcttaagaga ggtgataaaa gtgtatatta cactagtaat 4620
cctaccacat tccacctaga tggtgaagtt atcacctttg acaatcttaa gacacttctt 4680
tctttgagag aagtgaggac tattaaggtg tttacaacag tagacaacat taacctccac 4740
acgcaagttg tggacatgtc aatgacatat ggacaacagt ttggtccaac ttatttggat 4800
ggagctgatg ttactaaaat aaaacctcat aattcacatg aaggtaaaac attttatgtt 4860
ttacctaatg atgacactct acgtgttgag gcttttgagt actaccacac aactgatcct 4920
agttttctgg gtaggtacat gtcagcatta aatcacacta aaaagtggaa atacccacaa 4980
gttaatggtt taacttctat aaaatgggca gataacaact gttatcttgc cactgcattg 5040
ttaacactcc aacaaataga gttgaagttt aatccacctg ctctacaaga tgcttattac 5100
agagcaaggg ctggtgaagc tgataacttt tgtgcactta tcttagccta ctgtaataag 5160
acagtaggtg agttaggtga tgttagagaa acaatgagtt acttgtttca acatgccaat 5220
ttagattctt gcaaaagagt cttgaacgtg gtgtgtaaaa cttgtggaca acagcagaca 5280
acccttaagg gtgtagaagc tgttatgtac atgggcacac tttcttatga acaatttaag 5340
aaaggtgttc agataccttg tacgtgtggt aaacaagcta caaaatatct agtacaacag 5400
gagtcacctt ttgttatgat gtcagcacca cctgctcagt atgaacttaa gcatggtaca 5460
tttacttgtg ctagtgagta cactggtaat taccagtgtg gtcactataa acatataact 5520
tctaaagaaa ctttgtattg catagacggt gctttactta caaagtcctc agaatacaaa 5580
ggtcctatta cggatgtttt ctacaaagaa aacagttaca caacaaccat aaaaccagtt 5640
acttataaat tggatggtgt tgtttgtaca gaaattgacc ctaagttgga caattattat 5700
aagaaagaca attcttattt tacagagcaa ccaattgatc ttgtaccaaa ccaaccatat 5760
ccaaacgcaa gcttcgataa ttttaagttt gtatgtgata atatcaaatt tgctgatgat 5820
ttaaaccagt taactggtta taagaaacct gcttcaagag agcttaaagt tacatttttc 5880
cctgacttaa atggtgatgt ggtggctatt gattataaac actacacacc ctcttttaag 5940
aaaggagcta aattgttaca taaacctatt gtttggcatg ttaacaatgc aactaataaa 6000
gccacgtata aaccaaatac ctggtgtata cgttgtcttt ggagcacaaa accagttgaa 6060
acatcaaatt cgtttgatgt actgaagtca gaggacgcgc agggaatgga taatcttgcc 6120
tgcgaagatc taaaaccagt ctctgaagaa gtagtggaaa atcctaccat acagaaagac 6180
gttcttgagt gtaatgtgaa aactaccgaa gttgtaggag acattatact taaaccagca 6240
aataatagtt taaaaattac agaagaggtt ggccacacag atctaatggc tgcttatgta 6300
gacaattcta gtcttactat taagaaacct aatgaattat ctagagtatt aggtttgaaa 6360
acccttgcta ctcatggttt agctgctgtt aatagtgtcc cttgggatac tatagctaat 6420
tatgctaagc cttttcttaa caaagttgtt agtacaacta ctaacatagt tacacggtgt 6480
ttaaaccgtg tttgtactaa ttatatgcct tatttcttta ctttattgct acaattgtgt 6540
acttttacta gaagtacaaa ttctagaatt aaagcatcta tgccgactac tatagcaaag 6600
aatactgtta agagtgtcgg taaattttgt ctagaggctt catttaatta tttgaagtca 6660
cctaattttt ctaaactgat aaatattaca atttggtttt tactattaag tgtttgccta 6720
ggttctttaa tctactcaac cgctgcttta ggtgttttaa tgtctaattt aggcatgcct 6780
tcttactgta ctggttacag agaaggctat ttgaactcta ctaatgtcac tattgcaacc 6840
tactgtactg gttctatacc ttgtagtgtt tgtcttagtg gtttagattc tttagacacc 6900
tatccttctt tagaaactat acaaattacc atttcatctt ttaaatggga tttaactgct 6960
tttggcttag ttgcagagtg gtttttggca tatattcttt tcactaggtt tttctatgta 7020
cttggattgg ctgcaatcat gcaattgttt ttcagctatt ttgcagtaca ttttattagt 7080
aattcttggc ttatgtggtt aataattaat cttgtacaaa tggccccgat ttcagctatg 7140
gttagaatgt acatcttctt tgcatcattt tattatgtat ggaaaagtta tgtgcatgtt 7200
gtagacggtt gtaattcatc aacttgtatg atgtgttaca aacgtaatag agcaacaaga 7260
gtcgaatgta caactattgt taatggtgtt agaaggtcct tttatgtcta tgctaatgga 7320
ggtaaaggct tttgcaaact acacaattgg aattgtgtta attgtgatac attctgtgct 7380
ggtagtacat ttattagtga tgaagttgcg agagacttgt cactacagtt taaaagacca 7440
ataaatccta ctgaccagtc ttcttacatc gttgatagtg ttacagtgaa gaatggttcc 7500
atccatcttt actttgataa agctggtcaa aagacttatg aaagacattc tctctctcat 7560
tttgttaact tagacaacct gagagctaat aacactaaag gttcattgcc tattaatgtt 7620
atagtttttg atggtaaatc aaaatgtgaa gaatcatctg caaaatcagc gtctgtttac 7680
tacagtcagc ttatgtgtca acctatactg ttactagatc aggcattagt gtctgatgtt 7740
ggtgatagtg cggaagttgc agttaaaatg tttgatgctt acgttaatac gttttcatca 7800
acttttaacg taccaatgga aaaactcaaa acactagttg caactgcaga agctgaactt 7860
gcaaagaatg tgtccttaga caatgtctta tctactttta tttcagcagc tcggcaaggg 7920
tttgttgatt cagatgtaga aactaaagat gttgttgaat gtcttaaatt gtcacatcaa 7980
tctgacatag aagttactgg cgatagttgt aataactata tgctcaccta taacaaagtt 8040
gaaaacatga caccccgtga ccttggtgct tgtattgact gtagtgcgcg tcatattaat 8100
gcgcaggtag caaaaagtca caacattgct ttgatatgga acgttaaaga tttcatgtca 8160
ttgtctgaac aactacgaaa acaaatacgt agtgctgcta aaaagaataa cttacctttt 8220
aagttgacat gtgcaactac tagacaagtt gttaatgttg taacaacaaa gatagcactt 8280
aagggtggta aaattgttaa taattggttg aagcagttaa ttaaagttac acttgtgttc 8340
ctttttgttg ctgctatttt ctatttaata acacctgttc atgtcatgtc taaacatact 8400
gacttttcaa gtgaaatcat aggatacaag gctattgatg gtggtgtcac tcgtgacata 8460
gcatctacag atacttgttt tgctaacaaa catgctgatt ttgacacatg gtttagccag 8520
cgtggtggta gttatactaa tgacaaagct tgcccattga ttgctgcagt cataacaaga 8580
gaagtgggtt ttgtcgtgcc tggtttgcct ggcacgatat tacgcacaac taatggtgac 8640
tttttgcatt tcttacctag agtttttagt gcagttggta acatctgtta cacaccatca 8700
aaacttatag agtacactga ctttgcaaca tcagcttgtg ttttggctgc tgaatgtaca 8760
atttttaaag atgcttctgg taagccagta ccatattgtt atgataccaa tgtactagaa 8820
ggttctgttg cttatgaaag tttacgccct gacacacgtt atgtgctcat ggatggctct 8880
attattcaat ttcctaacac ctaccttgaa ggttctgtta gagtggtaac aacttttgat 8940
tctgagtact gtaggcacgg cacttgtgaa agatcagaag ctggtgtttg tgtatctact 9000
agtggtagat gggtacttaa caatgattat tacagatctt taccaggagt tttctgtggt 9060
gtagatgctg taaatttact tactaatatg tttacaccac taattcaacc tattggtgct 9120
ttggacatat cagcatctat agtagctggt ggtattgtag ctatcgtagt aacatgcctt 9180
gcctactatt ttatgaggtt tagaagagct tttggtgaat acagtcatgt agttgccttt 9240
aatactttac tattccttat gtcattcact gtactctgtt taacaccagt ttactcattc 9300
ttacctggtg tttattctgt tatttacttg tacttgacat tttatcttac taatgatgtt 9360
tcttttttag cacatattca gtggatggtt atgttcacac ctttagtacc tttctggata 9420
acaattgctt atatcatttg tatttccaca aagcatttct attggttctt tagtaattac 9480
ctaaagagac gtgtagtctt taatggtgtt tcctttagta cttttgaaga agctgcgctg 9540
tgcacctttt tgttaaataa agaaatgtat ctaaagttgc gtagtgatgt gctattacct 9600
cttacgcaat ataatagata cttagctctt tataataagt acaagtattt tagtggagca 9660
atggatacaa ctagctacag agaagctgct tgttgtcatc tcgcaaaggc tctcaatgac 9720
ttcagtaact caggttctga tgttctttac caaccaccac aaacctctat cacctcagct 9780
gttttgcaga gtggttttag aaaaatggca ttcccatctg gtaaagttga gggttgtatg 9840
gtacaagtaa cttgtggtac aactacactt aacggtcttt ggcttgatga cgtagtttac 9900
tgtccaagac atgtgatctg cacctctgaa gacatgctta accctaatta tgaagattta 9960
ctcattcgta agtctaatca taatttcttg gtacaggctg gtaatgttca actcagggtt 10020
attggacatt ctatgcaaaa ttgtgtactt aagcttaagg ttgatacagc caatcctaag 10080
acacctaagt ataagtttgt tcgcattcaa ccaggacaga ctttttcagt gttagcttgt 10140
tacaatggtt caccatctgg tgtttaccaa tgtgctatga ggcccaattt cactattaag 10200
ggttcattcc ttaatggttc atgtggtagt gttggtttta acatagatta tgactgtgtc 10260
tctttttgtt acatgcacca tatggaatta ccaactggag ttcatgctgg cacagactta 10320
gaaggtaact tttatggacc ttttgttgac aggcaaacag cacaagcagc tggtacggac 10380
acaactatta cagttaatgt tttagcttgg ttgtacgctg ctgttataaa tggagacagg 10440
tggtttctca atcgatttac cacaactctt aatgacttta accttgtggc tatgaagtac 10500
aattatgaac ctctaacaca agaccatgtt gacatactag gacctctttc tgctcaaact 10560
ggaattgccg ttttagatat gtgtgcttca ttaaaagaat tactgcaaaa tggtatgaat 10620
ggacgtacca tattgggtag tgctttatta gaagatgaat ttacaccttt tgatgttgtt 10680
agacaatgct caggtgttac tttccaaagt gcagtgaaaa gaacaatcaa gggtacacac 10740
cactggttgt tactcacaat tttgacttca cttttagttt tagtccagag tactcaatgg 10800
tctttgttct tttttttgta tgaaaatgcc tttttacctt ttgctatggg tattattgct 10860
atgtctgctt ttgcaatgat gtttgtcaaa cataagcatg catttctctg tttgtttttg 10920
ttaccttctc ttgccactgt agcttatttt aatatggtct atatgcctgc tagttgggtg 10980
atgcgtatta tgacatggtt ggatatggtt gatactagtt tgaagctaaa agactgtgtt 11040
atgtatgcat cagctgtagt gttactaatc cttatgacag caagaactgt gtatgatgat 11100
ggtgctagga gagtgtggac acttatgaat gtcttgacac tcgtttataa agtttattat 11160
ggtaatgctt tagatcaagc catttccatg tgggctctta taatctctgt tacttctaac 11220
tactcaggtg tagttacaac tgtcatgttt ttggccagag gtattgtttt tatgtgtgtt 11280
gagtattgcc ctattttctt cataactggt aatacacttc agtgtataat gctagtttat 11340
tgtttcttag gctatttttg tacttgttac tttggcctct tttgtttact caaccgctac 11400
tttagactga ctcttggtgt ttatgattac ttagtttcta cacaggagtt tagatatatg 11460
aattcacagg gactactccc acccaagaat agcatagatg ccttcaaact caacattaaa 11520
ttgttgggtg ttggtggcaa accttgtatc aaagtagcca ctgtacagtc taaaatgtca 11580
gatgtaaagt gcacatcagt agtcttactc tcagttttgc aacaactcag agtagaatca 11640
tcatctaaat tgtgggctca atgtgtccag ttacacaatg acattctctt agctaaagat 11700
actactgaag cctttgaaaa aatggtttca ctactttctg ttttgctttc catgcagggt 11760
gctgtagaca taaacaagct ttgtgaagaa atgctggaca acagggcaac cttacaagct 11820
atagcctcag agtttagttc ccttccatca tatgcagctt ttgctactgc tcaagaagct 11880
tatgagcagg ctgttgctaa tggtgattct gaagttgttc ttaaaaagtt gaagaagtct 11940
ttgaatgtgg ctaaatctga atttgaccgt gatgcagcca tgcaacgtaa gttggaaaag 12000
atggctgatc aagctatgac ccaaatgtat aaacaggcta gatctgagga caagagggca 12060
aaagttacta gtgctatgca gacaatgctt ttcactatgc ttagaaagtt ggataatgat 12120
gcactcaaca acattatcaa caatgcaaga gatggttgtg ttcccttgaa cataatacct 12180
cttacaacag cagccaaact aatggttgtc ataccagact ataacacata taaaaatacg 12240
tgtgatggta caacatttac ttatgcatca gcattgtggg aaatccaaca ggttgtagat 12300
gcagatagta aaattgttca acttagtgaa attagtatgg acaattcacc taatttagca 12360
tggcctctta ttgtaacagc tttaagggcc aattctgctg tcaaattaca gaataatgag 12420
cttagtcctg ttgcactacg acagatgtct tgtgctgccg gtactacaca aactgcttgc 12480
actgatgaca atgcgttagc ttactacaac acaacaaagg gaggtaggtt tgtacttgca 12540
ctgttatccg atttacagga tttgaaatgg gctagattcc ctaagagtga tggaactggt 12600
actatctata cagaactgga accaccttgt aggtttgtta cagacacacc taaaggtcct 12660
aaagtgaagt atttatactt tattaaagga ttaaacaacc taaatagagg tatggtactt 12720
ggtagtttag ctgccacagt acgtctacaa gctggtaatg caacagaagt gcctgccaat 12780
tcaactgtat tatctttctg tgcttttgct gtagatgctg ctaaagctta caaagattat 12840
ctagctagtg ggggacaacc aatcactaat tgtgttaaga tgttgtgtac acacactggt 12900
actggtcagg caataacagt tacaccggaa gccaatatgg atcaagaatc ctttggtggt 12960
gcatcgtgtt gtctgtactg ccgttgccac atagatcatc caaatcctaa aggattttgt 13020
gacttaaaag gtaagtatgt acaaatacct acaacttgtg ctaatgaccc tgtgggtttt 13080
acacttaaaa acacagtctg taccgtctgc ggtatgtgga aaggttatgg ctgtagttgt 13140
gatcaactcc gcgaacccat gcttcagtca gctgatgcac aatcgttttt aaaccgggtt 13200
tgcggtgtaa gtgcagcccg tcttacaccg tgcggcacag gcactagtac tgatgtcgta 13260
tacagggctt ttgacatcta caatgataaa gtagctggtt ttgctaaatt cctaaaaact 13320
aattgttgtc gcttccaaga aaaggacgaa gatgacaatt taattgattc ttactttgta 13380
gttaagagac acactttctc taactaccaa catgaagaaa caatttataa tttacttaag 13440
gattgtccag ctgttgctaa acatgacttc tttaagttta gaatagacgg tgacatggta 13500
ccacatatat cacgtcaacg tcttactaaa tacacaatgg cagacctcgt ctatgcttta 13560
aggcattttg atgaaggtaa ttgtgacaca ttaaaagaaa tacttgtcac atacaattgt 13620
tgtgatgatg attatttcaa taaaaaggac tggtatgatt ttgtagaaaa cccagatata 13680
ttacgcgtat acgccaactt aggtgaacgt gtacgccaag ctttgttaaa aacagtacaa 13740
ttctgtgatg ccatgcgaaa tgctggtatt gttggtgtac tgacattaga taatcaagat 13800
ctcaatggta actggtatga tttcggtgat ttcatacaaa ccacgccagg tagtggagtt 13860
cctgttgtag attcttatta ttcattgtta atgcctatat taaccttgac cagggcttta 13920
actgcagagt cacatgttga cactgactta acaaagcctt acattaagtg ggatttgtta 13980
aaatatgact tcacggaaga gaggttaaaa ctctttgacc gttattttaa atattgggat 14040
cagacatacc acccaaattg tgttaactgt ttggatgaca gatgcattct gcattgtgca 14100
aactttaatg ttttattctc tacagtgttc ccacttacaa gttttggacc actagtgaga 14160
aaaatatttg ttgatggtgt tccatttgta gtttcaactg gataccactt cagagagcta 14220
ggtgttgtac ataatcagga tgtaaactta catagctcta gacttagttt taaggaatta 14280
cttgtgtatg ctgctgaccc tgctatgcac gctgcttctg gtaatctatt actagataaa 14340
cgcactacgt gcttttcagt agctgcactt actaacaatg ttgcttttca aactgtcaaa 14400
cctggtaatt ttaacaaaga cttctatgac tttgctgtgt ctaagggttt ctttaaggaa 14460
ggaagttctg ttgaattaaa acacttcttc tttgctcagg atggtaatgc tgctatcagc 14520
gattatgact actatcgtta taatctacca acaatgtgtg atatcagaca actactattt 14580
gtagttgaag ttgttgataa gtactttgat tgttacgatg gtggctgtat taatgctaac 14640
caagtcatcg tcaacaacct agacaaatca gctggttttc catttaataa atggggtaag 14700
gctagacttt attatgattc aatgagttat gaggatcaag atgcactttt cgcatataca 14760
aaacgtaatg tcatccctac tataactcaa atgaatctta agtatgccat tagtgcaaag 14820
aatagagctc gcaccgtagc tggtgtctct atctgtagta ctatgaccaa tagacagttt 14880
catcaaaaat tattgaaatc aatagccgcc actagaggag ctactgtagt aattggaaca 14940
agcaaattct atggtggttg gcacaacatg ttaaaaactg tttatagtga tgtagaaaac 15000
cctcatctta tgggttggga ttatcctaaa tgtgatagag ccatgcctaa catgcttaga 15060
attatggcct cacttgttct tgctcgcaaa catacaacgt gttgtagctt gtcacaccgt 15120
ttctatagat tagctaatga gtgtgctcaa gtattgagtg aaatggtcat gtgtggcggt 15180
tcactatatg ttaaaccagg tggaacctca tcaggagatg ccacaactgc ttatgctaat 15240
agtgttttta acatttgtca agctgtcacg gccaatgtta atgcactttt atctactgat 15300
ggtaacaaaa ttgccgataa gtatgtccgc aatttacaac acagacttta tgagtgtctc 15360
tatagaaata gagatgttga cacagacttt gtgaatgagt tttacgcata tttgcgtaaa 15420
catttctcaa tgatgatact ctctgacgat gctgttgtgt gtttcaatag cacttatgca 15480
tctcaaggtc tagtggctag cataaagaac tttaagtcag ttctttatta tcaaaacaat 15540
gtttttatgt ctgaagcaaa atgttggact gagactgacc ttactaaagg acctcatgaa 15600
ttttgctctc aacatacaat gctagttaaa cagggtgatg attatgtgta ccttccttac 15660
ccagatccat caagaatcct aggggccggc tgttttgtag atgatatcgt aaaaacagat 15720
ggtacactta tgattgaacg gttcgtgtct ttagctatag atgcttaccc acttactaaa 15780
catcctaatc aggagtatgc tgatgtcttt catttgtact tacaatacat aagaaagcta 15840
catgatgagt taacaggaca catgttagac atgtattctg ttatgcttac taatgataac 15900
acctcaaggt attgggaacc tgagttttat gaggctatgt acacaccgca tacagtctta 15960
caggctgttg gggcttgtgt tctttgcaat tcacagactt cattaagatg tggtgcttgc 16020
atacgtagac cattcttatg ttgtaaatgc tgttacgacc atgtcatatc aacatcacat 16080
aaattagtct tgtctgttaa tccgtatgtt tgcaatgctc caggttgtga tgtcacagat 16140
gtgactcaac tttacttagg aggtatgagc tattattgta aatcacataa accatccatt 16200
agttttccat tgtgtgctaa tggacaagtt tttggtttat ataaaaatac atgtgttggt 16260
agcgataatg ttactgactt taatgcaatt gcaacatgtg actggacaaa tgctggtgat 16320
tacattttag ctaacacctg tactgaaaga ctcaagcttt ttgcagcaga aacgctcaaa 16380
gctactgagg agacatttaa actgtcttat ggtattgcta ctgtacgtga agtgctgtct 16440
gacagagaat tacatctttc atgggaagtt ggtaaaccta gaccaccact taaccgaaat 16500
tatgtcttta ctggttatcg tgtaactaaa aacagtaaag tacaaatagg agagtacacc 16560
tttgaaaaag gtgactatgg tgatgctgtt gtttaccgag gtacaacaac ttacaaatta 16620
aatgttggtg attattttgt gctgacatca catacagtaa tgccattaag tgcacctaca 16680
ctagtgccac aagagcacta tgttagaatt actggcttat acccaacact caatatctca 16740
gatgagtttt ctagcaatgt tgcaaattat caaaaggttg gtatgcaaaa gtattctaca 16800
ctccagggac cacctggtac tggtaagagt cattttgcta ttggcctagc tctctactac 16860
ccttctgctc gcatagtgta tacagcttgc tctcatgccg ctgttgatgc actatgtgag 16920
aaggcattaa aatatttgcc tatagataaa tgtagtagaa ttatacctgc acgtgctcgt 16980
gtagagtgtt ttgataaatt caaagtgaat tcaacattag aacagtatgt cttttgtact 17040
gtaaatgcat tgcctgagac gacagcagat atagttgtct ttgatgaaat ttcaatggcc 17100
acaaattatg atttgagtgt tgtcaatgcc agattacgtg ctaagcacta tgtgtacatt 17160
ggcgaccctg ctcaattacc tgcaccacgc acattgctaa ctaagggcac actagaacca 17220
gaatatttca attcagtgtg tagacttatg aaaactatag gtccagacat gttcctcgga 17280
acttgtcggc gttgtcctgc tgaaattgtt gacactgtga gtgctttggt ttatgataat 17340
aggcttaaag cacataaaga caaatcagct caatgcttta aaatgtttta taagggtgtt 17400
atcacgcatg atgtttcatc tgcaattaac aggccacaaa taggcgtggt aagagaattc 17460
cttacacgta accctgcttg gagaaaagct gtctttattt caccttataa ttcacagaat 17520
gctgtagcct caaagatttt gggactacca actcaaactg ttgattcatc acagggctca 17580
gaatatgact atgtcatatt cactcaaacc actgaaacag ctcactcttg taatgtaaac 17640
agatttaatg ttgctattac cagagcaaaa gtaggcatac tttgcataat gtctgataga 17700
gacctttatg acaagttgca atttacaagt cttgaaattc cacgtaggaa tgtggcaact 17760
ttacaagctg aaaatgtaac aggactcttt aaagattgta gtaaggtaat cactgggtta 17820
catcctacac aggcacctac acacctcagt gttgacacta aattcaaaac tgaaggttta 17880
tgtgttgaca tacctggcat acctaaggac atgacctata gaagactcat ctctatgatg 17940
ggttttaaaa tgaattatca agttaatggt taccctaaca tgtttatcac ccgcgaagaa 18000
gctataagac atgtacgtgc atggattggc ttcgatgtcg aggggtgtca tgctactaga 18060
gaagctgttg gtaccaattt acctttacag ctaggttttt ctacaggtgt taacctagtt 18120
gctgtaccta caggttatgt tgatacacct aataatacag atttttccag agttagtgct 18180
aaaccaccgc ctggagatca atttaaacac ctcataccac ttatgtacaa aggacttcct 18240
tggaatgtag tgcgtataaa gattgtacaa atgttaagtg acacacttaa aaatctctct 18300
gacagagtcg tatttgtctt atgggcacat ggctttgagt tgacatctat gaagtatttt 18360
gtgaaaatag gacctgagcg cacctgttgt ctatgtgata gacgtgccac atgcttttcc 18420
actgcttcag acacttatgc ctgttggcat cattctattg gatttgatta cgtctataat 18480
ccgtttatga ttgatgttca acaatggggt tttacaggta acctacaaag caaccatgat 18540
ctgtattgtc aagtccatgg taatgcacat gtagctagtt gtgatgcaat catgactagg 18600
tgtctagctg tccacgagtg ctttgttaag cgtgttgact ggactattga atatcctata 18660
attggtgatg aactgaagat taatgcggct tgtagaaagg ttcaacacat ggttgttaaa 18720
gctgcattat tagcagacaa attcccagtt cttcacgaca ttggtaaccc taaagctatt 18780
aagtgtgtac ctcaagctga tgtagaatgg aagttctatg atgcacagcc ttgtagtgac 18840
aaagcttata aaatagaaga attattctat tcttatgcca cacattctga caaattcaca 18900
gatggtgtat gcctattttg gaattgcaat gtcgatagat atcctgctaa ttccattgtt 18960
tgtagatttg acactagagt gctatctaac cttaacttgc ctggttgtga tggtggcagt 19020
ttgtatgtaa ataaacatgc attccacaca ccagcttttg ataaaagtgc ttttgttaat 19080
ttaaaacaat taccattttt ctattactct gacagtccat gtgagtctca tggaaaacaa 19140
gtagtgtcag atatagatta tgtaccacta aagtctgcta cgtgtataac acgttgcaat 19200
ttaggtggtg ctgtctgtag acatcatgct aatgagtaca gattgtatct cgatgcttat 19260
aacatgatga tctcagctgg ctttagcttg tgggtttaca aacaatttga tacttataac 19320
ctctggaaca cttttacaag acttcagagt ttagaaaatg tggcttttaa tgttgtaaat 19380
aagggacact ttgatggaca acagggtgaa gtaccagttt ctatcattaa taacactgtt 19440
tacacaaaag ttgatggtgt tgatgtagaa ttgtttgaaa ataaaacaac attacctgtt 19500
aatgtagcat ttgagctttg ggctaagcgc aacattaaac cagtaccaga ggtgaaaata 19560
ctcaataatt tgggtgtgga cattgctgct aatactgtga tctgggacta caaaagagat 19620
gctccagcac atatatctac tattggtgtt tgttctatga ctgacatagc caagaaacca 19680
actgaaacga tttgtgcacc actcactgtc ttttttgatg gtagagttga tggtcaagta 19740
gacttattta gaaatgcccg taatggtgtt cttattacag aaggtagtgt taaaggttta 19800
caaccatctg taggtcccaa acaagctagt cttaatggag tcacattaat tggagaagcc 19860
gtaaaaacac agttcaatta ttataagaaa gttgatggtg ttgtccaaca attacctgaa 19920
acttacttta ctcagagtag aaatttacaa gaatttaaac ccaggagtca aatggaaatt 19980
gatttcttag aattagctat ggatgaattc attgaacggt ataaattaga aggctatgcc 20040
ttcgaacata tcgtttatgg agattttagt catagtcagt taggtggttt acatctactg 20100
attggactag ctaaacgttt taaggaatca ccttttgaat tagaagattt tattcctatg 20160
gacagtacag ttaaaaacta tttcataaca gatgcgcaaa caggttcatc taagtgtgtg 20220
tgttctgtta ttgatttatt acttgatgat tttgttgaaa taataaaatc ccaagattta 20280
tctgtagttt ctaaggttgt caaagtgact attgactata cagaaatttc atttatgctt 20340
tggtgtaaag atggccatgt agaaacattt tacccaaaat tacaatctag tcaagcgtgg 20400
caaccgggtg ttgctatgcc taatctttac aaaatgcaaa gaatgctatt agaaaagtgt 20460
gaccttcaaa attatggtga tagtgcaaca ttacctaaag gcataatgat gaatgtcgca 20520
aaatatactc aactgtgtca atatttaaac acattaacat tagctgtacc ctataatatg 20580
agagttatac attttggtgc tggttctgat aaaggagttg caccaggtac agctgtttta 20640
agacagtggt tgcctacggg tacgctgctt gtcgattcag atcttaatga ctttgtctct 20700
gatgcagatt caactttgat tggtgattgt gcaactgtac atacagctaa taaatgggat 20760
ctcattatta gtgatatgta cgaccctaag actaaaaatg ttacaaaaga aaatgactct 20820
aaagagggtt ttttcactta catttgtggg tttatacaac aaaagctagc tcttggaggt 20880
tccgtggcta taaagataac agaacattct tggaatgctg atctttataa gctcatggga 20940
cacttcgcat ggtggacagc ctttgttact aatgtgaatg cgtcatcatc tgaagcattt 21000
ttaattggat gtaattatct tggcaaacca cgcgaacaaa tagatggtta tgtcatgcat 21060
gcaaattaca tattttggag gaatacaaat ccaattcagt tgtcttccta ttctttattt 21120
gacatgagta aatttcccct taaattaagg ggtactgctg ttatgtcttt aaaagaaggt 21180
caaatcaatg atatgatttt atctcttctt agtaaaggta gacttataat tagagaaaac 21240
aacagagttg ttatttctag tgatgttctt gttaacaact aa 21282
<210> 302
<211> 13209
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 302
atggagagcc ttgtccctgg tttcaacgag aaaacacacg tccaactcag tttgcctgtt 60
ttacaggttc gcgacgtgct cgtacgtggc tttggagact ccgtggagga ggtcttatca 120
gaggcacgtc aacatcttaa agatggcact tgtggcttag tagaagttga aaaaggcgtt 180
ttgcctcaac ttgaacagcc ctatgtgttc atcaaacgtt cggatgctcg aactgcacct 240
catggtcatg ttatggttga gctggtagca gaactcgaag gcattcagta cggtcgtagt 300
ggtgagacac ttggtgtcct tgtccctcat gtgggcgaaa taccagtggc ttaccgcaag 360
gttcttcttc gtaagaacgg taataaagga gctggtggcc atagttacgg cgccgatcta 420
aagtcatttg acttaggcga cgagcttggc actgatcctt atgaagattt tcaagaaaac 480
tggaacacta aacatagcag tggtgttacc cgtgaactca tgcgtgagct taacggaggg 540
gcatacactc gctatgtcga taacaacttc tgtggccctg atggctaccc tcttgagtgc 600
attaaagacc ttctagcacg tgctggtaaa gcttcatgca ctttgtctga acaactggac 660
tttattgaca ctaagagggg tgtatactgc tgccgtgaac atgagcatga aattgcttgg 720
tacacggaac gttctgaaaa gagctatgaa ttgcagacac cttttgaaat taaattggca 780
aagaaatttg acaccttcaa tggggaatgt ccaaattttg tatttccctt aaattccata 840
atcaagacta ttcaaccaag ggttgaaaag aaaaagcttg atggctttat gggtagaatt 900
cgatctgtct atccagttgc gtcaccaaat gaatgcaacc aaatgtgcct ttcaactctc 960
atgaagtgtg atcattgtgg tgaaacttca tggcagacgg gcgattttgt taaagccact 1020
tgcgaatttt gtggcactga gaatttgact aaagaaggtg ccactacttg tggttactta 1080
ccccaaaatg ctgttgttaa aatttattgt ccagcatgtc acaattcaga agtaggacct 1140
gagcatagtc ttgccgaata ccataatgaa tctggcttga aaaccattct tcgtaagggt 1200
ggtcgcacta ttgcctttgg aggctgtgtg ttctcttatg ttggttgcca taacaagtgt 1260
gcctattggg ttccacgtgc tagcgctaac ataggttgta accatacagg tgttgttgga 1320
gaaggttccg aaggtcttaa tgacaacctt cttgaaatac tccaaaaaga gaaagtcaac 1380
atcaatattg ttggtgactt taaacttaat gaagagatcg ccattatttt ggcatctttt 1440
tctgcttcca caagtgcttt tgtggaaact gtgaaaggtt tggattataa agcattcaaa 1500
caaattgttg aatcctgtgg taattttaaa gttacaaaag gaaaagctaa aaaaggtgcc 1560
tggaatattg gtgaacagaa atcaatactg agtcctcttt atgcatttgc atcagaggct 1620
gctcgtgttg tacgatcaat tttctcccgc actcttgaaa ctgctcaaaa ttctgtgcgt 1680
gttttacaga aggccgctat aacaatacta gatggaattt cacagtattc actgagactc 1740
attgatgcta tgatgttcac atctgatttg gctactaaca atctagttgt aatggcctac 1800
attacaggtg gtgttgttca gttgacttcg cagtggctaa ctaacatctt tggcactgtt 1860
tatgaaaaac tcaaacccgt ccttgattgg cttgaagaga agtttaagga aggtgtagag 1920
tttcttagag acggttggga aattgttaaa tttatctcaa cctgtgcttg tgaaattgtc 1980
ggtggacaaa ttgtcacctg tgcaaaggaa attaaggaga gtgttcagac attctttaag 2040
cttgtaaata aatttttggc tttgtgtgct gactctatca ttattggtgg agctaaactt 2100
aaagccttga atttaggtga aacatttgtc acgcactcaa agggattgta cagaaagtgt 2160
gttaaatcca gagaagaaac tggcctactc atgcctctaa aagccccaaa agaaattatc 2220
ttcttagagg gagaaacact tcccacagaa gtgttaacag aggaagttgt cttgaaaact 2280
ggtgatttac aaccattaga acaacctact agtgaagctg ttgaagctcc attggttggt 2340
acaccagttt gtattaacgg gcttatgttg ctcgaaatca aagacacaga aaagtactgt 2400
gcccttgcac ctaatatgat ggtaacaaac aataccttca cactcaaagg cggtgcacca 2460
acaaaggtta cttttggtga tgacactgtg atagaagtgc aaggttacaa gagtgtgaat 2520
atcacttttg aacttgatga aaggattgat aaagtactta atgagaagtg ctctgcctat 2580
acagttgaac tcggtacaga agtaaatgag ttcgcctgtg ttgtggcaga tgctgtcata 2640
aaaactttgc aaccagtatc tgaattactt acaccactgg gcattgattt agatgagtgg 2700
agtatggcta catactactt atttgatgag tctggtgagt ttaaattggc ttcacatatg 2760
tattgttctt tttaccctcc agatgaggat gaagaagaag gtgattgtga agaagaagag 2820
tttgagccat caactcaata tgagtatggt actgaagatg attaccaagg taaacctttg 2880
gaatttggtg ccacttctgc tgctcttcaa cctgaagaag agcaagaaga agattggtta 2940
gatgatgata gtcaacaaac tgttggtcaa caagacggca gtgaggacaa tcagacaact 3000
attattcaaa caattgttga ggttcaacct caattagaga tggaacttac accagttgtt 3060
cagactattg aagtgaatag ttttagtggt tatttaaaac ttactgacaa tgtatacatt 3120
aaaaatgcag acattgtgga agaagctaaa aaggtaaaac caacagtggt tgttaatgca 3180
gccaatgttt accttaaaca tggaggaggt gttgcaggag ccttaaataa ggctactaac 3240
aatgccatgc aagttgaatc tgatgattac atagctacta atggaccact taaagtgggt 3300
ggtagttgtg ttttaagcgg acacaatctt gctaaacact gtcttcatgt tgtcggccca 3360
aatgttaaca aaggtgaaga cattcaactt cttaagagtg cttatgaaaa ttttaatcag 3420
cacgaagttc tacttgcacc attattatca gctggtattt ttggtgctga ccctatacat 3480
tctttaagag tttgtgtaga tactgttcgc acaaatgtct acttagctgt ctttgataaa 3540
aatctctatg acaaacttgt ttcaagcttt ttggaaatga agagtgaaaa gcaagttgaa 3600
caaaagatcg ctgagattcc taaagaggaa gttaagccat ttataactga aagtaaacct 3660
tcagttgaac agagaaaaca agatgataag aaaatcaaag cttgtgttga agaagttaca 3720
acaactctgg aagaaactaa gttcctcaca gaaaacttgt tactttatat tgacattaat 3780
ggcaatcttc atccagattc tgccactctt gttagtgaca ttgacatcac tttcttaaag 3840
aaagatgctc catatatagt gggtgatgtt gttcaagagg gtgttttaac tgctgtggtt 3900
atacctacta aaaaggctgg tggcactact gaaatgctag cgaaagcttt gagaaaagtg 3960
ccaacagaca attatataac cacttacccg ggtcagggtt taaatggtta cactgtagag 4020
gaggcaaaga cagtgcttaa aaagtgtaaa agtgcctttt acattctacc atctattatc 4080
tctaatgaga agcaagaaat tcttggaact gtttcttgga atttgcgaga aatgcttgca 4140
catgcagaag aaacacgcaa attaatgcct gtctgtgtgg aaactaaagc catagtttca 4200
actatacagc gtaaatataa gggtattaaa atacaagagg gtgtggttga ttatggtgct 4260
agattttact tttacaccag taaaacaact gtagcgtcac ttatcaacac acttaacgat 4320
ctaaatgaaa ctcttgttac aatgccactt ggctatgtaa cacatggctt aaatttggaa 4380
gaagctgctc ggtatatgag atctctcaaa gtgccagcta cagtttctgt ttcttcacct 4440
gatgctgtta cagcgtataa tggttatctt acttcttctt ctaaaacacc tgaagaacat 4500
tttattgaaa ccatctcact tgctggttcc tataaagatt ggtcctattc tggacaatct 4560
acacaactag gtatagaatt tcttaagaga ggtgataaaa gtgtatatta cactagtaat 4620
cctaccacat tccacctaga tggtgaagtt atcacctttg acaatcttaa gacacttctt 4680
tctttgagag aagtgaggac tattaaggtg tttacaacag tagacaacat taacctccac 4740
acgcaagttg tggacatgtc aatgacatat ggacaacagt ttggtccaac ttatttggat 4800
ggagctgatg ttactaaaat aaaacctcat aattcacatg aaggtaaaac attttatgtt 4860
ttacctaatg atgacactct acgtgttgag gcttttgagt actaccacac aactgatcct 4920
agttttctgg gtaggtacat gtcagcatta aatcacacta aaaagtggaa atacccacaa 4980
gttaatggtt taacttctat aaaatgggca gataacaact gttatcttgc cactgcattg 5040
ttaacactcc aacaaataga gttgaagttt aatccacctg ctctacaaga tgcttattac 5100
agagcaaggg ctggtgaagc tgataacttt tgtgcactta tcttagccta ctgtaataag 5160
acagtaggtg agttaggtga tgttagagaa acaatgagtt acttgtttca acatgccaat 5220
ttagattctt gcaaaagagt cttgaacgtg gtgtgtaaaa cttgtggaca acagcagaca 5280
acccttaagg gtgtagaagc tgttatgtac atgggcacac tttcttatga acaatttaag 5340
aaaggtgttc agataccttg tacgtgtggt aaacaagcta caaaatatct agtacaacag 5400
gagtcacctt ttgttatgat gtcagcacca cctgctcagt atgaacttaa gcatggtaca 5460
tttacttgtg ctagtgagta cactggtaat taccagtgtg gtcactataa acatataact 5520
tctaaagaaa ctttgtattg catagacggt gctttactta caaagtcctc agaatacaaa 5580
ggtcctatta cggatgtttt ctacaaagaa aacagttaca caacaaccat aaaaccagtt 5640
acttataaat tggatggtgt tgtttgtaca gaaattgacc ctaagttgga caattattat 5700
aagaaagaca attcttattt tacagagcaa ccaattgatc ttgtaccaaa ccaaccatat 5760
ccaaacgcaa gcttcgataa ttttaagttt gtatgtgata atatcaaatt tgctgatgat 5820
ttaaaccagt taactggtta taagaaacct gcttcaagag agcttaaagt tacatttttc 5880
cctgacttaa atggtgatgt ggtggctatt gattataaac actacacacc ctcttttaag 5940
aaaggagcta aattgttaca taaacctatt gtttggcatg ttaacaatgc aactaataaa 6000
gccacgtata aaccaaatac ctggtgtata cgttgtcttt ggagcacaaa accagttgaa 6060
acatcaaatt cgtttgatgt actgaagtca gaggacgcgc agggaatgga taatcttgcc 6120
tgcgaagatc taaaaccagt ctctgaagaa gtagtggaaa atcctaccat acagaaagac 6180
gttcttgagt gtaatgtgaa aactaccgaa gttgtaggag acattatact taaaccagca 6240
aataatagtt taaaaattac agaagaggtt ggccacacag atctaatggc tgcttatgta 6300
gacaattcta gtcttactat taagaaacct aatgaattat ctagagtatt aggtttgaaa 6360
acccttgcta ctcatggttt agctgctgtt aatagtgtcc cttgggatac tatagctaat 6420
tatgctaagc cttttcttaa caaagttgtt agtacaacta ctaacatagt tacacggtgt 6480
ttaaaccgtg tttgtactaa ttatatgcct tatttcttta ctttattgct acaattgtgt 6540
acttttacta gaagtacaaa ttctagaatt aaagcatcta tgccgactac tatagcaaag 6600
aatactgtta agagtgtcgg taaattttgt ctagaggctt catttaatta tttgaagtca 6660
cctaattttt ctaaactgat aaatattaca atttggtttt tactattaag tgtttgccta 6720
ggttctttaa tctactcaac cgctgcttta ggtgttttaa tgtctaattt aggcatgcct 6780
tcttactgta ctggttacag agaaggctat ttgaactcta ctaatgtcac tattgcaacc 6840
tactgtactg gttctatacc ttgtagtgtt tgtcttagtg gtttagattc tttagacacc 6900
tatccttctt tagaaactat acaaattacc atttcatctt ttaaatggga tttaactgct 6960
tttggcttag ttgcagagtg gtttttggca tatattcttt tcactaggtt tttctatgta 7020
cttggattgg ctgcaatcat gcaattgttt ttcagctatt ttgcagtaca ttttattagt 7080
aattcttggc ttatgtggtt aataattaat cttgtacaaa tggccccgat ttcagctatg 7140
gttagaatgt acatcttctt tgcatcattt tattatgtat ggaaaagtta tgtgcatgtt 7200
gtagacggtt gtaattcatc aacttgtatg atgtgttaca aacgtaatag agcaacaaga 7260
gtcgaatgta caactattgt taatggtgtt agaaggtcct tttatgtcta tgctaatgga 7320
ggtaaaggct tttgcaaact acacaattgg aattgtgtta attgtgatac attctgtgct 7380
ggtagtacat ttattagtga tgaagttgcg agagacttgt cactacagtt taaaagacca 7440
ataaatccta ctgaccagtc ttcttacatc gttgatagtg ttacagtgaa gaatggttcc 7500
atccatcttt actttgataa agctggtcaa aagacttatg aaagacattc tctctctcat 7560
tttgttaact tagacaacct gagagctaat aacactaaag gttcattgcc tattaatgtt 7620
atagtttttg atggtaaatc aaaatgtgaa gaatcatctg caaaatcagc gtctgtttac 7680
tacagtcagc ttatgtgtca acctatactg ttactagatc aggcattagt gtctgatgtt 7740
ggtgatagtg cggaagttgc agttaaaatg tttgatgctt acgttaatac gttttcatca 7800
acttttaacg taccaatgga aaaactcaaa acactagttg caactgcaga agctgaactt 7860
gcaaagaatg tgtccttaga caatgtctta tctactttta tttcagcagc tcggcaaggg 7920
tttgttgatt cagatgtaga aactaaagat gttgttgaat gtcttaaatt gtcacatcaa 7980
tctgacatag aagttactgg cgatagttgt aataactata tgctcaccta taacaaagtt 8040
gaaaacatga caccccgtga ccttggtgct tgtattgact gtagtgcgcg tcatattaat 8100
gcgcaggtag caaaaagtca caacattgct ttgatatgga acgttaaaga tttcatgtca 8160
ttgtctgaac aactacgaaa acaaatacgt agtgctgcta aaaagaataa cttacctttt 8220
aagttgacat gtgcaactac tagacaagtt gttaatgttg taacaacaaa gatagcactt 8280
aagggtggta aaattgttaa taattggttg aagcagttaa ttaaagttac acttgtgttc 8340
ctttttgttg ctgctatttt ctatttaata acacctgttc atgtcatgtc taaacatact 8400
gacttttcaa gtgaaatcat aggatacaag gctattgatg gtggtgtcac tcgtgacata 8460
gcatctacag atacttgttt tgctaacaaa catgctgatt ttgacacatg gtttagccag 8520
cgtggtggta gttatactaa tgacaaagct tgcccattga ttgctgcagt cataacaaga 8580
gaagtgggtt ttgtcgtgcc tggtttgcct ggcacgatat tacgcacaac taatggtgac 8640
tttttgcatt tcttacctag agtttttagt gcagttggta acatctgtta cacaccatca 8700
aaacttatag agtacactga ctttgcaaca tcagcttgtg ttttggctgc tgaatgtaca 8760
atttttaaag atgcttctgg taagccagta ccatattgtt atgataccaa tgtactagaa 8820
ggttctgttg cttatgaaag tttacgccct gacacacgtt atgtgctcat ggatggctct 8880
attattcaat ttcctaacac ctaccttgaa ggttctgtta gagtggtaac aacttttgat 8940
tctgagtact gtaggcacgg cacttgtgaa agatcagaag ctggtgtttg tgtatctact 9000
agtggtagat gggtacttaa caatgattat tacagatctt taccaggagt tttctgtggt 9060
gtagatgctg taaatttact tactaatatg tttacaccac taattcaacc tattggtgct 9120
ttggacatat cagcatctat agtagctggt ggtattgtag ctatcgtagt aacatgcctt 9180
gcctactatt ttatgaggtt tagaagagct tttggtgaat acagtcatgt agttgccttt 9240
aatactttac tattccttat gtcattcact gtactctgtt taacaccagt ttactcattc 9300
ttacctggtg tttattctgt tatttacttg tacttgacat tttatcttac taatgatgtt 9360
tcttttttag cacatattca gtggatggtt atgttcacac ctttagtacc tttctggata 9420
acaattgctt atatcatttg tatttccaca aagcatttct attggttctt tagtaattac 9480
ctaaagagac gtgtagtctt taatggtgtt tcctttagta cttttgaaga agctgcgctg 9540
tgcacctttt tgttaaataa agaaatgtat ctaaagttgc gtagtgatgt gctattacct 9600
cttacgcaat ataatagata cttagctctt tataataagt acaagtattt tagtggagca 9660
atggatacaa ctagctacag agaagctgct tgttgtcatc tcgcaaaggc tctcaatgac 9720
ttcagtaact caggttctga tgttctttac caaccaccac aaacctctat cacctcagct 9780
gttttgcaga gtggttttag aaaaatggca ttcccatctg gtaaagttga gggttgtatg 9840
gtacaagtaa cttgtggtac aactacactt aacggtcttt ggcttgatga cgtagtttac 9900
tgtccaagac atgtgatctg cacctctgaa gacatgctta accctaatta tgaagattta 9960
ctcattcgta agtctaatca taatttcttg gtacaggctg gtaatgttca actcagggtt 10020
attggacatt ctatgcaaaa ttgtgtactt aagcttaagg ttgatacagc caatcctaag 10080
acacctaagt ataagtttgt tcgcattcaa ccaggacaga ctttttcagt gttagcttgt 10140
tacaatggtt caccatctgg tgtttaccaa tgtgctatga ggcccaattt cactattaag 10200
ggttcattcc ttaatggttc atgtggtagt gttggtttta acatagatta tgactgtgtc 10260
tctttttgtt acatgcacca tatggaatta ccaactggag ttcatgctgg cacagactta 10320
gaaggtaact tttatggacc ttttgttgac aggcaaacag cacaagcagc tggtacggac 10380
acaactatta cagttaatgt tttagcttgg ttgtacgctg ctgttataaa tggagacagg 10440
tggtttctca atcgatttac cacaactctt aatgacttta accttgtggc tatgaagtac 10500
aattatgaac ctctaacaca agaccatgtt gacatactag gacctctttc tgctcaaact 10560
ggaattgccg ttttagatat gtgtgcttca ttaaaagaat tactgcaaaa tggtatgaat 10620
ggacgtacca tattgggtag tgctttatta gaagatgaat ttacaccttt tgatgttgtt 10680
agacaatgct caggtgttac tttccaaagt gcagtgaaaa gaacaatcaa gggtacacac 10740
cactggttgt tactcacaat tttgacttca cttttagttt tagtccagag tactcaatgg 10800
tctttgttct tttttttgta tgaaaatgcc tttttacctt ttgctatggg tattattgct 10860
atgtctgctt ttgcaatgat gtttgtcaaa cataagcatg catttctctg tttgtttttg 10920
ttaccttctc ttgccactgt agcttatttt aatatggtct atatgcctgc tagttgggtg 10980
atgcgtatta tgacatggtt ggatatggtt gatactagtt tgaagctaaa agactgtgtt 11040
atgtatgcat cagctgtagt gttactaatc cttatgacag caagaactgt gtatgatgat 11100
ggtgctagga gagtgtggac acttatgaat gtcttgacac tcgtttataa agtttattat 11160
ggtaatgctt tagatcaagc catttccatg tgggctctta taatctctgt tacttctaac 11220
tactcaggtg tagttacaac tgtcatgttt ttggccagag gtattgtttt tatgtgtgtt 11280
gagtattgcc ctattttctt cataactggt aatacacttc agtgtataat gctagtttat 11340
tgtttcttag gctatttttg tacttgttac tttggcctct tttgtttact caaccgctac 11400
tttagactga ctcttggtgt ttatgattac ttagtttcta cacaggagtt tagatatatg 11460
aattcacagg gactactccc acccaagaat agcatagatg ccttcaaact caacattaaa 11520
ttgttgggtg ttggtggcaa accttgtatc aaagtagcca ctgtacagtc taaaatgtca 11580
gatgtaaagt gcacatcagt agtcttactc tcagttttgc aacaactcag agtagaatca 11640
tcatctaaat tgtgggctca atgtgtccag ttacacaatg acattctctt agctaaagat 11700
actactgaag cctttgaaaa aatggtttca ctactttctg ttttgctttc catgcagggt 11760
gctgtagaca taaacaagct ttgtgaagaa atgctggaca acagggcaac cttacaagct 11820
atagcctcag agtttagttc ccttccatca tatgcagctt ttgctactgc tcaagaagct 11880
tatgagcagg ctgttgctaa tggtgattct gaagttgttc ttaaaaagtt gaagaagtct 11940
ttgaatgtgg ctaaatctga atttgaccgt gatgcagcca tgcaacgtaa gttggaaaag 12000
atggctgatc aagctatgac ccaaatgtat aaacaggcta gatctgagga caagagggca 12060
aaagttacta gtgctatgca gacaatgctt ttcactatgc ttagaaagtt ggataatgat 12120
gcactcaaca acattatcaa caatgcaaga gatggttgtg ttcccttgaa cataatacct 12180
cttacaacag cagccaaact aatggttgtc ataccagact ataacacata taaaaatacg 12240
tgtgatggta caacatttac ttatgcatca gcattgtggg aaatccaaca ggttgtagat 12300
gcagatagta aaattgttca acttagtgaa attagtatgg acaattcacc taatttagca 12360
tggcctctta ttgtaacagc tttaagggcc aattctgctg tcaaattaca gaataatgag 12420
cttagtcctg ttgcactacg acagatgtct tgtgctgccg gtactacaca aactgcttgc 12480
actgatgaca atgcgttagc ttactacaac acaacaaagg gaggtaggtt tgtacttgca 12540
ctgttatccg atttacagga tttgaaatgg gctagattcc ctaagagtga tggaactggt 12600
actatctata cagaactgga accaccttgt aggtttgtta cagacacacc taaaggtcct 12660
aaagtgaagt atttatactt tattaaagga ttaaacaacc taaatagagg tatggtactt 12720
ggtagtttag ctgccacagt acgtctacaa gctggtaatg caacagaagt gcctgccaat 12780
tcaactgtat tatctttctg tgcttttgct gtagatgctg ctaaagctta caaagattat 12840
ctagctagtg ggggacaacc aatcactaat tgtgttaaga tgttgtgtac acacactggt 12900
actggtcagg caataacagt tacaccggaa gccaatatgg atcaagaatc ctttggtggt 12960
gcatcgtgtt gtctgtactg ccgttgccac atagatcatc caaatcctaa aggattttgt 13020
gacttaaaag gtaagtatgt acaaatacct acaacttgtg ctaatgaccc tgtgggtttt 13080
acacttaaaa acacagtctg taccgtctgc ggtatgtgga aaggttatgg ctgtagttgt 13140
gatcaactcc gcgaacccat gcttcagtca gctgatgcac aatcgttttt aaacgggttt 13200
gcggtgtaa 13209
<210> 303
<211> 3813
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 303
atgtttgttt ttcttgtttt attgccacta gtctctagtc agtgtgttaa tcttacaacc 60
agaactcaat taccccctgc atacactaat tctttcacac gtggtgttta ttaccctgac 120
aaagttttca gatcctcagt tttacattca actcaggact tgttcttacc tttcttttcc 180
aatgttactt ggttccatgc tatctctggg accaatggta ctaagaggtt tgataaccct 240
gtcctaccat ttaatgatgg tgtttatttt gcttccactg agaagtctaa cataataaga 300
ggctggattt ttggtactac tttagattcg aagacccagt ccctacttat tgttaataac 360
gctactaatg ttgttattaa agtctgtgaa tttcaatttt gtaatgatcc atttttgggt 420
gtttaccaca aaaacaacaa aagttggatg gaaagtgagt tcagagttta ttctagtgcg 480
aataattgca cttttgaata tgtctctcag ccttttctta tggaccttga aggaaaacag 540
ggtaatttca aaaatcttag ggaatttgtg tttaagaata ttgatggtta ttttaaaata 600
tattctaagc acacgcctat taatttagtg cgtgatctcc ctcagggttt ttcggcttta 660
gaaccattgg tagatttgcc aataggtatt aacatcacta ggtttcaaac tttacttgct 720
ttacatagaa gttatttgac tcctggtgat tcttcttcag gttggacagc tggtgctgca 780
gcttattatg tgggttatct tcaacctagg acttttctat taaaatataa tgaaaatgga 840
accattacag atgctgtaga ctgtgcactt gaccctctct cagaaacaaa gtgtacgttg 900
aaatccttca ctgtagaaaa aggaatctat caaacttcta actttagagt ccaaccaaca 960
gaatctattg ttagatttcc taatattaca aacttgtgcc cttttggtga agtttttaac 1020
gccaccagat ttgcatctgt ttatgcttgg aacaggaaga gaatcagcaa ctgtgttgct 1080
gattattctg tcctatataa ttccgcatca ttttccactt ttaagtgtta tggagtgtct 1140
cctactaaat taaatgatct ctgctttact aatgtctatg cagattcatt tgtaattaga 1200
ggtgatgaag tcagacaaat cgctccaggg caaactggaa agattgctga ttataattat 1260
aaattaccag atgattttac aggctgcgtt atagcttgga attctaacaa tcttgattct 1320
aaggttggtg gtaattataa ttacctgtat agattgttta ggaagtctaa tctcaaacct 1380
tttgagagag atatttcaac tgaaatctat caggccggta gcacaccttg taatggtgtt 1440
gaaggtttta attgttactt tcctttacaa tcatatggtt tccaacccac ttatggtgtt 1500
ggttaccaac catacagagt agtagtactt tcttttgaac ttctacatgc accagcaact 1560
gtttgtggac ctaaaaagtc tactaatttg gttaaaaaca aatgtgtcaa tttcaacttc 1620
aatggtttaa caggcacagg tgttcttact gagtctaaca aaaagtttct gcctttccaa 1680
caatttggca gagacattga tgacactact gatgctgtcc gtgatccaca gacacttgag 1740
attcttgaca ttacaccatg ttcttttggt ggtgtcagtg ttataacacc aggaacaaat 1800
acttctaacc aggttgctgt tctttatcag ggtgttaact gcacagaagt ccctgttgct 1860
attcatgcag atcaacttac tcctacttgg cgtgtttatt ctacaggttc taatgttttt 1920
caaacacgtg caggctgttt aataggggct gaacatgtca acaactcata tgagtgtgac 1980
atacccattg gtgcaggtat atgcgctagt tatcagactc agactaattc tcatcggcgg 2040
gcacgtagtg tagctagtca atccatcatt gcctacacta tgtcacttgg tgcagaaaat 2100
tcagttgctt actctaataa ctctattgcc atacccataa attttactat tagtgttacc 2160
acagaaattc taccagtgtc tatgaccaag acatcagtag attgtacaat gtacatttgt 2220
ggtgattcaa ctgaatgcag caatcttttg ttgcaatatg gcagtttttg tacacaatta 2280
aaccgtgctt taactggaat agctgttgaa caagacaaaa acacccaaga agtttttgca 2340
caagtcaaac aaatttacaa aacaccacca attaaagatt ttggtggttt taatttttca 2400
caaatattac cagatccatc aaaaccaagc aagaggtcat ttattgaaga tctacttttc 2460
aacaaagtga cacttgcaga tgctggcttc atcaaacaat atggtgattg ccttggtgat 2520
attgctgcta gagacctcat ttgtgcacaa aagtttaacg gccttactgt tttgccacct 2580
ttgctcacag atgaaatgat tgctcaatac acttctgcac tgttagcggg tacaatcact 2640
tctggttgga cctttggtgc aggtgctgca ttacaaatac catttgctat gcaaatggct 2700
tataggttta atggtattgg agttacacag aatgttctct atgagaacca aaaattgatt 2760
gccaaccaat ttaatagtgc tattggcaaa attcaagact cactttcttc cacagcaagt 2820
gcacttggaa aacttcaaga tgtggtcaac caaaatgcac aagctttaaa cacgcttgtt 2880
aaacaactta gctccaattt tggtgcaatt tcaagtgttt taaatgatat ccttgcacgt 2940
cttgacaaag ttgaggctga agtgcaaatt gataggttga tcacaggcag acttcaaagt 3000
ttgcagacat atgtgactca acaattaatt agagctgcag aaatcagagc ttctgctaat 3060
cttgctgcta ctaaaatgtc agagtgtgta cttggacaat caaaaagagt tgatttttgt 3120
ggaaagggct atcatcttat gtccttccct cagtcagcac ctcatggtgt agtcttcttg 3180
catgtgactt atgtccctgc acaagaaaag aacttcacaa ctgctcctgc catttgtcat 3240
gatggaaaag cacactttcc tcgtgaaggt gtctttgttt caaatggcac acactggttt 3300
gtaacacaaa ggaattttta tgaaccacaa atcattacta cacacaacac atttgtgtct 3360
ggtaactgtg atgttgtaat aggaattgtc aacaacacag tttatgatcc tttgcaacct 3420
gaattagact cattcaagga ggagttagat aaatatttta agaatcatac atcaccagat 3480
gttgatttag gtgacatctc tggcattaat gcttcagttg taaacattca aaaagaaatt 3540
gaccgcctca atgaggttgc caagaattta aatgaatctc tcatcgatct ccaagaactt 3600
ggaaagtatg agcagtatat aaaatggcca tggtacattt ggctaggttt tatagctggc 3660
ttgattgcca tagtaatggt gacaattatg ctttgctgta tgaccagttg ctgtagttgt 3720
ctcaagggct gttgttcttg tggatcctgc tgcaaatttg atgaagacga ctctgagcca 3780
gtgctcaaag gagtcaaatt acattacaca taa 3813
<210> 304
<211> 828
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 304
atggatttgt ttatgagaat cttcacaatt ggaactgtaa ctttgaagca aggtgaaatc 60
aaggatgcta ctccttcaga ttttgttcgc gctactgcaa cgataccgat acaagcctca 120
ctccctttcg gatggcttat tgttggcgtt gcacttcttg ctgtttttca gagcgcttcc 180
aaaatcataa ccctcaaaaa gagatggcaa ctagcactct ccaagggtgt tcactttgtt 240
tgcaacttgc tgttgttgtt tgtaacagtt tactcacacc ttttgctcgt tgctgctggc 300
cttgaagccc cttttctcta tctttatgct ttagtctact tcttgcagag tataaacttt 360
gtaagaataa taatgaggct ttggctttgc tggaaatgcc gttccaaaaa cccattactt 420
tatgatgcca actattttct ttgctggcat actaattgtt acgactattg tataccttac 480
aatagtgtaa cttcttcaat tgtcattact tcaggtgatg gcacaacaag tcctatttct 540
gaacatgact accagattgg tggttatact gaaaaatggg aatctggagt aaaagactgt 600
gttgtattac acagttactt cacttcagac tattaccagc tgtactcaac tcaattgagt 660
acagacactg gtgttgaaca tgttaccttc ttcatctaca ataaaattgt tgatgagcct 720
gaagaacatg tccaaattca cacaatcgac ggttcatccg gagttgttaa tccagtaatg 780
gaaccaattt atgatgaacc gacgacgact actagcgtgc ctttgtaa 828
<210> 305
<211> 228
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 305
atgtactcat tcgtttcgga agagacaggt acgttaatag ttaatagcgt acttcttttt 60
cttgctttcg tggtattctt gctagttaca ctagccatcc ttactgcgct tcgattgtgt 120
gcgtactgct gcaatattgt taacgtgagt cttgtaaaac cttcttttta cgtttactct 180
cgtgttaaaa atctgaattc ttctagagtt cctgatcttc tggtctaa 228
<210> 306
<211> 669
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 306
atggcagatt ccaacggtac tattaccgtt gaagagctta aaaagctcct tgaacaatgg 60
aacctagtaa taggtttcct attccttaca tggatttgtc ttctacaatt tgcctatgcc 120
aacaggaata ggtttttgta tataattaag ttaattttcc tctggctgtt atggccagta 180
actttagctt gttttgtgct tgctgctgtt tacagaataa attggatcac cggtggaatt 240
gctatcgcaa tggcttgtct tgtaggcttg atgtggctca gctacttcat tgcttctttc 300
agactgtttg cgcgtacgcg ttccatgtgg tcattcaatc cagaaactaa cattcttctc 360
aacgtgccac tccatggcac tattctgacc agaccgcttc tagaaagtga actcgtaatc 420
ggagctgtga tccttcgtgg acatcttcgt attgctggac accatctagg acgctgtgac 480
atcaaggacc tgcctaaaga aatcactgtt gctacatcac gaacgctttc ttattacaaa 540
ttgggagctt cgcagcgtgt agcaggtgac tcaggttttg ctgcatacag tcgctacagg 600
attggcaact ataaattaaa cacagaccat tccagtagca gtgacaatat tgctttgctt 660
gtacagtaa 669
<210> 307
<211> 186
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 307
atgtttcatc tcgttgactt tcaggttact atagcagaga tattactaat tattatgagg 60
acttttaaag tttccatttg gaatcttgat tacatcataa acctcataat taaaaattta 120
tctaagtcac taactgagaa taaatattct caattagatg aagagcaacc aatggagatt 180
gattaa 186
<210> 308
<211> 366
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 308
atgaaaatta ttcttttctt ggcactgata acactcgcta cttgtgagct ttatcactac 60
caagagtgtg ttagaggtac aacagtactt ttaaaagaac cttgctcttc tggaacatac 120
gagggcaatt caccatttca tcctctagct gataacaaat ttgcactgac ttgctttagc 180
actcaatttg cttttgcttg tcctgacggc gtaaaacacg tctatcagtt acgtgccaga 240
tcagtttcac ctaaactgtt catcagacaa gaggaagttc aagaacttta ctctccaatt 300
tttcttattg ttgcggcaat agtgtttata acactttgct tcacactcaa aagaaagaca 360
gaatga 366
<210> 309
<211> 132
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 309
atgattgaac tttcattaat tgacttctat ttgtgctttt tagcctttct gctattcctt 60
gttttaatta tgcttattat cttttggttc tcacttgaac tgcaagatca taatgaaact 120
tgtcacgcct aa 132
<210> 310
<211> 81
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 310
atgaaatttc ttgttttctt aggaatcatc acaactgtag ctgcatttca ccaagaatgt 60
agtttacagt catgtactta a 81
<210> 311
<211> 1260
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 311
atgtctctaa atggacccca aaatcagcga aatgcacccc gcattacgtt tggtggaccc 60
tcagattcaa ctggcagtaa ccagaatgga gaacgcagtg gggcgcgatc aaaacaacgt 120
cggccccaag gtttacccaa taatactgcg tcttggttca ccgctctcac tcaacatggc 180
aaggaagacc ttaaattccc tcgaggacaa ggcgttccaa ttaacaccaa tagcagtcca 240
gatgaccaaa ttggctacta ccgaagagct accagacgaa ttcgtggtgg tgacggtaaa 300
atgaaagatc tcagtccaag atggtatttc tactacctag gaactgggcc agaagctgga 360
cttccctatg gtgctaacaa agacggcatc atatgggttg caactgaggg agccttgaat 420
acaccaaaag atcacattgg cacccgcaat cctgctaaca atgctgcaat cgtgctacaa 480
cttcctcaag gaacaacatt gccaaaaggc ttctacgcag aagggagcag aggcggcagt 540
caagcctctt ctcgttcctc atcacgtagt cgcaacagtt caagaaattc aactccaggc 600
agcagtaaac gaacttctcc tgctagaatg gctggcaatg gcggtgatgc ggctcttgct 660
ttgctgctgc ttgacagatt gaaccagctt gagagcaaaa tgtttggtaa aggccaacaa 720
caacaaggcc aaactgtcac taagaaatct gctgctgagg cttctaagaa gcctcggcaa 780
aaacgtactg ccactaaagc atacaatgta acacaagctt tcggcagacg tggtccagaa 840
caaacccaag gaaattttgg ggaccaggaa ctaatcagac aaggaactga ttacaaacat 900
tggccgcaaa ttgcacaatt tgcccccagc gcttcagcgt tcttcggaat gtcgcgcatt 960
ggcatggaag tcacaccttc gggaacgtgg ttgacctaca caggtgccat caaattggat 1020
gacaaagatc caaatttcaa agatcaagtc attttgctga ataagcatat tgacgcatac 1080
aaaacattcc caccaacaga gcctaaaaag gacaaaaaga agaaggctga tgaaactcaa 1140
gccttaccgc agagacagaa gaaacagcaa actgtgactc ttcttcctgc tgcagatttg 1200
gatgatttct ccaaacaatt gcaacaatcc atgagcagtg ctgactcaac tcaggcctaa 1260
<210> 312
<211> 117
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 312
atgggctata taaacgtttt cgcttttccg tttacgatat atagtctact cttgtgcaga 60
atgaattctc gtaactacat agcacaagta gatgtagtta actttaatct cacatag 117
<210> 313
<211> 21291
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 313
atggagagcc ttgtccctgg tttcaacgag aaaacacacg tccaactcag tttgcctgtt 60
ttacaggttc gcgacgtgct cgtacgtggc tttggagact ccgtggagga ggtcttatca 120
gaggcacgtc aacatcttaa agatggcact tgtggcttag tagaagttga aaaaggcgtt 180
ttgcctcaac ttgaacagcc ctatgtgttc atcaaacgtt cggatgctcg aactgcacct 240
catggtcatg ttatggttga gctggtagca gaactcgaag gcattcagta cggtcgtagt 300
ggtgagacac ttggtgtcct tgtccctcat gtgggcgaaa taccagtggc ttaccgcaag 360
gttcttcttc gtaagaacgg taataaagga gctggtggcc atagttacgg cgccgatcta 420
aagtcatttg acttaggcga cgagcttggc actgatcctt atgaagattt tcaagaaaac 480
tggaacacta aacatagcag tggtgttacc cgtgaactca tgcgtgagct taacggaggg 540
gcatacactc gctatgtcga taacaacttc tgtggccctg atggctaccc tcttgagtgc 600
attaaagacc ttctagcacg tgctggtaaa gcttcatgca ctttgtccga acaactggac 660
tttattgaca ctaagagggg tgtatactgc tgccgtgaac atgagcatga aattgcttgg 720
tacacggaac gttctgaaaa gagctatgaa ttgcagacac cttttgaaat taaattggca 780
aagaaatttg acaccttcaa tggggaatgt ccaaattttg tatttccctt aaattccata 840
atcaagacta ttcaaccaag ggttgaaaag aaaaagcttg atggctttat gggtagaatt 900
cgatctgtct atccagttgc gtcaccaaat gaatgcaacc aaatgtgcct ttcaactctc 960
atgaagtgtg atcattgtgg tgaaacttca tggcagacgg gcgattttgt taaagccact 1020
tgcgaatttt gtggcactga gaatttgact aaagaaggtg ccactacttg tggttactta 1080
ccccaaaatg ctgttgttaa aatttattgt ccagcatgtc acaattcaga agtaggacct 1140
gagcatagtc ttgccgaata ccataatgaa tctggcttga aaaccattct tcgtaagggt 1200
ggtcgcacta ttgcctttgg aggctgtgtg ttctcttatg ttggttgcca taacaagtgt 1260
gcctattggg ttccacgtgc tagcgctaac ataggttgta accatacagg tgttgttgga 1320
gaaggttccg aaggtcttaa tgacaacctt cttgaaatac tccaaaaaga gaaagtcaac 1380
atcaatattg ttggtgactt taaacttaat gaagagatcg ccattatttt ggcatctttt 1440
tctgcttcca caagtgcttt tgtggaaact gtgaaaggtt tggattataa agcattcaaa 1500
caaattgttg aatcctgtgg taattttaaa gttacaaaag gaaaagctaa aaaaggtgcc 1560
tggaatattg gtgaacagaa atcaatactg agtcctcttt atgcatttgc atcagaggct 1620
gctcgtgttg tacgatcaat tttctcccgc actcttgaaa ctgctcaaaa ttctgtgcgt 1680
gttttacaga aggccgctat aacaatacta gatggaattt cacagtattc actgagactc 1740
attgatgcta tgatgttcac atctgatttg gctactaaca atctagttgt aatggcctac 1800
attacaggtg gtgttgttca gttgacttcg cagtggctaa ctaacatctt tggcactgtt 1860
tatgaaaaac tcaaacccgt ccttgattgg cttgaagaga agtttaagga aggtgtagag 1920
tttcttagag acggttggga aattgttaaa tttatctcaa cctgtgcttg tgaaattgtc 1980
ggtggacaaa ttgtcacctg tgcaaaggaa attaaggaga gtgttcagac attctttaag 2040
cttgtaaata aatttttggc tttgtgtgct gactctatca ttattggtgg agctaaactt 2100
aaagccttga atttaggtga aacatttgtc acgcactcaa agggattgta cagaaagtgt 2160
gttaaatcca gagaagaaac tggcctactc atgcctctaa aagccccaaa agaaattatc 2220
ttcttagagg gagaaacact tcccacagaa gtgttaacag aggaagttgt cttgaaaact 2280
ggtgatttac aaccattaga acaacctact agtgaagctg ttgaagctcc attggttggt 2340
acaccagttt gtattaacgg gcttatgttg ctcgaaatca aagacacaga aaagtactgt 2400
gcccttgcac ctaatatgat ggtaacaaac aataccttca cactcaaagg cggtgcacca 2460
acaaaggtta cttttggtga tgacactgtg atagaagtgc aaggttacaa gagtgtgaat 2520
atcacttttg aacttgatga aaggattgat aaagtactta atgagaagtg ctctgcctat 2580
acagttgaac tcggtacaga agtaaatgag ttcgcctgtg ttgtggcaga tgctgtcata 2640
aaaactttgc aaccagtatc tgaattactt acaccactgg gcattgattt agatgagtgg 2700
agtatggcta catactactt atttgatgag tctggtgagt ttaaattggc ttcacatatg 2760
tattgttctt tttaccctcc agatgaggat gaagaagaag gtgattgtga agaagaagag 2820
tttgagccat caactcaata tgagtatggt actgaagatg attaccaagg taaacctttg 2880
gaatttggtg ccacttctgc tgctcttcaa cctgaagaag agcaagaaga agattggtta 2940
gatgatgata gtcaacaaac tgttggtcaa caagacggca gtgaggacaa tcagacaact 3000
actattcaaa caattgttga ggttcaacct caattagaga tggaacttac accagttgtt 3060
cagactattg aagtgaatag ttttagtggt tatttaaaac ttactgacaa tgtatacatt 3120
aaaaatgcag acattgtgga agaagctaaa aaggtaaaac caacagtggt tgttaatgca 3180
gccaatgttt accttaaaca tggaggaggt gttgcaggag ccttaaataa ggctactaac 3240
aatgccatgc aagttgaatc tgatgattac atagctacta atggaccact taaagtgggt 3300
ggtagttgtg ttttaagcgg acacaatctt gctaaacact gtcttcatgt tgtcggccca 3360
aatgttaaca aaggtgaaga cattcaactt cttaagagtg cttatgaaaa ttttaatcag 3420
cacgaagttc tacttgcacc attattatca gctggtattt ttggtgctga ccctatacat 3480
tctttaagag tttgtgtaga tactgttcgc acaaatgtct acttagctgt ctttgataaa 3540
aatctctatg acaaacttgt ttcaagcttt ttggaaatga agagtgaaaa gcaagttgaa 3600
caaaagatcg ctgagattcc taaagaggaa gttaagccat ttataactga aagtaaacct 3660
tcagttgaac agagaaaaca agatgataag aaaatcaaag cttgtgttga agaagttaca 3720
acaactctgg aagaaactaa gttcctcaca gaaaacttgt tactttatat tgacattaat 3780
ggcaatcttc atccagattc tgccactctt gttagtgaca ttgacatcac tttcttaaag 3840
aaagatgctc catatatagt gggtgatgtt gttcaagagg gtgttttaac tgctgtggtt 3900
atacctacta aaaaggctgg tggcactact gaaatgctag cgaaagcttt gagaaaagtg 3960
ccaacagaca attatataac cacttacccg ggtcagggtt taaatggtta cactgtagag 4020
gaggcaaaga cagtgcttaa aaagtgtaaa agtgcctttt acattctacc atctattatc 4080
tctaatgaga agcaagaaat tcttggaact gtttcttgga atttgcgaga aatgcttgca 4140
catgcagaag aaacacgcaa attaatgcct gtctgtgtgg aaactaaagc catagtttca 4200
actatacagc gtaaatataa gggtattaaa atacaagagg gtgtggttga ttatggtgct 4260
agattttact tttacaccag taaaacaact gtagcgtcac ttatcaacac acttaacgat 4320
ctaaatgaaa ctcttgttac aatgccactt ggctatgtaa cacatggctt aaatttggaa 4380
gaagctgctc ggtatatgag atctctcaaa gtgccagcta cagtttctgt ttcttcacct 4440
gatgctgtta cagcgtataa tggttatctt acttcttctt ctaaaacacc tgaagaacat 4500
tttattgaaa ccatctcact tgctggttcc tataaagatt ggtcctattc tggacaatct 4560
acacaactag gtatagaatt tcttaagaga ggtgataaaa gtgtatatta cactagtaat 4620
cctaccacat tccacctaga tggtgaagtt atcacctttg acaatcttaa gacacttctt 4680
tctttgagag aagtgaggac tattaaggtg tttacaacag tagacaacat taacctccac 4740
acgcaagttg tggacatgtc aatgacatat ggacaacagt ttggtccaac ttatttggat 4800
ggagctgatg ttactaaaat aaaacctcat aattcacatg aaggtaaaac attttatgtt 4860
ttacctaatg atgacactct acgtgttgag gcttttgagt actaccacac aactgatcct 4920
agttttctgg gtaggtacat gtcagcatta aatcacacta aaaagtggaa atacccacaa 4980
gttaatggtt taacttctat taaatgggca gataacaact gttatcttgc cactgcattg 5040
ttaacactcc aacaaataga gttgaagttt aatccacctg ctctacaaga tgcttattac 5100
agagcaaggg ctggtgaagc tgctaacttt tgtgcactta tcttagccta ctgtaataag 5160
acagtaggtg agttaggtga tgttagagaa acaatgagtt acttgtttca acatgccaat 5220
ttagattctt gcaaaagagt cttgaacgtg gtgtgtaaaa cttgtggaca acagcagaca 5280
acccttaagg gtgtagaagc tgttatgtac atgggcacac tttcttatga acaatttaag 5340
aaaggtgttc agataccttg tacgtgtggt aaacaagcta caaaatatct agtacaacag 5400
gagtcacctt ttgttatgat gtcagcacca cctgctcagt atgaacttaa gcatggtaca 5460
tttacttgtg ctagtgagta cactggtaat taccagtgtg gtcactataa acatataact 5520
tctaaagaaa ctttgtattg catagacggt gctttactta caaagtcctc agaatacaaa 5580
ggtcctatta cggatgtttt ctacaaagaa aacagttaca caacaaccat aaaaccagtt 5640
acttataaat tggatggtgt tgtttgtaca gaaattgacc ctaagttgga caattattat 5700
aagaaagaca attcttattt cacagagcaa ccaattgatc ttgtaccaaa ccaaccatat 5760
ccaaacgcaa gcttcgataa ttttaagttt gtatgtgata atatcaaatt tgctgatgat 5820
ttaaaccagt taactggtta taagaaacct gcttcaagag agcttaaagt tacatttttc 5880
cctgacttaa atggtgatgt ggtggctatt gattataaac actacacacc ctcttttaag 5940
aaaggagcta aattgttaca taaacctatt gtttggcatg ttaacaatgc aactaataaa 6000
gccacgtata aaccaaatac ctggtgtata cgttgtcttt ggagcacaaa accagttgaa 6060
acatcaaatt cgtttgatgt actgaagtca gaggacgcgc agggaatgga taatcttgcc 6120
tgcgaagatc taaaaccagt ctctgaagaa gtagtggaaa atcctaccat acagaaagac 6180
gttcttgagt gtaatgtgaa aactaccgaa gttgtaggag acattatact taaaccagca 6240
aataatagtt taaaaattac agaagaggtt ggccacacag atctaatggc tgcttatgta 6300
gacaattcta gtcttactat taagaaacct aatgaattat ctagagtatt aggtttgaaa 6360
acccttgcta ctcatggttt agctgctgtt aatagtgtcc cttgggatac tatagctaat 6420
tatgctaagc cttttcttaa caaagttgtt agtacaacta ctaacatagt tacacggtgt 6480
ttaaaccgtg tttgtactaa ttatatgcct tatttcttta ctttattgct acaattgtgt 6540
acttttacta gaagtacaaa ttctagaatt aaagcatcta tgccgactac tatagcaaag 6600
aatactgtta agagtgtcgg taaattttgt ctagaggctt catttaatta tttgaagtca 6660
cctaattttt ctaaactgat aaatattata atttggtttt tactattaag tgtttgccta 6720
ggttctttaa tctactcaac cgctgcttta ggtgttttaa tgtctaattt aggcatgcct 6780
tcttactgta ctggttacag agaaggctat ttgaactcta ctaatgtcac tattgcaacc 6840
tactgtactg gttctatacc ttgtagtgtt tgtcttagtg gtttagattc tttagacacc 6900
tatccttctt tagaaactat acaaattacc atttcatctt ttaaatggga tttaactgct 6960
tttggcttag ttgcagagtg gtttttggca tatattcttt tcactaggtt tttctatgta 7020
cttggattgg ctgcaatcat gcaattgttt ttcagctatt ttgcagtaca ttttattagt 7080
aattcttggc ttatgtggtt aataattaat cttgtacaaa tggccccgat ttcagctatg 7140
gttagaatgt acatcttctt tgcatcattt tattatgtat ggaaaagtta tgtgcatgtt 7200
gtagacggtt gtaattcatc aacttgtatg atgtgttaca aacgtaatag agcaacaaga 7260
gtcgaatgta caactattgt taatggtgtt agaaggtcct tttatgtcta tgctaatgga 7320
ggtaaaggct tttgcaaact acacaattgg aattgtgtta attgtgatac attctgtgct 7380
ggtagtacat ttattagtga tgaagttgcg agagacttgt cactacagtt taaaagacca 7440
ataaatccta ctgaccagtc ttcttacatc gttgatagtg ttacagtgaa gaatggttcc 7500
atccatcttt actttgataa agctggtcaa aagacttatg aaagacattc tctctctcat 7560
tttgttaact tagacaacct gagagctaat aacactaaag gttcattgcc tattaatgtt 7620
atagtttttg atggtaaatc aaaatgtgaa gaatcatctg caaaatcagc gtctgtttac 7680
tacagtcagc ttatgtgtca acctatactg ttactagatc aggcattagt gtctgatgtt 7740
ggtgatagtg cggaagttgc agttaaaatg tttgatgctt acgttaatac gttttcatca 7800
acttttaacg taccaatgga aaaactcaaa acactagttg caactgcaga agctgaactt 7860
gcaaagaatg tgtccttaga caatgtctta tctactttta tttcagcagc tcggcaaggg 7920
tttgttgatt cagatgtaga aactaaagat gttgttgaat gtcttaaatt gtcacatcaa 7980
tctgacatag aagttactgg cgatagttgt aataactata tgctcaccta taacaaagtt 8040
gaaaacatga caccccgtga ccttggtgct tgtattgact gtagtgcgcg tcatattaat 8100
gcgcaggtag caaaaagtca caacattgct ttgatatgga acgttaaaga tttcatgtca 8160
ttgtctgaac aactacgaaa acaaatacgt agtgctgcta aaaagaataa cttacctttt 8220
aagttgacat gtgcaactac tagacaagtt gttaatgttg taacaacaaa gatagcactt 8280
aagggtggta aaattgttaa taattggttg aagcagttaa ttaaagttac acttgtgttc 8340
ctttttgttg ctgctatttt ctatttaata acacctgttc atgtcatgtc taaacatact 8400
gacttttcaa gtgaaatcat aggatacaag gctattgatg gtggtgtcac tcgtgacata 8460
gcatctacag atacttgttt tgctaacaaa catgctgatt ttgacacatg gtttagccag 8520
cgtggtggta gttatactaa tgacaaagct tgcccattga ttgctgcagt cataacaaga 8580
gaagtgggtt ttgtcgtgcc tggtttgcct ggcacgatat tacgcacaac taatggtgac 8640
tttttgcatt tcttacctag agtttttagt gcagttggta acatctgtta cacaccatca 8700
aaacttatag agtacactga ctttgcaaca tcagcttgtg ttttggctgc tgaatgtaca 8760
atttttaaag atgcttctgg taagccagta ccatattgtt atgataccaa tgtactagaa 8820
ggttctgttg cttatgaaag tttacgccct gacacacgtt atgtgctcat ggatggctct 8880
attattcaat ttcctaacac ctaccttgaa ggttctgtta gagtggtaac aacttttgat 8940
tctgagtact gtaggcacgg cacttgtgaa agatcagaag ctggtgtttg tgtatctact 9000
agtggtagat gggtacttaa caatgattat tacagatctt taccaggagt tttctgtggt 9060
gtagatgctg taaatttact tactaatatg tttacaccac taattcaacc tattggtgct 9120
ttggacatat cagcatctat agtagctggt ggtattgtag ctatcgtagt aacatgcctt 9180
gcctactatt ttatgaggtt tagaagagct tttggtgaat acagtcatgt agttgccttt 9240
aatactttac tattccttat gtcattcact gtactctgtt taacaccagt ttactcattc 9300
ttacctggtg tttattctgt tatttacttg tacttgacat tttatcttac taatgatgtt 9360
tcttttttag cacatattca gtggatggtt atgttcacac ctttagtacc tttctggata 9420
acaattgctt atatcatttg tatttccaca aagcatttct attggttctt tagtaattac 9480
ctaaagagac gtgtagtctt taatggtgtt tcctttagta cttttgaaga agctgcgctg 9540
tgcacctttt tgttaaataa agaaatgtat ctaaagttgc gtagtgatgt gctattacct 9600
cttacgcaat ataatagata cttagctctt tataataagt acaagtattt tagtggagca 9660
atggatacaa ctagctacag agaagctgct tgttgtcatc tcgcaaaggc tctcaatgac 9720
ttcagtaact caggttctga tgttctttac caaccaccac aaacctctat cacctcagct 9780
gttttgcaga gtggttttag aaaaatggca ttcccatctg gtaaagttga gggttgtatg 9840
gtacaagtaa cttgtggtac aactacactt aacggtcttt ggcttgatga cgtagtttac 9900
tgtccaagac atgtgatctg cacctctgaa gacatgctta accctaatta tgaagattta 9960
ctcattcgta agtctaatca taatttcttg gtacaggctg gtaatgttca actcagggtt 10020
attggacatt ctatgcaaaa ttgtgtactt aagcttaagg ttgatacagc caatcctaag 10080
acacctaagt ataagtttgt tcgcattcaa ccaggacaga ctttttcagt gttagcttgt 10140
tacaatggtt caccatctgg tgtttaccaa tgtgctatga ggcccaattt cactattaag 10200
ggttcattcc ttaatggttc atgtggtagt gttggtttta acatagatta tgactgtgtc 10260
tctttttgtt acatgcacca tatggaatta ccaactggag ttcatgctgg cacagactta 10320
gaaggtaact tttatggacc ttttgttgac aggcaaacag cacaagcagc tggtacggac 10380
acaactatta cagttaatgt tttagcttgg ttgtacgctg ctgttataaa tggagacagg 10440
tggtttctca atcgatttac cacaactctt aatgacttta accttgtggc tatgaagtac 10500
aattatgaac ctctaacaca agaccatgtt gacatactag gacctctttc tgctcaaact 10560
ggaattgccg ttttagatat gtgtgcttca ttaaaagaat tactgcaaaa tggtatgaat 10620
ggacgtacca tattgggtag tgctttatta gaagatgaat ttacaccttt tgatgttgtt 10680
agacaatgct caggtgttac tttccaaagt gcagtgaaaa gaacaatcaa gggtacacac 10740
cactggttgt tactcacaat tttgacttca cttttagttt tagtccagag tactcaatgg 10800
tctttgttct tttttttgta tgaaaatgcc tttttacctt ttgctatggg tattattgct 10860
atgtctgctt ttgcaatgat gtttgtcaaa cataagcatg catttctctg tttgtttttg 10920
ttaccttctc ttgccactgt agcttatttt aatatggtct atatgcctgc tagttgggtg 10980
atgcgtatta tgacatggtt ggatatggtt gatactagtt tgtctggttt taagctaaaa 11040
gactgtgtta tgtatgcatc agctgtagtg ttactaatcc ttatgacagc aagaactgtg 11100
tatgatgatg gtgctaggag agtgtggaca cttatgaatg tcttgacact cgtttataaa 11160
gtttattatg gtaatgcttt agatcaagcc atttccatgt gggctcttat aatctctgtt 11220
acttctaact actcaggtgt agttacaact gtcatgtttt tggccagagg tattgttttt 11280
atgtgtgttg agtattgccc tattttcttc ataactggta atacacttca gtgtataatg 11340
ctagtttatt gtttcttagg ctatttttgt acttgttact ttggcctctt ttgtttactc 11400
aaccgctact ttagactgac tcttggtgtt tatgattact tagtttctac acaggagttt 11460
agatatatga attcacaggg actactccca cccaagaata gcatagatgc cttcaaactc 11520
aacattaaat tgttgggtgt tggtggcaaa ccttgtatca aagtagccac tgtacagtct 11580
aaaatgtcag atgtaaagtg cacatcagta gtcttactct cagttttgca acaactcaga 11640
gtagaatcat catctaaatt gtgggctcaa tgtgtccagt tacacaatga cattctctta 11700
gctaaagata ctactgaagc ctttgaaaaa atggtttcac tactttctgt tttgctttcc 11760
atgcagggtg ctgtagacat aaacaagctt tgtgaagaaa tgctggacaa cagggcaacc 11820
ttacaagcta tagcctcaga gtttagttcc cttccatcat atgcagcttt tgctactgct 11880
caagaagctt atgagcaggc tgttgctaat ggtgattctg aagttgttct taaaaagttg 11940
aagaagtctt tgaatgtggc taaatctgaa tttgaccgtg atgcagccat gcaacgtaag 12000
ttggaaaaga tggctgatca agctatgacc caaatgtata aacaggctag atctgaggac 12060
aagagggcaa aagttactag tgctatgcag acaatgcttt tcactatgct tagaaagttg 12120
gataatgatg cactcaacaa cattatcaac aatgcaagag atggttgtgt tcccttgaac 12180
ataatacctc ttacaacagc agccaaacta atggttgtca taccagacta taacacatat 12240
aaaaatacgt gtgatggtac aacatttact tatgcatcag cattgtggga aatccaacag 12300
gttgtagatg cagatagtaa aattgttcaa cttagtgaaa ttagtatgga caattcacct 12360
aatttagcat ggcctcttat tgtaacagct ttaagggcca attctgctgt caaattacag 12420
aataatgagc ttagtcctgt tgcactacga cagatgtctt gtgctgccgg tactacacaa 12480
actgcttgca ctgatgacaa tgcgttagct tactacaaca caacaaaggg aggtaggttt 12540
gtacttgcac tgttatccga tttacaggat ttgaaatggg ctagattccc taagagtgat 12600
ggaactggta ctatctatac agaactggaa ccaccttgta ggtttgttac agacacacct 12660
aaaggtccta aagtgaagta tttatacttt attaaaggat taaacaacct aaatagaggt 12720
atggtacttg gtagtttagc tgccacagta cgtctacaag ctggtaatgc aacagaagtg 12780
cctgccaatt caactgtatt atctttctgt gcttttgctg tagatgctgc taaagcttac 12840
aaagattatc tagctagtgg gggacaacca atcactaatt gtgttaagat gttgtgtaca 12900
cacactggta ctggtcaggc aataacagtt acaccggaag ccaatatgga tcaagaatcc 12960
tttggtggtg catcgtgttg tctgtactgc cgttgccaca tagatcatcc aaatcctaaa 13020
ggattttgtg acttaaaagg taagtatgta caaataccta caacttgtgc taatgaccct 13080
gtgggtttta cacttaaaaa cacagtctgt accgtctgcg gtatgtggaa aggttatggc 13140
tgtagttgtg atcaactccg cgaacccatg cttcagtcag ctgatgcaca atcgttttta 13200
aaccgggttt gcggtgtaag tgcagcccgt cttacaccgt gcggcacagg cactagtact 13260
gatgtcgtat acagggcttt tgacatctac aatgataaag tagctggttt tgctaaattc 13320
ctaaaaacta attgttgtcg cttccaagaa aaggatgaag atgacaattt aattgattct 13380
tactttgtag ttaagagaca cactttctct aactaccaac atgaagaaac aatttataat 13440
ttacttaagg attgtccagc tgttgctaaa catgacttct ttaagtttag aatagacggt 13500
gacatggtac cacatatatc acgtcaacgt cttactaaat acacaatggc agacctcgtc 13560
tatgctttaa ggcattttga tgaaggtaat tgtgacacat taaaagaaat acttgtcaca 13620
tacaattgtt gtgatgatga ttatttcaat aaaaaggact ggtatgattt tgtagaaaac 13680
ccagatatat tacgcgtata cgccaactta ggtgaacgtg tacgccaagc tttgttaaaa 13740
acagtacaat tctgtgatgc catgcgaaat gctggtattg ttggtgtact gacattagat 13800
aatcaagatc tcaatggtaa ctggtatgat ttcggtgatt tcatacaaac cacgccaggt 13860
agtggagttc ctgttgtaga ttcttattat tcattgttaa tgcctatatt aaccttgacc 13920
agggctttaa ctgcagagtc acatgttgac actgacttaa caaagcctta cattaagtgg 13980
gatttgttaa aatatgactt cacggaagag aggttaaaac tctttgaccg ttattttaaa 14040
tattgggatc agacatacca cccaaattgt gttaactgtt tggatgacag atgcattctg 14100
cattgtgcaa actttaatgt tttattctct acagtgttcc cacttacaag ttttggacca 14160
ctagtgagaa aaatatttgt tgatggtgtt ccatttgtag tttcaactgg ataccacttc 14220
agagagctag gtgttgtaca taatcaggat gtaaacttac atagctctag acttagtttt 14280
aaggaattac ttgtgtatgc tgctgaccct gctatgcacg ctgcttctgg taatctatta 14340
ctagataaac gcactacgtg cttttcagta gctgcactta ctaacaatgt tgcttttcaa 14400
actgtcaaac ccggtaattt taacaaagac ttctatgact ttgctgtgtc taagggtttc 14460
tttaaggaag gaagttctgt tgaattaaaa cacttcttct ttgctcagga tggtaatgct 14520
gctatcagcg attatgacta ctatcgttat aatctaccaa caatgtgtga tatcagacaa 14580
ctactatttg tagttgaagt tgttgataag tactttgatt gttacgatgg tggctgtatt 14640
aatgctaacc aagtcatcgt caacaaccta gacaaatcag ctggttttcc atttaataaa 14700
tggggtaagg ctagacttta ttatgattca atgagttatg aggatcaaga tgcacttttc 14760
gcatatacaa aacgtaatgt catccctact ataactcaaa tgaatcttaa gtatgccatt 14820
agtgcaaaga atagagctcg caccgtagct ggtgtctcta tctgtagtac tatgaccaat 14880
agacagtttc atcaaaaatt attgaaatca atagccgcca ctagaggagc tactgtagta 14940
attggaacaa gcaaattcta tggtggttgg cacaacatgt taaaaactgt ttatagtgat 15000
gtagaaaacc ctcaccttat gggttgggat tatcctaaat gtgatagagc catgcctaac 15060
atgcttagaa ttatggcctc acttgttctt gctcgcaaac atacaacgtg ttgtagcttg 15120
tcacaccgtt tctatagatt agctaatgag tgtgctcaag tattgagtga aatggtcatg 15180
tgtggcggtt cactatatgt taaaccaggt ggaacctcat caggagatgc cacaactgct 15240
tatgctaata gtgtttttaa catttgtcaa gctgtcacgg ccaatgttaa tgcactttta 15300
tctactgatg gtaacaaaat tgccgataag tatgtccgca atttacaaca cagactttat 15360
gagtgtctct atagaaatag agatgttgac acagactttg tgaatgagtt ttacgcatat 15420
ttgcgtaaac atttctcaat gatgatactc tctgacgatg ctgttgtgtg tttcaatagc 15480
acttatgcat ctcaaggtct agtggctagc ataaagaact ttaagtcagt tctttattat 15540
caaaacaatg tttttatgtc tgaagcaaaa tgttggactg agactgacct tactaaagga 15600
cctcatgaat tttgctctca acatacaatg ctagttaaac agggtgatga ttatgtgtac 15660
cttccttacc cagatccatc aagaatccta ggggccggct gttttgtaga tgatatcgta 15720
aaaacagatg gtacacttat gattgaacgg ttcgtgtctt tagctataga tgcttaccca 15780
cttactaaac atcctaatca ggagtatgct gatgtctttc atttgtactt acaatacata 15840
agaaagctac atgatgagtt aacaggacac atgttagaca tgtattctgt tatgcttact 15900
aatgataaca cttcaaggta ttgggaacct gagttttatg aggctatgta cacaccgcat 15960
acagtcttac aggctgttgg ggcttgtgtt ctttgcaatt cacagacttc attaagatgt 16020
ggtgcttgca tacgtagacc attcttatgt tgtaaatgct gttacgacca tgtcatatca 16080
acatcacata aattagtctt gtctgttaat ccgtatgttt gcaatgctcc aggttgtgat 16140
gtcacagatg tgactcaact ttacttagga ggtatgagct attattgtaa atcacataaa 16200
ccacccatta gttttccatt gtgtgctaat ggacaagttt ttggtttata taaaaataca 16260
tgtgttggta gcgataatgt tactgacttt aatgcaattg caacatgtga ctggacaaat 16320
gctggtgatt acattttagc taacacctgt actgaaagac tcaagctttt tgcagcagaa 16380
acgctcaaag ctactgagga gacatttaaa ctgtcttatg gtattgctac tgtacgtgaa 16440
gtgctgtctg acagagaatt acatctttca tgggaagttg gtaaacctag accaccactt 16500
aaccgaaatt atgtctttac tggttatcgt gtaactaaaa acagtaaagt acaaatagga 16560
gagtacacct ttgaaaaagg tgactatggt gatgctgttg tttaccgagg tacaacaact 16620
tacaaattaa atgttggtga ttattttgtg ctgacatcac atacagtaat gccattaagt 16680
gcacctacac tagtgccaca agagcactat gttagaatta ctggcttata cccaacactc 16740
aatatctcag atgagttttc tagcaatgtt gcaaattatc aaaaggttgg tatgcaaaag 16800
tattctacac tccagggacc acctggtact ggtaagagtc attttgctat tggcctagct 16860
ctctactacc cttctgctcg catagtgtat acagcttgct ctcatgccgc tgttgatgca 16920
ctatgtgaga aggcattaaa atatttgcct atagataaat gtagtagaat tatacctgca 16980
cgtgctcgtg tagagtgttt tgataaattc aaagtgaatt caacattaga acagtatgtc 17040
ttttgtactg taaatgcatt gcctgagacg acagcagata tagttgtctt tgatgaaatt 17100
tcaatggcca caaattatga tttgagtgtt gtcaatgcca gattacgtgc taagcactat 17160
gtgtacattg gcgaccctgc tcaattacct gcaccacgca cattgctaac taagggcaca 17220
ctagaaccag aatatttcaa ttcagtgtgt agacttatga aaactatagg tccagacatg 17280
ttcctcggaa cttgtcggcg ttgtcctgct gaaattgttg acactgtgag tgctttggtt 17340
tatgataata agcttaaagc acataaagac aaatcagctc aatgctttaa aatgttttat 17400
aagggtgtta tcacgcatga tgtttcatct gcaattaaca ggccacaaat aggcgtggta 17460
agagaattcc ttacacgtaa ccctgcttgg agaaaagctg tctttatttc accttataat 17520
tcacagaatg ctgtagcctc aaagattttg ggactaccaa ctcaaactgt tgattcatca 17580
cagggctcag aatatgacta tgtcatattc actcaaacca ctgaaacagc tcactcttgt 17640
aatgtaaaca gatttaatgt tgctattacc agagcaaaag taggcatact ttgcataatg 17700
tctgatagag acctttatga caagttgcaa tttacaagtc ttgaaattcc acgtaggaat 17760
gtggcaactt tacaagctga aaatgtaaca ggactcttta aagattgtag taaggtaatc 17820
actgggttac atcctacaca ggcacctaca cacctcagtg ttgacactaa attcaaaact 17880
gaaggtttat gtgttgacat acctggcata cctaaggaca tgacctatag aagactcatc 17940
tctatgatgg gttttaaaat gaattatcaa gttaatggtt accctaacat gtttatcacc 18000
cgcgaagaag ctataagaca tgtacgtgca tggattggct tcgatgtcga ggggtgtcat 18060
gctactagag aagctgttgg taccaattta cctttacagc taggtttttc tacaggtgtt 18120
aacctagttg ctgtacctac aggttatgtt gatacaccta ataatacaga tttttccaga 18180
gttagtgcta aaccaccgcc tggagatcaa tttaaacacc tcataccact tatgtacaaa 18240
ggacttcctt ggaatgtagt gcgtataaag attgtacaaa tgttaagtga cacacttaaa 18300
aatctctctg acagagtcgt atttgtctta tgggcacatg gctttgagtt gacatctatg 18360
aagtattttg tgaaaatagg acctgagcgc acctgttgtc tatgtgatag acgtgccaca 18420
tgcttttcca ctgcttcaga cacttatgcc tgttggcatc attctattgg atttgattac 18480
gtctataatc cgtttatgat tgatgttcaa caatggggtt ttacaggtaa cctacaaagc 18540
aaccatgatc tgtattgtca agtccatggt aatgcacatg tagctagttg tgatgcaatc 18600
atgactaggt gtctagctgt ccacgagtgc tttgttaagc gtgttgactg gactattgaa 18660
tatcctataa ttggtgatga actgaagatt aatgcggctt gtagaaaggt tcaacacatg 18720
gttgttaaag ctgcattatt agcagacaaa ttcccagttc ttcacgacat tggtaaccct 18780
aaagctatta agtgtgtacc tcaagctgat gtagaatgga agttctatga tgcacagcct 18840
tgtagtgaca aagcttataa aatagaagaa ttattctatt cttatgccac acattctgac 18900
aaattcacag atggtgtatg cctattttgg aattgcaatg tcgatagata tcctgctaat 18960
tccattgttt gtagatttga cactagagtg ctatctaacc ttaacttgcc tggttgtgat 19020
ggtggcagtt tgtatgtaaa taaacatgca ttccacacac cagcttttga taaaagtgct 19080
tttgttaatt taaaacaatt accatttttc tattactctg acagtccatg tgagtctcat 19140
ggaaaacaag tagtgtcaga tatagattat gtaccactaa agtctgctac gtgtataaca 19200
cgttgcaatt taggtggtgc tgtctgtaga catcatgcta atgagtacag attgtatctc 19260
gatgcttata acatgatgat ctcagctggc tttagcttgt gggtttacaa acaatttgat 19320
acttataacc tctggaacac ttttacaaga cttcagagtt tagaaaatgt ggcttttaat 19380
gttgtaaata agggacactt tgatggacaa cagggtgaag taccagtttc tatcattaat 19440
aacactgttt acacaaaagt tgatggtgtt gatgtagaat tgtttgaaaa taaaacaaca 19500
ttacctgtta atgtagcatt tgagctttgg gctaagcgca acattaaacc agtaccagag 19560
gtgaaaatac tcaataattt gggtgtggac attgctgcta atactgtgat ctgggactac 19620
aaaagagatg ctccagcaca tatatctact attggtgttt gttctatgac tgacatagcc 19680
aagaaaccaa ctgaaacgat ttgtgcacca ctcactgtct tttttgatgg tagagttgat 19740
ggtcaagtag acttatttag aaatgcccgt aatggtgttc ttattacaga aggtagtgtt 19800
aaaggtttac aaccatctgt aggtcccaaa caagctagtc ttaatggagt cacattaatt 19860
ggagaagccg taaaaacaca gttcaattat tataagaaag ttgatggtgt tgtccaacaa 19920
ttacctgaaa cttactttac tcagagtaga aatttacaag aatttaaacc caggagtcaa 19980
atggaaattg atttcttaga attagctatg gatgaattca ttgaacggta taaattagaa 20040
ggctatgcct tcgaacatat cgtttatgga gattttagtc atagtcagtt aggtggttta 20100
catctactga ttggactagc taaacgtttt aaggaatcac cttttgaatt agaagatttt 20160
attcctatgg acagtacagt taaaaactat ttcataacag atgcgcaaac aggttcatct 20220
aagtgtgtgt gttctgttat tgatttatta cttgatgatt ttgttgaaat aataaaatcc 20280
caagatttat ctgtagtttc taaggttgtc aaagtgacta ttgactatac agaaatttca 20340
tttatgcttt ggtgtaaaga tggccatgta gaaacatttt acccaaaatt acaatctagt 20400
caagcgtggc aaccgggtgt tgctatgcct aatctttaca aaatgcaaag aatgctatta 20460
gaaaagtgtg accttcaaaa ttatggtgat agtgcaacat tacctaaagg cataatgatg 20520
aatgtcgcaa aatatactca actgtgtcaa tatttaaaca cattaacatt agctgtaccc 20580
tataatatga gagttataca ttttggtgct ggttctgata aaggagttgc accaggtaca 20640
gctgttttaa gacagtggtt gcctacgggt acgctgcttg tcgattcaga tcttaatgac 20700
tttgtctctg atgcagattc aactttgatt ggtgattgtg caactgtaca tacagctaat 20760
aaatgggatc tcattattag tgatatgtac gaccctaaga ctaaaaatgt tacaaaagaa 20820
aatgactcta aagagggttt tttcacttac atttgtgggt ttatacaaca aaagctagct 20880
cttggaggtt ccgtggctat aaagataaca gaacattctt ggaatgctga tctttataag 20940
ctcatgggac acttcgcatg gtggacagcc tttgttacta atgtgaatgc gtcatcatct 21000
gaagcatttt taattggatg taattatctt ggcaaaccac gcgaacaaat agatggttat 21060
gtcatgcatg caaattacat attttggagg aatacaaatc caattcagtt gtcttcctat 21120
tctttatttg acatgagtaa atttcccctt aaattaaggg gtactgctgt tatgtcttta 21180
aaagaaggtc aaatcaatga tatgatttta tctcttctta gtaaaggtag acttataatt 21240
agagaaaaca acagagttgt tatttctagt gatgttcttg ttaacaacta a 21291
<210> 314
<211> 13218
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 314
atggagagcc ttgtccctgg tttcaacgag aaaacacacg tccaactcag tttgcctgtt 60
ttacaggttc gcgacgtgct cgtacgtggc tttggagact ccgtggagga ggtcttatca 120
gaggcacgtc aacatcttaa agatggcact tgtggcttag tagaagttga aaaaggcgtt 180
ttgcctcaac ttgaacagcc ctatgtgttc atcaaacgtt cggatgctcg aactgcacct 240
catggtcatg ttatggttga gctggtagca gaactcgaag gcattcagta cggtcgtagt 300
ggtgagacac ttggtgtcct tgtccctcat gtgggcgaaa taccagtggc ttaccgcaag 360
gttcttcttc gtaagaacgg taataaagga gctggtggcc atagttacgg cgccgatcta 420
aagtcatttg acttaggcga cgagcttggc actgatcctt atgaagattt tcaagaaaac 480
tggaacacta aacatagcag tggtgttacc cgtgaactca tgcgtgagct taacggaggg 540
gcatacactc gctatgtcga taacaacttc tgtggccctg atggctaccc tcttgagtgc 600
attaaagacc ttctagcacg tgctggtaaa gcttcatgca ctttgtccga acaactggac 660
tttattgaca ctaagagggg tgtatactgc tgccgtgaac atgagcatga aattgcttgg 720
tacacggaac gttctgaaaa gagctatgaa ttgcagacac cttttgaaat taaattggca 780
aagaaatttg acaccttcaa tggggaatgt ccaaattttg tatttccctt aaattccata 840
atcaagacta ttcaaccaag ggttgaaaag aaaaagcttg atggctttat gggtagaatt 900
cgatctgtct atccagttgc gtcaccaaat gaatgcaacc aaatgtgcct ttcaactctc 960
atgaagtgtg atcattgtgg tgaaacttca tggcagacgg gcgattttgt taaagccact 1020
tgcgaatttt gtggcactga gaatttgact aaagaaggtg ccactacttg tggttactta 1080
ccccaaaatg ctgttgttaa aatttattgt ccagcatgtc acaattcaga agtaggacct 1140
gagcatagtc ttgccgaata ccataatgaa tctggcttga aaaccattct tcgtaagggt 1200
ggtcgcacta ttgcctttgg aggctgtgtg ttctcttatg ttggttgcca taacaagtgt 1260
gcctattggg ttccacgtgc tagcgctaac ataggttgta accatacagg tgttgttgga 1320
gaaggttccg aaggtcttaa tgacaacctt cttgaaatac tccaaaaaga gaaagtcaac 1380
atcaatattg ttggtgactt taaacttaat gaagagatcg ccattatttt ggcatctttt 1440
tctgcttcca caagtgcttt tgtggaaact gtgaaaggtt tggattataa agcattcaaa 1500
caaattgttg aatcctgtgg taattttaaa gttacaaaag gaaaagctaa aaaaggtgcc 1560
tggaatattg gtgaacagaa atcaatactg agtcctcttt atgcatttgc atcagaggct 1620
gctcgtgttg tacgatcaat tttctcccgc actcttgaaa ctgctcaaaa ttctgtgcgt 1680
gttttacaga aggccgctat aacaatacta gatggaattt cacagtattc actgagactc 1740
attgatgcta tgatgttcac atctgatttg gctactaaca atctagttgt aatggcctac 1800
attacaggtg gtgttgttca gttgacttcg cagtggctaa ctaacatctt tggcactgtt 1860
tatgaaaaac tcaaacccgt ccttgattgg cttgaagaga agtttaagga aggtgtagag 1920
tttcttagag acggttggga aattgttaaa tttatctcaa cctgtgcttg tgaaattgtc 1980
ggtggacaaa ttgtcacctg tgcaaaggaa attaaggaga gtgttcagac attctttaag 2040
cttgtaaata aatttttggc tttgtgtgct gactctatca ttattggtgg agctaaactt 2100
aaagccttga atttaggtga aacatttgtc acgcactcaa agggattgta cagaaagtgt 2160
gttaaatcca gagaagaaac tggcctactc atgcctctaa aagccccaaa agaaattatc 2220
ttcttagagg gagaaacact tcccacagaa gtgttaacag aggaagttgt cttgaaaact 2280
ggtgatttac aaccattaga acaacctact agtgaagctg ttgaagctcc attggttggt 2340
acaccagttt gtattaacgg gcttatgttg ctcgaaatca aagacacaga aaagtactgt 2400
gcccttgcac ctaatatgat ggtaacaaac aataccttca cactcaaagg cggtgcacca 2460
acaaaggtta cttttggtga tgacactgtg atagaagtgc aaggttacaa gagtgtgaat 2520
atcacttttg aacttgatga aaggattgat aaagtactta atgagaagtg ctctgcctat 2580
acagttgaac tcggtacaga agtaaatgag ttcgcctgtg ttgtggcaga tgctgtcata 2640
aaaactttgc aaccagtatc tgaattactt acaccactgg gcattgattt agatgagtgg 2700
agtatggcta catactactt atttgatgag tctggtgagt ttaaattggc ttcacatatg 2760
tattgttctt tttaccctcc agatgaggat gaagaagaag gtgattgtga agaagaagag 2820
tttgagccat caactcaata tgagtatggt actgaagatg attaccaagg taaacctttg 2880
gaatttggtg ccacttctgc tgctcttcaa cctgaagaag agcaagaaga agattggtta 2940
gatgatgata gtcaacaaac tgttggtcaa caagacggca gtgaggacaa tcagacaact 3000
actattcaaa caattgttga ggttcaacct caattagaga tggaacttac accagttgtt 3060
cagactattg aagtgaatag ttttagtggt tatttaaaac ttactgacaa tgtatacatt 3120
aaaaatgcag acattgtgga agaagctaaa aaggtaaaac caacagtggt tgttaatgca 3180
gccaatgttt accttaaaca tggaggaggt gttgcaggag ccttaaataa ggctactaac 3240
aatgccatgc aagttgaatc tgatgattac atagctacta atggaccact taaagtgggt 3300
ggtagttgtg ttttaagcgg acacaatctt gctaaacact gtcttcatgt tgtcggccca 3360
aatgttaaca aaggtgaaga cattcaactt cttaagagtg cttatgaaaa ttttaatcag 3420
cacgaagttc tacttgcacc attattatca gctggtattt ttggtgctga ccctatacat 3480
tctttaagag tttgtgtaga tactgttcgc acaaatgtct acttagctgt ctttgataaa 3540
aatctctatg acaaacttgt ttcaagcttt ttggaaatga agagtgaaaa gcaagttgaa 3600
caaaagatcg ctgagattcc taaagaggaa gttaagccat ttataactga aagtaaacct 3660
tcagttgaac agagaaaaca agatgataag aaaatcaaag cttgtgttga agaagttaca 3720
acaactctgg aagaaactaa gttcctcaca gaaaacttgt tactttatat tgacattaat 3780
ggcaatcttc atccagattc tgccactctt gttagtgaca ttgacatcac tttcttaaag 3840
aaagatgctc catatatagt gggtgatgtt gttcaagagg gtgttttaac tgctgtggtt 3900
atacctacta aaaaggctgg tggcactact gaaatgctag cgaaagcttt gagaaaagtg 3960
ccaacagaca attatataac cacttacccg ggtcagggtt taaatggtta cactgtagag 4020
gaggcaaaga cagtgcttaa aaagtgtaaa agtgcctttt acattctacc atctattatc 4080
tctaatgaga agcaagaaat tcttggaact gtttcttgga atttgcgaga aatgcttgca 4140
catgcagaag aaacacgcaa attaatgcct gtctgtgtgg aaactaaagc catagtttca 4200
actatacagc gtaaatataa gggtattaaa atacaagagg gtgtggttga ttatggtgct 4260
agattttact tttacaccag taaaacaact gtagcgtcac ttatcaacac acttaacgat 4320
ctaaatgaaa ctcttgttac aatgccactt ggctatgtaa cacatggctt aaatttggaa 4380
gaagctgctc ggtatatgag atctctcaaa gtgccagcta cagtttctgt ttcttcacct 4440
gatgctgtta cagcgtataa tggttatctt acttcttctt ctaaaacacc tgaagaacat 4500
tttattgaaa ccatctcact tgctggttcc tataaagatt ggtcctattc tggacaatct 4560
acacaactag gtatagaatt tcttaagaga ggtgataaaa gtgtatatta cactagtaat 4620
cctaccacat tccacctaga tggtgaagtt atcacctttg acaatcttaa gacacttctt 4680
tctttgagag aagtgaggac tattaaggtg tttacaacag tagacaacat taacctccac 4740
acgcaagttg tggacatgtc aatgacatat ggacaacagt ttggtccaac ttatttggat 4800
ggagctgatg ttactaaaat aaaacctcat aattcacatg aaggtaaaac attttatgtt 4860
ttacctaatg atgacactct acgtgttgag gcttttgagt actaccacac aactgatcct 4920
agttttctgg gtaggtacat gtcagcatta aatcacacta aaaagtggaa atacccacaa 4980
gttaatggtt taacttctat taaatgggca gataacaact gttatcttgc cactgcattg 5040
ttaacactcc aacaaataga gttgaagttt aatccacctg ctctacaaga tgcttattac 5100
agagcaaggg ctggtgaagc tgctaacttt tgtgcactta tcttagccta ctgtaataag 5160
acagtaggtg agttaggtga tgttagagaa acaatgagtt acttgtttca acatgccaat 5220
ttagattctt gcaaaagagt cttgaacgtg gtgtgtaaaa cttgtggaca acagcagaca 5280
acccttaagg gtgtagaagc tgttatgtac atgggcacac tttcttatga acaatttaag 5340
aaaggtgttc agataccttg tacgtgtggt aaacaagcta caaaatatct agtacaacag 5400
gagtcacctt ttgttatgat gtcagcacca cctgctcagt atgaacttaa gcatggtaca 5460
tttacttgtg ctagtgagta cactggtaat taccagtgtg gtcactataa acatataact 5520
tctaaagaaa ctttgtattg catagacggt gctttactta caaagtcctc agaatacaaa 5580
ggtcctatta cggatgtttt ctacaaagaa aacagttaca caacaaccat aaaaccagtt 5640
acttataaat tggatggtgt tgtttgtaca gaaattgacc ctaagttgga caattattat 5700
aagaaagaca attcttattt cacagagcaa ccaattgatc ttgtaccaaa ccaaccatat 5760
ccaaacgcaa gcttcgataa ttttaagttt gtatgtgata atatcaaatt tgctgatgat 5820
ttaaaccagt taactggtta taagaaacct gcttcaagag agcttaaagt tacatttttc 5880
cctgacttaa atggtgatgt ggtggctatt gattataaac actacacacc ctcttttaag 5940
aaaggagcta aattgttaca taaacctatt gtttggcatg ttaacaatgc aactaataaa 6000
gccacgtata aaccaaatac ctggtgtata cgttgtcttt ggagcacaaa accagttgaa 6060
acatcaaatt cgtttgatgt actgaagtca gaggacgcgc agggaatgga taatcttgcc 6120
tgcgaagatc taaaaccagt ctctgaagaa gtagtggaaa atcctaccat acagaaagac 6180
gttcttgagt gtaatgtgaa aactaccgaa gttgtaggag acattatact taaaccagca 6240
aataatagtt taaaaattac agaagaggtt ggccacacag atctaatggc tgcttatgta 6300
gacaattcta gtcttactat taagaaacct aatgaattat ctagagtatt aggtttgaaa 6360
acccttgcta ctcatggttt agctgctgtt aatagtgtcc cttgggatac tatagctaat 6420
tatgctaagc cttttcttaa caaagttgtt agtacaacta ctaacatagt tacacggtgt 6480
ttaaaccgtg tttgtactaa ttatatgcct tatttcttta ctttattgct acaattgtgt 6540
acttttacta gaagtacaaa ttctagaatt aaagcatcta tgccgactac tatagcaaag 6600
aatactgtta agagtgtcgg taaattttgt ctagaggctt catttaatta tttgaagtca 6660
cctaattttt ctaaactgat aaatattata atttggtttt tactattaag tgtttgccta 6720
ggttctttaa tctactcaac cgctgcttta ggtgttttaa tgtctaattt aggcatgcct 6780
tcttactgta ctggttacag agaaggctat ttgaactcta ctaatgtcac tattgcaacc 6840
tactgtactg gttctatacc ttgtagtgtt tgtcttagtg gtttagattc tttagacacc 6900
tatccttctt tagaaactat acaaattacc atttcatctt ttaaatggga tttaactgct 6960
tttggcttag ttgcagagtg gtttttggca tatattcttt tcactaggtt tttctatgta 7020
cttggattgg ctgcaatcat gcaattgttt ttcagctatt ttgcagtaca ttttattagt 7080
aattcttggc ttatgtggtt aataattaat cttgtacaaa tggccccgat ttcagctatg 7140
gttagaatgt acatcttctt tgcatcattt tattatgtat ggaaaagtta tgtgcatgtt 7200
gtagacggtt gtaattcatc aacttgtatg atgtgttaca aacgtaatag agcaacaaga 7260
gtcgaatgta caactattgt taatggtgtt agaaggtcct tttatgtcta tgctaatgga 7320
ggtaaaggct tttgcaaact acacaattgg aattgtgtta attgtgatac attctgtgct 7380
ggtagtacat ttattagtga tgaagttgcg agagacttgt cactacagtt taaaagacca 7440
ataaatccta ctgaccagtc ttcttacatc gttgatagtg ttacagtgaa gaatggttcc 7500
atccatcttt actttgataa agctggtcaa aagacttatg aaagacattc tctctctcat 7560
tttgttaact tagacaacct gagagctaat aacactaaag gttcattgcc tattaatgtt 7620
atagtttttg atggtaaatc aaaatgtgaa gaatcatctg caaaatcagc gtctgtttac 7680
tacagtcagc ttatgtgtca acctatactg ttactagatc aggcattagt gtctgatgtt 7740
ggtgatagtg cggaagttgc agttaaaatg tttgatgctt acgttaatac gttttcatca 7800
acttttaacg taccaatgga aaaactcaaa acactagttg caactgcaga agctgaactt 7860
gcaaagaatg tgtccttaga caatgtctta tctactttta tttcagcagc tcggcaaggg 7920
tttgttgatt cagatgtaga aactaaagat gttgttgaat gtcttaaatt gtcacatcaa 7980
tctgacatag aagttactgg cgatagttgt aataactata tgctcaccta taacaaagtt 8040
gaaaacatga caccccgtga ccttggtgct tgtattgact gtagtgcgcg tcatattaat 8100
gcgcaggtag caaaaagtca caacattgct ttgatatgga acgttaaaga tttcatgtca 8160
ttgtctgaac aactacgaaa acaaatacgt agtgctgcta aaaagaataa cttacctttt 8220
aagttgacat gtgcaactac tagacaagtt gttaatgttg taacaacaaa gatagcactt 8280
aagggtggta aaattgttaa taattggttg aagcagttaa ttaaagttac acttgtgttc 8340
ctttttgttg ctgctatttt ctatttaata acacctgttc atgtcatgtc taaacatact 8400
gacttttcaa gtgaaatcat aggatacaag gctattgatg gtggtgtcac tcgtgacata 8460
gcatctacag atacttgttt tgctaacaaa catgctgatt ttgacacatg gtttagccag 8520
cgtggtggta gttatactaa tgacaaagct tgcccattga ttgctgcagt cataacaaga 8580
gaagtgggtt ttgtcgtgcc tggtttgcct ggcacgatat tacgcacaac taatggtgac 8640
tttttgcatt tcttacctag agtttttagt gcagttggta acatctgtta cacaccatca 8700
aaacttatag agtacactga ctttgcaaca tcagcttgtg ttttggctgc tgaatgtaca 8760
atttttaaag atgcttctgg taagccagta ccatattgtt atgataccaa tgtactagaa 8820
ggttctgttg cttatgaaag tttacgccct gacacacgtt atgtgctcat ggatggctct 8880
attattcaat ttcctaacac ctaccttgaa ggttctgtta gagtggtaac aacttttgat 8940
tctgagtact gtaggcacgg cacttgtgaa agatcagaag ctggtgtttg tgtatctact 9000
agtggtagat gggtacttaa caatgattat tacagatctt taccaggagt tttctgtggt 9060
gtagatgctg taaatttact tactaatatg tttacaccac taattcaacc tattggtgct 9120
ttggacatat cagcatctat agtagctggt ggtattgtag ctatcgtagt aacatgcctt 9180
gcctactatt ttatgaggtt tagaagagct tttggtgaat acagtcatgt agttgccttt 9240
aatactttac tattccttat gtcattcact gtactctgtt taacaccagt ttactcattc 9300
ttacctggtg tttattctgt tatttacttg tacttgacat tttatcttac taatgatgtt 9360
tcttttttag cacatattca gtggatggtt atgttcacac ctttagtacc tttctggata 9420
acaattgctt atatcatttg tatttccaca aagcatttct attggttctt tagtaattac 9480
ctaaagagac gtgtagtctt taatggtgtt tcctttagta cttttgaaga agctgcgctg 9540
tgcacctttt tgttaaataa agaaatgtat ctaaagttgc gtagtgatgt gctattacct 9600
cttacgcaat ataatagata cttagctctt tataataagt acaagtattt tagtggagca 9660
atggatacaa ctagctacag agaagctgct tgttgtcatc tcgcaaaggc tctcaatgac 9720
ttcagtaact caggttctga tgttctttac caaccaccac aaacctctat cacctcagct 9780
gttttgcaga gtggttttag aaaaatggca ttcccatctg gtaaagttga gggttgtatg 9840
gtacaagtaa cttgtggtac aactacactt aacggtcttt ggcttgatga cgtagtttac 9900
tgtccaagac atgtgatctg cacctctgaa gacatgctta accctaatta tgaagattta 9960
ctcattcgta agtctaatca taatttcttg gtacaggctg gtaatgttca actcagggtt 10020
attggacatt ctatgcaaaa ttgtgtactt aagcttaagg ttgatacagc caatcctaag 10080
acacctaagt ataagtttgt tcgcattcaa ccaggacaga ctttttcagt gttagcttgt 10140
tacaatggtt caccatctgg tgtttaccaa tgtgctatga ggcccaattt cactattaag 10200
ggttcattcc ttaatggttc atgtggtagt gttggtttta acatagatta tgactgtgtc 10260
tctttttgtt acatgcacca tatggaatta ccaactggag ttcatgctgg cacagactta 10320
gaaggtaact tttatggacc ttttgttgac aggcaaacag cacaagcagc tggtacggac 10380
acaactatta cagttaatgt tttagcttgg ttgtacgctg ctgttataaa tggagacagg 10440
tggtttctca atcgatttac cacaactctt aatgacttta accttgtggc tatgaagtac 10500
aattatgaac ctctaacaca agaccatgtt gacatactag gacctctttc tgctcaaact 10560
ggaattgccg ttttagatat gtgtgcttca ttaaaagaat tactgcaaaa tggtatgaat 10620
ggacgtacca tattgggtag tgctttatta gaagatgaat ttacaccttt tgatgttgtt 10680
agacaatgct caggtgttac tttccaaagt gcagtgaaaa gaacaatcaa gggtacacac 10740
cactggttgt tactcacaat tttgacttca cttttagttt tagtccagag tactcaatgg 10800
tctttgttct tttttttgta tgaaaatgcc tttttacctt ttgctatggg tattattgct 10860
atgtctgctt ttgcaatgat gtttgtcaaa cataagcatg catttctctg tttgtttttg 10920
ttaccttctc ttgccactgt agcttatttt aatatggtct atatgcctgc tagttgggtg 10980
atgcgtatta tgacatggtt ggatatggtt gatactagtt tgtctggttt taagctaaaa 11040
gactgtgtta tgtatgcatc agctgtagtg ttactaatcc ttatgacagc aagaactgtg 11100
tatgatgatg gtgctaggag agtgtggaca cttatgaatg tcttgacact cgtttataaa 11160
gtttattatg gtaatgcttt agatcaagcc atttccatgt gggctcttat aatctctgtt 11220
acttctaact actcaggtgt agttacaact gtcatgtttt tggccagagg tattgttttt 11280
atgtgtgttg agtattgccc tattttcttc ataactggta atacacttca gtgtataatg 11340
ctagtttatt gtttcttagg ctatttttgt acttgttact ttggcctctt ttgtttactc 11400
aaccgctact ttagactgac tcttggtgtt tatgattact tagtttctac acaggagttt 11460
agatatatga attcacaggg actactccca cccaagaata gcatagatgc cttcaaactc 11520
aacattaaat tgttgggtgt tggtggcaaa ccttgtatca aagtagccac tgtacagtct 11580
aaaatgtcag atgtaaagtg cacatcagta gtcttactct cagttttgca acaactcaga 11640
gtagaatcat catctaaatt gtgggctcaa tgtgtccagt tacacaatga cattctctta 11700
gctaaagata ctactgaagc ctttgaaaaa atggtttcac tactttctgt tttgctttcc 11760
atgcagggtg ctgtagacat aaacaagctt tgtgaagaaa tgctggacaa cagggcaacc 11820
ttacaagcta tagcctcaga gtttagttcc cttccatcat atgcagcttt tgctactgct 11880
caagaagctt atgagcaggc tgttgctaat ggtgattctg aagttgttct taaaaagttg 11940
aagaagtctt tgaatgtggc taaatctgaa tttgaccgtg atgcagccat gcaacgtaag 12000
ttggaaaaga tggctgatca agctatgacc caaatgtata aacaggctag atctgaggac 12060
aagagggcaa aagttactag tgctatgcag acaatgcttt tcactatgct tagaaagttg 12120
gataatgatg cactcaacaa cattatcaac aatgcaagag atggttgtgt tcccttgaac 12180
ataatacctc ttacaacagc agccaaacta atggttgtca taccagacta taacacatat 12240
aaaaatacgt gtgatggtac aacatttact tatgcatcag cattgtggga aatccaacag 12300
gttgtagatg cagatagtaa aattgttcaa cttagtgaaa ttagtatgga caattcacct 12360
aatttagcat ggcctcttat tgtaacagct ttaagggcca attctgctgt caaattacag 12420
aataatgagc ttagtcctgt tgcactacga cagatgtctt gtgctgccgg tactacacaa 12480
actgcttgca ctgatgacaa tgcgttagct tactacaaca caacaaaggg aggtaggttt 12540
gtacttgcac tgttatccga tttacaggat ttgaaatggg ctagattccc taagagtgat 12600
ggaactggta ctatctatac agaactggaa ccaccttgta ggtttgttac agacacacct 12660
aaaggtccta aagtgaagta tttatacttt attaaaggat taaacaacct aaatagaggt 12720
atggtacttg gtagtttagc tgccacagta cgtctacaag ctggtaatgc aacagaagtg 12780
cctgccaatt caactgtatt atctttctgt gcttttgctg tagatgctgc taaagcttac 12840
aaagattatc tagctagtgg gggacaacca atcactaatt gtgttaagat gttgtgtaca 12900
cacactggta ctggtcaggc aataacagtt acaccggaag ccaatatgga tcaagaatcc 12960
tttggtggtg catcgtgttg tctgtactgc cgttgccaca tagatcatcc aaatcctaaa 13020
ggattttgtg acttaaaagg taagtatgta caaataccta caacttgtgc taatgaccct 13080
gtgggtttta cacttaaaaa cacagtctgt accgtctgcg gtatgtggaa aggttatggc 13140
tgtagttgtg atcaactccg cgaacccatg cttcagtcag ctgatgcaca atcgttttta 13200
aacgggtttg cggtgtaa 13218
<210> 315
<211> 3822
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 315
atgtttgttt ttcttgtttt attgccacta gtttctagtc agtgtgttaa tcttacaacc 60
agaactcaat taccccctgc atacactaat tctttcacac gtggtgttta ttaccctgac 120
aaagttttca gatcctcagt tttacattca actcaggact tgttcttacc tttcttttcc 180
aatgttactt ggttccatgc tatacatgtc tctgggacca atggtactaa gaggtttgat 240
aaccctgtcc taccatttaa tgatggtgtt tattttgctt ccactgagaa gtctaacata 300
ataagaggct ggatttttgg tactacttta gattcgaaga cccagtccct acttattgtt 360
aataacgcta ctaatgttgt tattaaagtc tgtgaatttc aattttgtaa tgatccattt 420
ttgggtgttt attaccacaa aaacaacaaa agttggatgg aaagtgagtt cagagtttat 480
tctagtgcga ataattgcac ttttgaatat gtctctcagc cttttcttat ggaccttgaa 540
ggaaaacagg gtaatttcaa aaatcttagg gaatttgtgt ttaagaatat tgatggttat 600
tttaaaatat attctaagca cacgcctatt aatttagtgc gtgatctccc tcagggtttt 660
tcggctttag aaccattggt agatttgcca ataggtatta acatcactag gtttcaaact 720
ttacttgctt tacatagaag ttatttgact cctggtgatt cttcttcagg ttggacagct 780
ggtgctgcag cttattatgt gggttatctt caacctagga cttttctatt aaaatataat 840
gaaaatggaa ccattacaga tgctgtagac tgtgcacttg accctctctc agaaacaaag 900
tgtacgttga aatccttcac tgtagaaaaa ggaatctatc aaacttctaa ctttagagtc 960
caaccaacag aatctattgt tagatttcct aatattacaa acttgtgccc ttttggtgaa 1020
gtttttaacg ccaccagatt tgcatctgtt tatgcttgga acaggaagag aatcagcaac 1080
tgtgttgctg attattctgt cctatataat tccgcatcat tttccacttt taagtgttat 1140
ggagtgtctc ctactaaatt aaatgatctc tgctttacta atgtctatgc agattcattt 1200
gtaattagag gtgatgaagt cagacaaatc gctccagggc aaactggaaa gattgctgat 1260
tataattata aattaccaga tgattttaca ggctgcgtta tagcttggaa ttctaacaat 1320
cttgattcta aggttggtgg taattataat tacctgtata gattgtttag gaagtctaat 1380
ctcaaacctt ttgagagaga tatttcaact gaaatctatc aggccggtag cacaccttgt 1440
aatggtgttg aaggttttaa ttgttacttt cctttacaat catatggttt ccaacccact 1500
aatggtgttg gttaccaacc atacagagta gtagtacttt cttttgaact tctacatgca 1560
ccagcaactg tttgtggacc taaaaagtct actaatttgg ttaaaaacaa atgtgtcaat 1620
ttcaacttca atggtttaac aggcacaggt gttcttactg agtctaacaa aaagtttctg 1680
cctttccaac aatttggcag agacattgct gacactactg atgctgtccg tgatccacag 1740
acacttgaga ttcttgacat tacaccatgt tcttttggtg gtgtcagtgt tataacacca 1800
ggaacaaata cttctaacca ggttgctgtt ctttatcagg gtgttaactg cacagaagtc 1860
cctgttgcta ttcatgcaga tcaacttact cctacttggc gtgtttattc tacaggttct 1920
aatgtttttc aaacacgtgc aggctgttta ataggggctg aacatgtcaa caactcatat 1980
gagtgtgaca tacccattgg tgcaggtata tgcgctagtt atcagactca gactaattct 2040
cctcggcggg cacgtagtgt agctagtcaa tccatcattg cctacactat gtcacttggt 2100
gcagaaaatt cagttgctta ctctaataac tctattgcca tacccacaaa ttttactatt 2160
agtgttacca cagaaattct accagtgtct atgaccaaga catcagtaga ttgtacaatg 2220
tacatttgtg gtgattcaac tgaatgcagc aatcttttgt tgcaatatgg cagtttttgt 2280
acacaattaa accgtgcttt aactggaata gctgttgaac aagacaaaaa cacccaagaa 2340
gtttttgcac aagtcaaaca aatttacaaa acaccaccaa ttaaagattt tggtggtttt 2400
aatttttcac aaatattacc agatccatca aaaccaagca agaggtcatt tattgaagat 2460
ctacttttca acaaagtgac acttgcagat gctggcttca tcaaacaata tggtgattgc 2520
cttggtgata ttgctgctag agacctcatt tgtgcacaaa agtttaacgg ccttactgtt 2580
ttgccacctt tgctcacaga tgaaatgatt gctcaataca cttctgcact gttagcgggt 2640
acaatcactt ctggttggac ctttggtgca ggtgctgcat tacaaatacc atttgctatg 2700
caaatggctt ataggtttaa tggtattgga gttacacaga atgttctcta tgagaaccaa 2760
aaattgattg ccaaccaatt taatagtgct attggcaaaa ttcaagactc actttcttcc 2820
acagcaagtg cacttggaaa acttcaagat gtggtcaacc aaaatgcaca agctttaaac 2880
acgcttgtta aacaacttag ctccaatttt ggtgcaattt caagtgtttt aaatgatatc 2940
ctttcacgtc ttgacaaagt tgaggctgaa gtgcaaattg ataggttgat cacaggcaga 3000
cttcaaagtt tgcagacata tgtgactcaa caattaatta gagctgcaga aatcagagct 3060
tctgctaatc ttgctgctac taaaatgtca gagtgtgtac ttggacaatc aaaaagagtt 3120
gatttttgtg gaaagggcta tcatcttatg tccttccctc agtcagcacc tcatggtgta 3180
gtcttcttgc atgtgactta tgtccctgca caagaaaaga acttcacaac tgctcctgcc 3240
atttgtcatg atggaaaagc acactttcct cgtgaaggtg tctttgtttc aaatggcaca 3300
cactggtttg taacacaaag gaatttttat gaaccacaaa tcattactac agacaacaca 3360
tttgtgtctg gtaactgtga tgttgtaata ggaattgtca acaacacagt ttatgatcct 3420
ttgcaacctg aattagactc attcaaggag gagttagata aatattttaa gaatcataca 3480
tcaccagatg ttgatttagg tgacatctct ggcattaatg cttcagttgt aaacattcaa 3540
aaagaaattg accgcctcaa tgaggttgcc aagaatttaa atgaatctct catcgatctc 3600
caagaacttg gaaagtatga gcagtatata aaatggccat ggtacatttg gctaggtttt 3660
atagctggct tgattgccat agtaatggtg acaattatgc tttgctgtat gaccagttgc 3720
tgtagttgtc tcaagggctg ttgttcttgt ggatcctgct gcaaatttga tgaagacgac 3780
tctgagccag tgctcaaagg agtcaaatta cattacacat aa 3822
<210> 316
<211> 828
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 316
atggatttgt ttatgagaat cttcacaatt ggaactgtaa ctttgaagca aggtgaaatc 60
aaggatgcta ctccttcaga ttttgttcgc gctactgcaa cgataccgat acaagcctca 120
ctccctttcg gatggcttat tgttggcgtt gcacttcttg ctgtttttca gagcgcttcc 180
aaaatcataa ccctcaaaaa gagatggcaa ctagcactct ccaagggtgt tcactttgtt 240
tgcaacttgc tgttgttgtt tgtaacagtt tactcacacc ttttgctcgt tgctgctggc 300
cttgaagccc cttttctcta tctttatgct ttagtctact tcttgcagag tataaacttt 360
gtaagaataa taatgaggct ttggctttgc tggaaatgcc gttccaaaaa cccattactt 420
tatgatgcca actattttct ttgctggcat actaattgtt acgactattg tataccttac 480
aatagtgtaa cttcttcaat tgtcattact tcaggtgatg gcacaacaag tcctatttct 540
gaacatgact accagattgg tggttatact gaaaaatggg aatctggagt aaaagactgt 600
gttgtattac acagttactt cacttcagac tattaccagc tgtactcaac tcaattgagt 660
acagacactg gtgttgaaca tgttaccttc ttcatctaca ataaaattgt tgatgagcct 720
gaagaacatg tccaaattca cacaatcgac ggttcatccg gagttgttaa tccagtaatg 780
gaaccaattt atgatgaacc gacgacgact actagcgtgc ctttgtaa 828
<210> 317
<211> 228
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 317
atgtactcat tcgtttcgga agagacaggt acgttaatag ttaatagcgt acttcttttt 60
cttgctttcg tggtattctt gctagttaca ctagccatcc ttactgcgct tcgattgtgt 120
gcgtactgct gcaatattgt taacgtgagt cttgtaaaac cttcttttta cgtttactct 180
cgtgttaaaa atctgaattc ttctagagtt cctgatcttc tggtctaa 228
<210> 318
<211> 669
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 318
atggcagatt ccaacggtac tattaccgtt gaagagctta aaaagctcct tgaacaatgg 60
aacctagtaa taggtttcct attccttaca tggatttgtc ttctacaatt tgcctatgcc 120
aacaggaata ggtttttgta tataattaag ttaattttcc tctggctgtt atggccagta 180
actttagctt gttttgtgct tgctgctgtt tacagaataa attggatcac cggtggaatt 240
gctatcgcaa tggcttgtct tgtaggcttg atgtggctca gctacttcat tgcttctttc 300
agactgtttg cgcgtacgcg ttccatgtgg tcattcaatc cagaaactaa cattcttctc 360
aacgtgccac tccatggcac tattctgacc agaccgcttc tagaaagtga actcgtaatc 420
ggagctgtga tccttcgtgg acatcttcgt attgctggac accatctagg acgctgtgac 480
atcaaggacc tgcctaaaga aatcactgtt gctacatcac gaacgctttc ttattacaaa 540
ttgggagctt cgcagcgtgt agcaggtgac tcaggttttg ctgcatacag tcgctacagg 600
attggcaact ataaattaaa cacagaccat tccagtagca gtgacaatat tgctttgctt 660
gtacagtaa 669
<210> 319
<211> 186
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 319
atgtttcatc tcgttgactt tcaggttact atagcagaga tattactaat tattatgagg 60
acttttaaag tttccatttg gaatcttgat tacatcataa acctcataat taaaaattta 120
tctaagtcac taactgagaa taaatattct caattagatg aagagcaacc aatggagatt 180
gattaa 186
<210> 320
<211> 366
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 320
atgaaaatta ttcttttctt ggcactgata acactcgcta cttgtgagct ttatcactac 60
caagagtgtg ttagaggtac aacagtactt ttaaaagaac cttgctcttc tggaacatac 120
gagggcaatt caccatttca tcctctagct gataacaaat ttgcactgac ttgctttagc 180
actcaatttg cttttgcttg tcctgacggc gtaaaacacg tctatcagtt acgtgccaga 240
tcagtttcac ctaaactgtt catcagacaa gaggaagttc aagaacttta ctctccaatt 300
tttcttattg ttgcggcaat agtgtttata acactttgct tcacactcaa aagaaagaca 360
gaatga 366
<210> 321
<211> 132
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 321
atgattgaac tttcattaat tgacttctat ttgtgctttt tagcctttct gctattcctt 60
gttttaatta tgcttattat cttttggttc tcacttgaac tgcaagatca taatgaaact 120
tgtcacgcct aa 132
<210> 322
<211> 366
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 322
atgaaatttc ttgttttctt aggaatcatc acaactgtag ctgcatttca ccaagaatgt 60
agtttacagt catgtactca acatcaacca tatgtagttg atgacccgtg tcctattcac 120
ttctattcta aatggtatat tagagtagga gctagaaaat cagcaccttt aattgaattg 180
tgcgtggatg aggctggttc taaatcaccc attcagtaca tcgatatcgg taattataca 240
gtttcctgtt taccttttac aattaattgc caggaaccta aattgggtag tcttgtagtg 300
cgttgttcgt tctatgaaga ctttttagag tatcatgacg ttcgtgttgt tttagatttc 360
atctaa 366
<210> 323
<211> 1260
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 323
atgtctgata atggacccca aaatcagcga aatgcacccc gcattacgtt tggtggaccc 60
tcagattcaa ctggcagtaa ccagaatgga gaacgcagtg gggcgcgatc aaaacaacgt 120
cggccccaag gtttacccaa taatactgcg tcttggttca ccgctctcac tcaacatggc 180
aaggaagacc ttaaattccc tcgaggacaa ggcgttccaa ttaacaccaa tagcagtcca 240
gatgaccaaa ttggctacta ccgaagagct accagacgaa ttcgtggtgg tgacggtaaa 300
atgaaagatc tcagtccaag atggtatttc tactacctag gaactgggcc agaagctgga 360
cttccctatg gtgctaacaa agacggcatc atatgggttg caactgaggg agccttgaat 420
acaccaaaag atcacattgg cacccgcaat cctgctaaca atgctgcaat cgtgctacaa 480
cttcctcaag gaacaacatt gccaaaaggc ttctacgcag aagggagcag aggcggcagt 540
caagcctctt ctcgttcctc atcacgtagt cgcaacagtt caagaaattc aactccaggc 600
agcagtaggg gaacttctcc tgctagaatg gctggcaatg gcggtgatgc tgctcttgct 660
ttgctgctgc ttgacagatt gaaccagctt gagagcaaaa tgtctggtaa aggccaacaa 720
caacaaggcc aaactgtcac taagaaatct gctgctgagg cttctaagaa gcctcggcaa 780
aaacgtactg ccactaaagc atacaatgta acacaagctt tcggcagacg tggtccagaa 840
caaacccaag gaaattttgg ggaccaggaa ctaatcagac aaggaactga ttacaaacat 900
tggccgcaaa ttgcacaatt tgcccccagc gcttcagcgt tcttcggaat gtcgcgcatt 960
ggcatggaag tcacaccttc gggaacgtgg ttgacctaca caggtgccat caaattggat 1020
gacaaagatc caaatttcaa agatcaagtc attttgctga ataagcatat tgacgcatac 1080
aaaacattcc caccaacaga gcctaaaaag gacaaaaaga agaaggctga tgaaactcaa 1140
gccttaccgc agagacagaa gaaacagcaa actgtgactc ttcttcctgc tgcagatttg 1200
gatgatttct ccaaacaatt gcaacaatcc atgagcagtg ctgactcaac tcaggcctaa 1260
<210> 324
<211> 117
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 324
atgggctata taaacgtttt cgcttttccg tttacgatat atagtctact cttgtgcaga 60
atgaattctc gtaactacat agcacaagta gatgtagtta actttaatct cacatag 117
<210> 325
<211> 21291
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 325
atggagagcc ttgtccctgg tttcaacgag aaaacacacg tccaactcag tttgcctgtt 60
ttacaggttc gcgacgtgct cgtacgtggc tttggagact ccgtggagga ggtcttatca 120
gaggcacgtc aacatcttaa agatggcact tgtggcttag tagaagttga aaaaggcgtt 180
ttgcctcaac ttgaacagcc ctatgtgttc atcaaacgtt cggatgctcg aactgcacct 240
catggtcatg ttatggttga gctggtagca gaactcgaag gcattcagta cggtcgtagt 300
ggtgagacac ttggtgtcct tgtccctcat gtgggcgaaa taccagtggc ttaccgcaag 360
gttcttcttc gtaagaacgg taataaagga gctggtggcc atagttacgg cgccgatcta 420
aagtcatttg acttaggcga cgagcttggc actgatcctt atgaagattt tcaagaaaac 480
tggaacacta aacatagcag tggtgttacc cgtgaactca tgcgtgagct taacggaggg 540
gcatacactc gctatgtcga taacaacttc tgtggccctg atggctaccc tcttgagtgc 600
attaaagacc ttctagcacg tgctggtaaa gcttcatgca ctttgtccga acaactggac 660
tttattgaca ctaagagggg tgtatactgc tgccgtgaac atgagcatga aattgcttgg 720
tacacggaac gttctgaaaa gagctatgaa ttgcagacac cttttgaaat taaattggca 780
aagaaatttg acaccttcaa tggggaatgt ccaaattttg tatttccctt aaattccata 840
atcaagacta ttcaaccaag ggttgaaaag aaaaagcttg atggctttat gggtagaatt 900
cgatctgtct atccagttgc gtcaccaaat gaatgcaacc aaatgtgcct ttcaactctc 960
atgaagtgtg atcattgtgg tgaaacttca tggcagacgg gcgattttgt taaagccact 1020
tgcgaatttt gtggcactga gaatttgact aaagaaggtg ccactacttg tggttactta 1080
ccccaaaatg ctgttgttaa aatttattgt ccagcatgtc acaattcaga agtaggacct 1140
gagcatagtc ttgccgaata ccataatgaa tctggcttga aaaccattct tcgtaagggt 1200
ggtcgcacta ttgcctttgg aggctgtgtg ttctcttatg ttggttgcca taacaagtgt 1260
gcctattggg ttccacgtgc tagcgctaac ataggttgta accatacagg tgttgttgga 1320
gaaggttccg aaggtcttaa tgacaacctt cttgaaatac tccaaaaaga gaaagtcaac 1380
atcaatattg ttggtgactt taaacttaat gaagagatcg ccattatttt ggcatctttt 1440
tctgcttcca caagtgcttt tgtggaaact gtgaaaggtt tggattataa agcattcaaa 1500
caaattgttg aatcctgtgg taattttaaa gttacaaaag gaaaagctaa aaaaggtgcc 1560
tggaatattg gtgaacagaa atcaatactg agtcctcttt atgcatttgc atcagaggct 1620
gctcgtgttg tacgatcaat tttctcccgc actcttgaaa ctgctcaaaa ttctgtgcgt 1680
gttttacaga aggccgctat aacaatacta gatggaattt cacagtattc actgagactc 1740
attgatgcta tgatgttcac atctgatttg gctactaaca atctagttgt aatggcctac 1800
attacaggtg gtgttgttca gttgacttcg cagtggctaa ctaacatctt tggcactgtt 1860
tatgaaaaac tcaaacccgt ccttgattgg cttgaagaga agtttaagga aggtgtagag 1920
tttcttagag acggttggga aattgttaaa tttatctcaa cctgtgcttg tgaaattgtc 1980
ggtggacaaa ttgtcacctg tgcaaaggaa attaaggaga gtgttcagac attctttaag 2040
cttgtaaata aatttttggc tttgtgtgct gactctatca ttattggtgg agctaaactt 2100
aaagccttga atttaggtga aacatttgtc acgcactcaa agggattgta cagaaagtgt 2160
gttaaatcca gagaagaaac tggcctactc atgcctctaa aagccccaaa agaaattatc 2220
ttcttagagg gagaaacact tcccacagaa gtgttaacag aggaagttgt cttgaaaact 2280
ggtgatttac aaccattaga acaacctact agtgaagctg ttgaagctcc attggttggt 2340
acaccagttt gtattaacgg gcttatgttg ctcgaaatca aagacacaga aaagtactgt 2400
gcccttgcac ctaatatgat ggtaacaaac aataccttca cactcaaagg cggtgcacca 2460
acaaaggtta cttttggtga tgacactgtg atagaagtgc aaggttacaa gagtgtgaat 2520
atcacttttg aacttgatga aaggattgat aaagtactta atgagaagtg ctctgcctat 2580
acagttgaac tcggtacaga agtaaatgag ttcgcctgtg ttgtggcaga tgctgtcata 2640
aaaactttgc aaccagtatc tgaattactt acaccactgg gcattgattt agatgagtgg 2700
agtatggcta catactactt atttgatgag tctggtgagt ttaaattggc ttcacatatg 2760
tattgttctt tttaccctcc agatgaggat gaagaagaag gtgattgtga agaagaagag 2820
tttgagccat caactcaata tgagtatggt actgaagatg attaccaagg taaacctttg 2880
gaatttggtg ccacttctgc tgctcttcaa cctgaagaag agcaagaaga agattggtta 2940
gatgatgata gtcaacaaac tgttggtcaa caagacggca gtgaggacaa tcagacaact 3000
actattcaaa caattgttga ggttcaacct caattagaga tggaacttac accagttgtt 3060
cagactattg aagtgaatag ttttagtggt tatttaaaac ttactgacaa tgtatacatt 3120
aaaaatgcag acattgtgga agaagctaaa aaggtaaaac caacagtggt tgttaatgca 3180
gccaatgttt accttaaaca tggaggaggt gttgcaggag ccttaaataa ggctactaac 3240
aatgccatgc aagttgaatc tgatgattac atagctacta atggaccact taaagtgggt 3300
ggtagttgtg ttttaagcgg acacaatctt gctaaacact gtcttcatgt tgtcggccca 3360
aatgttaaca aaggtgaaga cattcaactt cttaagagtg cttatgaaaa ttttaatcag 3420
cacgaagttc tacttgcacc attattatca gctggtattt ttggtgctga ccctatacat 3480
tctttaagag tttgtgtaga tactgttcgc acaaatgtct acttagctgt ctttgataaa 3540
aatctctatg acaaacttgt ttcaagcttt ttggaaatga agagtgaaaa gcaagttgaa 3600
caaaagatcg ctgagattcc taaagaggaa gttaagccat ttataactga aagtaaacct 3660
tcagttgaac agagaaaaca agatgataag aaaatcaaag cttgtgttga agaagttaca 3720
acaactctgg aagaaactaa gttcctcaca gaaaacttgt tactttatat tgacattaat 3780
ggcaatcttc atccagattc tgccactctt gttagtgaca ttgacatcac tttcttaaag 3840
aaagatgctc catatatagt gggtgatgtt gttcaagagg gtgttttaac tgctgtggtt 3900
atacctacta aaaaggctgg tggcactact gaaatgctag cgaaagcttt gagaaaagtg 3960
ccaacagaca attatataac cacttacccg ggtcagggtt taaatggtta cactgtagag 4020
gaggcaaaga cagtgcttaa aaagtgtaaa agtgcctttt acattctacc atctattatc 4080
tctaatgaga agcaagaaat tcttggaact gtttcttgga atttgcgaga aatgcttgca 4140
catgcagaag aaacacgcaa attaatgcct gtctgtgtgg aaactaaagc catagtttca 4200
actatacagc gtaaatataa gggtattaaa atacaagagg gtgtggttga ttatggtgct 4260
agattttact tttacaccag taaaacaact gtagcgtcac ttatcaacac acttaacgat 4320
ctaaatgaaa ctcttgttac aatgccactt ggctatgtaa cacatggctt aaatttggaa 4380
gaagctgctc ggtatatgag atctctcaaa gtgccagcta cagtttctgt ttcttcacct 4440
gatgctgtta cagcgtataa tggttatctt acttcttctt ctaaaacacc tgaagaacat 4500
tttattgaaa ccatctcact tgctggttcc tataaagatt ggtcctattc tggacaatct 4560
acacaactag gtatagaatt tcttaagaga ggtgataaaa gtgtatatta cactagtaat 4620
cctaccacat tccacctaga tggtgaagtt atcacctttg acaatcttaa gacacttctt 4680
tctttgagag aagtgaggac tattaaggtg tttacaacag tagacaacat taacctccac 4740
acgcaagttg tggacatgtc aatgacatat ggacaacagt ttggtccaac ttatttggat 4800
ggagctgatg ttactaaaat aaaacctcat aattcacatg aaggtaaaac attttatgtt 4860
ttacctaatg atgacactct acgtgttgag gcttttgagt actaccacac aactgatcct 4920
agttttctgg gtaggtacat gtcagcatta aatcacacta aaaagtggaa atacccacaa 4980
gttaatggtt taacttctat taaatgggca gataacaact gttatcttgc cactgcattg 5040
ttaacactcc aacaaataga gttgaagttt aatccacctg ctctacaaga tgcttattac 5100
agagcaaggg ctggtgaagc tgctaacttt tgtgcactta tcttagccta ctgtaataag 5160
acagtaggtg agttaggtga tgttagagaa acaatgagtt acttgtttca acatgccaat 5220
ttagattctt gcaaaagagt cttgaacgtg gtgtgtaaaa cttgtggaca acagcagaca 5280
acccttaagg gtgtagaagc tgttatgtac atgggcacac tttcttatga acaatttaag 5340
aaaggtgttc agataccttg tacgtgtggt aaacaagcta caaaatatct agtacaacag 5400
gagtcacctt ttgttatgat gtcagcacca cctgctcagt atgaacttaa gcatggtaca 5460
tttacttgtg ctagtgagta cactggtaat taccagtgtg gtcactataa acatataact 5520
tctaaagaaa ctttgtattg catagacggt gctttactta caaagtcctc agaatacaaa 5580
ggtcctatta cggatgtttt ctacaaagaa aacagttaca caacaaccat aaaaccagtt 5640
acttataaat tggatggtgt tgtttgtaca gaaattgacc ctaagttgga caattattat 5700
aagaaagaca attcttattt cacagagcaa ccaattgatc ttgtaccaaa ccaaccatat 5760
ccaaacgcaa gcttcgataa ttttaagttt gtatgtgata atatcaaatt tgctgatgat 5820
ttaaaccagt taactggtta taagaaacct gcttcaagag agcttaaagt tacatttttc 5880
cctgacttaa atggtgatgt ggtggctatt gattataaac actacacacc ctcttttaag 5940
aaaggagcta aattgttaca taaacctatt gtttggcatg ttaacaatgc aactaataaa 6000
gccacgtata aaccaaatac ctggtgtata cgttgtcttt ggagcacaaa accagttgaa 6060
acatcaaatt cgtttgatgt actgaagtca gaggacgcgc agggaatgga taatcttgcc 6120
tgcgaagatc taaaaccagt ctctgaagaa gtagtggaaa atcctaccat acagaaagac 6180
gttcttgagt gtaatgtgaa aactaccgaa gttgtaggag acattatact taaaccagca 6240
aataatagtt taaaaattac agaagaggtt ggccacacag atctaatggc tgcttatgta 6300
gacaattcta gtcttactat taagaaacct aatgaattat ctagagtatt aggtttgaaa 6360
acccttgcta ctcatggttt agctgctgtt aatagtgtcc cttgggatac tatagctaat 6420
tatgctaagc cttttcttaa caaagttgtt agtacaacta ctaacatagt tacacggtgt 6480
ttaaaccgtg tttgtactaa ttatatgcct tatttcttta ctttattgct acaattgtgt 6540
acttttacta gaagtacaaa ttctagaatt aaagcatcta tgccgactac tatagcaaag 6600
aatactgtta agagtgtcgg taaattttgt ctagaggctt catttaatta tttgaagtca 6660
cctaattttt ctaaactgat aaatattata atttggtttt tactattaag tgtttgccta 6720
ggttctttaa tctactcaac cgctgcttta ggtgttttaa tgtctaattt aggcatgcct 6780
tcttactgta ctggttacag agaaggctat ttgaactcta ctaatgtcac tattgcaacc 6840
tactgtactg gttctatacc ttgtagtgtt tgtcttagtg gtttagattc tttagacacc 6900
tatccttctt tagaaactat acaaattacc atttcatctt ttaaatggga tttaactgct 6960
tttggcttag ttgcagagtg gtttttggca tatattcttt tcactaggtt tttctatgta 7020
cttggattgg ctgcaatcat gcaattgttt ttcagctatt ttgcagtaca ttttattagt 7080
aattcttggc ttatgtggtt aataattaat cttgtacaaa tggccccgat ttcagctatg 7140
gttagaatgt acatcttctt tgcatcattt tattatgtat ggaaaagtta tgtgcatgtt 7200
gtagacggtt gtaattcatc aacttgtatg atgtgttaca aacgtaatag agcaacaaga 7260
gtcgaatgta caactattgt taatggtgtt agaaggtcct tttatgtcta tgctaatgga 7320
ggtaaaggct tttgcaaact acacaattgg aattgtgtta attgtgatac attctgtgct 7380
ggtagtacat ttattagtga tgaagttgcg agagacttgt cactacagtt taaaagacca 7440
ataaatccta ctgaccagtc ttcttacatc gttgatagtg ttacagtgaa gaatggttcc 7500
atccatcttt actttgataa agctggtcaa aagacttatg aaagacattc tctctctcat 7560
tttgttaact tagacaacct gagagctaat aacactaaag gttcattgcc tattaatgtt 7620
atagtttttg atggtaaatc aaaatgtgaa gaatcatctg caaaatcagc gtctgtttac 7680
tacagtcagc ttatgtgtca acctatactg ttactagatc aggcattagt gtctgatgtt 7740
ggtgatagtg cggaagttgc agttaaaatg tttgatgctt acgttaatac gttttcatca 7800
acttttaacg taccaatgga aaaactcaaa acactagttg caactgcaga agctgaactt 7860
gcaaagaatg tgtccttaga caatgtctta tctactttta tttcagcagc tcggcaaggg 7920
tttgttgatt cagatgtaga aactaaagat gttgttgaat gtcttaaatt gtcacatcaa 7980
tctgacatag aagttactgg cgatagttgt aataactata tgctcaccta taacaaagtt 8040
gaaaacatga caccccgtga ccttggtgct tgtattgact gtagtgcgcg tcatattaat 8100
gcgcaggtag caaaaagtca caacattgct ttgatatgga acgttaaaga tttcatgtca 8160
ttgtctgaac aactacgaaa acaaatacgt agtgctgcta aaaagaataa cttacctttt 8220
aagttgacat gtgcaactac tagacaagtt gttaatgttg taacaacaaa gatagcactt 8280
aagggtggta aaattgttaa taattggttg aagcagttaa ttaaagttac acttgtgttc 8340
ctttttgttg ctgctatttt ctatttaata acacctgttc atgtcatgtc taaacatact 8400
gacttttcaa gtgaaatcat aggatacaag gctattgatg gtggtgtcac tcgtgacata 8460
gcatctacag atacttgttt tgctaacaaa catgctgatt ttgacacatg gtttagccag 8520
cgtggtggta gttatactaa tgacaaagct tgcccattga ttgctgcagt cataacaaga 8580
gaagtgggtt ttgtcgtgcc tggtttgcct ggcacgatat tacgcacaac taatggtgac 8640
tttttgcatt tcttacctag agtttttagt gcagttggta acatctgtta cacaccatca 8700
aaacttatag agtacactga ctttgcaaca tcagcttgtg ttttggctgc tgaatgtaca 8760
atttttaaag atgcttctgg taagccagta ccatattgtt atgataccaa tgtactagaa 8820
ggttctgttg cttatgaaag tttacgccct gacacacgtt atgtgctcat ggatggctct 8880
attattcaat ttcctaacac ctaccttgaa ggttctgtta gagtggtaac aacttttgat 8940
tctgagtact gtaggcacgg cacttgtgaa agatcagaag ctggtgtttg tgtatctact 9000
agtggtagat gggtacttaa caatgattat tacagatctt taccaggagt tttctgtggt 9060
gtagatgctg taaatttact tactaatatg tttacaccac taattcaacc tattggtgct 9120
ttggacatat cagcatctat agtagctggt ggtattgtag ctatcgtagt aacatgcctt 9180
gcctactatt ttatgaggtt tagaagagct tttggtgaat acagtcatgt agttgccttt 9240
aatactttac tattccttat gtcattcact gtactctgtt taacaccagt ttactcattc 9300
ttacctggtg tttattctgt tatttacttg tacttgacat tttatcttac taatgatgtt 9360
tcttttttag cacatattca gtggatggtt atgttcacac ctttagtacc tttctggata 9420
acaattgctt atatcatttg tatttccaca aagcatttct attggttctt tagtaattac 9480
ctaaagagac gtgtagtctt taatggtgtt tcctttagta cttttgaaga agctgcgctg 9540
tgcacctttt tgttaaataa agaaatgtat ctaaagttgc gtagtgatgt gctattacct 9600
cttacgcaat ataatagata cttagctctt tataataagt acaagtattt tagtggagca 9660
atggatacaa ctagctacag agaagctgct tgttgtcatc tcgcaaaggc tctcaatgac 9720
ttcagtaact caggttctga tgttctttac caaccaccac aaacctctat cacctcagct 9780
gttttgcaga gtggttttag aaaaatggca ttcccatctg gtaaagttga gggttgtatg 9840
gtacaagtaa cttgtggtac aactacactt aacggtcttt ggcttgatga cgtagtttac 9900
tgtccaagac atgtgatctg cacctctgaa gacatgctta accctaatta tgaagattta 9960
ctcattcgta agtctaatca taatttcttg gtacaggctg gtaatgttca actcagggtt 10020
attggacatt ctatgcaaaa ttgtgtactt aagcttaagg ttgatacagc caatcctaag 10080
acacctaagt ataagtttgt tcgcattcaa ccaggacaga ctttttcagt gttagcttgt 10140
tacaatggtt caccatctgg tgtttaccaa tgtgctatga ggcccaattt cactattaag 10200
ggttcattcc ttaatggttc atgtggtagt gttggtttta acatagatta tgactgtgtc 10260
tctttttgtt acatgcacca tatggaatta ccaactggag ttcatgctgg cacagactta 10320
gaaggtaact tttatggacc ttttgttgac aggcaaacag cacaagcagc tggtacggac 10380
acaactatta cagttaatgt tttagcttgg ttgtacgctg ctgttataaa tggagacagg 10440
tggtttctca atcgatttac cacaactctt aatgacttta accttgtggc tatgaagtac 10500
aattatgaac ctctaacaca agaccatgtt gacatactag gacctctttc tgctcaaact 10560
ggaattgccg ttttagatat gtgtgcttca ttaaaagaat tactgcaaaa tggtatgaat 10620
ggacgtacca tattgggtag tgctttatta gaagatgaat ttacaccttt tgatgttgtt 10680
agacaatgct caggtgttac tttccaaagt gcagtgaaaa gaacaatcaa gggtacacac 10740
cactggttgt tactcacaat tttgacttca cttttagttt tagtccagag tactcaatgg 10800
tctttgttct tttttttgta tgaaaatgcc tttttacctt ttgctatggg tattattgct 10860
atgtctgctt ttgcaatgat gtttgtcaaa cataagcatg catttctctg tttgtttttg 10920
ttaccttctc ttgccactgt agcttatttt aatatggtct atatgcctgc tagttgggtg 10980
atgcgtatta tgacatggtt ggatatggtt gatactagtt tgtctggttt taagctaaaa 11040
gactgtgtta tgtatgcatc agctgtagtg ttactaatcc ttatgacagc aagaactgtg 11100
tatgatgatg gtgctaggag agtgtggaca cttatgaatg tcttgacact cgtttataaa 11160
gtttattatg gtaatgcttt agatcaagcc atttccatgt gggctcttat aatctctgtt 11220
acttctaact actcaggtgt agttacaact gtcatgtttt tggccagagg tattgttttt 11280
atgtgtgttg agtattgccc tattttcttc ataactggta atacacttca gtgtataatg 11340
ctagtttatt gtttcttagg ctatttttgt acttgttact ttggcctctt ttgtttactc 11400
aaccgctact ttagactgac tcttggtgtt tatgattact tagtttctac acaggagttt 11460
agatatatga attcacaggg actactccca cccaagaata gcatagatgc cttcaaactc 11520
aacattaaat tgttgggtgt tggtggcaaa ccttgtatca aagtagccac tgtacagtct 11580
aaaatgtcag atgtaaagtg cacatcagta gtcttactct cagttttgca acaactcaga 11640
gtagaatcat catctaaatt gtgggctcaa tgtgtccagt tacacaatga cattctctta 11700
gctaaagata ctactgaagc ctttgaaaaa atggtttcac tactttctgt tttgctttcc 11760
atgcagggtg ctgtagacat aaacaagctt tgtgaagaaa tgctggacaa cagggcaacc 11820
ttacaagcta tagcctcaga gtttagttcc cttccatcat atgcagcttt tgctactgct 11880
caagaagctt atgagcaggc tgttgctaat ggtgattctg aagttgttct taaaaagttg 11940
aagaagtctt tgaatgtggc taaatctgaa tttgaccgtg atgcagccat gcaacgtaag 12000
ttggaaaaga tggctgatca agctatgacc caaatgtata aacaggctag atctgaggac 12060
aagagggcaa aagttactag tgctatgcag acaatgcttt tcactatgct tagaaagttg 12120
gataatgatg cactcaacaa cattatcaac aatgcaagag atggttgtgt tcccttgaac 12180
ataatacctc ttacaacagc agccaaacta atggttgtca taccagacta taacacatat 12240
aaaaatacgt gtgatggtac aacatttact tatgcatcag cattgtggga aatccaacag 12300
gttgtagatg cagatagtaa aattgttcaa cttagtgaaa ttagtatgga caattcacct 12360
aatttagcat ggcctcttat tgtaacagct ttaagggcca attctgctgt caaattacag 12420
aataatgagc ttagtcctgt tgcactacga cagatgtctt gtgctgccgg tactacacaa 12480
actgcttgca ctgatgacaa tgcgttagct tactacaaca caacaaaggg aggtaggttt 12540
gtacttgcac tgttatccga tttacaggat ttgaaatggg ctagattccc taagagtgat 12600
ggaactggta ctatctatac agaactggaa ccaccttgta ggtttgttac agacacacct 12660
aaaggtccta aagtgaagta tttatacttt attaaaggat taaacaacct aaatagaggt 12720
atggtacttg gtagtttagc tgccacagta cgtctacaag ctggtaatgc aacagaagtg 12780
cctgccaatt caactgtatt atctttctgt gcttttgctg tagatgctgc taaagcttac 12840
aaagattatc tagctagtgg gggacaacca atcactaatt gtgttaagat gttgtgtaca 12900
cacactggta ctggtcaggc aataacagtt acaccggaag ccaatatgga tcaagaatcc 12960
tttggtggtg catcgtgttg tctgtactgc cgttgccaca tagatcatcc aaatcctaaa 13020
ggattttgtg acttaaaagg taagtatgta caaataccta caacttgtgc taatgaccct 13080
gtgggtttta cacttaaaaa cacagtctgt accgtctgcg gtatgtggaa aggttatggc 13140
tgtagttgtg atcaactccg cgaacccatg cttcagtcag ctgatgcaca atcgttttta 13200
aaccgggttt gcggtgtaag tgcagcccgt cttacaccgt gcggcacagg cactagtact 13260
gatgtcgtat acagggcttt tgacatctac aatgataaag tagctggttt tgctaaattc 13320
ctaaaaacta attgttgtcg cttccaagaa aaggacgaag atgacaattt aattgattct 13380
tactttgtag ttaagagaca cactttctct aactaccaac atgaagaaac aatttataat 13440
ttacttaagg attgtccagc tgttgctaaa catgacttct ttaagtttag aatagacggt 13500
gacatggtac cacatatatc acgtcaacgt cttactaaat acacaatggc agacctcgtc 13560
tatgctttaa ggcattttga tgaaggtaat tgtgacacat taaaagaaat acttgtcaca 13620
tacaattgtt gtgatgatga ttatttcaat aaaaaggact ggtatgattt tgtagaaaac 13680
ccagatatat tacgcgtata cgccaactta ggtgaacgtg tacgccaagc tttgttaaaa 13740
acagtacaat tctgtgatgc catgcgaaat gctggtattg ttggtgtact gacattagat 13800
aatcaagatc tcaatggtaa ctggtatgat ttcggtgatt tcatacaaac cacgccaggt 13860
agtggagttc ctgttgtaga ttcttattat tcattgttaa tgcctatatt aaccttgacc 13920
agggctttaa ctgcagagtc acatgttgac actgacttaa caaagcctta cattaagtgg 13980
gatttgttaa aatatgactt cacggaagag aggttaaaac tctttgaccg ttattttaaa 14040
tattgggatc agacatacca cccaaattgt gttaactgtt tggatgacag atgcattctg 14100
cattgtgcaa actttaatgt tttattctct acagtgttcc cacttacaag ttttggacca 14160
ctagtgagaa aaatatttgt tgatggtgtt ccatttgtag tttcaactgg ataccacttc 14220
agagagctag gtgttgtaca taatcaggat gtaaacttac atagctctag acttagtttt 14280
aaggaattac ttgtgtatgc tgctgaccct gctatgcacg ctgcttctgg taatctatta 14340
ctagataaac gcactacgtg cttttcagta gctgcactta ctaacaatgt tgcttttcaa 14400
actgtcaaac ccggtaattt taacaaagac ttctatgact ttgctgtgtc taagggtttc 14460
tttaaggaag gaagttctgt tgaattaaaa cacttcttct ttgctcagga tggtaatgct 14520
gctatcagcg attatgacta ctatcgttat aatctaccaa caatgtgtga tatcagacaa 14580
ctactatttg tagttgaagt tgttgataag tactttgatt gttacgatgg tggctgtatt 14640
aatgctaacc aagtcatcgt caacaaccta gacaaatcag ctggttttcc atttaataaa 14700
tggggtaagg ctagacttta ttatgattca atgagttatg aggatcaaga tgcacttttc 14760
gcatatacaa aacgtaatgt catccctact ataactcaaa tgaatcttaa gtatgccatt 14820
agtgcaaaga atagagctcg caccgtagct ggtgtctcta tctgtagtac tatgaccaat 14880
agacagtttc atcaaaaatt attgaaatca atagccgcca ctagaggagc tactgtagta 14940
attggaacaa gcaaattcta tggtggttgg cacaacatgt taaaaactgt ttatagtgat 15000
gtagaaaacc ctcaccttat gggttgggat tatcctaaat gtgatagagc catgcctaac 15060
atgcttagaa ttatggcctc acttgttctt gctcgcaaac atacaacgtg ttgtagcttg 15120
tcacaccgtt tctatagatt agctaatgag tgtgctcaag tattgagtga aatggtcatg 15180
tgtggcggtt cactatatgt taaaccaggt ggaacctcat caggagatgc cacaactgct 15240
tatgctaata gtgtttttaa catttgtcaa gctgtcacgg ccaatgttaa tgcactttta 15300
tctactgatg gtaacaaaat tgccgataag tatgtccgca atttacaaca cagactttat 15360
gagtgtctct atagaaatag agatgttgac acagactttg tgaatgagtt ttacgcatat 15420
ttgcgtaaac atttctcaat gatgatactc tctgacgatg ctgttgtgtg tttcaatagc 15480
acttatgcat ctcaaggtct agtggctagc ataaagaact ttaagtcagt tctttattat 15540
caaaacaatg tttttatgtc tgaagcaaaa tgttggactg agactgacct tactaaagga 15600
cctcatgaat tttgctctca acatacaatg ctagttaaac agggtgatga ttatgtgtac 15660
cttccttacc cagatccatc aagaatccta ggggccggct gttttgtaga tgatatcgta 15720
aaaacagatg gtacacttat gattgaacgg ttcgtgtctt tagctataga tgcttaccca 15780
cttactaaac atcctaatca ggagtatgct gatgtctttc atttgtactt acaatacata 15840
agaaagctac atgatgagtt aacaggacac atgttagaca tgtattctgt tatgcttact 15900
aatgataaca cttcaaggta ttgggaacct gagttttatg aggctatgta cacaccgcat 15960
acagtcttac aggctgttgg ggcttgtgtt ctttgcaatt cacagacttc attaagatgt 16020
ggtgcttgca tacgtagacc attcttatgt tgtaaatgct gttacgacca tgtcatatca 16080
acatcacata aattagtctt gtctgttaat ccgtatgttt gcaatgctcc aggttgtgat 16140
gtcacagatg tgactcaact ttacttagga ggtatgagct attattgtaa atcacataaa 16200
ccacccatta gttttccatt gtgtgctaat ggacaagttt ttggtttata taaaaataca 16260
tgtgttggta gcgataatgt tactgacttt aatgcaattg caacatgtga ctggacaaat 16320
gctggtgatt acattttagc taacacctgt actgaaagac tcaagctttt tgcagcagaa 16380
acgctcaaag ctactgagga gacatttaaa ctgtcttatg gtattgctac tgtacgtgaa 16440
gtgctgtctg acagagaatt acatctttca tgggaagttg gtaaacctag accaccactt 16500
aaccgaaatt atgtctttac tggttatcgt gtaactaaaa acagtaaagt acaaatagga 16560
gagtacacct ttgaaaaagg tgactatggt gatgctgttg tttaccgagg tacaacaact 16620
tacaaattaa atgttggtga ttattttgtg ctgacatcac atacagtaat gccattaagt 16680
gcacctacac tagtgccaca agagcactat gttagaatta ctggcttata cccaacactc 16740
aatatctcag atgagttttc tagcaatgtt gcaaattatc aaaaggttgg tatgcaaaag 16800
tattctacac tccagggacc acctggtact ggtaagagtc attttgctat tggcctagct 16860
ctctactacc cttctgctcg catagtgtat acagcttgct ctcatgccgc tgttgatgca 16920
ctatgtgaga aggcattaaa atatttgcct atagataaat gtagtagaat tatacctgca 16980
cgtgctcgtg tagagtgttt tgataaattc aaagtgaatt caacattaga acagtatgtc 17040
ttttgtactg taaatgcatt gcctgagacg acagcagata tagttgtctt tgatgaaatt 17100
tcaatggcca caaattatga tttgagtgtt gtcaatgcca gattacgtgc taagcactat 17160
gtgtacattg gcgaccctgc tcaattacct gcaccacgca cattgctaac taagggcaca 17220
ctagaaccag aatatttcaa ttcagtgtgt agacttatga aaactatagg tccagacatg 17280
ttcctcggaa cttgtcggcg ttgtcctgct gaaattgttg acactgtgag tgctttggtt 17340
tatgataata agcttaaagc acataaagac aaatcagctc aatgctttaa aatgttttat 17400
aagggtgtta tcacgcatga tgtttcatct gcaattaaca ggccacaaat aggcgtggta 17460
agagaattcc ttacacgtaa ccctgcttgg agaaaagctg tctttatttc accttataat 17520
tcacagaatg ctgtagcctc aaagattttg ggactaccaa ctcaaactgt tgattcatca 17580
cagggctcag aatatgacta tgtcatattc actcaaacca ctgaaacagc tcactcttgt 17640
aatgtaaaca gatttaatgt tgctattacc agagcaaaag taggcatact ttgcataatg 17700
tctgatagag acctttatga caagttgcaa tttacaagtc ttgaaattcc acgtaggaat 17760
gtggcaactt tacaagctga aaatgtaaca ggactcttta aagattgtag taaggtaatc 17820
actgggttac atcctacaca ggcacctaca cacctcagtg ttgacactaa attcaaaact 17880
gaaggtttat gtgttgacat acctggcata cctaaggaca tgacctatag aagactcatc 17940
tctatgatgg gttttaaaat gaattatcaa gttaatggtt accctaacat gtttatcacc 18000
cgcgaagaag ctataagaca tgtacgtgca tggattggct tcgatgtcga ggggtgtcat 18060
gctactagag aagctgttgg taccaattta cctttacagc taggtttttc tacaggtgtt 18120
aacctagttg ctgtacctac aggttatgtt gatacaccta ataatacaga tttttccaga 18180
gttagtgcta aaccaccgcc tggagatcaa tttaaacacc tcataccact tatgtacaaa 18240
ggacttcctt ggaatgtagt gcgtataaag attgtacaaa tgttaagtga cacacttaaa 18300
aatctctctg acagagtcgt atttgtctta tgggcacatg gctttgagtt gacatctatg 18360
aagtattttg tgaaaatagg acctgagcgc acctgttgtc tatgtgatag acgtgccaca 18420
tgcttttcca ctgcttcaga cacttatgcc tgttggcatc attctattgg atttgattac 18480
gtctataatc cgtttatgat tgatgttcaa caatggggtt ttacaggtaa cctacaaagc 18540
aaccatgatc tgtattgtca agtccatggt aatgcacatg tagctagttg tgatgcaatc 18600
atgactaggt gtctagctgt ccacgagtgc tttgttaagc gtgttgactg gactattgaa 18660
tatcctataa ttggtgatga actgaagatt aatgcggctt gtagaaaggt tcaacacatg 18720
gttgttaaag ctgcattatt agcagacaaa ttcccagttc ttcacgacat tggtaaccct 18780
aaagctatta agtgtgtacc tcaagctgat gtagaatgga agttctatga tgcacagcct 18840
tgtagtgaca aagcttataa aatagaagaa ttattctatt cttatgccac acattctgac 18900
aaattcacag atggtgtatg cctattttgg aattgcaatg tcgatagata tcctgctaat 18960
tccattgttt gtagatttga cactagagtg ctatctaacc ttaacttgcc tggttgtgat 19020
ggtggcagtt tgtatgtaaa taaacatgca ttccacacac cagcttttga taaaagtgct 19080
tttgttaatt taaaacaatt accatttttc tattactctg acagtccatg tgagtctcat 19140
ggaaaacaag tagtgtcaga tatagattat gtaccactaa agtctgctac gtgtataaca 19200
cgttgcaatt taggtggtgc tgtctgtaga catcatgcta atgagtacag attgtatctc 19260
gatgcttata acatgatgat ctcagctggc tttagcttgt gggtttacaa acaatttgat 19320
acttataacc tctggaacac ttttacaaga cttcagagtt tagaaaatgt ggcttttaat 19380
gttgtaaata agggacactt tgatggacaa cagggtgaag taccagtttc tatcattaat 19440
aacactgttt acacaaaagt tgatggtgtt gatgtagaat tgtttgaaaa taaaacaaca 19500
ttacctgtta atgtagcatt tgagctttgg gctaagcgca acattaaacc agtaccagag 19560
gtgaaaatac tcaataattt gggtgtggac attgctgcta atactgtgat ctgggactac 19620
aaaagagatg ctccagcaca tatatctact attggtgttt gttctatgac tgacatagcc 19680
aagaaaccaa ctgaaacgat ttgtgcacca ctcactgtct tttttgatgg tagagttgat 19740
ggtcaagtag acttatttag aaatgcccgt aatggtgttc ttattacaga aggtagtgtt 19800
aaaggtttac aaccatctgt aggtcccaaa caagctagtc ttaatggagt cacattaatt 19860
ggagaagccg taaaaacaca gttcaattat tataagaaag ttgatggtgt tgtccaacaa 19920
ttacctgaaa cttactttac tcagagtaga aatttacaag aatttaaacc caggagtcaa 19980
atggaaattg atttcttaga attagctatg gatgaattca ttgaacggta taaattagaa 20040
ggctatgcct tcgaacatat cgtttatgga gattttagtc atagtcagtt aggtggttta 20100
catctactga ttggactagc taaacgtttt aaggaatcac cttttgaatt agaagatttt 20160
attcctatgg acagtacagt taaaaactat ttcataacag atgcgcaaac aggttcatct 20220
aagtgtgtgt gttctgttat tgatttatta cttgatgatt ttgttgaaat aataaaatcc 20280
caagatttat ctgtagtttc taaggttgtc aaagtgacta ttgactatac agaaatttca 20340
tttatgcttt ggtgtaaaga tggccatgta gaaacatttt acccaaaatt acaatctagt 20400
caagcgtggc aaccgggtgt tgctatgcct aatctttaca aaatgcaaag aatgctatta 20460
gaaaagtgtg accttcaaaa ttatggtgat agtgcaacat tacctaaagg cataatgatg 20520
aatgtcgcaa aatatactca actgtgtcaa tatttaaaca cattaacatt agctgtaccc 20580
tataatatga gagttataca ttttggtgct ggttctgata aaggagttgc accaggtaca 20640
gctgttttaa gacagtggtt gcctacgggt acgctgcttg tcgattcaga tcttaatgac 20700
tttgtctctg atgcagattc aactttgatt ggtgattgtg caactgtaca tacagctaat 20760
aaatgggatc tcattattag tgatatgtac gaccctaaga ctaaaaatgt tacaaaagaa 20820
aatgactcta aagagggttt tttcacttac atttgtgggt ttatacaaca aaagctagct 20880
cttggaggtt ccgtggctat aaagataaca gaacattctt ggaatgctga tctttataag 20940
ctcatgggac acttcgcatg gtggacagcc tttgttacta atgtgaatgc gtcatcatct 21000
gaagcatttt taattggatg taattatctt ggcaaaccac gcgaacaaat agatggttat 21060
gtcatgcatg caaattacat attttggagg aatacaaatc caattcagtt gtcttcctat 21120
tctttatttg acatgagtaa atttcccctt aaattaaggg gtactgctgt tatgtcttta 21180
aaagaaggtc aaatcaatga tatgatttta tctcttctta gtaaaggtag acttataatt 21240
agagaaaaca acagagttgt tatttctagt gatgttcttg ttaacaacta a 21291
<210> 326
<211> 13218
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 326
atggagagcc ttgtccctgg tttcaacgag aaaacacacg tccaactcag tttgcctgtt 60
ttacaggttc gcgacgtgct cgtacgtggc tttggagact ccgtggagga ggtcttatca 120
gaggcacgtc aacatcttaa agatggcact tgtggcttag tagaagttga aaaaggcgtt 180
ttgcctcaac ttgaacagcc ctatgtgttc atcaaacgtt cggatgctcg aactgcacct 240
catggtcatg ttatggttga gctggtagca gaactcgaag gcattcagta cggtcgtagt 300
ggtgagacac ttggtgtcct tgtccctcat gtgggcgaaa taccagtggc ttaccgcaag 360
gttcttcttc gtaagaacgg taataaagga gctggtggcc atagttacgg cgccgatcta 420
aagtcatttg acttaggcga cgagcttggc actgatcctt atgaagattt tcaagaaaac 480
tggaacacta aacatagcag tggtgttacc cgtgaactca tgcgtgagct taacggaggg 540
gcatacactc gctatgtcga taacaacttc tgtggccctg atggctaccc tcttgagtgc 600
attaaagacc ttctagcacg tgctggtaaa gcttcatgca ctttgtccga acaactggac 660
tttattgaca ctaagagggg tgtatactgc tgccgtgaac atgagcatga aattgcttgg 720
tacacggaac gttctgaaaa gagctatgaa ttgcagacac cttttgaaat taaattggca 780
aagaaatttg acaccttcaa tggggaatgt ccaaattttg tatttccctt aaattccata 840
atcaagacta ttcaaccaag ggttgaaaag aaaaagcttg atggctttat gggtagaatt 900
cgatctgtct atccagttgc gtcaccaaat gaatgcaacc aaatgtgcct ttcaactctc 960
atgaagtgtg atcattgtgg tgaaacttca tggcagacgg gcgattttgt taaagccact 1020
tgcgaatttt gtggcactga gaatttgact aaagaaggtg ccactacttg tggttactta 1080
ccccaaaatg ctgttgttaa aatttattgt ccagcatgtc acaattcaga agtaggacct 1140
gagcatagtc ttgccgaata ccataatgaa tctggcttga aaaccattct tcgtaagggt 1200
ggtcgcacta ttgcctttgg aggctgtgtg ttctcttatg ttggttgcca taacaagtgt 1260
gcctattggg ttccacgtgc tagcgctaac ataggttgta accatacagg tgttgttgga 1320
gaaggttccg aaggtcttaa tgacaacctt cttgaaatac tccaaaaaga gaaagtcaac 1380
atcaatattg ttggtgactt taaacttaat gaagagatcg ccattatttt ggcatctttt 1440
tctgcttcca caagtgcttt tgtggaaact gtgaaaggtt tggattataa agcattcaaa 1500
caaattgttg aatcctgtgg taattttaaa gttacaaaag gaaaagctaa aaaaggtgcc 1560
tggaatattg gtgaacagaa atcaatactg agtcctcttt atgcatttgc atcagaggct 1620
gctcgtgttg tacgatcaat tttctcccgc actcttgaaa ctgctcaaaa ttctgtgcgt 1680
gttttacaga aggccgctat aacaatacta gatggaattt cacagtattc actgagactc 1740
attgatgcta tgatgttcac atctgatttg gctactaaca atctagttgt aatggcctac 1800
attacaggtg gtgttgttca gttgacttcg cagtggctaa ctaacatctt tggcactgtt 1860
tatgaaaaac tcaaacccgt ccttgattgg cttgaagaga agtttaagga aggtgtagag 1920
tttcttagag acggttggga aattgttaaa tttatctcaa cctgtgcttg tgaaattgtc 1980
ggtggacaaa ttgtcacctg tgcaaaggaa attaaggaga gtgttcagac attctttaag 2040
cttgtaaata aatttttggc tttgtgtgct gactctatca ttattggtgg agctaaactt 2100
aaagccttga atttaggtga aacatttgtc acgcactcaa agggattgta cagaaagtgt 2160
gttaaatcca gagaagaaac tggcctactc atgcctctaa aagccccaaa agaaattatc 2220
ttcttagagg gagaaacact tcccacagaa gtgttaacag aggaagttgt cttgaaaact 2280
ggtgatttac aaccattaga acaacctact agtgaagctg ttgaagctcc attggttggt 2340
acaccagttt gtattaacgg gcttatgttg ctcgaaatca aagacacaga aaagtactgt 2400
gcccttgcac ctaatatgat ggtaacaaac aataccttca cactcaaagg cggtgcacca 2460
acaaaggtta cttttggtga tgacactgtg atagaagtgc aaggttacaa gagtgtgaat 2520
atcacttttg aacttgatga aaggattgat aaagtactta atgagaagtg ctctgcctat 2580
acagttgaac tcggtacaga agtaaatgag ttcgcctgtg ttgtggcaga tgctgtcata 2640
aaaactttgc aaccagtatc tgaattactt acaccactgg gcattgattt agatgagtgg 2700
agtatggcta catactactt atttgatgag tctggtgagt ttaaattggc ttcacatatg 2760
tattgttctt tttaccctcc agatgaggat gaagaagaag gtgattgtga agaagaagag 2820
tttgagccat caactcaata tgagtatggt actgaagatg attaccaagg taaacctttg 2880
gaatttggtg ccacttctgc tgctcttcaa cctgaagaag agcaagaaga agattggtta 2940
gatgatgata gtcaacaaac tgttggtcaa caagacggca gtgaggacaa tcagacaact 3000
actattcaaa caattgttga ggttcaacct caattagaga tggaacttac accagttgtt 3060
cagactattg aagtgaatag ttttagtggt tatttaaaac ttactgacaa tgtatacatt 3120
aaaaatgcag acattgtgga agaagctaaa aaggtaaaac caacagtggt tgttaatgca 3180
gccaatgttt accttaaaca tggaggaggt gttgcaggag ccttaaataa ggctactaac 3240
aatgccatgc aagttgaatc tgatgattac atagctacta atggaccact taaagtgggt 3300
ggtagttgtg ttttaagcgg acacaatctt gctaaacact gtcttcatgt tgtcggccca 3360
aatgttaaca aaggtgaaga cattcaactt cttaagagtg cttatgaaaa ttttaatcag 3420
cacgaagttc tacttgcacc attattatca gctggtattt ttggtgctga ccctatacat 3480
tctttaagag tttgtgtaga tactgttcgc acaaatgtct acttagctgt ctttgataaa 3540
aatctctatg acaaacttgt ttcaagcttt ttggaaatga agagtgaaaa gcaagttgaa 3600
caaaagatcg ctgagattcc taaagaggaa gttaagccat ttataactga aagtaaacct 3660
tcagttgaac agagaaaaca agatgataag aaaatcaaag cttgtgttga agaagttaca 3720
acaactctgg aagaaactaa gttcctcaca gaaaacttgt tactttatat tgacattaat 3780
ggcaatcttc atccagattc tgccactctt gttagtgaca ttgacatcac tttcttaaag 3840
aaagatgctc catatatagt gggtgatgtt gttcaagagg gtgttttaac tgctgtggtt 3900
atacctacta aaaaggctgg tggcactact gaaatgctag cgaaagcttt gagaaaagtg 3960
ccaacagaca attatataac cacttacccg ggtcagggtt taaatggtta cactgtagag 4020
gaggcaaaga cagtgcttaa aaagtgtaaa agtgcctttt acattctacc atctattatc 4080
tctaatgaga agcaagaaat tcttggaact gtttcttgga atttgcgaga aatgcttgca 4140
catgcagaag aaacacgcaa attaatgcct gtctgtgtgg aaactaaagc catagtttca 4200
actatacagc gtaaatataa gggtattaaa atacaagagg gtgtggttga ttatggtgct 4260
agattttact tttacaccag taaaacaact gtagcgtcac ttatcaacac acttaacgat 4320
ctaaatgaaa ctcttgttac aatgccactt ggctatgtaa cacatggctt aaatttggaa 4380
gaagctgctc ggtatatgag atctctcaaa gtgccagcta cagtttctgt ttcttcacct 4440
gatgctgtta cagcgtataa tggttatctt acttcttctt ctaaaacacc tgaagaacat 4500
tttattgaaa ccatctcact tgctggttcc tataaagatt ggtcctattc tggacaatct 4560
acacaactag gtatagaatt tcttaagaga ggtgataaaa gtgtatatta cactagtaat 4620
cctaccacat tccacctaga tggtgaagtt atcacctttg acaatcttaa gacacttctt 4680
tctttgagag aagtgaggac tattaaggtg tttacaacag tagacaacat taacctccac 4740
acgcaagttg tggacatgtc aatgacatat ggacaacagt ttggtccaac ttatttggat 4800
ggagctgatg ttactaaaat aaaacctcat aattcacatg aaggtaaaac attttatgtt 4860
ttacctaatg atgacactct acgtgttgag gcttttgagt actaccacac aactgatcct 4920
agttttctgg gtaggtacat gtcagcatta aatcacacta aaaagtggaa atacccacaa 4980
gttaatggtt taacttctat taaatgggca gataacaact gttatcttgc cactgcattg 5040
ttaacactcc aacaaataga gttgaagttt aatccacctg ctctacaaga tgcttattac 5100
agagcaaggg ctggtgaagc tgctaacttt tgtgcactta tcttagccta ctgtaataag 5160
acagtaggtg agttaggtga tgttagagaa acaatgagtt acttgtttca acatgccaat 5220
ttagattctt gcaaaagagt cttgaacgtg gtgtgtaaaa cttgtggaca acagcagaca 5280
acccttaagg gtgtagaagc tgttatgtac atgggcacac tttcttatga acaatttaag 5340
aaaggtgttc agataccttg tacgtgtggt aaacaagcta caaaatatct agtacaacag 5400
gagtcacctt ttgttatgat gtcagcacca cctgctcagt atgaacttaa gcatggtaca 5460
tttacttgtg ctagtgagta cactggtaat taccagtgtg gtcactataa acatataact 5520
tctaaagaaa ctttgtattg catagacggt gctttactta caaagtcctc agaatacaaa 5580
ggtcctatta cggatgtttt ctacaaagaa aacagttaca caacaaccat aaaaccagtt 5640
acttataaat tggatggtgt tgtttgtaca gaaattgacc ctaagttgga caattattat 5700
aagaaagaca attcttattt cacagagcaa ccaattgatc ttgtaccaaa ccaaccatat 5760
ccaaacgcaa gcttcgataa ttttaagttt gtatgtgata atatcaaatt tgctgatgat 5820
ttaaaccagt taactggtta taagaaacct gcttcaagag agcttaaagt tacatttttc 5880
cctgacttaa atggtgatgt ggtggctatt gattataaac actacacacc ctcttttaag 5940
aaaggagcta aattgttaca taaacctatt gtttggcatg ttaacaatgc aactaataaa 6000
gccacgtata aaccaaatac ctggtgtata cgttgtcttt ggagcacaaa accagttgaa 6060
acatcaaatt cgtttgatgt actgaagtca gaggacgcgc agggaatgga taatcttgcc 6120
tgcgaagatc taaaaccagt ctctgaagaa gtagtggaaa atcctaccat acagaaagac 6180
gttcttgagt gtaatgtgaa aactaccgaa gttgtaggag acattatact taaaccagca 6240
aataatagtt taaaaattac agaagaggtt ggccacacag atctaatggc tgcttatgta 6300
gacaattcta gtcttactat taagaaacct aatgaattat ctagagtatt aggtttgaaa 6360
acccttgcta ctcatggttt agctgctgtt aatagtgtcc cttgggatac tatagctaat 6420
tatgctaagc cttttcttaa caaagttgtt agtacaacta ctaacatagt tacacggtgt 6480
ttaaaccgtg tttgtactaa ttatatgcct tatttcttta ctttattgct acaattgtgt 6540
acttttacta gaagtacaaa ttctagaatt aaagcatcta tgccgactac tatagcaaag 6600
aatactgtta agagtgtcgg taaattttgt ctagaggctt catttaatta tttgaagtca 6660
cctaattttt ctaaactgat aaatattata atttggtttt tactattaag tgtttgccta 6720
ggttctttaa tctactcaac cgctgcttta ggtgttttaa tgtctaattt aggcatgcct 6780
tcttactgta ctggttacag agaaggctat ttgaactcta ctaatgtcac tattgcaacc 6840
tactgtactg gttctatacc ttgtagtgtt tgtcttagtg gtttagattc tttagacacc 6900
tatccttctt tagaaactat acaaattacc atttcatctt ttaaatggga tttaactgct 6960
tttggcttag ttgcagagtg gtttttggca tatattcttt tcactaggtt tttctatgta 7020
cttggattgg ctgcaatcat gcaattgttt ttcagctatt ttgcagtaca ttttattagt 7080
aattcttggc ttatgtggtt aataattaat cttgtacaaa tggccccgat ttcagctatg 7140
gttagaatgt acatcttctt tgcatcattt tattatgtat ggaaaagtta tgtgcatgtt 7200
gtagacggtt gtaattcatc aacttgtatg atgtgttaca aacgtaatag agcaacaaga 7260
gtcgaatgta caactattgt taatggtgtt agaaggtcct tttatgtcta tgctaatgga 7320
ggtaaaggct tttgcaaact acacaattgg aattgtgtta attgtgatac attctgtgct 7380
ggtagtacat ttattagtga tgaagttgcg agagacttgt cactacagtt taaaagacca 7440
ataaatccta ctgaccagtc ttcttacatc gttgatagtg ttacagtgaa gaatggttcc 7500
atccatcttt actttgataa agctggtcaa aagacttatg aaagacattc tctctctcat 7560
tttgttaact tagacaacct gagagctaat aacactaaag gttcattgcc tattaatgtt 7620
atagtttttg atggtaaatc aaaatgtgaa gaatcatctg caaaatcagc gtctgtttac 7680
tacagtcagc ttatgtgtca acctatactg ttactagatc aggcattagt gtctgatgtt 7740
ggtgatagtg cggaagttgc agttaaaatg tttgatgctt acgttaatac gttttcatca 7800
acttttaacg taccaatgga aaaactcaaa acactagttg caactgcaga agctgaactt 7860
gcaaagaatg tgtccttaga caatgtctta tctactttta tttcagcagc tcggcaaggg 7920
tttgttgatt cagatgtaga aactaaagat gttgttgaat gtcttaaatt gtcacatcaa 7980
tctgacatag aagttactgg cgatagttgt aataactata tgctcaccta taacaaagtt 8040
gaaaacatga caccccgtga ccttggtgct tgtattgact gtagtgcgcg tcatattaat 8100
gcgcaggtag caaaaagtca caacattgct ttgatatgga acgttaaaga tttcatgtca 8160
ttgtctgaac aactacgaaa acaaatacgt agtgctgcta aaaagaataa cttacctttt 8220
aagttgacat gtgcaactac tagacaagtt gttaatgttg taacaacaaa gatagcactt 8280
aagggtggta aaattgttaa taattggttg aagcagttaa ttaaagttac acttgtgttc 8340
ctttttgttg ctgctatttt ctatttaata acacctgttc atgtcatgtc taaacatact 8400
gacttttcaa gtgaaatcat aggatacaag gctattgatg gtggtgtcac tcgtgacata 8460
gcatctacag atacttgttt tgctaacaaa catgctgatt ttgacacatg gtttagccag 8520
cgtggtggta gttatactaa tgacaaagct tgcccattga ttgctgcagt cataacaaga 8580
gaagtgggtt ttgtcgtgcc tggtttgcct ggcacgatat tacgcacaac taatggtgac 8640
tttttgcatt tcttacctag agtttttagt gcagttggta acatctgtta cacaccatca 8700
aaacttatag agtacactga ctttgcaaca tcagcttgtg ttttggctgc tgaatgtaca 8760
atttttaaag atgcttctgg taagccagta ccatattgtt atgataccaa tgtactagaa 8820
ggttctgttg cttatgaaag tttacgccct gacacacgtt atgtgctcat ggatggctct 8880
attattcaat ttcctaacac ctaccttgaa ggttctgtta gagtggtaac aacttttgat 8940
tctgagtact gtaggcacgg cacttgtgaa agatcagaag ctggtgtttg tgtatctact 9000
agtggtagat gggtacttaa caatgattat tacagatctt taccaggagt tttctgtggt 9060
gtagatgctg taaatttact tactaatatg tttacaccac taattcaacc tattggtgct 9120
ttggacatat cagcatctat agtagctggt ggtattgtag ctatcgtagt aacatgcctt 9180
gcctactatt ttatgaggtt tagaagagct tttggtgaat acagtcatgt agttgccttt 9240
aatactttac tattccttat gtcattcact gtactctgtt taacaccagt ttactcattc 9300
ttacctggtg tttattctgt tatttacttg tacttgacat tttatcttac taatgatgtt 9360
tcttttttag cacatattca gtggatggtt atgttcacac ctttagtacc tttctggata 9420
acaattgctt atatcatttg tatttccaca aagcatttct attggttctt tagtaattac 9480
ctaaagagac gtgtagtctt taatggtgtt tcctttagta cttttgaaga agctgcgctg 9540
tgcacctttt tgttaaataa agaaatgtat ctaaagttgc gtagtgatgt gctattacct 9600
cttacgcaat ataatagata cttagctctt tataataagt acaagtattt tagtggagca 9660
atggatacaa ctagctacag agaagctgct tgttgtcatc tcgcaaaggc tctcaatgac 9720
ttcagtaact caggttctga tgttctttac caaccaccac aaacctctat cacctcagct 9780
gttttgcaga gtggttttag aaaaatggca ttcccatctg gtaaagttga gggttgtatg 9840
gtacaagtaa cttgtggtac aactacactt aacggtcttt ggcttgatga cgtagtttac 9900
tgtccaagac atgtgatctg cacctctgaa gacatgctta accctaatta tgaagattta 9960
ctcattcgta agtctaatca taatttcttg gtacaggctg gtaatgttca actcagggtt 10020
attggacatt ctatgcaaaa ttgtgtactt aagcttaagg ttgatacagc caatcctaag 10080
acacctaagt ataagtttgt tcgcattcaa ccaggacaga ctttttcagt gttagcttgt 10140
tacaatggtt caccatctgg tgtttaccaa tgtgctatga ggcccaattt cactattaag 10200
ggttcattcc ttaatggttc atgtggtagt gttggtttta acatagatta tgactgtgtc 10260
tctttttgtt acatgcacca tatggaatta ccaactggag ttcatgctgg cacagactta 10320
gaaggtaact tttatggacc ttttgttgac aggcaaacag cacaagcagc tggtacggac 10380
acaactatta cagttaatgt tttagcttgg ttgtacgctg ctgttataaa tggagacagg 10440
tggtttctca atcgatttac cacaactctt aatgacttta accttgtggc tatgaagtac 10500
aattatgaac ctctaacaca agaccatgtt gacatactag gacctctttc tgctcaaact 10560
ggaattgccg ttttagatat gtgtgcttca ttaaaagaat tactgcaaaa tggtatgaat 10620
ggacgtacca tattgggtag tgctttatta gaagatgaat ttacaccttt tgatgttgtt 10680
agacaatgct caggtgttac tttccaaagt gcagtgaaaa gaacaatcaa gggtacacac 10740
cactggttgt tactcacaat tttgacttca cttttagttt tagtccagag tactcaatgg 10800
tctttgttct tttttttgta tgaaaatgcc tttttacctt ttgctatggg tattattgct 10860
atgtctgctt ttgcaatgat gtttgtcaaa cataagcatg catttctctg tttgtttttg 10920
ttaccttctc ttgccactgt agcttatttt aatatggtct atatgcctgc tagttgggtg 10980
atgcgtatta tgacatggtt ggatatggtt gatactagtt tgtctggttt taagctaaaa 11040
gactgtgtta tgtatgcatc agctgtagtg ttactaatcc ttatgacagc aagaactgtg 11100
tatgatgatg gtgctaggag agtgtggaca cttatgaatg tcttgacact cgtttataaa 11160
gtttattatg gtaatgcttt agatcaagcc atttccatgt gggctcttat aatctctgtt 11220
acttctaact actcaggtgt agttacaact gtcatgtttt tggccagagg tattgttttt 11280
atgtgtgttg agtattgccc tattttcttc ataactggta atacacttca gtgtataatg 11340
ctagtttatt gtttcttagg ctatttttgt acttgttact ttggcctctt ttgtttactc 11400
aaccgctact ttagactgac tcttggtgtt tatgattact tagtttctac acaggagttt 11460
agatatatga attcacaggg actactccca cccaagaata gcatagatgc cttcaaactc 11520
aacattaaat tgttgggtgt tggtggcaaa ccttgtatca aagtagccac tgtacagtct 11580
aaaatgtcag atgtaaagtg cacatcagta gtcttactct cagttttgca acaactcaga 11640
gtagaatcat catctaaatt gtgggctcaa tgtgtccagt tacacaatga cattctctta 11700
gctaaagata ctactgaagc ctttgaaaaa atggtttcac tactttctgt tttgctttcc 11760
atgcagggtg ctgtagacat aaacaagctt tgtgaagaaa tgctggacaa cagggcaacc 11820
ttacaagcta tagcctcaga gtttagttcc cttccatcat atgcagcttt tgctactgct 11880
caagaagctt atgagcaggc tgttgctaat ggtgattctg aagttgttct taaaaagttg 11940
aagaagtctt tgaatgtggc taaatctgaa tttgaccgtg atgcagccat gcaacgtaag 12000
ttggaaaaga tggctgatca agctatgacc caaatgtata aacaggctag atctgaggac 12060
aagagggcaa aagttactag tgctatgcag acaatgcttt tcactatgct tagaaagttg 12120
gataatgatg cactcaacaa cattatcaac aatgcaagag atggttgtgt tcccttgaac 12180
ataatacctc ttacaacagc agccaaacta atggttgtca taccagacta taacacatat 12240
aaaaatacgt gtgatggtac aacatttact tatgcatcag cattgtggga aatccaacag 12300
gttgtagatg cagatagtaa aattgttcaa cttagtgaaa ttagtatgga caattcacct 12360
aatttagcat ggcctcttat tgtaacagct ttaagggcca attctgctgt caaattacag 12420
aataatgagc ttagtcctgt tgcactacga cagatgtctt gtgctgccgg tactacacaa 12480
actgcttgca ctgatgacaa tgcgttagct tactacaaca caacaaaggg aggtaggttt 12540
gtacttgcac tgttatccga tttacaggat ttgaaatggg ctagattccc taagagtgat 12600
ggaactggta ctatctatac agaactggaa ccaccttgta ggtttgttac agacacacct 12660
aaaggtccta aagtgaagta tttatacttt attaaaggat taaacaacct aaatagaggt 12720
atggtacttg gtagtttagc tgccacagta cgtctacaag ctggtaatgc aacagaagtg 12780
cctgccaatt caactgtatt atctttctgt gcttttgctg tagatgctgc taaagcttac 12840
aaagattatc tagctagtgg gggacaacca atcactaatt gtgttaagat gttgtgtaca 12900
cacactggta ctggtcaggc aataacagtt acaccggaag ccaatatgga tcaagaatcc 12960
tttggtggtg catcgtgttg tctgtactgc cgttgccaca tagatcatcc aaatcctaaa 13020
ggattttgtg acttaaaagg taagtatgta caaataccta caacttgtgc taatgaccct 13080
gtgggtttta cacttaaaaa cacagtctgt accgtctgcg gtatgtggaa aggttatggc 13140
tgtagttgtg atcaactccg cgaacccatg cttcagtcag ctgatgcaca atcgttttta 13200
aacgggtttg cggtgtaa 13218
<210> 327
<211> 3822
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 327
atgtttgttt ttcttgtttt attgccacta gtctctagtc agtgtgttaa tcttacaacc 60
agaactcaat taccccctgc atacactaat tctttcacac gtggtgttta ttaccctgac 120
aaagttttca gatcctcagt tttacattca actcaggact tgttcttacc tttcttttcc 180
aatgttactt ggttccatgc tatacatgtc tctgggacca atggtactaa gaggtttgat 240
aaccctgtcc taccatttaa tgatggtgtt tattttgctt ccactgagaa gtctaacata 300
ataagaggct ggatttttgg tactacttta gattcgaaga cccagtccct acttattgtt 360
aataacgcta ctaatgttgt tattaaagtc tgtgaatttc aattttgtaa tgatccattt 420
ttgggtgttt attaccacaa aaacaacaaa agttggatgg aaagtgagtt cagagtttat 480
tctagtgcga ataattgcac ttttgaatat gtctctcagc cttttcttat ggaccttgaa 540
ggaaaacagg gtaatttcaa aaatcttagg gaatttgtgt ttaagaatat tgatggttat 600
tttaaaatat attctaagca cacgcctatt aatttagtgc gtgatctccc tcagggtttt 660
tcggctttag aaccattggt agatttgcca ataggtatta acatcactag gtttcaaact 720
ttacttgctt tacatagaag ttatttgact cctggtgatt cttcttcagg ttggacagct 780
ggtgctgcag cttattatgt gggttatctt caacctagga cttttctatt aaaatataat 840
gaaaatggaa ccattacaga tgctgtagac tgtgcacttg accctctctc agaaacaaag 900
tgtacgttga aatccttcac tgtagaaaaa ggaatctatc aaacttctaa ctttagagtc 960
caaccaacag aatctattgt tagatttcct aatattacaa acttgtgccc ttttggtgaa 1020
gtttttaacg ccaccagatt tgcatctgtt tatgcttgga acaggaagag aatcagcaac 1080
tgtgttgctg attattctgt cctatataat tccgcatcat tttccacttt taagtgttat 1140
ggagtgtctc ctactaaatt aaatgatctc tgctttacta atgtctatgc agattcattt 1200
gtaattagag gtgatgaagt cagacaaatc gctccagggc aaactggaaa gattgctgat 1260
tataattata aattaccaga tgattttaca ggctgcgtta tagcttggaa ttctaacaat 1320
cttgattcta aggttggtgg taattataat tacctgtata gattgtttag gaagtctaat 1380
ctcaaacctt ttgagagaga tatttcaact gaaatctatc aggccggtag cacaccttgt 1440
aatggtgttg aaggttttaa ttgttacttt cctttacaat catatggttt ccaacccact 1500
aatggtgttg gttaccaacc atacagagta gtagtacttt cttttgaact tctacatgca 1560
ccagcaactg tttgtggacc taaaaagtct actaatttgg ttaaaaacaa atgtgtcaat 1620
ttcaacttca atggtttaac aggcacaggt gttcttactg agtctaacaa aaagtttctg 1680
cctttccaac aatttggcag agacattgct gacactactg atgctgtccg tgatccacag 1740
acacttgaga ttcttgacat tacaccatgt tcttttggtg gtgtcagtgt tataacacca 1800
ggaacaaata cttctaacca ggttgctgtt ctttatcagg gtgttaactg cacagaagtc 1860
cctgttgcta ttcatgcaga tcaacttact cctacttggc gtgtttattc tacaggttct 1920
aatgtttttc aaacacgtgc aggctgttta ataggggctg aacatgtcaa caactcatat 1980
gagtgtgaca tacccattgg tgcaggtata tgcgctagtt atcagactca gactaattct 2040
cctcggcggg cacgtagtgt agctagtcaa tccatcattg cctacactat gtcacttggt 2100
gcagaaaatt cagttgctta ctctaataac tctattgcca tacccacaaa ttttactatt 2160
agtgttacca cagaaattct accagtgtct atgaccaaga catcagtaga ttgtacaatg 2220
tacatttgtg gtgattcaac tgaatgcagc aatcttttgt tgcaatatgg cagtttttgt 2280
acacaattaa accgtgcttt aactggaata gctgttgaac aagacaaaaa cacccaagaa 2340
gtttttgcac aagtcaaaca aatttacaaa acaccaccaa ttaaagattt tggtggtttt 2400
aatttttcac aaatattacc agatccatca aaaccaagca agaggtcatt tattgaagat 2460
ctacttttca acaaagtgac acttgcagat gctggcttca tcaaacaata tggtgattgc 2520
cttggtgata ttgctgctag agacctcatt tgtgcacaaa agtttaacgg ccttactgtt 2580
ttgccacctt tgctcacaga tgaaatgatt gctcaataca cttctgcact gttagcgggt 2640
acaatcactt ctggttggac ctttggtgca ggtgctgcat tacaaatacc atttgctatg 2700
caaatggctt ataggtttaa tggtattgga gttacacaga atgttctcta tgagaaccaa 2760
aaattgattg ccaaccaatt taatagtgct attggcaaaa ttcaagactc actttcttcc 2820
acagcaagtg cacttggaaa acttcaagat gtggtcaacc aaaatgcaca agctttaaac 2880
acgcttgtta aacaacttag ctccaatttt ggtgcaattt caagtgtttt aaatgatatc 2940
ctttcacgtc ttgacaaagt tgaggctgaa gtgcaaattg ataggttgat cacaggcaga 3000
cttcaaagtt tgcagacata tgtgactcaa caattaatta gagctgcaga aatcagagct 3060
tctgctaatc ttgctgctac taaaatgtca gagtgtgtac ttggacaatc aaaaagagtt 3120
gatttttgtg gaaagggcta tcatcttatg tccttccctc agtcagcacc tcatggtgta 3180
gtcttcttgc atgtgactta tgtccctgca caagaaaaga acttcacaac tgctcctgcc 3240
atttgtcatg atggaaaagc acactttcct cgtgaaggtg tctttgtttc aaatggcaca 3300
cactggtttg taacacaaag gaatttttat gaaccacaaa tcattactac agacaacaca 3360
tttgtgtctg gtaactgtga tgttgtaata ggaattgtca acaacacagt ttatgatcct 3420
ttgcaacctg aattagactc attcaaggag gagttagata aatattttaa gaatcataca 3480
tcaccagatg ttgatttagg tgacatctct ggcattaatg cttcagttgt aaacattcaa 3540
aaagaaattg accgcctcaa tgaggttgcc aagaatttaa atgaatctct catcgatctc 3600
caagaacttg gaaagtatga gcagtatata aaatggccat ggtacatttg gctaggtttt 3660
atagctggct tgattgccat agtaatggtg acaattatgc tttgctgtat gaccagttgc 3720
tgtagttgtc tcaagggctg ttgttcttgt ggatcctgct gcaaatttga tgaagacgac 3780
tctgagccag tgctcaaagg agtcaaatta cattacacat aa 3822
<210> 328
<211> 828
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 328
atggatttgt ttatgagaat cttcacaatt ggaactgtaa ctttgaagca aggtgaaatc 60
aaggatgcta ctccttcaga ttttgttcgc gctactgcaa cgataccgat acaagcctca 120
ctccctttcg gatggcttat tgttggcgtt gcacttcttg ctgtttttca gagcgcttcc 180
aaaatcataa ccctcaaaaa gagatggcaa ctagcactct ccaagggtgt tcactttgtt 240
tgcaacttgc tgttgttgtt tgtaacagtt tactcacacc ttttgctcgt tgctgctggc 300
cttgaagccc cttttctcta tctttatgct ttagtctact tcttgcagag tataaacttt 360
gtaagaataa taatgaggct ttggctttgc tggaaatgcc gttccaaaaa cccattactt 420
tatgatgcca actattttct ttgctggcat actaattgtt acgactattg tataccttac 480
aatagtgtaa cttcttcaat tgtcattact tcaggtgatg gcacaacaag tcctatttct 540
gaacatgact accagattgg tggttatact gaaaaatggg aatctggagt aaaagactgt 600
gttgtattac acagttactt cacttcagac tattaccagc tgtactcaac tcaattgagt 660
acagacactg gtgttgaaca tgttaccttc ttcatctaca ataaaattgt tgatgagcct 720
gaagaacatg tccaaattca cacaatcgac ggttcatccg gagttgttaa tccagtaatg 780
gaaccaattt atgatgaacc gacgacgact actagcgtgc ctttgtaa 828
<210> 329
<211> 228
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 329
atgtactcat tcgtttcgga agagacaggt acgttaatag ttaatagcgt acttcttttt 60
cttgctttcg tggtattctt gctagttaca ctagccatcc ttactgcgct tcgattgtgt 120
gcgtactgct gcaatattgt taacgtgagt cttgtaaaac cttcttttta cgtttactct 180
cgtgttaaaa atctgaattc ttctagagtt cctgatcttc tggtctaa 228
<210> 330
<211> 186
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 330
atgtttcatc tcgttgactt tcaggttact atagcagaga tattactaat tattatgagg 60
acttttaaag tttccatttg gaatcttgat tacatcacaa acctcataat taaaaattta 120
tctaagtcac taactgagaa taaatattct caattagatg aagagcaacc aatggagatt 180
gattaa 186
<210> 331
<211> 366
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 331
atgaaaatta ttcttttctt ggcactgata acactcgcta cttgtgagct ttatcactac 60
caagagtgtg ttagaggtac aacagtactt ttaaaagaac cttgctcttc tggaacatac 120
gagggcaatt caccatttca tcctctagct gataacaaat ttgcactgac ttgctttagc 180
actcaatttg cttttgcttg tcctgacggc gtaaaacacg tctatcagtt acgtgccaga 240
tcagtttcac ctaaactgtt catcagacaa gaggaagttc aagaacttta ctctccaatt 300
tttcttattg ttgcggcaat agtgtttata acactttgct tcacactcaa aagaaagaca 360
gaatga 366
<210> 332
<211> 132
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 332
atgattgaac tttcattaat tgacttctat ttgtgctttt tagcctttct gctattcctt 60
gttttaatta tgcttattat cttttggttc tcacttgaac tgcaagatca taatgaaact 120
tgtcacgcct aa 132
<210> 333
<211> 366
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 333
atgaaatttc ttgttttctt aggaatcatc acaactgtag ctgcatttca ccaagaatgt 60
agtttacagt catgtactca acatcaacca tatgtagttg atgacccgtg tcctattcac 120
ttctattcta aatggtatat tagagtagga gctagaaaat cagcaccttt aattgaattg 180
tgcgtggatg aggctggttc taaatcaccc attcagtaca tcgatatcgg taattataca 240
gtttcctgtt taccttttac aattaattgc caggaaccta aattgggtag tcttgtagtg 300
cgttgttcgt tctatgaaga ctttttagag tatcatgacg ttcgtgttgt tttagatttc 360
atctaa 366
<210> 334
<211> 1260
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 334
atgtctgata atggacccca aaatcagcga aatgcacccc gcattacgtt tggtggaccc 60
tcagattcaa ctggcagtaa ccagaatgga gaacgcagtg gggcgcgatc aaaacaacgt 120
cggccccaag gtttacccaa taatactgcg tcttggttca ccgctctcac tcaacatggc 180
aaggaagacc ttaaattccc tcgaggacaa ggcgttccaa ttaacaccaa tagcagtcca 240
gatgaccaaa ttggctacta ccgaagagct accagacgaa ttcgtggtgg tgacggtaaa 300
atgaaagatc tcagtccaag atggtatttc tactacctag gaactgggcc agaagctgga 360
cttccctatg gtgctaacaa agacggcatc atatgggttg caactgaggg agccttgaat 420
acaccaaaag atcacattgg cacccgcaat cctgctaaca atgctgcaat cgtgctacaa 480
cttcctcaag gaacaacatt gccaaaaggc ttctacgcag aagggagcag aggcggcagt 540
caagcctctt ctcgttcctc atcacgtagt cgcaacagtt caagaaattc aactccaggc 600
agcagtaaac gaacttctcc tgctagaatg gctggcaatg gcggtgatgc tgctcttgct 660
ttgctgctgc ttgacagatt gaaccagctt gagagtaaaa tgtctggtaa aggccaacaa 720
caacaaggcc aaactgtcac taagaaatct gctgctgagg cttctaagaa gcctcggcaa 780
aaacgtactg ccactaaagc atacaatgta acacaagctt tcggcagacg tggtccagaa 840
caaacccaag gaaattttgg ggaccaggaa ctaaccagac aaggaactga ttacaaacat 900
tggccgcaaa ttgcacaatt tgcccccagc gcttcagcgt tcttcggaat gtcgcgcatt 960
ggcatggaag tcacaccttc gggaacgtgg ttgacctaca caggtgccat caaattggat 1020
gacaaagatc caaatttcaa agatcaagtc attttgctga ataagcatat tgacgcatac 1080
aaaacattcc caccaacaga gcctaaaaag gacaaaaaga agaaggctga tgaaactcaa 1140
gccttaccgc agagacagaa gaaacagcaa actgtgactc ttcttcctgc tgcagatttg 1200
gatgatttct ccaaacaatt gcaacaatcc atgagcagtg ctgactcaac tcaggcctaa 1260
<210> 335
<211> 117
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 335
atgggctata taaacgtttt cgcttttccg tttacgatat atagtctact cttgtgcaga 60
atgaattctc gtaactacat agcacaagta gatgtagtta actttaatct cacatag 117
<210> 336
<211> 21291
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<220>
<221> modified_base
<222> (20906)..(20915)
<223> a, c, t, g, unknown or other
<220>
<221> modified_base
<222> (20939)..(20940)
<223> a, c, t, g, unknown or other
<220>
<221> modified_base
<222> (20952)..(20968)
<223> a, c, t, g, unknown or other
<220>
<221> modified_base
<222> (20970)..(20974)
<223> a, c, t, g, unknown or other
<220>
<221> modified_base
<222> (20976)..(20985)
<223> a, c, t, g, unknown or other
<220>
<221> modified_base
<222> (21005)..(21018)
<223> a, c, t, g, unknown or other
<220>
<221> modified_base
<222> (21022)..(21030)
<223> a, c, t, g, unknown or other
<220>
<221> modified_base
<222> (21052)..(21058)
<223> a, c, t, g, unknown or other
<220>
<221> modified_base
<222> (21062)..(21093)
<223> a, c, t, g, unknown or other
<400> 336
atggagagcc ttgtccctgg tttcaacgag aaaacacacg tccaactcag tttgcctgtt 60
ttacaggttc gcgacgtgct cgtacgtggc tttggagact ccgtggagga ggtcttatca 120
gaggcacgtc aacatcttaa agatggcact tgtggcttag tagaagttga aaaaggcgtt 180
ttgcctcaac ttgaacagcc ctatgtgttc atcaaacgtt cggatgctcg aactgcacct 240
catggtcatg ttatggttga gctggtagca gaactcgaag gcattcagta cggtcgtagt 300
ggtgagacac ttggtgtcct tgtccctcat gtgggcgaaa taccagtggc ttaccgcaag 360
gttcttcttc gtaagaacgg taataaagga gctggtggcc atagttacgg cgccgatcta 420
aagtcatttg acttaggcga cgagcttggc actgatcctt atgaagattt tcaagaaaac 480
tggaacacta aacatagcag tggtgttacc cgtgaactca tgcgtgagct taacggaggg 540
gcatacactc gctatgtcga taacaacttc tgtggccctg atggctaccc tcttgagtgc 600
attaaagacc ttctagcacg tgctggtaaa gcttcatgca ctttgtccga acaactggac 660
tttattgaca ctaagagggg tgtatactgc tgccgtgaac atgagcatga aattgcttgg 720
tacacggaac gttctgaaaa gagctatgaa ttgcagacac cttttgaaat taaattggca 780
aagaaatttg acatcttcaa tggggaatgt ccaaattttg tatttccctt aaattccata 840
atcaagacta ttcaaccaag ggttgaaaag aaaaagcttg atggctttat gggtagaatt 900
cgatccgtct atccagttgc gtcaccaaat gaatgcaacc aaatgtgcct ttcaactctc 960
atgaagtgtg atcattgtgg tgaaacttca tggcagacgg gcgattttgt taaagccact 1020
tgcgaatttt gtggcactga gaatttgact aaagaaggtg ccactacttg tggttactta 1080
acccaaaatg ctgttgttaa aatttattgt ccagcatgtc acaattcaga agtaggacct 1140
gagcatagtc ttgccgaata ccataatgaa tctggcttga aaaccattct tcgtaagggt 1200
ggtcgcacta ttgcctttgg aggctgtgtg ttctcttatg ttggttgcca taacaagtgt 1260
gcctattggg ttccacgtgc tagcgctaac ataggttgta accatacagg tgttgttgga 1320
gaaggttccg aaggtcttaa tgacaacctt cttgaaatac tccaaaaaga gaaagtcaac 1380
atcaatattg ttggtgactt taaacttaat gaagagatcg ccattatttt ggcatctttt 1440
tctgcttcca caagtgcttt tgtggaaact gtgaaaggtt tggattataa agcattcaaa 1500
caaattgttg aatcctgtgg taattttaaa gttacaaaag gaaaagctaa aaaaggtgcc 1560
tggaatattg gtgaacagaa atcaatactg agtcctcttt atgcatttgc atcagaggct 1620
gctcgtgttg tacgatcaat tttctcccgc actcttgaaa ctgctcaaaa ttctgtgcgt 1680
gttttacaga aggccgctat aacaatacta gatggaattt cacagtattc actgagactc 1740
attgatgcta tgatgttcac atctgatttg gctactaaca atctagttgt aatggcctac 1800
attacaggtg gtgttgttca gttgacttcg cagtggctaa ctaacatctt tggcactgtt 1860
tatgaaaaac tcaaacccgt ccttgattgg cttgaagaga agtttaagga aggtgtagag 1920
tttcttagag acggttggga aattgttaaa tttatctcaa cctgtgcttg tgaaattgtc 1980
ggtggacaaa ttgtcacctg tgcaaaggaa attaaggaga gtgttcagac attctttaag 2040
cttgtaaata aatttttggc tttgtgtgct gactctatca ttattggtgg agctaaactt 2100
aaagccttga atttaggtga aacatttgtc acgcactcaa agggattgta cagaaagtgt 2160
gttaaatcca gagaagaaac tggcctactc atgcctctaa aagccccaaa agaaattatc 2220
ttcttagagg gagaaacact tcccacagaa gtgttaacag aggaagttgt cttgaaaact 2280
ggtgatttac aaccattaga acaacctact agtgaagctg ttgaagctcc attggttggt 2340
acaccagttt gtattaacgg gcttatgttg ctcgaaatca aagacacaga aaagtactgt 2400
gcccttgcac ctaatatgat ggtaacaaac aataccttca cactcaaagg cggtgcacca 2460
acaaaggtta cttttggtga tgacactgtg atagaagtgc aaggttacaa gagtgtgaat 2520
atcacttttg aacttgatga aaggattgat aaagtactta atgagaagtg ctctgcctat 2580
acagttgaac tcggtacaga agtaaatgag ttcgcctgtg ttgtggcaga tgctgtcata 2640
aaaactttgc aaccagtatc tgaattactt acaccactgg gcattgattt agatgagtgg 2700
agtatggcta catactactt atttgatgag tctggtgagt ttaaattggc ttcacatatg 2760
tattgttctt tttaccctcc agatgaggat gaagaagaag gtgattgtga agaagaagag 2820
tttgagccat caactcaata tgagtatggt actgaagatg attaccaagg taaacctttg 2880
gaatttggtg ccacttctgc tgctcttcaa cctgaagaag agcaagaaga agattggtta 2940
gatgatgata gtcaacaaac tgttggtcaa caagacggca gtgaggacaa tcagacaact 3000
actattcaaa caattgttga ggttcaacct caattagaga tggaacttac accagttgtt 3060
cagactattg aagtgaatag ttttagtggt tatttaaaac ttactgacaa tgtatacatt 3120
aaaaatgcag acattgtgga agaagctaaa aaggtaaaac caacagtggt tgttaatgca 3180
gccaatgttt accttaaaca tggaggaggt gttgcaggag ccttaaataa ggctactaac 3240
aatgccatgc aagttgaatc tgatgattac atagctacta atggaccact taaagtgggt 3300
ggtagttgtg ttttaagcgg acacaatctt gctaaacact gtcttcatgt tgtcggccca 3360
aatgttaaca aaggtgaaga cattcaactt cttaagagtg cttatgaaaa ttttaatcag 3420
cacgaagttc tacttgcacc attattatca gctggtattt ttggtgctga ccctatacat 3480
tctttaagag tttgtgtaga tactgttcgc acaaatgtct acttagctgt ctttgataaa 3540
aatctctatg acaaacttgt ttcaagcttt ttggaaatga agagtgaaaa gcaagttgaa 3600
caaaagatcg ctgagattcc taaagaggaa gttaagccat ttataactga aagtaaacct 3660
tcagttgaac agagaaaaca agatgataag aaaatcaaag cttgtgttga agaagttaca 3720
acaactctgg aagaaactaa gttcctcaca gaaaacttgt tactttatat tgacattaat 3780
ggcaatcttc atccagattc tgccactctt gttagtgaca ttgacatcac tttcttaaag 3840
aaagatgctc catatatagt gggtgatgtt gttcaagagg gtgttttaac tgctgtggtt 3900
atacctacta aaaaggctgg tggcactact gaaatgctag cgaaagcttt gagaaaagtg 3960
ccaacagaca attatataac cacttacccg ggtcagggtt taaatggtta cactgtagag 4020
gaggcaaaga cagtgcttaa aaagtgtaaa agtgcctttt acattctacc atctattatc 4080
tctaatgaga agcaagaaat tcttggaact gtttcttgga atttgcgaga aatgcttgca 4140
catgcagaag aaacacgcaa attaatgcct gtctgtgtgg aaactaaagc catagtttca 4200
actatacagc gtaaatataa gggtattaaa atacaagagg gtgtggttga ttatggtgct 4260
agattttact tttacaccag taaaacaact gtagcgtcac ttatcaacac acttaacgat 4320
ctaaatgaaa ctcttgttac aatgccactt ggctatgtaa cacatggctt aaatttggaa 4380
gaagctgctc ggtatatgag atctctcaaa gtgccagcta cagtttctgt ttcttcacct 4440
gatgctgtta cagcgtataa tggttatctt acttcttctt ctaaaacacc tgaagaacat 4500
tttattgaaa ccatctcact tgctggttcc tataaagatt ggtcctattc tggacaatct 4560
acacaactag gtatagaatt tcttaagaga ggtgataaaa gtgtatatta cactagtaat 4620
cctaccacat tccacctaga tggtgaagtt atcacctttg acaatcttaa gacacttctt 4680
tctttgagag aagtgaggac tattaaggtg tttacaacag tagacaacat taacctccac 4740
acgcaagttg tggacatgtc aatgacatat ggacaacagt ttggtccaac ttatttggat 4800
ggagctgatg ttactaaaat aaaacctcat aattcacatg aaggtaaaac attttatgtt 4860
ttacctaatg atgacactct acgtgttgag gcttttgagt actaccacac aactgatcct 4920
agttttctgg gtaggtacat gtcagcatta aatcacacta aaaagtggaa atacccacaa 4980
gttaatggtt taacttctat taaatgggca gataacaact gttatcttgc cactgcattg 5040
ttaacactcc aacaaataga gttgaagttt aatccacctg ctctacaaga tgcttattac 5100
agagcaaggg ctggtgaagc tgctaacttt tgtgcactta tcttagccta ctgtaataag 5160
acagtaggtg agttaggtga tgttagagaa acaatgagtt acttgtttca acatgccaat 5220
ttagattctt gcaaaagagt cttgaacgtg gtgtgtaaaa cttgtggaca acagcagaca 5280
acccttaagg gtgtagaagc tgttatgtac atgggcacac tttcttatga acaatttaag 5340
aaaggtgttc agataccttg tacgtgtggt aaacaagcta caaaatatct agtacaacag 5400
gagtcacctt ttgttatgat gtcagcacca cctgctcagt atgaacttaa gcatggtaca 5460
tttacttgtg ctagtgagta cgctggtaat taccagtgtg gtcactataa acatataact 5520
tctaaagaaa ctttgtattg catagacggt gctttactta caaagtcctc agaatacaaa 5580
ggtcctatta cggatgtttt ctacaaagaa aacagttaca caacaaccat aaaaccagtt 5640
acttataaat tggatggtgt tgtttgtaca gaaattgacc ctaagttgga caattattat 5700
aagaaagaca attcttattt cacagagcaa ccaattgatc ttgtaccaaa ccaaccatat 5760
ccaaacgcaa gcttcgataa ttttaagttt gtatgtgata atatcaaatt tgctgatgat 5820
ttaaaccagt taactggtta taagaaacct gcttcaagag agcttaaagt tacatttttc 5880
cctgacttaa atggtgatgt ggtggctatt gattataaac actacacacc ctcttttaag 5940
aaaggagcta aattgttaca taaacctatt gtttggcatg ttaacaatgc aactaataaa 6000
gccacgtata aaccaaatac ctggtgtata cgttgtcttt ggagcacaaa accagttgaa 6060
acatcaaatt cgtttgatgt actgaagtca gaggacgcgc agggaatgga taatcttgcc 6120
tgcgaagatc taaaaccagt ctctgaagaa gtagtggaaa atcctaccat acagaaagac 6180
gttcttgagt gtaatgtgaa aactaccgaa gttgtaggag acattatact taaaccagca 6240
aataatagtt taaaaattac agaagaggtt ggccacacag atctaatggc tgcttatgta 6300
gacaattcta gtcttactat taagaaacct aatgaattat ctagagtatt aggtttgaaa 6360
acccttgcta ctcatggttt agctgctgtt aatagtgtcc cttgggatac tatagctaat 6420
tatgctaagc cttttcttaa caaagttgtt agtacaacta ctaacatagt tacacggtgt 6480
ttaaaccgtg tttgtactaa ttatatgcct tatttcttta ctttattgct acaattgtgt 6540
acttttacta gaagtacaaa ttctagaatt aaagcatcta tgccgactac tatagcaaag 6600
aatactgtta agagtgtcgg taaattttgt ctagaggctt catttaatta tttgaagtca 6660
cctaattttt ctaaactgat aaatattata atttggtttt tactattaag tgtttgccta 6720
ggttctttaa tctactcaac cgctgcttta ggtgttttaa tgtctaattt aggcatgcct 6780
tcttactgta ctggttacag agaaggctat ttgaactcta ctaatgtcac tattgcaacc 6840
tactgtactg gttctatacc ttgtagtgtt tgtcttagtg gtttagattc tttagacacc 6900
tatccttctt tagaaactat acaaattacc atttcatctt ttaaatggga tttaactgct 6960
tttggcttag ttgcagagtg gtttttggca tatattcttt tcactaggtt tttctatgta 7020
cttggattgg ctgcaatcat gcaattgttt ttcagctatt ttgcagtaca ttttattagt 7080
aattcttggc ttatgtggtt aataattaat cttgtacaaa tggccccgat ttcagctatg 7140
gttagaatgt acatcttctt tgcatcattt tattatgtat ggaaaagtta tgtgcatgtt 7200
gtagacggtt gtaattcatc aacttgtatg atgtgttaca aacgtaatag agcaacaaga 7260
gtcgaatgta caactattgt taatggtgtt agaaggtcct tttatgtcta tgctaatgga 7320
ggtaaaggct tttgcaaact acacaattgg aattgtgtta attgtgatac attctgtgct 7380
ggtagtacat ttattagtga tgaagttgcg agagacttgt cactacagtt taaaagacca 7440
ataaatccta ctgaccagtc ttcttacatc gttgatagtg ttacagtgaa gaatggttcc 7500
atccatcttt actttgataa agctggtcaa aagacttatg aaagacattc tctctctcat 7560
tttgttaact tagacaacct gagagctaat aacactaaag gttcattgcc tattaatgtt 7620
atagtttttg atggtaaatc aaaatgtgaa gaatcatctg caaaatcagc gtctgtttac 7680
tacagtcagc ttatgtgtca acctatactg ttactagatc aggcattagt gtctgatgtt 7740
ggtgatagtg cggaagttgc agttaaaatg tttgatgctt acgttaatac gttttcatca 7800
acttttaacg taccaatgga aaaactcaaa acactagttg caactgcaga agctgaactt 7860
gcaaagaatg tgtccttaga caatgtctta tctactttta tttcagcagc tcggcaaggg 7920
tttgttgatt cagatgtaga aactaaagat gttgttgaat gtcttaaatt gtcacatcaa 7980
tctgacatag aagttactgg cgatagttgt aataactata tgctcaccta taacaaagtt 8040
gaaaacatga caccccgtga ccttggtgct tgtattgact gtagtgcgcg tcatattaat 8100
gcgcaggtag caaaaagtca caacattgct ttgatatgga acgttaaaga tttcatgtca 8160
ttgtctgaac aactacgaaa acaaatacgt agtgctgcta aaaagaataa cttacctttt 8220
aagttgacat gtgcaactac tagacaagtt gttaatgttg taacaacaaa gatagcactt 8280
aagggtggta aaattgttaa taattggttg aagcagttaa ttaaagttac acttgtgttc 8340
ctttttgttg ctgctatttt ctatttaata acacctgttc atgtcatgtc taaacatact 8400
gacttttcaa gtgaaatcat aggatacaag gctattgatg gtggtgtcac tcgtgacata 8460
gcatctacag atacttgttt tgctaacaaa catgctgatt ttgacacatg gtttagccag 8520
cgtggtggta gttatactaa tgacaaagct tgcccattga ttgctgcagt cataacaaga 8580
gaagtgggtt ttgtcgtgcc tggtttgcct ggcacgatat tacgcacaac taatggtgac 8640
tttttgcatt tcttacctag agtttttagt gcagttggta acatctgtta cacaccatca 8700
aaacttatag agtacactga ctttgcaaca tcagcttgtg ttttggctgc tgaatgtaca 8760
atttttaaag atgcttctgg taagccagta ccatattgtt atgataccaa tgtactagaa 8820
ggttctgttg cttatgaaag tttacgccct gacacacgtt atgtgctcat ggatggctct 8880
attattcaat ttcctaacac ctaccttgaa ggttctgtta gagtggtaac aacttttgat 8940
tctgagtact gtaggcacgg cacttgtgaa agatcagaag ctggtgtttg tgtatctact 9000
agtggtagat gggtacttaa caatgattat tacagatctt taccaggagt tttctgtggt 9060
gtagatgctg taaatttact tactaatatg tttacaccac taattcaacc tattggtgct 9120
ttggacatat cagcatctat agtagctggt ggtattgtag ctatcgtagt aacatgcctt 9180
gcctactatt ttatgaggtt tagaagagct tttggtgaat acagtcatgt agttgccttt 9240
aatactttac tattccttat gtcattcact gtactctgtt taacaccagt ttactcattc 9300
ttacctggtg tttattctgt tatttacttg tacttgacat tttatcttac taatgatgtt 9360
tcttttttag cacatattca gtggatggtt atgttcacac ctttagtacc tttctggata 9420
acaattgctt atatcatttg tatttccaca aagcatttct attggttctt tagtaattac 9480
ctaaagagac gtgtagtctt taatggtgtt tcctttagta cttttgaaga agctgcgctg 9540
tgcacctttt tgttaaataa agaaatgtat ctaaagttgc gtagtgatgt gctattacct 9600
cttacgcaat ataatagata cttagctctt tataataagt acaagtattt tagtggagca 9660
atggatacaa ctagctacag agaagctgct tgttgtcatc tcgcaaaggc tctcaatgac 9720
ttcagtaact caggttctga tgttctttac caaccaccac aaacctctat cacctcagct 9780
gttttgcaga gtggttttag aaaaatggca ttcccatctg gtaaagttga gggttgtatg 9840
gtacaagtaa cttgtggtac aactacactt aacggtcttt ggcttgatga cgtagtttac 9900
tgtccaagac atgtgatctg cacctctgaa gacatgctta accctaatta tgaagattta 9960
ctcattcgta agtctaatca taatttcttg gtacaggctg gtaatgttca actcagggtt 10020
attggacatt ctatgcaaaa ttgtgtactt aagcttaagg ttgatacagc caatcctaag 10080
acacctaagt ataagtttgt tcgcattcaa ccaggacaga ctttttcagt gttagcttgt 10140
tacaatggtt caccatctgg tgtttaccaa tgtgctatga ggcccaattt cactattaag 10200
ggttcattcc ttaatggttc atgtggtagt gttggtttta acatagatta tgactgtgtc 10260
tctttttgtt acatgcacca tatggaatta ccaactggag ttcatgctgg cacagactta 10320
gaaggtaact tttatggacc ttttgttgac aggcaaacag cacaagcagc tggtacggac 10380
acaactatta cagttaatgt tttagcttgg ttgtacgctg ctgttataaa tggagacagg 10440
tggtttctca atcgatttac cacaactctt aatgacttta accttgtggc tatgaagtac 10500
aattatgaac ctctaacaca agatcatgtt gacatactag gacctctttc tgctcaaact 10560
ggaattgccg ttttagatat gtgtgcttca ttaaaagaat tactgcaaaa tggtatgaat 10620
ggacgtacca tattgggtag tgctttatta gaagatgaat ttacaccttt tgatgttgtt 10680
agacaatgct caggtgttac tttccaaagt gcagtgaaaa gaacaatcaa gggtacacac 10740
cactggttgt tactcacaat tttgacttca cttttagttt tagtccagag tactcaatgg 10800
tctttgttct tttttttgta tgaaaatgcc tttttacctt ttgctatggg tattattgct 10860
atgtctgctt ttgcaatgat gtttgtcaaa cataagcatg catttctctg tttgtttttg 10920
ttaccttctc ttgccactgt agcttatttt aatatggtct atatgcctgc tagttgggtg 10980
atgcgtatta tgacatggtt ggatatggtt gatactagtt tgtctggttt taagctaaaa 11040
gactgtgtta tgtatgcatc agctgtagtg ttactaatcc ttatgacagc aagaactgtg 11100
tatgatgatg gtgctaggag agtgtggaca cttatgaatg tcttgacact cgtttataaa 11160
gtttattatg gtaatgcttt agatcaagcc atttccatgt gggctcttat aatctctgtt 11220
acttctaact actcaggtgt agttacaact gtcatgtttt tggccagagg tattgttttt 11280
atgtgtgttg agtattgccc tattttcttc ataactggta atacacttca gtgtataatg 11340
ctagtttatt gtttcttagg ctatttttgt acttgttact ttggcctctt ttgtttactc 11400
aaccgctact ttagactgac tcttggtgtt tatgattact tagtttctac acaggagttt 11460
agatatatga attcacaggg actactccca cccaagaata gcatagatgc cttcaaactc 11520
aacattaaat tgttgggtgt tggtggcaaa ccttgtatca aagtagccac tgtacagtct 11580
aaaatgtcag atgtaaagtg cacatcagta gtcttactct cagttttgca acaactcaga 11640
gtagaatcat catctaaatt gtgggctcaa tgtgtccagt tacacaatga cattctctta 11700
gctaaagata ctactgaagc ctttgaaaaa atggtttcac tactttctgt tttgctttcc 11760
atgcagggtg ctgtagacat aaacaagctt tgtgaagaaa tgctggacaa cagggcaacc 11820
ttacaagcta tagcctcaga gtttagttcc cttccatcat atgcagcttt tgctactgct 11880
caagaagctt atgagcaggc tgttgctaat ggtgattctg aagttgttct taaaaagttg 11940
aagaagtctt tgaatgtggc taaatctgaa tttgaccgtg atgcagccat gcaacgtaag 12000
ttggaaaaga tggctgatca agctatgacc caaatgtata aacaggctag atctgaggac 12060
aagagggcaa aagttactag tgctatgcag acaatgcttt tcactatgct tagaaagttg 12120
gataatgatg cactcaacaa cattatcaac aatgcaagag atggttgtgt tcccttgaac 12180
ataatacctc ttacaacagc agccaaacta atggttgtca taccagacta taacacatat 12240
aaaaatacgt gtgatggtac aacatttact tatgcatcag cattgtggga aatccaacag 12300
gttgtagatg cagatagtaa aattgttcaa cttagtgaaa ttagtatgga caattcacct 12360
aatttagcat ggcctcttat tgtaacagct ttaagggcca attctgctgt caaattacag 12420
aataatgagc ttagtcctgt tgcactacga cagatgtctt gtgctgccgg tactacacaa 12480
actgcttgca ctgatgacaa tgcgttagct tactacaaca caacaaaggg aggtaggttt 12540
gtacttgcac tgttatccga tttacaggat ttgaaatggg ctagattccc taagagtgat 12600
ggaactggta ctatctatac agaactggaa ccaccttgta ggtttgttac agacacacct 12660
aaaggtccta aagtgaagta tttatacttt attaaaggat taaacaacct aaatagaggt 12720
atggtacttg gtagtttagc tgccacagta cgtctacaag ctggtaatgc aacagaagtg 12780
cctgccaatt caactgtatt atctttctgt gcttttgctg tagatgctgc taaagcttac 12840
aaagattatc tagctagtgg gggacaacca atcactaatt gtgttaagat gttgtgtaca 12900
cacactggta ctggtcaggc aataacagtt acaccggaag ccaatatgga tcaagaatcc 12960
tttggtggtg catcgtgttg tctgtactgc cgttgccaca tagatcatcc aaatcctaaa 13020
ggattttgtg acttaaaagg taagtatgta caaataccta caacttgtgt taatgaccct 13080
gtgggtttta cacttaaaaa cacagtctgt accgtctgcg gtatgtggaa aggttatggc 13140
tgtagttgtg atcaactccg cgaacccatg cttcagtcag ctgatgcaca atcgttttta 13200
aaccgggttt gcggtgtaag tgcagcccgt cttacaccgt gcggcacagg cactagtact 13260
gatgtcgtat acagggcttt tgacatctac aatgataaag tagctggttt tgctaaattc 13320
ctaaaaacta attgttgtcg cttccaagaa aaggacgaag atgacaattt aattgattct 13380
tactttgtag ttaagagaca cactttctct aactaccaac atgaagaaac aatttataat 13440
ttacttaagg attgtccagc tgttgctaaa catgacttct ttaagtttag aatagacggt 13500
gacatggtac cacatatatc acgtcaacgt cttactaaat acacaatggc agacctcgtc 13560
tatgctttaa ggcattttga tgaaggtaat tgtgacacat taaaagaaat acttgtcaca 13620
tacaattgtt gtgatgatga ttatttcaat aaaaaggact ggtatgattt tgtagaaaac 13680
ccagatatat tacgcgtata cgccaactta ggtgaacgtg tacgccaagc tttgttaaaa 13740
acagtacaat tctgtgatgc catgcgaaat gctggtattg ttggtgtact gacattagat 13800
aatcaagatc tcaatggtaa ctggtatgat ttcggtgatt tcatacaaac cacgccaggt 13860
agtggagttc ctgttgtaga ttcttattat tcattgttaa tgcctatatt aaccttgacc 13920
agggctttaa ctgcagagtc acatgttgac actgacttaa caaagcctta cattaagtgg 13980
gatttgttaa aatatgactt cacggaagag aggttaaaac tctttgaccg ttattttaaa 14040
tattgggatc agacatacca cccaaattgt gttaactgtt tggatgacag atgcattctg 14100
cattgtgcaa actttaatgt tttattctct acagtgttcc cacttacaag ttttggacca 14160
ctagtgagaa aaatatttgt tgatggtgtt ccatttgtag tttcaactgg ataccacttc 14220
agagagctag gtgttgtaca taatcaggat gtaaacttac atagctctag acttagtttt 14280
aaggaattac ttgtgtatgc tgctgaccct gctatgcacg ctgcttctgg taatctatta 14340
ctagataaac gcactacgtg cttttcagta gctgcactta ctaacaatgt tgcttttcaa 14400
actgtcaaac ccggtaattt taacaaagac ttctatgact ttgctgtgtc taagggtttc 14460
tttaaggaag gaagttctgt tgaattaaaa cacttcttct ttgctcagga tggtaatgct 14520
gctatcagcg attatgacta ctatcgttat aatctaccaa caatgtgtga tatcagacaa 14580
ctactatttg tagttgaagt tgttgataag tactttgatt gttacgatgg tggctgtatt 14640
aatgctaacc aagtcatcgt caacaaccta gacaaatcag ctggttttcc atttaataaa 14700
tggggtaagg ctagacttta ttatgattca atgagttatg aggatcaaga tgcacttttc 14760
gcatatacaa aacgtaatgt catccctact ataactcaaa tgaatcttaa gtatgccatt 14820
agtgcaaaga atagagctcg caccgtagct ggtgtctcta tctgtagtac tatgaccaat 14880
agacagtttc atcaaaaatt attgaaatca atagccgcca ctagaggagc tactgtagta 14940
attggaacaa gcaaattcta tggtggttgg cacaacatgt taaaaactgt ttatagtgat 15000
gtagaaaacc ctcaccttat gggttgggat tatcctaaat gtgatagagc catgcctaac 15060
atgcttagaa ttatggcctc acttgttctt gctcgcaaac atacaacgtg ttgtagcttg 15120
tcacaccgtt tctatagatt agctaatgag tgtgctcaag tattgagtga aatggtcatg 15180
tgtggcggtt cactatatgt taaaccaggt ggaacctcat caggagatgc cacaactgct 15240
tatgctaata gtgtttttaa catttgtcaa gctgtcacgg ccaatgttaa tgcactttta 15300
tctactgatg gtaacaaaat tgccgataag tatgtccgca atttacaaca cagactttat 15360
gagtgtctct atagaaatag agatgttgac acagactttg tgaatgagtt ttacgcatat 15420
ttgcgtaaac atttctcaat gatgatactc tctgacgatg ctgttgtgtg tttcaatagc 15480
acttatgcat ctcaaggtct agtggctagc ataaagaact ttaagtcagt tctttattat 15540
caaaacaatg tttttatgtc tgaagcaaaa tgttggactg agactgacct tactaaagga 15600
cctcatgaat tttgctctca acatacaatg ctagttaaac agggtgatga ttatgtgtac 15660
cttccttacc cagatccatc aagaatccta ggggccggct gttttgtaga tgatatcgta 15720
aaaacagatg gtacacttat gattgaacgg ttcgtgtctt tagctataga tgcttaccca 15780
cttactaaac atcctaatca ggagtatgct gatgtctttc atttgtactt acaatacata 15840
agaaagctac atgatgagtt aacaggacac atgttagaca tgtattctgt tatgcttact 15900
aatgataaca cttcaaggta ttgggaacct gagttttatg aggctatgta cacaccgcat 15960
acagtcttac aggctgttgg ggcttgtgtt ctttgcaatt cacagacttc attaagatgt 16020
ggtgcttgca tacgtagacc attcttatgt tgtaaatgct gttacgacca tgtcatatca 16080
acatcacata aattagtctt gtctgttaat ccgtatgttt gcaatgctcc aggttgtgat 16140
gtcacagatg tgactcaact ttacttagga ggtatgagct attattgtaa atcacataaa 16200
ccacccatta gttttccatt gtgtgctaat ggacaagttt ttggtttata taaaaataca 16260
tgtgttggta gcgataatgt tactgacttt aatgcaattg caacatgtga ctggacaaat 16320
gctggtgatt acattttagc taacacctgt actgaaagac tcaagctttt tgcagcagaa 16380
acgctcaaag ctactgagga gacatttaaa ctgtcttatg gtattgctac tgtacgtgaa 16440
gtgctgtctg acagagaatt acatctttca tgggaagttg gtaaacctag accaccactt 16500
aaccgaaatt atgtctttac tggttatcgt gtaactaaaa acagtaaagt acaaatagga 16560
gagtacacct ttgaaaaagg tgactatggt gatgctgttg tttaccgagg tacaacaact 16620
tacaaattaa atgttggtga ttattttgtg ctgacatcac atacagtaat gccattaagt 16680
gcacctacac tagtgccaca agagcactat gttagaatta ctggcttata cccaacactc 16740
aatatctcag atgagttttc tagcaatgtt gcaaattatc aaaaggttgg tatgcaaaag 16800
tattctacac tccagggacc acctggtact ggtaagagtc attttgctat tggcctagct 16860
ctctactacc cttctgctcg catagtgtat acagcttgct ctcatgccgc tgttgatgca 16920
ctatgtgaga aggcattaaa atatttgcct atagataaat gtagtagaat tatacctgca 16980
cgtgctcgtg tagattgttt tgataaattc aaagtgaatt caacattaga acagtatgtc 17040
ttttgtactg taaatgcatt gcctgagacg acagcagata tagttgtctt tgatgaaatt 17100
tcaatggcca caaattatga tttgagtgtt gtcaatgcca gattacgtgc taagcactat 17160
gtgtacattg gcgaccctgc tcaattacct gcaccacgca cattgctaac taagggcaca 17220
ctagaaccag aatatttcaa ttcagtgtgt agacttatga aaactatagg tccagacatg 17280
ttcctcggaa cttgtcggcg ttgtcctgct gaaattgttg acactgtgag tgctttggtt 17340
tatgataata agcttaaagc acataaagac aaatcagctc aatgctttaa aatgttttat 17400
aagggtgtta tcacgcatga tgtttcatct gcaattaaca ggccacaaat aggcgtggta 17460
agagaattcc ttacacgtaa ccctgcttgg agaaaagctg tctttatttc accttataat 17520
tcacagaatg ctgtagcctc aaagattttg ggactaccaa ctcaaactgt tgattcatca 17580
cagggctcag aatatgacta tgtcatattc actcaaacca ctgaaacagc tcactcttgt 17640
aatgtaaaca gatttaatgt tgctattacc agagcaaaag taggcatact ttgcataatg 17700
tctgatagag acctttatga caagttgcaa tttacaagtc ttgaaattcc acgtaggaat 17760
gtggcaactt tacaagctga aaatgtaaca ggactcttta aagattgtag taaggtaatc 17820
actgggttac atcctacaca ggcacctaca cacctcagtg ttgacactaa attcaaaact 17880
gaaggtttat gtgttgacat acctggcata cctaaggaca tgacctatag aagactcatc 17940
tctatgatgg gttttaaaat gaattatcaa gttaatggtt accctaacat gtttatcacc 18000
cgcgaagaag ctataagaca tgtacgtgca tggattggct tcgatgtcga ggggtgtcat 18060
gctactagag aagctgttgg taccaattta cctttacagc taggtttttc tacaggtgtt 18120
aacctagttg ctgtacctac aggttatgtt gatacaccta ataatacaga tttttccaga 18180
gttagtgcta aaccaccgcc tggagatcaa tttaaacacc tcataccact tatgtacaaa 18240
ggacttcctt ggaatgtagt gcgtataaag attgtacaaa tgttaagtga cacacttaga 18300
aatctctctg acagagtcgt atttgtctta tgggcacatg gctttgagtt gacatctatg 18360
aagtattttg tgaaaatagg acctgagcgc acctgttgtc tatgtgatag acgtgccaca 18420
tgcttttcca ctgcttcaga cacttatgcc tgttggcatc attctattgg atttgattac 18480
gtctataatc cgtttatgat tgatgttcaa caatggggtt ttacaggtaa cctacaaagc 18540
aaccatgatc tgtattgtca agtccatggt aatgcacatg tagctagttg tgatgcaatc 18600
atgactaggt gtctagctgt ccacgagtgc tttgttaagc gtgttgactg gactattgaa 18660
tatcctataa ttggtgatga actgaagatt aatgcggctt gtagaaaggt tcaacacatg 18720
gttgttaaag ctgcattatt agcagacaaa ttcccagttc ttcacgacat tggtaaccct 18780
aaagctatta agtgtgtacc tcaagctgat gtagaatgga agttctatga tgcacagcct 18840
tgtagtgaca aagcttataa aatagaagaa ttattctatt cttatgccac acattctgac 18900
aaattcacag atggtgtatg cctattttgg aattgcaatg tcgatagata tcctgctaat 18960
tccattgttt gtagatttga cactagagtg ctatctaacc ttaacttgcc tggttgtgat 19020
ggtggcagtt tgtatgtaaa taaacatgca ttccacacac cagcttttga taaaagtgct 19080
tttgttaatt taaaacaatt accatttttc tattactctg acagtccatg tgagtctcat 19140
ggaaaacaag tagtgtcaga tatagattat gtaccactaa agtctgctac gtgtataaca 19200
cgttgcaatt taggtggtgc tgtctgtaga catcatgcta atgagtacag attgtatctc 19260
gatgcttata acatgatgat ctcagctggc tttagcttgt gggtttacaa acaatttgat 19320
acttataacc tctggaacac ttttacaaga cttcagagtt tagaaaatgt ggcttttaat 19380
gttgtaaata agggacactt tgatggacaa cagggtgaag taccagtttc tatcattaat 19440
aacactgttt acacaaaagt tgatggtgtt gatgtagaat tgtttgaaaa taaaacaaca 19500
ttacctgtta atgtagcatt tgagctttgg gctaagcgca acattaaacc agtaccagag 19560
gtgaaaatac tcaataattt gggtgtggac attgctgcta atactgtgat ctgggactac 19620
aaaagagatg ctccagcaca tatatctact attggtgttt gttctatgac tgacatagcc 19680
aagaaaccaa ctgaaacgat ttgtgcacca ctcactgtct tttttgatgg tagagttgat 19740
ggtcaagtag acttatttag aaatgcccgt aatggtgttc ttattacaga aggtagtgtt 19800
aaaggtttac aaccatctgt aggtcccaaa caagctagtc ttaatggagt cacattaatt 19860
ggagaagccg taaaaacaca gttcaattat tataagaaag ttgatggtgt tgtccaacaa 19920
ttacctgaaa cttactttac tcagagtaga aatttacaag aatttaaacc caggagtcaa 19980
atggaaattg atttcttaga attagctatg gatgaattca ttgaacggta taaattagaa 20040
ggctatgcct tcgaacatat cgtttatgga gattttagtc atagtcagtt aggtggttta 20100
catctactga ttggactagc taaacgtttt aaggaatcac cttttgaatt agaagatttt 20160
attcctatgg acagtacagt taaaaactat ttcataacag atgcgcaaac aggttcatct 20220
aagtgtgtgt gttctgttat tgatttatta cttgatgatt ttgttgaaat aataaaatcc 20280
caagatttat ctgtagtttc taaggttgtc aaagtgacta ttgactatac agaaatttca 20340
tttatgcttt ggtgtaaaga tggccatgta gaaacatttt acccaaaatt acaatctagt 20400
caagcgtggc aaccgggtgt tgctatgcct aatctttaca aaatgcaaag aatgctatta 20460
gaaaagtgtg accttcaaaa ttatggtgat agtgcaacat tacctaaagg cataatgatg 20520
aatgtcgcaa aatatactca actgtgtcaa tatttaaaca cattaacatt agctgtaccc 20580
tataatatga gagttataca ttttggtgct ggttctgata aaggagttgc accaggtaca 20640
gctgttttaa gacagtggtt gcctacgggt acgctgcttg tcgattcaga tcttaatgac 20700
tttgtctctg atgcagattc aactttgatt ggtgattgtg caactgtaca tacagctaat 20760
aaatgggatc tcattattag tgatatgtac gaccctaaga ctaaaaatgt tacaaaagaa 20820
aatgactcta aagagggttt tttcacttac atttgtgggt ttatacaaca aaagctagct 20880
cttggaggtt ccgtggctat aaagannnnn nnnnnttctt ggaatgctga tctttatann 20940
ctcatgggac annnnnnnnn nnnnnnnncn nnnntnnnnn nnnnnaatgc gtcatcatct 21000
gaagnnnnnn nnnnnnnntg tnnnnnnnnn ggcaaaccac gcgaacaaat annnnnnnat 21060
gnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnacaaatc caattcagtt gtcttcctat 21120
tctttatttg acatgagtaa atttcccctt aaattaaggg gtactgttgt tatgtcttta 21180
aaagaaggtc aaatcaatga tatgatttta tctcttctta gtaaaggtag acttataatt 21240
agagaaaaca acagagttgt tatttctagt gatgttcttg ttaacaacta a 21291
<210> 337
<211> 13218
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 337
atggagagcc ttgtccctgg tttcaacgag aaaacacacg tccaactcag tttgcctgtt 60
ttacaggttc gcgacgtgct cgtacgtggc tttggagact ccgtggagga ggtcttatca 120
gaggcacgtc aacatcttaa agatggcact tgtggcttag tagaagttga aaaaggcgtt 180
ttgcctcaac ttgaacagcc ctatgtgttc atcaaacgtt cggatgctcg aactgcacct 240
catggtcatg ttatggttga gctggtagca gaactcgaag gcattcagta cggtcgtagt 300
ggtgagacac ttggtgtcct tgtccctcat gtgggcgaaa taccagtggc ttaccgcaag 360
gttcttcttc gtaagaacgg taataaagga gctggtggcc atagttacgg cgccgatcta 420
aagtcatttg acttaggcga cgagcttggc actgatcctt atgaagattt tcaagaaaac 480
tggaacacta aacatagcag tggtgttacc cgtgaactca tgcgtgagct taacggaggg 540
gcatacactc gctatgtcga taacaacttc tgtggccctg atggctaccc tcttgagtgc 600
attaaagacc ttctagcacg tgctggtaaa gcttcatgca ctttgtccga acaactggac 660
tttattgaca ctaagagggg tgtatactgc tgccgtgaac atgagcatga aattgcttgg 720
tacacggaac gttctgaaaa gagctatgaa ttgcagacac cttttgaaat taaattggca 780
aagaaatttg acatcttcaa tggggaatgt ccaaattttg tatttccctt aaattccata 840
atcaagacta ttcaaccaag ggttgaaaag aaaaagcttg atggctttat gggtagaatt 900
cgatccgtct atccagttgc gtcaccaaat gaatgcaacc aaatgtgcct ttcaactctc 960
atgaagtgtg atcattgtgg tgaaacttca tggcagacgg gcgattttgt taaagccact 1020
tgcgaatttt gtggcactga gaatttgact aaagaaggtg ccactacttg tggttactta 1080
acccaaaatg ctgttgttaa aatttattgt ccagcatgtc acaattcaga agtaggacct 1140
gagcatagtc ttgccgaata ccataatgaa tctggcttga aaaccattct tcgtaagggt 1200
ggtcgcacta ttgcctttgg aggctgtgtg ttctcttatg ttggttgcca taacaagtgt 1260
gcctattggg ttccacgtgc tagcgctaac ataggttgta accatacagg tgttgttgga 1320
gaaggttccg aaggtcttaa tgacaacctt cttgaaatac tccaaaaaga gaaagtcaac 1380
atcaatattg ttggtgactt taaacttaat gaagagatcg ccattatttt ggcatctttt 1440
tctgcttcca caagtgcttt tgtggaaact gtgaaaggtt tggattataa agcattcaaa 1500
caaattgttg aatcctgtgg taattttaaa gttacaaaag gaaaagctaa aaaaggtgcc 1560
tggaatattg gtgaacagaa atcaatactg agtcctcttt atgcatttgc atcagaggct 1620
gctcgtgttg tacgatcaat tttctcccgc actcttgaaa ctgctcaaaa ttctgtgcgt 1680
gttttacaga aggccgctat aacaatacta gatggaattt cacagtattc actgagactc 1740
attgatgcta tgatgttcac atctgatttg gctactaaca atctagttgt aatggcctac 1800
attacaggtg gtgttgttca gttgacttcg cagtggctaa ctaacatctt tggcactgtt 1860
tatgaaaaac tcaaacccgt ccttgattgg cttgaagaga agtttaagga aggtgtagag 1920
tttcttagag acggttggga aattgttaaa tttatctcaa cctgtgcttg tgaaattgtc 1980
ggtggacaaa ttgtcacctg tgcaaaggaa attaaggaga gtgttcagac attctttaag 2040
cttgtaaata aatttttggc tttgtgtgct gactctatca ttattggtgg agctaaactt 2100
aaagccttga atttaggtga aacatttgtc acgcactcaa agggattgta cagaaagtgt 2160
gttaaatcca gagaagaaac tggcctactc atgcctctaa aagccccaaa agaaattatc 2220
ttcttagagg gagaaacact tcccacagaa gtgttaacag aggaagttgt cttgaaaact 2280
ggtgatttac aaccattaga acaacctact agtgaagctg ttgaagctcc attggttggt 2340
acaccagttt gtattaacgg gcttatgttg ctcgaaatca aagacacaga aaagtactgt 2400
gcccttgcac ctaatatgat ggtaacaaac aataccttca cactcaaagg cggtgcacca 2460
acaaaggtta cttttggtga tgacactgtg atagaagtgc aaggttacaa gagtgtgaat 2520
atcacttttg aacttgatga aaggattgat aaagtactta atgagaagtg ctctgcctat 2580
acagttgaac tcggtacaga agtaaatgag ttcgcctgtg ttgtggcaga tgctgtcata 2640
aaaactttgc aaccagtatc tgaattactt acaccactgg gcattgattt agatgagtgg 2700
agtatggcta catactactt atttgatgag tctggtgagt ttaaattggc ttcacatatg 2760
tattgttctt tttaccctcc agatgaggat gaagaagaag gtgattgtga agaagaagag 2820
tttgagccat caactcaata tgagtatggt actgaagatg attaccaagg taaacctttg 2880
gaatttggtg ccacttctgc tgctcttcaa cctgaagaag agcaagaaga agattggtta 2940
gatgatgata gtcaacaaac tgttggtcaa caagacggca gtgaggacaa tcagacaact 3000
actattcaaa caattgttga ggttcaacct caattagaga tggaacttac accagttgtt 3060
cagactattg aagtgaatag ttttagtggt tatttaaaac ttactgacaa tgtatacatt 3120
aaaaatgcag acattgtgga agaagctaaa aaggtaaaac caacagtggt tgttaatgca 3180
gccaatgttt accttaaaca tggaggaggt gttgcaggag ccttaaataa ggctactaac 3240
aatgccatgc aagttgaatc tgatgattac atagctacta atggaccact taaagtgggt 3300
ggtagttgtg ttttaagcgg acacaatctt gctaaacact gtcttcatgt tgtcggccca 3360
aatgttaaca aaggtgaaga cattcaactt cttaagagtg cttatgaaaa ttttaatcag 3420
cacgaagttc tacttgcacc attattatca gctggtattt ttggtgctga ccctatacat 3480
tctttaagag tttgtgtaga tactgttcgc acaaatgtct acttagctgt ctttgataaa 3540
aatctctatg acaaacttgt ttcaagcttt ttggaaatga agagtgaaaa gcaagttgaa 3600
caaaagatcg ctgagattcc taaagaggaa gttaagccat ttataactga aagtaaacct 3660
tcagttgaac agagaaaaca agatgataag aaaatcaaag cttgtgttga agaagttaca 3720
acaactctgg aagaaactaa gttcctcaca gaaaacttgt tactttatat tgacattaat 3780
ggcaatcttc atccagattc tgccactctt gttagtgaca ttgacatcac tttcttaaag 3840
aaagatgctc catatatagt gggtgatgtt gttcaagagg gtgttttaac tgctgtggtt 3900
atacctacta aaaaggctgg tggcactact gaaatgctag cgaaagcttt gagaaaagtg 3960
ccaacagaca attatataac cacttacccg ggtcagggtt taaatggtta cactgtagag 4020
gaggcaaaga cagtgcttaa aaagtgtaaa agtgcctttt acattctacc atctattatc 4080
tctaatgaga agcaagaaat tcttggaact gtttcttgga atttgcgaga aatgcttgca 4140
catgcagaag aaacacgcaa attaatgcct gtctgtgtgg aaactaaagc catagtttca 4200
actatacagc gtaaatataa gggtattaaa atacaagagg gtgtggttga ttatggtgct 4260
agattttact tttacaccag taaaacaact gtagcgtcac ttatcaacac acttaacgat 4320
ctaaatgaaa ctcttgttac aatgccactt ggctatgtaa cacatggctt aaatttggaa 4380
gaagctgctc ggtatatgag atctctcaaa gtgccagcta cagtttctgt ttcttcacct 4440
gatgctgtta cagcgtataa tggttatctt acttcttctt ctaaaacacc tgaagaacat 4500
tttattgaaa ccatctcact tgctggttcc tataaagatt ggtcctattc tggacaatct 4560
acacaactag gtatagaatt tcttaagaga ggtgataaaa gtgtatatta cactagtaat 4620
cctaccacat tccacctaga tggtgaagtt atcacctttg acaatcttaa gacacttctt 4680
tctttgagag aagtgaggac tattaaggtg tttacaacag tagacaacat taacctccac 4740
acgcaagttg tggacatgtc aatgacatat ggacaacagt ttggtccaac ttatttggat 4800
ggagctgatg ttactaaaat aaaacctcat aattcacatg aaggtaaaac attttatgtt 4860
ttacctaatg atgacactct acgtgttgag gcttttgagt actaccacac aactgatcct 4920
agttttctgg gtaggtacat gtcagcatta aatcacacta aaaagtggaa atacccacaa 4980
gttaatggtt taacttctat taaatgggca gataacaact gttatcttgc cactgcattg 5040
ttaacactcc aacaaataga gttgaagttt aatccacctg ctctacaaga tgcttattac 5100
agagcaaggg ctggtgaagc tgctaacttt tgtgcactta tcttagccta ctgtaataag 5160
acagtaggtg agttaggtga tgttagagaa acaatgagtt acttgtttca acatgccaat 5220
ttagattctt gcaaaagagt cttgaacgtg gtgtgtaaaa cttgtggaca acagcagaca 5280
acccttaagg gtgtagaagc tgttatgtac atgggcacac tttcttatga acaatttaag 5340
aaaggtgttc agataccttg tacgtgtggt aaacaagcta caaaatatct agtacaacag 5400
gagtcacctt ttgttatgat gtcagcacca cctgctcagt atgaacttaa gcatggtaca 5460
tttacttgtg ctagtgagta cgctggtaat taccagtgtg gtcactataa acatataact 5520
tctaaagaaa ctttgtattg catagacggt gctttactta caaagtcctc agaatacaaa 5580
ggtcctatta cggatgtttt ctacaaagaa aacagttaca caacaaccat aaaaccagtt 5640
acttataaat tggatggtgt tgtttgtaca gaaattgacc ctaagttgga caattattat 5700
aagaaagaca attcttattt cacagagcaa ccaattgatc ttgtaccaaa ccaaccatat 5760
ccaaacgcaa gcttcgataa ttttaagttt gtatgtgata atatcaaatt tgctgatgat 5820
ttaaaccagt taactggtta taagaaacct gcttcaagag agcttaaagt tacatttttc 5880
cctgacttaa atggtgatgt ggtggctatt gattataaac actacacacc ctcttttaag 5940
aaaggagcta aattgttaca taaacctatt gtttggcatg ttaacaatgc aactaataaa 6000
gccacgtata aaccaaatac ctggtgtata cgttgtcttt ggagcacaaa accagttgaa 6060
acatcaaatt cgtttgatgt actgaagtca gaggacgcgc agggaatgga taatcttgcc 6120
tgcgaagatc taaaaccagt ctctgaagaa gtagtggaaa atcctaccat acagaaagac 6180
gttcttgagt gtaatgtgaa aactaccgaa gttgtaggag acattatact taaaccagca 6240
aataatagtt taaaaattac agaagaggtt ggccacacag atctaatggc tgcttatgta 6300
gacaattcta gtcttactat taagaaacct aatgaattat ctagagtatt aggtttgaaa 6360
acccttgcta ctcatggttt agctgctgtt aatagtgtcc cttgggatac tatagctaat 6420
tatgctaagc cttttcttaa caaagttgtt agtacaacta ctaacatagt tacacggtgt 6480
ttaaaccgtg tttgtactaa ttatatgcct tatttcttta ctttattgct acaattgtgt 6540
acttttacta gaagtacaaa ttctagaatt aaagcatcta tgccgactac tatagcaaag 6600
aatactgtta agagtgtcgg taaattttgt ctagaggctt catttaatta tttgaagtca 6660
cctaattttt ctaaactgat aaatattata atttggtttt tactattaag tgtttgccta 6720
ggttctttaa tctactcaac cgctgcttta ggtgttttaa tgtctaattt aggcatgcct 6780
tcttactgta ctggttacag agaaggctat ttgaactcta ctaatgtcac tattgcaacc 6840
tactgtactg gttctatacc ttgtagtgtt tgtcttagtg gtttagattc tttagacacc 6900
tatccttctt tagaaactat acaaattacc atttcatctt ttaaatggga tttaactgct 6960
tttggcttag ttgcagagtg gtttttggca tatattcttt tcactaggtt tttctatgta 7020
cttggattgg ctgcaatcat gcaattgttt ttcagctatt ttgcagtaca ttttattagt 7080
aattcttggc ttatgtggtt aataattaat cttgtacaaa tggccccgat ttcagctatg 7140
gttagaatgt acatcttctt tgcatcattt tattatgtat ggaaaagtta tgtgcatgtt 7200
gtagacggtt gtaattcatc aacttgtatg atgtgttaca aacgtaatag agcaacaaga 7260
gtcgaatgta caactattgt taatggtgtt agaaggtcct tttatgtcta tgctaatgga 7320
ggtaaaggct tttgcaaact acacaattgg aattgtgtta attgtgatac attctgtgct 7380
ggtagtacat ttattagtga tgaagttgcg agagacttgt cactacagtt taaaagacca 7440
ataaatccta ctgaccagtc ttcttacatc gttgatagtg ttacagtgaa gaatggttcc 7500
atccatcttt actttgataa agctggtcaa aagacttatg aaagacattc tctctctcat 7560
tttgttaact tagacaacct gagagctaat aacactaaag gttcattgcc tattaatgtt 7620
atagtttttg atggtaaatc aaaatgtgaa gaatcatctg caaaatcagc gtctgtttac 7680
tacagtcagc ttatgtgtca acctatactg ttactagatc aggcattagt gtctgatgtt 7740
ggtgatagtg cggaagttgc agttaaaatg tttgatgctt acgttaatac gttttcatca 7800
acttttaacg taccaatgga aaaactcaaa acactagttg caactgcaga agctgaactt 7860
gcaaagaatg tgtccttaga caatgtctta tctactttta tttcagcagc tcggcaaggg 7920
tttgttgatt cagatgtaga aactaaagat gttgttgaat gtcttaaatt gtcacatcaa 7980
tctgacatag aagttactgg cgatagttgt aataactata tgctcaccta taacaaagtt 8040
gaaaacatga caccccgtga ccttggtgct tgtattgact gtagtgcgcg tcatattaat 8100
gcgcaggtag caaaaagtca caacattgct ttgatatgga acgttaaaga tttcatgtca 8160
ttgtctgaac aactacgaaa acaaatacgt agtgctgcta aaaagaataa cttacctttt 8220
aagttgacat gtgcaactac tagacaagtt gttaatgttg taacaacaaa gatagcactt 8280
aagggtggta aaattgttaa taattggttg aagcagttaa ttaaagttac acttgtgttc 8340
ctttttgttg ctgctatttt ctatttaata acacctgttc atgtcatgtc taaacatact 8400
gacttttcaa gtgaaatcat aggatacaag gctattgatg gtggtgtcac tcgtgacata 8460
gcatctacag atacttgttt tgctaacaaa catgctgatt ttgacacatg gtttagccag 8520
cgtggtggta gttatactaa tgacaaagct tgcccattga ttgctgcagt cataacaaga 8580
gaagtgggtt ttgtcgtgcc tggtttgcct ggcacgatat tacgcacaac taatggtgac 8640
tttttgcatt tcttacctag agtttttagt gcagttggta acatctgtta cacaccatca 8700
aaacttatag agtacactga ctttgcaaca tcagcttgtg ttttggctgc tgaatgtaca 8760
atttttaaag atgcttctgg taagccagta ccatattgtt atgataccaa tgtactagaa 8820
ggttctgttg cttatgaaag tttacgccct gacacacgtt atgtgctcat ggatggctct 8880
attattcaat ttcctaacac ctaccttgaa ggttctgtta gagtggtaac aacttttgat 8940
tctgagtact gtaggcacgg cacttgtgaa agatcagaag ctggtgtttg tgtatctact 9000
agtggtagat gggtacttaa caatgattat tacagatctt taccaggagt tttctgtggt 9060
gtagatgctg taaatttact tactaatatg tttacaccac taattcaacc tattggtgct 9120
ttggacatat cagcatctat agtagctggt ggtattgtag ctatcgtagt aacatgcctt 9180
gcctactatt ttatgaggtt tagaagagct tttggtgaat acagtcatgt agttgccttt 9240
aatactttac tattccttat gtcattcact gtactctgtt taacaccagt ttactcattc 9300
ttacctggtg tttattctgt tatttacttg tacttgacat tttatcttac taatgatgtt 9360
tcttttttag cacatattca gtggatggtt atgttcacac ctttagtacc tttctggata 9420
acaattgctt atatcatttg tatttccaca aagcatttct attggttctt tagtaattac 9480
ctaaagagac gtgtagtctt taatggtgtt tcctttagta cttttgaaga agctgcgctg 9540
tgcacctttt tgttaaataa agaaatgtat ctaaagttgc gtagtgatgt gctattacct 9600
cttacgcaat ataatagata cttagctctt tataataagt acaagtattt tagtggagca 9660
atggatacaa ctagctacag agaagctgct tgttgtcatc tcgcaaaggc tctcaatgac 9720
ttcagtaact caggttctga tgttctttac caaccaccac aaacctctat cacctcagct 9780
gttttgcaga gtggttttag aaaaatggca ttcccatctg gtaaagttga gggttgtatg 9840
gtacaagtaa cttgtggtac aactacactt aacggtcttt ggcttgatga cgtagtttac 9900
tgtccaagac atgtgatctg cacctctgaa gacatgctta accctaatta tgaagattta 9960
ctcattcgta agtctaatca taatttcttg gtacaggctg gtaatgttca actcagggtt 10020
attggacatt ctatgcaaaa ttgtgtactt aagcttaagg ttgatacagc caatcctaag 10080
acacctaagt ataagtttgt tcgcattcaa ccaggacaga ctttttcagt gttagcttgt 10140
tacaatggtt caccatctgg tgtttaccaa tgtgctatga ggcccaattt cactattaag 10200
ggttcattcc ttaatggttc atgtggtagt gttggtttta acatagatta tgactgtgtc 10260
tctttttgtt acatgcacca tatggaatta ccaactggag ttcatgctgg cacagactta 10320
gaaggtaact tttatggacc ttttgttgac aggcaaacag cacaagcagc tggtacggac 10380
acaactatta cagttaatgt tttagcttgg ttgtacgctg ctgttataaa tggagacagg 10440
tggtttctca atcgatttac cacaactctt aatgacttta accttgtggc tatgaagtac 10500
aattatgaac ctctaacaca agatcatgtt gacatactag gacctctttc tgctcaaact 10560
ggaattgccg ttttagatat gtgtgcttca ttaaaagaat tactgcaaaa tggtatgaat 10620
ggacgtacca tattgggtag tgctttatta gaagatgaat ttacaccttt tgatgttgtt 10680
agacaatgct caggtgttac tttccaaagt gcagtgaaaa gaacaatcaa gggtacacac 10740
cactggttgt tactcacaat tttgacttca cttttagttt tagtccagag tactcaatgg 10800
tctttgttct tttttttgta tgaaaatgcc tttttacctt ttgctatggg tattattgct 10860
atgtctgctt ttgcaatgat gtttgtcaaa cataagcatg catttctctg tttgtttttg 10920
ttaccttctc ttgccactgt agcttatttt aatatggtct atatgcctgc tagttgggtg 10980
atgcgtatta tgacatggtt ggatatggtt gatactagtt tgtctggttt taagctaaaa 11040
gactgtgtta tgtatgcatc agctgtagtg ttactaatcc ttatgacagc aagaactgtg 11100
tatgatgatg gtgctaggag agtgtggaca cttatgaatg tcttgacact cgtttataaa 11160
gtttattatg gtaatgcttt agatcaagcc atttccatgt gggctcttat aatctctgtt 11220
acttctaact actcaggtgt agttacaact gtcatgtttt tggccagagg tattgttttt 11280
atgtgtgttg agtattgccc tattttcttc ataactggta atacacttca gtgtataatg 11340
ctagtttatt gtttcttagg ctatttttgt acttgttact ttggcctctt ttgtttactc 11400
aaccgctact ttagactgac tcttggtgtt tatgattact tagtttctac acaggagttt 11460
agatatatga attcacaggg actactccca cccaagaata gcatagatgc cttcaaactc 11520
aacattaaat tgttgggtgt tggtggcaaa ccttgtatca aagtagccac tgtacagtct 11580
aaaatgtcag atgtaaagtg cacatcagta gtcttactct cagttttgca acaactcaga 11640
gtagaatcat catctaaatt gtgggctcaa tgtgtccagt tacacaatga cattctctta 11700
gctaaagata ctactgaagc ctttgaaaaa atggtttcac tactttctgt tttgctttcc 11760
atgcagggtg ctgtagacat aaacaagctt tgtgaagaaa tgctggacaa cagggcaacc 11820
ttacaagcta tagcctcaga gtttagttcc cttccatcat atgcagcttt tgctactgct 11880
caagaagctt atgagcaggc tgttgctaat ggtgattctg aagttgttct taaaaagttg 11940
aagaagtctt tgaatgtggc taaatctgaa tttgaccgtg atgcagccat gcaacgtaag 12000
ttggaaaaga tggctgatca agctatgacc caaatgtata aacaggctag atctgaggac 12060
aagagggcaa aagttactag tgctatgcag acaatgcttt tcactatgct tagaaagttg 12120
gataatgatg cactcaacaa cattatcaac aatgcaagag atggttgtgt tcccttgaac 12180
ataatacctc ttacaacagc agccaaacta atggttgtca taccagacta taacacatat 12240
aaaaatacgt gtgatggtac aacatttact tatgcatcag cattgtggga aatccaacag 12300
gttgtagatg cagatagtaa aattgttcaa cttagtgaaa ttagtatgga caattcacct 12360
aatttagcat ggcctcttat tgtaacagct ttaagggcca attctgctgt caaattacag 12420
aataatgagc ttagtcctgt tgcactacga cagatgtctt gtgctgccgg tactacacaa 12480
actgcttgca ctgatgacaa tgcgttagct tactacaaca caacaaaggg aggtaggttt 12540
gtacttgcac tgttatccga tttacaggat ttgaaatggg ctagattccc taagagtgat 12600
ggaactggta ctatctatac agaactggaa ccaccttgta ggtttgttac agacacacct 12660
aaaggtccta aagtgaagta tttatacttt attaaaggat taaacaacct aaatagaggt 12720
atggtacttg gtagtttagc tgccacagta cgtctacaag ctggtaatgc aacagaagtg 12780
cctgccaatt caactgtatt atctttctgt gcttttgctg tagatgctgc taaagcttac 12840
aaagattatc tagctagtgg gggacaacca atcactaatt gtgttaagat gttgtgtaca 12900
cacactggta ctggtcaggc aataacagtt acaccggaag ccaatatgga tcaagaatcc 12960
tttggtggtg catcgtgttg tctgtactgc cgttgccaca tagatcatcc aaatcctaaa 13020
ggattttgtg acttaaaagg taagtatgta caaataccta caacttgtgt taatgaccct 13080
gtgggtttta cacttaaaaa cacagtctgt accgtctgcg gtatgtggaa aggttatggc 13140
tgtagttgtg atcaactccg cgaacccatg cttcagtcag ctgatgcaca atcgttttta 13200
aacgggtttg cggtgtaa 13218
<210> 338
<211> 3816
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 338
atgtttgttt ttcttgtttt attgccacta gtctctagtc agtgtgttaa tcttacaacc 60
agaactcaat taccccctgc atacactaat tctttcacac gtggtgttta ttaccctgac 120
aaagttttca gatcctcagt tttacattca actcaggact tgttcttacc tttcttttcc 180
aatgttactt ggttccatgc tatctctggg accaatggta ctaagaggtt tgataaccct 240
gtcctaccat ttaatgatgg tgtttatttt gcttccactg agaagtctaa cataataaga 300
ggctggattt ttggtactac tttagattcg aagacccagt ccctacttat tgttaataac 360
gctactaatg ttgttattaa agtctgtgaa tttcaatttt gtaatgatcc atttttgggt 420
gtttattacc acaaaaacaa caaaagttgg atggaaagtg agttcagagt ttattctagt 480
gcgaataatt gcacttttga atatgtctct cagccttttc ttatggacct tgaaggaaaa 540
cagggtaatt tcaaaaatct tagggaattt gtgtttaaga atattgatgg ttattttaaa 600
atatattcta agcacacgcc tattaattta gtgcgtgatc tccctcaggg tttttcggct 660
ttagaaccat tggtagattt gccaataggt attaacatca ctaggtttca aactttactt 720
gctttacata gaagttattt gactcctggt gattcttctt caggttggac agctggtgct 780
gcagcttatt atgtgggtta tcttcaacct aggacttttc tattaaaata taatgaaaat 840
ggaaccatta cagatgctgt agactgtgca cttgaccctc tctcagaaac aaagtgtacg 900
ttgaaatcct tcactgtaga aaaaggaatc tatcaaactt ctaactttag agtccaacca 960
acagaatcta ttgttagatt tcctaatatt acaaacttgt gcccttttgg tgaagttttt 1020
aacgccacca gatttgcatc tgtttatgct tggaacagga agagaatcag caactgtgtt 1080
gctgattatt ctgtcctata taattccgca tcattttcca cttttaagtg ttatggagtg 1140
tctcctacta aattaaatga tctctgcttt actaatgtct atgcagattc atttgtaatt 1200
agaggtgatg aagtcagaca aatcgctcca gggcaaactg gaaagattgc tgattataat 1260
tataaattac cagatgattt tacaggctgc gttatagctt ggaattctaa caatcttgat 1320
tctaaggttg gtggtaatta taattacctg tatagattgt ttaggaagtc taatctcaaa 1380
ccttttgaga gagatatttc aactgaaatc tatcaggccg gtagcacacc ttgtaatggt 1440
gttgaaggtt ttaattgtta ctttccttta caatcatatg gtttccaacc cactaatggt 1500
gttggttacc aaccatacag agtagtagta ctttcttttg aacttctaca tgcaccagca 1560
actgtttgtg gacctaaaaa gtctactaat ttggttaaaa acaaatgtgt caatttcaac 1620
ttcaatggtt taacaggcac aggtgttctt actgagtcta acaaaaagtt tctgcctttc 1680
caacaatttg gcagagacat tgctgacact actgatgctg tccgtgatcc acagacactt 1740
gagattcttg acattacacc atgttctttt ggtggtgtca gtgttataac accaggaaca 1800
aatacttcta accaggttgc tgttctttat cagggtgtta actgcacaga agtccctgtt 1860
gctattcatg cagatcaact tactcctact tggcgtgttt attctacagg ttctaatgtt 1920
tttcaaacac gtgcaggctg tttaataggg gctgaacatg tcaacaactc atatgagtgt 1980
gacataccca ttggtgcagg tatatgcgct agttatcaga ctcagactaa ttctcctcgg 2040
cgggcacgta gtgtagctag tcaatccatc attgcctaca ctatgtcact tggtgcagaa 2100
aattcagttg cttactctaa taactctatt gccataccca caaattttac tattagtgtt 2160
accacagaaa ttctaccagt gtctatgacc aagacatcag tagattgtac aatgtacatt 2220
tgtggtgatt caactgaatg cagcaatctt ttgttgcaat atggcagttt ttgtacacaa 2280
ttaaaccgtg ctttaactgg aatagctgtt gaacaagaca aaaacaccca agaagttttt 2340
gcacaagtca aacaaattta caaaacacca ccaattaaag attttggtgg ttttaatttt 2400
tcacaaatat taccagatcc atcaaaacca agcaagagat catttattga agatctactt 2460
ttcaacaaag tgacacttgc agatgctggc ttcatcaaac aatatggtga ttgccttggt 2520
gatattgctg ctagagacct catttgtgca caaaagttta acggccttac tgttttgcca 2580
cctttgctca cagatgaaat gattgctcaa tacacttctg cactgttagc gggtacaatc 2640
acttctggtt ggacctttgg tgcaggtgct gcattacaaa taccatttgc tatgcaaatg 2700
gcttataggt ttaatggtat tggagttaca cagaatgttc tctatgagaa ccaaaaattg 2760
attgccaacc aatttaatag tgctattggc aaaattcaag actcactttc ttccacagca 2820
agtgcacttg gaaaacttca agatgtggtc aaccaaaatg cacaagcttt aaacacgctt 2880
gttaaacaac ttagctccaa ttttggtgca atttcaagtg ttttaaatga tatcctttca 2940
cgtcttgaca aagttgaggc tgaagtgcaa attgataggt tgatcacagg cagacttcaa 3000
agtttgcaga catatgtgac tcaacaatta attagagctg cagaaatcag agcttctgct 3060
aatcttgctg ctactaaaat gtcagagtgt gtacttggac aatcaaaaag agttgatttt 3120
tgtggaaagg gctatcatct tatgtccttc cctcagtcag cacctcatgg tgtagtcttc 3180
ttgcatgtga cttatgtccc tgcacaagaa aagaacttca caactgctcc tgccatttgt 3240
catgatggaa aagcacactt tcctcgtgaa ggtgtctttg tttcaaatgg cacacactgg 3300
tttgtaacac aaaggaattt ttatgaacca caaatcatta ctacagacaa cacatttgtg 3360
tctggtaact gtgatgttgt aataggaatt gtcaacaaca cagtttatga tcctttgcaa 3420
cctgaattag actcattcaa ggaggagtta gataaatatt ttaagaatca tacatcacca 3480
gatgttgatt taggtgacat ctctggcatt aatgcttcag ttgtaaacat tcaaaaagaa 3540
attgaccgcc tcaatgaggt tgccaagaat ttaaatgaat ctctcatcga tctccaagaa 3600
cttggaaagt atgagcagta tataaaatgg ccatggtaca tttggctagg ttttatagct 3660
ggcttgattg ccatagtaat ggtgacaatt atgctttgct gtatgaccag ttgctgtagt 3720
tgtctcaagg gctgttgttc ttgtggatcc tgctgcaaat ttgatgaaga cgactctgag 3780
ccagtgctca aaggagtcaa attacattac acataa 3816
<210> 339
<211> 828
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 339
atggatttgt ttatgagaat cttcacaatt ggaactgtaa ctttgaagca aggtgaaatc 60
aaggatgcta ctccttcaga ttttgttcgc gctactgcaa cgataccgat acaagcctca 120
ctccctttcg gatggcttat tgttggcgtt gcacttcttg ctgtttttca tagcgcttcc 180
aaaatcataa ccctcaaaaa gagatggcaa ctagcactct ccaagggtgt tcactttgtt 240
tgcaacttgc tgttgttgtt tgtaacagtt tactcacacc ttttgctcgt tgctgctggc 300
cttgaagccc cttttctcta tctttatgct ttagtctact tcttgcagag tataaacttt 360
gtaagaataa taatgaggct ttggctttgc tggaaatgcc gttccaaaaa cccattactt 420
tatgatgcca actattttct ttgctggcat attaattgtt acgactattg tataccttac 480
aatagtgtaa cttcttcaat tgtcattact tcaggtgatg gcacaacaag tcctatttct 540
gaacatgact accagattgg tggttatact gaaaaatggg aatctggagt aaaagactgt 600
gttgtattac acagttactt cacttcagac tattaccagc tgtactcaac tcaattgagt 660
acagacactg gtgttgaaca tgttaccttc ttcatctaca ataaaattgt tgatgagcct 720
gaagaacatg tccaaattca cacaatcgac ggttcatccg gagttgttaa tccagtaatg 780
gaaccaattt atgatgaacc gacgacgact actagcgtgc ctttgtaa 828
<210> 340
<211> 228
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 340
atgtactcat tcgtttcgga agagacaggt acgttaatag ttaatagcgt acttcttttt 60
cttgctttcg tggtattctt gctagttaca ctagccatcc ttactgcgct tcgattgtgt 120
gcgtactgct gcaatattgt taacgtgagt cttgtaaaac cttcttttta cgtttactct 180
cgtgttaaaa atctgaattc ttctagagtt cctgatcttc tggtctaa 228
<210> 341
<211> 669
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 341
atggcagatt ccaacggtac tattaccgtt gaagagctta aaaagctcct tgaacaatgg 60
aacctagtaa taggtttcct attccttaca tggatttgtc ttctacaatt tgcctatgcc 120
aacaggaata ggtttttgta tgtaattaag ttaattttcc tctggctgtt atggccagta 180
actttagctt gttttgtgct tgctgctgtt tacagaataa attggatcac cggtggaatt 240
gctatcgcaa tggcttgtct tgtaggcttg atgtggctca gctacttcat tgcttctttc 300
agactgtttg cgcgtacgcg ttccatgtgg tcattcaatc cagaaactaa cattcttctc 360
aacgtgccac tccatggcac tattctgacc agaccgcttc tagaaagtga actcgtaatc 420
ggagctgtga tccttcgtgg acatcttcgt attgctggac accatctagg acgctgtgac 480
atcaaggacc tgcctaaaga aatcactgtt gctacatcac gaacgctttc ttattacaaa 540
ttgggagctt cgcagcgtgt agcaggtgac tcaggttttg ctgcatacag tcgctacagg 600
attggcaact ataaattaaa cacagaccat tccagtagca gtgacaatat tgctttgctt 660
gtacagtaa 669
<210> 342
<211> 186
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 342
atgtttcatc tcgttgactt tcaggttact atagcagaga tattactaat tattatgagg 60
acttttaaag tttccatttg gaatcttgat tacatcataa acctcataat taaaaattta 120
tctaagtcac taactgagaa taaatattct caattagatg aagagcaacc aatggagatt 180
gattaa 186
<210> 343
<211> 366
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 343
atgaaaatta ttcttttctt ggcactgata acactcgcta cttgtgagct ttatcactac 60
caagagtgtg ttagaggtac aacagtactt ttaaaagaac cttgctcttc tggaacatac 120
gagggcaatt caccatttca tcctctagct gataacaaat ttgcactgac ttgctttagc 180
actcaatttg cttttgcttg tcctgacggc gtaaaacacg tctatcagtt acgtgccaga 240
tcagtttcac ctaaactgtt catcagacaa gaggaagttc aagaacttta ctctccaatt 300
tttcttattg ttgcggcaat agtgtttata acactttgct tcacactcaa aagaaagaca 360
gaatga 366
<210> 344
<211> 132
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 344
atgattgaac tttcattaat tgacttctat ttgtgctttt tagcctttct gctattcctt 60
gttttaatta tgcttattat cttttggttc tcacttgaac tgcaagatca taatgaaact 120
tgtcacgcct aa 132
<210> 345
<211> 366
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 345
atgaaatttc ttgttttctt aggaatcatc acaactgtag ctgcatttca ccaagaatgt 60
agtttacagt catgtactca acatcaacca tatgtagttg atgacccgtg tcctattcac 120
ttctattcta aatggtatat tagagtagga gctagaaaat cagcaccttt aattgaattg 180
tgcgtggatg aggctggttc taaatcaccc attcagtaca tcgatatcgg taattataca 240
gtttcctgtt taccttttac aattaattgc caggaaccta aattgggtag tcttgtagtg 300
cgttgttcgt tctatgaaga ctttttagag tatcatgacg ttcgtgttgt tttagatttc 360
atctaa 366
<210> 346
<211> 1260
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 346
atgtctgata atggacccca aaatcagcga aatgcacccc gcattacgtt tggtggaccc 60
tcagattcaa ctggcagtaa ccagaatgga gaacgcagtg gggcgcgatc aaaacaacgt 120
cggccccaag gtttacccaa taatactgcg tcttggttca ccgctctcac tcaacatggc 180
aaggaagacc ttaaattccc tcgaggacaa ggcgttccaa ttaacaccaa tagcagtcca 240
gatgaccaaa ttggctacta ccgaagagct accagacgaa ttcgtggtgg tgacggtaaa 300
atgaaagatc tcagtccaag atggtatttc tactacctag gaactgggcc agaagctgga 360
cttccctatg gtgctaacaa agacggcatc atatgggttg caactgaggg agcctttaat 420
acaccaaaag atcacattgg cacccgcaat cctgctaaca atgctgcaat cgtgctacaa 480
cttcctcaag gaacaacatt gccaaaaggc ttctacgcag aagggagcag aggcggcagt 540
caagcctctt ctcgttcctc atcacgtagt cgcaacagtt caagaaattc aactccaggc 600
agcagtaggg gaatttctcc tgctagaatg gctggcaatg gcggtgatgc tgctcttgct 660
ttgctgctgc ttgacagatt gaaccagctt gagagcaaaa tgtctggtaa aggccaacaa 720
caacaaggcc aaactgtcac taagaaatct gctgctgagg cttctaagaa gcctcggcaa 780
aaacgtactg ccactaaagc atacaatgta acacaagctt tcggcagacg tggtccagaa 840
caaacccaag gaaattttgg ggaccaggaa ctaatcagac aaggaactga ttacaaacat 900
tggccgcaaa ttgcacaatt tgcccccagc gcttcagcgt tcttcggaat gtcgcgcatt 960
ggcatggaag tcacaccttc gggaacgtgg ttgacctaca caggtgccat caaattggat 1020
gacaaagatc caaatttcaa agatcaagtc attttgctga ataagcatat tgacgcatac 1080
aaaacattcc caccaacaga gcctaaaaag gacaaaaaga agaaggctga tgaaactcaa 1140
gccttaccgc agagacagaa gaaacagcaa actgtgactc ttcttcctgc tgcagatttg 1200
gatgatttct ccaaacaatt gcaacaatcc atgagcagtg ctgactcaac tcaggcctaa 1260
<210> 347
<211> 117
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 347
atgggctata taaacgtttt cgcttttccg tttacgatat atagtctact cttgtgcaga 60
atgaattctc gtaactacat agcacaagta gatgtagtta actttaatct cacatag 117
<210> 348
<400> 348
000
<210> 349
<400> 349
000
<210> 350
<400> 350
000
<210> 351
<400> 351
000
<210> 352
<400> 352
000
<210> 353
<400> 353
000
<210> 354
<400> 354
000
<210> 355
<400> 355
000
<210> 356
<400> 356
000
<210> 357
<400> 357
000
<210> 358
<400> 358
000
<210> 359
<400> 359
000
<210> 360
<400> 360
000
<210> 361
<400> 361
000
<210> 362
<400> 362
000
<210> 363
<400> 363
000
<210> 364
<400> 364
000
<210> 365
<400> 365
000
<210> 366
<400> 366
000
<210> 367
<400> 367
000
<210> 368
<400> 368
000
<210> 369
<400> 369
000
<210> 370
<400> 370
000
<210> 371
<400> 371
000
<210> 372
<400> 372
000
<210> 373
<400> 373
000
<210> 374
<400> 374
000
<210> 375
<400> 375
000
<210> 376
<400> 376
000
<210> 377
<400> 377
000
<210> 378
<400> 378
000
<210> 379
<400> 379
000
<210> 380
<400> 380
000
<210> 381
<400> 381
000
<210> 382
<400> 382
000
<210> 383
<400> 383
000
<210> 384
<400> 384
000
<210> 385
<400> 385
000
<210> 386
<400> 386
000
<210> 387
<400> 387
000
<210> 388
<400> 388
000
<210> 389
<400> 389
000
<210> 390
<400> 390
000
<210> 391
<400> 391
000
<210> 392
<400> 392
000
<210> 393
<400> 393
000
<210> 394
<400> 394
000
<210> 395
<400> 395
000
<210> 396
<400> 396
000
<210> 397
<400> 397
000
<210> 398
<400> 398
000
<210> 399
<400> 399
000
<210> 400
<400> 400
000
<210> 401
<211> 7093
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 401
Met Glu Ser Leu Val Pro Gly Phe Asn Glu Lys Thr His Val Gln Leu
1 5 10 15
Ser Leu Pro Val Leu Gln Val Arg Asp Val Leu Val Arg Gly Phe Gly
20 25 30
Asp Ser Val Glu Glu Val Leu Ser Glu Ala Arg Gln His Leu Lys Asp
35 40 45
Gly Thr Cys Gly Leu Val Glu Val Glu Lys Gly Val Leu Pro Gln Leu
50 55 60
Glu Gln Pro Tyr Val Phe Ile Lys Arg Ser Asp Ala Arg Thr Ala Pro
65 70 75 80
His Gly His Val Met Val Glu Leu Val Ala Glu Leu Glu Gly Ile Gln
85 90 95
Tyr Gly Arg Ser Gly Glu Thr Leu Gly Val Leu Val Pro His Val Gly
100 105 110
Glu Ile Pro Val Ala Tyr Arg Lys Val Leu Leu Arg Lys Asn Gly Asn
115 120 125
Lys Gly Ala Gly Gly His Ser Tyr Gly Ala Asp Leu Lys Ser Phe Asp
130 135 140
Leu Gly Asp Glu Leu Gly Thr Asp Pro Tyr Glu Asp Phe Gln Glu Asn
145 150 155 160
Trp Asn Thr Lys His Ser Ser Gly Val Thr Arg Glu Leu Met Arg Glu
165 170 175
Leu Asn Gly Gly Ala Tyr Thr Arg Tyr Val Asp Asn Asn Phe Cys Gly
180 185 190
Pro Asp Gly Tyr Pro Leu Glu Cys Ile Lys Asp Leu Leu Ala Arg Ala
195 200 205
Gly Lys Ala Ser Cys Thr Leu Ser Glu Gln Leu Asp Phe Ile Asp Thr
210 215 220
Lys Arg Gly Val Tyr Cys Cys Arg Glu His Glu His Glu Ile Ala Trp
225 230 235 240
Tyr Thr Glu Arg Ser Glu Lys Ser Tyr Glu Leu Gln Thr Pro Phe Glu
245 250 255
Ile Lys Leu Ala Lys Lys Phe Asp Thr Phe Asn Gly Glu Cys Pro Asn
260 265 270
Phe Val Phe Pro Leu Asn Ser Ile Ile Lys Thr Ile Gln Pro Arg Val
275 280 285
Glu Lys Lys Lys Leu Asp Gly Phe Met Gly Arg Ile Arg Ser Val Tyr
290 295 300
Pro Val Ala Ser Pro Asn Glu Cys Asn Gln Met Cys Leu Ser Thr Leu
305 310 315 320
Met Lys Cys Asp His Cys Gly Glu Thr Ser Trp Gln Thr Gly Asp Phe
325 330 335
Val Lys Ala Thr Cys Glu Phe Cys Gly Thr Glu Asn Leu Thr Lys Glu
340 345 350
Gly Ala Thr Thr Cys Gly Tyr Leu Pro Gln Asn Ala Val Val Lys Ile
355 360 365
Tyr Cys Pro Ala Cys His Asn Ser Glu Val Gly Pro Glu His Ser Leu
370 375 380
Ala Glu Tyr His Asn Glu Ser Gly Leu Lys Thr Ile Leu Arg Lys Gly
385 390 395 400
Gly Arg Thr Ile Ala Phe Gly Gly Cys Val Phe Ser Tyr Val Gly Cys
405 410 415
His Asn Lys Cys Ala Tyr Trp Val Pro Arg Ala Ser Ala Asn Ile Gly
420 425 430
Cys Asn His Thr Gly Val Val Gly Glu Gly Ser Glu Gly Leu Asn Asp
435 440 445
Asn Leu Leu Glu Ile Leu Gln Lys Glu Lys Val Asn Ile Asn Ile Val
450 455 460
Gly Asp Phe Lys Leu Asn Glu Glu Ile Ala Ile Ile Leu Ala Ser Phe
465 470 475 480
Ser Ala Ser Thr Ser Ala Phe Val Glu Thr Val Lys Gly Leu Asp Tyr
485 490 495
Lys Ala Phe Lys Gln Ile Val Glu Ser Cys Gly Asn Phe Lys Val Thr
500 505 510
Lys Gly Lys Ala Lys Lys Gly Ala Trp Asn Ile Gly Glu Gln Lys Ser
515 520 525
Ile Leu Ser Pro Leu Tyr Ala Phe Ala Ser Glu Ala Ala Arg Val Val
530 535 540
Arg Ser Ile Phe Ser Arg Thr Leu Glu Thr Ala Gln Asn Ser Val Arg
545 550 555 560
Val Leu Gln Lys Ala Ala Ile Thr Ile Leu Asp Gly Ile Ser Gln Tyr
565 570 575
Ser Leu Arg Leu Ile Asp Ala Met Met Phe Thr Ser Asp Leu Ala Thr
580 585 590
Asn Asn Leu Val Val Met Ala Tyr Ile Thr Gly Gly Val Val Gln Leu
595 600 605
Thr Ser Gln Trp Leu Thr Asn Ile Phe Gly Thr Val Tyr Glu Lys Leu
610 615 620
Lys Pro Val Leu Asp Trp Leu Glu Glu Lys Phe Lys Glu Gly Val Glu
625 630 635 640
Phe Leu Arg Asp Gly Trp Glu Ile Val Lys Phe Ile Ser Thr Cys Ala
645 650 655
Cys Glu Ile Val Gly Gly Gln Ile Val Thr Cys Ala Lys Glu Ile Lys
660 665 670
Glu Ser Val Gln Thr Phe Phe Lys Leu Val Asn Lys Phe Leu Ala Leu
675 680 685
Cys Ala Asp Ser Ile Ile Ile Gly Gly Ala Lys Leu Lys Ala Leu Asn
690 695 700
Leu Gly Glu Thr Phe Val Thr His Ser Lys Gly Leu Tyr Arg Lys Cys
705 710 715 720
Val Lys Ser Arg Glu Glu Thr Gly Leu Leu Met Pro Leu Lys Ala Pro
725 730 735
Lys Glu Ile Ile Phe Leu Glu Gly Glu Thr Leu Pro Thr Glu Val Leu
740 745 750
Thr Glu Glu Val Val Leu Lys Thr Gly Asp Leu Gln Pro Leu Glu Gln
755 760 765
Pro Thr Ser Glu Ala Val Glu Ala Pro Leu Val Gly Thr Pro Val Cys
770 775 780
Ile Asn Gly Leu Met Leu Leu Glu Ile Lys Asp Thr Glu Lys Tyr Cys
785 790 795 800
Ala Leu Ala Pro Asn Met Met Val Thr Asn Asn Thr Phe Thr Leu Lys
805 810 815
Gly Gly Ala Pro Thr Lys Val Thr Phe Gly Asp Asp Thr Val Ile Glu
820 825 830
Val Gln Gly Tyr Lys Ser Val Asn Ile Thr Phe Glu Leu Asp Glu Arg
835 840 845
Ile Asp Lys Val Leu Asn Glu Lys Cys Ser Ala Tyr Thr Val Glu Leu
850 855 860
Gly Thr Glu Val Asn Glu Phe Ala Cys Val Val Ala Asp Ala Val Ile
865 870 875 880
Lys Thr Leu Gln Pro Val Ser Glu Leu Leu Thr Pro Leu Gly Ile Asp
885 890 895
Leu Asp Glu Trp Ser Met Ala Thr Tyr Tyr Leu Phe Asp Glu Ser Gly
900 905 910
Glu Phe Lys Leu Ala Ser His Met Tyr Cys Ser Phe Tyr Pro Pro Asp
915 920 925
Glu Asp Glu Glu Glu Gly Asp Cys Glu Glu Glu Glu Phe Glu Pro Ser
930 935 940
Thr Gln Tyr Glu Tyr Gly Thr Glu Asp Asp Tyr Gln Gly Lys Pro Leu
945 950 955 960
Glu Phe Gly Ala Thr Ser Ala Ala Leu Gln Pro Glu Glu Glu Gln Glu
965 970 975
Glu Asp Trp Leu Asp Asp Asp Ser Gln Gln Thr Val Gly Gln Gln Asp
980 985 990
Gly Ser Glu Asp Asn Gln Thr Thr Ile Ile Gln Thr Ile Val Glu Val
995 1000 1005
Gln Pro Gln Leu Glu Met Glu Leu Thr Pro Val Val Gln Thr Ile
1010 1015 1020
Glu Val Asn Ser Phe Ser Gly Tyr Leu Lys Leu Thr Asp Asn Val
1025 1030 1035
Tyr Ile Lys Asn Ala Asp Ile Val Glu Glu Ala Lys Lys Val Lys
1040 1045 1050
Pro Thr Val Val Val Asn Ala Ala Asn Val Tyr Leu Lys His Gly
1055 1060 1065
Gly Gly Val Ala Gly Ala Leu Asn Lys Ala Thr Asn Asn Ala Met
1070 1075 1080
Gln Val Glu Ser Asp Asp Tyr Ile Ala Thr Asn Gly Pro Leu Lys
1085 1090 1095
Val Gly Gly Ser Cys Val Leu Ser Gly His Asn Leu Ala Lys His
1100 1105 1110
Cys Leu His Val Val Gly Pro Asn Val Asn Lys Gly Glu Asp Ile
1115 1120 1125
Gln Leu Leu Lys Ser Ala Tyr Glu Asn Phe Asn Gln His Glu Val
1130 1135 1140
Leu Leu Ala Pro Leu Leu Ser Ala Gly Ile Phe Gly Ala Asp Pro
1145 1150 1155
Ile His Ser Leu Arg Val Cys Val Asp Thr Val Arg Thr Asn Val
1160 1165 1170
Tyr Leu Ala Val Phe Asp Lys Asn Leu Tyr Asp Lys Leu Val Ser
1175 1180 1185
Ser Phe Leu Glu Met Lys Ser Glu Lys Gln Val Glu Gln Lys Ile
1190 1195 1200
Ala Glu Ile Pro Lys Glu Glu Val Lys Pro Phe Ile Thr Glu Ser
1205 1210 1215
Lys Pro Ser Val Glu Gln Arg Lys Gln Asp Asp Lys Lys Ile Lys
1220 1225 1230
Ala Cys Val Glu Glu Val Thr Thr Thr Leu Glu Glu Thr Lys Phe
1235 1240 1245
Leu Thr Glu Asn Leu Leu Leu Tyr Ile Asp Ile Asn Gly Asn Leu
1250 1255 1260
His Pro Asp Ser Ala Thr Leu Val Ser Asp Ile Asp Ile Thr Phe
1265 1270 1275
Leu Lys Lys Asp Ala Pro Tyr Ile Val Gly Asp Val Val Gln Glu
1280 1285 1290
Gly Val Leu Thr Ala Val Val Ile Pro Thr Lys Lys Ala Gly Gly
1295 1300 1305
Thr Thr Glu Met Leu Ala Lys Ala Leu Arg Lys Val Pro Thr Asp
1310 1315 1320
Asn Tyr Ile Thr Thr Tyr Pro Gly Gln Gly Leu Asn Gly Tyr Thr
1325 1330 1335
Val Glu Glu Ala Lys Thr Val Leu Lys Lys Cys Lys Ser Ala Phe
1340 1345 1350
Tyr Ile Leu Pro Ser Ile Ile Ser Asn Glu Lys Gln Glu Ile Leu
1355 1360 1365
Gly Thr Val Ser Trp Asn Leu Arg Glu Met Leu Ala His Ala Glu
1370 1375 1380
Glu Thr Arg Lys Leu Met Pro Val Cys Val Glu Thr Lys Ala Ile
1385 1390 1395
Val Ser Thr Ile Gln Arg Lys Tyr Lys Gly Ile Lys Ile Gln Glu
1400 1405 1410
Gly Val Val Asp Tyr Gly Ala Arg Phe Tyr Phe Tyr Thr Ser Lys
1415 1420 1425
Thr Thr Val Ala Ser Leu Ile Asn Thr Leu Asn Asp Leu Asn Glu
1430 1435 1440
Thr Leu Val Thr Met Pro Leu Gly Tyr Val Thr His Gly Leu Asn
1445 1450 1455
Leu Glu Glu Ala Ala Arg Tyr Met Arg Ser Leu Lys Val Pro Ala
1460 1465 1470
Thr Val Ser Val Ser Ser Pro Asp Ala Val Thr Ala Tyr Asn Gly
1475 1480 1485
Tyr Leu Thr Ser Ser Ser Lys Thr Pro Glu Glu His Phe Ile Glu
1490 1495 1500
Thr Ile Ser Leu Ala Gly Ser Tyr Lys Asp Trp Ser Tyr Ser Gly
1505 1510 1515
Gln Ser Thr Gln Leu Gly Ile Glu Phe Leu Lys Arg Gly Asp Lys
1520 1525 1530
Ser Val Tyr Tyr Thr Ser Asn Pro Thr Thr Phe His Leu Asp Gly
1535 1540 1545
Glu Val Ile Thr Phe Asp Asn Leu Lys Thr Leu Leu Ser Leu Arg
1550 1555 1560
Glu Val Arg Thr Ile Lys Val Phe Thr Thr Val Asp Asn Ile Asn
1565 1570 1575
Leu His Thr Gln Val Val Asp Met Ser Met Thr Tyr Gly Gln Gln
1580 1585 1590
Phe Gly Pro Thr Tyr Leu Asp Gly Ala Asp Val Thr Lys Ile Lys
1595 1600 1605
Pro His Asn Ser His Glu Gly Lys Thr Phe Tyr Val Leu Pro Asn
1610 1615 1620
Asp Asp Thr Leu Arg Val Glu Ala Phe Glu Tyr Tyr His Thr Thr
1625 1630 1635
Asp Pro Ser Phe Leu Gly Arg Tyr Met Ser Ala Leu Asn His Thr
1640 1645 1650
Lys Lys Trp Lys Tyr Pro Gln Val Asn Gly Leu Thr Ser Ile Lys
1655 1660 1665
Trp Ala Asp Asn Asn Cys Tyr Leu Ala Thr Ala Leu Leu Thr Leu
1670 1675 1680
Gln Gln Ile Glu Leu Lys Phe Asn Pro Pro Ala Leu Gln Asp Ala
1685 1690 1695
Tyr Tyr Arg Ala Arg Ala Gly Glu Ala Asp Asn Phe Cys Ala Leu
1700 1705 1710
Ile Leu Ala Tyr Cys Asn Lys Thr Val Gly Glu Leu Gly Asp Val
1715 1720 1725
Arg Glu Thr Met Ser Tyr Leu Phe Gln His Ala Asn Leu Asp Ser
1730 1735 1740
Cys Lys Arg Val Leu Asn Val Val Cys Lys Thr Cys Gly Gln Gln
1745 1750 1755
Gln Thr Thr Leu Lys Gly Val Glu Ala Val Met Tyr Met Gly Thr
1760 1765 1770
Leu Ser Tyr Glu Gln Phe Lys Lys Gly Val Gln Ile Pro Cys Thr
1775 1780 1785
Cys Gly Lys Gln Ala Thr Lys Tyr Leu Val Gln Gln Glu Ser Pro
1790 1795 1800
Phe Val Met Met Ser Ala Pro Pro Ala Gln Tyr Glu Leu Lys His
1805 1810 1815
Gly Thr Phe Thr Cys Ala Ser Glu Tyr Thr Gly Asn Tyr Gln Cys
1820 1825 1830
Gly His Tyr Lys His Ile Thr Ser Lys Glu Thr Leu Tyr Cys Ile
1835 1840 1845
Asp Gly Ala Leu Leu Thr Lys Ser Ser Glu Tyr Lys Gly Pro Ile
1850 1855 1860
Thr Asp Val Phe Tyr Lys Glu Asn Ser Tyr Thr Thr Thr Ile Lys
1865 1870 1875
Pro Val Thr Tyr Lys Leu Asp Gly Val Val Cys Thr Glu Ile Asp
1880 1885 1890
Pro Lys Leu Asp Asn Tyr Tyr Lys Lys Asp Asn Ser Tyr Phe Thr
1895 1900 1905
Glu Gln Pro Ile Asp Leu Val Pro Asn Gln Pro Tyr Pro Asn Ala
1910 1915 1920
Ser Phe Asp Asn Phe Lys Phe Val Cys Asp Asn Ile Lys Phe Ala
1925 1930 1935
Asp Asp Leu Asn Gln Leu Thr Gly Tyr Lys Lys Pro Ala Ser Arg
1940 1945 1950
Glu Leu Lys Val Thr Phe Phe Pro Asp Leu Asn Gly Asp Val Val
1955 1960 1965
Ala Ile Asp Tyr Lys His Tyr Thr Pro Ser Phe Lys Lys Gly Ala
1970 1975 1980
Lys Leu Leu His Lys Pro Ile Val Trp His Val Asn Asn Ala Thr
1985 1990 1995
Asn Lys Ala Thr Tyr Lys Pro Asn Thr Trp Cys Ile Arg Cys Leu
2000 2005 2010
Trp Ser Thr Lys Pro Val Glu Thr Ser Asn Ser Phe Asp Val Leu
2015 2020 2025
Lys Ser Glu Asp Ala Gln Gly Met Asp Asn Leu Ala Cys Glu Asp
2030 2035 2040
Leu Lys Pro Val Ser Glu Glu Val Val Glu Asn Pro Thr Ile Gln
2045 2050 2055
Lys Asp Val Leu Glu Cys Asn Val Lys Thr Thr Glu Val Val Gly
2060 2065 2070
Asp Ile Ile Leu Lys Pro Ala Asn Asn Ser Leu Lys Ile Thr Glu
2075 2080 2085
Glu Val Gly His Thr Asp Leu Met Ala Ala Tyr Val Asp Asn Ser
2090 2095 2100
Ser Leu Thr Ile Lys Lys Pro Asn Glu Leu Ser Arg Val Leu Gly
2105 2110 2115
Leu Lys Thr Leu Ala Thr His Gly Leu Ala Ala Val Asn Ser Val
2120 2125 2130
Pro Trp Asp Thr Ile Ala Asn Tyr Ala Lys Pro Phe Leu Asn Lys
2135 2140 2145
Val Val Ser Thr Thr Thr Asn Ile Val Thr Arg Cys Leu Asn Arg
2150 2155 2160
Val Cys Thr Asn Tyr Met Pro Tyr Phe Phe Thr Leu Leu Leu Gln
2165 2170 2175
Leu Cys Thr Phe Thr Arg Ser Thr Asn Ser Arg Ile Lys Ala Ser
2180 2185 2190
Met Pro Thr Thr Ile Ala Lys Asn Thr Val Lys Ser Val Gly Lys
2195 2200 2205
Phe Cys Leu Glu Ala Ser Phe Asn Tyr Leu Lys Ser Pro Asn Phe
2210 2215 2220
Ser Lys Leu Ile Asn Ile Thr Ile Trp Phe Leu Leu Leu Ser Val
2225 2230 2235
Cys Leu Gly Ser Leu Ile Tyr Ser Thr Ala Ala Leu Gly Val Leu
2240 2245 2250
Met Ser Asn Leu Gly Met Pro Ser Tyr Cys Thr Gly Tyr Arg Glu
2255 2260 2265
Gly Tyr Leu Asn Ser Thr Asn Val Thr Ile Ala Thr Tyr Cys Thr
2270 2275 2280
Gly Ser Ile Pro Cys Ser Val Cys Leu Ser Gly Leu Asp Ser Leu
2285 2290 2295
Asp Thr Tyr Pro Ser Leu Glu Thr Ile Gln Ile Thr Ile Ser Ser
2300 2305 2310
Phe Lys Trp Asp Leu Thr Ala Phe Gly Leu Val Ala Glu Trp Phe
2315 2320 2325
Leu Ala Tyr Ile Leu Phe Thr Arg Phe Phe Tyr Val Leu Gly Leu
2330 2335 2340
Ala Ala Ile Met Gln Leu Phe Phe Ser Tyr Phe Ala Val His Phe
2345 2350 2355
Ile Ser Asn Ser Trp Leu Met Trp Leu Ile Ile Asn Leu Val Gln
2360 2365 2370
Met Ala Pro Ile Ser Ala Met Val Arg Met Tyr Ile Phe Phe Ala
2375 2380 2385
Ser Phe Tyr Tyr Val Trp Lys Ser Tyr Val His Val Val Asp Gly
2390 2395 2400
Cys Asn Ser Ser Thr Cys Met Met Cys Tyr Lys Arg Asn Arg Ala
2405 2410 2415
Thr Arg Val Glu Cys Thr Thr Ile Val Asn Gly Val Arg Arg Ser
2420 2425 2430
Phe Tyr Val Tyr Ala Asn Gly Gly Lys Gly Phe Cys Lys Leu His
2435 2440 2445
Asn Trp Asn Cys Val Asn Cys Asp Thr Phe Cys Ala Gly Ser Thr
2450 2455 2460
Phe Ile Ser Asp Glu Val Ala Arg Asp Leu Ser Leu Gln Phe Lys
2465 2470 2475
Arg Pro Ile Asn Pro Thr Asp Gln Ser Ser Tyr Ile Val Asp Ser
2480 2485 2490
Val Thr Val Lys Asn Gly Ser Ile His Leu Tyr Phe Asp Lys Ala
2495 2500 2505
Gly Gln Lys Thr Tyr Glu Arg His Ser Leu Ser His Phe Val Asn
2510 2515 2520
Leu Asp Asn Leu Arg Ala Asn Asn Thr Lys Gly Ser Leu Pro Ile
2525 2530 2535
Asn Val Ile Val Phe Asp Gly Lys Ser Lys Cys Glu Glu Ser Ser
2540 2545 2550
Ala Lys Ser Ala Ser Val Tyr Tyr Ser Gln Leu Met Cys Gln Pro
2555 2560 2565
Ile Leu Leu Leu Asp Gln Ala Leu Val Ser Asp Val Gly Asp Ser
2570 2575 2580
Ala Glu Val Ala Val Lys Met Phe Asp Ala Tyr Val Asn Thr Phe
2585 2590 2595
Ser Ser Thr Phe Asn Val Pro Met Glu Lys Leu Lys Thr Leu Val
2600 2605 2610
Ala Thr Ala Glu Ala Glu Leu Ala Lys Asn Val Ser Leu Asp Asn
2615 2620 2625
Val Leu Ser Thr Phe Ile Ser Ala Ala Arg Gln Gly Phe Val Asp
2630 2635 2640
Ser Asp Val Glu Thr Lys Asp Val Val Glu Cys Leu Lys Leu Ser
2645 2650 2655
His Gln Ser Asp Ile Glu Val Thr Gly Asp Ser Cys Asn Asn Tyr
2660 2665 2670
Met Leu Thr Tyr Asn Lys Val Glu Asn Met Thr Pro Arg Asp Leu
2675 2680 2685
Gly Ala Cys Ile Asp Cys Ser Ala Arg His Ile Asn Ala Gln Val
2690 2695 2700
Ala Lys Ser His Asn Ile Ala Leu Ile Trp Asn Val Lys Asp Phe
2705 2710 2715
Met Ser Leu Ser Glu Gln Leu Arg Lys Gln Ile Arg Ser Ala Ala
2720 2725 2730
Lys Lys Asn Asn Leu Pro Phe Lys Leu Thr Cys Ala Thr Thr Arg
2735 2740 2745
Gln Val Val Asn Val Val Thr Thr Lys Ile Ala Leu Lys Gly Gly
2750 2755 2760
Lys Ile Val Asn Asn Trp Leu Lys Gln Leu Ile Lys Val Thr Leu
2765 2770 2775
Val Phe Leu Phe Val Ala Ala Ile Phe Tyr Leu Ile Thr Pro Val
2780 2785 2790
His Val Met Ser Lys His Thr Asp Phe Ser Ser Glu Ile Ile Gly
2795 2800 2805
Tyr Lys Ala Ile Asp Gly Gly Val Thr Arg Asp Ile Ala Ser Thr
2810 2815 2820
Asp Thr Cys Phe Ala Asn Lys His Ala Asp Phe Asp Thr Trp Phe
2825 2830 2835
Ser Gln Arg Gly Gly Ser Tyr Thr Asn Asp Lys Ala Cys Pro Leu
2840 2845 2850
Ile Ala Ala Val Ile Thr Arg Glu Val Gly Phe Val Val Pro Gly
2855 2860 2865
Leu Pro Gly Thr Ile Leu Arg Thr Thr Asn Gly Asp Phe Leu His
2870 2875 2880
Phe Leu Pro Arg Val Phe Ser Ala Val Gly Asn Ile Cys Tyr Thr
2885 2890 2895
Pro Ser Lys Leu Ile Glu Tyr Thr Asp Phe Ala Thr Ser Ala Cys
2900 2905 2910
Val Leu Ala Ala Glu Cys Thr Ile Phe Lys Asp Ala Ser Gly Lys
2915 2920 2925
Pro Val Pro Tyr Cys Tyr Asp Thr Asn Val Leu Glu Gly Ser Val
2930 2935 2940
Ala Tyr Glu Ser Leu Arg Pro Asp Thr Arg Tyr Val Leu Met Asp
2945 2950 2955
Gly Ser Ile Ile Gln Phe Pro Asn Thr Tyr Leu Glu Gly Ser Val
2960 2965 2970
Arg Val Val Thr Thr Phe Asp Ser Glu Tyr Cys Arg His Gly Thr
2975 2980 2985
Cys Glu Arg Ser Glu Ala Gly Val Cys Val Ser Thr Ser Gly Arg
2990 2995 3000
Trp Val Leu Asn Asn Asp Tyr Tyr Arg Ser Leu Pro Gly Val Phe
3005 3010 3015
Cys Gly Val Asp Ala Val Asn Leu Leu Thr Asn Met Phe Thr Pro
3020 3025 3030
Leu Ile Gln Pro Ile Gly Ala Leu Asp Ile Ser Ala Ser Ile Val
3035 3040 3045
Ala Gly Gly Ile Val Ala Ile Val Val Thr Cys Leu Ala Tyr Tyr
3050 3055 3060
Phe Met Arg Phe Arg Arg Ala Phe Gly Glu Tyr Ser His Val Val
3065 3070 3075
Ala Phe Asn Thr Leu Leu Phe Leu Met Ser Phe Thr Val Leu Cys
3080 3085 3090
Leu Thr Pro Val Tyr Ser Phe Leu Pro Gly Val Tyr Ser Val Ile
3095 3100 3105
Tyr Leu Tyr Leu Thr Phe Tyr Leu Thr Asn Asp Val Ser Phe Leu
3110 3115 3120
Ala His Ile Gln Trp Met Val Met Phe Thr Pro Leu Val Pro Phe
3125 3130 3135
Trp Ile Thr Ile Ala Tyr Ile Ile Cys Ile Ser Thr Lys His Phe
3140 3145 3150
Tyr Trp Phe Phe Ser Asn Tyr Leu Lys Arg Arg Val Val Phe Asn
3155 3160 3165
Gly Val Ser Phe Ser Thr Phe Glu Glu Ala Ala Leu Cys Thr Phe
3170 3175 3180
Leu Leu Asn Lys Glu Met Tyr Leu Lys Leu Arg Ser Asp Val Leu
3185 3190 3195
Leu Pro Leu Thr Gln Tyr Asn Arg Tyr Leu Ala Leu Tyr Asn Lys
3200 3205 3210
Tyr Lys Tyr Phe Ser Gly Ala Met Asp Thr Thr Ser Tyr Arg Glu
3215 3220 3225
Ala Ala Cys Cys His Leu Ala Lys Ala Leu Asn Asp Phe Ser Asn
3230 3235 3240
Ser Gly Ser Asp Val Leu Tyr Gln Pro Pro Gln Thr Ser Ile Thr
3245 3250 3255
Ser Ala Val Leu Gln Ser Gly Phe Arg Lys Met Ala Phe Pro Ser
3260 3265 3270
Gly Lys Val Glu Gly Cys Met Val Gln Val Thr Cys Gly Thr Thr
3275 3280 3285
Thr Leu Asn Gly Leu Trp Leu Asp Asp Val Val Tyr Cys Pro Arg
3290 3295 3300
His Val Ile Cys Thr Ser Glu Asp Met Leu Asn Pro Asn Tyr Glu
3305 3310 3315
Asp Leu Leu Ile Arg Lys Ser Asn His Asn Phe Leu Val Gln Ala
3320 3325 3330
Gly Asn Val Gln Leu Arg Val Ile Gly His Ser Met Gln Asn Cys
3335 3340 3345
Val Leu Lys Leu Lys Val Asp Thr Ala Asn Pro Lys Thr Pro Lys
3350 3355 3360
Tyr Lys Phe Val Arg Ile Gln Pro Gly Gln Thr Phe Ser Val Leu
3365 3370 3375
Ala Cys Tyr Asn Gly Ser Pro Ser Gly Val Tyr Gln Cys Ala Met
3380 3385 3390
Arg Pro Asn Phe Thr Ile Lys Gly Ser Phe Leu Asn Gly Ser Cys
3395 3400 3405
Gly Ser Val Gly Phe Asn Ile Asp Tyr Asp Cys Val Ser Phe Cys
3410 3415 3420
Tyr Met His His Met Glu Leu Pro Thr Gly Val His Ala Gly Thr
3425 3430 3435
Asp Leu Glu Gly Asn Phe Tyr Gly Pro Phe Val Asp Arg Gln Thr
3440 3445 3450
Ala Gln Ala Ala Gly Thr Asp Thr Thr Ile Thr Val Asn Val Leu
3455 3460 3465
Ala Trp Leu Tyr Ala Ala Val Ile Asn Gly Asp Arg Trp Phe Leu
3470 3475 3480
Asn Arg Phe Thr Thr Thr Leu Asn Asp Phe Asn Leu Val Ala Met
3485 3490 3495
Lys Tyr Asn Tyr Glu Pro Leu Thr Gln Asp His Val Asp Ile Leu
3500 3505 3510
Gly Pro Leu Ser Ala Gln Thr Gly Ile Ala Val Leu Asp Met Cys
3515 3520 3525
Ala Ser Leu Lys Glu Leu Leu Gln Asn Gly Met Asn Gly Arg Thr
3530 3535 3540
Ile Leu Gly Ser Ala Leu Leu Glu Asp Glu Phe Thr Pro Phe Asp
3545 3550 3555
Val Val Arg Gln Cys Ser Gly Val Thr Phe Gln Ser Ala Val Lys
3560 3565 3570
Arg Thr Ile Lys Gly Thr His His Trp Leu Leu Leu Thr Ile Leu
3575 3580 3585
Thr Ser Leu Leu Val Leu Val Gln Ser Thr Gln Trp Ser Leu Phe
3590 3595 3600
Phe Phe Leu Tyr Glu Asn Ala Phe Leu Pro Phe Ala Met Gly Ile
3605 3610 3615
Ile Ala Met Ser Ala Phe Ala Met Met Phe Val Lys His Lys His
3620 3625 3630
Ala Phe Leu Cys Leu Phe Leu Leu Pro Ser Leu Ala Thr Val Ala
3635 3640 3645
Tyr Phe Asn Met Val Tyr Met Pro Ala Ser Trp Val Met Arg Ile
3650 3655 3660
Met Thr Trp Leu Asp Met Val Asp Thr Ser Leu Lys Leu Lys Asp
3665 3670 3675
Cys Val Met Tyr Ala Ser Ala Val Val Leu Leu Ile Leu Met Thr
3680 3685 3690
Ala Arg Thr Val Tyr Asp Asp Gly Ala Arg Arg Val Trp Thr Leu
3695 3700 3705
Met Asn Val Leu Thr Leu Val Tyr Lys Val Tyr Tyr Gly Asn Ala
3710 3715 3720
Leu Asp Gln Ala Ile Ser Met Trp Ala Leu Ile Ile Ser Val Thr
3725 3730 3735
Ser Asn Tyr Ser Gly Val Val Thr Thr Val Met Phe Leu Ala Arg
3740 3745 3750
Gly Ile Val Phe Met Cys Val Glu Tyr Cys Pro Ile Phe Phe Ile
3755 3760 3765
Thr Gly Asn Thr Leu Gln Cys Ile Met Leu Val Tyr Cys Phe Leu
3770 3775 3780
Gly Tyr Phe Cys Thr Cys Tyr Phe Gly Leu Phe Cys Leu Leu Asn
3785 3790 3795
Arg Tyr Phe Arg Leu Thr Leu Gly Val Tyr Asp Tyr Leu Val Ser
3800 3805 3810
Thr Gln Glu Phe Arg Tyr Met Asn Ser Gln Gly Leu Leu Pro Pro
3815 3820 3825
Lys Asn Ser Ile Asp Ala Phe Lys Leu Asn Ile Lys Leu Leu Gly
3830 3835 3840
Val Gly Gly Lys Pro Cys Ile Lys Val Ala Thr Val Gln Ser Lys
3845 3850 3855
Met Ser Asp Val Lys Cys Thr Ser Val Val Leu Leu Ser Val Leu
3860 3865 3870
Gln Gln Leu Arg Val Glu Ser Ser Ser Lys Leu Trp Ala Gln Cys
3875 3880 3885
Val Gln Leu His Asn Asp Ile Leu Leu Ala Lys Asp Thr Thr Glu
3890 3895 3900
Ala Phe Glu Lys Met Val Ser Leu Leu Ser Val Leu Leu Ser Met
3905 3910 3915
Gln Gly Ala Val Asp Ile Asn Lys Leu Cys Glu Glu Met Leu Asp
3920 3925 3930
Asn Arg Ala Thr Leu Gln Ala Ile Ala Ser Glu Phe Ser Ser Leu
3935 3940 3945
Pro Ser Tyr Ala Ala Phe Ala Thr Ala Gln Glu Ala Tyr Glu Gln
3950 3955 3960
Ala Val Ala Asn Gly Asp Ser Glu Val Val Leu Lys Lys Leu Lys
3965 3970 3975
Lys Ser Leu Asn Val Ala Lys Ser Glu Phe Asp Arg Asp Ala Ala
3980 3985 3990
Met Gln Arg Lys Leu Glu Lys Met Ala Asp Gln Ala Met Thr Gln
3995 4000 4005
Met Tyr Lys Gln Ala Arg Ser Glu Asp Lys Arg Ala Lys Val Thr
4010 4015 4020
Ser Ala Met Gln Thr Met Leu Phe Thr Met Leu Arg Lys Leu Asp
4025 4030 4035
Asn Asp Ala Leu Asn Asn Ile Ile Asn Asn Ala Arg Asp Gly Cys
4040 4045 4050
Val Pro Leu Asn Ile Ile Pro Leu Thr Thr Ala Ala Lys Leu Met
4055 4060 4065
Val Val Ile Pro Asp Tyr Asn Thr Tyr Lys Asn Thr Cys Asp Gly
4070 4075 4080
Thr Thr Phe Thr Tyr Ala Ser Ala Leu Trp Glu Ile Gln Gln Val
4085 4090 4095
Val Asp Ala Asp Ser Lys Ile Val Gln Leu Ser Glu Ile Ser Met
4100 4105 4110
Asp Asn Ser Pro Asn Leu Ala Trp Pro Leu Ile Val Thr Ala Leu
4115 4120 4125
Arg Ala Asn Ser Ala Val Lys Leu Gln Asn Asn Glu Leu Ser Pro
4130 4135 4140
Val Ala Leu Arg Gln Met Ser Cys Ala Ala Gly Thr Thr Gln Thr
4145 4150 4155
Ala Cys Thr Asp Asp Asn Ala Leu Ala Tyr Tyr Asn Thr Thr Lys
4160 4165 4170
Gly Gly Arg Phe Val Leu Ala Leu Leu Ser Asp Leu Gln Asp Leu
4175 4180 4185
Lys Trp Ala Arg Phe Pro Lys Ser Asp Gly Thr Gly Thr Ile Tyr
4190 4195 4200
Thr Glu Leu Glu Pro Pro Cys Arg Phe Val Thr Asp Thr Pro Lys
4205 4210 4215
Gly Pro Lys Val Lys Tyr Leu Tyr Phe Ile Lys Gly Leu Asn Asn
4220 4225 4230
Leu Asn Arg Gly Met Val Leu Gly Ser Leu Ala Ala Thr Val Arg
4235 4240 4245
Leu Gln Ala Gly Asn Ala Thr Glu Val Pro Ala Asn Ser Thr Val
4250 4255 4260
Leu Ser Phe Cys Ala Phe Ala Val Asp Ala Ala Lys Ala Tyr Lys
4265 4270 4275
Asp Tyr Leu Ala Ser Gly Gly Gln Pro Ile Thr Asn Cys Val Lys
4280 4285 4290
Met Leu Cys Thr His Thr Gly Thr Gly Gln Ala Ile Thr Val Thr
4295 4300 4305
Pro Glu Ala Asn Met Asp Gln Glu Ser Phe Gly Gly Ala Ser Cys
4310 4315 4320
Cys Leu Tyr Cys Arg Cys His Ile Asp His Pro Asn Pro Lys Gly
4325 4330 4335
Phe Cys Asp Leu Lys Gly Lys Tyr Val Gln Ile Pro Thr Thr Cys
4340 4345 4350
Ala Asn Asp Pro Val Gly Phe Thr Leu Lys Asn Thr Val Cys Thr
4355 4360 4365
Val Cys Gly Met Trp Lys Gly Tyr Gly Cys Ser Cys Asp Gln Leu
4370 4375 4380
Arg Glu Pro Met Leu Gln Ser Ala Asp Ala Gln Ser Phe Leu Asn
4385 4390 4395
Arg Val Cys Gly Val Ser Ala Ala Arg Leu Thr Pro Cys Gly Thr
4400 4405 4410
Gly Thr Ser Thr Asp Val Val Tyr Arg Ala Phe Asp Ile Tyr Asn
4415 4420 4425
Asp Lys Val Ala Gly Phe Ala Lys Phe Leu Lys Thr Asn Cys Cys
4430 4435 4440
Arg Phe Gln Glu Lys Asp Glu Asp Asp Asn Leu Ile Asp Ser Tyr
4445 4450 4455
Phe Val Val Lys Arg His Thr Phe Ser Asn Tyr Gln His Glu Glu
4460 4465 4470
Thr Ile Tyr Asn Leu Leu Lys Asp Cys Pro Ala Val Ala Lys His
4475 4480 4485
Asp Phe Phe Lys Phe Arg Ile Asp Gly Asp Met Val Pro His Ile
4490 4495 4500
Ser Arg Gln Arg Leu Thr Lys Tyr Thr Met Ala Asp Leu Val Tyr
4505 4510 4515
Ala Leu Arg His Phe Asp Glu Gly Asn Cys Asp Thr Leu Lys Glu
4520 4525 4530
Ile Leu Val Thr Tyr Asn Cys Cys Asp Asp Asp Tyr Phe Asn Lys
4535 4540 4545
Lys Asp Trp Tyr Asp Phe Val Glu Asn Pro Asp Ile Leu Arg Val
4550 4555 4560
Tyr Ala Asn Leu Gly Glu Arg Val Arg Gln Ala Leu Leu Lys Thr
4565 4570 4575
Val Gln Phe Cys Asp Ala Met Arg Asn Ala Gly Ile Val Gly Val
4580 4585 4590
Leu Thr Leu Asp Asn Gln Asp Leu Asn Gly Asn Trp Tyr Asp Phe
4595 4600 4605
Gly Asp Phe Ile Gln Thr Thr Pro Gly Ser Gly Val Pro Val Val
4610 4615 4620
Asp Ser Tyr Tyr Ser Leu Leu Met Pro Ile Leu Thr Leu Thr Arg
4625 4630 4635
Ala Leu Thr Ala Glu Ser His Val Asp Thr Asp Leu Thr Lys Pro
4640 4645 4650
Tyr Ile Lys Trp Asp Leu Leu Lys Tyr Asp Phe Thr Glu Glu Arg
4655 4660 4665
Leu Lys Leu Phe Asp Arg Tyr Phe Lys Tyr Trp Asp Gln Thr Tyr
4670 4675 4680
His Pro Asn Cys Val Asn Cys Leu Asp Asp Arg Cys Ile Leu His
4685 4690 4695
Cys Ala Asn Phe Asn Val Leu Phe Ser Thr Val Phe Pro Leu Thr
4700 4705 4710
Ser Phe Gly Pro Leu Val Arg Lys Ile Phe Val Asp Gly Val Pro
4715 4720 4725
Phe Val Val Ser Thr Gly Tyr His Phe Arg Glu Leu Gly Val Val
4730 4735 4740
His Asn Gln Asp Val Asn Leu His Ser Ser Arg Leu Ser Phe Lys
4745 4750 4755
Glu Leu Leu Val Tyr Ala Ala Asp Pro Ala Met His Ala Ala Ser
4760 4765 4770
Gly Asn Leu Leu Leu Asp Lys Arg Thr Thr Cys Phe Ser Val Ala
4775 4780 4785
Ala Leu Thr Asn Asn Val Ala Phe Gln Thr Val Lys Pro Gly Asn
4790 4795 4800
Phe Asn Lys Asp Phe Tyr Asp Phe Ala Val Ser Lys Gly Phe Phe
4805 4810 4815
Lys Glu Gly Ser Ser Val Glu Leu Lys His Phe Phe Phe Ala Gln
4820 4825 4830
Asp Gly Asn Ala Ala Ile Ser Asp Tyr Asp Tyr Tyr Arg Tyr Asn
4835 4840 4845
Leu Pro Thr Met Cys Asp Ile Arg Gln Leu Leu Phe Val Val Glu
4850 4855 4860
Val Val Asp Lys Tyr Phe Asp Cys Tyr Asp Gly Gly Cys Ile Asn
4865 4870 4875
Ala Asn Gln Val Ile Val Asn Asn Leu Asp Lys Ser Ala Gly Phe
4880 4885 4890
Pro Phe Asn Lys Trp Gly Lys Ala Arg Leu Tyr Tyr Asp Ser Met
4895 4900 4905
Ser Tyr Glu Asp Gln Asp Ala Leu Phe Ala Tyr Thr Lys Arg Asn
4910 4915 4920
Val Ile Pro Thr Ile Thr Gln Met Asn Leu Lys Tyr Ala Ile Ser
4925 4930 4935
Ala Lys Asn Arg Ala Arg Thr Val Ala Gly Val Ser Ile Cys Ser
4940 4945 4950
Thr Met Thr Asn Arg Gln Phe His Gln Lys Leu Leu Lys Ser Ile
4955 4960 4965
Ala Ala Thr Arg Gly Ala Thr Val Val Ile Gly Thr Ser Lys Phe
4970 4975 4980
Tyr Gly Gly Trp His Asn Met Leu Lys Thr Val Tyr Ser Asp Val
4985 4990 4995
Glu Asn Pro His Leu Met Gly Trp Asp Tyr Pro Lys Cys Asp Arg
5000 5005 5010
Ala Met Pro Asn Met Leu Arg Ile Met Ala Ser Leu Val Leu Ala
5015 5020 5025
Arg Lys His Thr Thr Cys Cys Ser Leu Ser His Arg Phe Tyr Arg
5030 5035 5040
Leu Ala Asn Glu Cys Ala Gln Val Leu Ser Glu Met Val Met Cys
5045 5050 5055
Gly Gly Ser Leu Tyr Val Lys Pro Gly Gly Thr Ser Ser Gly Asp
5060 5065 5070
Ala Thr Thr Ala Tyr Ala Asn Ser Val Phe Asn Ile Cys Gln Ala
5075 5080 5085
Val Thr Ala Asn Val Asn Ala Leu Leu Ser Thr Asp Gly Asn Lys
5090 5095 5100
Ile Ala Asp Lys Tyr Val Arg Asn Leu Gln His Arg Leu Tyr Glu
5105 5110 5115
Cys Leu Tyr Arg Asn Arg Asp Val Asp Thr Asp Phe Val Asn Glu
5120 5125 5130
Phe Tyr Ala Tyr Leu Arg Lys His Phe Ser Met Met Ile Leu Ser
5135 5140 5145
Asp Asp Ala Val Val Cys Phe Asn Ser Thr Tyr Ala Ser Gln Gly
5150 5155 5160
Leu Val Ala Ser Ile Lys Asn Phe Lys Ser Val Leu Tyr Tyr Gln
5165 5170 5175
Asn Asn Val Phe Met Ser Glu Ala Lys Cys Trp Thr Glu Thr Asp
5180 5185 5190
Leu Thr Lys Gly Pro His Glu Phe Cys Ser Gln His Thr Met Leu
5195 5200 5205
Val Lys Gln Gly Asp Asp Tyr Val Tyr Leu Pro Tyr Pro Asp Pro
5210 5215 5220
Ser Arg Ile Leu Gly Ala Gly Cys Phe Val Asp Asp Ile Val Lys
5225 5230 5235
Thr Asp Gly Thr Leu Met Ile Glu Arg Phe Val Ser Leu Ala Ile
5240 5245 5250
Asp Ala Tyr Pro Leu Thr Lys His Pro Asn Gln Glu Tyr Ala Asp
5255 5260 5265
Val Phe His Leu Tyr Leu Gln Tyr Ile Arg Lys Leu His Asp Glu
5270 5275 5280
Leu Thr Gly His Met Leu Asp Met Tyr Ser Val Met Leu Thr Asn
5285 5290 5295
Asp Asn Thr Ser Arg Tyr Trp Glu Pro Glu Phe Tyr Glu Ala Met
5300 5305 5310
Tyr Thr Pro His Thr Val Leu Gln Ala Val Gly Ala Cys Val Leu
5315 5320 5325
Cys Asn Ser Gln Thr Ser Leu Arg Cys Gly Ala Cys Ile Arg Arg
5330 5335 5340
Pro Phe Leu Cys Cys Lys Cys Cys Tyr Asp His Val Ile Ser Thr
5345 5350 5355
Ser His Lys Leu Val Leu Ser Val Asn Pro Tyr Val Cys Asn Ala
5360 5365 5370
Pro Gly Cys Asp Val Thr Asp Val Thr Gln Leu Tyr Leu Gly Gly
5375 5380 5385
Met Ser Tyr Tyr Cys Lys Ser His Lys Pro Ser Ile Ser Phe Pro
5390 5395 5400
Leu Cys Ala Asn Gly Gln Val Phe Gly Leu Tyr Lys Asn Thr Cys
5405 5410 5415
Val Gly Ser Asp Asn Val Thr Asp Phe Asn Ala Ile Ala Thr Cys
5420 5425 5430
Asp Trp Thr Asn Ala Gly Asp Tyr Ile Leu Ala Asn Thr Cys Thr
5435 5440 5445
Glu Arg Leu Lys Leu Phe Ala Ala Glu Thr Leu Lys Ala Thr Glu
5450 5455 5460
Glu Thr Phe Lys Leu Ser Tyr Gly Ile Ala Thr Val Arg Glu Val
5465 5470 5475
Leu Ser Asp Arg Glu Leu His Leu Ser Trp Glu Val Gly Lys Pro
5480 5485 5490
Arg Pro Pro Leu Asn Arg Asn Tyr Val Phe Thr Gly Tyr Arg Val
5495 5500 5505
Thr Lys Asn Ser Lys Val Gln Ile Gly Glu Tyr Thr Phe Glu Lys
5510 5515 5520
Gly Asp Tyr Gly Asp Ala Val Val Tyr Arg Gly Thr Thr Thr Tyr
5525 5530 5535
Lys Leu Asn Val Gly Asp Tyr Phe Val Leu Thr Ser His Thr Val
5540 5545 5550
Met Pro Leu Ser Ala Pro Thr Leu Val Pro Gln Glu His Tyr Val
5555 5560 5565
Arg Ile Thr Gly Leu Tyr Pro Thr Leu Asn Ile Ser Asp Glu Phe
5570 5575 5580
Ser Ser Asn Val Ala Asn Tyr Gln Lys Val Gly Met Gln Lys Tyr
5585 5590 5595
Ser Thr Leu Gln Gly Pro Pro Gly Thr Gly Lys Ser His Phe Ala
5600 5605 5610
Ile Gly Leu Ala Leu Tyr Tyr Pro Ser Ala Arg Ile Val Tyr Thr
5615 5620 5625
Ala Cys Ser His Ala Ala Val Asp Ala Leu Cys Glu Lys Ala Leu
5630 5635 5640
Lys Tyr Leu Pro Ile Asp Lys Cys Ser Arg Ile Ile Pro Ala Arg
5645 5650 5655
Ala Arg Val Glu Cys Phe Asp Lys Phe Lys Val Asn Ser Thr Leu
5660 5665 5670
Glu Gln Tyr Val Phe Cys Thr Val Asn Ala Leu Pro Glu Thr Thr
5675 5680 5685
Ala Asp Ile Val Val Phe Asp Glu Ile Ser Met Ala Thr Asn Tyr
5690 5695 5700
Asp Leu Ser Val Val Asn Ala Arg Leu Arg Ala Lys His Tyr Val
5705 5710 5715
Tyr Ile Gly Asp Pro Ala Gln Leu Pro Ala Pro Arg Thr Leu Leu
5720 5725 5730
Thr Lys Gly Thr Leu Glu Pro Glu Tyr Phe Asn Ser Val Cys Arg
5735 5740 5745
Leu Met Lys Thr Ile Gly Pro Asp Met Phe Leu Gly Thr Cys Arg
5750 5755 5760
Arg Cys Pro Ala Glu Ile Val Asp Thr Val Ser Ala Leu Val Tyr
5765 5770 5775
Asp Asn Arg Leu Lys Ala His Lys Asp Lys Ser Ala Gln Cys Phe
5780 5785 5790
Lys Met Phe Tyr Lys Gly Val Ile Thr His Asp Val Ser Ser Ala
5795 5800 5805
Ile Asn Arg Pro Gln Ile Gly Val Val Arg Glu Phe Leu Thr Arg
5810 5815 5820
Asn Pro Ala Trp Arg Lys Ala Val Phe Ile Ser Pro Tyr Asn Ser
5825 5830 5835
Gln Asn Ala Val Ala Ser Lys Ile Leu Gly Leu Pro Thr Gln Thr
5840 5845 5850
Val Asp Ser Ser Gln Gly Ser Glu Tyr Asp Tyr Val Ile Phe Thr
5855 5860 5865
Gln Thr Thr Glu Thr Ala His Ser Cys Asn Val Asn Arg Phe Asn
5870 5875 5880
Val Ala Ile Thr Arg Ala Lys Val Gly Ile Leu Cys Ile Met Ser
5885 5890 5895
Asp Arg Asp Leu Tyr Asp Lys Leu Gln Phe Thr Ser Leu Glu Ile
5900 5905 5910
Pro Arg Arg Asn Val Ala Thr Leu Gln Ala Glu Asn Val Thr Gly
5915 5920 5925
Leu Phe Lys Asp Cys Ser Lys Val Ile Thr Gly Leu His Pro Thr
5930 5935 5940
Gln Ala Pro Thr His Leu Ser Val Asp Thr Lys Phe Lys Thr Glu
5945 5950 5955
Gly Leu Cys Val Asp Ile Pro Gly Ile Pro Lys Asp Met Thr Tyr
5960 5965 5970
Arg Arg Leu Ile Ser Met Met Gly Phe Lys Met Asn Tyr Gln Val
5975 5980 5985
Asn Gly Tyr Pro Asn Met Phe Ile Thr Arg Glu Glu Ala Ile Arg
5990 5995 6000
His Val Arg Ala Trp Ile Gly Phe Asp Val Glu Gly Cys His Ala
6005 6010 6015
Thr Arg Glu Ala Val Gly Thr Asn Leu Pro Leu Gln Leu Gly Phe
6020 6025 6030
Ser Thr Gly Val Asn Leu Val Ala Val Pro Thr Gly Tyr Val Asp
6035 6040 6045
Thr Pro Asn Asn Thr Asp Phe Ser Arg Val Ser Ala Lys Pro Pro
6050 6055 6060
Pro Gly Asp Gln Phe Lys His Leu Ile Pro Leu Met Tyr Lys Gly
6065 6070 6075
Leu Pro Trp Asn Val Val Arg Ile Lys Ile Val Gln Met Leu Ser
6080 6085 6090
Asp Thr Leu Lys Asn Leu Ser Asp Arg Val Val Phe Val Leu Trp
6095 6100 6105
Ala His Gly Phe Glu Leu Thr Ser Met Lys Tyr Phe Val Lys Ile
6110 6115 6120
Gly Pro Glu Arg Thr Cys Cys Leu Cys Asp Arg Arg Ala Thr Cys
6125 6130 6135
Phe Ser Thr Ala Ser Asp Thr Tyr Ala Cys Trp His His Ser Ile
6140 6145 6150
Gly Phe Asp Tyr Val Tyr Asn Pro Phe Met Ile Asp Val Gln Gln
6155 6160 6165
Trp Gly Phe Thr Gly Asn Leu Gln Ser Asn His Asp Leu Tyr Cys
6170 6175 6180
Gln Val His Gly Asn Ala His Val Ala Ser Cys Asp Ala Ile Met
6185 6190 6195
Thr Arg Cys Leu Ala Val His Glu Cys Phe Val Lys Arg Val Asp
6200 6205 6210
Trp Thr Ile Glu Tyr Pro Ile Ile Gly Asp Glu Leu Lys Ile Asn
6215 6220 6225
Ala Ala Cys Arg Lys Val Gln His Met Val Val Lys Ala Ala Leu
6230 6235 6240
Leu Ala Asp Lys Phe Pro Val Leu His Asp Ile Gly Asn Pro Lys
6245 6250 6255
Ala Ile Lys Cys Val Pro Gln Ala Asp Val Glu Trp Lys Phe Tyr
6260 6265 6270
Asp Ala Gln Pro Cys Ser Asp Lys Ala Tyr Lys Ile Glu Glu Leu
6275 6280 6285
Phe Tyr Ser Tyr Ala Thr His Ser Asp Lys Phe Thr Asp Gly Val
6290 6295 6300
Cys Leu Phe Trp Asn Cys Asn Val Asp Arg Tyr Pro Ala Asn Ser
6305 6310 6315
Ile Val Cys Arg Phe Asp Thr Arg Val Leu Ser Asn Leu Asn Leu
6320 6325 6330
Pro Gly Cys Asp Gly Gly Ser Leu Tyr Val Asn Lys His Ala Phe
6335 6340 6345
His Thr Pro Ala Phe Asp Lys Ser Ala Phe Val Asn Leu Lys Gln
6350 6355 6360
Leu Pro Phe Phe Tyr Tyr Ser Asp Ser Pro Cys Glu Ser His Gly
6365 6370 6375
Lys Gln Val Val Ser Asp Ile Asp Tyr Val Pro Leu Lys Ser Ala
6380 6385 6390
Thr Cys Ile Thr Arg Cys Asn Leu Gly Gly Ala Val Cys Arg His
6395 6400 6405
His Ala Asn Glu Tyr Arg Leu Tyr Leu Asp Ala Tyr Asn Met Met
6410 6415 6420
Ile Ser Ala Gly Phe Ser Leu Trp Val Tyr Lys Gln Phe Asp Thr
6425 6430 6435
Tyr Asn Leu Trp Asn Thr Phe Thr Arg Leu Gln Ser Leu Glu Asn
6440 6445 6450
Val Ala Phe Asn Val Val Asn Lys Gly His Phe Asp Gly Gln Gln
6455 6460 6465
Gly Glu Val Pro Val Ser Ile Ile Asn Asn Thr Val Tyr Thr Lys
6470 6475 6480
Val Asp Gly Val Asp Val Glu Leu Phe Glu Asn Lys Thr Thr Leu
6485 6490 6495
Pro Val Asn Val Ala Phe Glu Leu Trp Ala Lys Arg Asn Ile Lys
6500 6505 6510
Pro Val Pro Glu Val Lys Ile Leu Asn Asn Leu Gly Val Asp Ile
6515 6520 6525
Ala Ala Asn Thr Val Ile Trp Asp Tyr Lys Arg Asp Ala Pro Ala
6530 6535 6540
His Ile Ser Thr Ile Gly Val Cys Ser Met Thr Asp Ile Ala Lys
6545 6550 6555
Lys Pro Thr Glu Thr Ile Cys Ala Pro Leu Thr Val Phe Phe Asp
6560 6565 6570
Gly Arg Val Asp Gly Gln Val Asp Leu Phe Arg Asn Ala Arg Asn
6575 6580 6585
Gly Val Leu Ile Thr Glu Gly Ser Val Lys Gly Leu Gln Pro Ser
6590 6595 6600
Val Gly Pro Lys Gln Ala Ser Leu Asn Gly Val Thr Leu Ile Gly
6605 6610 6615
Glu Ala Val Lys Thr Gln Phe Asn Tyr Tyr Lys Lys Val Asp Gly
6620 6625 6630
Val Val Gln Gln Leu Pro Glu Thr Tyr Phe Thr Gln Ser Arg Asn
6635 6640 6645
Leu Gln Glu Phe Lys Pro Arg Ser Gln Met Glu Ile Asp Phe Leu
6650 6655 6660
Glu Leu Ala Met Asp Glu Phe Ile Glu Arg Tyr Lys Leu Glu Gly
6665 6670 6675
Tyr Ala Phe Glu His Ile Val Tyr Gly Asp Phe Ser His Ser Gln
6680 6685 6690
Leu Gly Gly Leu His Leu Leu Ile Gly Leu Ala Lys Arg Phe Lys
6695 6700 6705
Glu Ser Pro Phe Glu Leu Glu Asp Phe Ile Pro Met Asp Ser Thr
6710 6715 6720
Val Lys Asn Tyr Phe Ile Thr Asp Ala Gln Thr Gly Ser Ser Lys
6725 6730 6735
Cys Val Cys Ser Val Ile Asp Leu Leu Leu Asp Asp Phe Val Glu
6740 6745 6750
Ile Ile Lys Ser Gln Asp Leu Ser Val Val Ser Lys Val Val Lys
6755 6760 6765
Val Thr Ile Asp Tyr Thr Glu Ile Ser Phe Met Leu Trp Cys Lys
6770 6775 6780
Asp Gly His Val Glu Thr Phe Tyr Pro Lys Leu Gln Ser Ser Gln
6785 6790 6795
Ala Trp Gln Pro Gly Val Ala Met Pro Asn Leu Tyr Lys Met Gln
6800 6805 6810
Arg Met Leu Leu Glu Lys Cys Asp Leu Gln Asn Tyr Gly Asp Ser
6815 6820 6825
Ala Thr Leu Pro Lys Gly Ile Met Met Asn Val Ala Lys Tyr Thr
6830 6835 6840
Gln Leu Cys Gln Tyr Leu Asn Thr Leu Thr Leu Ala Val Pro Tyr
6845 6850 6855
Asn Met Arg Val Ile His Phe Gly Ala Gly Ser Asp Lys Gly Val
6860 6865 6870
Ala Pro Gly Thr Ala Val Leu Arg Gln Trp Leu Pro Thr Gly Thr
6875 6880 6885
Leu Leu Val Asp Ser Asp Leu Asn Asp Phe Val Ser Asp Ala Asp
6890 6895 6900
Ser Thr Leu Ile Gly Asp Cys Ala Thr Val His Thr Ala Asn Lys
6905 6910 6915
Trp Asp Leu Ile Ile Ser Asp Met Tyr Asp Pro Lys Thr Lys Asn
6920 6925 6930
Val Thr Lys Glu Asn Asp Ser Lys Glu Gly Phe Phe Thr Tyr Ile
6935 6940 6945
Cys Gly Phe Ile Gln Gln Lys Leu Ala Leu Gly Gly Ser Val Ala
6950 6955 6960
Ile Lys Ile Thr Glu His Ser Trp Asn Ala Asp Leu Tyr Lys Leu
6965 6970 6975
Met Gly His Phe Ala Trp Trp Thr Ala Phe Val Thr Asn Val Asn
6980 6985 6990
Ala Ser Ser Ser Glu Ala Phe Leu Ile Gly Cys Asn Tyr Leu Gly
6995 7000 7005
Lys Pro Arg Glu Gln Ile Asp Gly Tyr Val Met His Ala Asn Tyr
7010 7015 7020
Ile Phe Trp Arg Asn Thr Asn Pro Ile Gln Leu Ser Ser Tyr Ser
7025 7030 7035
Leu Phe Asp Met Ser Lys Phe Pro Leu Lys Leu Arg Gly Thr Ala
7040 7045 7050
Val Met Ser Leu Lys Glu Gly Gln Ile Asn Asp Met Ile Leu Ser
7055 7060 7065
Leu Leu Ser Lys Gly Arg Leu Ile Ile Arg Glu Asn Asn Arg Val
7070 7075 7080
Val Ile Ser Ser Asp Val Leu Val Asn Asn
7085 7090
<210> 402
<211> 4402
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 402
Met Glu Ser Leu Val Pro Gly Phe Asn Glu Lys Thr His Val Gln Leu
1 5 10 15
Ser Leu Pro Val Leu Gln Val Arg Asp Val Leu Val Arg Gly Phe Gly
20 25 30
Asp Ser Val Glu Glu Val Leu Ser Glu Ala Arg Gln His Leu Lys Asp
35 40 45
Gly Thr Cys Gly Leu Val Glu Val Glu Lys Gly Val Leu Pro Gln Leu
50 55 60
Glu Gln Pro Tyr Val Phe Ile Lys Arg Ser Asp Ala Arg Thr Ala Pro
65 70 75 80
His Gly His Val Met Val Glu Leu Val Ala Glu Leu Glu Gly Ile Gln
85 90 95
Tyr Gly Arg Ser Gly Glu Thr Leu Gly Val Leu Val Pro His Val Gly
100 105 110
Glu Ile Pro Val Ala Tyr Arg Lys Val Leu Leu Arg Lys Asn Gly Asn
115 120 125
Lys Gly Ala Gly Gly His Ser Tyr Gly Ala Asp Leu Lys Ser Phe Asp
130 135 140
Leu Gly Asp Glu Leu Gly Thr Asp Pro Tyr Glu Asp Phe Gln Glu Asn
145 150 155 160
Trp Asn Thr Lys His Ser Ser Gly Val Thr Arg Glu Leu Met Arg Glu
165 170 175
Leu Asn Gly Gly Ala Tyr Thr Arg Tyr Val Asp Asn Asn Phe Cys Gly
180 185 190
Pro Asp Gly Tyr Pro Leu Glu Cys Ile Lys Asp Leu Leu Ala Arg Ala
195 200 205
Gly Lys Ala Ser Cys Thr Leu Ser Glu Gln Leu Asp Phe Ile Asp Thr
210 215 220
Lys Arg Gly Val Tyr Cys Cys Arg Glu His Glu His Glu Ile Ala Trp
225 230 235 240
Tyr Thr Glu Arg Ser Glu Lys Ser Tyr Glu Leu Gln Thr Pro Phe Glu
245 250 255
Ile Lys Leu Ala Lys Lys Phe Asp Thr Phe Asn Gly Glu Cys Pro Asn
260 265 270
Phe Val Phe Pro Leu Asn Ser Ile Ile Lys Thr Ile Gln Pro Arg Val
275 280 285
Glu Lys Lys Lys Leu Asp Gly Phe Met Gly Arg Ile Arg Ser Val Tyr
290 295 300
Pro Val Ala Ser Pro Asn Glu Cys Asn Gln Met Cys Leu Ser Thr Leu
305 310 315 320
Met Lys Cys Asp His Cys Gly Glu Thr Ser Trp Gln Thr Gly Asp Phe
325 330 335
Val Lys Ala Thr Cys Glu Phe Cys Gly Thr Glu Asn Leu Thr Lys Glu
340 345 350
Gly Ala Thr Thr Cys Gly Tyr Leu Pro Gln Asn Ala Val Val Lys Ile
355 360 365
Tyr Cys Pro Ala Cys His Asn Ser Glu Val Gly Pro Glu His Ser Leu
370 375 380
Ala Glu Tyr His Asn Glu Ser Gly Leu Lys Thr Ile Leu Arg Lys Gly
385 390 395 400
Gly Arg Thr Ile Ala Phe Gly Gly Cys Val Phe Ser Tyr Val Gly Cys
405 410 415
His Asn Lys Cys Ala Tyr Trp Val Pro Arg Ala Ser Ala Asn Ile Gly
420 425 430
Cys Asn His Thr Gly Val Val Gly Glu Gly Ser Glu Gly Leu Asn Asp
435 440 445
Asn Leu Leu Glu Ile Leu Gln Lys Glu Lys Val Asn Ile Asn Ile Val
450 455 460
Gly Asp Phe Lys Leu Asn Glu Glu Ile Ala Ile Ile Leu Ala Ser Phe
465 470 475 480
Ser Ala Ser Thr Ser Ala Phe Val Glu Thr Val Lys Gly Leu Asp Tyr
485 490 495
Lys Ala Phe Lys Gln Ile Val Glu Ser Cys Gly Asn Phe Lys Val Thr
500 505 510
Lys Gly Lys Ala Lys Lys Gly Ala Trp Asn Ile Gly Glu Gln Lys Ser
515 520 525
Ile Leu Ser Pro Leu Tyr Ala Phe Ala Ser Glu Ala Ala Arg Val Val
530 535 540
Arg Ser Ile Phe Ser Arg Thr Leu Glu Thr Ala Gln Asn Ser Val Arg
545 550 555 560
Val Leu Gln Lys Ala Ala Ile Thr Ile Leu Asp Gly Ile Ser Gln Tyr
565 570 575
Ser Leu Arg Leu Ile Asp Ala Met Met Phe Thr Ser Asp Leu Ala Thr
580 585 590
Asn Asn Leu Val Val Met Ala Tyr Ile Thr Gly Gly Val Val Gln Leu
595 600 605
Thr Ser Gln Trp Leu Thr Asn Ile Phe Gly Thr Val Tyr Glu Lys Leu
610 615 620
Lys Pro Val Leu Asp Trp Leu Glu Glu Lys Phe Lys Glu Gly Val Glu
625 630 635 640
Phe Leu Arg Asp Gly Trp Glu Ile Val Lys Phe Ile Ser Thr Cys Ala
645 650 655
Cys Glu Ile Val Gly Gly Gln Ile Val Thr Cys Ala Lys Glu Ile Lys
660 665 670
Glu Ser Val Gln Thr Phe Phe Lys Leu Val Asn Lys Phe Leu Ala Leu
675 680 685
Cys Ala Asp Ser Ile Ile Ile Gly Gly Ala Lys Leu Lys Ala Leu Asn
690 695 700
Leu Gly Glu Thr Phe Val Thr His Ser Lys Gly Leu Tyr Arg Lys Cys
705 710 715 720
Val Lys Ser Arg Glu Glu Thr Gly Leu Leu Met Pro Leu Lys Ala Pro
725 730 735
Lys Glu Ile Ile Phe Leu Glu Gly Glu Thr Leu Pro Thr Glu Val Leu
740 745 750
Thr Glu Glu Val Val Leu Lys Thr Gly Asp Leu Gln Pro Leu Glu Gln
755 760 765
Pro Thr Ser Glu Ala Val Glu Ala Pro Leu Val Gly Thr Pro Val Cys
770 775 780
Ile Asn Gly Leu Met Leu Leu Glu Ile Lys Asp Thr Glu Lys Tyr Cys
785 790 795 800
Ala Leu Ala Pro Asn Met Met Val Thr Asn Asn Thr Phe Thr Leu Lys
805 810 815
Gly Gly Ala Pro Thr Lys Val Thr Phe Gly Asp Asp Thr Val Ile Glu
820 825 830
Val Gln Gly Tyr Lys Ser Val Asn Ile Thr Phe Glu Leu Asp Glu Arg
835 840 845
Ile Asp Lys Val Leu Asn Glu Lys Cys Ser Ala Tyr Thr Val Glu Leu
850 855 860
Gly Thr Glu Val Asn Glu Phe Ala Cys Val Val Ala Asp Ala Val Ile
865 870 875 880
Lys Thr Leu Gln Pro Val Ser Glu Leu Leu Thr Pro Leu Gly Ile Asp
885 890 895
Leu Asp Glu Trp Ser Met Ala Thr Tyr Tyr Leu Phe Asp Glu Ser Gly
900 905 910
Glu Phe Lys Leu Ala Ser His Met Tyr Cys Ser Phe Tyr Pro Pro Asp
915 920 925
Glu Asp Glu Glu Glu Gly Asp Cys Glu Glu Glu Glu Phe Glu Pro Ser
930 935 940
Thr Gln Tyr Glu Tyr Gly Thr Glu Asp Asp Tyr Gln Gly Lys Pro Leu
945 950 955 960
Glu Phe Gly Ala Thr Ser Ala Ala Leu Gln Pro Glu Glu Glu Gln Glu
965 970 975
Glu Asp Trp Leu Asp Asp Asp Ser Gln Gln Thr Val Gly Gln Gln Asp
980 985 990
Gly Ser Glu Asp Asn Gln Thr Thr Ile Ile Gln Thr Ile Val Glu Val
995 1000 1005
Gln Pro Gln Leu Glu Met Glu Leu Thr Pro Val Val Gln Thr Ile
1010 1015 1020
Glu Val Asn Ser Phe Ser Gly Tyr Leu Lys Leu Thr Asp Asn Val
1025 1030 1035
Tyr Ile Lys Asn Ala Asp Ile Val Glu Glu Ala Lys Lys Val Lys
1040 1045 1050
Pro Thr Val Val Val Asn Ala Ala Asn Val Tyr Leu Lys His Gly
1055 1060 1065
Gly Gly Val Ala Gly Ala Leu Asn Lys Ala Thr Asn Asn Ala Met
1070 1075 1080
Gln Val Glu Ser Asp Asp Tyr Ile Ala Thr Asn Gly Pro Leu Lys
1085 1090 1095
Val Gly Gly Ser Cys Val Leu Ser Gly His Asn Leu Ala Lys His
1100 1105 1110
Cys Leu His Val Val Gly Pro Asn Val Asn Lys Gly Glu Asp Ile
1115 1120 1125
Gln Leu Leu Lys Ser Ala Tyr Glu Asn Phe Asn Gln His Glu Val
1130 1135 1140
Leu Leu Ala Pro Leu Leu Ser Ala Gly Ile Phe Gly Ala Asp Pro
1145 1150 1155
Ile His Ser Leu Arg Val Cys Val Asp Thr Val Arg Thr Asn Val
1160 1165 1170
Tyr Leu Ala Val Phe Asp Lys Asn Leu Tyr Asp Lys Leu Val Ser
1175 1180 1185
Ser Phe Leu Glu Met Lys Ser Glu Lys Gln Val Glu Gln Lys Ile
1190 1195 1200
Ala Glu Ile Pro Lys Glu Glu Val Lys Pro Phe Ile Thr Glu Ser
1205 1210 1215
Lys Pro Ser Val Glu Gln Arg Lys Gln Asp Asp Lys Lys Ile Lys
1220 1225 1230
Ala Cys Val Glu Glu Val Thr Thr Thr Leu Glu Glu Thr Lys Phe
1235 1240 1245
Leu Thr Glu Asn Leu Leu Leu Tyr Ile Asp Ile Asn Gly Asn Leu
1250 1255 1260
His Pro Asp Ser Ala Thr Leu Val Ser Asp Ile Asp Ile Thr Phe
1265 1270 1275
Leu Lys Lys Asp Ala Pro Tyr Ile Val Gly Asp Val Val Gln Glu
1280 1285 1290
Gly Val Leu Thr Ala Val Val Ile Pro Thr Lys Lys Ala Gly Gly
1295 1300 1305
Thr Thr Glu Met Leu Ala Lys Ala Leu Arg Lys Val Pro Thr Asp
1310 1315 1320
Asn Tyr Ile Thr Thr Tyr Pro Gly Gln Gly Leu Asn Gly Tyr Thr
1325 1330 1335
Val Glu Glu Ala Lys Thr Val Leu Lys Lys Cys Lys Ser Ala Phe
1340 1345 1350
Tyr Ile Leu Pro Ser Ile Ile Ser Asn Glu Lys Gln Glu Ile Leu
1355 1360 1365
Gly Thr Val Ser Trp Asn Leu Arg Glu Met Leu Ala His Ala Glu
1370 1375 1380
Glu Thr Arg Lys Leu Met Pro Val Cys Val Glu Thr Lys Ala Ile
1385 1390 1395
Val Ser Thr Ile Gln Arg Lys Tyr Lys Gly Ile Lys Ile Gln Glu
1400 1405 1410
Gly Val Val Asp Tyr Gly Ala Arg Phe Tyr Phe Tyr Thr Ser Lys
1415 1420 1425
Thr Thr Val Ala Ser Leu Ile Asn Thr Leu Asn Asp Leu Asn Glu
1430 1435 1440
Thr Leu Val Thr Met Pro Leu Gly Tyr Val Thr His Gly Leu Asn
1445 1450 1455
Leu Glu Glu Ala Ala Arg Tyr Met Arg Ser Leu Lys Val Pro Ala
1460 1465 1470
Thr Val Ser Val Ser Ser Pro Asp Ala Val Thr Ala Tyr Asn Gly
1475 1480 1485
Tyr Leu Thr Ser Ser Ser Lys Thr Pro Glu Glu His Phe Ile Glu
1490 1495 1500
Thr Ile Ser Leu Ala Gly Ser Tyr Lys Asp Trp Ser Tyr Ser Gly
1505 1510 1515
Gln Ser Thr Gln Leu Gly Ile Glu Phe Leu Lys Arg Gly Asp Lys
1520 1525 1530
Ser Val Tyr Tyr Thr Ser Asn Pro Thr Thr Phe His Leu Asp Gly
1535 1540 1545
Glu Val Ile Thr Phe Asp Asn Leu Lys Thr Leu Leu Ser Leu Arg
1550 1555 1560
Glu Val Arg Thr Ile Lys Val Phe Thr Thr Val Asp Asn Ile Asn
1565 1570 1575
Leu His Thr Gln Val Val Asp Met Ser Met Thr Tyr Gly Gln Gln
1580 1585 1590
Phe Gly Pro Thr Tyr Leu Asp Gly Ala Asp Val Thr Lys Ile Lys
1595 1600 1605
Pro His Asn Ser His Glu Gly Lys Thr Phe Tyr Val Leu Pro Asn
1610 1615 1620
Asp Asp Thr Leu Arg Val Glu Ala Phe Glu Tyr Tyr His Thr Thr
1625 1630 1635
Asp Pro Ser Phe Leu Gly Arg Tyr Met Ser Ala Leu Asn His Thr
1640 1645 1650
Lys Lys Trp Lys Tyr Pro Gln Val Asn Gly Leu Thr Ser Ile Lys
1655 1660 1665
Trp Ala Asp Asn Asn Cys Tyr Leu Ala Thr Ala Leu Leu Thr Leu
1670 1675 1680
Gln Gln Ile Glu Leu Lys Phe Asn Pro Pro Ala Leu Gln Asp Ala
1685 1690 1695
Tyr Tyr Arg Ala Arg Ala Gly Glu Ala Asp Asn Phe Cys Ala Leu
1700 1705 1710
Ile Leu Ala Tyr Cys Asn Lys Thr Val Gly Glu Leu Gly Asp Val
1715 1720 1725
Arg Glu Thr Met Ser Tyr Leu Phe Gln His Ala Asn Leu Asp Ser
1730 1735 1740
Cys Lys Arg Val Leu Asn Val Val Cys Lys Thr Cys Gly Gln Gln
1745 1750 1755
Gln Thr Thr Leu Lys Gly Val Glu Ala Val Met Tyr Met Gly Thr
1760 1765 1770
Leu Ser Tyr Glu Gln Phe Lys Lys Gly Val Gln Ile Pro Cys Thr
1775 1780 1785
Cys Gly Lys Gln Ala Thr Lys Tyr Leu Val Gln Gln Glu Ser Pro
1790 1795 1800
Phe Val Met Met Ser Ala Pro Pro Ala Gln Tyr Glu Leu Lys His
1805 1810 1815
Gly Thr Phe Thr Cys Ala Ser Glu Tyr Thr Gly Asn Tyr Gln Cys
1820 1825 1830
Gly His Tyr Lys His Ile Thr Ser Lys Glu Thr Leu Tyr Cys Ile
1835 1840 1845
Asp Gly Ala Leu Leu Thr Lys Ser Ser Glu Tyr Lys Gly Pro Ile
1850 1855 1860
Thr Asp Val Phe Tyr Lys Glu Asn Ser Tyr Thr Thr Thr Ile Lys
1865 1870 1875
Pro Val Thr Tyr Lys Leu Asp Gly Val Val Cys Thr Glu Ile Asp
1880 1885 1890
Pro Lys Leu Asp Asn Tyr Tyr Lys Lys Asp Asn Ser Tyr Phe Thr
1895 1900 1905
Glu Gln Pro Ile Asp Leu Val Pro Asn Gln Pro Tyr Pro Asn Ala
1910 1915 1920
Ser Phe Asp Asn Phe Lys Phe Val Cys Asp Asn Ile Lys Phe Ala
1925 1930 1935
Asp Asp Leu Asn Gln Leu Thr Gly Tyr Lys Lys Pro Ala Ser Arg
1940 1945 1950
Glu Leu Lys Val Thr Phe Phe Pro Asp Leu Asn Gly Asp Val Val
1955 1960 1965
Ala Ile Asp Tyr Lys His Tyr Thr Pro Ser Phe Lys Lys Gly Ala
1970 1975 1980
Lys Leu Leu His Lys Pro Ile Val Trp His Val Asn Asn Ala Thr
1985 1990 1995
Asn Lys Ala Thr Tyr Lys Pro Asn Thr Trp Cys Ile Arg Cys Leu
2000 2005 2010
Trp Ser Thr Lys Pro Val Glu Thr Ser Asn Ser Phe Asp Val Leu
2015 2020 2025
Lys Ser Glu Asp Ala Gln Gly Met Asp Asn Leu Ala Cys Glu Asp
2030 2035 2040
Leu Lys Pro Val Ser Glu Glu Val Val Glu Asn Pro Thr Ile Gln
2045 2050 2055
Lys Asp Val Leu Glu Cys Asn Val Lys Thr Thr Glu Val Val Gly
2060 2065 2070
Asp Ile Ile Leu Lys Pro Ala Asn Asn Ser Leu Lys Ile Thr Glu
2075 2080 2085
Glu Val Gly His Thr Asp Leu Met Ala Ala Tyr Val Asp Asn Ser
2090 2095 2100
Ser Leu Thr Ile Lys Lys Pro Asn Glu Leu Ser Arg Val Leu Gly
2105 2110 2115
Leu Lys Thr Leu Ala Thr His Gly Leu Ala Ala Val Asn Ser Val
2120 2125 2130
Pro Trp Asp Thr Ile Ala Asn Tyr Ala Lys Pro Phe Leu Asn Lys
2135 2140 2145
Val Val Ser Thr Thr Thr Asn Ile Val Thr Arg Cys Leu Asn Arg
2150 2155 2160
Val Cys Thr Asn Tyr Met Pro Tyr Phe Phe Thr Leu Leu Leu Gln
2165 2170 2175
Leu Cys Thr Phe Thr Arg Ser Thr Asn Ser Arg Ile Lys Ala Ser
2180 2185 2190
Met Pro Thr Thr Ile Ala Lys Asn Thr Val Lys Ser Val Gly Lys
2195 2200 2205
Phe Cys Leu Glu Ala Ser Phe Asn Tyr Leu Lys Ser Pro Asn Phe
2210 2215 2220
Ser Lys Leu Ile Asn Ile Thr Ile Trp Phe Leu Leu Leu Ser Val
2225 2230 2235
Cys Leu Gly Ser Leu Ile Tyr Ser Thr Ala Ala Leu Gly Val Leu
2240 2245 2250
Met Ser Asn Leu Gly Met Pro Ser Tyr Cys Thr Gly Tyr Arg Glu
2255 2260 2265
Gly Tyr Leu Asn Ser Thr Asn Val Thr Ile Ala Thr Tyr Cys Thr
2270 2275 2280
Gly Ser Ile Pro Cys Ser Val Cys Leu Ser Gly Leu Asp Ser Leu
2285 2290 2295
Asp Thr Tyr Pro Ser Leu Glu Thr Ile Gln Ile Thr Ile Ser Ser
2300 2305 2310
Phe Lys Trp Asp Leu Thr Ala Phe Gly Leu Val Ala Glu Trp Phe
2315 2320 2325
Leu Ala Tyr Ile Leu Phe Thr Arg Phe Phe Tyr Val Leu Gly Leu
2330 2335 2340
Ala Ala Ile Met Gln Leu Phe Phe Ser Tyr Phe Ala Val His Phe
2345 2350 2355
Ile Ser Asn Ser Trp Leu Met Trp Leu Ile Ile Asn Leu Val Gln
2360 2365 2370
Met Ala Pro Ile Ser Ala Met Val Arg Met Tyr Ile Phe Phe Ala
2375 2380 2385
Ser Phe Tyr Tyr Val Trp Lys Ser Tyr Val His Val Val Asp Gly
2390 2395 2400
Cys Asn Ser Ser Thr Cys Met Met Cys Tyr Lys Arg Asn Arg Ala
2405 2410 2415
Thr Arg Val Glu Cys Thr Thr Ile Val Asn Gly Val Arg Arg Ser
2420 2425 2430
Phe Tyr Val Tyr Ala Asn Gly Gly Lys Gly Phe Cys Lys Leu His
2435 2440 2445
Asn Trp Asn Cys Val Asn Cys Asp Thr Phe Cys Ala Gly Ser Thr
2450 2455 2460
Phe Ile Ser Asp Glu Val Ala Arg Asp Leu Ser Leu Gln Phe Lys
2465 2470 2475
Arg Pro Ile Asn Pro Thr Asp Gln Ser Ser Tyr Ile Val Asp Ser
2480 2485 2490
Val Thr Val Lys Asn Gly Ser Ile His Leu Tyr Phe Asp Lys Ala
2495 2500 2505
Gly Gln Lys Thr Tyr Glu Arg His Ser Leu Ser His Phe Val Asn
2510 2515 2520
Leu Asp Asn Leu Arg Ala Asn Asn Thr Lys Gly Ser Leu Pro Ile
2525 2530 2535
Asn Val Ile Val Phe Asp Gly Lys Ser Lys Cys Glu Glu Ser Ser
2540 2545 2550
Ala Lys Ser Ala Ser Val Tyr Tyr Ser Gln Leu Met Cys Gln Pro
2555 2560 2565
Ile Leu Leu Leu Asp Gln Ala Leu Val Ser Asp Val Gly Asp Ser
2570 2575 2580
Ala Glu Val Ala Val Lys Met Phe Asp Ala Tyr Val Asn Thr Phe
2585 2590 2595
Ser Ser Thr Phe Asn Val Pro Met Glu Lys Leu Lys Thr Leu Val
2600 2605 2610
Ala Thr Ala Glu Ala Glu Leu Ala Lys Asn Val Ser Leu Asp Asn
2615 2620 2625
Val Leu Ser Thr Phe Ile Ser Ala Ala Arg Gln Gly Phe Val Asp
2630 2635 2640
Ser Asp Val Glu Thr Lys Asp Val Val Glu Cys Leu Lys Leu Ser
2645 2650 2655
His Gln Ser Asp Ile Glu Val Thr Gly Asp Ser Cys Asn Asn Tyr
2660 2665 2670
Met Leu Thr Tyr Asn Lys Val Glu Asn Met Thr Pro Arg Asp Leu
2675 2680 2685
Gly Ala Cys Ile Asp Cys Ser Ala Arg His Ile Asn Ala Gln Val
2690 2695 2700
Ala Lys Ser His Asn Ile Ala Leu Ile Trp Asn Val Lys Asp Phe
2705 2710 2715
Met Ser Leu Ser Glu Gln Leu Arg Lys Gln Ile Arg Ser Ala Ala
2720 2725 2730
Lys Lys Asn Asn Leu Pro Phe Lys Leu Thr Cys Ala Thr Thr Arg
2735 2740 2745
Gln Val Val Asn Val Val Thr Thr Lys Ile Ala Leu Lys Gly Gly
2750 2755 2760
Lys Ile Val Asn Asn Trp Leu Lys Gln Leu Ile Lys Val Thr Leu
2765 2770 2775
Val Phe Leu Phe Val Ala Ala Ile Phe Tyr Leu Ile Thr Pro Val
2780 2785 2790
His Val Met Ser Lys His Thr Asp Phe Ser Ser Glu Ile Ile Gly
2795 2800 2805
Tyr Lys Ala Ile Asp Gly Gly Val Thr Arg Asp Ile Ala Ser Thr
2810 2815 2820
Asp Thr Cys Phe Ala Asn Lys His Ala Asp Phe Asp Thr Trp Phe
2825 2830 2835
Ser Gln Arg Gly Gly Ser Tyr Thr Asn Asp Lys Ala Cys Pro Leu
2840 2845 2850
Ile Ala Ala Val Ile Thr Arg Glu Val Gly Phe Val Val Pro Gly
2855 2860 2865
Leu Pro Gly Thr Ile Leu Arg Thr Thr Asn Gly Asp Phe Leu His
2870 2875 2880
Phe Leu Pro Arg Val Phe Ser Ala Val Gly Asn Ile Cys Tyr Thr
2885 2890 2895
Pro Ser Lys Leu Ile Glu Tyr Thr Asp Phe Ala Thr Ser Ala Cys
2900 2905 2910
Val Leu Ala Ala Glu Cys Thr Ile Phe Lys Asp Ala Ser Gly Lys
2915 2920 2925
Pro Val Pro Tyr Cys Tyr Asp Thr Asn Val Leu Glu Gly Ser Val
2930 2935 2940
Ala Tyr Glu Ser Leu Arg Pro Asp Thr Arg Tyr Val Leu Met Asp
2945 2950 2955
Gly Ser Ile Ile Gln Phe Pro Asn Thr Tyr Leu Glu Gly Ser Val
2960 2965 2970
Arg Val Val Thr Thr Phe Asp Ser Glu Tyr Cys Arg His Gly Thr
2975 2980 2985
Cys Glu Arg Ser Glu Ala Gly Val Cys Val Ser Thr Ser Gly Arg
2990 2995 3000
Trp Val Leu Asn Asn Asp Tyr Tyr Arg Ser Leu Pro Gly Val Phe
3005 3010 3015
Cys Gly Val Asp Ala Val Asn Leu Leu Thr Asn Met Phe Thr Pro
3020 3025 3030
Leu Ile Gln Pro Ile Gly Ala Leu Asp Ile Ser Ala Ser Ile Val
3035 3040 3045
Ala Gly Gly Ile Val Ala Ile Val Val Thr Cys Leu Ala Tyr Tyr
3050 3055 3060
Phe Met Arg Phe Arg Arg Ala Phe Gly Glu Tyr Ser His Val Val
3065 3070 3075
Ala Phe Asn Thr Leu Leu Phe Leu Met Ser Phe Thr Val Leu Cys
3080 3085 3090
Leu Thr Pro Val Tyr Ser Phe Leu Pro Gly Val Tyr Ser Val Ile
3095 3100 3105
Tyr Leu Tyr Leu Thr Phe Tyr Leu Thr Asn Asp Val Ser Phe Leu
3110 3115 3120
Ala His Ile Gln Trp Met Val Met Phe Thr Pro Leu Val Pro Phe
3125 3130 3135
Trp Ile Thr Ile Ala Tyr Ile Ile Cys Ile Ser Thr Lys His Phe
3140 3145 3150
Tyr Trp Phe Phe Ser Asn Tyr Leu Lys Arg Arg Val Val Phe Asn
3155 3160 3165
Gly Val Ser Phe Ser Thr Phe Glu Glu Ala Ala Leu Cys Thr Phe
3170 3175 3180
Leu Leu Asn Lys Glu Met Tyr Leu Lys Leu Arg Ser Asp Val Leu
3185 3190 3195
Leu Pro Leu Thr Gln Tyr Asn Arg Tyr Leu Ala Leu Tyr Asn Lys
3200 3205 3210
Tyr Lys Tyr Phe Ser Gly Ala Met Asp Thr Thr Ser Tyr Arg Glu
3215 3220 3225
Ala Ala Cys Cys His Leu Ala Lys Ala Leu Asn Asp Phe Ser Asn
3230 3235 3240
Ser Gly Ser Asp Val Leu Tyr Gln Pro Pro Gln Thr Ser Ile Thr
3245 3250 3255
Ser Ala Val Leu Gln Ser Gly Phe Arg Lys Met Ala Phe Pro Ser
3260 3265 3270
Gly Lys Val Glu Gly Cys Met Val Gln Val Thr Cys Gly Thr Thr
3275 3280 3285
Thr Leu Asn Gly Leu Trp Leu Asp Asp Val Val Tyr Cys Pro Arg
3290 3295 3300
His Val Ile Cys Thr Ser Glu Asp Met Leu Asn Pro Asn Tyr Glu
3305 3310 3315
Asp Leu Leu Ile Arg Lys Ser Asn His Asn Phe Leu Val Gln Ala
3320 3325 3330
Gly Asn Val Gln Leu Arg Val Ile Gly His Ser Met Gln Asn Cys
3335 3340 3345
Val Leu Lys Leu Lys Val Asp Thr Ala Asn Pro Lys Thr Pro Lys
3350 3355 3360
Tyr Lys Phe Val Arg Ile Gln Pro Gly Gln Thr Phe Ser Val Leu
3365 3370 3375
Ala Cys Tyr Asn Gly Ser Pro Ser Gly Val Tyr Gln Cys Ala Met
3380 3385 3390
Arg Pro Asn Phe Thr Ile Lys Gly Ser Phe Leu Asn Gly Ser Cys
3395 3400 3405
Gly Ser Val Gly Phe Asn Ile Asp Tyr Asp Cys Val Ser Phe Cys
3410 3415 3420
Tyr Met His His Met Glu Leu Pro Thr Gly Val His Ala Gly Thr
3425 3430 3435
Asp Leu Glu Gly Asn Phe Tyr Gly Pro Phe Val Asp Arg Gln Thr
3440 3445 3450
Ala Gln Ala Ala Gly Thr Asp Thr Thr Ile Thr Val Asn Val Leu
3455 3460 3465
Ala Trp Leu Tyr Ala Ala Val Ile Asn Gly Asp Arg Trp Phe Leu
3470 3475 3480
Asn Arg Phe Thr Thr Thr Leu Asn Asp Phe Asn Leu Val Ala Met
3485 3490 3495
Lys Tyr Asn Tyr Glu Pro Leu Thr Gln Asp His Val Asp Ile Leu
3500 3505 3510
Gly Pro Leu Ser Ala Gln Thr Gly Ile Ala Val Leu Asp Met Cys
3515 3520 3525
Ala Ser Leu Lys Glu Leu Leu Gln Asn Gly Met Asn Gly Arg Thr
3530 3535 3540
Ile Leu Gly Ser Ala Leu Leu Glu Asp Glu Phe Thr Pro Phe Asp
3545 3550 3555
Val Val Arg Gln Cys Ser Gly Val Thr Phe Gln Ser Ala Val Lys
3560 3565 3570
Arg Thr Ile Lys Gly Thr His His Trp Leu Leu Leu Thr Ile Leu
3575 3580 3585
Thr Ser Leu Leu Val Leu Val Gln Ser Thr Gln Trp Ser Leu Phe
3590 3595 3600
Phe Phe Leu Tyr Glu Asn Ala Phe Leu Pro Phe Ala Met Gly Ile
3605 3610 3615
Ile Ala Met Ser Ala Phe Ala Met Met Phe Val Lys His Lys His
3620 3625 3630
Ala Phe Leu Cys Leu Phe Leu Leu Pro Ser Leu Ala Thr Val Ala
3635 3640 3645
Tyr Phe Asn Met Val Tyr Met Pro Ala Ser Trp Val Met Arg Ile
3650 3655 3660
Met Thr Trp Leu Asp Met Val Asp Thr Ser Leu Lys Leu Lys Asp
3665 3670 3675
Cys Val Met Tyr Ala Ser Ala Val Val Leu Leu Ile Leu Met Thr
3680 3685 3690
Ala Arg Thr Val Tyr Asp Asp Gly Ala Arg Arg Val Trp Thr Leu
3695 3700 3705
Met Asn Val Leu Thr Leu Val Tyr Lys Val Tyr Tyr Gly Asn Ala
3710 3715 3720
Leu Asp Gln Ala Ile Ser Met Trp Ala Leu Ile Ile Ser Val Thr
3725 3730 3735
Ser Asn Tyr Ser Gly Val Val Thr Thr Val Met Phe Leu Ala Arg
3740 3745 3750
Gly Ile Val Phe Met Cys Val Glu Tyr Cys Pro Ile Phe Phe Ile
3755 3760 3765
Thr Gly Asn Thr Leu Gln Cys Ile Met Leu Val Tyr Cys Phe Leu
3770 3775 3780
Gly Tyr Phe Cys Thr Cys Tyr Phe Gly Leu Phe Cys Leu Leu Asn
3785 3790 3795
Arg Tyr Phe Arg Leu Thr Leu Gly Val Tyr Asp Tyr Leu Val Ser
3800 3805 3810
Thr Gln Glu Phe Arg Tyr Met Asn Ser Gln Gly Leu Leu Pro Pro
3815 3820 3825
Lys Asn Ser Ile Asp Ala Phe Lys Leu Asn Ile Lys Leu Leu Gly
3830 3835 3840
Val Gly Gly Lys Pro Cys Ile Lys Val Ala Thr Val Gln Ser Lys
3845 3850 3855
Met Ser Asp Val Lys Cys Thr Ser Val Val Leu Leu Ser Val Leu
3860 3865 3870
Gln Gln Leu Arg Val Glu Ser Ser Ser Lys Leu Trp Ala Gln Cys
3875 3880 3885
Val Gln Leu His Asn Asp Ile Leu Leu Ala Lys Asp Thr Thr Glu
3890 3895 3900
Ala Phe Glu Lys Met Val Ser Leu Leu Ser Val Leu Leu Ser Met
3905 3910 3915
Gln Gly Ala Val Asp Ile Asn Lys Leu Cys Glu Glu Met Leu Asp
3920 3925 3930
Asn Arg Ala Thr Leu Gln Ala Ile Ala Ser Glu Phe Ser Ser Leu
3935 3940 3945
Pro Ser Tyr Ala Ala Phe Ala Thr Ala Gln Glu Ala Tyr Glu Gln
3950 3955 3960
Ala Val Ala Asn Gly Asp Ser Glu Val Val Leu Lys Lys Leu Lys
3965 3970 3975
Lys Ser Leu Asn Val Ala Lys Ser Glu Phe Asp Arg Asp Ala Ala
3980 3985 3990
Met Gln Arg Lys Leu Glu Lys Met Ala Asp Gln Ala Met Thr Gln
3995 4000 4005
Met Tyr Lys Gln Ala Arg Ser Glu Asp Lys Arg Ala Lys Val Thr
4010 4015 4020
Ser Ala Met Gln Thr Met Leu Phe Thr Met Leu Arg Lys Leu Asp
4025 4030 4035
Asn Asp Ala Leu Asn Asn Ile Ile Asn Asn Ala Arg Asp Gly Cys
4040 4045 4050
Val Pro Leu Asn Ile Ile Pro Leu Thr Thr Ala Ala Lys Leu Met
4055 4060 4065
Val Val Ile Pro Asp Tyr Asn Thr Tyr Lys Asn Thr Cys Asp Gly
4070 4075 4080
Thr Thr Phe Thr Tyr Ala Ser Ala Leu Trp Glu Ile Gln Gln Val
4085 4090 4095
Val Asp Ala Asp Ser Lys Ile Val Gln Leu Ser Glu Ile Ser Met
4100 4105 4110
Asp Asn Ser Pro Asn Leu Ala Trp Pro Leu Ile Val Thr Ala Leu
4115 4120 4125
Arg Ala Asn Ser Ala Val Lys Leu Gln Asn Asn Glu Leu Ser Pro
4130 4135 4140
Val Ala Leu Arg Gln Met Ser Cys Ala Ala Gly Thr Thr Gln Thr
4145 4150 4155
Ala Cys Thr Asp Asp Asn Ala Leu Ala Tyr Tyr Asn Thr Thr Lys
4160 4165 4170
Gly Gly Arg Phe Val Leu Ala Leu Leu Ser Asp Leu Gln Asp Leu
4175 4180 4185
Lys Trp Ala Arg Phe Pro Lys Ser Asp Gly Thr Gly Thr Ile Tyr
4190 4195 4200
Thr Glu Leu Glu Pro Pro Cys Arg Phe Val Thr Asp Thr Pro Lys
4205 4210 4215
Gly Pro Lys Val Lys Tyr Leu Tyr Phe Ile Lys Gly Leu Asn Asn
4220 4225 4230
Leu Asn Arg Gly Met Val Leu Gly Ser Leu Ala Ala Thr Val Arg
4235 4240 4245
Leu Gln Ala Gly Asn Ala Thr Glu Val Pro Ala Asn Ser Thr Val
4250 4255 4260
Leu Ser Phe Cys Ala Phe Ala Val Asp Ala Ala Lys Ala Tyr Lys
4265 4270 4275
Asp Tyr Leu Ala Ser Gly Gly Gln Pro Ile Thr Asn Cys Val Lys
4280 4285 4290
Met Leu Cys Thr His Thr Gly Thr Gly Gln Ala Ile Thr Val Thr
4295 4300 4305
Pro Glu Ala Asn Met Asp Gln Glu Ser Phe Gly Gly Ala Ser Cys
4310 4315 4320
Cys Leu Tyr Cys Arg Cys His Ile Asp His Pro Asn Pro Lys Gly
4325 4330 4335
Phe Cys Asp Leu Lys Gly Lys Tyr Val Gln Ile Pro Thr Thr Cys
4340 4345 4350
Ala Asn Asp Pro Val Gly Phe Thr Leu Lys Asn Thr Val Cys Thr
4355 4360 4365
Val Cys Gly Met Trp Lys Gly Tyr Gly Cys Ser Cys Asp Gln Leu
4370 4375 4380
Arg Glu Pro Met Leu Gln Ser Ala Asp Ala Gln Ser Phe Leu Asn
4385 4390 4395
Gly Phe Ala Val
4400
<210> 403
<211> 1270
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 403
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp Asn Pro
65 70 75 80
Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu Lys Ser
85 90 95
Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser Lys Thr
100 105 110
Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile Lys Val
115 120 125
Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr His Lys
130 135 140
Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr Ser Ser Ala
145 150 155 160
Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met Asp Leu
165 170 175
Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val Phe Lys
180 185 190
Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro Ile Asn
195 200 205
Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu Val
210 215 220
Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu Ala
225 230 235 240
Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr
245 250 255
Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe
260 265 270
Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys
275 280 285
Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr
290 295 300
Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr
305 310 315 320
Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly
325 330 335
Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg
340 345 350
Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser
355 360 365
Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu
370 375 380
Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg
385 390 395 400
Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala
405 410 415
Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala
420 425 430
Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr
435 440 445
Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp
450 455 460
Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val
465 470 475 480
Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro
485 490 495
Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe
500 505 510
Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr
515 520 525
Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr
530 535 540
Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln
545 550 555 560
Gln Phe Gly Arg Asp Ile Asp Asp Thr Thr Asp Ala Val Arg Asp Pro
565 570 575
Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Val
580 585 590
Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu
595 600 605
Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala Asp
610 615 620
Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val Phe
625 630 635 640
Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn Ser
645 650 655
Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln
660 665 670
Thr Gln Thr Asn Ser His Arg Arg Ala Arg Ser Val Ala Ser Gln Ser
675 680 685
Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr
690 695 700
Ser Asn Asn Ser Ile Ala Ile Pro Ile Asn Phe Thr Ile Ser Val Thr
705 710 715 720
Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr
725 730 735
Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln
740 745 750
Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala
755 760 765
Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln
770 775 780
Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser
785 790 795 800
Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu
805 810 815
Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys
820 825 830
Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys
835 840 845
Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp
850 855 860
Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr
865 870 875 880
Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala
885 890 895
Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val
900 905 910
Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile
915 920 925
Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys
930 935 940
Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val
945 950 955 960
Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp
965 970 975
Ile Leu Ala Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp Arg
980 985 990
Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln
995 1000 1005
Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala
1010 1015 1020
Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp
1025 1030 1035
Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1040 1045 1050
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln
1055 1060 1065
Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys
1070 1075 1080
Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His
1085 1090 1095
Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr
1100 1105 1110
Thr His Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly
1115 1120 1125
Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp
1130 1135 1140
Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser
1145 1150 1155
Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val
1160 1165 1170
Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys
1175 1180 1185
Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr
1190 1195 1200
Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly Phe Ile
1205 1210 1215
Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys Cys
1220 1225 1230
Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly
1235 1240 1245
Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys
1250 1255 1260
Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 404
<211> 275
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 404
Met Asp Leu Phe Met Arg Ile Phe Thr Ile Gly Thr Val Thr Leu Lys
1 5 10 15
Gln Gly Glu Ile Lys Asp Ala Thr Pro Ser Asp Phe Val Arg Ala Thr
20 25 30
Ala Thr Ile Pro Ile Gln Ala Ser Leu Pro Phe Gly Trp Leu Ile Val
35 40 45
Gly Val Ala Leu Leu Ala Val Phe Gln Ser Ala Ser Lys Ile Ile Thr
50 55 60
Leu Lys Lys Arg Trp Gln Leu Ala Leu Ser Lys Gly Val His Phe Val
65 70 75 80
Cys Asn Leu Leu Leu Leu Phe Val Thr Val Tyr Ser His Leu Leu Leu
85 90 95
Val Ala Ala Gly Leu Glu Ala Pro Phe Leu Tyr Leu Tyr Ala Leu Val
100 105 110
Tyr Phe Leu Gln Ser Ile Asn Phe Val Arg Ile Ile Met Arg Leu Trp
115 120 125
Leu Cys Trp Lys Cys Arg Ser Lys Asn Pro Leu Leu Tyr Asp Ala Asn
130 135 140
Tyr Phe Leu Cys Trp His Thr Asn Cys Tyr Asp Tyr Cys Ile Pro Tyr
145 150 155 160
Asn Ser Val Thr Ser Ser Ile Val Ile Thr Ser Gly Asp Gly Thr Thr
165 170 175
Ser Pro Ile Ser Glu His Asp Tyr Gln Ile Gly Gly Tyr Thr Glu Lys
180 185 190
Trp Glu Ser Gly Val Lys Asp Cys Val Val Leu His Ser Tyr Phe Thr
195 200 205
Ser Asp Tyr Tyr Gln Leu Tyr Ser Thr Gln Leu Ser Thr Asp Thr Gly
210 215 220
Val Glu His Val Thr Phe Phe Ile Tyr Asn Lys Ile Val Asp Glu Pro
225 230 235 240
Glu Glu His Val Gln Ile His Thr Ile Asp Gly Ser Ser Gly Val Val
245 250 255
Asn Pro Val Met Glu Pro Ile Tyr Asp Glu Pro Thr Thr Thr Thr Ser
260 265 270
Val Pro Leu
275
<210> 405
<211> 75
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 405
Met Tyr Ser Phe Val Ser Glu Glu Thr Gly Thr Leu Ile Val Asn Ser
1 5 10 15
Val Leu Leu Phe Leu Ala Phe Val Val Phe Leu Leu Val Thr Leu Ala
20 25 30
Ile Leu Thr Ala Leu Arg Leu Cys Ala Tyr Cys Cys Asn Ile Val Asn
35 40 45
Val Ser Leu Val Lys Pro Ser Phe Tyr Val Tyr Ser Arg Val Lys Asn
50 55 60
Leu Asn Ser Ser Arg Val Pro Asp Leu Leu Val
65 70 75
<210> 406
<211> 222
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 406
Met Ala Asp Ser Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Lys Leu
1 5 10 15
Leu Glu Gln Trp Asn Leu Val Ile Gly Phe Leu Phe Leu Thr Trp Ile
20 25 30
Cys Leu Leu Gln Phe Ala Tyr Ala Asn Arg Asn Arg Phe Leu Tyr Ile
35 40 45
Ile Lys Leu Ile Phe Leu Trp Leu Leu Trp Pro Val Thr Leu Ala Cys
50 55 60
Phe Val Leu Ala Ala Val Tyr Arg Ile Asn Trp Ile Thr Gly Gly Ile
65 70 75 80
Ala Ile Ala Met Ala Cys Leu Val Gly Leu Met Trp Leu Ser Tyr Phe
85 90 95
Ile Ala Ser Phe Arg Leu Phe Ala Arg Thr Arg Ser Met Trp Ser Phe
100 105 110
Asn Pro Glu Thr Asn Ile Leu Leu Asn Val Pro Leu His Gly Thr Ile
115 120 125
Leu Thr Arg Pro Leu Leu Glu Ser Glu Leu Val Ile Gly Ala Val Ile
130 135 140
Leu Arg Gly His Leu Arg Ile Ala Gly His His Leu Gly Arg Cys Asp
145 150 155 160
Ile Lys Asp Leu Pro Lys Glu Ile Thr Val Ala Thr Ser Arg Thr Leu
165 170 175
Ser Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Ala Gly Asp Ser Gly
180 185 190
Phe Ala Ala Tyr Ser Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr
195 200 205
Asp His Ser Ser Ser Ser Asp Asn Ile Ala Leu Leu Val Gln
210 215 220
<210> 407
<211> 61
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 407
Met Phe His Leu Val Asp Phe Gln Val Thr Ile Ala Glu Ile Leu Leu
1 5 10 15
Ile Ile Met Arg Thr Phe Lys Val Ser Ile Trp Asn Leu Asp Tyr Ile
20 25 30
Ile Asn Leu Ile Ile Lys Asn Leu Ser Lys Ser Leu Thr Glu Asn Lys
35 40 45
Tyr Ser Gln Leu Asp Glu Glu Gln Pro Met Glu Ile Asp
50 55 60
<210> 408
<211> 121
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 408
Met Lys Ile Ile Leu Phe Leu Ala Leu Ile Thr Leu Ala Thr Cys Glu
1 5 10 15
Leu Tyr His Tyr Gln Glu Cys Val Arg Gly Thr Thr Val Leu Leu Lys
20 25 30
Glu Pro Cys Ser Ser Gly Thr Tyr Glu Gly Asn Ser Pro Phe His Pro
35 40 45
Leu Ala Asp Asn Lys Phe Ala Leu Thr Cys Phe Ser Thr Gln Phe Ala
50 55 60
Phe Ala Cys Pro Asp Gly Val Lys His Val Tyr Gln Leu Arg Ala Arg
65 70 75 80
Ser Val Ser Pro Lys Leu Phe Ile Arg Gln Glu Glu Val Gln Glu Leu
85 90 95
Tyr Ser Pro Ile Phe Leu Ile Val Ala Ala Ile Val Phe Ile Thr Leu
100 105 110
Cys Phe Thr Leu Lys Arg Lys Thr Glu
115 120
<210> 409
<211> 43
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 409
Met Ile Glu Leu Ser Leu Ile Asp Phe Tyr Leu Cys Phe Leu Ala Phe
1 5 10 15
Leu Leu Phe Leu Val Leu Ile Met Leu Ile Ile Phe Trp Phe Ser Leu
20 25 30
Glu Leu Gln Asp His Asn Glu Thr Cys His Ala
35 40
<210> 410
<211> 26
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 410
Met Lys Phe Leu Val Phe Leu Gly Ile Ile Thr Thr Val Ala Ala Phe
1 5 10 15
His Gln Glu Cys Ser Leu Gln Ser Cys Thr
20 25
<210> 411
<211> 419
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 411
Met Ser Leu Asn Gly Pro Gln Asn Gln Arg Asn Ala Pro Arg Ile Thr
1 5 10 15
Phe Gly Gly Pro Ser Asp Ser Thr Gly Ser Asn Gln Asn Gly Glu Arg
20 25 30
Ser Gly Ala Arg Ser Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn Asn
35 40 45
Thr Ala Ser Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Asp Leu
50 55 60
Lys Phe Pro Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Ser Pro
65 70 75 80
Asp Asp Gln Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Ile Arg Gly
85 90 95
Gly Asp Gly Lys Met Lys Asp Leu Ser Pro Arg Trp Tyr Phe Tyr Tyr
100 105 110
Leu Gly Thr Gly Pro Glu Ala Gly Leu Pro Tyr Gly Ala Asn Lys Asp
115 120 125
Gly Ile Ile Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys Asp
130 135 140
His Ile Gly Thr Arg Asn Pro Ala Asn Asn Ala Ala Ile Val Leu Gln
145 150 155 160
Leu Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly Ser
165 170 175
Arg Gly Gly Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg Asn
180 185 190
Ser Ser Arg Asn Ser Thr Pro Gly Ser Ser Lys Arg Thr Ser Pro Ala
195 200 205
Arg Met Ala Gly Asn Gly Gly Asp Ala Ala Leu Ala Leu Leu Leu Leu
210 215 220
Asp Arg Leu Asn Gln Leu Glu Ser Lys Met Phe Gly Lys Gly Gln Gln
225 230 235 240
Gln Gln Gly Gln Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser Lys
245 250 255
Lys Pro Arg Gln Lys Arg Thr Ala Thr Lys Ala Tyr Asn Val Thr Gln
260 265 270
Ala Phe Gly Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly Asp
275 280 285
Gln Glu Leu Ile Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln Ile
290 295 300
Ala Gln Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg Ile
305 310 315 320
Gly Met Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr Thr Gly Ala
325 330 335
Ile Lys Leu Asp Asp Lys Asp Pro Asn Phe Lys Asp Gln Val Ile Leu
340 345 350
Leu Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu Pro
355 360 365
Lys Lys Asp Lys Lys Lys Lys Ala Asp Glu Thr Gln Ala Leu Pro Gln
370 375 380
Arg Gln Lys Lys Gln Gln Thr Val Thr Leu Leu Pro Ala Ala Asp Leu
385 390 395 400
Asp Asp Phe Ser Lys Gln Leu Gln Gln Ser Met Ser Ser Ala Asp Ser
405 410 415
Thr Gln Ala
<210> 412
<211> 38
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 412
Met Gly Tyr Ile Asn Val Phe Ala Phe Pro Phe Thr Ile Tyr Ser Leu
1 5 10 15
Leu Leu Cys Arg Met Asn Ser Arg Asn Tyr Ile Ala Gln Val Asp Val
20 25 30
Val Asn Phe Asn Leu Thr
35
<210> 413
<211> 7096
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 413
Met Glu Ser Leu Val Pro Gly Phe Asn Glu Lys Thr His Val Gln Leu
1 5 10 15
Ser Leu Pro Val Leu Gln Val Arg Asp Val Leu Val Arg Gly Phe Gly
20 25 30
Asp Ser Val Glu Glu Val Leu Ser Glu Ala Arg Gln His Leu Lys Asp
35 40 45
Gly Thr Cys Gly Leu Val Glu Val Glu Lys Gly Val Leu Pro Gln Leu
50 55 60
Glu Gln Pro Tyr Val Phe Ile Lys Arg Ser Asp Ala Arg Thr Ala Pro
65 70 75 80
His Gly His Val Met Val Glu Leu Val Ala Glu Leu Glu Gly Ile Gln
85 90 95
Tyr Gly Arg Ser Gly Glu Thr Leu Gly Val Leu Val Pro His Val Gly
100 105 110
Glu Ile Pro Val Ala Tyr Arg Lys Val Leu Leu Arg Lys Asn Gly Asn
115 120 125
Lys Gly Ala Gly Gly His Ser Tyr Gly Ala Asp Leu Lys Ser Phe Asp
130 135 140
Leu Gly Asp Glu Leu Gly Thr Asp Pro Tyr Glu Asp Phe Gln Glu Asn
145 150 155 160
Trp Asn Thr Lys His Ser Ser Gly Val Thr Arg Glu Leu Met Arg Glu
165 170 175
Leu Asn Gly Gly Ala Tyr Thr Arg Tyr Val Asp Asn Asn Phe Cys Gly
180 185 190
Pro Asp Gly Tyr Pro Leu Glu Cys Ile Lys Asp Leu Leu Ala Arg Ala
195 200 205
Gly Lys Ala Ser Cys Thr Leu Ser Glu Gln Leu Asp Phe Ile Asp Thr
210 215 220
Lys Arg Gly Val Tyr Cys Cys Arg Glu His Glu His Glu Ile Ala Trp
225 230 235 240
Tyr Thr Glu Arg Ser Glu Lys Ser Tyr Glu Leu Gln Thr Pro Phe Glu
245 250 255
Ile Lys Leu Ala Lys Lys Phe Asp Thr Phe Asn Gly Glu Cys Pro Asn
260 265 270
Phe Val Phe Pro Leu Asn Ser Ile Ile Lys Thr Ile Gln Pro Arg Val
275 280 285
Glu Lys Lys Lys Leu Asp Gly Phe Met Gly Arg Ile Arg Ser Val Tyr
290 295 300
Pro Val Ala Ser Pro Asn Glu Cys Asn Gln Met Cys Leu Ser Thr Leu
305 310 315 320
Met Lys Cys Asp His Cys Gly Glu Thr Ser Trp Gln Thr Gly Asp Phe
325 330 335
Val Lys Ala Thr Cys Glu Phe Cys Gly Thr Glu Asn Leu Thr Lys Glu
340 345 350
Gly Ala Thr Thr Cys Gly Tyr Leu Pro Gln Asn Ala Val Val Lys Ile
355 360 365
Tyr Cys Pro Ala Cys His Asn Ser Glu Val Gly Pro Glu His Ser Leu
370 375 380
Ala Glu Tyr His Asn Glu Ser Gly Leu Lys Thr Ile Leu Arg Lys Gly
385 390 395 400
Gly Arg Thr Ile Ala Phe Gly Gly Cys Val Phe Ser Tyr Val Gly Cys
405 410 415
His Asn Lys Cys Ala Tyr Trp Val Pro Arg Ala Ser Ala Asn Ile Gly
420 425 430
Cys Asn His Thr Gly Val Val Gly Glu Gly Ser Glu Gly Leu Asn Asp
435 440 445
Asn Leu Leu Glu Ile Leu Gln Lys Glu Lys Val Asn Ile Asn Ile Val
450 455 460
Gly Asp Phe Lys Leu Asn Glu Glu Ile Ala Ile Ile Leu Ala Ser Phe
465 470 475 480
Ser Ala Ser Thr Ser Ala Phe Val Glu Thr Val Lys Gly Leu Asp Tyr
485 490 495
Lys Ala Phe Lys Gln Ile Val Glu Ser Cys Gly Asn Phe Lys Val Thr
500 505 510
Lys Gly Lys Ala Lys Lys Gly Ala Trp Asn Ile Gly Glu Gln Lys Ser
515 520 525
Ile Leu Ser Pro Leu Tyr Ala Phe Ala Ser Glu Ala Ala Arg Val Val
530 535 540
Arg Ser Ile Phe Ser Arg Thr Leu Glu Thr Ala Gln Asn Ser Val Arg
545 550 555 560
Val Leu Gln Lys Ala Ala Ile Thr Ile Leu Asp Gly Ile Ser Gln Tyr
565 570 575
Ser Leu Arg Leu Ile Asp Ala Met Met Phe Thr Ser Asp Leu Ala Thr
580 585 590
Asn Asn Leu Val Val Met Ala Tyr Ile Thr Gly Gly Val Val Gln Leu
595 600 605
Thr Ser Gln Trp Leu Thr Asn Ile Phe Gly Thr Val Tyr Glu Lys Leu
610 615 620
Lys Pro Val Leu Asp Trp Leu Glu Glu Lys Phe Lys Glu Gly Val Glu
625 630 635 640
Phe Leu Arg Asp Gly Trp Glu Ile Val Lys Phe Ile Ser Thr Cys Ala
645 650 655
Cys Glu Ile Val Gly Gly Gln Ile Val Thr Cys Ala Lys Glu Ile Lys
660 665 670
Glu Ser Val Gln Thr Phe Phe Lys Leu Val Asn Lys Phe Leu Ala Leu
675 680 685
Cys Ala Asp Ser Ile Ile Ile Gly Gly Ala Lys Leu Lys Ala Leu Asn
690 695 700
Leu Gly Glu Thr Phe Val Thr His Ser Lys Gly Leu Tyr Arg Lys Cys
705 710 715 720
Val Lys Ser Arg Glu Glu Thr Gly Leu Leu Met Pro Leu Lys Ala Pro
725 730 735
Lys Glu Ile Ile Phe Leu Glu Gly Glu Thr Leu Pro Thr Glu Val Leu
740 745 750
Thr Glu Glu Val Val Leu Lys Thr Gly Asp Leu Gln Pro Leu Glu Gln
755 760 765
Pro Thr Ser Glu Ala Val Glu Ala Pro Leu Val Gly Thr Pro Val Cys
770 775 780
Ile Asn Gly Leu Met Leu Leu Glu Ile Lys Asp Thr Glu Lys Tyr Cys
785 790 795 800
Ala Leu Ala Pro Asn Met Met Val Thr Asn Asn Thr Phe Thr Leu Lys
805 810 815
Gly Gly Ala Pro Thr Lys Val Thr Phe Gly Asp Asp Thr Val Ile Glu
820 825 830
Val Gln Gly Tyr Lys Ser Val Asn Ile Thr Phe Glu Leu Asp Glu Arg
835 840 845
Ile Asp Lys Val Leu Asn Glu Lys Cys Ser Ala Tyr Thr Val Glu Leu
850 855 860
Gly Thr Glu Val Asn Glu Phe Ala Cys Val Val Ala Asp Ala Val Ile
865 870 875 880
Lys Thr Leu Gln Pro Val Ser Glu Leu Leu Thr Pro Leu Gly Ile Asp
885 890 895
Leu Asp Glu Trp Ser Met Ala Thr Tyr Tyr Leu Phe Asp Glu Ser Gly
900 905 910
Glu Phe Lys Leu Ala Ser His Met Tyr Cys Ser Phe Tyr Pro Pro Asp
915 920 925
Glu Asp Glu Glu Glu Gly Asp Cys Glu Glu Glu Glu Phe Glu Pro Ser
930 935 940
Thr Gln Tyr Glu Tyr Gly Thr Glu Asp Asp Tyr Gln Gly Lys Pro Leu
945 950 955 960
Glu Phe Gly Ala Thr Ser Ala Ala Leu Gln Pro Glu Glu Glu Gln Glu
965 970 975
Glu Asp Trp Leu Asp Asp Asp Ser Gln Gln Thr Val Gly Gln Gln Asp
980 985 990
Gly Ser Glu Asp Asn Gln Thr Thr Thr Ile Gln Thr Ile Val Glu Val
995 1000 1005
Gln Pro Gln Leu Glu Met Glu Leu Thr Pro Val Val Gln Thr Ile
1010 1015 1020
Glu Val Asn Ser Phe Ser Gly Tyr Leu Lys Leu Thr Asp Asn Val
1025 1030 1035
Tyr Ile Lys Asn Ala Asp Ile Val Glu Glu Ala Lys Lys Val Lys
1040 1045 1050
Pro Thr Val Val Val Asn Ala Ala Asn Val Tyr Leu Lys His Gly
1055 1060 1065
Gly Gly Val Ala Gly Ala Leu Asn Lys Ala Thr Asn Asn Ala Met
1070 1075 1080
Gln Val Glu Ser Asp Asp Tyr Ile Ala Thr Asn Gly Pro Leu Lys
1085 1090 1095
Val Gly Gly Ser Cys Val Leu Ser Gly His Asn Leu Ala Lys His
1100 1105 1110
Cys Leu His Val Val Gly Pro Asn Val Asn Lys Gly Glu Asp Ile
1115 1120 1125
Gln Leu Leu Lys Ser Ala Tyr Glu Asn Phe Asn Gln His Glu Val
1130 1135 1140
Leu Leu Ala Pro Leu Leu Ser Ala Gly Ile Phe Gly Ala Asp Pro
1145 1150 1155
Ile His Ser Leu Arg Val Cys Val Asp Thr Val Arg Thr Asn Val
1160 1165 1170
Tyr Leu Ala Val Phe Asp Lys Asn Leu Tyr Asp Lys Leu Val Ser
1175 1180 1185
Ser Phe Leu Glu Met Lys Ser Glu Lys Gln Val Glu Gln Lys Ile
1190 1195 1200
Ala Glu Ile Pro Lys Glu Glu Val Lys Pro Phe Ile Thr Glu Ser
1205 1210 1215
Lys Pro Ser Val Glu Gln Arg Lys Gln Asp Asp Lys Lys Ile Lys
1220 1225 1230
Ala Cys Val Glu Glu Val Thr Thr Thr Leu Glu Glu Thr Lys Phe
1235 1240 1245
Leu Thr Glu Asn Leu Leu Leu Tyr Ile Asp Ile Asn Gly Asn Leu
1250 1255 1260
His Pro Asp Ser Ala Thr Leu Val Ser Asp Ile Asp Ile Thr Phe
1265 1270 1275
Leu Lys Lys Asp Ala Pro Tyr Ile Val Gly Asp Val Val Gln Glu
1280 1285 1290
Gly Val Leu Thr Ala Val Val Ile Pro Thr Lys Lys Ala Gly Gly
1295 1300 1305
Thr Thr Glu Met Leu Ala Lys Ala Leu Arg Lys Val Pro Thr Asp
1310 1315 1320
Asn Tyr Ile Thr Thr Tyr Pro Gly Gln Gly Leu Asn Gly Tyr Thr
1325 1330 1335
Val Glu Glu Ala Lys Thr Val Leu Lys Lys Cys Lys Ser Ala Phe
1340 1345 1350
Tyr Ile Leu Pro Ser Ile Ile Ser Asn Glu Lys Gln Glu Ile Leu
1355 1360 1365
Gly Thr Val Ser Trp Asn Leu Arg Glu Met Leu Ala His Ala Glu
1370 1375 1380
Glu Thr Arg Lys Leu Met Pro Val Cys Val Glu Thr Lys Ala Ile
1385 1390 1395
Val Ser Thr Ile Gln Arg Lys Tyr Lys Gly Ile Lys Ile Gln Glu
1400 1405 1410
Gly Val Val Asp Tyr Gly Ala Arg Phe Tyr Phe Tyr Thr Ser Lys
1415 1420 1425
Thr Thr Val Ala Ser Leu Ile Asn Thr Leu Asn Asp Leu Asn Glu
1430 1435 1440
Thr Leu Val Thr Met Pro Leu Gly Tyr Val Thr His Gly Leu Asn
1445 1450 1455
Leu Glu Glu Ala Ala Arg Tyr Met Arg Ser Leu Lys Val Pro Ala
1460 1465 1470
Thr Val Ser Val Ser Ser Pro Asp Ala Val Thr Ala Tyr Asn Gly
1475 1480 1485
Tyr Leu Thr Ser Ser Ser Lys Thr Pro Glu Glu His Phe Ile Glu
1490 1495 1500
Thr Ile Ser Leu Ala Gly Ser Tyr Lys Asp Trp Ser Tyr Ser Gly
1505 1510 1515
Gln Ser Thr Gln Leu Gly Ile Glu Phe Leu Lys Arg Gly Asp Lys
1520 1525 1530
Ser Val Tyr Tyr Thr Ser Asn Pro Thr Thr Phe His Leu Asp Gly
1535 1540 1545
Glu Val Ile Thr Phe Asp Asn Leu Lys Thr Leu Leu Ser Leu Arg
1550 1555 1560
Glu Val Arg Thr Ile Lys Val Phe Thr Thr Val Asp Asn Ile Asn
1565 1570 1575
Leu His Thr Gln Val Val Asp Met Ser Met Thr Tyr Gly Gln Gln
1580 1585 1590
Phe Gly Pro Thr Tyr Leu Asp Gly Ala Asp Val Thr Lys Ile Lys
1595 1600 1605
Pro His Asn Ser His Glu Gly Lys Thr Phe Tyr Val Leu Pro Asn
1610 1615 1620
Asp Asp Thr Leu Arg Val Glu Ala Phe Glu Tyr Tyr His Thr Thr
1625 1630 1635
Asp Pro Ser Phe Leu Gly Arg Tyr Met Ser Ala Leu Asn His Thr
1640 1645 1650
Lys Lys Trp Lys Tyr Pro Gln Val Asn Gly Leu Thr Ser Ile Lys
1655 1660 1665
Trp Ala Asp Asn Asn Cys Tyr Leu Ala Thr Ala Leu Leu Thr Leu
1670 1675 1680
Gln Gln Ile Glu Leu Lys Phe Asn Pro Pro Ala Leu Gln Asp Ala
1685 1690 1695
Tyr Tyr Arg Ala Arg Ala Gly Glu Ala Ala Asn Phe Cys Ala Leu
1700 1705 1710
Ile Leu Ala Tyr Cys Asn Lys Thr Val Gly Glu Leu Gly Asp Val
1715 1720 1725
Arg Glu Thr Met Ser Tyr Leu Phe Gln His Ala Asn Leu Asp Ser
1730 1735 1740
Cys Lys Arg Val Leu Asn Val Val Cys Lys Thr Cys Gly Gln Gln
1745 1750 1755
Gln Thr Thr Leu Lys Gly Val Glu Ala Val Met Tyr Met Gly Thr
1760 1765 1770
Leu Ser Tyr Glu Gln Phe Lys Lys Gly Val Gln Ile Pro Cys Thr
1775 1780 1785
Cys Gly Lys Gln Ala Thr Lys Tyr Leu Val Gln Gln Glu Ser Pro
1790 1795 1800
Phe Val Met Met Ser Ala Pro Pro Ala Gln Tyr Glu Leu Lys His
1805 1810 1815
Gly Thr Phe Thr Cys Ala Ser Glu Tyr Thr Gly Asn Tyr Gln Cys
1820 1825 1830
Gly His Tyr Lys His Ile Thr Ser Lys Glu Thr Leu Tyr Cys Ile
1835 1840 1845
Asp Gly Ala Leu Leu Thr Lys Ser Ser Glu Tyr Lys Gly Pro Ile
1850 1855 1860
Thr Asp Val Phe Tyr Lys Glu Asn Ser Tyr Thr Thr Thr Ile Lys
1865 1870 1875
Pro Val Thr Tyr Lys Leu Asp Gly Val Val Cys Thr Glu Ile Asp
1880 1885 1890
Pro Lys Leu Asp Asn Tyr Tyr Lys Lys Asp Asn Ser Tyr Phe Thr
1895 1900 1905
Glu Gln Pro Ile Asp Leu Val Pro Asn Gln Pro Tyr Pro Asn Ala
1910 1915 1920
Ser Phe Asp Asn Phe Lys Phe Val Cys Asp Asn Ile Lys Phe Ala
1925 1930 1935
Asp Asp Leu Asn Gln Leu Thr Gly Tyr Lys Lys Pro Ala Ser Arg
1940 1945 1950
Glu Leu Lys Val Thr Phe Phe Pro Asp Leu Asn Gly Asp Val Val
1955 1960 1965
Ala Ile Asp Tyr Lys His Tyr Thr Pro Ser Phe Lys Lys Gly Ala
1970 1975 1980
Lys Leu Leu His Lys Pro Ile Val Trp His Val Asn Asn Ala Thr
1985 1990 1995
Asn Lys Ala Thr Tyr Lys Pro Asn Thr Trp Cys Ile Arg Cys Leu
2000 2005 2010
Trp Ser Thr Lys Pro Val Glu Thr Ser Asn Ser Phe Asp Val Leu
2015 2020 2025
Lys Ser Glu Asp Ala Gln Gly Met Asp Asn Leu Ala Cys Glu Asp
2030 2035 2040
Leu Lys Pro Val Ser Glu Glu Val Val Glu Asn Pro Thr Ile Gln
2045 2050 2055
Lys Asp Val Leu Glu Cys Asn Val Lys Thr Thr Glu Val Val Gly
2060 2065 2070
Asp Ile Ile Leu Lys Pro Ala Asn Asn Ser Leu Lys Ile Thr Glu
2075 2080 2085
Glu Val Gly His Thr Asp Leu Met Ala Ala Tyr Val Asp Asn Ser
2090 2095 2100
Ser Leu Thr Ile Lys Lys Pro Asn Glu Leu Ser Arg Val Leu Gly
2105 2110 2115
Leu Lys Thr Leu Ala Thr His Gly Leu Ala Ala Val Asn Ser Val
2120 2125 2130
Pro Trp Asp Thr Ile Ala Asn Tyr Ala Lys Pro Phe Leu Asn Lys
2135 2140 2145
Val Val Ser Thr Thr Thr Asn Ile Val Thr Arg Cys Leu Asn Arg
2150 2155 2160
Val Cys Thr Asn Tyr Met Pro Tyr Phe Phe Thr Leu Leu Leu Gln
2165 2170 2175
Leu Cys Thr Phe Thr Arg Ser Thr Asn Ser Arg Ile Lys Ala Ser
2180 2185 2190
Met Pro Thr Thr Ile Ala Lys Asn Thr Val Lys Ser Val Gly Lys
2195 2200 2205
Phe Cys Leu Glu Ala Ser Phe Asn Tyr Leu Lys Ser Pro Asn Phe
2210 2215 2220
Ser Lys Leu Ile Asn Ile Ile Ile Trp Phe Leu Leu Leu Ser Val
2225 2230 2235
Cys Leu Gly Ser Leu Ile Tyr Ser Thr Ala Ala Leu Gly Val Leu
2240 2245 2250
Met Ser Asn Leu Gly Met Pro Ser Tyr Cys Thr Gly Tyr Arg Glu
2255 2260 2265
Gly Tyr Leu Asn Ser Thr Asn Val Thr Ile Ala Thr Tyr Cys Thr
2270 2275 2280
Gly Ser Ile Pro Cys Ser Val Cys Leu Ser Gly Leu Asp Ser Leu
2285 2290 2295
Asp Thr Tyr Pro Ser Leu Glu Thr Ile Gln Ile Thr Ile Ser Ser
2300 2305 2310
Phe Lys Trp Asp Leu Thr Ala Phe Gly Leu Val Ala Glu Trp Phe
2315 2320 2325
Leu Ala Tyr Ile Leu Phe Thr Arg Phe Phe Tyr Val Leu Gly Leu
2330 2335 2340
Ala Ala Ile Met Gln Leu Phe Phe Ser Tyr Phe Ala Val His Phe
2345 2350 2355
Ile Ser Asn Ser Trp Leu Met Trp Leu Ile Ile Asn Leu Val Gln
2360 2365 2370
Met Ala Pro Ile Ser Ala Met Val Arg Met Tyr Ile Phe Phe Ala
2375 2380 2385
Ser Phe Tyr Tyr Val Trp Lys Ser Tyr Val His Val Val Asp Gly
2390 2395 2400
Cys Asn Ser Ser Thr Cys Met Met Cys Tyr Lys Arg Asn Arg Ala
2405 2410 2415
Thr Arg Val Glu Cys Thr Thr Ile Val Asn Gly Val Arg Arg Ser
2420 2425 2430
Phe Tyr Val Tyr Ala Asn Gly Gly Lys Gly Phe Cys Lys Leu His
2435 2440 2445
Asn Trp Asn Cys Val Asn Cys Asp Thr Phe Cys Ala Gly Ser Thr
2450 2455 2460
Phe Ile Ser Asp Glu Val Ala Arg Asp Leu Ser Leu Gln Phe Lys
2465 2470 2475
Arg Pro Ile Asn Pro Thr Asp Gln Ser Ser Tyr Ile Val Asp Ser
2480 2485 2490
Val Thr Val Lys Asn Gly Ser Ile His Leu Tyr Phe Asp Lys Ala
2495 2500 2505
Gly Gln Lys Thr Tyr Glu Arg His Ser Leu Ser His Phe Val Asn
2510 2515 2520
Leu Asp Asn Leu Arg Ala Asn Asn Thr Lys Gly Ser Leu Pro Ile
2525 2530 2535
Asn Val Ile Val Phe Asp Gly Lys Ser Lys Cys Glu Glu Ser Ser
2540 2545 2550
Ala Lys Ser Ala Ser Val Tyr Tyr Ser Gln Leu Met Cys Gln Pro
2555 2560 2565
Ile Leu Leu Leu Asp Gln Ala Leu Val Ser Asp Val Gly Asp Ser
2570 2575 2580
Ala Glu Val Ala Val Lys Met Phe Asp Ala Tyr Val Asn Thr Phe
2585 2590 2595
Ser Ser Thr Phe Asn Val Pro Met Glu Lys Leu Lys Thr Leu Val
2600 2605 2610
Ala Thr Ala Glu Ala Glu Leu Ala Lys Asn Val Ser Leu Asp Asn
2615 2620 2625
Val Leu Ser Thr Phe Ile Ser Ala Ala Arg Gln Gly Phe Val Asp
2630 2635 2640
Ser Asp Val Glu Thr Lys Asp Val Val Glu Cys Leu Lys Leu Ser
2645 2650 2655
His Gln Ser Asp Ile Glu Val Thr Gly Asp Ser Cys Asn Asn Tyr
2660 2665 2670
Met Leu Thr Tyr Asn Lys Val Glu Asn Met Thr Pro Arg Asp Leu
2675 2680 2685
Gly Ala Cys Ile Asp Cys Ser Ala Arg His Ile Asn Ala Gln Val
2690 2695 2700
Ala Lys Ser His Asn Ile Ala Leu Ile Trp Asn Val Lys Asp Phe
2705 2710 2715
Met Ser Leu Ser Glu Gln Leu Arg Lys Gln Ile Arg Ser Ala Ala
2720 2725 2730
Lys Lys Asn Asn Leu Pro Phe Lys Leu Thr Cys Ala Thr Thr Arg
2735 2740 2745
Gln Val Val Asn Val Val Thr Thr Lys Ile Ala Leu Lys Gly Gly
2750 2755 2760
Lys Ile Val Asn Asn Trp Leu Lys Gln Leu Ile Lys Val Thr Leu
2765 2770 2775
Val Phe Leu Phe Val Ala Ala Ile Phe Tyr Leu Ile Thr Pro Val
2780 2785 2790
His Val Met Ser Lys His Thr Asp Phe Ser Ser Glu Ile Ile Gly
2795 2800 2805
Tyr Lys Ala Ile Asp Gly Gly Val Thr Arg Asp Ile Ala Ser Thr
2810 2815 2820
Asp Thr Cys Phe Ala Asn Lys His Ala Asp Phe Asp Thr Trp Phe
2825 2830 2835
Ser Gln Arg Gly Gly Ser Tyr Thr Asn Asp Lys Ala Cys Pro Leu
2840 2845 2850
Ile Ala Ala Val Ile Thr Arg Glu Val Gly Phe Val Val Pro Gly
2855 2860 2865
Leu Pro Gly Thr Ile Leu Arg Thr Thr Asn Gly Asp Phe Leu His
2870 2875 2880
Phe Leu Pro Arg Val Phe Ser Ala Val Gly Asn Ile Cys Tyr Thr
2885 2890 2895
Pro Ser Lys Leu Ile Glu Tyr Thr Asp Phe Ala Thr Ser Ala Cys
2900 2905 2910
Val Leu Ala Ala Glu Cys Thr Ile Phe Lys Asp Ala Ser Gly Lys
2915 2920 2925
Pro Val Pro Tyr Cys Tyr Asp Thr Asn Val Leu Glu Gly Ser Val
2930 2935 2940
Ala Tyr Glu Ser Leu Arg Pro Asp Thr Arg Tyr Val Leu Met Asp
2945 2950 2955
Gly Ser Ile Ile Gln Phe Pro Asn Thr Tyr Leu Glu Gly Ser Val
2960 2965 2970
Arg Val Val Thr Thr Phe Asp Ser Glu Tyr Cys Arg His Gly Thr
2975 2980 2985
Cys Glu Arg Ser Glu Ala Gly Val Cys Val Ser Thr Ser Gly Arg
2990 2995 3000
Trp Val Leu Asn Asn Asp Tyr Tyr Arg Ser Leu Pro Gly Val Phe
3005 3010 3015
Cys Gly Val Asp Ala Val Asn Leu Leu Thr Asn Met Phe Thr Pro
3020 3025 3030
Leu Ile Gln Pro Ile Gly Ala Leu Asp Ile Ser Ala Ser Ile Val
3035 3040 3045
Ala Gly Gly Ile Val Ala Ile Val Val Thr Cys Leu Ala Tyr Tyr
3050 3055 3060
Phe Met Arg Phe Arg Arg Ala Phe Gly Glu Tyr Ser His Val Val
3065 3070 3075
Ala Phe Asn Thr Leu Leu Phe Leu Met Ser Phe Thr Val Leu Cys
3080 3085 3090
Leu Thr Pro Val Tyr Ser Phe Leu Pro Gly Val Tyr Ser Val Ile
3095 3100 3105
Tyr Leu Tyr Leu Thr Phe Tyr Leu Thr Asn Asp Val Ser Phe Leu
3110 3115 3120
Ala His Ile Gln Trp Met Val Met Phe Thr Pro Leu Val Pro Phe
3125 3130 3135
Trp Ile Thr Ile Ala Tyr Ile Ile Cys Ile Ser Thr Lys His Phe
3140 3145 3150
Tyr Trp Phe Phe Ser Asn Tyr Leu Lys Arg Arg Val Val Phe Asn
3155 3160 3165
Gly Val Ser Phe Ser Thr Phe Glu Glu Ala Ala Leu Cys Thr Phe
3170 3175 3180
Leu Leu Asn Lys Glu Met Tyr Leu Lys Leu Arg Ser Asp Val Leu
3185 3190 3195
Leu Pro Leu Thr Gln Tyr Asn Arg Tyr Leu Ala Leu Tyr Asn Lys
3200 3205 3210
Tyr Lys Tyr Phe Ser Gly Ala Met Asp Thr Thr Ser Tyr Arg Glu
3215 3220 3225
Ala Ala Cys Cys His Leu Ala Lys Ala Leu Asn Asp Phe Ser Asn
3230 3235 3240
Ser Gly Ser Asp Val Leu Tyr Gln Pro Pro Gln Thr Ser Ile Thr
3245 3250 3255
Ser Ala Val Leu Gln Ser Gly Phe Arg Lys Met Ala Phe Pro Ser
3260 3265 3270
Gly Lys Val Glu Gly Cys Met Val Gln Val Thr Cys Gly Thr Thr
3275 3280 3285
Thr Leu Asn Gly Leu Trp Leu Asp Asp Val Val Tyr Cys Pro Arg
3290 3295 3300
His Val Ile Cys Thr Ser Glu Asp Met Leu Asn Pro Asn Tyr Glu
3305 3310 3315
Asp Leu Leu Ile Arg Lys Ser Asn His Asn Phe Leu Val Gln Ala
3320 3325 3330
Gly Asn Val Gln Leu Arg Val Ile Gly His Ser Met Gln Asn Cys
3335 3340 3345
Val Leu Lys Leu Lys Val Asp Thr Ala Asn Pro Lys Thr Pro Lys
3350 3355 3360
Tyr Lys Phe Val Arg Ile Gln Pro Gly Gln Thr Phe Ser Val Leu
3365 3370 3375
Ala Cys Tyr Asn Gly Ser Pro Ser Gly Val Tyr Gln Cys Ala Met
3380 3385 3390
Arg Pro Asn Phe Thr Ile Lys Gly Ser Phe Leu Asn Gly Ser Cys
3395 3400 3405
Gly Ser Val Gly Phe Asn Ile Asp Tyr Asp Cys Val Ser Phe Cys
3410 3415 3420
Tyr Met His His Met Glu Leu Pro Thr Gly Val His Ala Gly Thr
3425 3430 3435
Asp Leu Glu Gly Asn Phe Tyr Gly Pro Phe Val Asp Arg Gln Thr
3440 3445 3450
Ala Gln Ala Ala Gly Thr Asp Thr Thr Ile Thr Val Asn Val Leu
3455 3460 3465
Ala Trp Leu Tyr Ala Ala Val Ile Asn Gly Asp Arg Trp Phe Leu
3470 3475 3480
Asn Arg Phe Thr Thr Thr Leu Asn Asp Phe Asn Leu Val Ala Met
3485 3490 3495
Lys Tyr Asn Tyr Glu Pro Leu Thr Gln Asp His Val Asp Ile Leu
3500 3505 3510
Gly Pro Leu Ser Ala Gln Thr Gly Ile Ala Val Leu Asp Met Cys
3515 3520 3525
Ala Ser Leu Lys Glu Leu Leu Gln Asn Gly Met Asn Gly Arg Thr
3530 3535 3540
Ile Leu Gly Ser Ala Leu Leu Glu Asp Glu Phe Thr Pro Phe Asp
3545 3550 3555
Val Val Arg Gln Cys Ser Gly Val Thr Phe Gln Ser Ala Val Lys
3560 3565 3570
Arg Thr Ile Lys Gly Thr His His Trp Leu Leu Leu Thr Ile Leu
3575 3580 3585
Thr Ser Leu Leu Val Leu Val Gln Ser Thr Gln Trp Ser Leu Phe
3590 3595 3600
Phe Phe Leu Tyr Glu Asn Ala Phe Leu Pro Phe Ala Met Gly Ile
3605 3610 3615
Ile Ala Met Ser Ala Phe Ala Met Met Phe Val Lys His Lys His
3620 3625 3630
Ala Phe Leu Cys Leu Phe Leu Leu Pro Ser Leu Ala Thr Val Ala
3635 3640 3645
Tyr Phe Asn Met Val Tyr Met Pro Ala Ser Trp Val Met Arg Ile
3650 3655 3660
Met Thr Trp Leu Asp Met Val Asp Thr Ser Leu Ser Gly Phe Lys
3665 3670 3675
Leu Lys Asp Cys Val Met Tyr Ala Ser Ala Val Val Leu Leu Ile
3680 3685 3690
Leu Met Thr Ala Arg Thr Val Tyr Asp Asp Gly Ala Arg Arg Val
3695 3700 3705
Trp Thr Leu Met Asn Val Leu Thr Leu Val Tyr Lys Val Tyr Tyr
3710 3715 3720
Gly Asn Ala Leu Asp Gln Ala Ile Ser Met Trp Ala Leu Ile Ile
3725 3730 3735
Ser Val Thr Ser Asn Tyr Ser Gly Val Val Thr Thr Val Met Phe
3740 3745 3750
Leu Ala Arg Gly Ile Val Phe Met Cys Val Glu Tyr Cys Pro Ile
3755 3760 3765
Phe Phe Ile Thr Gly Asn Thr Leu Gln Cys Ile Met Leu Val Tyr
3770 3775 3780
Cys Phe Leu Gly Tyr Phe Cys Thr Cys Tyr Phe Gly Leu Phe Cys
3785 3790 3795
Leu Leu Asn Arg Tyr Phe Arg Leu Thr Leu Gly Val Tyr Asp Tyr
3800 3805 3810
Leu Val Ser Thr Gln Glu Phe Arg Tyr Met Asn Ser Gln Gly Leu
3815 3820 3825
Leu Pro Pro Lys Asn Ser Ile Asp Ala Phe Lys Leu Asn Ile Lys
3830 3835 3840
Leu Leu Gly Val Gly Gly Lys Pro Cys Ile Lys Val Ala Thr Val
3845 3850 3855
Gln Ser Lys Met Ser Asp Val Lys Cys Thr Ser Val Val Leu Leu
3860 3865 3870
Ser Val Leu Gln Gln Leu Arg Val Glu Ser Ser Ser Lys Leu Trp
3875 3880 3885
Ala Gln Cys Val Gln Leu His Asn Asp Ile Leu Leu Ala Lys Asp
3890 3895 3900
Thr Thr Glu Ala Phe Glu Lys Met Val Ser Leu Leu Ser Val Leu
3905 3910 3915
Leu Ser Met Gln Gly Ala Val Asp Ile Asn Lys Leu Cys Glu Glu
3920 3925 3930
Met Leu Asp Asn Arg Ala Thr Leu Gln Ala Ile Ala Ser Glu Phe
3935 3940 3945
Ser Ser Leu Pro Ser Tyr Ala Ala Phe Ala Thr Ala Gln Glu Ala
3950 3955 3960
Tyr Glu Gln Ala Val Ala Asn Gly Asp Ser Glu Val Val Leu Lys
3965 3970 3975
Lys Leu Lys Lys Ser Leu Asn Val Ala Lys Ser Glu Phe Asp Arg
3980 3985 3990
Asp Ala Ala Met Gln Arg Lys Leu Glu Lys Met Ala Asp Gln Ala
3995 4000 4005
Met Thr Gln Met Tyr Lys Gln Ala Arg Ser Glu Asp Lys Arg Ala
4010 4015 4020
Lys Val Thr Ser Ala Met Gln Thr Met Leu Phe Thr Met Leu Arg
4025 4030 4035
Lys Leu Asp Asn Asp Ala Leu Asn Asn Ile Ile Asn Asn Ala Arg
4040 4045 4050
Asp Gly Cys Val Pro Leu Asn Ile Ile Pro Leu Thr Thr Ala Ala
4055 4060 4065
Lys Leu Met Val Val Ile Pro Asp Tyr Asn Thr Tyr Lys Asn Thr
4070 4075 4080
Cys Asp Gly Thr Thr Phe Thr Tyr Ala Ser Ala Leu Trp Glu Ile
4085 4090 4095
Gln Gln Val Val Asp Ala Asp Ser Lys Ile Val Gln Leu Ser Glu
4100 4105 4110
Ile Ser Met Asp Asn Ser Pro Asn Leu Ala Trp Pro Leu Ile Val
4115 4120 4125
Thr Ala Leu Arg Ala Asn Ser Ala Val Lys Leu Gln Asn Asn Glu
4130 4135 4140
Leu Ser Pro Val Ala Leu Arg Gln Met Ser Cys Ala Ala Gly Thr
4145 4150 4155
Thr Gln Thr Ala Cys Thr Asp Asp Asn Ala Leu Ala Tyr Tyr Asn
4160 4165 4170
Thr Thr Lys Gly Gly Arg Phe Val Leu Ala Leu Leu Ser Asp Leu
4175 4180 4185
Gln Asp Leu Lys Trp Ala Arg Phe Pro Lys Ser Asp Gly Thr Gly
4190 4195 4200
Thr Ile Tyr Thr Glu Leu Glu Pro Pro Cys Arg Phe Val Thr Asp
4205 4210 4215
Thr Pro Lys Gly Pro Lys Val Lys Tyr Leu Tyr Phe Ile Lys Gly
4220 4225 4230
Leu Asn Asn Leu Asn Arg Gly Met Val Leu Gly Ser Leu Ala Ala
4235 4240 4245
Thr Val Arg Leu Gln Ala Gly Asn Ala Thr Glu Val Pro Ala Asn
4250 4255 4260
Ser Thr Val Leu Ser Phe Cys Ala Phe Ala Val Asp Ala Ala Lys
4265 4270 4275
Ala Tyr Lys Asp Tyr Leu Ala Ser Gly Gly Gln Pro Ile Thr Asn
4280 4285 4290
Cys Val Lys Met Leu Cys Thr His Thr Gly Thr Gly Gln Ala Ile
4295 4300 4305
Thr Val Thr Pro Glu Ala Asn Met Asp Gln Glu Ser Phe Gly Gly
4310 4315 4320
Ala Ser Cys Cys Leu Tyr Cys Arg Cys His Ile Asp His Pro Asn
4325 4330 4335
Pro Lys Gly Phe Cys Asp Leu Lys Gly Lys Tyr Val Gln Ile Pro
4340 4345 4350
Thr Thr Cys Ala Asn Asp Pro Val Gly Phe Thr Leu Lys Asn Thr
4355 4360 4365
Val Cys Thr Val Cys Gly Met Trp Lys Gly Tyr Gly Cys Ser Cys
4370 4375 4380
Asp Gln Leu Arg Glu Pro Met Leu Gln Ser Ala Asp Ala Gln Ser
4385 4390 4395
Phe Leu Asn Arg Val Cys Gly Val Ser Ala Ala Arg Leu Thr Pro
4400 4405 4410
Cys Gly Thr Gly Thr Ser Thr Asp Val Val Tyr Arg Ala Phe Asp
4415 4420 4425
Ile Tyr Asn Asp Lys Val Ala Gly Phe Ala Lys Phe Leu Lys Thr
4430 4435 4440
Asn Cys Cys Arg Phe Gln Glu Lys Asp Glu Asp Asp Asn Leu Ile
4445 4450 4455
Asp Ser Tyr Phe Val Val Lys Arg His Thr Phe Ser Asn Tyr Gln
4460 4465 4470
His Glu Glu Thr Ile Tyr Asn Leu Leu Lys Asp Cys Pro Ala Val
4475 4480 4485
Ala Lys His Asp Phe Phe Lys Phe Arg Ile Asp Gly Asp Met Val
4490 4495 4500
Pro His Ile Ser Arg Gln Arg Leu Thr Lys Tyr Thr Met Ala Asp
4505 4510 4515
Leu Val Tyr Ala Leu Arg His Phe Asp Glu Gly Asn Cys Asp Thr
4520 4525 4530
Leu Lys Glu Ile Leu Val Thr Tyr Asn Cys Cys Asp Asp Asp Tyr
4535 4540 4545
Phe Asn Lys Lys Asp Trp Tyr Asp Phe Val Glu Asn Pro Asp Ile
4550 4555 4560
Leu Arg Val Tyr Ala Asn Leu Gly Glu Arg Val Arg Gln Ala Leu
4565 4570 4575
Leu Lys Thr Val Gln Phe Cys Asp Ala Met Arg Asn Ala Gly Ile
4580 4585 4590
Val Gly Val Leu Thr Leu Asp Asn Gln Asp Leu Asn Gly Asn Trp
4595 4600 4605
Tyr Asp Phe Gly Asp Phe Ile Gln Thr Thr Pro Gly Ser Gly Val
4610 4615 4620
Pro Val Val Asp Ser Tyr Tyr Ser Leu Leu Met Pro Ile Leu Thr
4625 4630 4635
Leu Thr Arg Ala Leu Thr Ala Glu Ser His Val Asp Thr Asp Leu
4640 4645 4650
Thr Lys Pro Tyr Ile Lys Trp Asp Leu Leu Lys Tyr Asp Phe Thr
4655 4660 4665
Glu Glu Arg Leu Lys Leu Phe Asp Arg Tyr Phe Lys Tyr Trp Asp
4670 4675 4680
Gln Thr Tyr His Pro Asn Cys Val Asn Cys Leu Asp Asp Arg Cys
4685 4690 4695
Ile Leu His Cys Ala Asn Phe Asn Val Leu Phe Ser Thr Val Phe
4700 4705 4710
Pro Leu Thr Ser Phe Gly Pro Leu Val Arg Lys Ile Phe Val Asp
4715 4720 4725
Gly Val Pro Phe Val Val Ser Thr Gly Tyr His Phe Arg Glu Leu
4730 4735 4740
Gly Val Val His Asn Gln Asp Val Asn Leu His Ser Ser Arg Leu
4745 4750 4755
Ser Phe Lys Glu Leu Leu Val Tyr Ala Ala Asp Pro Ala Met His
4760 4765 4770
Ala Ala Ser Gly Asn Leu Leu Leu Asp Lys Arg Thr Thr Cys Phe
4775 4780 4785
Ser Val Ala Ala Leu Thr Asn Asn Val Ala Phe Gln Thr Val Lys
4790 4795 4800
Pro Gly Asn Phe Asn Lys Asp Phe Tyr Asp Phe Ala Val Ser Lys
4805 4810 4815
Gly Phe Phe Lys Glu Gly Ser Ser Val Glu Leu Lys His Phe Phe
4820 4825 4830
Phe Ala Gln Asp Gly Asn Ala Ala Ile Ser Asp Tyr Asp Tyr Tyr
4835 4840 4845
Arg Tyr Asn Leu Pro Thr Met Cys Asp Ile Arg Gln Leu Leu Phe
4850 4855 4860
Val Val Glu Val Val Asp Lys Tyr Phe Asp Cys Tyr Asp Gly Gly
4865 4870 4875
Cys Ile Asn Ala Asn Gln Val Ile Val Asn Asn Leu Asp Lys Ser
4880 4885 4890
Ala Gly Phe Pro Phe Asn Lys Trp Gly Lys Ala Arg Leu Tyr Tyr
4895 4900 4905
Asp Ser Met Ser Tyr Glu Asp Gln Asp Ala Leu Phe Ala Tyr Thr
4910 4915 4920
Lys Arg Asn Val Ile Pro Thr Ile Thr Gln Met Asn Leu Lys Tyr
4925 4930 4935
Ala Ile Ser Ala Lys Asn Arg Ala Arg Thr Val Ala Gly Val Ser
4940 4945 4950
Ile Cys Ser Thr Met Thr Asn Arg Gln Phe His Gln Lys Leu Leu
4955 4960 4965
Lys Ser Ile Ala Ala Thr Arg Gly Ala Thr Val Val Ile Gly Thr
4970 4975 4980
Ser Lys Phe Tyr Gly Gly Trp His Asn Met Leu Lys Thr Val Tyr
4985 4990 4995
Ser Asp Val Glu Asn Pro His Leu Met Gly Trp Asp Tyr Pro Lys
5000 5005 5010
Cys Asp Arg Ala Met Pro Asn Met Leu Arg Ile Met Ala Ser Leu
5015 5020 5025
Val Leu Ala Arg Lys His Thr Thr Cys Cys Ser Leu Ser His Arg
5030 5035 5040
Phe Tyr Arg Leu Ala Asn Glu Cys Ala Gln Val Leu Ser Glu Met
5045 5050 5055
Val Met Cys Gly Gly Ser Leu Tyr Val Lys Pro Gly Gly Thr Ser
5060 5065 5070
Ser Gly Asp Ala Thr Thr Ala Tyr Ala Asn Ser Val Phe Asn Ile
5075 5080 5085
Cys Gln Ala Val Thr Ala Asn Val Asn Ala Leu Leu Ser Thr Asp
5090 5095 5100
Gly Asn Lys Ile Ala Asp Lys Tyr Val Arg Asn Leu Gln His Arg
5105 5110 5115
Leu Tyr Glu Cys Leu Tyr Arg Asn Arg Asp Val Asp Thr Asp Phe
5120 5125 5130
Val Asn Glu Phe Tyr Ala Tyr Leu Arg Lys His Phe Ser Met Met
5135 5140 5145
Ile Leu Ser Asp Asp Ala Val Val Cys Phe Asn Ser Thr Tyr Ala
5150 5155 5160
Ser Gln Gly Leu Val Ala Ser Ile Lys Asn Phe Lys Ser Val Leu
5165 5170 5175
Tyr Tyr Gln Asn Asn Val Phe Met Ser Glu Ala Lys Cys Trp Thr
5180 5185 5190
Glu Thr Asp Leu Thr Lys Gly Pro His Glu Phe Cys Ser Gln His
5195 5200 5205
Thr Met Leu Val Lys Gln Gly Asp Asp Tyr Val Tyr Leu Pro Tyr
5210 5215 5220
Pro Asp Pro Ser Arg Ile Leu Gly Ala Gly Cys Phe Val Asp Asp
5225 5230 5235
Ile Val Lys Thr Asp Gly Thr Leu Met Ile Glu Arg Phe Val Ser
5240 5245 5250
Leu Ala Ile Asp Ala Tyr Pro Leu Thr Lys His Pro Asn Gln Glu
5255 5260 5265
Tyr Ala Asp Val Phe His Leu Tyr Leu Gln Tyr Ile Arg Lys Leu
5270 5275 5280
His Asp Glu Leu Thr Gly His Met Leu Asp Met Tyr Ser Val Met
5285 5290 5295
Leu Thr Asn Asp Asn Thr Ser Arg Tyr Trp Glu Pro Glu Phe Tyr
5300 5305 5310
Glu Ala Met Tyr Thr Pro His Thr Val Leu Gln Ala Val Gly Ala
5315 5320 5325
Cys Val Leu Cys Asn Ser Gln Thr Ser Leu Arg Cys Gly Ala Cys
5330 5335 5340
Ile Arg Arg Pro Phe Leu Cys Cys Lys Cys Cys Tyr Asp His Val
5345 5350 5355
Ile Ser Thr Ser His Lys Leu Val Leu Ser Val Asn Pro Tyr Val
5360 5365 5370
Cys Asn Ala Pro Gly Cys Asp Val Thr Asp Val Thr Gln Leu Tyr
5375 5380 5385
Leu Gly Gly Met Ser Tyr Tyr Cys Lys Ser His Lys Pro Pro Ile
5390 5395 5400
Ser Phe Pro Leu Cys Ala Asn Gly Gln Val Phe Gly Leu Tyr Lys
5405 5410 5415
Asn Thr Cys Val Gly Ser Asp Asn Val Thr Asp Phe Asn Ala Ile
5420 5425 5430
Ala Thr Cys Asp Trp Thr Asn Ala Gly Asp Tyr Ile Leu Ala Asn
5435 5440 5445
Thr Cys Thr Glu Arg Leu Lys Leu Phe Ala Ala Glu Thr Leu Lys
5450 5455 5460
Ala Thr Glu Glu Thr Phe Lys Leu Ser Tyr Gly Ile Ala Thr Val
5465 5470 5475
Arg Glu Val Leu Ser Asp Arg Glu Leu His Leu Ser Trp Glu Val
5480 5485 5490
Gly Lys Pro Arg Pro Pro Leu Asn Arg Asn Tyr Val Phe Thr Gly
5495 5500 5505
Tyr Arg Val Thr Lys Asn Ser Lys Val Gln Ile Gly Glu Tyr Thr
5510 5515 5520
Phe Glu Lys Gly Asp Tyr Gly Asp Ala Val Val Tyr Arg Gly Thr
5525 5530 5535
Thr Thr Tyr Lys Leu Asn Val Gly Asp Tyr Phe Val Leu Thr Ser
5540 5545 5550
His Thr Val Met Pro Leu Ser Ala Pro Thr Leu Val Pro Gln Glu
5555 5560 5565
His Tyr Val Arg Ile Thr Gly Leu Tyr Pro Thr Leu Asn Ile Ser
5570 5575 5580
Asp Glu Phe Ser Ser Asn Val Ala Asn Tyr Gln Lys Val Gly Met
5585 5590 5595
Gln Lys Tyr Ser Thr Leu Gln Gly Pro Pro Gly Thr Gly Lys Ser
5600 5605 5610
His Phe Ala Ile Gly Leu Ala Leu Tyr Tyr Pro Ser Ala Arg Ile
5615 5620 5625
Val Tyr Thr Ala Cys Ser His Ala Ala Val Asp Ala Leu Cys Glu
5630 5635 5640
Lys Ala Leu Lys Tyr Leu Pro Ile Asp Lys Cys Ser Arg Ile Ile
5645 5650 5655
Pro Ala Arg Ala Arg Val Glu Cys Phe Asp Lys Phe Lys Val Asn
5660 5665 5670
Ser Thr Leu Glu Gln Tyr Val Phe Cys Thr Val Asn Ala Leu Pro
5675 5680 5685
Glu Thr Thr Ala Asp Ile Val Val Phe Asp Glu Ile Ser Met Ala
5690 5695 5700
Thr Asn Tyr Asp Leu Ser Val Val Asn Ala Arg Leu Arg Ala Lys
5705 5710 5715
His Tyr Val Tyr Ile Gly Asp Pro Ala Gln Leu Pro Ala Pro Arg
5720 5725 5730
Thr Leu Leu Thr Lys Gly Thr Leu Glu Pro Glu Tyr Phe Asn Ser
5735 5740 5745
Val Cys Arg Leu Met Lys Thr Ile Gly Pro Asp Met Phe Leu Gly
5750 5755 5760
Thr Cys Arg Arg Cys Pro Ala Glu Ile Val Asp Thr Val Ser Ala
5765 5770 5775
Leu Val Tyr Asp Asn Lys Leu Lys Ala His Lys Asp Lys Ser Ala
5780 5785 5790
Gln Cys Phe Lys Met Phe Tyr Lys Gly Val Ile Thr His Asp Val
5795 5800 5805
Ser Ser Ala Ile Asn Arg Pro Gln Ile Gly Val Val Arg Glu Phe
5810 5815 5820
Leu Thr Arg Asn Pro Ala Trp Arg Lys Ala Val Phe Ile Ser Pro
5825 5830 5835
Tyr Asn Ser Gln Asn Ala Val Ala Ser Lys Ile Leu Gly Leu Pro
5840 5845 5850
Thr Gln Thr Val Asp Ser Ser Gln Gly Ser Glu Tyr Asp Tyr Val
5855 5860 5865
Ile Phe Thr Gln Thr Thr Glu Thr Ala His Ser Cys Asn Val Asn
5870 5875 5880
Arg Phe Asn Val Ala Ile Thr Arg Ala Lys Val Gly Ile Leu Cys
5885 5890 5895
Ile Met Ser Asp Arg Asp Leu Tyr Asp Lys Leu Gln Phe Thr Ser
5900 5905 5910
Leu Glu Ile Pro Arg Arg Asn Val Ala Thr Leu Gln Ala Glu Asn
5915 5920 5925
Val Thr Gly Leu Phe Lys Asp Cys Ser Lys Val Ile Thr Gly Leu
5930 5935 5940
His Pro Thr Gln Ala Pro Thr His Leu Ser Val Asp Thr Lys Phe
5945 5950 5955
Lys Thr Glu Gly Leu Cys Val Asp Ile Pro Gly Ile Pro Lys Asp
5960 5965 5970
Met Thr Tyr Arg Arg Leu Ile Ser Met Met Gly Phe Lys Met Asn
5975 5980 5985
Tyr Gln Val Asn Gly Tyr Pro Asn Met Phe Ile Thr Arg Glu Glu
5990 5995 6000
Ala Ile Arg His Val Arg Ala Trp Ile Gly Phe Asp Val Glu Gly
6005 6010 6015
Cys His Ala Thr Arg Glu Ala Val Gly Thr Asn Leu Pro Leu Gln
6020 6025 6030
Leu Gly Phe Ser Thr Gly Val Asn Leu Val Ala Val Pro Thr Gly
6035 6040 6045
Tyr Val Asp Thr Pro Asn Asn Thr Asp Phe Ser Arg Val Ser Ala
6050 6055 6060
Lys Pro Pro Pro Gly Asp Gln Phe Lys His Leu Ile Pro Leu Met
6065 6070 6075
Tyr Lys Gly Leu Pro Trp Asn Val Val Arg Ile Lys Ile Val Gln
6080 6085 6090
Met Leu Ser Asp Thr Leu Lys Asn Leu Ser Asp Arg Val Val Phe
6095 6100 6105
Val Leu Trp Ala His Gly Phe Glu Leu Thr Ser Met Lys Tyr Phe
6110 6115 6120
Val Lys Ile Gly Pro Glu Arg Thr Cys Cys Leu Cys Asp Arg Arg
6125 6130 6135
Ala Thr Cys Phe Ser Thr Ala Ser Asp Thr Tyr Ala Cys Trp His
6140 6145 6150
His Ser Ile Gly Phe Asp Tyr Val Tyr Asn Pro Phe Met Ile Asp
6155 6160 6165
Val Gln Gln Trp Gly Phe Thr Gly Asn Leu Gln Ser Asn His Asp
6170 6175 6180
Leu Tyr Cys Gln Val His Gly Asn Ala His Val Ala Ser Cys Asp
6185 6190 6195
Ala Ile Met Thr Arg Cys Leu Ala Val His Glu Cys Phe Val Lys
6200 6205 6210
Arg Val Asp Trp Thr Ile Glu Tyr Pro Ile Ile Gly Asp Glu Leu
6215 6220 6225
Lys Ile Asn Ala Ala Cys Arg Lys Val Gln His Met Val Val Lys
6230 6235 6240
Ala Ala Leu Leu Ala Asp Lys Phe Pro Val Leu His Asp Ile Gly
6245 6250 6255
Asn Pro Lys Ala Ile Lys Cys Val Pro Gln Ala Asp Val Glu Trp
6260 6265 6270
Lys Phe Tyr Asp Ala Gln Pro Cys Ser Asp Lys Ala Tyr Lys Ile
6275 6280 6285
Glu Glu Leu Phe Tyr Ser Tyr Ala Thr His Ser Asp Lys Phe Thr
6290 6295 6300
Asp Gly Val Cys Leu Phe Trp Asn Cys Asn Val Asp Arg Tyr Pro
6305 6310 6315
Ala Asn Ser Ile Val Cys Arg Phe Asp Thr Arg Val Leu Ser Asn
6320 6325 6330
Leu Asn Leu Pro Gly Cys Asp Gly Gly Ser Leu Tyr Val Asn Lys
6335 6340 6345
His Ala Phe His Thr Pro Ala Phe Asp Lys Ser Ala Phe Val Asn
6350 6355 6360
Leu Lys Gln Leu Pro Phe Phe Tyr Tyr Ser Asp Ser Pro Cys Glu
6365 6370 6375
Ser His Gly Lys Gln Val Val Ser Asp Ile Asp Tyr Val Pro Leu
6380 6385 6390
Lys Ser Ala Thr Cys Ile Thr Arg Cys Asn Leu Gly Gly Ala Val
6395 6400 6405
Cys Arg His His Ala Asn Glu Tyr Arg Leu Tyr Leu Asp Ala Tyr
6410 6415 6420
Asn Met Met Ile Ser Ala Gly Phe Ser Leu Trp Val Tyr Lys Gln
6425 6430 6435
Phe Asp Thr Tyr Asn Leu Trp Asn Thr Phe Thr Arg Leu Gln Ser
6440 6445 6450
Leu Glu Asn Val Ala Phe Asn Val Val Asn Lys Gly His Phe Asp
6455 6460 6465
Gly Gln Gln Gly Glu Val Pro Val Ser Ile Ile Asn Asn Thr Val
6470 6475 6480
Tyr Thr Lys Val Asp Gly Val Asp Val Glu Leu Phe Glu Asn Lys
6485 6490 6495
Thr Thr Leu Pro Val Asn Val Ala Phe Glu Leu Trp Ala Lys Arg
6500 6505 6510
Asn Ile Lys Pro Val Pro Glu Val Lys Ile Leu Asn Asn Leu Gly
6515 6520 6525
Val Asp Ile Ala Ala Asn Thr Val Ile Trp Asp Tyr Lys Arg Asp
6530 6535 6540
Ala Pro Ala His Ile Ser Thr Ile Gly Val Cys Ser Met Thr Asp
6545 6550 6555
Ile Ala Lys Lys Pro Thr Glu Thr Ile Cys Ala Pro Leu Thr Val
6560 6565 6570
Phe Phe Asp Gly Arg Val Asp Gly Gln Val Asp Leu Phe Arg Asn
6575 6580 6585
Ala Arg Asn Gly Val Leu Ile Thr Glu Gly Ser Val Lys Gly Leu
6590 6595 6600
Gln Pro Ser Val Gly Pro Lys Gln Ala Ser Leu Asn Gly Val Thr
6605 6610 6615
Leu Ile Gly Glu Ala Val Lys Thr Gln Phe Asn Tyr Tyr Lys Lys
6620 6625 6630
Val Asp Gly Val Val Gln Gln Leu Pro Glu Thr Tyr Phe Thr Gln
6635 6640 6645
Ser Arg Asn Leu Gln Glu Phe Lys Pro Arg Ser Gln Met Glu Ile
6650 6655 6660
Asp Phe Leu Glu Leu Ala Met Asp Glu Phe Ile Glu Arg Tyr Lys
6665 6670 6675
Leu Glu Gly Tyr Ala Phe Glu His Ile Val Tyr Gly Asp Phe Ser
6680 6685 6690
His Ser Gln Leu Gly Gly Leu His Leu Leu Ile Gly Leu Ala Lys
6695 6700 6705
Arg Phe Lys Glu Ser Pro Phe Glu Leu Glu Asp Phe Ile Pro Met
6710 6715 6720
Asp Ser Thr Val Lys Asn Tyr Phe Ile Thr Asp Ala Gln Thr Gly
6725 6730 6735
Ser Ser Lys Cys Val Cys Ser Val Ile Asp Leu Leu Leu Asp Asp
6740 6745 6750
Phe Val Glu Ile Ile Lys Ser Gln Asp Leu Ser Val Val Ser Lys
6755 6760 6765
Val Val Lys Val Thr Ile Asp Tyr Thr Glu Ile Ser Phe Met Leu
6770 6775 6780
Trp Cys Lys Asp Gly His Val Glu Thr Phe Tyr Pro Lys Leu Gln
6785 6790 6795
Ser Ser Gln Ala Trp Gln Pro Gly Val Ala Met Pro Asn Leu Tyr
6800 6805 6810
Lys Met Gln Arg Met Leu Leu Glu Lys Cys Asp Leu Gln Asn Tyr
6815 6820 6825
Gly Asp Ser Ala Thr Leu Pro Lys Gly Ile Met Met Asn Val Ala
6830 6835 6840
Lys Tyr Thr Gln Leu Cys Gln Tyr Leu Asn Thr Leu Thr Leu Ala
6845 6850 6855
Val Pro Tyr Asn Met Arg Val Ile His Phe Gly Ala Gly Ser Asp
6860 6865 6870
Lys Gly Val Ala Pro Gly Thr Ala Val Leu Arg Gln Trp Leu Pro
6875 6880 6885
Thr Gly Thr Leu Leu Val Asp Ser Asp Leu Asn Asp Phe Val Ser
6890 6895 6900
Asp Ala Asp Ser Thr Leu Ile Gly Asp Cys Ala Thr Val His Thr
6905 6910 6915
Ala Asn Lys Trp Asp Leu Ile Ile Ser Asp Met Tyr Asp Pro Lys
6920 6925 6930
Thr Lys Asn Val Thr Lys Glu Asn Asp Ser Lys Glu Gly Phe Phe
6935 6940 6945
Thr Tyr Ile Cys Gly Phe Ile Gln Gln Lys Leu Ala Leu Gly Gly
6950 6955 6960
Ser Val Ala Ile Lys Ile Thr Glu His Ser Trp Asn Ala Asp Leu
6965 6970 6975
Tyr Lys Leu Met Gly His Phe Ala Trp Trp Thr Ala Phe Val Thr
6980 6985 6990
Asn Val Asn Ala Ser Ser Ser Glu Ala Phe Leu Ile Gly Cys Asn
6995 7000 7005
Tyr Leu Gly Lys Pro Arg Glu Gln Ile Asp Gly Tyr Val Met His
7010 7015 7020
Ala Asn Tyr Ile Phe Trp Arg Asn Thr Asn Pro Ile Gln Leu Ser
7025 7030 7035
Ser Tyr Ser Leu Phe Asp Met Ser Lys Phe Pro Leu Lys Leu Arg
7040 7045 7050
Gly Thr Ala Val Met Ser Leu Lys Glu Gly Gln Ile Asn Asp Met
7055 7060 7065
Ile Leu Ser Leu Leu Ser Lys Gly Arg Leu Ile Ile Arg Glu Asn
7070 7075 7080
Asn Arg Val Val Ile Ser Ser Asp Val Leu Val Asn Asn
7085 7090 7095
<210> 414
<211> 4405
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 414
Met Glu Ser Leu Val Pro Gly Phe Asn Glu Lys Thr His Val Gln Leu
1 5 10 15
Ser Leu Pro Val Leu Gln Val Arg Asp Val Leu Val Arg Gly Phe Gly
20 25 30
Asp Ser Val Glu Glu Val Leu Ser Glu Ala Arg Gln His Leu Lys Asp
35 40 45
Gly Thr Cys Gly Leu Val Glu Val Glu Lys Gly Val Leu Pro Gln Leu
50 55 60
Glu Gln Pro Tyr Val Phe Ile Lys Arg Ser Asp Ala Arg Thr Ala Pro
65 70 75 80
His Gly His Val Met Val Glu Leu Val Ala Glu Leu Glu Gly Ile Gln
85 90 95
Tyr Gly Arg Ser Gly Glu Thr Leu Gly Val Leu Val Pro His Val Gly
100 105 110
Glu Ile Pro Val Ala Tyr Arg Lys Val Leu Leu Arg Lys Asn Gly Asn
115 120 125
Lys Gly Ala Gly Gly His Ser Tyr Gly Ala Asp Leu Lys Ser Phe Asp
130 135 140
Leu Gly Asp Glu Leu Gly Thr Asp Pro Tyr Glu Asp Phe Gln Glu Asn
145 150 155 160
Trp Asn Thr Lys His Ser Ser Gly Val Thr Arg Glu Leu Met Arg Glu
165 170 175
Leu Asn Gly Gly Ala Tyr Thr Arg Tyr Val Asp Asn Asn Phe Cys Gly
180 185 190
Pro Asp Gly Tyr Pro Leu Glu Cys Ile Lys Asp Leu Leu Ala Arg Ala
195 200 205
Gly Lys Ala Ser Cys Thr Leu Ser Glu Gln Leu Asp Phe Ile Asp Thr
210 215 220
Lys Arg Gly Val Tyr Cys Cys Arg Glu His Glu His Glu Ile Ala Trp
225 230 235 240
Tyr Thr Glu Arg Ser Glu Lys Ser Tyr Glu Leu Gln Thr Pro Phe Glu
245 250 255
Ile Lys Leu Ala Lys Lys Phe Asp Thr Phe Asn Gly Glu Cys Pro Asn
260 265 270
Phe Val Phe Pro Leu Asn Ser Ile Ile Lys Thr Ile Gln Pro Arg Val
275 280 285
Glu Lys Lys Lys Leu Asp Gly Phe Met Gly Arg Ile Arg Ser Val Tyr
290 295 300
Pro Val Ala Ser Pro Asn Glu Cys Asn Gln Met Cys Leu Ser Thr Leu
305 310 315 320
Met Lys Cys Asp His Cys Gly Glu Thr Ser Trp Gln Thr Gly Asp Phe
325 330 335
Val Lys Ala Thr Cys Glu Phe Cys Gly Thr Glu Asn Leu Thr Lys Glu
340 345 350
Gly Ala Thr Thr Cys Gly Tyr Leu Pro Gln Asn Ala Val Val Lys Ile
355 360 365
Tyr Cys Pro Ala Cys His Asn Ser Glu Val Gly Pro Glu His Ser Leu
370 375 380
Ala Glu Tyr His Asn Glu Ser Gly Leu Lys Thr Ile Leu Arg Lys Gly
385 390 395 400
Gly Arg Thr Ile Ala Phe Gly Gly Cys Val Phe Ser Tyr Val Gly Cys
405 410 415
His Asn Lys Cys Ala Tyr Trp Val Pro Arg Ala Ser Ala Asn Ile Gly
420 425 430
Cys Asn His Thr Gly Val Val Gly Glu Gly Ser Glu Gly Leu Asn Asp
435 440 445
Asn Leu Leu Glu Ile Leu Gln Lys Glu Lys Val Asn Ile Asn Ile Val
450 455 460
Gly Asp Phe Lys Leu Asn Glu Glu Ile Ala Ile Ile Leu Ala Ser Phe
465 470 475 480
Ser Ala Ser Thr Ser Ala Phe Val Glu Thr Val Lys Gly Leu Asp Tyr
485 490 495
Lys Ala Phe Lys Gln Ile Val Glu Ser Cys Gly Asn Phe Lys Val Thr
500 505 510
Lys Gly Lys Ala Lys Lys Gly Ala Trp Asn Ile Gly Glu Gln Lys Ser
515 520 525
Ile Leu Ser Pro Leu Tyr Ala Phe Ala Ser Glu Ala Ala Arg Val Val
530 535 540
Arg Ser Ile Phe Ser Arg Thr Leu Glu Thr Ala Gln Asn Ser Val Arg
545 550 555 560
Val Leu Gln Lys Ala Ala Ile Thr Ile Leu Asp Gly Ile Ser Gln Tyr
565 570 575
Ser Leu Arg Leu Ile Asp Ala Met Met Phe Thr Ser Asp Leu Ala Thr
580 585 590
Asn Asn Leu Val Val Met Ala Tyr Ile Thr Gly Gly Val Val Gln Leu
595 600 605
Thr Ser Gln Trp Leu Thr Asn Ile Phe Gly Thr Val Tyr Glu Lys Leu
610 615 620
Lys Pro Val Leu Asp Trp Leu Glu Glu Lys Phe Lys Glu Gly Val Glu
625 630 635 640
Phe Leu Arg Asp Gly Trp Glu Ile Val Lys Phe Ile Ser Thr Cys Ala
645 650 655
Cys Glu Ile Val Gly Gly Gln Ile Val Thr Cys Ala Lys Glu Ile Lys
660 665 670
Glu Ser Val Gln Thr Phe Phe Lys Leu Val Asn Lys Phe Leu Ala Leu
675 680 685
Cys Ala Asp Ser Ile Ile Ile Gly Gly Ala Lys Leu Lys Ala Leu Asn
690 695 700
Leu Gly Glu Thr Phe Val Thr His Ser Lys Gly Leu Tyr Arg Lys Cys
705 710 715 720
Val Lys Ser Arg Glu Glu Thr Gly Leu Leu Met Pro Leu Lys Ala Pro
725 730 735
Lys Glu Ile Ile Phe Leu Glu Gly Glu Thr Leu Pro Thr Glu Val Leu
740 745 750
Thr Glu Glu Val Val Leu Lys Thr Gly Asp Leu Gln Pro Leu Glu Gln
755 760 765
Pro Thr Ser Glu Ala Val Glu Ala Pro Leu Val Gly Thr Pro Val Cys
770 775 780
Ile Asn Gly Leu Met Leu Leu Glu Ile Lys Asp Thr Glu Lys Tyr Cys
785 790 795 800
Ala Leu Ala Pro Asn Met Met Val Thr Asn Asn Thr Phe Thr Leu Lys
805 810 815
Gly Gly Ala Pro Thr Lys Val Thr Phe Gly Asp Asp Thr Val Ile Glu
820 825 830
Val Gln Gly Tyr Lys Ser Val Asn Ile Thr Phe Glu Leu Asp Glu Arg
835 840 845
Ile Asp Lys Val Leu Asn Glu Lys Cys Ser Ala Tyr Thr Val Glu Leu
850 855 860
Gly Thr Glu Val Asn Glu Phe Ala Cys Val Val Ala Asp Ala Val Ile
865 870 875 880
Lys Thr Leu Gln Pro Val Ser Glu Leu Leu Thr Pro Leu Gly Ile Asp
885 890 895
Leu Asp Glu Trp Ser Met Ala Thr Tyr Tyr Leu Phe Asp Glu Ser Gly
900 905 910
Glu Phe Lys Leu Ala Ser His Met Tyr Cys Ser Phe Tyr Pro Pro Asp
915 920 925
Glu Asp Glu Glu Glu Gly Asp Cys Glu Glu Glu Glu Phe Glu Pro Ser
930 935 940
Thr Gln Tyr Glu Tyr Gly Thr Glu Asp Asp Tyr Gln Gly Lys Pro Leu
945 950 955 960
Glu Phe Gly Ala Thr Ser Ala Ala Leu Gln Pro Glu Glu Glu Gln Glu
965 970 975
Glu Asp Trp Leu Asp Asp Asp Ser Gln Gln Thr Val Gly Gln Gln Asp
980 985 990
Gly Ser Glu Asp Asn Gln Thr Thr Thr Ile Gln Thr Ile Val Glu Val
995 1000 1005
Gln Pro Gln Leu Glu Met Glu Leu Thr Pro Val Val Gln Thr Ile
1010 1015 1020
Glu Val Asn Ser Phe Ser Gly Tyr Leu Lys Leu Thr Asp Asn Val
1025 1030 1035
Tyr Ile Lys Asn Ala Asp Ile Val Glu Glu Ala Lys Lys Val Lys
1040 1045 1050
Pro Thr Val Val Val Asn Ala Ala Asn Val Tyr Leu Lys His Gly
1055 1060 1065
Gly Gly Val Ala Gly Ala Leu Asn Lys Ala Thr Asn Asn Ala Met
1070 1075 1080
Gln Val Glu Ser Asp Asp Tyr Ile Ala Thr Asn Gly Pro Leu Lys
1085 1090 1095
Val Gly Gly Ser Cys Val Leu Ser Gly His Asn Leu Ala Lys His
1100 1105 1110
Cys Leu His Val Val Gly Pro Asn Val Asn Lys Gly Glu Asp Ile
1115 1120 1125
Gln Leu Leu Lys Ser Ala Tyr Glu Asn Phe Asn Gln His Glu Val
1130 1135 1140
Leu Leu Ala Pro Leu Leu Ser Ala Gly Ile Phe Gly Ala Asp Pro
1145 1150 1155
Ile His Ser Leu Arg Val Cys Val Asp Thr Val Arg Thr Asn Val
1160 1165 1170
Tyr Leu Ala Val Phe Asp Lys Asn Leu Tyr Asp Lys Leu Val Ser
1175 1180 1185
Ser Phe Leu Glu Met Lys Ser Glu Lys Gln Val Glu Gln Lys Ile
1190 1195 1200
Ala Glu Ile Pro Lys Glu Glu Val Lys Pro Phe Ile Thr Glu Ser
1205 1210 1215
Lys Pro Ser Val Glu Gln Arg Lys Gln Asp Asp Lys Lys Ile Lys
1220 1225 1230
Ala Cys Val Glu Glu Val Thr Thr Thr Leu Glu Glu Thr Lys Phe
1235 1240 1245
Leu Thr Glu Asn Leu Leu Leu Tyr Ile Asp Ile Asn Gly Asn Leu
1250 1255 1260
His Pro Asp Ser Ala Thr Leu Val Ser Asp Ile Asp Ile Thr Phe
1265 1270 1275
Leu Lys Lys Asp Ala Pro Tyr Ile Val Gly Asp Val Val Gln Glu
1280 1285 1290
Gly Val Leu Thr Ala Val Val Ile Pro Thr Lys Lys Ala Gly Gly
1295 1300 1305
Thr Thr Glu Met Leu Ala Lys Ala Leu Arg Lys Val Pro Thr Asp
1310 1315 1320
Asn Tyr Ile Thr Thr Tyr Pro Gly Gln Gly Leu Asn Gly Tyr Thr
1325 1330 1335
Val Glu Glu Ala Lys Thr Val Leu Lys Lys Cys Lys Ser Ala Phe
1340 1345 1350
Tyr Ile Leu Pro Ser Ile Ile Ser Asn Glu Lys Gln Glu Ile Leu
1355 1360 1365
Gly Thr Val Ser Trp Asn Leu Arg Glu Met Leu Ala His Ala Glu
1370 1375 1380
Glu Thr Arg Lys Leu Met Pro Val Cys Val Glu Thr Lys Ala Ile
1385 1390 1395
Val Ser Thr Ile Gln Arg Lys Tyr Lys Gly Ile Lys Ile Gln Glu
1400 1405 1410
Gly Val Val Asp Tyr Gly Ala Arg Phe Tyr Phe Tyr Thr Ser Lys
1415 1420 1425
Thr Thr Val Ala Ser Leu Ile Asn Thr Leu Asn Asp Leu Asn Glu
1430 1435 1440
Thr Leu Val Thr Met Pro Leu Gly Tyr Val Thr His Gly Leu Asn
1445 1450 1455
Leu Glu Glu Ala Ala Arg Tyr Met Arg Ser Leu Lys Val Pro Ala
1460 1465 1470
Thr Val Ser Val Ser Ser Pro Asp Ala Val Thr Ala Tyr Asn Gly
1475 1480 1485
Tyr Leu Thr Ser Ser Ser Lys Thr Pro Glu Glu His Phe Ile Glu
1490 1495 1500
Thr Ile Ser Leu Ala Gly Ser Tyr Lys Asp Trp Ser Tyr Ser Gly
1505 1510 1515
Gln Ser Thr Gln Leu Gly Ile Glu Phe Leu Lys Arg Gly Asp Lys
1520 1525 1530
Ser Val Tyr Tyr Thr Ser Asn Pro Thr Thr Phe His Leu Asp Gly
1535 1540 1545
Glu Val Ile Thr Phe Asp Asn Leu Lys Thr Leu Leu Ser Leu Arg
1550 1555 1560
Glu Val Arg Thr Ile Lys Val Phe Thr Thr Val Asp Asn Ile Asn
1565 1570 1575
Leu His Thr Gln Val Val Asp Met Ser Met Thr Tyr Gly Gln Gln
1580 1585 1590
Phe Gly Pro Thr Tyr Leu Asp Gly Ala Asp Val Thr Lys Ile Lys
1595 1600 1605
Pro His Asn Ser His Glu Gly Lys Thr Phe Tyr Val Leu Pro Asn
1610 1615 1620
Asp Asp Thr Leu Arg Val Glu Ala Phe Glu Tyr Tyr His Thr Thr
1625 1630 1635
Asp Pro Ser Phe Leu Gly Arg Tyr Met Ser Ala Leu Asn His Thr
1640 1645 1650
Lys Lys Trp Lys Tyr Pro Gln Val Asn Gly Leu Thr Ser Ile Lys
1655 1660 1665
Trp Ala Asp Asn Asn Cys Tyr Leu Ala Thr Ala Leu Leu Thr Leu
1670 1675 1680
Gln Gln Ile Glu Leu Lys Phe Asn Pro Pro Ala Leu Gln Asp Ala
1685 1690 1695
Tyr Tyr Arg Ala Arg Ala Gly Glu Ala Ala Asn Phe Cys Ala Leu
1700 1705 1710
Ile Leu Ala Tyr Cys Asn Lys Thr Val Gly Glu Leu Gly Asp Val
1715 1720 1725
Arg Glu Thr Met Ser Tyr Leu Phe Gln His Ala Asn Leu Asp Ser
1730 1735 1740
Cys Lys Arg Val Leu Asn Val Val Cys Lys Thr Cys Gly Gln Gln
1745 1750 1755
Gln Thr Thr Leu Lys Gly Val Glu Ala Val Met Tyr Met Gly Thr
1760 1765 1770
Leu Ser Tyr Glu Gln Phe Lys Lys Gly Val Gln Ile Pro Cys Thr
1775 1780 1785
Cys Gly Lys Gln Ala Thr Lys Tyr Leu Val Gln Gln Glu Ser Pro
1790 1795 1800
Phe Val Met Met Ser Ala Pro Pro Ala Gln Tyr Glu Leu Lys His
1805 1810 1815
Gly Thr Phe Thr Cys Ala Ser Glu Tyr Thr Gly Asn Tyr Gln Cys
1820 1825 1830
Gly His Tyr Lys His Ile Thr Ser Lys Glu Thr Leu Tyr Cys Ile
1835 1840 1845
Asp Gly Ala Leu Leu Thr Lys Ser Ser Glu Tyr Lys Gly Pro Ile
1850 1855 1860
Thr Asp Val Phe Tyr Lys Glu Asn Ser Tyr Thr Thr Thr Ile Lys
1865 1870 1875
Pro Val Thr Tyr Lys Leu Asp Gly Val Val Cys Thr Glu Ile Asp
1880 1885 1890
Pro Lys Leu Asp Asn Tyr Tyr Lys Lys Asp Asn Ser Tyr Phe Thr
1895 1900 1905
Glu Gln Pro Ile Asp Leu Val Pro Asn Gln Pro Tyr Pro Asn Ala
1910 1915 1920
Ser Phe Asp Asn Phe Lys Phe Val Cys Asp Asn Ile Lys Phe Ala
1925 1930 1935
Asp Asp Leu Asn Gln Leu Thr Gly Tyr Lys Lys Pro Ala Ser Arg
1940 1945 1950
Glu Leu Lys Val Thr Phe Phe Pro Asp Leu Asn Gly Asp Val Val
1955 1960 1965
Ala Ile Asp Tyr Lys His Tyr Thr Pro Ser Phe Lys Lys Gly Ala
1970 1975 1980
Lys Leu Leu His Lys Pro Ile Val Trp His Val Asn Asn Ala Thr
1985 1990 1995
Asn Lys Ala Thr Tyr Lys Pro Asn Thr Trp Cys Ile Arg Cys Leu
2000 2005 2010
Trp Ser Thr Lys Pro Val Glu Thr Ser Asn Ser Phe Asp Val Leu
2015 2020 2025
Lys Ser Glu Asp Ala Gln Gly Met Asp Asn Leu Ala Cys Glu Asp
2030 2035 2040
Leu Lys Pro Val Ser Glu Glu Val Val Glu Asn Pro Thr Ile Gln
2045 2050 2055
Lys Asp Val Leu Glu Cys Asn Val Lys Thr Thr Glu Val Val Gly
2060 2065 2070
Asp Ile Ile Leu Lys Pro Ala Asn Asn Ser Leu Lys Ile Thr Glu
2075 2080 2085
Glu Val Gly His Thr Asp Leu Met Ala Ala Tyr Val Asp Asn Ser
2090 2095 2100
Ser Leu Thr Ile Lys Lys Pro Asn Glu Leu Ser Arg Val Leu Gly
2105 2110 2115
Leu Lys Thr Leu Ala Thr His Gly Leu Ala Ala Val Asn Ser Val
2120 2125 2130
Pro Trp Asp Thr Ile Ala Asn Tyr Ala Lys Pro Phe Leu Asn Lys
2135 2140 2145
Val Val Ser Thr Thr Thr Asn Ile Val Thr Arg Cys Leu Asn Arg
2150 2155 2160
Val Cys Thr Asn Tyr Met Pro Tyr Phe Phe Thr Leu Leu Leu Gln
2165 2170 2175
Leu Cys Thr Phe Thr Arg Ser Thr Asn Ser Arg Ile Lys Ala Ser
2180 2185 2190
Met Pro Thr Thr Ile Ala Lys Asn Thr Val Lys Ser Val Gly Lys
2195 2200 2205
Phe Cys Leu Glu Ala Ser Phe Asn Tyr Leu Lys Ser Pro Asn Phe
2210 2215 2220
Ser Lys Leu Ile Asn Ile Ile Ile Trp Phe Leu Leu Leu Ser Val
2225 2230 2235
Cys Leu Gly Ser Leu Ile Tyr Ser Thr Ala Ala Leu Gly Val Leu
2240 2245 2250
Met Ser Asn Leu Gly Met Pro Ser Tyr Cys Thr Gly Tyr Arg Glu
2255 2260 2265
Gly Tyr Leu Asn Ser Thr Asn Val Thr Ile Ala Thr Tyr Cys Thr
2270 2275 2280
Gly Ser Ile Pro Cys Ser Val Cys Leu Ser Gly Leu Asp Ser Leu
2285 2290 2295
Asp Thr Tyr Pro Ser Leu Glu Thr Ile Gln Ile Thr Ile Ser Ser
2300 2305 2310
Phe Lys Trp Asp Leu Thr Ala Phe Gly Leu Val Ala Glu Trp Phe
2315 2320 2325
Leu Ala Tyr Ile Leu Phe Thr Arg Phe Phe Tyr Val Leu Gly Leu
2330 2335 2340
Ala Ala Ile Met Gln Leu Phe Phe Ser Tyr Phe Ala Val His Phe
2345 2350 2355
Ile Ser Asn Ser Trp Leu Met Trp Leu Ile Ile Asn Leu Val Gln
2360 2365 2370
Met Ala Pro Ile Ser Ala Met Val Arg Met Tyr Ile Phe Phe Ala
2375 2380 2385
Ser Phe Tyr Tyr Val Trp Lys Ser Tyr Val His Val Val Asp Gly
2390 2395 2400
Cys Asn Ser Ser Thr Cys Met Met Cys Tyr Lys Arg Asn Arg Ala
2405 2410 2415
Thr Arg Val Glu Cys Thr Thr Ile Val Asn Gly Val Arg Arg Ser
2420 2425 2430
Phe Tyr Val Tyr Ala Asn Gly Gly Lys Gly Phe Cys Lys Leu His
2435 2440 2445
Asn Trp Asn Cys Val Asn Cys Asp Thr Phe Cys Ala Gly Ser Thr
2450 2455 2460
Phe Ile Ser Asp Glu Val Ala Arg Asp Leu Ser Leu Gln Phe Lys
2465 2470 2475
Arg Pro Ile Asn Pro Thr Asp Gln Ser Ser Tyr Ile Val Asp Ser
2480 2485 2490
Val Thr Val Lys Asn Gly Ser Ile His Leu Tyr Phe Asp Lys Ala
2495 2500 2505
Gly Gln Lys Thr Tyr Glu Arg His Ser Leu Ser His Phe Val Asn
2510 2515 2520
Leu Asp Asn Leu Arg Ala Asn Asn Thr Lys Gly Ser Leu Pro Ile
2525 2530 2535
Asn Val Ile Val Phe Asp Gly Lys Ser Lys Cys Glu Glu Ser Ser
2540 2545 2550
Ala Lys Ser Ala Ser Val Tyr Tyr Ser Gln Leu Met Cys Gln Pro
2555 2560 2565
Ile Leu Leu Leu Asp Gln Ala Leu Val Ser Asp Val Gly Asp Ser
2570 2575 2580
Ala Glu Val Ala Val Lys Met Phe Asp Ala Tyr Val Asn Thr Phe
2585 2590 2595
Ser Ser Thr Phe Asn Val Pro Met Glu Lys Leu Lys Thr Leu Val
2600 2605 2610
Ala Thr Ala Glu Ala Glu Leu Ala Lys Asn Val Ser Leu Asp Asn
2615 2620 2625
Val Leu Ser Thr Phe Ile Ser Ala Ala Arg Gln Gly Phe Val Asp
2630 2635 2640
Ser Asp Val Glu Thr Lys Asp Val Val Glu Cys Leu Lys Leu Ser
2645 2650 2655
His Gln Ser Asp Ile Glu Val Thr Gly Asp Ser Cys Asn Asn Tyr
2660 2665 2670
Met Leu Thr Tyr Asn Lys Val Glu Asn Met Thr Pro Arg Asp Leu
2675 2680 2685
Gly Ala Cys Ile Asp Cys Ser Ala Arg His Ile Asn Ala Gln Val
2690 2695 2700
Ala Lys Ser His Asn Ile Ala Leu Ile Trp Asn Val Lys Asp Phe
2705 2710 2715
Met Ser Leu Ser Glu Gln Leu Arg Lys Gln Ile Arg Ser Ala Ala
2720 2725 2730
Lys Lys Asn Asn Leu Pro Phe Lys Leu Thr Cys Ala Thr Thr Arg
2735 2740 2745
Gln Val Val Asn Val Val Thr Thr Lys Ile Ala Leu Lys Gly Gly
2750 2755 2760
Lys Ile Val Asn Asn Trp Leu Lys Gln Leu Ile Lys Val Thr Leu
2765 2770 2775
Val Phe Leu Phe Val Ala Ala Ile Phe Tyr Leu Ile Thr Pro Val
2780 2785 2790
His Val Met Ser Lys His Thr Asp Phe Ser Ser Glu Ile Ile Gly
2795 2800 2805
Tyr Lys Ala Ile Asp Gly Gly Val Thr Arg Asp Ile Ala Ser Thr
2810 2815 2820
Asp Thr Cys Phe Ala Asn Lys His Ala Asp Phe Asp Thr Trp Phe
2825 2830 2835
Ser Gln Arg Gly Gly Ser Tyr Thr Asn Asp Lys Ala Cys Pro Leu
2840 2845 2850
Ile Ala Ala Val Ile Thr Arg Glu Val Gly Phe Val Val Pro Gly
2855 2860 2865
Leu Pro Gly Thr Ile Leu Arg Thr Thr Asn Gly Asp Phe Leu His
2870 2875 2880
Phe Leu Pro Arg Val Phe Ser Ala Val Gly Asn Ile Cys Tyr Thr
2885 2890 2895
Pro Ser Lys Leu Ile Glu Tyr Thr Asp Phe Ala Thr Ser Ala Cys
2900 2905 2910
Val Leu Ala Ala Glu Cys Thr Ile Phe Lys Asp Ala Ser Gly Lys
2915 2920 2925
Pro Val Pro Tyr Cys Tyr Asp Thr Asn Val Leu Glu Gly Ser Val
2930 2935 2940
Ala Tyr Glu Ser Leu Arg Pro Asp Thr Arg Tyr Val Leu Met Asp
2945 2950 2955
Gly Ser Ile Ile Gln Phe Pro Asn Thr Tyr Leu Glu Gly Ser Val
2960 2965 2970
Arg Val Val Thr Thr Phe Asp Ser Glu Tyr Cys Arg His Gly Thr
2975 2980 2985
Cys Glu Arg Ser Glu Ala Gly Val Cys Val Ser Thr Ser Gly Arg
2990 2995 3000
Trp Val Leu Asn Asn Asp Tyr Tyr Arg Ser Leu Pro Gly Val Phe
3005 3010 3015
Cys Gly Val Asp Ala Val Asn Leu Leu Thr Asn Met Phe Thr Pro
3020 3025 3030
Leu Ile Gln Pro Ile Gly Ala Leu Asp Ile Ser Ala Ser Ile Val
3035 3040 3045
Ala Gly Gly Ile Val Ala Ile Val Val Thr Cys Leu Ala Tyr Tyr
3050 3055 3060
Phe Met Arg Phe Arg Arg Ala Phe Gly Glu Tyr Ser His Val Val
3065 3070 3075
Ala Phe Asn Thr Leu Leu Phe Leu Met Ser Phe Thr Val Leu Cys
3080 3085 3090
Leu Thr Pro Val Tyr Ser Phe Leu Pro Gly Val Tyr Ser Val Ile
3095 3100 3105
Tyr Leu Tyr Leu Thr Phe Tyr Leu Thr Asn Asp Val Ser Phe Leu
3110 3115 3120
Ala His Ile Gln Trp Met Val Met Phe Thr Pro Leu Val Pro Phe
3125 3130 3135
Trp Ile Thr Ile Ala Tyr Ile Ile Cys Ile Ser Thr Lys His Phe
3140 3145 3150
Tyr Trp Phe Phe Ser Asn Tyr Leu Lys Arg Arg Val Val Phe Asn
3155 3160 3165
Gly Val Ser Phe Ser Thr Phe Glu Glu Ala Ala Leu Cys Thr Phe
3170 3175 3180
Leu Leu Asn Lys Glu Met Tyr Leu Lys Leu Arg Ser Asp Val Leu
3185 3190 3195
Leu Pro Leu Thr Gln Tyr Asn Arg Tyr Leu Ala Leu Tyr Asn Lys
3200 3205 3210
Tyr Lys Tyr Phe Ser Gly Ala Met Asp Thr Thr Ser Tyr Arg Glu
3215 3220 3225
Ala Ala Cys Cys His Leu Ala Lys Ala Leu Asn Asp Phe Ser Asn
3230 3235 3240
Ser Gly Ser Asp Val Leu Tyr Gln Pro Pro Gln Thr Ser Ile Thr
3245 3250 3255
Ser Ala Val Leu Gln Ser Gly Phe Arg Lys Met Ala Phe Pro Ser
3260 3265 3270
Gly Lys Val Glu Gly Cys Met Val Gln Val Thr Cys Gly Thr Thr
3275 3280 3285
Thr Leu Asn Gly Leu Trp Leu Asp Asp Val Val Tyr Cys Pro Arg
3290 3295 3300
His Val Ile Cys Thr Ser Glu Asp Met Leu Asn Pro Asn Tyr Glu
3305 3310 3315
Asp Leu Leu Ile Arg Lys Ser Asn His Asn Phe Leu Val Gln Ala
3320 3325 3330
Gly Asn Val Gln Leu Arg Val Ile Gly His Ser Met Gln Asn Cys
3335 3340 3345
Val Leu Lys Leu Lys Val Asp Thr Ala Asn Pro Lys Thr Pro Lys
3350 3355 3360
Tyr Lys Phe Val Arg Ile Gln Pro Gly Gln Thr Phe Ser Val Leu
3365 3370 3375
Ala Cys Tyr Asn Gly Ser Pro Ser Gly Val Tyr Gln Cys Ala Met
3380 3385 3390
Arg Pro Asn Phe Thr Ile Lys Gly Ser Phe Leu Asn Gly Ser Cys
3395 3400 3405
Gly Ser Val Gly Phe Asn Ile Asp Tyr Asp Cys Val Ser Phe Cys
3410 3415 3420
Tyr Met His His Met Glu Leu Pro Thr Gly Val His Ala Gly Thr
3425 3430 3435
Asp Leu Glu Gly Asn Phe Tyr Gly Pro Phe Val Asp Arg Gln Thr
3440 3445 3450
Ala Gln Ala Ala Gly Thr Asp Thr Thr Ile Thr Val Asn Val Leu
3455 3460 3465
Ala Trp Leu Tyr Ala Ala Val Ile Asn Gly Asp Arg Trp Phe Leu
3470 3475 3480
Asn Arg Phe Thr Thr Thr Leu Asn Asp Phe Asn Leu Val Ala Met
3485 3490 3495
Lys Tyr Asn Tyr Glu Pro Leu Thr Gln Asp His Val Asp Ile Leu
3500 3505 3510
Gly Pro Leu Ser Ala Gln Thr Gly Ile Ala Val Leu Asp Met Cys
3515 3520 3525
Ala Ser Leu Lys Glu Leu Leu Gln Asn Gly Met Asn Gly Arg Thr
3530 3535 3540
Ile Leu Gly Ser Ala Leu Leu Glu Asp Glu Phe Thr Pro Phe Asp
3545 3550 3555
Val Val Arg Gln Cys Ser Gly Val Thr Phe Gln Ser Ala Val Lys
3560 3565 3570
Arg Thr Ile Lys Gly Thr His His Trp Leu Leu Leu Thr Ile Leu
3575 3580 3585
Thr Ser Leu Leu Val Leu Val Gln Ser Thr Gln Trp Ser Leu Phe
3590 3595 3600
Phe Phe Leu Tyr Glu Asn Ala Phe Leu Pro Phe Ala Met Gly Ile
3605 3610 3615
Ile Ala Met Ser Ala Phe Ala Met Met Phe Val Lys His Lys His
3620 3625 3630
Ala Phe Leu Cys Leu Phe Leu Leu Pro Ser Leu Ala Thr Val Ala
3635 3640 3645
Tyr Phe Asn Met Val Tyr Met Pro Ala Ser Trp Val Met Arg Ile
3650 3655 3660
Met Thr Trp Leu Asp Met Val Asp Thr Ser Leu Ser Gly Phe Lys
3665 3670 3675
Leu Lys Asp Cys Val Met Tyr Ala Ser Ala Val Val Leu Leu Ile
3680 3685 3690
Leu Met Thr Ala Arg Thr Val Tyr Asp Asp Gly Ala Arg Arg Val
3695 3700 3705
Trp Thr Leu Met Asn Val Leu Thr Leu Val Tyr Lys Val Tyr Tyr
3710 3715 3720
Gly Asn Ala Leu Asp Gln Ala Ile Ser Met Trp Ala Leu Ile Ile
3725 3730 3735
Ser Val Thr Ser Asn Tyr Ser Gly Val Val Thr Thr Val Met Phe
3740 3745 3750
Leu Ala Arg Gly Ile Val Phe Met Cys Val Glu Tyr Cys Pro Ile
3755 3760 3765
Phe Phe Ile Thr Gly Asn Thr Leu Gln Cys Ile Met Leu Val Tyr
3770 3775 3780
Cys Phe Leu Gly Tyr Phe Cys Thr Cys Tyr Phe Gly Leu Phe Cys
3785 3790 3795
Leu Leu Asn Arg Tyr Phe Arg Leu Thr Leu Gly Val Tyr Asp Tyr
3800 3805 3810
Leu Val Ser Thr Gln Glu Phe Arg Tyr Met Asn Ser Gln Gly Leu
3815 3820 3825
Leu Pro Pro Lys Asn Ser Ile Asp Ala Phe Lys Leu Asn Ile Lys
3830 3835 3840
Leu Leu Gly Val Gly Gly Lys Pro Cys Ile Lys Val Ala Thr Val
3845 3850 3855
Gln Ser Lys Met Ser Asp Val Lys Cys Thr Ser Val Val Leu Leu
3860 3865 3870
Ser Val Leu Gln Gln Leu Arg Val Glu Ser Ser Ser Lys Leu Trp
3875 3880 3885
Ala Gln Cys Val Gln Leu His Asn Asp Ile Leu Leu Ala Lys Asp
3890 3895 3900
Thr Thr Glu Ala Phe Glu Lys Met Val Ser Leu Leu Ser Val Leu
3905 3910 3915
Leu Ser Met Gln Gly Ala Val Asp Ile Asn Lys Leu Cys Glu Glu
3920 3925 3930
Met Leu Asp Asn Arg Ala Thr Leu Gln Ala Ile Ala Ser Glu Phe
3935 3940 3945
Ser Ser Leu Pro Ser Tyr Ala Ala Phe Ala Thr Ala Gln Glu Ala
3950 3955 3960
Tyr Glu Gln Ala Val Ala Asn Gly Asp Ser Glu Val Val Leu Lys
3965 3970 3975
Lys Leu Lys Lys Ser Leu Asn Val Ala Lys Ser Glu Phe Asp Arg
3980 3985 3990
Asp Ala Ala Met Gln Arg Lys Leu Glu Lys Met Ala Asp Gln Ala
3995 4000 4005
Met Thr Gln Met Tyr Lys Gln Ala Arg Ser Glu Asp Lys Arg Ala
4010 4015 4020
Lys Val Thr Ser Ala Met Gln Thr Met Leu Phe Thr Met Leu Arg
4025 4030 4035
Lys Leu Asp Asn Asp Ala Leu Asn Asn Ile Ile Asn Asn Ala Arg
4040 4045 4050
Asp Gly Cys Val Pro Leu Asn Ile Ile Pro Leu Thr Thr Ala Ala
4055 4060 4065
Lys Leu Met Val Val Ile Pro Asp Tyr Asn Thr Tyr Lys Asn Thr
4070 4075 4080
Cys Asp Gly Thr Thr Phe Thr Tyr Ala Ser Ala Leu Trp Glu Ile
4085 4090 4095
Gln Gln Val Val Asp Ala Asp Ser Lys Ile Val Gln Leu Ser Glu
4100 4105 4110
Ile Ser Met Asp Asn Ser Pro Asn Leu Ala Trp Pro Leu Ile Val
4115 4120 4125
Thr Ala Leu Arg Ala Asn Ser Ala Val Lys Leu Gln Asn Asn Glu
4130 4135 4140
Leu Ser Pro Val Ala Leu Arg Gln Met Ser Cys Ala Ala Gly Thr
4145 4150 4155
Thr Gln Thr Ala Cys Thr Asp Asp Asn Ala Leu Ala Tyr Tyr Asn
4160 4165 4170
Thr Thr Lys Gly Gly Arg Phe Val Leu Ala Leu Leu Ser Asp Leu
4175 4180 4185
Gln Asp Leu Lys Trp Ala Arg Phe Pro Lys Ser Asp Gly Thr Gly
4190 4195 4200
Thr Ile Tyr Thr Glu Leu Glu Pro Pro Cys Arg Phe Val Thr Asp
4205 4210 4215
Thr Pro Lys Gly Pro Lys Val Lys Tyr Leu Tyr Phe Ile Lys Gly
4220 4225 4230
Leu Asn Asn Leu Asn Arg Gly Met Val Leu Gly Ser Leu Ala Ala
4235 4240 4245
Thr Val Arg Leu Gln Ala Gly Asn Ala Thr Glu Val Pro Ala Asn
4250 4255 4260
Ser Thr Val Leu Ser Phe Cys Ala Phe Ala Val Asp Ala Ala Lys
4265 4270 4275
Ala Tyr Lys Asp Tyr Leu Ala Ser Gly Gly Gln Pro Ile Thr Asn
4280 4285 4290
Cys Val Lys Met Leu Cys Thr His Thr Gly Thr Gly Gln Ala Ile
4295 4300 4305
Thr Val Thr Pro Glu Ala Asn Met Asp Gln Glu Ser Phe Gly Gly
4310 4315 4320
Ala Ser Cys Cys Leu Tyr Cys Arg Cys His Ile Asp His Pro Asn
4325 4330 4335
Pro Lys Gly Phe Cys Asp Leu Lys Gly Lys Tyr Val Gln Ile Pro
4340 4345 4350
Thr Thr Cys Ala Asn Asp Pro Val Gly Phe Thr Leu Lys Asn Thr
4355 4360 4365
Val Cys Thr Val Cys Gly Met Trp Lys Gly Tyr Gly Cys Ser Cys
4370 4375 4380
Asp Gln Leu Arg Glu Pro Met Leu Gln Ser Ala Asp Ala Gln Ser
4385 4390 4395
Phe Leu Asn Gly Phe Ala Val
4400 4405
<210> 415
<211> 1273
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 415
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
1145 1150 1155
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn
1160 1165 1170
Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu
1175 1180 1185
Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu
1205 1210 1215
Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met
1220 1225 1230
Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro
1250 1255 1260
Val Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 416
<211> 275
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 416
Met Asp Leu Phe Met Arg Ile Phe Thr Ile Gly Thr Val Thr Leu Lys
1 5 10 15
Gln Gly Glu Ile Lys Asp Ala Thr Pro Ser Asp Phe Val Arg Ala Thr
20 25 30
Ala Thr Ile Pro Ile Gln Ala Ser Leu Pro Phe Gly Trp Leu Ile Val
35 40 45
Gly Val Ala Leu Leu Ala Val Phe Gln Ser Ala Ser Lys Ile Ile Thr
50 55 60
Leu Lys Lys Arg Trp Gln Leu Ala Leu Ser Lys Gly Val His Phe Val
65 70 75 80
Cys Asn Leu Leu Leu Leu Phe Val Thr Val Tyr Ser His Leu Leu Leu
85 90 95
Val Ala Ala Gly Leu Glu Ala Pro Phe Leu Tyr Leu Tyr Ala Leu Val
100 105 110
Tyr Phe Leu Gln Ser Ile Asn Phe Val Arg Ile Ile Met Arg Leu Trp
115 120 125
Leu Cys Trp Lys Cys Arg Ser Lys Asn Pro Leu Leu Tyr Asp Ala Asn
130 135 140
Tyr Phe Leu Cys Trp His Thr Asn Cys Tyr Asp Tyr Cys Ile Pro Tyr
145 150 155 160
Asn Ser Val Thr Ser Ser Ile Val Ile Thr Ser Gly Asp Gly Thr Thr
165 170 175
Ser Pro Ile Ser Glu His Asp Tyr Gln Ile Gly Gly Tyr Thr Glu Lys
180 185 190
Trp Glu Ser Gly Val Lys Asp Cys Val Val Leu His Ser Tyr Phe Thr
195 200 205
Ser Asp Tyr Tyr Gln Leu Tyr Ser Thr Gln Leu Ser Thr Asp Thr Gly
210 215 220
Val Glu His Val Thr Phe Phe Ile Tyr Asn Lys Ile Val Asp Glu Pro
225 230 235 240
Glu Glu His Val Gln Ile His Thr Ile Asp Gly Ser Ser Gly Val Val
245 250 255
Asn Pro Val Met Glu Pro Ile Tyr Asp Glu Pro Thr Thr Thr Thr Ser
260 265 270
Val Pro Leu
275
<210> 417
<211> 75
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 417
Met Tyr Ser Phe Val Ser Glu Glu Thr Gly Thr Leu Ile Val Asn Ser
1 5 10 15
Val Leu Leu Phe Leu Ala Phe Val Val Phe Leu Leu Val Thr Leu Ala
20 25 30
Ile Leu Thr Ala Leu Arg Leu Cys Ala Tyr Cys Cys Asn Ile Val Asn
35 40 45
Val Ser Leu Val Lys Pro Ser Phe Tyr Val Tyr Ser Arg Val Lys Asn
50 55 60
Leu Asn Ser Ser Arg Val Pro Asp Leu Leu Val
65 70 75
<210> 418
<211> 222
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 418
Met Ala Asp Ser Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Lys Leu
1 5 10 15
Leu Glu Gln Trp Asn Leu Val Ile Gly Phe Leu Phe Leu Thr Trp Ile
20 25 30
Cys Leu Leu Gln Phe Ala Tyr Ala Asn Arg Asn Arg Phe Leu Tyr Ile
35 40 45
Ile Lys Leu Ile Phe Leu Trp Leu Leu Trp Pro Val Thr Leu Ala Cys
50 55 60
Phe Val Leu Ala Ala Val Tyr Arg Ile Asn Trp Ile Thr Gly Gly Ile
65 70 75 80
Ala Ile Ala Met Ala Cys Leu Val Gly Leu Met Trp Leu Ser Tyr Phe
85 90 95
Ile Ala Ser Phe Arg Leu Phe Ala Arg Thr Arg Ser Met Trp Ser Phe
100 105 110
Asn Pro Glu Thr Asn Ile Leu Leu Asn Val Pro Leu His Gly Thr Ile
115 120 125
Leu Thr Arg Pro Leu Leu Glu Ser Glu Leu Val Ile Gly Ala Val Ile
130 135 140
Leu Arg Gly His Leu Arg Ile Ala Gly His His Leu Gly Arg Cys Asp
145 150 155 160
Ile Lys Asp Leu Pro Lys Glu Ile Thr Val Ala Thr Ser Arg Thr Leu
165 170 175
Ser Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Ala Gly Asp Ser Gly
180 185 190
Phe Ala Ala Tyr Ser Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr
195 200 205
Asp His Ser Ser Ser Ser Asp Asn Ile Ala Leu Leu Val Gln
210 215 220
<210> 419
<211> 61
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 419
Met Phe His Leu Val Asp Phe Gln Val Thr Ile Ala Glu Ile Leu Leu
1 5 10 15
Ile Ile Met Arg Thr Phe Lys Val Ser Ile Trp Asn Leu Asp Tyr Ile
20 25 30
Ile Asn Leu Ile Ile Lys Asn Leu Ser Lys Ser Leu Thr Glu Asn Lys
35 40 45
Tyr Ser Gln Leu Asp Glu Glu Gln Pro Met Glu Ile Asp
50 55 60
<210> 420
<211> 121
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 420
Met Lys Ile Ile Leu Phe Leu Ala Leu Ile Thr Leu Ala Thr Cys Glu
1 5 10 15
Leu Tyr His Tyr Gln Glu Cys Val Arg Gly Thr Thr Val Leu Leu Lys
20 25 30
Glu Pro Cys Ser Ser Gly Thr Tyr Glu Gly Asn Ser Pro Phe His Pro
35 40 45
Leu Ala Asp Asn Lys Phe Ala Leu Thr Cys Phe Ser Thr Gln Phe Ala
50 55 60
Phe Ala Cys Pro Asp Gly Val Lys His Val Tyr Gln Leu Arg Ala Arg
65 70 75 80
Ser Val Ser Pro Lys Leu Phe Ile Arg Gln Glu Glu Val Gln Glu Leu
85 90 95
Tyr Ser Pro Ile Phe Leu Ile Val Ala Ala Ile Val Phe Ile Thr Leu
100 105 110
Cys Phe Thr Leu Lys Arg Lys Thr Glu
115 120
<210> 421
<211> 43
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 421
Met Ile Glu Leu Ser Leu Ile Asp Phe Tyr Leu Cys Phe Leu Ala Phe
1 5 10 15
Leu Leu Phe Leu Val Leu Ile Met Leu Ile Ile Phe Trp Phe Ser Leu
20 25 30
Glu Leu Gln Asp His Asn Glu Thr Cys His Ala
35 40
<210> 422
<211> 121
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 422
Met Lys Phe Leu Val Phe Leu Gly Ile Ile Thr Thr Val Ala Ala Phe
1 5 10 15
His Gln Glu Cys Ser Leu Gln Ser Cys Thr Gln His Gln Pro Tyr Val
20 25 30
Val Asp Asp Pro Cys Pro Ile His Phe Tyr Ser Lys Trp Tyr Ile Arg
35 40 45
Val Gly Ala Arg Lys Ser Ala Pro Leu Ile Glu Leu Cys Val Asp Glu
50 55 60
Ala Gly Ser Lys Ser Pro Ile Gln Tyr Ile Asp Ile Gly Asn Tyr Thr
65 70 75 80
Val Ser Cys Leu Pro Phe Thr Ile Asn Cys Gln Glu Pro Lys Leu Gly
85 90 95
Ser Leu Val Val Arg Cys Ser Phe Tyr Glu Asp Phe Leu Glu Tyr His
100 105 110
Asp Val Arg Val Val Leu Asp Phe Ile
115 120
<210> 423
<211> 419
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 423
Met Ser Asp Asn Gly Pro Gln Asn Gln Arg Asn Ala Pro Arg Ile Thr
1 5 10 15
Phe Gly Gly Pro Ser Asp Ser Thr Gly Ser Asn Gln Asn Gly Glu Arg
20 25 30
Ser Gly Ala Arg Ser Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn Asn
35 40 45
Thr Ala Ser Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Asp Leu
50 55 60
Lys Phe Pro Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Ser Pro
65 70 75 80
Asp Asp Gln Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Ile Arg Gly
85 90 95
Gly Asp Gly Lys Met Lys Asp Leu Ser Pro Arg Trp Tyr Phe Tyr Tyr
100 105 110
Leu Gly Thr Gly Pro Glu Ala Gly Leu Pro Tyr Gly Ala Asn Lys Asp
115 120 125
Gly Ile Ile Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys Asp
130 135 140
His Ile Gly Thr Arg Asn Pro Ala Asn Asn Ala Ala Ile Val Leu Gln
145 150 155 160
Leu Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly Ser
165 170 175
Arg Gly Gly Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg Asn
180 185 190
Ser Ser Arg Asn Ser Thr Pro Gly Ser Ser Arg Gly Thr Ser Pro Ala
195 200 205
Arg Met Ala Gly Asn Gly Gly Asp Ala Ala Leu Ala Leu Leu Leu Leu
210 215 220
Asp Arg Leu Asn Gln Leu Glu Ser Lys Met Ser Gly Lys Gly Gln Gln
225 230 235 240
Gln Gln Gly Gln Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser Lys
245 250 255
Lys Pro Arg Gln Lys Arg Thr Ala Thr Lys Ala Tyr Asn Val Thr Gln
260 265 270
Ala Phe Gly Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly Asp
275 280 285
Gln Glu Leu Ile Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln Ile
290 295 300
Ala Gln Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg Ile
305 310 315 320
Gly Met Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr Thr Gly Ala
325 330 335
Ile Lys Leu Asp Asp Lys Asp Pro Asn Phe Lys Asp Gln Val Ile Leu
340 345 350
Leu Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu Pro
355 360 365
Lys Lys Asp Lys Lys Lys Lys Ala Asp Glu Thr Gln Ala Leu Pro Gln
370 375 380
Arg Gln Lys Lys Gln Gln Thr Val Thr Leu Leu Pro Ala Ala Asp Leu
385 390 395 400
Asp Asp Phe Ser Lys Gln Leu Gln Gln Ser Met Ser Ser Ala Asp Ser
405 410 415
Thr Gln Ala
<210> 424
<211> 38
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 424
Met Gly Tyr Ile Asn Val Phe Ala Phe Pro Phe Thr Ile Tyr Ser Leu
1 5 10 15
Leu Leu Cys Arg Met Asn Ser Arg Asn Tyr Ile Ala Gln Val Asp Val
20 25 30
Val Asn Phe Asn Leu Thr
35
<210> 425
<211> 7096
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 425
Met Glu Ser Leu Val Pro Gly Phe Asn Glu Lys Thr His Val Gln Leu
1 5 10 15
Ser Leu Pro Val Leu Gln Val Arg Asp Val Leu Val Arg Gly Phe Gly
20 25 30
Asp Ser Val Glu Glu Val Leu Ser Glu Ala Arg Gln His Leu Lys Asp
35 40 45
Gly Thr Cys Gly Leu Val Glu Val Glu Lys Gly Val Leu Pro Gln Leu
50 55 60
Glu Gln Pro Tyr Val Phe Ile Lys Arg Ser Asp Ala Arg Thr Ala Pro
65 70 75 80
His Gly His Val Met Val Glu Leu Val Ala Glu Leu Glu Gly Ile Gln
85 90 95
Tyr Gly Arg Ser Gly Glu Thr Leu Gly Val Leu Val Pro His Val Gly
100 105 110
Glu Ile Pro Val Ala Tyr Arg Lys Val Leu Leu Arg Lys Asn Gly Asn
115 120 125
Lys Gly Ala Gly Gly His Ser Tyr Gly Ala Asp Leu Lys Ser Phe Asp
130 135 140
Leu Gly Asp Glu Leu Gly Thr Asp Pro Tyr Glu Asp Phe Gln Glu Asn
145 150 155 160
Trp Asn Thr Lys His Ser Ser Gly Val Thr Arg Glu Leu Met Arg Glu
165 170 175
Leu Asn Gly Gly Ala Tyr Thr Arg Tyr Val Asp Asn Asn Phe Cys Gly
180 185 190
Pro Asp Gly Tyr Pro Leu Glu Cys Ile Lys Asp Leu Leu Ala Arg Ala
195 200 205
Gly Lys Ala Ser Cys Thr Leu Ser Glu Gln Leu Asp Phe Ile Asp Thr
210 215 220
Lys Arg Gly Val Tyr Cys Cys Arg Glu His Glu His Glu Ile Ala Trp
225 230 235 240
Tyr Thr Glu Arg Ser Glu Lys Ser Tyr Glu Leu Gln Thr Pro Phe Glu
245 250 255
Ile Lys Leu Ala Lys Lys Phe Asp Thr Phe Asn Gly Glu Cys Pro Asn
260 265 270
Phe Val Phe Pro Leu Asn Ser Ile Ile Lys Thr Ile Gln Pro Arg Val
275 280 285
Glu Lys Lys Lys Leu Asp Gly Phe Met Gly Arg Ile Arg Ser Val Tyr
290 295 300
Pro Val Ala Ser Pro Asn Glu Cys Asn Gln Met Cys Leu Ser Thr Leu
305 310 315 320
Met Lys Cys Asp His Cys Gly Glu Thr Ser Trp Gln Thr Gly Asp Phe
325 330 335
Val Lys Ala Thr Cys Glu Phe Cys Gly Thr Glu Asn Leu Thr Lys Glu
340 345 350
Gly Ala Thr Thr Cys Gly Tyr Leu Pro Gln Asn Ala Val Val Lys Ile
355 360 365
Tyr Cys Pro Ala Cys His Asn Ser Glu Val Gly Pro Glu His Ser Leu
370 375 380
Ala Glu Tyr His Asn Glu Ser Gly Leu Lys Thr Ile Leu Arg Lys Gly
385 390 395 400
Gly Arg Thr Ile Ala Phe Gly Gly Cys Val Phe Ser Tyr Val Gly Cys
405 410 415
His Asn Lys Cys Ala Tyr Trp Val Pro Arg Ala Ser Ala Asn Ile Gly
420 425 430
Cys Asn His Thr Gly Val Val Gly Glu Gly Ser Glu Gly Leu Asn Asp
435 440 445
Asn Leu Leu Glu Ile Leu Gln Lys Glu Lys Val Asn Ile Asn Ile Val
450 455 460
Gly Asp Phe Lys Leu Asn Glu Glu Ile Ala Ile Ile Leu Ala Ser Phe
465 470 475 480
Ser Ala Ser Thr Ser Ala Phe Val Glu Thr Val Lys Gly Leu Asp Tyr
485 490 495
Lys Ala Phe Lys Gln Ile Val Glu Ser Cys Gly Asn Phe Lys Val Thr
500 505 510
Lys Gly Lys Ala Lys Lys Gly Ala Trp Asn Ile Gly Glu Gln Lys Ser
515 520 525
Ile Leu Ser Pro Leu Tyr Ala Phe Ala Ser Glu Ala Ala Arg Val Val
530 535 540
Arg Ser Ile Phe Ser Arg Thr Leu Glu Thr Ala Gln Asn Ser Val Arg
545 550 555 560
Val Leu Gln Lys Ala Ala Ile Thr Ile Leu Asp Gly Ile Ser Gln Tyr
565 570 575
Ser Leu Arg Leu Ile Asp Ala Met Met Phe Thr Ser Asp Leu Ala Thr
580 585 590
Asn Asn Leu Val Val Met Ala Tyr Ile Thr Gly Gly Val Val Gln Leu
595 600 605
Thr Ser Gln Trp Leu Thr Asn Ile Phe Gly Thr Val Tyr Glu Lys Leu
610 615 620
Lys Pro Val Leu Asp Trp Leu Glu Glu Lys Phe Lys Glu Gly Val Glu
625 630 635 640
Phe Leu Arg Asp Gly Trp Glu Ile Val Lys Phe Ile Ser Thr Cys Ala
645 650 655
Cys Glu Ile Val Gly Gly Gln Ile Val Thr Cys Ala Lys Glu Ile Lys
660 665 670
Glu Ser Val Gln Thr Phe Phe Lys Leu Val Asn Lys Phe Leu Ala Leu
675 680 685
Cys Ala Asp Ser Ile Ile Ile Gly Gly Ala Lys Leu Lys Ala Leu Asn
690 695 700
Leu Gly Glu Thr Phe Val Thr His Ser Lys Gly Leu Tyr Arg Lys Cys
705 710 715 720
Val Lys Ser Arg Glu Glu Thr Gly Leu Leu Met Pro Leu Lys Ala Pro
725 730 735
Lys Glu Ile Ile Phe Leu Glu Gly Glu Thr Leu Pro Thr Glu Val Leu
740 745 750
Thr Glu Glu Val Val Leu Lys Thr Gly Asp Leu Gln Pro Leu Glu Gln
755 760 765
Pro Thr Ser Glu Ala Val Glu Ala Pro Leu Val Gly Thr Pro Val Cys
770 775 780
Ile Asn Gly Leu Met Leu Leu Glu Ile Lys Asp Thr Glu Lys Tyr Cys
785 790 795 800
Ala Leu Ala Pro Asn Met Met Val Thr Asn Asn Thr Phe Thr Leu Lys
805 810 815
Gly Gly Ala Pro Thr Lys Val Thr Phe Gly Asp Asp Thr Val Ile Glu
820 825 830
Val Gln Gly Tyr Lys Ser Val Asn Ile Thr Phe Glu Leu Asp Glu Arg
835 840 845
Ile Asp Lys Val Leu Asn Glu Lys Cys Ser Ala Tyr Thr Val Glu Leu
850 855 860
Gly Thr Glu Val Asn Glu Phe Ala Cys Val Val Ala Asp Ala Val Ile
865 870 875 880
Lys Thr Leu Gln Pro Val Ser Glu Leu Leu Thr Pro Leu Gly Ile Asp
885 890 895
Leu Asp Glu Trp Ser Met Ala Thr Tyr Tyr Leu Phe Asp Glu Ser Gly
900 905 910
Glu Phe Lys Leu Ala Ser His Met Tyr Cys Ser Phe Tyr Pro Pro Asp
915 920 925
Glu Asp Glu Glu Glu Gly Asp Cys Glu Glu Glu Glu Phe Glu Pro Ser
930 935 940
Thr Gln Tyr Glu Tyr Gly Thr Glu Asp Asp Tyr Gln Gly Lys Pro Leu
945 950 955 960
Glu Phe Gly Ala Thr Ser Ala Ala Leu Gln Pro Glu Glu Glu Gln Glu
965 970 975
Glu Asp Trp Leu Asp Asp Asp Ser Gln Gln Thr Val Gly Gln Gln Asp
980 985 990
Gly Ser Glu Asp Asn Gln Thr Thr Thr Ile Gln Thr Ile Val Glu Val
995 1000 1005
Gln Pro Gln Leu Glu Met Glu Leu Thr Pro Val Val Gln Thr Ile
1010 1015 1020
Glu Val Asn Ser Phe Ser Gly Tyr Leu Lys Leu Thr Asp Asn Val
1025 1030 1035
Tyr Ile Lys Asn Ala Asp Ile Val Glu Glu Ala Lys Lys Val Lys
1040 1045 1050
Pro Thr Val Val Val Asn Ala Ala Asn Val Tyr Leu Lys His Gly
1055 1060 1065
Gly Gly Val Ala Gly Ala Leu Asn Lys Ala Thr Asn Asn Ala Met
1070 1075 1080
Gln Val Glu Ser Asp Asp Tyr Ile Ala Thr Asn Gly Pro Leu Lys
1085 1090 1095
Val Gly Gly Ser Cys Val Leu Ser Gly His Asn Leu Ala Lys His
1100 1105 1110
Cys Leu His Val Val Gly Pro Asn Val Asn Lys Gly Glu Asp Ile
1115 1120 1125
Gln Leu Leu Lys Ser Ala Tyr Glu Asn Phe Asn Gln His Glu Val
1130 1135 1140
Leu Leu Ala Pro Leu Leu Ser Ala Gly Ile Phe Gly Ala Asp Pro
1145 1150 1155
Ile His Ser Leu Arg Val Cys Val Asp Thr Val Arg Thr Asn Val
1160 1165 1170
Tyr Leu Ala Val Phe Asp Lys Asn Leu Tyr Asp Lys Leu Val Ser
1175 1180 1185
Ser Phe Leu Glu Met Lys Ser Glu Lys Gln Val Glu Gln Lys Ile
1190 1195 1200
Ala Glu Ile Pro Lys Glu Glu Val Lys Pro Phe Ile Thr Glu Ser
1205 1210 1215
Lys Pro Ser Val Glu Gln Arg Lys Gln Asp Asp Lys Lys Ile Lys
1220 1225 1230
Ala Cys Val Glu Glu Val Thr Thr Thr Leu Glu Glu Thr Lys Phe
1235 1240 1245
Leu Thr Glu Asn Leu Leu Leu Tyr Ile Asp Ile Asn Gly Asn Leu
1250 1255 1260
His Pro Asp Ser Ala Thr Leu Val Ser Asp Ile Asp Ile Thr Phe
1265 1270 1275
Leu Lys Lys Asp Ala Pro Tyr Ile Val Gly Asp Val Val Gln Glu
1280 1285 1290
Gly Val Leu Thr Ala Val Val Ile Pro Thr Lys Lys Ala Gly Gly
1295 1300 1305
Thr Thr Glu Met Leu Ala Lys Ala Leu Arg Lys Val Pro Thr Asp
1310 1315 1320
Asn Tyr Ile Thr Thr Tyr Pro Gly Gln Gly Leu Asn Gly Tyr Thr
1325 1330 1335
Val Glu Glu Ala Lys Thr Val Leu Lys Lys Cys Lys Ser Ala Phe
1340 1345 1350
Tyr Ile Leu Pro Ser Ile Ile Ser Asn Glu Lys Gln Glu Ile Leu
1355 1360 1365
Gly Thr Val Ser Trp Asn Leu Arg Glu Met Leu Ala His Ala Glu
1370 1375 1380
Glu Thr Arg Lys Leu Met Pro Val Cys Val Glu Thr Lys Ala Ile
1385 1390 1395
Val Ser Thr Ile Gln Arg Lys Tyr Lys Gly Ile Lys Ile Gln Glu
1400 1405 1410
Gly Val Val Asp Tyr Gly Ala Arg Phe Tyr Phe Tyr Thr Ser Lys
1415 1420 1425
Thr Thr Val Ala Ser Leu Ile Asn Thr Leu Asn Asp Leu Asn Glu
1430 1435 1440
Thr Leu Val Thr Met Pro Leu Gly Tyr Val Thr His Gly Leu Asn
1445 1450 1455
Leu Glu Glu Ala Ala Arg Tyr Met Arg Ser Leu Lys Val Pro Ala
1460 1465 1470
Thr Val Ser Val Ser Ser Pro Asp Ala Val Thr Ala Tyr Asn Gly
1475 1480 1485
Tyr Leu Thr Ser Ser Ser Lys Thr Pro Glu Glu His Phe Ile Glu
1490 1495 1500
Thr Ile Ser Leu Ala Gly Ser Tyr Lys Asp Trp Ser Tyr Ser Gly
1505 1510 1515
Gln Ser Thr Gln Leu Gly Ile Glu Phe Leu Lys Arg Gly Asp Lys
1520 1525 1530
Ser Val Tyr Tyr Thr Ser Asn Pro Thr Thr Phe His Leu Asp Gly
1535 1540 1545
Glu Val Ile Thr Phe Asp Asn Leu Lys Thr Leu Leu Ser Leu Arg
1550 1555 1560
Glu Val Arg Thr Ile Lys Val Phe Thr Thr Val Asp Asn Ile Asn
1565 1570 1575
Leu His Thr Gln Val Val Asp Met Ser Met Thr Tyr Gly Gln Gln
1580 1585 1590
Phe Gly Pro Thr Tyr Leu Asp Gly Ala Asp Val Thr Lys Ile Lys
1595 1600 1605
Pro His Asn Ser His Glu Gly Lys Thr Phe Tyr Val Leu Pro Asn
1610 1615 1620
Asp Asp Thr Leu Arg Val Glu Ala Phe Glu Tyr Tyr His Thr Thr
1625 1630 1635
Asp Pro Ser Phe Leu Gly Arg Tyr Met Ser Ala Leu Asn His Thr
1640 1645 1650
Lys Lys Trp Lys Tyr Pro Gln Val Asn Gly Leu Thr Ser Ile Lys
1655 1660 1665
Trp Ala Asp Asn Asn Cys Tyr Leu Ala Thr Ala Leu Leu Thr Leu
1670 1675 1680
Gln Gln Ile Glu Leu Lys Phe Asn Pro Pro Ala Leu Gln Asp Ala
1685 1690 1695
Tyr Tyr Arg Ala Arg Ala Gly Glu Ala Ala Asn Phe Cys Ala Leu
1700 1705 1710
Ile Leu Ala Tyr Cys Asn Lys Thr Val Gly Glu Leu Gly Asp Val
1715 1720 1725
Arg Glu Thr Met Ser Tyr Leu Phe Gln His Ala Asn Leu Asp Ser
1730 1735 1740
Cys Lys Arg Val Leu Asn Val Val Cys Lys Thr Cys Gly Gln Gln
1745 1750 1755
Gln Thr Thr Leu Lys Gly Val Glu Ala Val Met Tyr Met Gly Thr
1760 1765 1770
Leu Ser Tyr Glu Gln Phe Lys Lys Gly Val Gln Ile Pro Cys Thr
1775 1780 1785
Cys Gly Lys Gln Ala Thr Lys Tyr Leu Val Gln Gln Glu Ser Pro
1790 1795 1800
Phe Val Met Met Ser Ala Pro Pro Ala Gln Tyr Glu Leu Lys His
1805 1810 1815
Gly Thr Phe Thr Cys Ala Ser Glu Tyr Thr Gly Asn Tyr Gln Cys
1820 1825 1830
Gly His Tyr Lys His Ile Thr Ser Lys Glu Thr Leu Tyr Cys Ile
1835 1840 1845
Asp Gly Ala Leu Leu Thr Lys Ser Ser Glu Tyr Lys Gly Pro Ile
1850 1855 1860
Thr Asp Val Phe Tyr Lys Glu Asn Ser Tyr Thr Thr Thr Ile Lys
1865 1870 1875
Pro Val Thr Tyr Lys Leu Asp Gly Val Val Cys Thr Glu Ile Asp
1880 1885 1890
Pro Lys Leu Asp Asn Tyr Tyr Lys Lys Asp Asn Ser Tyr Phe Thr
1895 1900 1905
Glu Gln Pro Ile Asp Leu Val Pro Asn Gln Pro Tyr Pro Asn Ala
1910 1915 1920
Ser Phe Asp Asn Phe Lys Phe Val Cys Asp Asn Ile Lys Phe Ala
1925 1930 1935
Asp Asp Leu Asn Gln Leu Thr Gly Tyr Lys Lys Pro Ala Ser Arg
1940 1945 1950
Glu Leu Lys Val Thr Phe Phe Pro Asp Leu Asn Gly Asp Val Val
1955 1960 1965
Ala Ile Asp Tyr Lys His Tyr Thr Pro Ser Phe Lys Lys Gly Ala
1970 1975 1980
Lys Leu Leu His Lys Pro Ile Val Trp His Val Asn Asn Ala Thr
1985 1990 1995
Asn Lys Ala Thr Tyr Lys Pro Asn Thr Trp Cys Ile Arg Cys Leu
2000 2005 2010
Trp Ser Thr Lys Pro Val Glu Thr Ser Asn Ser Phe Asp Val Leu
2015 2020 2025
Lys Ser Glu Asp Ala Gln Gly Met Asp Asn Leu Ala Cys Glu Asp
2030 2035 2040
Leu Lys Pro Val Ser Glu Glu Val Val Glu Asn Pro Thr Ile Gln
2045 2050 2055
Lys Asp Val Leu Glu Cys Asn Val Lys Thr Thr Glu Val Val Gly
2060 2065 2070
Asp Ile Ile Leu Lys Pro Ala Asn Asn Ser Leu Lys Ile Thr Glu
2075 2080 2085
Glu Val Gly His Thr Asp Leu Met Ala Ala Tyr Val Asp Asn Ser
2090 2095 2100
Ser Leu Thr Ile Lys Lys Pro Asn Glu Leu Ser Arg Val Leu Gly
2105 2110 2115
Leu Lys Thr Leu Ala Thr His Gly Leu Ala Ala Val Asn Ser Val
2120 2125 2130
Pro Trp Asp Thr Ile Ala Asn Tyr Ala Lys Pro Phe Leu Asn Lys
2135 2140 2145
Val Val Ser Thr Thr Thr Asn Ile Val Thr Arg Cys Leu Asn Arg
2150 2155 2160
Val Cys Thr Asn Tyr Met Pro Tyr Phe Phe Thr Leu Leu Leu Gln
2165 2170 2175
Leu Cys Thr Phe Thr Arg Ser Thr Asn Ser Arg Ile Lys Ala Ser
2180 2185 2190
Met Pro Thr Thr Ile Ala Lys Asn Thr Val Lys Ser Val Gly Lys
2195 2200 2205
Phe Cys Leu Glu Ala Ser Phe Asn Tyr Leu Lys Ser Pro Asn Phe
2210 2215 2220
Ser Lys Leu Ile Asn Ile Ile Ile Trp Phe Leu Leu Leu Ser Val
2225 2230 2235
Cys Leu Gly Ser Leu Ile Tyr Ser Thr Ala Ala Leu Gly Val Leu
2240 2245 2250
Met Ser Asn Leu Gly Met Pro Ser Tyr Cys Thr Gly Tyr Arg Glu
2255 2260 2265
Gly Tyr Leu Asn Ser Thr Asn Val Thr Ile Ala Thr Tyr Cys Thr
2270 2275 2280
Gly Ser Ile Pro Cys Ser Val Cys Leu Ser Gly Leu Asp Ser Leu
2285 2290 2295
Asp Thr Tyr Pro Ser Leu Glu Thr Ile Gln Ile Thr Ile Ser Ser
2300 2305 2310
Phe Lys Trp Asp Leu Thr Ala Phe Gly Leu Val Ala Glu Trp Phe
2315 2320 2325
Leu Ala Tyr Ile Leu Phe Thr Arg Phe Phe Tyr Val Leu Gly Leu
2330 2335 2340
Ala Ala Ile Met Gln Leu Phe Phe Ser Tyr Phe Ala Val His Phe
2345 2350 2355
Ile Ser Asn Ser Trp Leu Met Trp Leu Ile Ile Asn Leu Val Gln
2360 2365 2370
Met Ala Pro Ile Ser Ala Met Val Arg Met Tyr Ile Phe Phe Ala
2375 2380 2385
Ser Phe Tyr Tyr Val Trp Lys Ser Tyr Val His Val Val Asp Gly
2390 2395 2400
Cys Asn Ser Ser Thr Cys Met Met Cys Tyr Lys Arg Asn Arg Ala
2405 2410 2415
Thr Arg Val Glu Cys Thr Thr Ile Val Asn Gly Val Arg Arg Ser
2420 2425 2430
Phe Tyr Val Tyr Ala Asn Gly Gly Lys Gly Phe Cys Lys Leu His
2435 2440 2445
Asn Trp Asn Cys Val Asn Cys Asp Thr Phe Cys Ala Gly Ser Thr
2450 2455 2460
Phe Ile Ser Asp Glu Val Ala Arg Asp Leu Ser Leu Gln Phe Lys
2465 2470 2475
Arg Pro Ile Asn Pro Thr Asp Gln Ser Ser Tyr Ile Val Asp Ser
2480 2485 2490
Val Thr Val Lys Asn Gly Ser Ile His Leu Tyr Phe Asp Lys Ala
2495 2500 2505
Gly Gln Lys Thr Tyr Glu Arg His Ser Leu Ser His Phe Val Asn
2510 2515 2520
Leu Asp Asn Leu Arg Ala Asn Asn Thr Lys Gly Ser Leu Pro Ile
2525 2530 2535
Asn Val Ile Val Phe Asp Gly Lys Ser Lys Cys Glu Glu Ser Ser
2540 2545 2550
Ala Lys Ser Ala Ser Val Tyr Tyr Ser Gln Leu Met Cys Gln Pro
2555 2560 2565
Ile Leu Leu Leu Asp Gln Ala Leu Val Ser Asp Val Gly Asp Ser
2570 2575 2580
Ala Glu Val Ala Val Lys Met Phe Asp Ala Tyr Val Asn Thr Phe
2585 2590 2595
Ser Ser Thr Phe Asn Val Pro Met Glu Lys Leu Lys Thr Leu Val
2600 2605 2610
Ala Thr Ala Glu Ala Glu Leu Ala Lys Asn Val Ser Leu Asp Asn
2615 2620 2625
Val Leu Ser Thr Phe Ile Ser Ala Ala Arg Gln Gly Phe Val Asp
2630 2635 2640
Ser Asp Val Glu Thr Lys Asp Val Val Glu Cys Leu Lys Leu Ser
2645 2650 2655
His Gln Ser Asp Ile Glu Val Thr Gly Asp Ser Cys Asn Asn Tyr
2660 2665 2670
Met Leu Thr Tyr Asn Lys Val Glu Asn Met Thr Pro Arg Asp Leu
2675 2680 2685
Gly Ala Cys Ile Asp Cys Ser Ala Arg His Ile Asn Ala Gln Val
2690 2695 2700
Ala Lys Ser His Asn Ile Ala Leu Ile Trp Asn Val Lys Asp Phe
2705 2710 2715
Met Ser Leu Ser Glu Gln Leu Arg Lys Gln Ile Arg Ser Ala Ala
2720 2725 2730
Lys Lys Asn Asn Leu Pro Phe Lys Leu Thr Cys Ala Thr Thr Arg
2735 2740 2745
Gln Val Val Asn Val Val Thr Thr Lys Ile Ala Leu Lys Gly Gly
2750 2755 2760
Lys Ile Val Asn Asn Trp Leu Lys Gln Leu Ile Lys Val Thr Leu
2765 2770 2775
Val Phe Leu Phe Val Ala Ala Ile Phe Tyr Leu Ile Thr Pro Val
2780 2785 2790
His Val Met Ser Lys His Thr Asp Phe Ser Ser Glu Ile Ile Gly
2795 2800 2805
Tyr Lys Ala Ile Asp Gly Gly Val Thr Arg Asp Ile Ala Ser Thr
2810 2815 2820
Asp Thr Cys Phe Ala Asn Lys His Ala Asp Phe Asp Thr Trp Phe
2825 2830 2835
Ser Gln Arg Gly Gly Ser Tyr Thr Asn Asp Lys Ala Cys Pro Leu
2840 2845 2850
Ile Ala Ala Val Ile Thr Arg Glu Val Gly Phe Val Val Pro Gly
2855 2860 2865
Leu Pro Gly Thr Ile Leu Arg Thr Thr Asn Gly Asp Phe Leu His
2870 2875 2880
Phe Leu Pro Arg Val Phe Ser Ala Val Gly Asn Ile Cys Tyr Thr
2885 2890 2895
Pro Ser Lys Leu Ile Glu Tyr Thr Asp Phe Ala Thr Ser Ala Cys
2900 2905 2910
Val Leu Ala Ala Glu Cys Thr Ile Phe Lys Asp Ala Ser Gly Lys
2915 2920 2925
Pro Val Pro Tyr Cys Tyr Asp Thr Asn Val Leu Glu Gly Ser Val
2930 2935 2940
Ala Tyr Glu Ser Leu Arg Pro Asp Thr Arg Tyr Val Leu Met Asp
2945 2950 2955
Gly Ser Ile Ile Gln Phe Pro Asn Thr Tyr Leu Glu Gly Ser Val
2960 2965 2970
Arg Val Val Thr Thr Phe Asp Ser Glu Tyr Cys Arg His Gly Thr
2975 2980 2985
Cys Glu Arg Ser Glu Ala Gly Val Cys Val Ser Thr Ser Gly Arg
2990 2995 3000
Trp Val Leu Asn Asn Asp Tyr Tyr Arg Ser Leu Pro Gly Val Phe
3005 3010 3015
Cys Gly Val Asp Ala Val Asn Leu Leu Thr Asn Met Phe Thr Pro
3020 3025 3030
Leu Ile Gln Pro Ile Gly Ala Leu Asp Ile Ser Ala Ser Ile Val
3035 3040 3045
Ala Gly Gly Ile Val Ala Ile Val Val Thr Cys Leu Ala Tyr Tyr
3050 3055 3060
Phe Met Arg Phe Arg Arg Ala Phe Gly Glu Tyr Ser His Val Val
3065 3070 3075
Ala Phe Asn Thr Leu Leu Phe Leu Met Ser Phe Thr Val Leu Cys
3080 3085 3090
Leu Thr Pro Val Tyr Ser Phe Leu Pro Gly Val Tyr Ser Val Ile
3095 3100 3105
Tyr Leu Tyr Leu Thr Phe Tyr Leu Thr Asn Asp Val Ser Phe Leu
3110 3115 3120
Ala His Ile Gln Trp Met Val Met Phe Thr Pro Leu Val Pro Phe
3125 3130 3135
Trp Ile Thr Ile Ala Tyr Ile Ile Cys Ile Ser Thr Lys His Phe
3140 3145 3150
Tyr Trp Phe Phe Ser Asn Tyr Leu Lys Arg Arg Val Val Phe Asn
3155 3160 3165
Gly Val Ser Phe Ser Thr Phe Glu Glu Ala Ala Leu Cys Thr Phe
3170 3175 3180
Leu Leu Asn Lys Glu Met Tyr Leu Lys Leu Arg Ser Asp Val Leu
3185 3190 3195
Leu Pro Leu Thr Gln Tyr Asn Arg Tyr Leu Ala Leu Tyr Asn Lys
3200 3205 3210
Tyr Lys Tyr Phe Ser Gly Ala Met Asp Thr Thr Ser Tyr Arg Glu
3215 3220 3225
Ala Ala Cys Cys His Leu Ala Lys Ala Leu Asn Asp Phe Ser Asn
3230 3235 3240
Ser Gly Ser Asp Val Leu Tyr Gln Pro Pro Gln Thr Ser Ile Thr
3245 3250 3255
Ser Ala Val Leu Gln Ser Gly Phe Arg Lys Met Ala Phe Pro Ser
3260 3265 3270
Gly Lys Val Glu Gly Cys Met Val Gln Val Thr Cys Gly Thr Thr
3275 3280 3285
Thr Leu Asn Gly Leu Trp Leu Asp Asp Val Val Tyr Cys Pro Arg
3290 3295 3300
His Val Ile Cys Thr Ser Glu Asp Met Leu Asn Pro Asn Tyr Glu
3305 3310 3315
Asp Leu Leu Ile Arg Lys Ser Asn His Asn Phe Leu Val Gln Ala
3320 3325 3330
Gly Asn Val Gln Leu Arg Val Ile Gly His Ser Met Gln Asn Cys
3335 3340 3345
Val Leu Lys Leu Lys Val Asp Thr Ala Asn Pro Lys Thr Pro Lys
3350 3355 3360
Tyr Lys Phe Val Arg Ile Gln Pro Gly Gln Thr Phe Ser Val Leu
3365 3370 3375
Ala Cys Tyr Asn Gly Ser Pro Ser Gly Val Tyr Gln Cys Ala Met
3380 3385 3390
Arg Pro Asn Phe Thr Ile Lys Gly Ser Phe Leu Asn Gly Ser Cys
3395 3400 3405
Gly Ser Val Gly Phe Asn Ile Asp Tyr Asp Cys Val Ser Phe Cys
3410 3415 3420
Tyr Met His His Met Glu Leu Pro Thr Gly Val His Ala Gly Thr
3425 3430 3435
Asp Leu Glu Gly Asn Phe Tyr Gly Pro Phe Val Asp Arg Gln Thr
3440 3445 3450
Ala Gln Ala Ala Gly Thr Asp Thr Thr Ile Thr Val Asn Val Leu
3455 3460 3465
Ala Trp Leu Tyr Ala Ala Val Ile Asn Gly Asp Arg Trp Phe Leu
3470 3475 3480
Asn Arg Phe Thr Thr Thr Leu Asn Asp Phe Asn Leu Val Ala Met
3485 3490 3495
Lys Tyr Asn Tyr Glu Pro Leu Thr Gln Asp His Val Asp Ile Leu
3500 3505 3510
Gly Pro Leu Ser Ala Gln Thr Gly Ile Ala Val Leu Asp Met Cys
3515 3520 3525
Ala Ser Leu Lys Glu Leu Leu Gln Asn Gly Met Asn Gly Arg Thr
3530 3535 3540
Ile Leu Gly Ser Ala Leu Leu Glu Asp Glu Phe Thr Pro Phe Asp
3545 3550 3555
Val Val Arg Gln Cys Ser Gly Val Thr Phe Gln Ser Ala Val Lys
3560 3565 3570
Arg Thr Ile Lys Gly Thr His His Trp Leu Leu Leu Thr Ile Leu
3575 3580 3585
Thr Ser Leu Leu Val Leu Val Gln Ser Thr Gln Trp Ser Leu Phe
3590 3595 3600
Phe Phe Leu Tyr Glu Asn Ala Phe Leu Pro Phe Ala Met Gly Ile
3605 3610 3615
Ile Ala Met Ser Ala Phe Ala Met Met Phe Val Lys His Lys His
3620 3625 3630
Ala Phe Leu Cys Leu Phe Leu Leu Pro Ser Leu Ala Thr Val Ala
3635 3640 3645
Tyr Phe Asn Met Val Tyr Met Pro Ala Ser Trp Val Met Arg Ile
3650 3655 3660
Met Thr Trp Leu Asp Met Val Asp Thr Ser Leu Ser Gly Phe Lys
3665 3670 3675
Leu Lys Asp Cys Val Met Tyr Ala Ser Ala Val Val Leu Leu Ile
3680 3685 3690
Leu Met Thr Ala Arg Thr Val Tyr Asp Asp Gly Ala Arg Arg Val
3695 3700 3705
Trp Thr Leu Met Asn Val Leu Thr Leu Val Tyr Lys Val Tyr Tyr
3710 3715 3720
Gly Asn Ala Leu Asp Gln Ala Ile Ser Met Trp Ala Leu Ile Ile
3725 3730 3735
Ser Val Thr Ser Asn Tyr Ser Gly Val Val Thr Thr Val Met Phe
3740 3745 3750
Leu Ala Arg Gly Ile Val Phe Met Cys Val Glu Tyr Cys Pro Ile
3755 3760 3765
Phe Phe Ile Thr Gly Asn Thr Leu Gln Cys Ile Met Leu Val Tyr
3770 3775 3780
Cys Phe Leu Gly Tyr Phe Cys Thr Cys Tyr Phe Gly Leu Phe Cys
3785 3790 3795
Leu Leu Asn Arg Tyr Phe Arg Leu Thr Leu Gly Val Tyr Asp Tyr
3800 3805 3810
Leu Val Ser Thr Gln Glu Phe Arg Tyr Met Asn Ser Gln Gly Leu
3815 3820 3825
Leu Pro Pro Lys Asn Ser Ile Asp Ala Phe Lys Leu Asn Ile Lys
3830 3835 3840
Leu Leu Gly Val Gly Gly Lys Pro Cys Ile Lys Val Ala Thr Val
3845 3850 3855
Gln Ser Lys Met Ser Asp Val Lys Cys Thr Ser Val Val Leu Leu
3860 3865 3870
Ser Val Leu Gln Gln Leu Arg Val Glu Ser Ser Ser Lys Leu Trp
3875 3880 3885
Ala Gln Cys Val Gln Leu His Asn Asp Ile Leu Leu Ala Lys Asp
3890 3895 3900
Thr Thr Glu Ala Phe Glu Lys Met Val Ser Leu Leu Ser Val Leu
3905 3910 3915
Leu Ser Met Gln Gly Ala Val Asp Ile Asn Lys Leu Cys Glu Glu
3920 3925 3930
Met Leu Asp Asn Arg Ala Thr Leu Gln Ala Ile Ala Ser Glu Phe
3935 3940 3945
Ser Ser Leu Pro Ser Tyr Ala Ala Phe Ala Thr Ala Gln Glu Ala
3950 3955 3960
Tyr Glu Gln Ala Val Ala Asn Gly Asp Ser Glu Val Val Leu Lys
3965 3970 3975
Lys Leu Lys Lys Ser Leu Asn Val Ala Lys Ser Glu Phe Asp Arg
3980 3985 3990
Asp Ala Ala Met Gln Arg Lys Leu Glu Lys Met Ala Asp Gln Ala
3995 4000 4005
Met Thr Gln Met Tyr Lys Gln Ala Arg Ser Glu Asp Lys Arg Ala
4010 4015 4020
Lys Val Thr Ser Ala Met Gln Thr Met Leu Phe Thr Met Leu Arg
4025 4030 4035
Lys Leu Asp Asn Asp Ala Leu Asn Asn Ile Ile Asn Asn Ala Arg
4040 4045 4050
Asp Gly Cys Val Pro Leu Asn Ile Ile Pro Leu Thr Thr Ala Ala
4055 4060 4065
Lys Leu Met Val Val Ile Pro Asp Tyr Asn Thr Tyr Lys Asn Thr
4070 4075 4080
Cys Asp Gly Thr Thr Phe Thr Tyr Ala Ser Ala Leu Trp Glu Ile
4085 4090 4095
Gln Gln Val Val Asp Ala Asp Ser Lys Ile Val Gln Leu Ser Glu
4100 4105 4110
Ile Ser Met Asp Asn Ser Pro Asn Leu Ala Trp Pro Leu Ile Val
4115 4120 4125
Thr Ala Leu Arg Ala Asn Ser Ala Val Lys Leu Gln Asn Asn Glu
4130 4135 4140
Leu Ser Pro Val Ala Leu Arg Gln Met Ser Cys Ala Ala Gly Thr
4145 4150 4155
Thr Gln Thr Ala Cys Thr Asp Asp Asn Ala Leu Ala Tyr Tyr Asn
4160 4165 4170
Thr Thr Lys Gly Gly Arg Phe Val Leu Ala Leu Leu Ser Asp Leu
4175 4180 4185
Gln Asp Leu Lys Trp Ala Arg Phe Pro Lys Ser Asp Gly Thr Gly
4190 4195 4200
Thr Ile Tyr Thr Glu Leu Glu Pro Pro Cys Arg Phe Val Thr Asp
4205 4210 4215
Thr Pro Lys Gly Pro Lys Val Lys Tyr Leu Tyr Phe Ile Lys Gly
4220 4225 4230
Leu Asn Asn Leu Asn Arg Gly Met Val Leu Gly Ser Leu Ala Ala
4235 4240 4245
Thr Val Arg Leu Gln Ala Gly Asn Ala Thr Glu Val Pro Ala Asn
4250 4255 4260
Ser Thr Val Leu Ser Phe Cys Ala Phe Ala Val Asp Ala Ala Lys
4265 4270 4275
Ala Tyr Lys Asp Tyr Leu Ala Ser Gly Gly Gln Pro Ile Thr Asn
4280 4285 4290
Cys Val Lys Met Leu Cys Thr His Thr Gly Thr Gly Gln Ala Ile
4295 4300 4305
Thr Val Thr Pro Glu Ala Asn Met Asp Gln Glu Ser Phe Gly Gly
4310 4315 4320
Ala Ser Cys Cys Leu Tyr Cys Arg Cys His Ile Asp His Pro Asn
4325 4330 4335
Pro Lys Gly Phe Cys Asp Leu Lys Gly Lys Tyr Val Gln Ile Pro
4340 4345 4350
Thr Thr Cys Ala Asn Asp Pro Val Gly Phe Thr Leu Lys Asn Thr
4355 4360 4365
Val Cys Thr Val Cys Gly Met Trp Lys Gly Tyr Gly Cys Ser Cys
4370 4375 4380
Asp Gln Leu Arg Glu Pro Met Leu Gln Ser Ala Asp Ala Gln Ser
4385 4390 4395
Phe Leu Asn Arg Val Cys Gly Val Ser Ala Ala Arg Leu Thr Pro
4400 4405 4410
Cys Gly Thr Gly Thr Ser Thr Asp Val Val Tyr Arg Ala Phe Asp
4415 4420 4425
Ile Tyr Asn Asp Lys Val Ala Gly Phe Ala Lys Phe Leu Lys Thr
4430 4435 4440
Asn Cys Cys Arg Phe Gln Glu Lys Asp Glu Asp Asp Asn Leu Ile
4445 4450 4455
Asp Ser Tyr Phe Val Val Lys Arg His Thr Phe Ser Asn Tyr Gln
4460 4465 4470
His Glu Glu Thr Ile Tyr Asn Leu Leu Lys Asp Cys Pro Ala Val
4475 4480 4485
Ala Lys His Asp Phe Phe Lys Phe Arg Ile Asp Gly Asp Met Val
4490 4495 4500
Pro His Ile Ser Arg Gln Arg Leu Thr Lys Tyr Thr Met Ala Asp
4505 4510 4515
Leu Val Tyr Ala Leu Arg His Phe Asp Glu Gly Asn Cys Asp Thr
4520 4525 4530
Leu Lys Glu Ile Leu Val Thr Tyr Asn Cys Cys Asp Asp Asp Tyr
4535 4540 4545
Phe Asn Lys Lys Asp Trp Tyr Asp Phe Val Glu Asn Pro Asp Ile
4550 4555 4560
Leu Arg Val Tyr Ala Asn Leu Gly Glu Arg Val Arg Gln Ala Leu
4565 4570 4575
Leu Lys Thr Val Gln Phe Cys Asp Ala Met Arg Asn Ala Gly Ile
4580 4585 4590
Val Gly Val Leu Thr Leu Asp Asn Gln Asp Leu Asn Gly Asn Trp
4595 4600 4605
Tyr Asp Phe Gly Asp Phe Ile Gln Thr Thr Pro Gly Ser Gly Val
4610 4615 4620
Pro Val Val Asp Ser Tyr Tyr Ser Leu Leu Met Pro Ile Leu Thr
4625 4630 4635
Leu Thr Arg Ala Leu Thr Ala Glu Ser His Val Asp Thr Asp Leu
4640 4645 4650
Thr Lys Pro Tyr Ile Lys Trp Asp Leu Leu Lys Tyr Asp Phe Thr
4655 4660 4665
Glu Glu Arg Leu Lys Leu Phe Asp Arg Tyr Phe Lys Tyr Trp Asp
4670 4675 4680
Gln Thr Tyr His Pro Asn Cys Val Asn Cys Leu Asp Asp Arg Cys
4685 4690 4695
Ile Leu His Cys Ala Asn Phe Asn Val Leu Phe Ser Thr Val Phe
4700 4705 4710
Pro Leu Thr Ser Phe Gly Pro Leu Val Arg Lys Ile Phe Val Asp
4715 4720 4725
Gly Val Pro Phe Val Val Ser Thr Gly Tyr His Phe Arg Glu Leu
4730 4735 4740
Gly Val Val His Asn Gln Asp Val Asn Leu His Ser Ser Arg Leu
4745 4750 4755
Ser Phe Lys Glu Leu Leu Val Tyr Ala Ala Asp Pro Ala Met His
4760 4765 4770
Ala Ala Ser Gly Asn Leu Leu Leu Asp Lys Arg Thr Thr Cys Phe
4775 4780 4785
Ser Val Ala Ala Leu Thr Asn Asn Val Ala Phe Gln Thr Val Lys
4790 4795 4800
Pro Gly Asn Phe Asn Lys Asp Phe Tyr Asp Phe Ala Val Ser Lys
4805 4810 4815
Gly Phe Phe Lys Glu Gly Ser Ser Val Glu Leu Lys His Phe Phe
4820 4825 4830
Phe Ala Gln Asp Gly Asn Ala Ala Ile Ser Asp Tyr Asp Tyr Tyr
4835 4840 4845
Arg Tyr Asn Leu Pro Thr Met Cys Asp Ile Arg Gln Leu Leu Phe
4850 4855 4860
Val Val Glu Val Val Asp Lys Tyr Phe Asp Cys Tyr Asp Gly Gly
4865 4870 4875
Cys Ile Asn Ala Asn Gln Val Ile Val Asn Asn Leu Asp Lys Ser
4880 4885 4890
Ala Gly Phe Pro Phe Asn Lys Trp Gly Lys Ala Arg Leu Tyr Tyr
4895 4900 4905
Asp Ser Met Ser Tyr Glu Asp Gln Asp Ala Leu Phe Ala Tyr Thr
4910 4915 4920
Lys Arg Asn Val Ile Pro Thr Ile Thr Gln Met Asn Leu Lys Tyr
4925 4930 4935
Ala Ile Ser Ala Lys Asn Arg Ala Arg Thr Val Ala Gly Val Ser
4940 4945 4950
Ile Cys Ser Thr Met Thr Asn Arg Gln Phe His Gln Lys Leu Leu
4955 4960 4965
Lys Ser Ile Ala Ala Thr Arg Gly Ala Thr Val Val Ile Gly Thr
4970 4975 4980
Ser Lys Phe Tyr Gly Gly Trp His Asn Met Leu Lys Thr Val Tyr
4985 4990 4995
Ser Asp Val Glu Asn Pro His Leu Met Gly Trp Asp Tyr Pro Lys
5000 5005 5010
Cys Asp Arg Ala Met Pro Asn Met Leu Arg Ile Met Ala Ser Leu
5015 5020 5025
Val Leu Ala Arg Lys His Thr Thr Cys Cys Ser Leu Ser His Arg
5030 5035 5040
Phe Tyr Arg Leu Ala Asn Glu Cys Ala Gln Val Leu Ser Glu Met
5045 5050 5055
Val Met Cys Gly Gly Ser Leu Tyr Val Lys Pro Gly Gly Thr Ser
5060 5065 5070
Ser Gly Asp Ala Thr Thr Ala Tyr Ala Asn Ser Val Phe Asn Ile
5075 5080 5085
Cys Gln Ala Val Thr Ala Asn Val Asn Ala Leu Leu Ser Thr Asp
5090 5095 5100
Gly Asn Lys Ile Ala Asp Lys Tyr Val Arg Asn Leu Gln His Arg
5105 5110 5115
Leu Tyr Glu Cys Leu Tyr Arg Asn Arg Asp Val Asp Thr Asp Phe
5120 5125 5130
Val Asn Glu Phe Tyr Ala Tyr Leu Arg Lys His Phe Ser Met Met
5135 5140 5145
Ile Leu Ser Asp Asp Ala Val Val Cys Phe Asn Ser Thr Tyr Ala
5150 5155 5160
Ser Gln Gly Leu Val Ala Ser Ile Lys Asn Phe Lys Ser Val Leu
5165 5170 5175
Tyr Tyr Gln Asn Asn Val Phe Met Ser Glu Ala Lys Cys Trp Thr
5180 5185 5190
Glu Thr Asp Leu Thr Lys Gly Pro His Glu Phe Cys Ser Gln His
5195 5200 5205
Thr Met Leu Val Lys Gln Gly Asp Asp Tyr Val Tyr Leu Pro Tyr
5210 5215 5220
Pro Asp Pro Ser Arg Ile Leu Gly Ala Gly Cys Phe Val Asp Asp
5225 5230 5235
Ile Val Lys Thr Asp Gly Thr Leu Met Ile Glu Arg Phe Val Ser
5240 5245 5250
Leu Ala Ile Asp Ala Tyr Pro Leu Thr Lys His Pro Asn Gln Glu
5255 5260 5265
Tyr Ala Asp Val Phe His Leu Tyr Leu Gln Tyr Ile Arg Lys Leu
5270 5275 5280
His Asp Glu Leu Thr Gly His Met Leu Asp Met Tyr Ser Val Met
5285 5290 5295
Leu Thr Asn Asp Asn Thr Ser Arg Tyr Trp Glu Pro Glu Phe Tyr
5300 5305 5310
Glu Ala Met Tyr Thr Pro His Thr Val Leu Gln Ala Val Gly Ala
5315 5320 5325
Cys Val Leu Cys Asn Ser Gln Thr Ser Leu Arg Cys Gly Ala Cys
5330 5335 5340
Ile Arg Arg Pro Phe Leu Cys Cys Lys Cys Cys Tyr Asp His Val
5345 5350 5355
Ile Ser Thr Ser His Lys Leu Val Leu Ser Val Asn Pro Tyr Val
5360 5365 5370
Cys Asn Ala Pro Gly Cys Asp Val Thr Asp Val Thr Gln Leu Tyr
5375 5380 5385
Leu Gly Gly Met Ser Tyr Tyr Cys Lys Ser His Lys Pro Pro Ile
5390 5395 5400
Ser Phe Pro Leu Cys Ala Asn Gly Gln Val Phe Gly Leu Tyr Lys
5405 5410 5415
Asn Thr Cys Val Gly Ser Asp Asn Val Thr Asp Phe Asn Ala Ile
5420 5425 5430
Ala Thr Cys Asp Trp Thr Asn Ala Gly Asp Tyr Ile Leu Ala Asn
5435 5440 5445
Thr Cys Thr Glu Arg Leu Lys Leu Phe Ala Ala Glu Thr Leu Lys
5450 5455 5460
Ala Thr Glu Glu Thr Phe Lys Leu Ser Tyr Gly Ile Ala Thr Val
5465 5470 5475
Arg Glu Val Leu Ser Asp Arg Glu Leu His Leu Ser Trp Glu Val
5480 5485 5490
Gly Lys Pro Arg Pro Pro Leu Asn Arg Asn Tyr Val Phe Thr Gly
5495 5500 5505
Tyr Arg Val Thr Lys Asn Ser Lys Val Gln Ile Gly Glu Tyr Thr
5510 5515 5520
Phe Glu Lys Gly Asp Tyr Gly Asp Ala Val Val Tyr Arg Gly Thr
5525 5530 5535
Thr Thr Tyr Lys Leu Asn Val Gly Asp Tyr Phe Val Leu Thr Ser
5540 5545 5550
His Thr Val Met Pro Leu Ser Ala Pro Thr Leu Val Pro Gln Glu
5555 5560 5565
His Tyr Val Arg Ile Thr Gly Leu Tyr Pro Thr Leu Asn Ile Ser
5570 5575 5580
Asp Glu Phe Ser Ser Asn Val Ala Asn Tyr Gln Lys Val Gly Met
5585 5590 5595
Gln Lys Tyr Ser Thr Leu Gln Gly Pro Pro Gly Thr Gly Lys Ser
5600 5605 5610
His Phe Ala Ile Gly Leu Ala Leu Tyr Tyr Pro Ser Ala Arg Ile
5615 5620 5625
Val Tyr Thr Ala Cys Ser His Ala Ala Val Asp Ala Leu Cys Glu
5630 5635 5640
Lys Ala Leu Lys Tyr Leu Pro Ile Asp Lys Cys Ser Arg Ile Ile
5645 5650 5655
Pro Ala Arg Ala Arg Val Glu Cys Phe Asp Lys Phe Lys Val Asn
5660 5665 5670
Ser Thr Leu Glu Gln Tyr Val Phe Cys Thr Val Asn Ala Leu Pro
5675 5680 5685
Glu Thr Thr Ala Asp Ile Val Val Phe Asp Glu Ile Ser Met Ala
5690 5695 5700
Thr Asn Tyr Asp Leu Ser Val Val Asn Ala Arg Leu Arg Ala Lys
5705 5710 5715
His Tyr Val Tyr Ile Gly Asp Pro Ala Gln Leu Pro Ala Pro Arg
5720 5725 5730
Thr Leu Leu Thr Lys Gly Thr Leu Glu Pro Glu Tyr Phe Asn Ser
5735 5740 5745
Val Cys Arg Leu Met Lys Thr Ile Gly Pro Asp Met Phe Leu Gly
5750 5755 5760
Thr Cys Arg Arg Cys Pro Ala Glu Ile Val Asp Thr Val Ser Ala
5765 5770 5775
Leu Val Tyr Asp Asn Lys Leu Lys Ala His Lys Asp Lys Ser Ala
5780 5785 5790
Gln Cys Phe Lys Met Phe Tyr Lys Gly Val Ile Thr His Asp Val
5795 5800 5805
Ser Ser Ala Ile Asn Arg Pro Gln Ile Gly Val Val Arg Glu Phe
5810 5815 5820
Leu Thr Arg Asn Pro Ala Trp Arg Lys Ala Val Phe Ile Ser Pro
5825 5830 5835
Tyr Asn Ser Gln Asn Ala Val Ala Ser Lys Ile Leu Gly Leu Pro
5840 5845 5850
Thr Gln Thr Val Asp Ser Ser Gln Gly Ser Glu Tyr Asp Tyr Val
5855 5860 5865
Ile Phe Thr Gln Thr Thr Glu Thr Ala His Ser Cys Asn Val Asn
5870 5875 5880
Arg Phe Asn Val Ala Ile Thr Arg Ala Lys Val Gly Ile Leu Cys
5885 5890 5895
Ile Met Ser Asp Arg Asp Leu Tyr Asp Lys Leu Gln Phe Thr Ser
5900 5905 5910
Leu Glu Ile Pro Arg Arg Asn Val Ala Thr Leu Gln Ala Glu Asn
5915 5920 5925
Val Thr Gly Leu Phe Lys Asp Cys Ser Lys Val Ile Thr Gly Leu
5930 5935 5940
His Pro Thr Gln Ala Pro Thr His Leu Ser Val Asp Thr Lys Phe
5945 5950 5955
Lys Thr Glu Gly Leu Cys Val Asp Ile Pro Gly Ile Pro Lys Asp
5960 5965 5970
Met Thr Tyr Arg Arg Leu Ile Ser Met Met Gly Phe Lys Met Asn
5975 5980 5985
Tyr Gln Val Asn Gly Tyr Pro Asn Met Phe Ile Thr Arg Glu Glu
5990 5995 6000
Ala Ile Arg His Val Arg Ala Trp Ile Gly Phe Asp Val Glu Gly
6005 6010 6015
Cys His Ala Thr Arg Glu Ala Val Gly Thr Asn Leu Pro Leu Gln
6020 6025 6030
Leu Gly Phe Ser Thr Gly Val Asn Leu Val Ala Val Pro Thr Gly
6035 6040 6045
Tyr Val Asp Thr Pro Asn Asn Thr Asp Phe Ser Arg Val Ser Ala
6050 6055 6060
Lys Pro Pro Pro Gly Asp Gln Phe Lys His Leu Ile Pro Leu Met
6065 6070 6075
Tyr Lys Gly Leu Pro Trp Asn Val Val Arg Ile Lys Ile Val Gln
6080 6085 6090
Met Leu Ser Asp Thr Leu Lys Asn Leu Ser Asp Arg Val Val Phe
6095 6100 6105
Val Leu Trp Ala His Gly Phe Glu Leu Thr Ser Met Lys Tyr Phe
6110 6115 6120
Val Lys Ile Gly Pro Glu Arg Thr Cys Cys Leu Cys Asp Arg Arg
6125 6130 6135
Ala Thr Cys Phe Ser Thr Ala Ser Asp Thr Tyr Ala Cys Trp His
6140 6145 6150
His Ser Ile Gly Phe Asp Tyr Val Tyr Asn Pro Phe Met Ile Asp
6155 6160 6165
Val Gln Gln Trp Gly Phe Thr Gly Asn Leu Gln Ser Asn His Asp
6170 6175 6180
Leu Tyr Cys Gln Val His Gly Asn Ala His Val Ala Ser Cys Asp
6185 6190 6195
Ala Ile Met Thr Arg Cys Leu Ala Val His Glu Cys Phe Val Lys
6200 6205 6210
Arg Val Asp Trp Thr Ile Glu Tyr Pro Ile Ile Gly Asp Glu Leu
6215 6220 6225
Lys Ile Asn Ala Ala Cys Arg Lys Val Gln His Met Val Val Lys
6230 6235 6240
Ala Ala Leu Leu Ala Asp Lys Phe Pro Val Leu His Asp Ile Gly
6245 6250 6255
Asn Pro Lys Ala Ile Lys Cys Val Pro Gln Ala Asp Val Glu Trp
6260 6265 6270
Lys Phe Tyr Asp Ala Gln Pro Cys Ser Asp Lys Ala Tyr Lys Ile
6275 6280 6285
Glu Glu Leu Phe Tyr Ser Tyr Ala Thr His Ser Asp Lys Phe Thr
6290 6295 6300
Asp Gly Val Cys Leu Phe Trp Asn Cys Asn Val Asp Arg Tyr Pro
6305 6310 6315
Ala Asn Ser Ile Val Cys Arg Phe Asp Thr Arg Val Leu Ser Asn
6320 6325 6330
Leu Asn Leu Pro Gly Cys Asp Gly Gly Ser Leu Tyr Val Asn Lys
6335 6340 6345
His Ala Phe His Thr Pro Ala Phe Asp Lys Ser Ala Phe Val Asn
6350 6355 6360
Leu Lys Gln Leu Pro Phe Phe Tyr Tyr Ser Asp Ser Pro Cys Glu
6365 6370 6375
Ser His Gly Lys Gln Val Val Ser Asp Ile Asp Tyr Val Pro Leu
6380 6385 6390
Lys Ser Ala Thr Cys Ile Thr Arg Cys Asn Leu Gly Gly Ala Val
6395 6400 6405
Cys Arg His His Ala Asn Glu Tyr Arg Leu Tyr Leu Asp Ala Tyr
6410 6415 6420
Asn Met Met Ile Ser Ala Gly Phe Ser Leu Trp Val Tyr Lys Gln
6425 6430 6435
Phe Asp Thr Tyr Asn Leu Trp Asn Thr Phe Thr Arg Leu Gln Ser
6440 6445 6450
Leu Glu Asn Val Ala Phe Asn Val Val Asn Lys Gly His Phe Asp
6455 6460 6465
Gly Gln Gln Gly Glu Val Pro Val Ser Ile Ile Asn Asn Thr Val
6470 6475 6480
Tyr Thr Lys Val Asp Gly Val Asp Val Glu Leu Phe Glu Asn Lys
6485 6490 6495
Thr Thr Leu Pro Val Asn Val Ala Phe Glu Leu Trp Ala Lys Arg
6500 6505 6510
Asn Ile Lys Pro Val Pro Glu Val Lys Ile Leu Asn Asn Leu Gly
6515 6520 6525
Val Asp Ile Ala Ala Asn Thr Val Ile Trp Asp Tyr Lys Arg Asp
6530 6535 6540
Ala Pro Ala His Ile Ser Thr Ile Gly Val Cys Ser Met Thr Asp
6545 6550 6555
Ile Ala Lys Lys Pro Thr Glu Thr Ile Cys Ala Pro Leu Thr Val
6560 6565 6570
Phe Phe Asp Gly Arg Val Asp Gly Gln Val Asp Leu Phe Arg Asn
6575 6580 6585
Ala Arg Asn Gly Val Leu Ile Thr Glu Gly Ser Val Lys Gly Leu
6590 6595 6600
Gln Pro Ser Val Gly Pro Lys Gln Ala Ser Leu Asn Gly Val Thr
6605 6610 6615
Leu Ile Gly Glu Ala Val Lys Thr Gln Phe Asn Tyr Tyr Lys Lys
6620 6625 6630
Val Asp Gly Val Val Gln Gln Leu Pro Glu Thr Tyr Phe Thr Gln
6635 6640 6645
Ser Arg Asn Leu Gln Glu Phe Lys Pro Arg Ser Gln Met Glu Ile
6650 6655 6660
Asp Phe Leu Glu Leu Ala Met Asp Glu Phe Ile Glu Arg Tyr Lys
6665 6670 6675
Leu Glu Gly Tyr Ala Phe Glu His Ile Val Tyr Gly Asp Phe Ser
6680 6685 6690
His Ser Gln Leu Gly Gly Leu His Leu Leu Ile Gly Leu Ala Lys
6695 6700 6705
Arg Phe Lys Glu Ser Pro Phe Glu Leu Glu Asp Phe Ile Pro Met
6710 6715 6720
Asp Ser Thr Val Lys Asn Tyr Phe Ile Thr Asp Ala Gln Thr Gly
6725 6730 6735
Ser Ser Lys Cys Val Cys Ser Val Ile Asp Leu Leu Leu Asp Asp
6740 6745 6750
Phe Val Glu Ile Ile Lys Ser Gln Asp Leu Ser Val Val Ser Lys
6755 6760 6765
Val Val Lys Val Thr Ile Asp Tyr Thr Glu Ile Ser Phe Met Leu
6770 6775 6780
Trp Cys Lys Asp Gly His Val Glu Thr Phe Tyr Pro Lys Leu Gln
6785 6790 6795
Ser Ser Gln Ala Trp Gln Pro Gly Val Ala Met Pro Asn Leu Tyr
6800 6805 6810
Lys Met Gln Arg Met Leu Leu Glu Lys Cys Asp Leu Gln Asn Tyr
6815 6820 6825
Gly Asp Ser Ala Thr Leu Pro Lys Gly Ile Met Met Asn Val Ala
6830 6835 6840
Lys Tyr Thr Gln Leu Cys Gln Tyr Leu Asn Thr Leu Thr Leu Ala
6845 6850 6855
Val Pro Tyr Asn Met Arg Val Ile His Phe Gly Ala Gly Ser Asp
6860 6865 6870
Lys Gly Val Ala Pro Gly Thr Ala Val Leu Arg Gln Trp Leu Pro
6875 6880 6885
Thr Gly Thr Leu Leu Val Asp Ser Asp Leu Asn Asp Phe Val Ser
6890 6895 6900
Asp Ala Asp Ser Thr Leu Ile Gly Asp Cys Ala Thr Val His Thr
6905 6910 6915
Ala Asn Lys Trp Asp Leu Ile Ile Ser Asp Met Tyr Asp Pro Lys
6920 6925 6930
Thr Lys Asn Val Thr Lys Glu Asn Asp Ser Lys Glu Gly Phe Phe
6935 6940 6945
Thr Tyr Ile Cys Gly Phe Ile Gln Gln Lys Leu Ala Leu Gly Gly
6950 6955 6960
Ser Val Ala Ile Lys Ile Thr Glu His Ser Trp Asn Ala Asp Leu
6965 6970 6975
Tyr Lys Leu Met Gly His Phe Ala Trp Trp Thr Ala Phe Val Thr
6980 6985 6990
Asn Val Asn Ala Ser Ser Ser Glu Ala Phe Leu Ile Gly Cys Asn
6995 7000 7005
Tyr Leu Gly Lys Pro Arg Glu Gln Ile Asp Gly Tyr Val Met His
7010 7015 7020
Ala Asn Tyr Ile Phe Trp Arg Asn Thr Asn Pro Ile Gln Leu Ser
7025 7030 7035
Ser Tyr Ser Leu Phe Asp Met Ser Lys Phe Pro Leu Lys Leu Arg
7040 7045 7050
Gly Thr Ala Val Met Ser Leu Lys Glu Gly Gln Ile Asn Asp Met
7055 7060 7065
Ile Leu Ser Leu Leu Ser Lys Gly Arg Leu Ile Ile Arg Glu Asn
7070 7075 7080
Asn Arg Val Val Ile Ser Ser Asp Val Leu Val Asn Asn
7085 7090 7095
<210> 426
<211> 4405
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 426
Met Glu Ser Leu Val Pro Gly Phe Asn Glu Lys Thr His Val Gln Leu
1 5 10 15
Ser Leu Pro Val Leu Gln Val Arg Asp Val Leu Val Arg Gly Phe Gly
20 25 30
Asp Ser Val Glu Glu Val Leu Ser Glu Ala Arg Gln His Leu Lys Asp
35 40 45
Gly Thr Cys Gly Leu Val Glu Val Glu Lys Gly Val Leu Pro Gln Leu
50 55 60
Glu Gln Pro Tyr Val Phe Ile Lys Arg Ser Asp Ala Arg Thr Ala Pro
65 70 75 80
His Gly His Val Met Val Glu Leu Val Ala Glu Leu Glu Gly Ile Gln
85 90 95
Tyr Gly Arg Ser Gly Glu Thr Leu Gly Val Leu Val Pro His Val Gly
100 105 110
Glu Ile Pro Val Ala Tyr Arg Lys Val Leu Leu Arg Lys Asn Gly Asn
115 120 125
Lys Gly Ala Gly Gly His Ser Tyr Gly Ala Asp Leu Lys Ser Phe Asp
130 135 140
Leu Gly Asp Glu Leu Gly Thr Asp Pro Tyr Glu Asp Phe Gln Glu Asn
145 150 155 160
Trp Asn Thr Lys His Ser Ser Gly Val Thr Arg Glu Leu Met Arg Glu
165 170 175
Leu Asn Gly Gly Ala Tyr Thr Arg Tyr Val Asp Asn Asn Phe Cys Gly
180 185 190
Pro Asp Gly Tyr Pro Leu Glu Cys Ile Lys Asp Leu Leu Ala Arg Ala
195 200 205
Gly Lys Ala Ser Cys Thr Leu Ser Glu Gln Leu Asp Phe Ile Asp Thr
210 215 220
Lys Arg Gly Val Tyr Cys Cys Arg Glu His Glu His Glu Ile Ala Trp
225 230 235 240
Tyr Thr Glu Arg Ser Glu Lys Ser Tyr Glu Leu Gln Thr Pro Phe Glu
245 250 255
Ile Lys Leu Ala Lys Lys Phe Asp Thr Phe Asn Gly Glu Cys Pro Asn
260 265 270
Phe Val Phe Pro Leu Asn Ser Ile Ile Lys Thr Ile Gln Pro Arg Val
275 280 285
Glu Lys Lys Lys Leu Asp Gly Phe Met Gly Arg Ile Arg Ser Val Tyr
290 295 300
Pro Val Ala Ser Pro Asn Glu Cys Asn Gln Met Cys Leu Ser Thr Leu
305 310 315 320
Met Lys Cys Asp His Cys Gly Glu Thr Ser Trp Gln Thr Gly Asp Phe
325 330 335
Val Lys Ala Thr Cys Glu Phe Cys Gly Thr Glu Asn Leu Thr Lys Glu
340 345 350
Gly Ala Thr Thr Cys Gly Tyr Leu Pro Gln Asn Ala Val Val Lys Ile
355 360 365
Tyr Cys Pro Ala Cys His Asn Ser Glu Val Gly Pro Glu His Ser Leu
370 375 380
Ala Glu Tyr His Asn Glu Ser Gly Leu Lys Thr Ile Leu Arg Lys Gly
385 390 395 400
Gly Arg Thr Ile Ala Phe Gly Gly Cys Val Phe Ser Tyr Val Gly Cys
405 410 415
His Asn Lys Cys Ala Tyr Trp Val Pro Arg Ala Ser Ala Asn Ile Gly
420 425 430
Cys Asn His Thr Gly Val Val Gly Glu Gly Ser Glu Gly Leu Asn Asp
435 440 445
Asn Leu Leu Glu Ile Leu Gln Lys Glu Lys Val Asn Ile Asn Ile Val
450 455 460
Gly Asp Phe Lys Leu Asn Glu Glu Ile Ala Ile Ile Leu Ala Ser Phe
465 470 475 480
Ser Ala Ser Thr Ser Ala Phe Val Glu Thr Val Lys Gly Leu Asp Tyr
485 490 495
Lys Ala Phe Lys Gln Ile Val Glu Ser Cys Gly Asn Phe Lys Val Thr
500 505 510
Lys Gly Lys Ala Lys Lys Gly Ala Trp Asn Ile Gly Glu Gln Lys Ser
515 520 525
Ile Leu Ser Pro Leu Tyr Ala Phe Ala Ser Glu Ala Ala Arg Val Val
530 535 540
Arg Ser Ile Phe Ser Arg Thr Leu Glu Thr Ala Gln Asn Ser Val Arg
545 550 555 560
Val Leu Gln Lys Ala Ala Ile Thr Ile Leu Asp Gly Ile Ser Gln Tyr
565 570 575
Ser Leu Arg Leu Ile Asp Ala Met Met Phe Thr Ser Asp Leu Ala Thr
580 585 590
Asn Asn Leu Val Val Met Ala Tyr Ile Thr Gly Gly Val Val Gln Leu
595 600 605
Thr Ser Gln Trp Leu Thr Asn Ile Phe Gly Thr Val Tyr Glu Lys Leu
610 615 620
Lys Pro Val Leu Asp Trp Leu Glu Glu Lys Phe Lys Glu Gly Val Glu
625 630 635 640
Phe Leu Arg Asp Gly Trp Glu Ile Val Lys Phe Ile Ser Thr Cys Ala
645 650 655
Cys Glu Ile Val Gly Gly Gln Ile Val Thr Cys Ala Lys Glu Ile Lys
660 665 670
Glu Ser Val Gln Thr Phe Phe Lys Leu Val Asn Lys Phe Leu Ala Leu
675 680 685
Cys Ala Asp Ser Ile Ile Ile Gly Gly Ala Lys Leu Lys Ala Leu Asn
690 695 700
Leu Gly Glu Thr Phe Val Thr His Ser Lys Gly Leu Tyr Arg Lys Cys
705 710 715 720
Val Lys Ser Arg Glu Glu Thr Gly Leu Leu Met Pro Leu Lys Ala Pro
725 730 735
Lys Glu Ile Ile Phe Leu Glu Gly Glu Thr Leu Pro Thr Glu Val Leu
740 745 750
Thr Glu Glu Val Val Leu Lys Thr Gly Asp Leu Gln Pro Leu Glu Gln
755 760 765
Pro Thr Ser Glu Ala Val Glu Ala Pro Leu Val Gly Thr Pro Val Cys
770 775 780
Ile Asn Gly Leu Met Leu Leu Glu Ile Lys Asp Thr Glu Lys Tyr Cys
785 790 795 800
Ala Leu Ala Pro Asn Met Met Val Thr Asn Asn Thr Phe Thr Leu Lys
805 810 815
Gly Gly Ala Pro Thr Lys Val Thr Phe Gly Asp Asp Thr Val Ile Glu
820 825 830
Val Gln Gly Tyr Lys Ser Val Asn Ile Thr Phe Glu Leu Asp Glu Arg
835 840 845
Ile Asp Lys Val Leu Asn Glu Lys Cys Ser Ala Tyr Thr Val Glu Leu
850 855 860
Gly Thr Glu Val Asn Glu Phe Ala Cys Val Val Ala Asp Ala Val Ile
865 870 875 880
Lys Thr Leu Gln Pro Val Ser Glu Leu Leu Thr Pro Leu Gly Ile Asp
885 890 895
Leu Asp Glu Trp Ser Met Ala Thr Tyr Tyr Leu Phe Asp Glu Ser Gly
900 905 910
Glu Phe Lys Leu Ala Ser His Met Tyr Cys Ser Phe Tyr Pro Pro Asp
915 920 925
Glu Asp Glu Glu Glu Gly Asp Cys Glu Glu Glu Glu Phe Glu Pro Ser
930 935 940
Thr Gln Tyr Glu Tyr Gly Thr Glu Asp Asp Tyr Gln Gly Lys Pro Leu
945 950 955 960
Glu Phe Gly Ala Thr Ser Ala Ala Leu Gln Pro Glu Glu Glu Gln Glu
965 970 975
Glu Asp Trp Leu Asp Asp Asp Ser Gln Gln Thr Val Gly Gln Gln Asp
980 985 990
Gly Ser Glu Asp Asn Gln Thr Thr Thr Ile Gln Thr Ile Val Glu Val
995 1000 1005
Gln Pro Gln Leu Glu Met Glu Leu Thr Pro Val Val Gln Thr Ile
1010 1015 1020
Glu Val Asn Ser Phe Ser Gly Tyr Leu Lys Leu Thr Asp Asn Val
1025 1030 1035
Tyr Ile Lys Asn Ala Asp Ile Val Glu Glu Ala Lys Lys Val Lys
1040 1045 1050
Pro Thr Val Val Val Asn Ala Ala Asn Val Tyr Leu Lys His Gly
1055 1060 1065
Gly Gly Val Ala Gly Ala Leu Asn Lys Ala Thr Asn Asn Ala Met
1070 1075 1080
Gln Val Glu Ser Asp Asp Tyr Ile Ala Thr Asn Gly Pro Leu Lys
1085 1090 1095
Val Gly Gly Ser Cys Val Leu Ser Gly His Asn Leu Ala Lys His
1100 1105 1110
Cys Leu His Val Val Gly Pro Asn Val Asn Lys Gly Glu Asp Ile
1115 1120 1125
Gln Leu Leu Lys Ser Ala Tyr Glu Asn Phe Asn Gln His Glu Val
1130 1135 1140
Leu Leu Ala Pro Leu Leu Ser Ala Gly Ile Phe Gly Ala Asp Pro
1145 1150 1155
Ile His Ser Leu Arg Val Cys Val Asp Thr Val Arg Thr Asn Val
1160 1165 1170
Tyr Leu Ala Val Phe Asp Lys Asn Leu Tyr Asp Lys Leu Val Ser
1175 1180 1185
Ser Phe Leu Glu Met Lys Ser Glu Lys Gln Val Glu Gln Lys Ile
1190 1195 1200
Ala Glu Ile Pro Lys Glu Glu Val Lys Pro Phe Ile Thr Glu Ser
1205 1210 1215
Lys Pro Ser Val Glu Gln Arg Lys Gln Asp Asp Lys Lys Ile Lys
1220 1225 1230
Ala Cys Val Glu Glu Val Thr Thr Thr Leu Glu Glu Thr Lys Phe
1235 1240 1245
Leu Thr Glu Asn Leu Leu Leu Tyr Ile Asp Ile Asn Gly Asn Leu
1250 1255 1260
His Pro Asp Ser Ala Thr Leu Val Ser Asp Ile Asp Ile Thr Phe
1265 1270 1275
Leu Lys Lys Asp Ala Pro Tyr Ile Val Gly Asp Val Val Gln Glu
1280 1285 1290
Gly Val Leu Thr Ala Val Val Ile Pro Thr Lys Lys Ala Gly Gly
1295 1300 1305
Thr Thr Glu Met Leu Ala Lys Ala Leu Arg Lys Val Pro Thr Asp
1310 1315 1320
Asn Tyr Ile Thr Thr Tyr Pro Gly Gln Gly Leu Asn Gly Tyr Thr
1325 1330 1335
Val Glu Glu Ala Lys Thr Val Leu Lys Lys Cys Lys Ser Ala Phe
1340 1345 1350
Tyr Ile Leu Pro Ser Ile Ile Ser Asn Glu Lys Gln Glu Ile Leu
1355 1360 1365
Gly Thr Val Ser Trp Asn Leu Arg Glu Met Leu Ala His Ala Glu
1370 1375 1380
Glu Thr Arg Lys Leu Met Pro Val Cys Val Glu Thr Lys Ala Ile
1385 1390 1395
Val Ser Thr Ile Gln Arg Lys Tyr Lys Gly Ile Lys Ile Gln Glu
1400 1405 1410
Gly Val Val Asp Tyr Gly Ala Arg Phe Tyr Phe Tyr Thr Ser Lys
1415 1420 1425
Thr Thr Val Ala Ser Leu Ile Asn Thr Leu Asn Asp Leu Asn Glu
1430 1435 1440
Thr Leu Val Thr Met Pro Leu Gly Tyr Val Thr His Gly Leu Asn
1445 1450 1455
Leu Glu Glu Ala Ala Arg Tyr Met Arg Ser Leu Lys Val Pro Ala
1460 1465 1470
Thr Val Ser Val Ser Ser Pro Asp Ala Val Thr Ala Tyr Asn Gly
1475 1480 1485
Tyr Leu Thr Ser Ser Ser Lys Thr Pro Glu Glu His Phe Ile Glu
1490 1495 1500
Thr Ile Ser Leu Ala Gly Ser Tyr Lys Asp Trp Ser Tyr Ser Gly
1505 1510 1515
Gln Ser Thr Gln Leu Gly Ile Glu Phe Leu Lys Arg Gly Asp Lys
1520 1525 1530
Ser Val Tyr Tyr Thr Ser Asn Pro Thr Thr Phe His Leu Asp Gly
1535 1540 1545
Glu Val Ile Thr Phe Asp Asn Leu Lys Thr Leu Leu Ser Leu Arg
1550 1555 1560
Glu Val Arg Thr Ile Lys Val Phe Thr Thr Val Asp Asn Ile Asn
1565 1570 1575
Leu His Thr Gln Val Val Asp Met Ser Met Thr Tyr Gly Gln Gln
1580 1585 1590
Phe Gly Pro Thr Tyr Leu Asp Gly Ala Asp Val Thr Lys Ile Lys
1595 1600 1605
Pro His Asn Ser His Glu Gly Lys Thr Phe Tyr Val Leu Pro Asn
1610 1615 1620
Asp Asp Thr Leu Arg Val Glu Ala Phe Glu Tyr Tyr His Thr Thr
1625 1630 1635
Asp Pro Ser Phe Leu Gly Arg Tyr Met Ser Ala Leu Asn His Thr
1640 1645 1650
Lys Lys Trp Lys Tyr Pro Gln Val Asn Gly Leu Thr Ser Ile Lys
1655 1660 1665
Trp Ala Asp Asn Asn Cys Tyr Leu Ala Thr Ala Leu Leu Thr Leu
1670 1675 1680
Gln Gln Ile Glu Leu Lys Phe Asn Pro Pro Ala Leu Gln Asp Ala
1685 1690 1695
Tyr Tyr Arg Ala Arg Ala Gly Glu Ala Ala Asn Phe Cys Ala Leu
1700 1705 1710
Ile Leu Ala Tyr Cys Asn Lys Thr Val Gly Glu Leu Gly Asp Val
1715 1720 1725
Arg Glu Thr Met Ser Tyr Leu Phe Gln His Ala Asn Leu Asp Ser
1730 1735 1740
Cys Lys Arg Val Leu Asn Val Val Cys Lys Thr Cys Gly Gln Gln
1745 1750 1755
Gln Thr Thr Leu Lys Gly Val Glu Ala Val Met Tyr Met Gly Thr
1760 1765 1770
Leu Ser Tyr Glu Gln Phe Lys Lys Gly Val Gln Ile Pro Cys Thr
1775 1780 1785
Cys Gly Lys Gln Ala Thr Lys Tyr Leu Val Gln Gln Glu Ser Pro
1790 1795 1800
Phe Val Met Met Ser Ala Pro Pro Ala Gln Tyr Glu Leu Lys His
1805 1810 1815
Gly Thr Phe Thr Cys Ala Ser Glu Tyr Thr Gly Asn Tyr Gln Cys
1820 1825 1830
Gly His Tyr Lys His Ile Thr Ser Lys Glu Thr Leu Tyr Cys Ile
1835 1840 1845
Asp Gly Ala Leu Leu Thr Lys Ser Ser Glu Tyr Lys Gly Pro Ile
1850 1855 1860
Thr Asp Val Phe Tyr Lys Glu Asn Ser Tyr Thr Thr Thr Ile Lys
1865 1870 1875
Pro Val Thr Tyr Lys Leu Asp Gly Val Val Cys Thr Glu Ile Asp
1880 1885 1890
Pro Lys Leu Asp Asn Tyr Tyr Lys Lys Asp Asn Ser Tyr Phe Thr
1895 1900 1905
Glu Gln Pro Ile Asp Leu Val Pro Asn Gln Pro Tyr Pro Asn Ala
1910 1915 1920
Ser Phe Asp Asn Phe Lys Phe Val Cys Asp Asn Ile Lys Phe Ala
1925 1930 1935
Asp Asp Leu Asn Gln Leu Thr Gly Tyr Lys Lys Pro Ala Ser Arg
1940 1945 1950
Glu Leu Lys Val Thr Phe Phe Pro Asp Leu Asn Gly Asp Val Val
1955 1960 1965
Ala Ile Asp Tyr Lys His Tyr Thr Pro Ser Phe Lys Lys Gly Ala
1970 1975 1980
Lys Leu Leu His Lys Pro Ile Val Trp His Val Asn Asn Ala Thr
1985 1990 1995
Asn Lys Ala Thr Tyr Lys Pro Asn Thr Trp Cys Ile Arg Cys Leu
2000 2005 2010
Trp Ser Thr Lys Pro Val Glu Thr Ser Asn Ser Phe Asp Val Leu
2015 2020 2025
Lys Ser Glu Asp Ala Gln Gly Met Asp Asn Leu Ala Cys Glu Asp
2030 2035 2040
Leu Lys Pro Val Ser Glu Glu Val Val Glu Asn Pro Thr Ile Gln
2045 2050 2055
Lys Asp Val Leu Glu Cys Asn Val Lys Thr Thr Glu Val Val Gly
2060 2065 2070
Asp Ile Ile Leu Lys Pro Ala Asn Asn Ser Leu Lys Ile Thr Glu
2075 2080 2085
Glu Val Gly His Thr Asp Leu Met Ala Ala Tyr Val Asp Asn Ser
2090 2095 2100
Ser Leu Thr Ile Lys Lys Pro Asn Glu Leu Ser Arg Val Leu Gly
2105 2110 2115
Leu Lys Thr Leu Ala Thr His Gly Leu Ala Ala Val Asn Ser Val
2120 2125 2130
Pro Trp Asp Thr Ile Ala Asn Tyr Ala Lys Pro Phe Leu Asn Lys
2135 2140 2145
Val Val Ser Thr Thr Thr Asn Ile Val Thr Arg Cys Leu Asn Arg
2150 2155 2160
Val Cys Thr Asn Tyr Met Pro Tyr Phe Phe Thr Leu Leu Leu Gln
2165 2170 2175
Leu Cys Thr Phe Thr Arg Ser Thr Asn Ser Arg Ile Lys Ala Ser
2180 2185 2190
Met Pro Thr Thr Ile Ala Lys Asn Thr Val Lys Ser Val Gly Lys
2195 2200 2205
Phe Cys Leu Glu Ala Ser Phe Asn Tyr Leu Lys Ser Pro Asn Phe
2210 2215 2220
Ser Lys Leu Ile Asn Ile Ile Ile Trp Phe Leu Leu Leu Ser Val
2225 2230 2235
Cys Leu Gly Ser Leu Ile Tyr Ser Thr Ala Ala Leu Gly Val Leu
2240 2245 2250
Met Ser Asn Leu Gly Met Pro Ser Tyr Cys Thr Gly Tyr Arg Glu
2255 2260 2265
Gly Tyr Leu Asn Ser Thr Asn Val Thr Ile Ala Thr Tyr Cys Thr
2270 2275 2280
Gly Ser Ile Pro Cys Ser Val Cys Leu Ser Gly Leu Asp Ser Leu
2285 2290 2295
Asp Thr Tyr Pro Ser Leu Glu Thr Ile Gln Ile Thr Ile Ser Ser
2300 2305 2310
Phe Lys Trp Asp Leu Thr Ala Phe Gly Leu Val Ala Glu Trp Phe
2315 2320 2325
Leu Ala Tyr Ile Leu Phe Thr Arg Phe Phe Tyr Val Leu Gly Leu
2330 2335 2340
Ala Ala Ile Met Gln Leu Phe Phe Ser Tyr Phe Ala Val His Phe
2345 2350 2355
Ile Ser Asn Ser Trp Leu Met Trp Leu Ile Ile Asn Leu Val Gln
2360 2365 2370
Met Ala Pro Ile Ser Ala Met Val Arg Met Tyr Ile Phe Phe Ala
2375 2380 2385
Ser Phe Tyr Tyr Val Trp Lys Ser Tyr Val His Val Val Asp Gly
2390 2395 2400
Cys Asn Ser Ser Thr Cys Met Met Cys Tyr Lys Arg Asn Arg Ala
2405 2410 2415
Thr Arg Val Glu Cys Thr Thr Ile Val Asn Gly Val Arg Arg Ser
2420 2425 2430
Phe Tyr Val Tyr Ala Asn Gly Gly Lys Gly Phe Cys Lys Leu His
2435 2440 2445
Asn Trp Asn Cys Val Asn Cys Asp Thr Phe Cys Ala Gly Ser Thr
2450 2455 2460
Phe Ile Ser Asp Glu Val Ala Arg Asp Leu Ser Leu Gln Phe Lys
2465 2470 2475
Arg Pro Ile Asn Pro Thr Asp Gln Ser Ser Tyr Ile Val Asp Ser
2480 2485 2490
Val Thr Val Lys Asn Gly Ser Ile His Leu Tyr Phe Asp Lys Ala
2495 2500 2505
Gly Gln Lys Thr Tyr Glu Arg His Ser Leu Ser His Phe Val Asn
2510 2515 2520
Leu Asp Asn Leu Arg Ala Asn Asn Thr Lys Gly Ser Leu Pro Ile
2525 2530 2535
Asn Val Ile Val Phe Asp Gly Lys Ser Lys Cys Glu Glu Ser Ser
2540 2545 2550
Ala Lys Ser Ala Ser Val Tyr Tyr Ser Gln Leu Met Cys Gln Pro
2555 2560 2565
Ile Leu Leu Leu Asp Gln Ala Leu Val Ser Asp Val Gly Asp Ser
2570 2575 2580
Ala Glu Val Ala Val Lys Met Phe Asp Ala Tyr Val Asn Thr Phe
2585 2590 2595
Ser Ser Thr Phe Asn Val Pro Met Glu Lys Leu Lys Thr Leu Val
2600 2605 2610
Ala Thr Ala Glu Ala Glu Leu Ala Lys Asn Val Ser Leu Asp Asn
2615 2620 2625
Val Leu Ser Thr Phe Ile Ser Ala Ala Arg Gln Gly Phe Val Asp
2630 2635 2640
Ser Asp Val Glu Thr Lys Asp Val Val Glu Cys Leu Lys Leu Ser
2645 2650 2655
His Gln Ser Asp Ile Glu Val Thr Gly Asp Ser Cys Asn Asn Tyr
2660 2665 2670
Met Leu Thr Tyr Asn Lys Val Glu Asn Met Thr Pro Arg Asp Leu
2675 2680 2685
Gly Ala Cys Ile Asp Cys Ser Ala Arg His Ile Asn Ala Gln Val
2690 2695 2700
Ala Lys Ser His Asn Ile Ala Leu Ile Trp Asn Val Lys Asp Phe
2705 2710 2715
Met Ser Leu Ser Glu Gln Leu Arg Lys Gln Ile Arg Ser Ala Ala
2720 2725 2730
Lys Lys Asn Asn Leu Pro Phe Lys Leu Thr Cys Ala Thr Thr Arg
2735 2740 2745
Gln Val Val Asn Val Val Thr Thr Lys Ile Ala Leu Lys Gly Gly
2750 2755 2760
Lys Ile Val Asn Asn Trp Leu Lys Gln Leu Ile Lys Val Thr Leu
2765 2770 2775
Val Phe Leu Phe Val Ala Ala Ile Phe Tyr Leu Ile Thr Pro Val
2780 2785 2790
His Val Met Ser Lys His Thr Asp Phe Ser Ser Glu Ile Ile Gly
2795 2800 2805
Tyr Lys Ala Ile Asp Gly Gly Val Thr Arg Asp Ile Ala Ser Thr
2810 2815 2820
Asp Thr Cys Phe Ala Asn Lys His Ala Asp Phe Asp Thr Trp Phe
2825 2830 2835
Ser Gln Arg Gly Gly Ser Tyr Thr Asn Asp Lys Ala Cys Pro Leu
2840 2845 2850
Ile Ala Ala Val Ile Thr Arg Glu Val Gly Phe Val Val Pro Gly
2855 2860 2865
Leu Pro Gly Thr Ile Leu Arg Thr Thr Asn Gly Asp Phe Leu His
2870 2875 2880
Phe Leu Pro Arg Val Phe Ser Ala Val Gly Asn Ile Cys Tyr Thr
2885 2890 2895
Pro Ser Lys Leu Ile Glu Tyr Thr Asp Phe Ala Thr Ser Ala Cys
2900 2905 2910
Val Leu Ala Ala Glu Cys Thr Ile Phe Lys Asp Ala Ser Gly Lys
2915 2920 2925
Pro Val Pro Tyr Cys Tyr Asp Thr Asn Val Leu Glu Gly Ser Val
2930 2935 2940
Ala Tyr Glu Ser Leu Arg Pro Asp Thr Arg Tyr Val Leu Met Asp
2945 2950 2955
Gly Ser Ile Ile Gln Phe Pro Asn Thr Tyr Leu Glu Gly Ser Val
2960 2965 2970
Arg Val Val Thr Thr Phe Asp Ser Glu Tyr Cys Arg His Gly Thr
2975 2980 2985
Cys Glu Arg Ser Glu Ala Gly Val Cys Val Ser Thr Ser Gly Arg
2990 2995 3000
Trp Val Leu Asn Asn Asp Tyr Tyr Arg Ser Leu Pro Gly Val Phe
3005 3010 3015
Cys Gly Val Asp Ala Val Asn Leu Leu Thr Asn Met Phe Thr Pro
3020 3025 3030
Leu Ile Gln Pro Ile Gly Ala Leu Asp Ile Ser Ala Ser Ile Val
3035 3040 3045
Ala Gly Gly Ile Val Ala Ile Val Val Thr Cys Leu Ala Tyr Tyr
3050 3055 3060
Phe Met Arg Phe Arg Arg Ala Phe Gly Glu Tyr Ser His Val Val
3065 3070 3075
Ala Phe Asn Thr Leu Leu Phe Leu Met Ser Phe Thr Val Leu Cys
3080 3085 3090
Leu Thr Pro Val Tyr Ser Phe Leu Pro Gly Val Tyr Ser Val Ile
3095 3100 3105
Tyr Leu Tyr Leu Thr Phe Tyr Leu Thr Asn Asp Val Ser Phe Leu
3110 3115 3120
Ala His Ile Gln Trp Met Val Met Phe Thr Pro Leu Val Pro Phe
3125 3130 3135
Trp Ile Thr Ile Ala Tyr Ile Ile Cys Ile Ser Thr Lys His Phe
3140 3145 3150
Tyr Trp Phe Phe Ser Asn Tyr Leu Lys Arg Arg Val Val Phe Asn
3155 3160 3165
Gly Val Ser Phe Ser Thr Phe Glu Glu Ala Ala Leu Cys Thr Phe
3170 3175 3180
Leu Leu Asn Lys Glu Met Tyr Leu Lys Leu Arg Ser Asp Val Leu
3185 3190 3195
Leu Pro Leu Thr Gln Tyr Asn Arg Tyr Leu Ala Leu Tyr Asn Lys
3200 3205 3210
Tyr Lys Tyr Phe Ser Gly Ala Met Asp Thr Thr Ser Tyr Arg Glu
3215 3220 3225
Ala Ala Cys Cys His Leu Ala Lys Ala Leu Asn Asp Phe Ser Asn
3230 3235 3240
Ser Gly Ser Asp Val Leu Tyr Gln Pro Pro Gln Thr Ser Ile Thr
3245 3250 3255
Ser Ala Val Leu Gln Ser Gly Phe Arg Lys Met Ala Phe Pro Ser
3260 3265 3270
Gly Lys Val Glu Gly Cys Met Val Gln Val Thr Cys Gly Thr Thr
3275 3280 3285
Thr Leu Asn Gly Leu Trp Leu Asp Asp Val Val Tyr Cys Pro Arg
3290 3295 3300
His Val Ile Cys Thr Ser Glu Asp Met Leu Asn Pro Asn Tyr Glu
3305 3310 3315
Asp Leu Leu Ile Arg Lys Ser Asn His Asn Phe Leu Val Gln Ala
3320 3325 3330
Gly Asn Val Gln Leu Arg Val Ile Gly His Ser Met Gln Asn Cys
3335 3340 3345
Val Leu Lys Leu Lys Val Asp Thr Ala Asn Pro Lys Thr Pro Lys
3350 3355 3360
Tyr Lys Phe Val Arg Ile Gln Pro Gly Gln Thr Phe Ser Val Leu
3365 3370 3375
Ala Cys Tyr Asn Gly Ser Pro Ser Gly Val Tyr Gln Cys Ala Met
3380 3385 3390
Arg Pro Asn Phe Thr Ile Lys Gly Ser Phe Leu Asn Gly Ser Cys
3395 3400 3405
Gly Ser Val Gly Phe Asn Ile Asp Tyr Asp Cys Val Ser Phe Cys
3410 3415 3420
Tyr Met His His Met Glu Leu Pro Thr Gly Val His Ala Gly Thr
3425 3430 3435
Asp Leu Glu Gly Asn Phe Tyr Gly Pro Phe Val Asp Arg Gln Thr
3440 3445 3450
Ala Gln Ala Ala Gly Thr Asp Thr Thr Ile Thr Val Asn Val Leu
3455 3460 3465
Ala Trp Leu Tyr Ala Ala Val Ile Asn Gly Asp Arg Trp Phe Leu
3470 3475 3480
Asn Arg Phe Thr Thr Thr Leu Asn Asp Phe Asn Leu Val Ala Met
3485 3490 3495
Lys Tyr Asn Tyr Glu Pro Leu Thr Gln Asp His Val Asp Ile Leu
3500 3505 3510
Gly Pro Leu Ser Ala Gln Thr Gly Ile Ala Val Leu Asp Met Cys
3515 3520 3525
Ala Ser Leu Lys Glu Leu Leu Gln Asn Gly Met Asn Gly Arg Thr
3530 3535 3540
Ile Leu Gly Ser Ala Leu Leu Glu Asp Glu Phe Thr Pro Phe Asp
3545 3550 3555
Val Val Arg Gln Cys Ser Gly Val Thr Phe Gln Ser Ala Val Lys
3560 3565 3570
Arg Thr Ile Lys Gly Thr His His Trp Leu Leu Leu Thr Ile Leu
3575 3580 3585
Thr Ser Leu Leu Val Leu Val Gln Ser Thr Gln Trp Ser Leu Phe
3590 3595 3600
Phe Phe Leu Tyr Glu Asn Ala Phe Leu Pro Phe Ala Met Gly Ile
3605 3610 3615
Ile Ala Met Ser Ala Phe Ala Met Met Phe Val Lys His Lys His
3620 3625 3630
Ala Phe Leu Cys Leu Phe Leu Leu Pro Ser Leu Ala Thr Val Ala
3635 3640 3645
Tyr Phe Asn Met Val Tyr Met Pro Ala Ser Trp Val Met Arg Ile
3650 3655 3660
Met Thr Trp Leu Asp Met Val Asp Thr Ser Leu Ser Gly Phe Lys
3665 3670 3675
Leu Lys Asp Cys Val Met Tyr Ala Ser Ala Val Val Leu Leu Ile
3680 3685 3690
Leu Met Thr Ala Arg Thr Val Tyr Asp Asp Gly Ala Arg Arg Val
3695 3700 3705
Trp Thr Leu Met Asn Val Leu Thr Leu Val Tyr Lys Val Tyr Tyr
3710 3715 3720
Gly Asn Ala Leu Asp Gln Ala Ile Ser Met Trp Ala Leu Ile Ile
3725 3730 3735
Ser Val Thr Ser Asn Tyr Ser Gly Val Val Thr Thr Val Met Phe
3740 3745 3750
Leu Ala Arg Gly Ile Val Phe Met Cys Val Glu Tyr Cys Pro Ile
3755 3760 3765
Phe Phe Ile Thr Gly Asn Thr Leu Gln Cys Ile Met Leu Val Tyr
3770 3775 3780
Cys Phe Leu Gly Tyr Phe Cys Thr Cys Tyr Phe Gly Leu Phe Cys
3785 3790 3795
Leu Leu Asn Arg Tyr Phe Arg Leu Thr Leu Gly Val Tyr Asp Tyr
3800 3805 3810
Leu Val Ser Thr Gln Glu Phe Arg Tyr Met Asn Ser Gln Gly Leu
3815 3820 3825
Leu Pro Pro Lys Asn Ser Ile Asp Ala Phe Lys Leu Asn Ile Lys
3830 3835 3840
Leu Leu Gly Val Gly Gly Lys Pro Cys Ile Lys Val Ala Thr Val
3845 3850 3855
Gln Ser Lys Met Ser Asp Val Lys Cys Thr Ser Val Val Leu Leu
3860 3865 3870
Ser Val Leu Gln Gln Leu Arg Val Glu Ser Ser Ser Lys Leu Trp
3875 3880 3885
Ala Gln Cys Val Gln Leu His Asn Asp Ile Leu Leu Ala Lys Asp
3890 3895 3900
Thr Thr Glu Ala Phe Glu Lys Met Val Ser Leu Leu Ser Val Leu
3905 3910 3915
Leu Ser Met Gln Gly Ala Val Asp Ile Asn Lys Leu Cys Glu Glu
3920 3925 3930
Met Leu Asp Asn Arg Ala Thr Leu Gln Ala Ile Ala Ser Glu Phe
3935 3940 3945
Ser Ser Leu Pro Ser Tyr Ala Ala Phe Ala Thr Ala Gln Glu Ala
3950 3955 3960
Tyr Glu Gln Ala Val Ala Asn Gly Asp Ser Glu Val Val Leu Lys
3965 3970 3975
Lys Leu Lys Lys Ser Leu Asn Val Ala Lys Ser Glu Phe Asp Arg
3980 3985 3990
Asp Ala Ala Met Gln Arg Lys Leu Glu Lys Met Ala Asp Gln Ala
3995 4000 4005
Met Thr Gln Met Tyr Lys Gln Ala Arg Ser Glu Asp Lys Arg Ala
4010 4015 4020
Lys Val Thr Ser Ala Met Gln Thr Met Leu Phe Thr Met Leu Arg
4025 4030 4035
Lys Leu Asp Asn Asp Ala Leu Asn Asn Ile Ile Asn Asn Ala Arg
4040 4045 4050
Asp Gly Cys Val Pro Leu Asn Ile Ile Pro Leu Thr Thr Ala Ala
4055 4060 4065
Lys Leu Met Val Val Ile Pro Asp Tyr Asn Thr Tyr Lys Asn Thr
4070 4075 4080
Cys Asp Gly Thr Thr Phe Thr Tyr Ala Ser Ala Leu Trp Glu Ile
4085 4090 4095
Gln Gln Val Val Asp Ala Asp Ser Lys Ile Val Gln Leu Ser Glu
4100 4105 4110
Ile Ser Met Asp Asn Ser Pro Asn Leu Ala Trp Pro Leu Ile Val
4115 4120 4125
Thr Ala Leu Arg Ala Asn Ser Ala Val Lys Leu Gln Asn Asn Glu
4130 4135 4140
Leu Ser Pro Val Ala Leu Arg Gln Met Ser Cys Ala Ala Gly Thr
4145 4150 4155
Thr Gln Thr Ala Cys Thr Asp Asp Asn Ala Leu Ala Tyr Tyr Asn
4160 4165 4170
Thr Thr Lys Gly Gly Arg Phe Val Leu Ala Leu Leu Ser Asp Leu
4175 4180 4185
Gln Asp Leu Lys Trp Ala Arg Phe Pro Lys Ser Asp Gly Thr Gly
4190 4195 4200
Thr Ile Tyr Thr Glu Leu Glu Pro Pro Cys Arg Phe Val Thr Asp
4205 4210 4215
Thr Pro Lys Gly Pro Lys Val Lys Tyr Leu Tyr Phe Ile Lys Gly
4220 4225 4230
Leu Asn Asn Leu Asn Arg Gly Met Val Leu Gly Ser Leu Ala Ala
4235 4240 4245
Thr Val Arg Leu Gln Ala Gly Asn Ala Thr Glu Val Pro Ala Asn
4250 4255 4260
Ser Thr Val Leu Ser Phe Cys Ala Phe Ala Val Asp Ala Ala Lys
4265 4270 4275
Ala Tyr Lys Asp Tyr Leu Ala Ser Gly Gly Gln Pro Ile Thr Asn
4280 4285 4290
Cys Val Lys Met Leu Cys Thr His Thr Gly Thr Gly Gln Ala Ile
4295 4300 4305
Thr Val Thr Pro Glu Ala Asn Met Asp Gln Glu Ser Phe Gly Gly
4310 4315 4320
Ala Ser Cys Cys Leu Tyr Cys Arg Cys His Ile Asp His Pro Asn
4325 4330 4335
Pro Lys Gly Phe Cys Asp Leu Lys Gly Lys Tyr Val Gln Ile Pro
4340 4345 4350
Thr Thr Cys Ala Asn Asp Pro Val Gly Phe Thr Leu Lys Asn Thr
4355 4360 4365
Val Cys Thr Val Cys Gly Met Trp Lys Gly Tyr Gly Cys Ser Cys
4370 4375 4380
Asp Gln Leu Arg Glu Pro Met Leu Gln Ser Ala Asp Ala Gln Ser
4385 4390 4395
Phe Leu Asn Gly Phe Ala Val
4400 4405
<210> 427
<211> 1273
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 427
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
1145 1150 1155
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn
1160 1165 1170
Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu
1175 1180 1185
Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu
1205 1210 1215
Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met
1220 1225 1230
Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro
1250 1255 1260
Val Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 428
<211> 275
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 428
Met Asp Leu Phe Met Arg Ile Phe Thr Ile Gly Thr Val Thr Leu Lys
1 5 10 15
Gln Gly Glu Ile Lys Asp Ala Thr Pro Ser Asp Phe Val Arg Ala Thr
20 25 30
Ala Thr Ile Pro Ile Gln Ala Ser Leu Pro Phe Gly Trp Leu Ile Val
35 40 45
Gly Val Ala Leu Leu Ala Val Phe Gln Ser Ala Ser Lys Ile Ile Thr
50 55 60
Leu Lys Lys Arg Trp Gln Leu Ala Leu Ser Lys Gly Val His Phe Val
65 70 75 80
Cys Asn Leu Leu Leu Leu Phe Val Thr Val Tyr Ser His Leu Leu Leu
85 90 95
Val Ala Ala Gly Leu Glu Ala Pro Phe Leu Tyr Leu Tyr Ala Leu Val
100 105 110
Tyr Phe Leu Gln Ser Ile Asn Phe Val Arg Ile Ile Met Arg Leu Trp
115 120 125
Leu Cys Trp Lys Cys Arg Ser Lys Asn Pro Leu Leu Tyr Asp Ala Asn
130 135 140
Tyr Phe Leu Cys Trp His Thr Asn Cys Tyr Asp Tyr Cys Ile Pro Tyr
145 150 155 160
Asn Ser Val Thr Ser Ser Ile Val Ile Thr Ser Gly Asp Gly Thr Thr
165 170 175
Ser Pro Ile Ser Glu His Asp Tyr Gln Ile Gly Gly Tyr Thr Glu Lys
180 185 190
Trp Glu Ser Gly Val Lys Asp Cys Val Val Leu His Ser Tyr Phe Thr
195 200 205
Ser Asp Tyr Tyr Gln Leu Tyr Ser Thr Gln Leu Ser Thr Asp Thr Gly
210 215 220
Val Glu His Val Thr Phe Phe Ile Tyr Asn Lys Ile Val Asp Glu Pro
225 230 235 240
Glu Glu His Val Gln Ile His Thr Ile Asp Gly Ser Ser Gly Val Val
245 250 255
Asn Pro Val Met Glu Pro Ile Tyr Asp Glu Pro Thr Thr Thr Thr Ser
260 265 270
Val Pro Leu
275
<210> 429
<211> 669
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 429
atggcagatt ccaacggtac tattaccgtt gaagagctta aaaagctcct tgaacaatgg 60
aacctagtaa taggtttcct attccttaca tggatttgtc ttctacaatt tgcctatgcc 120
aacaggaata ggtttttgta tataattaag ttaattttcc tctggctgtt atggccagta 180
actttagctt gttttgtgct tgctgctgtt tacagaataa attggatcac cggtggaatt 240
gctatcgcaa tggcttgtct tgtaggcttg atgtggctca gctacttcat tgcttctttc 300
agactgtttg cgcgtacgcg ttccatgtgg tcattcaatc cagaaactaa cattcttctc 360
aacgtgccac tccatggcac tattctgacc agaccgcttc tagaaagtga actcgtaatc 420
ggagctgtga tccttcgtgg acatcttcgt attgctggac accatctagg acgctgtgac 480
atcaaggacc tgcctaaaga aatcactgtt gctacatcac gaacgctttc ttattacaaa 540
ttgggagctt cgcagcgtgt agcaggtgac tcaggttttg ctgcatacag tcgctacagg 600
attggcaact ataaattaaa cacagaccat tccagtagca gtgacaatat tgctttgctt 660
gtacagtaa 669
<210> 430
<211> 222
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 430
Met Ala Asp Ser Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Lys Leu
1 5 10 15
Leu Glu Gln Trp Asn Leu Val Ile Gly Phe Leu Phe Leu Thr Trp Ile
20 25 30
Cys Leu Leu Gln Phe Ala Tyr Ala Asn Arg Asn Arg Phe Leu Tyr Ile
35 40 45
Ile Lys Leu Ile Phe Leu Trp Leu Leu Trp Pro Val Thr Leu Ala Cys
50 55 60
Phe Val Leu Ala Ala Val Tyr Arg Ile Asn Trp Ile Thr Gly Gly Ile
65 70 75 80
Ala Ile Ala Met Ala Cys Leu Val Gly Leu Met Trp Leu Ser Tyr Phe
85 90 95
Ile Ala Ser Phe Arg Leu Phe Ala Arg Thr Arg Ser Met Trp Ser Phe
100 105 110
Asn Pro Glu Thr Asn Ile Leu Leu Asn Val Pro Leu His Gly Thr Ile
115 120 125
Leu Thr Arg Pro Leu Leu Glu Ser Glu Leu Val Ile Gly Ala Val Ile
130 135 140
Leu Arg Gly His Leu Arg Ile Ala Gly His His Leu Gly Arg Cys Asp
145 150 155 160
Ile Lys Asp Leu Pro Lys Glu Ile Thr Val Ala Thr Ser Arg Thr Leu
165 170 175
Ser Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Ala Gly Asp Ser Gly
180 185 190
Phe Ala Ala Tyr Ser Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr
195 200 205
Asp His Ser Ser Ser Ser Asp Asn Ile Ala Leu Leu Val Gln
210 215 220
<210> 431
<211> 61
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 431
Met Phe His Leu Val Asp Phe Gln Val Thr Ile Ala Glu Ile Leu Leu
1 5 10 15
Ile Ile Met Arg Thr Phe Lys Val Ser Ile Trp Asn Leu Asp Tyr Ile
20 25 30
Thr Asn Leu Ile Ile Lys Asn Leu Ser Lys Ser Leu Thr Glu Asn Lys
35 40 45
Tyr Ser Gln Leu Asp Glu Glu Gln Pro Met Glu Ile Asp
50 55 60
<210> 432
<211> 121
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 432
Met Lys Ile Ile Leu Phe Leu Ala Leu Ile Thr Leu Ala Thr Cys Glu
1 5 10 15
Leu Tyr His Tyr Gln Glu Cys Val Arg Gly Thr Thr Val Leu Leu Lys
20 25 30
Glu Pro Cys Ser Ser Gly Thr Tyr Glu Gly Asn Ser Pro Phe His Pro
35 40 45
Leu Ala Asp Asn Lys Phe Ala Leu Thr Cys Phe Ser Thr Gln Phe Ala
50 55 60
Phe Ala Cys Pro Asp Gly Val Lys His Val Tyr Gln Leu Arg Ala Arg
65 70 75 80
Ser Val Ser Pro Lys Leu Phe Ile Arg Gln Glu Glu Val Gln Glu Leu
85 90 95
Tyr Ser Pro Ile Phe Leu Ile Val Ala Ala Ile Val Phe Ile Thr Leu
100 105 110
Cys Phe Thr Leu Lys Arg Lys Thr Glu
115 120
<210> 433
<211> 43
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 433
Met Ile Glu Leu Ser Leu Ile Asp Phe Tyr Leu Cys Phe Leu Ala Phe
1 5 10 15
Leu Leu Phe Leu Val Leu Ile Met Leu Ile Ile Phe Trp Phe Ser Leu
20 25 30
Glu Leu Gln Asp His Asn Glu Thr Cys His Ala
35 40
<210> 434
<211> 121
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 434
Met Lys Phe Leu Val Phe Leu Gly Ile Ile Thr Thr Val Ala Ala Phe
1 5 10 15
His Gln Glu Cys Ser Leu Gln Ser Cys Thr Gln His Gln Pro Tyr Val
20 25 30
Val Asp Asp Pro Cys Pro Ile His Phe Tyr Ser Lys Trp Tyr Ile Arg
35 40 45
Val Gly Ala Arg Lys Ser Ala Pro Leu Ile Glu Leu Cys Val Asp Glu
50 55 60
Ala Gly Ser Lys Ser Pro Ile Gln Tyr Ile Asp Ile Gly Asn Tyr Thr
65 70 75 80
Val Ser Cys Leu Pro Phe Thr Ile Asn Cys Gln Glu Pro Lys Leu Gly
85 90 95
Ser Leu Val Val Arg Cys Ser Phe Tyr Glu Asp Phe Leu Glu Tyr His
100 105 110
Asp Val Arg Val Val Leu Asp Phe Ile
115 120
<210> 435
<211> 419
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 435
Met Ser Asp Asn Gly Pro Gln Asn Gln Arg Asn Ala Pro Arg Ile Thr
1 5 10 15
Phe Gly Gly Pro Ser Asp Ser Thr Gly Ser Asn Gln Asn Gly Glu Arg
20 25 30
Ser Gly Ala Arg Ser Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn Asn
35 40 45
Thr Ala Ser Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Asp Leu
50 55 60
Lys Phe Pro Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Ser Pro
65 70 75 80
Asp Asp Gln Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Ile Arg Gly
85 90 95
Gly Asp Gly Lys Met Lys Asp Leu Ser Pro Arg Trp Tyr Phe Tyr Tyr
100 105 110
Leu Gly Thr Gly Pro Glu Ala Gly Leu Pro Tyr Gly Ala Asn Lys Asp
115 120 125
Gly Ile Ile Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys Asp
130 135 140
His Ile Gly Thr Arg Asn Pro Ala Asn Asn Ala Ala Ile Val Leu Gln
145 150 155 160
Leu Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly Ser
165 170 175
Arg Gly Gly Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg Asn
180 185 190
Ser Ser Arg Asn Ser Thr Pro Gly Ser Ser Lys Arg Thr Ser Pro Ala
195 200 205
Arg Met Ala Gly Asn Gly Gly Asp Ala Ala Leu Ala Leu Leu Leu Leu
210 215 220
Asp Arg Leu Asn Gln Leu Glu Ser Lys Met Ser Gly Lys Gly Gln Gln
225 230 235 240
Gln Gln Gly Gln Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser Lys
245 250 255
Lys Pro Arg Gln Lys Arg Thr Ala Thr Lys Ala Tyr Asn Val Thr Gln
260 265 270
Ala Phe Gly Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly Asp
275 280 285
Gln Glu Leu Thr Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln Ile
290 295 300
Ala Gln Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg Ile
305 310 315 320
Gly Met Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr Thr Gly Ala
325 330 335
Ile Lys Leu Asp Asp Lys Asp Pro Asn Phe Lys Asp Gln Val Ile Leu
340 345 350
Leu Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu Pro
355 360 365
Lys Lys Asp Lys Lys Lys Lys Ala Asp Glu Thr Gln Ala Leu Pro Gln
370 375 380
Arg Gln Lys Lys Gln Gln Thr Val Thr Leu Leu Pro Ala Ala Asp Leu
385 390 395 400
Asp Asp Phe Ser Lys Gln Leu Gln Gln Ser Met Ser Ser Ala Asp Ser
405 410 415
Thr Gln Ala
<210> 436
<211> 38
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 436
Met Gly Tyr Ile Asn Val Phe Ala Phe Pro Phe Thr Ile Tyr Ser Leu
1 5 10 15
Leu Leu Cys Arg Met Asn Ser Arg Asn Tyr Ile Ala Gln Val Asp Val
20 25 30
Val Asn Phe Asn Leu Thr
35
<210> 437
<211> 4405
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 437
Met Glu Ser Leu Val Pro Gly Phe Asn Glu Lys Thr His Val Gln Leu
1 5 10 15
Ser Leu Pro Val Leu Gln Val Arg Asp Val Leu Val Arg Gly Phe Gly
20 25 30
Asp Ser Val Glu Glu Val Leu Ser Glu Ala Arg Gln His Leu Lys Asp
35 40 45
Gly Thr Cys Gly Leu Val Glu Val Glu Lys Gly Val Leu Pro Gln Leu
50 55 60
Glu Gln Pro Tyr Val Phe Ile Lys Arg Ser Asp Ala Arg Thr Ala Pro
65 70 75 80
His Gly His Val Met Val Glu Leu Val Ala Glu Leu Glu Gly Ile Gln
85 90 95
Tyr Gly Arg Ser Gly Glu Thr Leu Gly Val Leu Val Pro His Val Gly
100 105 110
Glu Ile Pro Val Ala Tyr Arg Lys Val Leu Leu Arg Lys Asn Gly Asn
115 120 125
Lys Gly Ala Gly Gly His Ser Tyr Gly Ala Asp Leu Lys Ser Phe Asp
130 135 140
Leu Gly Asp Glu Leu Gly Thr Asp Pro Tyr Glu Asp Phe Gln Glu Asn
145 150 155 160
Trp Asn Thr Lys His Ser Ser Gly Val Thr Arg Glu Leu Met Arg Glu
165 170 175
Leu Asn Gly Gly Ala Tyr Thr Arg Tyr Val Asp Asn Asn Phe Cys Gly
180 185 190
Pro Asp Gly Tyr Pro Leu Glu Cys Ile Lys Asp Leu Leu Ala Arg Ala
195 200 205
Gly Lys Ala Ser Cys Thr Leu Ser Glu Gln Leu Asp Phe Ile Asp Thr
210 215 220
Lys Arg Gly Val Tyr Cys Cys Arg Glu His Glu His Glu Ile Ala Trp
225 230 235 240
Tyr Thr Glu Arg Ser Glu Lys Ser Tyr Glu Leu Gln Thr Pro Phe Glu
245 250 255
Ile Lys Leu Ala Lys Lys Phe Asp Ile Phe Asn Gly Glu Cys Pro Asn
260 265 270
Phe Val Phe Pro Leu Asn Ser Ile Ile Lys Thr Ile Gln Pro Arg Val
275 280 285
Glu Lys Lys Lys Leu Asp Gly Phe Met Gly Arg Ile Arg Ser Val Tyr
290 295 300
Pro Val Ala Ser Pro Asn Glu Cys Asn Gln Met Cys Leu Ser Thr Leu
305 310 315 320
Met Lys Cys Asp His Cys Gly Glu Thr Ser Trp Gln Thr Gly Asp Phe
325 330 335
Val Lys Ala Thr Cys Glu Phe Cys Gly Thr Glu Asn Leu Thr Lys Glu
340 345 350
Gly Ala Thr Thr Cys Gly Tyr Leu Thr Gln Asn Ala Val Val Lys Ile
355 360 365
Tyr Cys Pro Ala Cys His Asn Ser Glu Val Gly Pro Glu His Ser Leu
370 375 380
Ala Glu Tyr His Asn Glu Ser Gly Leu Lys Thr Ile Leu Arg Lys Gly
385 390 395 400
Gly Arg Thr Ile Ala Phe Gly Gly Cys Val Phe Ser Tyr Val Gly Cys
405 410 415
His Asn Lys Cys Ala Tyr Trp Val Pro Arg Ala Ser Ala Asn Ile Gly
420 425 430
Cys Asn His Thr Gly Val Val Gly Glu Gly Ser Glu Gly Leu Asn Asp
435 440 445
Asn Leu Leu Glu Ile Leu Gln Lys Glu Lys Val Asn Ile Asn Ile Val
450 455 460
Gly Asp Phe Lys Leu Asn Glu Glu Ile Ala Ile Ile Leu Ala Ser Phe
465 470 475 480
Ser Ala Ser Thr Ser Ala Phe Val Glu Thr Val Lys Gly Leu Asp Tyr
485 490 495
Lys Ala Phe Lys Gln Ile Val Glu Ser Cys Gly Asn Phe Lys Val Thr
500 505 510
Lys Gly Lys Ala Lys Lys Gly Ala Trp Asn Ile Gly Glu Gln Lys Ser
515 520 525
Ile Leu Ser Pro Leu Tyr Ala Phe Ala Ser Glu Ala Ala Arg Val Val
530 535 540
Arg Ser Ile Phe Ser Arg Thr Leu Glu Thr Ala Gln Asn Ser Val Arg
545 550 555 560
Val Leu Gln Lys Ala Ala Ile Thr Ile Leu Asp Gly Ile Ser Gln Tyr
565 570 575
Ser Leu Arg Leu Ile Asp Ala Met Met Phe Thr Ser Asp Leu Ala Thr
580 585 590
Asn Asn Leu Val Val Met Ala Tyr Ile Thr Gly Gly Val Val Gln Leu
595 600 605
Thr Ser Gln Trp Leu Thr Asn Ile Phe Gly Thr Val Tyr Glu Lys Leu
610 615 620
Lys Pro Val Leu Asp Trp Leu Glu Glu Lys Phe Lys Glu Gly Val Glu
625 630 635 640
Phe Leu Arg Asp Gly Trp Glu Ile Val Lys Phe Ile Ser Thr Cys Ala
645 650 655
Cys Glu Ile Val Gly Gly Gln Ile Val Thr Cys Ala Lys Glu Ile Lys
660 665 670
Glu Ser Val Gln Thr Phe Phe Lys Leu Val Asn Lys Phe Leu Ala Leu
675 680 685
Cys Ala Asp Ser Ile Ile Ile Gly Gly Ala Lys Leu Lys Ala Leu Asn
690 695 700
Leu Gly Glu Thr Phe Val Thr His Ser Lys Gly Leu Tyr Arg Lys Cys
705 710 715 720
Val Lys Ser Arg Glu Glu Thr Gly Leu Leu Met Pro Leu Lys Ala Pro
725 730 735
Lys Glu Ile Ile Phe Leu Glu Gly Glu Thr Leu Pro Thr Glu Val Leu
740 745 750
Thr Glu Glu Val Val Leu Lys Thr Gly Asp Leu Gln Pro Leu Glu Gln
755 760 765
Pro Thr Ser Glu Ala Val Glu Ala Pro Leu Val Gly Thr Pro Val Cys
770 775 780
Ile Asn Gly Leu Met Leu Leu Glu Ile Lys Asp Thr Glu Lys Tyr Cys
785 790 795 800
Ala Leu Ala Pro Asn Met Met Val Thr Asn Asn Thr Phe Thr Leu Lys
805 810 815
Gly Gly Ala Pro Thr Lys Val Thr Phe Gly Asp Asp Thr Val Ile Glu
820 825 830
Val Gln Gly Tyr Lys Ser Val Asn Ile Thr Phe Glu Leu Asp Glu Arg
835 840 845
Ile Asp Lys Val Leu Asn Glu Lys Cys Ser Ala Tyr Thr Val Glu Leu
850 855 860
Gly Thr Glu Val Asn Glu Phe Ala Cys Val Val Ala Asp Ala Val Ile
865 870 875 880
Lys Thr Leu Gln Pro Val Ser Glu Leu Leu Thr Pro Leu Gly Ile Asp
885 890 895
Leu Asp Glu Trp Ser Met Ala Thr Tyr Tyr Leu Phe Asp Glu Ser Gly
900 905 910
Glu Phe Lys Leu Ala Ser His Met Tyr Cys Ser Phe Tyr Pro Pro Asp
915 920 925
Glu Asp Glu Glu Glu Gly Asp Cys Glu Glu Glu Glu Phe Glu Pro Ser
930 935 940
Thr Gln Tyr Glu Tyr Gly Thr Glu Asp Asp Tyr Gln Gly Lys Pro Leu
945 950 955 960
Glu Phe Gly Ala Thr Ser Ala Ala Leu Gln Pro Glu Glu Glu Gln Glu
965 970 975
Glu Asp Trp Leu Asp Asp Asp Ser Gln Gln Thr Val Gly Gln Gln Asp
980 985 990
Gly Ser Glu Asp Asn Gln Thr Thr Thr Ile Gln Thr Ile Val Glu Val
995 1000 1005
Gln Pro Gln Leu Glu Met Glu Leu Thr Pro Val Val Gln Thr Ile
1010 1015 1020
Glu Val Asn Ser Phe Ser Gly Tyr Leu Lys Leu Thr Asp Asn Val
1025 1030 1035
Tyr Ile Lys Asn Ala Asp Ile Val Glu Glu Ala Lys Lys Val Lys
1040 1045 1050
Pro Thr Val Val Val Asn Ala Ala Asn Val Tyr Leu Lys His Gly
1055 1060 1065
Gly Gly Val Ala Gly Ala Leu Asn Lys Ala Thr Asn Asn Ala Met
1070 1075 1080
Gln Val Glu Ser Asp Asp Tyr Ile Ala Thr Asn Gly Pro Leu Lys
1085 1090 1095
Val Gly Gly Ser Cys Val Leu Ser Gly His Asn Leu Ala Lys His
1100 1105 1110
Cys Leu His Val Val Gly Pro Asn Val Asn Lys Gly Glu Asp Ile
1115 1120 1125
Gln Leu Leu Lys Ser Ala Tyr Glu Asn Phe Asn Gln His Glu Val
1130 1135 1140
Leu Leu Ala Pro Leu Leu Ser Ala Gly Ile Phe Gly Ala Asp Pro
1145 1150 1155
Ile His Ser Leu Arg Val Cys Val Asp Thr Val Arg Thr Asn Val
1160 1165 1170
Tyr Leu Ala Val Phe Asp Lys Asn Leu Tyr Asp Lys Leu Val Ser
1175 1180 1185
Ser Phe Leu Glu Met Lys Ser Glu Lys Gln Val Glu Gln Lys Ile
1190 1195 1200
Ala Glu Ile Pro Lys Glu Glu Val Lys Pro Phe Ile Thr Glu Ser
1205 1210 1215
Lys Pro Ser Val Glu Gln Arg Lys Gln Asp Asp Lys Lys Ile Lys
1220 1225 1230
Ala Cys Val Glu Glu Val Thr Thr Thr Leu Glu Glu Thr Lys Phe
1235 1240 1245
Leu Thr Glu Asn Leu Leu Leu Tyr Ile Asp Ile Asn Gly Asn Leu
1250 1255 1260
His Pro Asp Ser Ala Thr Leu Val Ser Asp Ile Asp Ile Thr Phe
1265 1270 1275
Leu Lys Lys Asp Ala Pro Tyr Ile Val Gly Asp Val Val Gln Glu
1280 1285 1290
Gly Val Leu Thr Ala Val Val Ile Pro Thr Lys Lys Ala Gly Gly
1295 1300 1305
Thr Thr Glu Met Leu Ala Lys Ala Leu Arg Lys Val Pro Thr Asp
1310 1315 1320
Asn Tyr Ile Thr Thr Tyr Pro Gly Gln Gly Leu Asn Gly Tyr Thr
1325 1330 1335
Val Glu Glu Ala Lys Thr Val Leu Lys Lys Cys Lys Ser Ala Phe
1340 1345 1350
Tyr Ile Leu Pro Ser Ile Ile Ser Asn Glu Lys Gln Glu Ile Leu
1355 1360 1365
Gly Thr Val Ser Trp Asn Leu Arg Glu Met Leu Ala His Ala Glu
1370 1375 1380
Glu Thr Arg Lys Leu Met Pro Val Cys Val Glu Thr Lys Ala Ile
1385 1390 1395
Val Ser Thr Ile Gln Arg Lys Tyr Lys Gly Ile Lys Ile Gln Glu
1400 1405 1410
Gly Val Val Asp Tyr Gly Ala Arg Phe Tyr Phe Tyr Thr Ser Lys
1415 1420 1425
Thr Thr Val Ala Ser Leu Ile Asn Thr Leu Asn Asp Leu Asn Glu
1430 1435 1440
Thr Leu Val Thr Met Pro Leu Gly Tyr Val Thr His Gly Leu Asn
1445 1450 1455
Leu Glu Glu Ala Ala Arg Tyr Met Arg Ser Leu Lys Val Pro Ala
1460 1465 1470
Thr Val Ser Val Ser Ser Pro Asp Ala Val Thr Ala Tyr Asn Gly
1475 1480 1485
Tyr Leu Thr Ser Ser Ser Lys Thr Pro Glu Glu His Phe Ile Glu
1490 1495 1500
Thr Ile Ser Leu Ala Gly Ser Tyr Lys Asp Trp Ser Tyr Ser Gly
1505 1510 1515
Gln Ser Thr Gln Leu Gly Ile Glu Phe Leu Lys Arg Gly Asp Lys
1520 1525 1530
Ser Val Tyr Tyr Thr Ser Asn Pro Thr Thr Phe His Leu Asp Gly
1535 1540 1545
Glu Val Ile Thr Phe Asp Asn Leu Lys Thr Leu Leu Ser Leu Arg
1550 1555 1560
Glu Val Arg Thr Ile Lys Val Phe Thr Thr Val Asp Asn Ile Asn
1565 1570 1575
Leu His Thr Gln Val Val Asp Met Ser Met Thr Tyr Gly Gln Gln
1580 1585 1590
Phe Gly Pro Thr Tyr Leu Asp Gly Ala Asp Val Thr Lys Ile Lys
1595 1600 1605
Pro His Asn Ser His Glu Gly Lys Thr Phe Tyr Val Leu Pro Asn
1610 1615 1620
Asp Asp Thr Leu Arg Val Glu Ala Phe Glu Tyr Tyr His Thr Thr
1625 1630 1635
Asp Pro Ser Phe Leu Gly Arg Tyr Met Ser Ala Leu Asn His Thr
1640 1645 1650
Lys Lys Trp Lys Tyr Pro Gln Val Asn Gly Leu Thr Ser Ile Lys
1655 1660 1665
Trp Ala Asp Asn Asn Cys Tyr Leu Ala Thr Ala Leu Leu Thr Leu
1670 1675 1680
Gln Gln Ile Glu Leu Lys Phe Asn Pro Pro Ala Leu Gln Asp Ala
1685 1690 1695
Tyr Tyr Arg Ala Arg Ala Gly Glu Ala Ala Asn Phe Cys Ala Leu
1700 1705 1710
Ile Leu Ala Tyr Cys Asn Lys Thr Val Gly Glu Leu Gly Asp Val
1715 1720 1725
Arg Glu Thr Met Ser Tyr Leu Phe Gln His Ala Asn Leu Asp Ser
1730 1735 1740
Cys Lys Arg Val Leu Asn Val Val Cys Lys Thr Cys Gly Gln Gln
1745 1750 1755
Gln Thr Thr Leu Lys Gly Val Glu Ala Val Met Tyr Met Gly Thr
1760 1765 1770
Leu Ser Tyr Glu Gln Phe Lys Lys Gly Val Gln Ile Pro Cys Thr
1775 1780 1785
Cys Gly Lys Gln Ala Thr Lys Tyr Leu Val Gln Gln Glu Ser Pro
1790 1795 1800
Phe Val Met Met Ser Ala Pro Pro Ala Gln Tyr Glu Leu Lys His
1805 1810 1815
Gly Thr Phe Thr Cys Ala Ser Glu Tyr Ala Gly Asn Tyr Gln Cys
1820 1825 1830
Gly His Tyr Lys His Ile Thr Ser Lys Glu Thr Leu Tyr Cys Ile
1835 1840 1845
Asp Gly Ala Leu Leu Thr Lys Ser Ser Glu Tyr Lys Gly Pro Ile
1850 1855 1860
Thr Asp Val Phe Tyr Lys Glu Asn Ser Tyr Thr Thr Thr Ile Lys
1865 1870 1875
Pro Val Thr Tyr Lys Leu Asp Gly Val Val Cys Thr Glu Ile Asp
1880 1885 1890
Pro Lys Leu Asp Asn Tyr Tyr Lys Lys Asp Asn Ser Tyr Phe Thr
1895 1900 1905
Glu Gln Pro Ile Asp Leu Val Pro Asn Gln Pro Tyr Pro Asn Ala
1910 1915 1920
Ser Phe Asp Asn Phe Lys Phe Val Cys Asp Asn Ile Lys Phe Ala
1925 1930 1935
Asp Asp Leu Asn Gln Leu Thr Gly Tyr Lys Lys Pro Ala Ser Arg
1940 1945 1950
Glu Leu Lys Val Thr Phe Phe Pro Asp Leu Asn Gly Asp Val Val
1955 1960 1965
Ala Ile Asp Tyr Lys His Tyr Thr Pro Ser Phe Lys Lys Gly Ala
1970 1975 1980
Lys Leu Leu His Lys Pro Ile Val Trp His Val Asn Asn Ala Thr
1985 1990 1995
Asn Lys Ala Thr Tyr Lys Pro Asn Thr Trp Cys Ile Arg Cys Leu
2000 2005 2010
Trp Ser Thr Lys Pro Val Glu Thr Ser Asn Ser Phe Asp Val Leu
2015 2020 2025
Lys Ser Glu Asp Ala Gln Gly Met Asp Asn Leu Ala Cys Glu Asp
2030 2035 2040
Leu Lys Pro Val Ser Glu Glu Val Val Glu Asn Pro Thr Ile Gln
2045 2050 2055
Lys Asp Val Leu Glu Cys Asn Val Lys Thr Thr Glu Val Val Gly
2060 2065 2070
Asp Ile Ile Leu Lys Pro Ala Asn Asn Ser Leu Lys Ile Thr Glu
2075 2080 2085
Glu Val Gly His Thr Asp Leu Met Ala Ala Tyr Val Asp Asn Ser
2090 2095 2100
Ser Leu Thr Ile Lys Lys Pro Asn Glu Leu Ser Arg Val Leu Gly
2105 2110 2115
Leu Lys Thr Leu Ala Thr His Gly Leu Ala Ala Val Asn Ser Val
2120 2125 2130
Pro Trp Asp Thr Ile Ala Asn Tyr Ala Lys Pro Phe Leu Asn Lys
2135 2140 2145
Val Val Ser Thr Thr Thr Asn Ile Val Thr Arg Cys Leu Asn Arg
2150 2155 2160
Val Cys Thr Asn Tyr Met Pro Tyr Phe Phe Thr Leu Leu Leu Gln
2165 2170 2175
Leu Cys Thr Phe Thr Arg Ser Thr Asn Ser Arg Ile Lys Ala Ser
2180 2185 2190
Met Pro Thr Thr Ile Ala Lys Asn Thr Val Lys Ser Val Gly Lys
2195 2200 2205
Phe Cys Leu Glu Ala Ser Phe Asn Tyr Leu Lys Ser Pro Asn Phe
2210 2215 2220
Ser Lys Leu Ile Asn Ile Ile Ile Trp Phe Leu Leu Leu Ser Val
2225 2230 2235
Cys Leu Gly Ser Leu Ile Tyr Ser Thr Ala Ala Leu Gly Val Leu
2240 2245 2250
Met Ser Asn Leu Gly Met Pro Ser Tyr Cys Thr Gly Tyr Arg Glu
2255 2260 2265
Gly Tyr Leu Asn Ser Thr Asn Val Thr Ile Ala Thr Tyr Cys Thr
2270 2275 2280
Gly Ser Ile Pro Cys Ser Val Cys Leu Ser Gly Leu Asp Ser Leu
2285 2290 2295
Asp Thr Tyr Pro Ser Leu Glu Thr Ile Gln Ile Thr Ile Ser Ser
2300 2305 2310
Phe Lys Trp Asp Leu Thr Ala Phe Gly Leu Val Ala Glu Trp Phe
2315 2320 2325
Leu Ala Tyr Ile Leu Phe Thr Arg Phe Phe Tyr Val Leu Gly Leu
2330 2335 2340
Ala Ala Ile Met Gln Leu Phe Phe Ser Tyr Phe Ala Val His Phe
2345 2350 2355
Ile Ser Asn Ser Trp Leu Met Trp Leu Ile Ile Asn Leu Val Gln
2360 2365 2370
Met Ala Pro Ile Ser Ala Met Val Arg Met Tyr Ile Phe Phe Ala
2375 2380 2385
Ser Phe Tyr Tyr Val Trp Lys Ser Tyr Val His Val Val Asp Gly
2390 2395 2400
Cys Asn Ser Ser Thr Cys Met Met Cys Tyr Lys Arg Asn Arg Ala
2405 2410 2415
Thr Arg Val Glu Cys Thr Thr Ile Val Asn Gly Val Arg Arg Ser
2420 2425 2430
Phe Tyr Val Tyr Ala Asn Gly Gly Lys Gly Phe Cys Lys Leu His
2435 2440 2445
Asn Trp Asn Cys Val Asn Cys Asp Thr Phe Cys Ala Gly Ser Thr
2450 2455 2460
Phe Ile Ser Asp Glu Val Ala Arg Asp Leu Ser Leu Gln Phe Lys
2465 2470 2475
Arg Pro Ile Asn Pro Thr Asp Gln Ser Ser Tyr Ile Val Asp Ser
2480 2485 2490
Val Thr Val Lys Asn Gly Ser Ile His Leu Tyr Phe Asp Lys Ala
2495 2500 2505
Gly Gln Lys Thr Tyr Glu Arg His Ser Leu Ser His Phe Val Asn
2510 2515 2520
Leu Asp Asn Leu Arg Ala Asn Asn Thr Lys Gly Ser Leu Pro Ile
2525 2530 2535
Asn Val Ile Val Phe Asp Gly Lys Ser Lys Cys Glu Glu Ser Ser
2540 2545 2550
Ala Lys Ser Ala Ser Val Tyr Tyr Ser Gln Leu Met Cys Gln Pro
2555 2560 2565
Ile Leu Leu Leu Asp Gln Ala Leu Val Ser Asp Val Gly Asp Ser
2570 2575 2580
Ala Glu Val Ala Val Lys Met Phe Asp Ala Tyr Val Asn Thr Phe
2585 2590 2595
Ser Ser Thr Phe Asn Val Pro Met Glu Lys Leu Lys Thr Leu Val
2600 2605 2610
Ala Thr Ala Glu Ala Glu Leu Ala Lys Asn Val Ser Leu Asp Asn
2615 2620 2625
Val Leu Ser Thr Phe Ile Ser Ala Ala Arg Gln Gly Phe Val Asp
2630 2635 2640
Ser Asp Val Glu Thr Lys Asp Val Val Glu Cys Leu Lys Leu Ser
2645 2650 2655
His Gln Ser Asp Ile Glu Val Thr Gly Asp Ser Cys Asn Asn Tyr
2660 2665 2670
Met Leu Thr Tyr Asn Lys Val Glu Asn Met Thr Pro Arg Asp Leu
2675 2680 2685
Gly Ala Cys Ile Asp Cys Ser Ala Arg His Ile Asn Ala Gln Val
2690 2695 2700
Ala Lys Ser His Asn Ile Ala Leu Ile Trp Asn Val Lys Asp Phe
2705 2710 2715
Met Ser Leu Ser Glu Gln Leu Arg Lys Gln Ile Arg Ser Ala Ala
2720 2725 2730
Lys Lys Asn Asn Leu Pro Phe Lys Leu Thr Cys Ala Thr Thr Arg
2735 2740 2745
Gln Val Val Asn Val Val Thr Thr Lys Ile Ala Leu Lys Gly Gly
2750 2755 2760
Lys Ile Val Asn Asn Trp Leu Lys Gln Leu Ile Lys Val Thr Leu
2765 2770 2775
Val Phe Leu Phe Val Ala Ala Ile Phe Tyr Leu Ile Thr Pro Val
2780 2785 2790
His Val Met Ser Lys His Thr Asp Phe Ser Ser Glu Ile Ile Gly
2795 2800 2805
Tyr Lys Ala Ile Asp Gly Gly Val Thr Arg Asp Ile Ala Ser Thr
2810 2815 2820
Asp Thr Cys Phe Ala Asn Lys His Ala Asp Phe Asp Thr Trp Phe
2825 2830 2835
Ser Gln Arg Gly Gly Ser Tyr Thr Asn Asp Lys Ala Cys Pro Leu
2840 2845 2850
Ile Ala Ala Val Ile Thr Arg Glu Val Gly Phe Val Val Pro Gly
2855 2860 2865
Leu Pro Gly Thr Ile Leu Arg Thr Thr Asn Gly Asp Phe Leu His
2870 2875 2880
Phe Leu Pro Arg Val Phe Ser Ala Val Gly Asn Ile Cys Tyr Thr
2885 2890 2895
Pro Ser Lys Leu Ile Glu Tyr Thr Asp Phe Ala Thr Ser Ala Cys
2900 2905 2910
Val Leu Ala Ala Glu Cys Thr Ile Phe Lys Asp Ala Ser Gly Lys
2915 2920 2925
Pro Val Pro Tyr Cys Tyr Asp Thr Asn Val Leu Glu Gly Ser Val
2930 2935 2940
Ala Tyr Glu Ser Leu Arg Pro Asp Thr Arg Tyr Val Leu Met Asp
2945 2950 2955
Gly Ser Ile Ile Gln Phe Pro Asn Thr Tyr Leu Glu Gly Ser Val
2960 2965 2970
Arg Val Val Thr Thr Phe Asp Ser Glu Tyr Cys Arg His Gly Thr
2975 2980 2985
Cys Glu Arg Ser Glu Ala Gly Val Cys Val Ser Thr Ser Gly Arg
2990 2995 3000
Trp Val Leu Asn Asn Asp Tyr Tyr Arg Ser Leu Pro Gly Val Phe
3005 3010 3015
Cys Gly Val Asp Ala Val Asn Leu Leu Thr Asn Met Phe Thr Pro
3020 3025 3030
Leu Ile Gln Pro Ile Gly Ala Leu Asp Ile Ser Ala Ser Ile Val
3035 3040 3045
Ala Gly Gly Ile Val Ala Ile Val Val Thr Cys Leu Ala Tyr Tyr
3050 3055 3060
Phe Met Arg Phe Arg Arg Ala Phe Gly Glu Tyr Ser His Val Val
3065 3070 3075
Ala Phe Asn Thr Leu Leu Phe Leu Met Ser Phe Thr Val Leu Cys
3080 3085 3090
Leu Thr Pro Val Tyr Ser Phe Leu Pro Gly Val Tyr Ser Val Ile
3095 3100 3105
Tyr Leu Tyr Leu Thr Phe Tyr Leu Thr Asn Asp Val Ser Phe Leu
3110 3115 3120
Ala His Ile Gln Trp Met Val Met Phe Thr Pro Leu Val Pro Phe
3125 3130 3135
Trp Ile Thr Ile Ala Tyr Ile Ile Cys Ile Ser Thr Lys His Phe
3140 3145 3150
Tyr Trp Phe Phe Ser Asn Tyr Leu Lys Arg Arg Val Val Phe Asn
3155 3160 3165
Gly Val Ser Phe Ser Thr Phe Glu Glu Ala Ala Leu Cys Thr Phe
3170 3175 3180
Leu Leu Asn Lys Glu Met Tyr Leu Lys Leu Arg Ser Asp Val Leu
3185 3190 3195
Leu Pro Leu Thr Gln Tyr Asn Arg Tyr Leu Ala Leu Tyr Asn Lys
3200 3205 3210
Tyr Lys Tyr Phe Ser Gly Ala Met Asp Thr Thr Ser Tyr Arg Glu
3215 3220 3225
Ala Ala Cys Cys His Leu Ala Lys Ala Leu Asn Asp Phe Ser Asn
3230 3235 3240
Ser Gly Ser Asp Val Leu Tyr Gln Pro Pro Gln Thr Ser Ile Thr
3245 3250 3255
Ser Ala Val Leu Gln Ser Gly Phe Arg Lys Met Ala Phe Pro Ser
3260 3265 3270
Gly Lys Val Glu Gly Cys Met Val Gln Val Thr Cys Gly Thr Thr
3275 3280 3285
Thr Leu Asn Gly Leu Trp Leu Asp Asp Val Val Tyr Cys Pro Arg
3290 3295 3300
His Val Ile Cys Thr Ser Glu Asp Met Leu Asn Pro Asn Tyr Glu
3305 3310 3315
Asp Leu Leu Ile Arg Lys Ser Asn His Asn Phe Leu Val Gln Ala
3320 3325 3330
Gly Asn Val Gln Leu Arg Val Ile Gly His Ser Met Gln Asn Cys
3335 3340 3345
Val Leu Lys Leu Lys Val Asp Thr Ala Asn Pro Lys Thr Pro Lys
3350 3355 3360
Tyr Lys Phe Val Arg Ile Gln Pro Gly Gln Thr Phe Ser Val Leu
3365 3370 3375
Ala Cys Tyr Asn Gly Ser Pro Ser Gly Val Tyr Gln Cys Ala Met
3380 3385 3390
Arg Pro Asn Phe Thr Ile Lys Gly Ser Phe Leu Asn Gly Ser Cys
3395 3400 3405
Gly Ser Val Gly Phe Asn Ile Asp Tyr Asp Cys Val Ser Phe Cys
3410 3415 3420
Tyr Met His His Met Glu Leu Pro Thr Gly Val His Ala Gly Thr
3425 3430 3435
Asp Leu Glu Gly Asn Phe Tyr Gly Pro Phe Val Asp Arg Gln Thr
3440 3445 3450
Ala Gln Ala Ala Gly Thr Asp Thr Thr Ile Thr Val Asn Val Leu
3455 3460 3465
Ala Trp Leu Tyr Ala Ala Val Ile Asn Gly Asp Arg Trp Phe Leu
3470 3475 3480
Asn Arg Phe Thr Thr Thr Leu Asn Asp Phe Asn Leu Val Ala Met
3485 3490 3495
Lys Tyr Asn Tyr Glu Pro Leu Thr Gln Asp His Val Asp Ile Leu
3500 3505 3510
Gly Pro Leu Ser Ala Gln Thr Gly Ile Ala Val Leu Asp Met Cys
3515 3520 3525
Ala Ser Leu Lys Glu Leu Leu Gln Asn Gly Met Asn Gly Arg Thr
3530 3535 3540
Ile Leu Gly Ser Ala Leu Leu Glu Asp Glu Phe Thr Pro Phe Asp
3545 3550 3555
Val Val Arg Gln Cys Ser Gly Val Thr Phe Gln Ser Ala Val Lys
3560 3565 3570
Arg Thr Ile Lys Gly Thr His His Trp Leu Leu Leu Thr Ile Leu
3575 3580 3585
Thr Ser Leu Leu Val Leu Val Gln Ser Thr Gln Trp Ser Leu Phe
3590 3595 3600
Phe Phe Leu Tyr Glu Asn Ala Phe Leu Pro Phe Ala Met Gly Ile
3605 3610 3615
Ile Ala Met Ser Ala Phe Ala Met Met Phe Val Lys His Lys His
3620 3625 3630
Ala Phe Leu Cys Leu Phe Leu Leu Pro Ser Leu Ala Thr Val Ala
3635 3640 3645
Tyr Phe Asn Met Val Tyr Met Pro Ala Ser Trp Val Met Arg Ile
3650 3655 3660
Met Thr Trp Leu Asp Met Val Asp Thr Ser Leu Ser Gly Phe Lys
3665 3670 3675
Leu Lys Asp Cys Val Met Tyr Ala Ser Ala Val Val Leu Leu Ile
3680 3685 3690
Leu Met Thr Ala Arg Thr Val Tyr Asp Asp Gly Ala Arg Arg Val
3695 3700 3705
Trp Thr Leu Met Asn Val Leu Thr Leu Val Tyr Lys Val Tyr Tyr
3710 3715 3720
Gly Asn Ala Leu Asp Gln Ala Ile Ser Met Trp Ala Leu Ile Ile
3725 3730 3735
Ser Val Thr Ser Asn Tyr Ser Gly Val Val Thr Thr Val Met Phe
3740 3745 3750
Leu Ala Arg Gly Ile Val Phe Met Cys Val Glu Tyr Cys Pro Ile
3755 3760 3765
Phe Phe Ile Thr Gly Asn Thr Leu Gln Cys Ile Met Leu Val Tyr
3770 3775 3780
Cys Phe Leu Gly Tyr Phe Cys Thr Cys Tyr Phe Gly Leu Phe Cys
3785 3790 3795
Leu Leu Asn Arg Tyr Phe Arg Leu Thr Leu Gly Val Tyr Asp Tyr
3800 3805 3810
Leu Val Ser Thr Gln Glu Phe Arg Tyr Met Asn Ser Gln Gly Leu
3815 3820 3825
Leu Pro Pro Lys Asn Ser Ile Asp Ala Phe Lys Leu Asn Ile Lys
3830 3835 3840
Leu Leu Gly Val Gly Gly Lys Pro Cys Ile Lys Val Ala Thr Val
3845 3850 3855
Gln Ser Lys Met Ser Asp Val Lys Cys Thr Ser Val Val Leu Leu
3860 3865 3870
Ser Val Leu Gln Gln Leu Arg Val Glu Ser Ser Ser Lys Leu Trp
3875 3880 3885
Ala Gln Cys Val Gln Leu His Asn Asp Ile Leu Leu Ala Lys Asp
3890 3895 3900
Thr Thr Glu Ala Phe Glu Lys Met Val Ser Leu Leu Ser Val Leu
3905 3910 3915
Leu Ser Met Gln Gly Ala Val Asp Ile Asn Lys Leu Cys Glu Glu
3920 3925 3930
Met Leu Asp Asn Arg Ala Thr Leu Gln Ala Ile Ala Ser Glu Phe
3935 3940 3945
Ser Ser Leu Pro Ser Tyr Ala Ala Phe Ala Thr Ala Gln Glu Ala
3950 3955 3960
Tyr Glu Gln Ala Val Ala Asn Gly Asp Ser Glu Val Val Leu Lys
3965 3970 3975
Lys Leu Lys Lys Ser Leu Asn Val Ala Lys Ser Glu Phe Asp Arg
3980 3985 3990
Asp Ala Ala Met Gln Arg Lys Leu Glu Lys Met Ala Asp Gln Ala
3995 4000 4005
Met Thr Gln Met Tyr Lys Gln Ala Arg Ser Glu Asp Lys Arg Ala
4010 4015 4020
Lys Val Thr Ser Ala Met Gln Thr Met Leu Phe Thr Met Leu Arg
4025 4030 4035
Lys Leu Asp Asn Asp Ala Leu Asn Asn Ile Ile Asn Asn Ala Arg
4040 4045 4050
Asp Gly Cys Val Pro Leu Asn Ile Ile Pro Leu Thr Thr Ala Ala
4055 4060 4065
Lys Leu Met Val Val Ile Pro Asp Tyr Asn Thr Tyr Lys Asn Thr
4070 4075 4080
Cys Asp Gly Thr Thr Phe Thr Tyr Ala Ser Ala Leu Trp Glu Ile
4085 4090 4095
Gln Gln Val Val Asp Ala Asp Ser Lys Ile Val Gln Leu Ser Glu
4100 4105 4110
Ile Ser Met Asp Asn Ser Pro Asn Leu Ala Trp Pro Leu Ile Val
4115 4120 4125
Thr Ala Leu Arg Ala Asn Ser Ala Val Lys Leu Gln Asn Asn Glu
4130 4135 4140
Leu Ser Pro Val Ala Leu Arg Gln Met Ser Cys Ala Ala Gly Thr
4145 4150 4155
Thr Gln Thr Ala Cys Thr Asp Asp Asn Ala Leu Ala Tyr Tyr Asn
4160 4165 4170
Thr Thr Lys Gly Gly Arg Phe Val Leu Ala Leu Leu Ser Asp Leu
4175 4180 4185
Gln Asp Leu Lys Trp Ala Arg Phe Pro Lys Ser Asp Gly Thr Gly
4190 4195 4200
Thr Ile Tyr Thr Glu Leu Glu Pro Pro Cys Arg Phe Val Thr Asp
4205 4210 4215
Thr Pro Lys Gly Pro Lys Val Lys Tyr Leu Tyr Phe Ile Lys Gly
4220 4225 4230
Leu Asn Asn Leu Asn Arg Gly Met Val Leu Gly Ser Leu Ala Ala
4235 4240 4245
Thr Val Arg Leu Gln Ala Gly Asn Ala Thr Glu Val Pro Ala Asn
4250 4255 4260
Ser Thr Val Leu Ser Phe Cys Ala Phe Ala Val Asp Ala Ala Lys
4265 4270 4275
Ala Tyr Lys Asp Tyr Leu Ala Ser Gly Gly Gln Pro Ile Thr Asn
4280 4285 4290
Cys Val Lys Met Leu Cys Thr His Thr Gly Thr Gly Gln Ala Ile
4295 4300 4305
Thr Val Thr Pro Glu Ala Asn Met Asp Gln Glu Ser Phe Gly Gly
4310 4315 4320
Ala Ser Cys Cys Leu Tyr Cys Arg Cys His Ile Asp His Pro Asn
4325 4330 4335
Pro Lys Gly Phe Cys Asp Leu Lys Gly Lys Tyr Val Gln Ile Pro
4340 4345 4350
Thr Thr Cys Val Asn Asp Pro Val Gly Phe Thr Leu Lys Asn Thr
4355 4360 4365
Val Cys Thr Val Cys Gly Met Trp Lys Gly Tyr Gly Cys Ser Cys
4370 4375 4380
Asp Gln Leu Arg Glu Pro Met Leu Gln Ser Ala Asp Ala Gln Ser
4385 4390 4395
Phe Leu Asn Gly Phe Ala Val
4400 4405
<210> 438
<211> 1271
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 438
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp Asn Pro
65 70 75 80
Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu Lys Ser
85 90 95
Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser Lys Thr
100 105 110
Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile Lys Val
115 120 125
Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr Tyr His
130 135 140
Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr Ser Ser
145 150 155 160
Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met Asp
165 170 175
Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val Phe
180 185 190
Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro Ile
195 200 205
Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu
210 215 220
Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu
225 230 235 240
Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp
245 250 255
Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr
260 265 270
Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp
275 280 285
Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe
290 295 300
Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro
305 310 315 320
Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe
325 330 335
Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn
340 345 350
Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn
355 360 365
Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys
370 375 380
Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile
385 390 395 400
Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile
405 410 415
Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile
420 425 430
Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn
435 440 445
Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg
450 455 460
Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly
465 470 475 480
Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln
485 490 495
Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser
500 505 510
Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser
515 520 525
Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu
530 535 540
Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe
545 550 555 560
Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp
565 570 575
Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly
580 585 590
Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val
595 600 605
Leu Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala
610 615 620
Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val
625 630 635 640
Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn
645 650 655
Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr
660 665 670
Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala Ser Gln
675 680 685
Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala
690 695 700
Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val
705 710 715 720
Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys
725 730 735
Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu
740 745 750
Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile
755 760 765
Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys
770 775 780
Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe
785 790 795 800
Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile
805 810 815
Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile
820 825 830
Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile
835 840 845
Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr
850 855 860
Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile
865 870 875 880
Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe
885 890 895
Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn
900 905 910
Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala
915 920 925
Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly
930 935 940
Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu
945 950 955 960
Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn
965 970 975
Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp
980 985 990
Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln
995 1000 1005
Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala
1010 1015 1020
Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
1025 1030 1035
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser
1040 1045 1050
Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala
1055 1060 1065
Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly
1070 1075 1080
Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr
1085 1090 1095
His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile
1100 1105 1110
Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile
1115 1120 1125
Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu
1130 1135 1140
Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr
1145 1150 1155
Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser
1160 1165 1170
Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala
1175 1180 1185
Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys
1190 1195 1200
Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly Phe
1205 1210 1215
Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys
1220 1225 1230
Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys
1235 1240 1245
Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu
1250 1255 1260
Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 439
<211> 275
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 439
Met Asp Leu Phe Met Arg Ile Phe Thr Ile Gly Thr Val Thr Leu Lys
1 5 10 15
Gln Gly Glu Ile Lys Asp Ala Thr Pro Ser Asp Phe Val Arg Ala Thr
20 25 30
Ala Thr Ile Pro Ile Gln Ala Ser Leu Pro Phe Gly Trp Leu Ile Val
35 40 45
Gly Val Ala Leu Leu Ala Val Phe His Ser Ala Ser Lys Ile Ile Thr
50 55 60
Leu Lys Lys Arg Trp Gln Leu Ala Leu Ser Lys Gly Val His Phe Val
65 70 75 80
Cys Asn Leu Leu Leu Leu Phe Val Thr Val Tyr Ser His Leu Leu Leu
85 90 95
Val Ala Ala Gly Leu Glu Ala Pro Phe Leu Tyr Leu Tyr Ala Leu Val
100 105 110
Tyr Phe Leu Gln Ser Ile Asn Phe Val Arg Ile Ile Met Arg Leu Trp
115 120 125
Leu Cys Trp Lys Cys Arg Ser Lys Asn Pro Leu Leu Tyr Asp Ala Asn
130 135 140
Tyr Phe Leu Cys Trp His Ile Asn Cys Tyr Asp Tyr Cys Ile Pro Tyr
145 150 155 160
Asn Ser Val Thr Ser Ser Ile Val Ile Thr Ser Gly Asp Gly Thr Thr
165 170 175
Ser Pro Ile Ser Glu His Asp Tyr Gln Ile Gly Gly Tyr Thr Glu Lys
180 185 190
Trp Glu Ser Gly Val Lys Asp Cys Val Val Leu His Ser Tyr Phe Thr
195 200 205
Ser Asp Tyr Tyr Gln Leu Tyr Ser Thr Gln Leu Ser Thr Asp Thr Gly
210 215 220
Val Glu His Val Thr Phe Phe Ile Tyr Asn Lys Ile Val Asp Glu Pro
225 230 235 240
Glu Glu His Val Gln Ile His Thr Ile Asp Gly Ser Ser Gly Val Val
245 250 255
Asn Pro Val Met Glu Pro Ile Tyr Asp Glu Pro Thr Thr Thr Thr Ser
260 265 270
Val Pro Leu
275
<210> 440
<211> 75
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 440
Met Tyr Ser Phe Val Ser Glu Glu Thr Gly Thr Leu Ile Val Asn Ser
1 5 10 15
Val Leu Leu Phe Leu Ala Phe Val Val Phe Leu Leu Val Thr Leu Ala
20 25 30
Ile Leu Thr Ala Leu Arg Leu Cys Ala Tyr Cys Cys Asn Ile Val Asn
35 40 45
Val Ser Leu Val Lys Pro Ser Phe Tyr Val Tyr Ser Arg Val Lys Asn
50 55 60
Leu Asn Ser Ser Arg Val Pro Asp Leu Leu Val
65 70 75
<210> 441
<211> 222
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 441
Met Ala Asp Ser Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Lys Leu
1 5 10 15
Leu Glu Gln Trp Asn Leu Val Ile Gly Phe Leu Phe Leu Thr Trp Ile
20 25 30
Cys Leu Leu Gln Phe Ala Tyr Ala Asn Arg Asn Arg Phe Leu Tyr Val
35 40 45
Ile Lys Leu Ile Phe Leu Trp Leu Leu Trp Pro Val Thr Leu Ala Cys
50 55 60
Phe Val Leu Ala Ala Val Tyr Arg Ile Asn Trp Ile Thr Gly Gly Ile
65 70 75 80
Ala Ile Ala Met Ala Cys Leu Val Gly Leu Met Trp Leu Ser Tyr Phe
85 90 95
Ile Ala Ser Phe Arg Leu Phe Ala Arg Thr Arg Ser Met Trp Ser Phe
100 105 110
Asn Pro Glu Thr Asn Ile Leu Leu Asn Val Pro Leu His Gly Thr Ile
115 120 125
Leu Thr Arg Pro Leu Leu Glu Ser Glu Leu Val Ile Gly Ala Val Ile
130 135 140
Leu Arg Gly His Leu Arg Ile Ala Gly His His Leu Gly Arg Cys Asp
145 150 155 160
Ile Lys Asp Leu Pro Lys Glu Ile Thr Val Ala Thr Ser Arg Thr Leu
165 170 175
Ser Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Ala Gly Asp Ser Gly
180 185 190
Phe Ala Ala Tyr Ser Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr
195 200 205
Asp His Ser Ser Ser Ser Asp Asn Ile Ala Leu Leu Val Gln
210 215 220
<210> 442
<211> 61
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 442
Met Phe His Leu Val Asp Phe Gln Val Thr Ile Ala Glu Ile Leu Leu
1 5 10 15
Ile Ile Met Arg Thr Phe Lys Val Ser Ile Trp Asn Leu Asp Tyr Ile
20 25 30
Ile Asn Leu Ile Ile Lys Asn Leu Ser Lys Ser Leu Thr Glu Asn Lys
35 40 45
Tyr Ser Gln Leu Asp Glu Glu Gln Pro Met Glu Ile Asp
50 55 60
<210> 443
<211> 121
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 443
Met Lys Ile Ile Leu Phe Leu Ala Leu Ile Thr Leu Ala Thr Cys Glu
1 5 10 15
Leu Tyr His Tyr Gln Glu Cys Val Arg Gly Thr Thr Val Leu Leu Lys
20 25 30
Glu Pro Cys Ser Ser Gly Thr Tyr Glu Gly Asn Ser Pro Phe His Pro
35 40 45
Leu Ala Asp Asn Lys Phe Ala Leu Thr Cys Phe Ser Thr Gln Phe Ala
50 55 60
Phe Ala Cys Pro Asp Gly Val Lys His Val Tyr Gln Leu Arg Ala Arg
65 70 75 80
Ser Val Ser Pro Lys Leu Phe Ile Arg Gln Glu Glu Val Gln Glu Leu
85 90 95
Tyr Ser Pro Ile Phe Leu Ile Val Ala Ala Ile Val Phe Ile Thr Leu
100 105 110
Cys Phe Thr Leu Lys Arg Lys Thr Glu
115 120
<210> 444
<211> 43
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 444
Met Ile Glu Leu Ser Leu Ile Asp Phe Tyr Leu Cys Phe Leu Ala Phe
1 5 10 15
Leu Leu Phe Leu Val Leu Ile Met Leu Ile Ile Phe Trp Phe Ser Leu
20 25 30
Glu Leu Gln Asp His Asn Glu Thr Cys His Ala
35 40
<210> 445
<211> 121
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 445
Met Lys Phe Leu Val Phe Leu Gly Ile Ile Thr Thr Val Ala Ala Phe
1 5 10 15
His Gln Glu Cys Ser Leu Gln Ser Cys Thr Gln His Gln Pro Tyr Val
20 25 30
Val Asp Asp Pro Cys Pro Ile His Phe Tyr Ser Lys Trp Tyr Ile Arg
35 40 45
Val Gly Ala Arg Lys Ser Ala Pro Leu Ile Glu Leu Cys Val Asp Glu
50 55 60
Ala Gly Ser Lys Ser Pro Ile Gln Tyr Ile Asp Ile Gly Asn Tyr Thr
65 70 75 80
Val Ser Cys Leu Pro Phe Thr Ile Asn Cys Gln Glu Pro Lys Leu Gly
85 90 95
Ser Leu Val Val Arg Cys Ser Phe Tyr Glu Asp Phe Leu Glu Tyr His
100 105 110
Asp Val Arg Val Val Leu Asp Phe Ile
115 120
<210> 446
<211> 419
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 446
Met Ser Asp Asn Gly Pro Gln Asn Gln Arg Asn Ala Pro Arg Ile Thr
1 5 10 15
Phe Gly Gly Pro Ser Asp Ser Thr Gly Ser Asn Gln Asn Gly Glu Arg
20 25 30
Ser Gly Ala Arg Ser Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn Asn
35 40 45
Thr Ala Ser Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Asp Leu
50 55 60
Lys Phe Pro Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Ser Pro
65 70 75 80
Asp Asp Gln Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Ile Arg Gly
85 90 95
Gly Asp Gly Lys Met Lys Asp Leu Ser Pro Arg Trp Tyr Phe Tyr Tyr
100 105 110
Leu Gly Thr Gly Pro Glu Ala Gly Leu Pro Tyr Gly Ala Asn Lys Asp
115 120 125
Gly Ile Ile Trp Val Ala Thr Glu Gly Ala Phe Asn Thr Pro Lys Asp
130 135 140
His Ile Gly Thr Arg Asn Pro Ala Asn Asn Ala Ala Ile Val Leu Gln
145 150 155 160
Leu Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly Ser
165 170 175
Arg Gly Gly Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg Asn
180 185 190
Ser Ser Arg Asn Ser Thr Pro Gly Ser Ser Arg Gly Ile Ser Pro Ala
195 200 205
Arg Met Ala Gly Asn Gly Gly Asp Ala Ala Leu Ala Leu Leu Leu Leu
210 215 220
Asp Arg Leu Asn Gln Leu Glu Ser Lys Met Ser Gly Lys Gly Gln Gln
225 230 235 240
Gln Gln Gly Gln Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser Lys
245 250 255
Lys Pro Arg Gln Lys Arg Thr Ala Thr Lys Ala Tyr Asn Val Thr Gln
260 265 270
Ala Phe Gly Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly Asp
275 280 285
Gln Glu Leu Ile Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln Ile
290 295 300
Ala Gln Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg Ile
305 310 315 320
Gly Met Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr Thr Gly Ala
325 330 335
Ile Lys Leu Asp Asp Lys Asp Pro Asn Phe Lys Asp Gln Val Ile Leu
340 345 350
Leu Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu Pro
355 360 365
Lys Lys Asp Lys Lys Lys Lys Ala Asp Glu Thr Gln Ala Leu Pro Gln
370 375 380
Arg Gln Lys Lys Gln Gln Thr Val Thr Leu Leu Pro Ala Ala Asp Leu
385 390 395 400
Asp Asp Phe Ser Lys Gln Leu Gln Gln Ser Met Ser Ser Ala Asp Ser
405 410 415
Thr Gln Ala
<210> 447
<211> 38
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 447
Met Gly Tyr Ile Asn Val Phe Ala Phe Pro Phe Thr Ile Tyr Ser Leu
1 5 10 15
Leu Leu Cys Arg Met Asn Ser Arg Asn Tyr Ile Ala Gln Val Asp Val
20 25 30
Val Asn Phe Asn Leu Thr
35
<210> 448
<400> 448
000
<210> 449
<400> 449
000
<210> 450
<400> 450
000
<210> 451
<400> 451
000
<210> 452
<400> 452
000
<210> 453
<400> 453
000
<210> 454
<400> 454
000
<210> 455
<400> 455
000
<210> 456
<400> 456
000
<210> 457
<400> 457
000
<210> 458
<400> 458
000
<210> 459
<400> 459
000
<210> 460
<400> 460
000
<210> 461
<400> 461
000
<210> 462
<400> 462
000
<210> 463
<400> 463
000
<210> 464
<400> 464
000
<210> 465
<400> 465
000
<210> 466
<400> 466
000
<210> 467
<400> 467
000
<210> 468
<400> 468
000
<210> 469
<400> 469
000
<210> 470
<400> 470
000
<210> 471
<400> 471
000
<210> 472
<400> 472
000
<210> 473
<400> 473
000
<210> 474
<400> 474
000
<210> 475
<400> 475
000
<210> 476
<400> 476
000
<210> 477
<400> 477
000
<210> 478
<400> 478
000
<210> 479
<400> 479
000
<210> 480
<400> 480
000
<210> 481
<400> 481
000
<210> 482
<400> 482
000
<210> 483
<400> 483
000
<210> 484
<400> 484
000
<210> 485
<400> 485
000
<210> 486
<400> 486
000
<210> 487
<400> 487
000
<210> 488
<400> 488
000
<210> 489
<400> 489
000
<210> 490
<400> 490
000
<210> 491
<400> 491
000
<210> 492
<400> 492
000
<210> 493
<400> 493
000
<210> 494
<400> 494
000
<210> 495
<400> 495
000
<210> 496
<400> 496
000
<210> 497
<400> 497
000
<210> 498
<400> 498
000
<210> 499
<400> 499
000
<210> 500
<400> 500
000
<210> 501
<211> 21291
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 501
atggagagcc ttgtccctgg tttcaacgag aaaacacacg tccaactcag tttgcctgtt 60
ttacaggttc gcgacgtgct cgtacgtggc tttggagact ccgtggagga ggtcttatca 120
gaggcacgtc aacatcttaa agatggcact tgtggcttag tagaagttga aaaaggcgtt 180
ttgcctcaac ttgaacagcc ctatgtgttc atcaaacgtt cggatgctcg aactgcacct 240
catggtcatg ttatggttga gctggtagca gaactcgaag gcattcagta cggtcgtagt 300
ggtgagacac ttggtgtcct tgtccctcat gtgggcgaaa taccagtggc ttaccgcaag 360
gttcttcttc gtaagaacgg taataaagga gctggtggcc atagttacgg cgccgatcta 420
aagtcatttg acttaggcga cgagcttggc actgatcctt atgaagattt tcaagaaaac 480
tggaacacta aacatagcag tggtgttacc cgtgaactca tgcgtgagct taacggaggg 540
gcatacactc gctatgtcga taacaacttc tgtggccctg atggctaccc tcttgagtgc 600
attaaagacc ttctagcacg tgctggtaaa gcttcatgca ctttgtccga acaactggac 660
tttattgaca ctaagagggg tgtatactgc tgccgtgaac atgagcatga aattgcttgg 720
tacacggaac gttctgaaaa gagctatgaa ttgcagacac cttttgaaat taaattggca 780
aagaaatttg acaccttcaa tggggaatgt ccaaattttg tatttccctt aaattccata 840
atcaagacta ttcaaccaag ggttgaaaag aaaaagcttg atggctttat gggtagaatt 900
cgatctgtct atccagttgc gtcaccaaat gaatgcaacc aaatgtgcct ttcaactctc 960
atgaagtgtg atcattgtgg tgaaacttca tggcagacgg gcgattttgt taaagccact 1020
tgcgaatttt gtggcactga gaatttgact aaagaaggtg ccactacttg tggttactta 1080
ccccaaaatg ctgttgttaa aatttattgt ccagcatgtc acaattcaga agtaggacct 1140
gagcatagtc ttgccgaata ccataatgaa tctggcttga aaaccattct tcgtaagggt 1200
ggtcgcacta ttgcctttgg aggctgtgtg ttctcttatg ttggttgcca taacaagtgt 1260
gcctattggg ttccacgtgc tagcgctaac ataggttgta accatacagg tgttgttgga 1320
gaaggttccg aaggtcttaa tgacaacctt cttgaaatac tccaaaaaga gaaagtcaac 1380
atcaatattg ttggtgactt taaacttaat gaagagatcg ccattatttt ggcatctttt 1440
tctgcttcca caagtgcttt tgtggaaact gtgaaaggtt tggattataa agcattcaaa 1500
caaattgttg aatcctgtgg taattttaaa gttacaaaag gaaaagctaa aaaaggtgcc 1560
tggaatattg gtgaacagaa atcaatactg agtcctcttt atgcatttgc atcagaggct 1620
gctcgtgttg tacgatcaat tttctcccgc actcttgaaa ctgctcaaaa ttctgtgcgt 1680
gttttacaga aggccgctat aacaatacta gatggaattt cacagtattc actgagactc 1740
attgatgcta tgatgttcac atctgatttg gctactaaca atctagttgt aatggcctac 1800
attacaggtg gtgttgttca gttgacttcg cagtggctaa ctaacatctt tggcactgtt 1860
tatgaaaaac tcaaacccgt ccttgattgg cttgaagaga agtttaagga aggtgtagag 1920
tttcttagag acggttggga aattgttaaa tttatctcaa cctgtgcttg tgaaattgtc 1980
ggtggacaaa ttgtcacctg tgcaaaggaa attaaggaga gtgttcagac attctttaag 2040
cttgtaaata aatttttggc tttgtgtgct gactctatca ttattggtgg agctaaactt 2100
aaagccttga atttaggtga aacatttgtc acgcactcaa agggattgta cagaaagtgt 2160
gttaaatcca gagaagaaac tggcctactc atgcctctaa aagccccaaa agaaattatc 2220
ttcttagagg gagaaacact tcccacagaa gtgttaacag aggaagttgt cttgaaaact 2280
ggtgatttac aaccattaga acaacctact agtgaagctg ttgaagctcc attggttggt 2340
acaccagttt gtattaacgg gcttatgttg ctcgaaatca aagacacaga aaagtactgt 2400
gcccttgcac ctaatatgat ggtaacaaac aataccttca cactcaaagg cggtgcacca 2460
acaaaggtta cttttggtga tgacactgtg atagaagtgc aaggttacaa gagtgtgaat 2520
atcacttttg aacttgatga aaggattgat aaagtactta atgagaagtg ctctgcctat 2580
acagttgaac tcggtacaga agtaaatgag ttcgcctgtg ttgtggcaga tgctgtcata 2640
aaaactttgc aaccagtatc tgaattactt acaccactgg gcattgattt agatgagtgg 2700
agtatggcta catactactt atttgatgag tctggtgagt ttaaattggc ttcacatatg 2760
tattgttctt tctaccctcc agatgaggat gaagaagaag gtgattgtga agaagaagag 2820
tttgagccat caactcaata tgagtatggt actgaagatg attaccaagg taaacctttg 2880
gaatttggtg ccacttctgc tgctcttcaa cctgaagaag agcaagaaga agattggtta 2940
gatgatgata gtcaacaaac tgttggtcaa caagacggca gtgaggacaa tcagacaact 3000
actattcaaa caattgttga ggttcaacct caattagaga tggaacttac accagttgtt 3060
cagactattg aagtgaatag ttttagtggt tatttaaaac ttactgacaa tgtatacatt 3120
aaaaatgcag acattgtgga agaagctaaa aaggtaaaac caacagtggt tgttaatgca 3180
gccaatgttt accttaaaca tggaggaggt gttgcaggag ccttaaataa ggctactaac 3240
aatgccatgc aagttgaatc tgatgattac atagctacta atggaccact taaagtgggt 3300
ggtagttgtg ttttaagcgg acacaatctt gctaaacact gtcttcatgt tgtcggccca 3360
aatgttaaca aaggtgaaga cattcaactt cttaagagtg cttatgaaaa ttttaatcag 3420
cacgaagttc tacttgcacc attattatca gctggtattt ttggtgctga ccctatacat 3480
tctttaagag tttgtgtaga tactgttcgc acaaatgtct acttagctgt ctttgataaa 3540
aatctctatg acaaacttgt ttcaagcttt ttggaaatga agagtgaaaa gcaagttgaa 3600
caaaagatcg ctgagattcc taaagaggaa gttaagccat ttataactga aagtaaacct 3660
tcagttgaac agagaaaaca agatgataag aaaatcaaag cttgtgttga agaagttaca 3720
acaactctgg aagaaactaa gttcctcaca gaaaacttgt tactttatat tgacattaat 3780
ggcaatcttc atccagattc tgccactctt gttagtgaca ttgacatcac tttcttaaag 3840
aaagatgctc catatatagt gggtgatgtt gttcaagagg gtgttttaac tgctgtggtt 3900
atacctacta aaaaggctgg tggcactact gaaatgctag cgaaagcttt gagaaaagtg 3960
ccaacagaca attatataac cacttacccg ggtcagggtt taaatggtta cactgtagag 4020
gaggcaaaga cagtgcttaa aaagtgtaaa agtgcctttt acattctacc atctattatc 4080
tctaatgaga agcaagaaat tcttggaact gtttcttgga atttgcgaga aatgcttgca 4140
catgcagaag aaacacgcaa attaatgcct gtctgtgtgg aaactaaagc catagtttca 4200
actatacagc gtaaatataa gggtattaaa atacaagagg gtgtggttga ttatggtgct 4260
agattttact tttacaccag taaaacaact gtagcgtcac ttatcaacac acttaacgat 4320
ctaaatgaaa ctcttgttac aatgccactt ggctatgtaa cacatggctt aaatttggaa 4380
gaagctgctc ggtatatgag atctctcaaa gtgccagcta cagtttctgt ttcttcacct 4440
gatgctgtta cagcgtataa tggttatctt acttcttctt ctaaaacacc tgaagaacat 4500
tttattgaaa ccatctcact tgctggttcc tataaagatt ggtcctattc tggacaatct 4560
acacaactag gtatagaatt tcttaagaga ggtgataaaa gtgtatatta cactagtaat 4620
cctaccacat tccacctaga tggtgaagtt atcacctttg acaatcttaa gacacttctt 4680
tctttgagag aagtgaggac tattaaggtg tttacaacag tagacaacat taacctccac 4740
acgcaagttg tggacatgtc aatgacatat ggacaacagt ttggtccaac ttatttggat 4800
ggagctgatg ttactaaaat aaaacctcat aattcacatg aaggtaaaac attttatgtt 4860
ttacctaatg atgacactct acgtgttgag gcttttgagt actaccacac aactgatcct 4920
agttttctgg gtaggtacat gtcagcatta aatcacacta aaaagtggaa atacccacaa 4980
gttaatggtt taacttctat taaatgggca gataacaact gttatcttgc cactgcattg 5040
ttaacactcc aacaaataga gttgaagttt aatccacctg ctctacaaga tgcttattac 5100
agagcaaggg ctggtgaagc tgctaacttt tgtgcactta tcttagccta ctgtaataag 5160
acagtaggtg agttaggtga tgttagagaa acaatgagtt acttgtttca acatgccaat 5220
ttagattctt gcaaaagagt cttgaacgtg gtgtgtaaaa cttgtggaca acagcagaca 5280
acccttaagg gtgtagaagc tgttatgtac atgggcacac tttcttatga acaatttaag 5340
aaaggtgttc agataccttg tacgtgtggt aaacaagcta caaaatatct agtacaacag 5400
gagtcacctt ttgttatgat gtcagcacca cctgctcagt atgaacttaa gcatggtaca 5460
tttacttgtg ctagtgagta cactggtaat taccagtgtg gtcactataa acatataact 5520
tctaaagaaa ctttgtattg catagacggt gctttactta caaagtcctc agaatacaaa 5580
ggtcctatta cggatgtttt ctacaaagaa aacagttaca caacaaccat aaaaccagtt 5640
acttataaat tggatggtgt tgtttgtaca gaaattgacc ctaagttgga caattattat 5700
aagaaagaca attcttattt cacagagcaa ccaattgatc ttgtaccaaa ccaaccatat 5760
ccaaacgcaa gcttcgataa ttttaagttt gtatgtgata atatcaaatt tgctgatgat 5820
ttaaaccagt taactggtta taagaaacct gcttcaagag agcttaaagt tacatttttc 5880
cctgacttaa atggtgatgt ggtggctatt gattataaac actacacacc ctcttttaag 5940
aaaggagcta aattgttaca taaacctatt gtttggcatg ttaacaatgc aactaataaa 6000
gccacgtata aaccaaatac ctggtgtata cgttgtcttt ggagcacaaa accagttgaa 6060
acatcaaatt cgtttgatgt actgaagtca gaggacgcgc agggaatgga taatcttgcc 6120
tgcgaagatc taaaaccagt ctctgaagaa gtagtggaaa atcctaccat acagaaagac 6180
gttcttgagt gtaatgtgaa aactaccgaa gttgtaggag acattatact taaaccagca 6240
aataatagtt taaaaattac agaagaggtt ggccacacag atctaatggc tgcttatgta 6300
gacaattcta gtcttactat taagaaacct aatgaattat ctagagtatt aggtttgaaa 6360
acccttgcta ctcatggttt agctgctgtt aatagtgtcc cttgggatac tatagctaat 6420
tatgctaagc cttttcttaa caaagttgtt agtacaacta ctaacatagt tacacggtgt 6480
ttaaaccgtg tttgtactaa ttatatgcct tatttcttta ctttattgct acaattgtgt 6540
acttttacta gaagtacaaa ttctagaatt aaagcatcta tgccgactac tatagcaaag 6600
aatactgtta agagtgtcgg taaattttgt ctagaggctt catttaatta tttgaagtca 6660
cctaattttt ctaaactgat aaatattata atttggtttt tactattaag tgtttgccta 6720
ggttctttaa tctactcaac cgctgcttta ggtgttttaa tgtctaattt aggcatgcct 6780
tcttactgta ctggttacag agaaggctat ttgaactcta ctaatgtcac tattgcaacc 6840
tactgtactg gttctatacc ttgtagtgtt tgtcttagtg gtttagattc tttagacacc 6900
tatccttctt tagaaactat acaaattacc atttcatctt ttaaatggga tttaactgct 6960
tttggcttag ttgcagagtg gtttttggca tatattcttt tcactaggtt tttctatgta 7020
cttggattgg ctgcaatcat gcaattgttt ttcagctatt ttgcagtaca ttttattagt 7080
aattcttggc ttatgtggtt aataattaat cttgtacaaa tggccccgat ttcagctatg 7140
gttagaatgt acatcttctt tgcatcattt tattatgtat ggaaaagtta tgtgcatgtt 7200
gtagacggtt gtaattcatc aacttgtatg atgtgttaca aacgtaatag agcaacaaga 7260
gtcgaatgta caactattgt taatggtgtt agaaggtcct tttatgtcta tgctaatgga 7320
ggtaaaggct tttgcaaact acacaattgg aattgtgtta attgtgatac attctgtgct 7380
ggtagtacat ttattagtga tgaagttgcg agagacttgt cactacagtt taaaagacca 7440
ataaatccta ctgaccagtc ttcttacatc gttgatagtg ttacagtgaa gaatggttcc 7500
atccatcttt actttgataa agctggtcaa aagacttatg aaagacattc tctctctcat 7560
tttgttaact tagacaacct gagagctaat aacactaaag gttcattgcc tattaatgtt 7620
atagtttttg atggtaaatc aaaatgtgaa gaatcatctg caaaatcagc gtctgtttac 7680
tacagtcagc ttatgtgtca acctatactg ttactagatc aggcattagt gtctgatgtt 7740
ggtgatagtg cggaagttgc agttaaaatg tttgatgctt acgttaatac gttttcatca 7800
acttttaacg taccaatgga aaaactcaaa acactagttg caactgcaga agctgaactt 7860
gcaaagaatg tgtccttaga caatgtctta tctactttta tttcagcagc tcggcaaggg 7920
tttgttgatt cagatgtaga aactaaagat gttgttgaat gtcttaaatt gtcacatcaa 7980
tctgacatag aagttactgg cgatagttgt aataactata tgctcaccta taacaaagtt 8040
gaaaacatga caccccgtga ccttggtgct tgtattgact gtagtgcgcg tcatattaat 8100
gcgcaggtag caaaaagtca caacattgct ttgatatgga acgttaaaga tttcatgtca 8160
ttgtctgaac aactacgaaa acaaatacgt agtgctgcta aaaagaataa cttacctttt 8220
aagttgacat gtgcaactac tagacaagtt gttaatgttg taacaacaaa gatagcactt 8280
aagggtggta aaattgttaa taattggttg aagcagttaa ttaaagttac acttgtgttc 8340
ctttttgttg ctgctatttt ctatttaata acacctgttc atgtcatgtc taaacatact 8400
gacttttcaa gtgaaatcat aggatacaag gctattgatg gtggtgtcac tcgtgacata 8460
gcatctacag atacttgttt tgctaacaaa catgctgatt ttgacacatg gtttagccag 8520
cgtggtggta gttatactaa tgacaaagct tgcccattga ttgctgcagt cataacaaga 8580
gaagtgggtt ttgtcgtgcc tggtttgcct ggcacgatat tacgcacaac taatggtgac 8640
tttttgcatt tcttacctag agtttttagt gcagttggta acatctgtta cacaccatca 8700
aaacttatag agtacactga ctttgcaaca tcagcttgtg ttttggctgc tgaatgtaca 8760
atttttaaag atgcttctgg taagccagta ccatattgtt atgataccaa tgtactagaa 8820
ggttctgttg cttatgaaag tttacgccct gacacacgtt atgtgctcat ggatggctct 8880
attattcaat ttcctaacac ctaccttgaa ggttctgtta gagtggtaac aacttttgat 8940
tctgagtact gtaggcacgg cacttgtgaa agatcagaag ctggtgtttg tgtatctact 9000
agtggtagat gggtacttaa caatgattat tacagatctt taccaggagt tttctgtggt 9060
gtagatgctg taaatttact tactaatatg tttacaccac taattcaacc tattggtgct 9120
ttggacatat cagcatctat agtagctggt ggtattgtag ctatcgtagt aacatgcctt 9180
gcctactatt ttatgaggtt tagaagagct tttggtgaat acagtcatgt agttgccttt 9240
aatactttac tattccttat gtcattcact gtactctgtt taacaccagt ttactcattc 9300
ttacctggtg tttattctgt tatttacttg tacttgacat tttatcttac taatgatgtt 9360
tcttttttag cacatattca gtggatggtt atgttcacac ctttagtacc tttctggata 9420
acaattgctt atatcatttg tatttccaca aagcatttct attggttctt tagtaattac 9480
ctaaagagac gtgtagtctt taatggtgtt tcctttagta cttttgaaga agctgcgctg 9540
tgcacctttt tgttaaataa agaaatgtat ctaaagttgc gtagtgatgt gctattacct 9600
cttacgcaat ataatagata cttagctctt tataataagt acaagtattt tagtggagca 9660
atggatacaa ctagctacag agaagctgct tgttgtcatc tcgcaaaggc tctcaatgac 9720
ttcagtaact caggttctga tgttctttac caaccaccac aaacctctat cacctcagct 9780
gttttgcaga gtggttttag aaaaatggca ttcccatctg gtaaagttga gggttgtatg 9840
gtacaagtaa cttgtggtac aactacactt aacggtcttt ggcttgatga cgtagtttac 9900
tgtccaagac atgtgatctg cacctctgaa gacatgctta accctaatta tgaagattta 9960
ctcattcgta agtctaatca taatttcttg gtacaggctg gtaatgttca actcagggtt 10020
attggacatt ctatgcaaaa ttgtgtactt aagcttaagg ttgatacagc caatcctaag 10080
acacctaagt ataagtttgt tcgcattcaa ccaggacaga ctttttcagt gttagcttgt 10140
tacaatggtt caccatctgg tgtttaccaa tgtgctatga ggcccaattt cactattaag 10200
ggttcattcc ttaatggttc atgtggtagt gttggtttta acatagatta tgactgtgtc 10260
tctttttgtt acatgcacca tatggaatta ccaactggag ttcatgctgg cacagactta 10320
gaaggtaact tttatggacc ttttgttgac aggcaaacag cacaagcagc tggtacggac 10380
acaactatta cagttaatgt tttagcttgg ttgtacgctg ctgttataaa tggagacagg 10440
tggtttctca atcgatttac cacaactctt aatgacttta accttgtggc tatgaagtac 10500
aattatgaac ctctaacaca agaccatgtt gacatactag gacctctttc tgctcaaact 10560
ggaattgccg ttttagatat gtgtgcttca ttaaaagaat tactgcaaaa tggtatgaat 10620
ggacgtacca tattgggtag tgctttatta gaagatgaat ttacaccttt tgatgttgtt 10680
agacaatgct caggtgttac tttccaaagt gcagtgaaaa gaacaatcaa gggtacacac 10740
cactggttgt tactcacaat tttgacttca cttttagttt tagtccagag tactcaatgg 10800
tctttgttct tttttttgta tgaaaatgcc tttttacctt ttgctatggg tattattgct 10860
atgtctgctt ttgcaatgat gtttgtcaaa cataagcatg catttctctg tttgtttttg 10920
ttaccttctc ttgccactgt agcttatttt aatatggtct atatgcctgc tagttgggtg 10980
atgcgtatta tgacatggtt ggatatggtt gatactagtt tgtctggttt taagctaaaa 11040
gactgtgtta tgtatgcatc agctgtagtg ttactaatcc ttatgacagc aagaactgtg 11100
tatgatgatg gtgctaggag agtgtggaca cttatgaatg tcttgacact cgtttataaa 11160
gtttattatg gtaatgcttt agatcaagcc atttccatgt gggctcttat aatctctgtt 11220
acttctaact actcaggtgt agttacaact gtcatgtttt tggccagagg tattgttttt 11280
atgtgtgttg agtattgccc tattttcttc ataactggta atacacttca gtgtataatg 11340
ctagtttatt gtttcttagg ctatttttgt acttgttact ttggcctctt ttgtttactc 11400
aaccgctact ttagactgac tcttggtgtt tatgattact tagtttctac acaggagttt 11460
agatatatga attcacaggg actactccca cccaagaata gcatagatgc cttcaaactc 11520
aacattaaat tgttgggtgt tggtggcaaa ccttgtatca aagtagccac tgtacagtct 11580
aaaatgtcag atgtaaagtg cacatcagta gtcttactct cagttttgca acaactcaga 11640
gtagaatcat catctaaatt gtgggctcaa tgtgtccagt tacacaatga cattctctta 11700
gctaaagata ctactgaagc ctttgaaaaa atggtttcac tactttctgt tttgctttcc 11760
atgcagggtg ctgtagacat aaacaagctt tgtgaagaaa tgctggacaa cagggcaacc 11820
ttacaagcta tagcctcaga gtttagttcc cttccatcat atgcagcttt tgctactgct 11880
caagaagctt atgagcaggc tgttgctaat ggtgattctg aagttgttct taaaaagttg 11940
aagaagtctt tgaatgtggc taaatctgaa tttgaccgtg atgcagccat gcaacgtaag 12000
ttggaaaaga tggctgatca agctatgacc caaatgtata aacaggctag atctgaggac 12060
aagagggcaa aagttactag tgctatgcag acaatgcttt tcactatgct tagaaagttg 12120
gataatgatg cactcaacaa cattatcaac aatgcaagag atggttgtgt tcccttgaac 12180
ataatacctc ttacaacagc agccaaacta atggttgtca taccagacta taacacatat 12240
aaaaatacgt gtgatggtac aacatttact tatgcatcag cattgtggga aatccaacag 12300
gttgtagatg cagatagtaa aattgttcaa cttagtgaaa ttagtatgga caattcacct 12360
aatttagcat ggcctcttat tgtaacagct ttaagggcca attctgctgt caaattacag 12420
aataatgagc ttagtcctgt tgcactacga cagatgtctt gtgctgccgg tactacacaa 12480
actgcttgca ctgatgacaa tgcgttagct tactacaaca caacaaaggg aggtaggttt 12540
gtacttgcac tgttatccga tttacaggat ttgaaatggg ctagattccc taagagtgat 12600
ggaactggta ctatctatac agaactggaa ccaccttgta ggtttgttac agacacacct 12660
aaaggtccta aagtgaagta tttatacttt attaaaggat taaacaacct aaatagaggt 12720
atggtacttg gtagtttagc tgccacagta cgtctacaag ctggtaatgc aacagaagtg 12780
cctgccaatt caactgtatt atctttctgt gcttttgctg tagatgctgc taaagcttac 12840
aaagattatc tagctagtgg gggacaacca atcactaatt gtgttaagat gttgtgtaca 12900
cacactggta ctggtcaggc aataacagtt acaccggaag ccaatatgga tcaagaatcc 12960
tttggtggtg catcgtgttg tctgtactgc cgttgccaca tagatcatcc aaatcctaaa 13020
ggattttgtg acttaaaagg taagtatgta caaataccta caacttgtgc taatgaccct 13080
gtgggtttta cacttaaaaa cacagtctgt accgtctgcg gtatgtggaa aggttatggc 13140
tgtagttgtg atcaactccg cgaacccatg cttcagtcag ctgatgcaca atcgttttta 13200
aaccgggttt gcggtgtaag tgcagcccgt cttacaccgt gcggcacagg cactagtact 13260
gatgtcgtat acagggcttt tgacatctac aatgataaag tagctggttt tgctaaattc 13320
ctaaaaacta attgttgtcg cttccaagaa aaggacgaag atgacaattt aattgattct 13380
tactttgtag ttaagagaca cactttctct aactaccaac atgaagaaac aatttataat 13440
ttacttaagg attgtccagc tgttgctaaa catgacttct ttaagtttag aatagacggt 13500
gacatggtac cacatatatc acgtcaacgt cttactaaat acacaatggc agacctcgtc 13560
tatgctttaa ggcattttga tgaaggtaat tgtgacacat taaaagaaat acttgtcaca 13620
tacaattgtt gtgatgatga ttatttcaat aaaaaggact ggtatgattt tgtagaaaac 13680
ccagatatat tacgcgtata cgccaactta ggtgaacgtg tacgccaagc tttgttaaaa 13740
acagtacaat tctgtgatgc catgcgaaat gctggtattg ttggtgtact gacattagat 13800
aatcaagatc tcaatggtaa ctggtatgat ttcggtgatt tcatacaaac cacgccaggt 13860
agtggagttc ctgttgtaga ttcttattat tcattgttaa tgcctatatt aaccttgacc 13920
agggctttaa ctgcagagtc acatgttgac actgacttaa caaagcctta cattaagtgg 13980
gatttgttaa aatatgactt cacggaagag aggttaaaac tctttgaccg ttattttaaa 14040
tattgggatc agacatacca cccaaattgt gttaactgtt tggatgacag atgcattctg 14100
cattgtgcaa actttaatgt tttattctct acagtgttcc cacctacaag ttttggacca 14160
ctagtgagaa aaatatttgt tgatggtgtt ccatttgtag tttcaactgg ataccacttc 14220
agagagctag gtgttgtaca taatcaggat gtaaacttac atagctctag acttagtttt 14280
aaggaattac ttgtgtatgc tgctgaccct gctatgcacg ctgcttctgg taatctatta 14340
ctagataaac gcactacgtg cttttcagta gctgcactta ctaacaatgt tgcttttcaa 14400
actgtcaaac ccggtaattt taacaaagac ttctatgact ttgctgtgtc taagggtttc 14460
tttaaggaag gaagttctgt tgaattaaaa cacttcttct ttgctcagga tggtaatgct 14520
gctatcagcg attatgacta ctatcgttat aatctaccaa caatgtgtga tatcagacaa 14580
ctactatttg tagttgaagt tgttgataag tactttgatt gttacgatgg tggctgtatt 14640
aatgctaacc aagtcatcgt caacaaccta gacaaatcag ctggttttcc atttaataaa 14700
tggggtaagg ctagacttta ttatgattca atgagttatg aggatcaaga tgcacttttc 14760
gcatatacaa aacgtaatgt catccctact ataactcaaa tgaatcttaa gtatgccatt 14820
agtgcaaaga atagagctcg caccgtagct ggtgtctcta tctgtagtac tatgaccaat 14880
agacagtttc atcaaaaatt attgaaatca atagccgcca ctagaggagc tactgtagta 14940
attggaacaa gcaaattcta tggtggttgg cacaacatgt taaaaactgt ttatagtgat 15000
gtagaaaacc ctcaccttat gggttgggat tatcctaaat gtgatagagc catgcctaac 15060
atgcttagaa ttatggcctc acttgttctt gctcgcaaac atacaacgtg ttgtagcttg 15120
tcacaccgtt tctatagatt agctaatgag tgtgctcaag tattgagtga aatggtcatg 15180
tgtggcggtt cactatatgt taaaccaggt ggaacctcat caggagatgc cacaactgct 15240
tatgctaata gtgtttttaa catttgtcaa gctgtcacgg ccaatgttaa tgcactttta 15300
tctactgatg gtaacaaaat tgccgataag tatgtccgca atttacaaca cagactttat 15360
gagtgtctct atagaaatag agatgttgac acagactttg tgaatgagtt ttacgcatat 15420
ttgcgtaaac atttctcaat gatgatactc tctgacgatg ctgttgtgtg tttcaatagc 15480
acttatgcat ctcaaggtct agtggctagc ataaagaact ttaagtcagt tctttattat 15540
caaaacaatg tttttatgtc tgaagcaaaa tgttggactg agactgacct tactaaagga 15600
cctcatgaat tttgctctca acatacaatg ctagttaaac agggtgatga ttatgtgtac 15660
cttccttacc cagatccatc aagaatccta ggggccggct gttttgtaga tgatatcgta 15720
aaaacagatg gtacacttat gattgaacgg ttcgtgtctt tagctataga tgcttaccca 15780
cttactaaac atcctaatca ggagtatgct gatgtctttc atttgtactt acaatacata 15840
agaaagctac atgatgagtt aacaggacac atgttagaca tgtattctgt tatgcttact 15900
aatgataaca cttcaaggta ttgggaacct gagttttatg aggctatgta cacaccgcat 15960
acagtcttac aggctgttgg ggcttgtgtt ctttgcaatt cacagacttc attaagatgt 16020
ggtgcttgca tacgtagacc attcttatgt tgtaaatgct gttacgacca tgtcatatca 16080
acatcacata aattagtctt gtctgttaat ccgtatgttt gcaatgctcc aggttgtgat 16140
gtcacagatg tgactcaact ttacttagga ggtatgagct attattgtaa atcacataaa 16200
ccacccatta gttttccatt gtgtgctaat ggacaagttt ttggtttata taaaaataca 16260
tgtgttggta gcgataatgt tactgacttt aatgcaattg caacatgtga ctggacaaat 16320
gctggtgatt acattttagc taacacctgt actgaaagac tcaagctttt tgcagcagaa 16380
acgctcaaag ctactgagga gacatttaaa ctgtcttatg gtattgctac tgtacgtgaa 16440
gtgctgtctg acagagaatt acatctttca tgggaagttg gtaaacctag accaccactt 16500
aaccgaaatt atgtctttac tggttatcgt gtaactaaaa acagtaaagt acaaatagga 16560
gagtacacct ttgaaaaagg tgactatggt gatgctgttg tttaccgagg tacaacaact 16620
tacaaattaa atgttggtga ttattttgtg ctgacatcac atacagtaat gccattaagt 16680
gcacctacac tagtgccaca agagcactat gttagaatta ctggcttata cccaacactc 16740
aatatctcag atgagttttc tagcaatgtt gcaaattatc aaaaggttgg tatgcaaaag 16800
tattctacac tccagggacc acctggtact ggtaagagtc attttgctat tggcctagct 16860
ctctactacc cttctgctcg catagtgtat acagcttgct ctcatgccgc tgttgatgca 16920
ctatgtgaga aggcattaaa atatttgcct atagataaat gtagtagaat tatacctgca 16980
cgtgctcgtg tagagtgttt tgataaattc aaagtgaatt caacattaga acagtatgtc 17040
ttttgtactg taaatgcatt gcctgagacg acagcagata tagttgtctt tgatgaaatt 17100
tcaatggcca caaattatga tttgagtgtt gtcaatgcca gattacgtgc taagcactat 17160
gtgtacattg gcgaccctgc tcaattacct gcaccacgca cattgctaac taagggcaca 17220
ctagaaccag aatatttcaa ttcagtgtgt agacttatga aaactatagg tccagacatg 17280
ttcctcggaa cttgtcggcg ttgtcctgct gaaattgttg acactgtgag tgctttggtt 17340
tatgataata agcttaaagc acataaagac aaatcagctc aatgctttaa aatgttttat 17400
aagggtgtta tcacgcatga tgtttcatct gcaattaaca ggccacaaat aggcgtggta 17460
agagaattcc ttacacgtaa ccctgcttgg agaaaagctg tctttatttc accttataat 17520
tcacagaatg ctgtagcctc aaagattttg ggactaccaa ctcaaactgt tgattcatca 17580
cagggctcag aatatgacta tgtcatattc actcaaacca ctgaaacagc tcactcttgt 17640
aatgtaaaca gatttaatgt tgctattacc agagcaaaag taggcatact ttgcataatg 17700
tctgatagag acctttatga caagttgcaa tttacaagtc ttgaaattcc acgtaggaat 17760
gtggcaactt tacaagctga aaatgtaaca ggactcttta aagattgtag taaggtaatc 17820
actgggttac atcctacaca ggcacctaca cacctcagtg ttgacactaa attcaaaact 17880
gaaggtttat gtgttgacat acctggcata cctaaggaca tgacctatag aagactcatc 17940
tctatgatgg gttttaaaat gaattatcaa gttaatggtt accctaacat gtttatcacc 18000
cgcgaagaag ctataagaca tgtacgtgca tggattggct tcgatgtcga ggggtgtcat 18060
gctactagag aagctgttgg taccaattta cctttacagc taggtttttc tacaggtgtt 18120
aacctagttg ctgtacctac aggttatgtt gatacaccta ataatacaga tttttccaga 18180
gttagtgcta aaccaccgcc tggagatcaa tttaaacacc tcataccact tatgtacaaa 18240
ggacttcctt ggaatgtagt gcgtataaag attgtacaaa tgttaagtga cacacttaaa 18300
aatctctctg acagagtcgt atttgtctta tgggcacatg gctttgagtt gacatctatg 18360
aagtattttg tgaaaatagg acctgagcgc acctgttgtc tatgtgatag acgtgccaca 18420
tgcttttcca ctgcttcaga cacttatgcc tgttggcatc attctattgg atttgattac 18480
gtctataatc cgtttatgat tgatgttcaa caatggggtt ttacaggtaa cctacaaagc 18540
aaccatgatc tgtattgtca agtccatggt aatgcacatg tagctagttg tgatgcaatc 18600
atgactaggt gtctagctgt ccacgagtgc tttgttaagc gtgttgactg gactattgaa 18660
tatcctataa ttggtgatga actgaagatt aatgcggctt gtagaaaggt tcaacacatg 18720
gttgttaaag ctgcattatt agcagacaaa ttcccagttc ttcacgacat tggtaaccct 18780
aaagctatta agtgtgtacc tcaagctgat gtagaatgga agttctatga tgcacagcct 18840
tgtagtgaca aagcttataa aatagaagaa ttattctatt cttatgccac acattctgac 18900
aaattcacag atggtgtatg cctattttgg aattgcaatg tcgatagata tcctgctaat 18960
tccattgttt gtagatttga cactagagtg ctatctaacc ttaacttgcc tggttgtgat 19020
ggtggcagtt tgtatgtaaa taaacatgca ttccacacac cagcttttga taaaagtgct 19080
tttgttaatt taaaacaatt accatttttc tattactctg acagtccatg tgagtctcat 19140
ggaaaacaag tagtgtcaga tatagattat gtaccactaa agtctgctac gtgtataaca 19200
cgttgcaatt taggtggtgc tgtctgtaga catcatgcta atgagtacag attgtatctc 19260
gatgcttata acatgatgat ctcagctggc tttagcttgt gggtttacaa acaatttgat 19320
acttataacc tctggaacac ttttacaaga cttcagagtt tagaaaatgt ggcttttaat 19380
gttgtaaata agggacactt tgatggacaa cagggtgaag taccagtttc tatcattaat 19440
aacactgttt acacaaaagt tgatggtgtt gatgtagaat tgtttgaaaa taaaacaaca 19500
ttacctgtta atgtagcatt tgagctttgg gctaagcgca acattaaacc agtaccagag 19560
gtgaaaatac tcaataattt gggtgtggac attgctgcta atactgtgat ctgggactac 19620
aaaagagatg ctccagcaca tatatctact attggtgttt gttctatgac tgacatagcc 19680
aagaaaccaa ctgaaacgat ttgtgcacca ctcactgtct tttttgatgg tagagttgat 19740
ggtcaagtag acttatttag aaatgcccgt aatggtgttc ttattacaga aggtagtgtt 19800
aaaggtttac aaccatctgt aggtcccaaa caagctagtc ttaatggagt cacattaatt 19860
ggagaagccg taaaaacaca gttcaattat tataagaaag ttgatggtgt tgtccaacaa 19920
ttacctgaaa cttactttac tcagagtaga aatttacaag aatttaaacc caggagtcaa 19980
atggaaattg atttcttaga attagctatg gatgaattca ttgaacggta taaattagaa 20040
ggctatgcct tcgaacatat cgtttatgga gattttagtc atagtcagtt aggtggttta 20100
catctactga ttggactagc taaacgtttt aaggaatcac cttttgaatt agaagatttt 20160
attcctatgg acagtacagt taaaaactat ttcataacag atgcgcaaac aggttcatct 20220
aagtgtgtgt gttctgttat tgatttatta cttgatgatt ttgttgaaat aataaaatcc 20280
caagatttat ctgtagtttc taaggttgtc aaagtgacta ttgactatac agaaatttca 20340
tttatgcttt ggtgtaaaga tggccatgta gaaacatttt acccaaaatt acaatctagt 20400
caagcgtggc aaccgggtgt tgctatgcct aatctttaca aaatgcaaag aatgctatta 20460
gaaaagtgtg accttcaaaa ttatggtgat agtgcaacat tacctaaagg cataatgatg 20520
aatgtcgcaa aatatactca actgtgtcaa tatttaaaca cattaacatt agctgtaccc 20580
tataatatga gagttataca ttttggtgct ggttctgata aaggagttgc accaggtaca 20640
gctgttttaa gacagtggtt gcctacgggt acgctgcttg tcgattcaga tcttaatgac 20700
tttgtctctg atgcagattc aactttgatt ggtgattgtg caactgtaca tacagctaat 20760
aaatgggatc tcattattag tgatatgtac gaccctaaga ctaaaaatgt tacaaaagaa 20820
aatgactcta aagagggttt tttcacttac atttgtgggt ttatacaaca aaagctagct 20880
cttggaggtt ccgtggctat aaagataaca gaacattctt ggaatgctga tctttataag 20940
ctcatgggac acttcgcatg gtggacagcc tttgttacta atgtgaatgc gtcatcatct 21000
gaagcatttt taattggatg taattatctt ggcaaaccac gcgaacaaat agatggttat 21060
gtcatgcatg caaattacat attttggagg aatacaaatc caattcagtt gtcttcctat 21120
tctttatttg acatgagtaa atttcccctt aaattaaggg gtactgctgt tatgtcttta 21180
aaagaaggtc aaatcaatga tatgatttta tctcttctta gtaaaggtag acttataatt 21240
agagaaaaca acagagttgt tatttctagt gatgttcttg ttaacaacta a 21291
<210> 502
<211> 13218
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 502
atggagagcc ttgtccctgg tttcaacgag aaaacacacg tccaactcag tttgcctgtt 60
ttacaggttc gcgacgtgct cgtacgtggc tttggagact ccgtggagga ggtcttatca 120
gaggcacgtc aacatcttaa agatggcact tgtggcttag tagaagttga aaaaggcgtt 180
ttgcctcaac ttgaacagcc ctatgtgttc atcaaacgtt cggatgctcg aactgcacct 240
catggtcatg ttatggttga gctggtagca gaactcgaag gcattcagta cggtcgtagt 300
ggtgagacac ttggtgtcct tgtccctcat gtgggcgaaa taccagtggc ttaccgcaag 360
gttcttcttc gtaagaacgg taataaagga gctggtggcc atagttacgg cgccgatcta 420
aagtcatttg acttaggcga cgagcttggc actgatcctt atgaagattt tcaagaaaac 480
tggaacacta aacatagcag tggtgttacc cgtgaactca tgcgtgagct taacggaggg 540
gcatacactc gctatgtcga taacaacttc tgtggccctg atggctaccc tcttgagtgc 600
attaaagacc ttctagcacg tgctggtaaa gcttcatgca ctttgtccga acaactggac 660
tttattgaca ctaagagggg tgtatactgc tgccgtgaac atgagcatga aattgcttgg 720
tacacggaac gttctgaaaa gagctatgaa ttgcagacac cttttgaaat taaattggca 780
aagaaatttg acaccttcaa tggggaatgt ccaaattttg tatttccctt aaattccata 840
atcaagacta ttcaaccaag ggttgaaaag aaaaagcttg atggctttat gggtagaatt 900
cgatctgtct atccagttgc gtcaccaaat gaatgcaacc aaatgtgcct ttcaactctc 960
atgaagtgtg atcattgtgg tgaaacttca tggcagacgg gcgattttgt taaagccact 1020
tgcgaatttt gtggcactga gaatttgact aaagaaggtg ccactacttg tggttactta 1080
ccccaaaatg ctgttgttaa aatttattgt ccagcatgtc acaattcaga agtaggacct 1140
gagcatagtc ttgccgaata ccataatgaa tctggcttga aaaccattct tcgtaagggt 1200
ggtcgcacta ttgcctttgg aggctgtgtg ttctcttatg ttggttgcca taacaagtgt 1260
gcctattggg ttccacgtgc tagcgctaac ataggttgta accatacagg tgttgttgga 1320
gaaggttccg aaggtcttaa tgacaacctt cttgaaatac tccaaaaaga gaaagtcaac 1380
atcaatattg ttggtgactt taaacttaat gaagagatcg ccattatttt ggcatctttt 1440
tctgcttcca caagtgcttt tgtggaaact gtgaaaggtt tggattataa agcattcaaa 1500
caaattgttg aatcctgtgg taattttaaa gttacaaaag gaaaagctaa aaaaggtgcc 1560
tggaatattg gtgaacagaa atcaatactg agtcctcttt atgcatttgc atcagaggct 1620
gctcgtgttg tacgatcaat tttctcccgc actcttgaaa ctgctcaaaa ttctgtgcgt 1680
gttttacaga aggccgctat aacaatacta gatggaattt cacagtattc actgagactc 1740
attgatgcta tgatgttcac atctgatttg gctactaaca atctagttgt aatggcctac 1800
attacaggtg gtgttgttca gttgacttcg cagtggctaa ctaacatctt tggcactgtt 1860
tatgaaaaac tcaaacccgt ccttgattgg cttgaagaga agtttaagga aggtgtagag 1920
tttcttagag acggttggga aattgttaaa tttatctcaa cctgtgcttg tgaaattgtc 1980
ggtggacaaa ttgtcacctg tgcaaaggaa attaaggaga gtgttcagac attctttaag 2040
cttgtaaata aatttttggc tttgtgtgct gactctatca ttattggtgg agctaaactt 2100
aaagccttga atttaggtga aacatttgtc acgcactcaa agggattgta cagaaagtgt 2160
gttaaatcca gagaagaaac tggcctactc atgcctctaa aagccccaaa agaaattatc 2220
ttcttagagg gagaaacact tcccacagaa gtgttaacag aggaagttgt cttgaaaact 2280
ggtgatttac aaccattaga acaacctact agtgaagctg ttgaagctcc attggttggt 2340
acaccagttt gtattaacgg gcttatgttg ctcgaaatca aagacacaga aaagtactgt 2400
gcccttgcac ctaatatgat ggtaacaaac aataccttca cactcaaagg cggtgcacca 2460
acaaaggtta cttttggtga tgacactgtg atagaagtgc aaggttacaa gagtgtgaat 2520
atcacttttg aacttgatga aaggattgat aaagtactta atgagaagtg ctctgcctat 2580
acagttgaac tcggtacaga agtaaatgag ttcgcctgtg ttgtggcaga tgctgtcata 2640
aaaactttgc aaccagtatc tgaattactt acaccactgg gcattgattt agatgagtgg 2700
agtatggcta catactactt atttgatgag tctggtgagt ttaaattggc ttcacatatg 2760
tattgttctt tctaccctcc agatgaggat gaagaagaag gtgattgtga agaagaagag 2820
tttgagccat caactcaata tgagtatggt actgaagatg attaccaagg taaacctttg 2880
gaatttggtg ccacttctgc tgctcttcaa cctgaagaag agcaagaaga agattggtta 2940
gatgatgata gtcaacaaac tgttggtcaa caagacggca gtgaggacaa tcagacaact 3000
actattcaaa caattgttga ggttcaacct caattagaga tggaacttac accagttgtt 3060
cagactattg aagtgaatag ttttagtggt tatttaaaac ttactgacaa tgtatacatt 3120
aaaaatgcag acattgtgga agaagctaaa aaggtaaaac caacagtggt tgttaatgca 3180
gccaatgttt accttaaaca tggaggaggt gttgcaggag ccttaaataa ggctactaac 3240
aatgccatgc aagttgaatc tgatgattac atagctacta atggaccact taaagtgggt 3300
ggtagttgtg ttttaagcgg acacaatctt gctaaacact gtcttcatgt tgtcggccca 3360
aatgttaaca aaggtgaaga cattcaactt cttaagagtg cttatgaaaa ttttaatcag 3420
cacgaagttc tacttgcacc attattatca gctggtattt ttggtgctga ccctatacat 3480
tctttaagag tttgtgtaga tactgttcgc acaaatgtct acttagctgt ctttgataaa 3540
aatctctatg acaaacttgt ttcaagcttt ttggaaatga agagtgaaaa gcaagttgaa 3600
caaaagatcg ctgagattcc taaagaggaa gttaagccat ttataactga aagtaaacct 3660
tcagttgaac agagaaaaca agatgataag aaaatcaaag cttgtgttga agaagttaca 3720
acaactctgg aagaaactaa gttcctcaca gaaaacttgt tactttatat tgacattaat 3780
ggcaatcttc atccagattc tgccactctt gttagtgaca ttgacatcac tttcttaaag 3840
aaagatgctc catatatagt gggtgatgtt gttcaagagg gtgttttaac tgctgtggtt 3900
atacctacta aaaaggctgg tggcactact gaaatgctag cgaaagcttt gagaaaagtg 3960
ccaacagaca attatataac cacttacccg ggtcagggtt taaatggtta cactgtagag 4020
gaggcaaaga cagtgcttaa aaagtgtaaa agtgcctttt acattctacc atctattatc 4080
tctaatgaga agcaagaaat tcttggaact gtttcttgga atttgcgaga aatgcttgca 4140
catgcagaag aaacacgcaa attaatgcct gtctgtgtgg aaactaaagc catagtttca 4200
actatacagc gtaaatataa gggtattaaa atacaagagg gtgtggttga ttatggtgct 4260
agattttact tttacaccag taaaacaact gtagcgtcac ttatcaacac acttaacgat 4320
ctaaatgaaa ctcttgttac aatgccactt ggctatgtaa cacatggctt aaatttggaa 4380
gaagctgctc ggtatatgag atctctcaaa gtgccagcta cagtttctgt ttcttcacct 4440
gatgctgtta cagcgtataa tggttatctt acttcttctt ctaaaacacc tgaagaacat 4500
tttattgaaa ccatctcact tgctggttcc tataaagatt ggtcctattc tggacaatct 4560
acacaactag gtatagaatt tcttaagaga ggtgataaaa gtgtatatta cactagtaat 4620
cctaccacat tccacctaga tggtgaagtt atcacctttg acaatcttaa gacacttctt 4680
tctttgagag aagtgaggac tattaaggtg tttacaacag tagacaacat taacctccac 4740
acgcaagttg tggacatgtc aatgacatat ggacaacagt ttggtccaac ttatttggat 4800
ggagctgatg ttactaaaat aaaacctcat aattcacatg aaggtaaaac attttatgtt 4860
ttacctaatg atgacactct acgtgttgag gcttttgagt actaccacac aactgatcct 4920
agttttctgg gtaggtacat gtcagcatta aatcacacta aaaagtggaa atacccacaa 4980
gttaatggtt taacttctat taaatgggca gataacaact gttatcttgc cactgcattg 5040
ttaacactcc aacaaataga gttgaagttt aatccacctg ctctacaaga tgcttattac 5100
agagcaaggg ctggtgaagc tgctaacttt tgtgcactta tcttagccta ctgtaataag 5160
acagtaggtg agttaggtga tgttagagaa acaatgagtt acttgtttca acatgccaat 5220
ttagattctt gcaaaagagt cttgaacgtg gtgtgtaaaa cttgtggaca acagcagaca 5280
acccttaagg gtgtagaagc tgttatgtac atgggcacac tttcttatga acaatttaag 5340
aaaggtgttc agataccttg tacgtgtggt aaacaagcta caaaatatct agtacaacag 5400
gagtcacctt ttgttatgat gtcagcacca cctgctcagt atgaacttaa gcatggtaca 5460
tttacttgtg ctagtgagta cactggtaat taccagtgtg gtcactataa acatataact 5520
tctaaagaaa ctttgtattg catagacggt gctttactta caaagtcctc agaatacaaa 5580
ggtcctatta cggatgtttt ctacaaagaa aacagttaca caacaaccat aaaaccagtt 5640
acttataaat tggatggtgt tgtttgtaca gaaattgacc ctaagttgga caattattat 5700
aagaaagaca attcttattt cacagagcaa ccaattgatc ttgtaccaaa ccaaccatat 5760
ccaaacgcaa gcttcgataa ttttaagttt gtatgtgata atatcaaatt tgctgatgat 5820
ttaaaccagt taactggtta taagaaacct gcttcaagag agcttaaagt tacatttttc 5880
cctgacttaa atggtgatgt ggtggctatt gattataaac actacacacc ctcttttaag 5940
aaaggagcta aattgttaca taaacctatt gtttggcatg ttaacaatgc aactaataaa 6000
gccacgtata aaccaaatac ctggtgtata cgttgtcttt ggagcacaaa accagttgaa 6060
acatcaaatt cgtttgatgt actgaagtca gaggacgcgc agggaatgga taatcttgcc 6120
tgcgaagatc taaaaccagt ctctgaagaa gtagtggaaa atcctaccat acagaaagac 6180
gttcttgagt gtaatgtgaa aactaccgaa gttgtaggag acattatact taaaccagca 6240
aataatagtt taaaaattac agaagaggtt ggccacacag atctaatggc tgcttatgta 6300
gacaattcta gtcttactat taagaaacct aatgaattat ctagagtatt aggtttgaaa 6360
acccttgcta ctcatggttt agctgctgtt aatagtgtcc cttgggatac tatagctaat 6420
tatgctaagc cttttcttaa caaagttgtt agtacaacta ctaacatagt tacacggtgt 6480
ttaaaccgtg tttgtactaa ttatatgcct tatttcttta ctttattgct acaattgtgt 6540
acttttacta gaagtacaaa ttctagaatt aaagcatcta tgccgactac tatagcaaag 6600
aatactgtta agagtgtcgg taaattttgt ctagaggctt catttaatta tttgaagtca 6660
cctaattttt ctaaactgat aaatattata atttggtttt tactattaag tgtttgccta 6720
ggttctttaa tctactcaac cgctgcttta ggtgttttaa tgtctaattt aggcatgcct 6780
tcttactgta ctggttacag agaaggctat ttgaactcta ctaatgtcac tattgcaacc 6840
tactgtactg gttctatacc ttgtagtgtt tgtcttagtg gtttagattc tttagacacc 6900
tatccttctt tagaaactat acaaattacc atttcatctt ttaaatggga tttaactgct 6960
tttggcttag ttgcagagtg gtttttggca tatattcttt tcactaggtt tttctatgta 7020
cttggattgg ctgcaatcat gcaattgttt ttcagctatt ttgcagtaca ttttattagt 7080
aattcttggc ttatgtggtt aataattaat cttgtacaaa tggccccgat ttcagctatg 7140
gttagaatgt acatcttctt tgcatcattt tattatgtat ggaaaagtta tgtgcatgtt 7200
gtagacggtt gtaattcatc aacttgtatg atgtgttaca aacgtaatag agcaacaaga 7260
gtcgaatgta caactattgt taatggtgtt agaaggtcct tttatgtcta tgctaatgga 7320
ggtaaaggct tttgcaaact acacaattgg aattgtgtta attgtgatac attctgtgct 7380
ggtagtacat ttattagtga tgaagttgcg agagacttgt cactacagtt taaaagacca 7440
ataaatccta ctgaccagtc ttcttacatc gttgatagtg ttacagtgaa gaatggttcc 7500
atccatcttt actttgataa agctggtcaa aagacttatg aaagacattc tctctctcat 7560
tttgttaact tagacaacct gagagctaat aacactaaag gttcattgcc tattaatgtt 7620
atagtttttg atggtaaatc aaaatgtgaa gaatcatctg caaaatcagc gtctgtttac 7680
tacagtcagc ttatgtgtca acctatactg ttactagatc aggcattagt gtctgatgtt 7740
ggtgatagtg cggaagttgc agttaaaatg tttgatgctt acgttaatac gttttcatca 7800
acttttaacg taccaatgga aaaactcaaa acactagttg caactgcaga agctgaactt 7860
gcaaagaatg tgtccttaga caatgtctta tctactttta tttcagcagc tcggcaaggg 7920
tttgttgatt cagatgtaga aactaaagat gttgttgaat gtcttaaatt gtcacatcaa 7980
tctgacatag aagttactgg cgatagttgt aataactata tgctcaccta taacaaagtt 8040
gaaaacatga caccccgtga ccttggtgct tgtattgact gtagtgcgcg tcatattaat 8100
gcgcaggtag caaaaagtca caacattgct ttgatatgga acgttaaaga tttcatgtca 8160
ttgtctgaac aactacgaaa acaaatacgt agtgctgcta aaaagaataa cttacctttt 8220
aagttgacat gtgcaactac tagacaagtt gttaatgttg taacaacaaa gatagcactt 8280
aagggtggta aaattgttaa taattggttg aagcagttaa ttaaagttac acttgtgttc 8340
ctttttgttg ctgctatttt ctatttaata acacctgttc atgtcatgtc taaacatact 8400
gacttttcaa gtgaaatcat aggatacaag gctattgatg gtggtgtcac tcgtgacata 8460
gcatctacag atacttgttt tgctaacaaa catgctgatt ttgacacatg gtttagccag 8520
cgtggtggta gttatactaa tgacaaagct tgcccattga ttgctgcagt cataacaaga 8580
gaagtgggtt ttgtcgtgcc tggtttgcct ggcacgatat tacgcacaac taatggtgac 8640
tttttgcatt tcttacctag agtttttagt gcagttggta acatctgtta cacaccatca 8700
aaacttatag agtacactga ctttgcaaca tcagcttgtg ttttggctgc tgaatgtaca 8760
atttttaaag atgcttctgg taagccagta ccatattgtt atgataccaa tgtactagaa 8820
ggttctgttg cttatgaaag tttacgccct gacacacgtt atgtgctcat ggatggctct 8880
attattcaat ttcctaacac ctaccttgaa ggttctgtta gagtggtaac aacttttgat 8940
tctgagtact gtaggcacgg cacttgtgaa agatcagaag ctggtgtttg tgtatctact 9000
agtggtagat gggtacttaa caatgattat tacagatctt taccaggagt tttctgtggt 9060
gtagatgctg taaatttact tactaatatg tttacaccac taattcaacc tattggtgct 9120
ttggacatat cagcatctat agtagctggt ggtattgtag ctatcgtagt aacatgcctt 9180
gcctactatt ttatgaggtt tagaagagct tttggtgaat acagtcatgt agttgccttt 9240
aatactttac tattccttat gtcattcact gtactctgtt taacaccagt ttactcattc 9300
ttacctggtg tttattctgt tatttacttg tacttgacat tttatcttac taatgatgtt 9360
tcttttttag cacatattca gtggatggtt atgttcacac ctttagtacc tttctggata 9420
acaattgctt atatcatttg tatttccaca aagcatttct attggttctt tagtaattac 9480
ctaaagagac gtgtagtctt taatggtgtt tcctttagta cttttgaaga agctgcgctg 9540
tgcacctttt tgttaaataa agaaatgtat ctaaagttgc gtagtgatgt gctattacct 9600
cttacgcaat ataatagata cttagctctt tataataagt acaagtattt tagtggagca 9660
atggatacaa ctagctacag agaagctgct tgttgtcatc tcgcaaaggc tctcaatgac 9720
ttcagtaact caggttctga tgttctttac caaccaccac aaacctctat cacctcagct 9780
gttttgcaga gtggttttag aaaaatggca ttcccatctg gtaaagttga gggttgtatg 9840
gtacaagtaa cttgtggtac aactacactt aacggtcttt ggcttgatga cgtagtttac 9900
tgtccaagac atgtgatctg cacctctgaa gacatgctta accctaatta tgaagattta 9960
ctcattcgta agtctaatca taatttcttg gtacaggctg gtaatgttca actcagggtt 10020
attggacatt ctatgcaaaa ttgtgtactt aagcttaagg ttgatacagc caatcctaag 10080
acacctaagt ataagtttgt tcgcattcaa ccaggacaga ctttttcagt gttagcttgt 10140
tacaatggtt caccatctgg tgtttaccaa tgtgctatga ggcccaattt cactattaag 10200
ggttcattcc ttaatggttc atgtggtagt gttggtttta acatagatta tgactgtgtc 10260
tctttttgtt acatgcacca tatggaatta ccaactggag ttcatgctgg cacagactta 10320
gaaggtaact tttatggacc ttttgttgac aggcaaacag cacaagcagc tggtacggac 10380
acaactatta cagttaatgt tttagcttgg ttgtacgctg ctgttataaa tggagacagg 10440
tggtttctca atcgatttac cacaactctt aatgacttta accttgtggc tatgaagtac 10500
aattatgaac ctctaacaca agaccatgtt gacatactag gacctctttc tgctcaaact 10560
ggaattgccg ttttagatat gtgtgcttca ttaaaagaat tactgcaaaa tggtatgaat 10620
ggacgtacca tattgggtag tgctttatta gaagatgaat ttacaccttt tgatgttgtt 10680
agacaatgct caggtgttac tttccaaagt gcagtgaaaa gaacaatcaa gggtacacac 10740
cactggttgt tactcacaat tttgacttca cttttagttt tagtccagag tactcaatgg 10800
tctttgttct tttttttgta tgaaaatgcc tttttacctt ttgctatggg tattattgct 10860
atgtctgctt ttgcaatgat gtttgtcaaa cataagcatg catttctctg tttgtttttg 10920
ttaccttctc ttgccactgt agcttatttt aatatggtct atatgcctgc tagttgggtg 10980
atgcgtatta tgacatggtt ggatatggtt gatactagtt tgtctggttt taagctaaaa 11040
gactgtgtta tgtatgcatc agctgtagtg ttactaatcc ttatgacagc aagaactgtg 11100
tatgatgatg gtgctaggag agtgtggaca cttatgaatg tcttgacact cgtttataaa 11160
gtttattatg gtaatgcttt agatcaagcc atttccatgt gggctcttat aatctctgtt 11220
acttctaact actcaggtgt agttacaact gtcatgtttt tggccagagg tattgttttt 11280
atgtgtgttg agtattgccc tattttcttc ataactggta atacacttca gtgtataatg 11340
ctagtttatt gtttcttagg ctatttttgt acttgttact ttggcctctt ttgtttactc 11400
aaccgctact ttagactgac tcttggtgtt tatgattact tagtttctac acaggagttt 11460
agatatatga attcacaggg actactccca cccaagaata gcatagatgc cttcaaactc 11520
aacattaaat tgttgggtgt tggtggcaaa ccttgtatca aagtagccac tgtacagtct 11580
aaaatgtcag atgtaaagtg cacatcagta gtcttactct cagttttgca acaactcaga 11640
gtagaatcat catctaaatt gtgggctcaa tgtgtccagt tacacaatga cattctctta 11700
gctaaagata ctactgaagc ctttgaaaaa atggtttcac tactttctgt tttgctttcc 11760
atgcagggtg ctgtagacat aaacaagctt tgtgaagaaa tgctggacaa cagggcaacc 11820
ttacaagcta tagcctcaga gtttagttcc cttccatcat atgcagcttt tgctactgct 11880
caagaagctt atgagcaggc tgttgctaat ggtgattctg aagttgttct taaaaagttg 11940
aagaagtctt tgaatgtggc taaatctgaa tttgaccgtg atgcagccat gcaacgtaag 12000
ttggaaaaga tggctgatca agctatgacc caaatgtata aacaggctag atctgaggac 12060
aagagggcaa aagttactag tgctatgcag acaatgcttt tcactatgct tagaaagttg 12120
gataatgatg cactcaacaa cattatcaac aatgcaagag atggttgtgt tcccttgaac 12180
ataatacctc ttacaacagc agccaaacta atggttgtca taccagacta taacacatat 12240
aaaaatacgt gtgatggtac aacatttact tatgcatcag cattgtggga aatccaacag 12300
gttgtagatg cagatagtaa aattgttcaa cttagtgaaa ttagtatgga caattcacct 12360
aatttagcat ggcctcttat tgtaacagct ttaagggcca attctgctgt caaattacag 12420
aataatgagc ttagtcctgt tgcactacga cagatgtctt gtgctgccgg tactacacaa 12480
actgcttgca ctgatgacaa tgcgttagct tactacaaca caacaaaggg aggtaggttt 12540
gtacttgcac tgttatccga tttacaggat ttgaaatggg ctagattccc taagagtgat 12600
ggaactggta ctatctatac agaactggaa ccaccttgta ggtttgttac agacacacct 12660
aaaggtccta aagtgaagta tttatacttt attaaaggat taaacaacct aaatagaggt 12720
atggtacttg gtagtttagc tgccacagta cgtctacaag ctggtaatgc aacagaagtg 12780
cctgccaatt caactgtatt atctttctgt gcttttgctg tagatgctgc taaagcttac 12840
aaagattatc tagctagtgg gggacaacca atcactaatt gtgttaagat gttgtgtaca 12900
cacactggta ctggtcaggc aataacagtt acaccggaag ccaatatgga tcaagaatcc 12960
tttggtggtg catcgtgttg tctgtactgc cgttgccaca tagatcatcc aaatcctaaa 13020
ggattttgtg acttaaaagg taagtatgta caaataccta caacttgtgc taatgaccct 13080
gtgggtttta cacttaaaaa cacagtctgt accgtctgcg gtatgtggaa aggttatggc 13140
tgtagttgtg atcaactccg cgaacccatg cttcagtcag ctgatgcaca atcgttttta 13200
aacgggtttg cggtgtaa 13218
<210> 503
<211> 3822
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 503
atgtttgttt ttcttgtttt attgccacta gtctctagtc agtgtgttaa tcttacaacc 60
agaactcaat taccccctgc atacactaat tctttcacac gtggtgttta ttaccctgac 120
aaagttttca gatcctcagt tttacattca actcaggact tgttcttacc tttcttttcc 180
aatgttactt ggttccatgc tatacatgtc tctgggacca atggtactaa gaggtttgat 240
aaccctgtcc taccatttaa tgatggtgtt tattttgctt ccactgagaa gtctaacata 300
ataagaggct ggatttttgg tactacttta gattcgaaga cccagtccct acttattgtt 360
aataacgcta ctaatgttgt tattaaagtc tgtgaatttc aattttgtaa tgatccattt 420
ttgggtgttt attaccacaa aaacaacaaa agttggatgg aaagtgagtt cagagtttat 480
tctagtgcga ataattgcac ttttgaatat gtctctcagc cttttcttat ggaccttgaa 540
ggaaaacagg gtaatttcaa aaatcttagg gaatttgtgt ttaagaatat tgatggttat 600
tttaaaatat attctaagca cacgcctatt aatttagtgc gtgatctccc tcagggtttt 660
tcggctttag aaccattggt agatttgcca ataggtatta acatcactag gtttcaaact 720
ttacttgctt tacatagaag ttatttgact cctggtgatt cttcttcagg ttggacagct 780
ggtgctgcag cttattatgt gggttatctt caacctagga cttttctatt aaaatataat 840
gaaaatggaa ccattacaga tgctgtagac tgtgcacttg accctctctc agaaacaaag 900
tgtacgttga aatccttcac tgtagaaaaa ggaatctatc aaacttctaa ctttagagtc 960
caaccaacag aatctattgt tagatttcct aatattacaa acttgtgccc ttttggtgaa 1020
gtttttaacg ccaccagatt tgcatctgtt tatgcttgga acaggaagag aatcagcaac 1080
tgtgttgctg attattctgt cctatataat tccgcatcat tttccacttt taagtgttat 1140
ggagtgtctc ctactaaatt aaatgatctc tgctttacta atgtctatgc agattcattt 1200
gtaattagag gtgatgaagt cagacaaatc gctccagggc aaactggaaa gattgctgat 1260
tataattata aattaccaga tgattttaca ggctgcgtta tagcttggaa ttctaacaat 1320
cttgattcta aggttggtgg taattataat tacctgtata gattgtttag gaagtctaat 1380
ctcaaacctt ttgagagaga tatttcaact gaaatctatc aggccggtag cacaccttgt 1440
aatggtgttg aaggttttaa ttgttacttt cctttacaat catatggttt ccaacccact 1500
aatggtgttg gttaccaacc atacagagta gtagtacttt cttttgaact tctacatgca 1560
ccagcaactg tttgtggacc taaaaagtct actaatttgg ttaaaaacaa atgtgtcaat 1620
ttcaacttca atggtttaac aggcacaggt gttcttactg agtctaacaa aaagtttctg 1680
cctttccaac aatttggcag agacattgct gacactactg atgctgtccg tgatccacag 1740
acacttgaga ttcttgacat tacaccatgt tcttttggtg gtgtcagtgt tataacacca 1800
ggaacaaata cttctaacca ggttgctgtt ctttatcagg atgttaactg cacagaagtc 1860
cctgttgcta ttcatgcaga tcaacttact cctacttggc gtgtttattc tacaggttct 1920
aatgtttttc aaacacgtgc aggctgttta ataggggctg aacatgtcaa caactcatat 1980
gagtgtgaca tacccattgg tgcaggtata tgcgctagtt atcagactca gactaattct 2040
cctcggcggg cacgtagtgt agctagtcaa tccatcattg cctacactat gtcacttggt 2100
gcagaaaatt cagttgctta ctctaataac tctattgcca tacccacaaa ttttactatt 2160
agtgttacca cagaaattct accagtgtct atgaccaaga catcagtaga ttgtacaatg 2220
tacatttgtg gtgattcaac tgaatgcagc aatcttttgt tgcaatatgg cagtttttgt 2280
acacaattaa accgtgcttt aactggaata gctgttgaac aagacaaaaa cacccaagaa 2340
gtttttgcac aagtcaaaca aatttacaaa acaccaccaa ttaaagattt tggtggtttt 2400
aatttttcac aaatattacc agatccatca aaaccaagca agaggtcatt tattgaagat 2460
ctacttttca acaaagtgac acttgcagat gctggcttca tcaaacaata tggtgattgc 2520
cttggtgata ttgctgctag agacctcatt tgtgcacaaa agtttaacgg ccttactgtt 2580
ttgccacctt tgctcacaga tgaaatgatt gctcaataca cttctgcact gttagcgggt 2640
acaatcactt ctggttggac ctttggtgca ggtgctgcat tacaaatacc atttgctatg 2700
caaatggctt ataggtttaa tggtattgga gttacacaga atgttctcta tgagaaccaa 2760
aaattgattg ccaaccaatt taatagtgct attggcaaaa ttcaagactc actttcttcc 2820
acagcaagtg cacttggaaa acttcaagat gtggtcaacc aaaatgcaca agctttaaac 2880
acgcttgtta aacaacttag ctccaatttt ggtgcaattt caagtgtttt aaatgatatc 2940
ctttcacgtc ttgacaaagt tgaggctgaa gtgcaaattg ataggttgat cacaggcaga 3000
cttcaaagtt tgcagacata tgtgactcaa caattaatta gagctgcaga aatcagagct 3060
tctgctaatc ttgctgctac taaaatgtca gagtgtgtac ttggacaatc aaaaagagtt 3120
gatttttgtg gaaagggcta tcatcttatg tccttccctc agtcagcacc tcatggtgta 3180
gtcttcttgc atgtgactta tgtccctgca caagaaaaga acttcacaac tgctcctgcc 3240
atttgtcatg atggaaaagc acactttcct cgtgaaggtg tctttgtttc aaatggcaca 3300
cactggtttg taacacaaag gaatttttat gaaccacaaa tcattactac agacaacaca 3360
tttgtgtctg gtaactgtga tgttgtaata ggaattgtca acaacacagt ttatgatcct 3420
ttgcaacctg aattagactc attcaaggag gagttagata aatattttaa gaatcataca 3480
tcaccagatg ttgatttagg tgacatctct ggcattaatg cttcagttgt aaacattcaa 3540
aaagaaattg accgcctcaa tgaggttgcc aagaatttaa atgaatctct catcgatctc 3600
caagaacttg gaaagtatga gcagtatata aaatggccat ggtacatttg gctaggtttt 3660
atagctggct tgattgccat agtaatggtg acaattatgc tttgctgtat gaccagttgc 3720
tgtagttgtc tcaagggctg ttgttcttgt ggatcctgct gcaaatttga tgaagacgac 3780
tctgagccag tgctcaaagg agtcaaatta cattacacat aa 3822
<210> 504
<211> 828
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 504
atggatttgt ttatgagaat cttcacaatt ggaactgtaa ctttgaagca aggtgaaatc 60
aaggatgcta ctccttcaga ttttgttcgc gctactgcaa cgataccgat acaagcctca 120
ctccctttcg gatggcttat tgttggcgtt gcacttcttg ctgtttttca gagcgcttcc 180
aaaatcataa ccctcaaaaa gagatggcaa ctagcactct ccaagggtgt tcactttgtt 240
tgcaacttgc tgttgttgtt tgtaacagtt tactcacacc ttttgctcgt tgctgctggc 300
cttgaagccc cttttctcta tctttatgct ttagtctact tcttgcagag tataaacttt 360
gtaagaataa taatgaggct ttggctttgc tggaaatgcc gttccaaaaa cccattactt 420
tatgatgcca actattttct ttgctggcat actaattgtt acgactattg tataccttac 480
aatagtgtaa cttcttcaat tgtcattact tcaggtgatg gcacaacaag tcctatttct 540
gaacatgact accagattgg tggttatact gaaaaatggg aatctggagt aaaagactgt 600
gttgtattac acagttactt cacttcagac tattaccagc tgtactcaac tcaattgagt 660
acagacactg gtgttgaaca tgttaccttc ttcatctaca ataaaattgt tgatgagcct 720
gaagaacatg tccaaattca cacaatcgac ggttcatccg gagttgttaa tccagtaatg 780
gaaccaattt atgatgaacc gacgacgact actagcgtgc ctttgtaa 828
<210> 505
<211> 228
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 505
atgtactcat tcgtttcgga agagacaggt acgttaatag ttaatagcgt acttcttttt 60
cttgctttcg tggtattctt gctagttaca ctagccatcc ttactgcgct tcgattgtgt 120
gcgtactgct gcaatattgt taacgtgagt cttgtaaaac cttcttttta cgtttactct 180
cgtgttaaaa atctgaattc ttctagagtt cctgatcttc tggtctaa 228
<210> 506
<211> 669
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 506
atggcagatt ccaacggtac tattaccgtt gaagagctta aaaagctcct tgaacaatgg 60
aacctagtaa taggtttcct attccttaca tggatttgtc ttctacaatt tgcctatgcc 120
aacaggaata ggtttttgta tataattaag ttaattttcc tctggctgtt atggccagta 180
actttagctt gttttgtgct tgctgctgtt tacagaataa attggatcac cggtggaatt 240
gctatcgcaa tggcttgtct tgtaggcttg atgtggctca gctacttcat tgcttctttc 300
agactgtttg cgcgtacgcg ttccatgtgg tcattcaatc cagaaactaa cattcttctc 360
aacgtgccac tccatggcac tattctgacc agaccgcttc tagaaagtga actcgtaatc 420
ggagctgtga tccttcgtgg acatcttcgt attgctggac accatctagg acgctgtgac 480
atcaaggacc tgcctaaaga aatcactgtt gctacatcac gaacgctttc ttattacaaa 540
ttgggagctt cgcagcgtgt agcaggtgac tcaggttttg ctgcatacag tcgctacagg 600
attggcaact ataaattaaa cacagaccat tccagtagca gtgacaatat tgctttgctt 660
gtacagtaa 669
<210> 507
<211> 186
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 507
atgtttcatc tcgttgactt tcaggttact atagcagaga tattactaat tattatgagg 60
acttttaaag tttccatttg gaatcttgat tacatcataa acctcataat taaaaattta 120
tctaagtcac taactgagaa taaatattct caattagatg aagagcaacc aatggagatt 180
gattaa 186
<210> 508
<211> 366
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 508
atgaaaatta ttcttttctt ggcactgata acactcgcta cttgtgagct ttatcactac 60
caagagtgtg ttagaggtac aacagtactt ttaaaagaac cttgctcttc tggaacatac 120
gagggcaatt caccatttca tcctctagct gataacaaat ttgcactgac ttgctttagc 180
actcaatttg cttttgcttg tcctgacggc gtaaaacacg tctatcagtt acgtgccaga 240
tcagtttcac ctaaactgtt catcagacaa gaggaagttc aagaacttta ctctccaatt 300
tttcttattg ttgcggcaat agtgtttata acactttgct tcacactcaa aagaaagaca 360
gaatga 366
<210> 509
<211> 132
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 509
atgattgaac tttcattaat tgacttctat ttgtgctttt tagcctttct gctattcctt 60
gttttaatta tgcttattat cttttggttc tcacttgaac tgcaagatca taatgaaact 120
tgtcacgcct aa 132
<210> 510
<211> 366
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 510
atgaaatttc ttgttttctt aggaatcatc acaactgtag ctgcatttca ccaagaatgt 60
agtttacagt catgtactca acatcaacca tatgtagttg atgacccgtg tcctattcac 120
ttctattcta aatggtatat tagagtagga gctagaaaat cagcaccttt aattgaattg 180
tgcgtggatg aggctggttc taaatcaccc attcagtaca tcgatatcgg taattataca 240
gtttcctgtt taccttttac aattaattgc caggaaccta aattgggtag tcttgtagtg 300
cgttgttcgt tctatgaaga ctttttagag tatcatgacg ttcgtgttgt tttagatttc 360
atctaa 366
<210> 511
<211> 1260
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 511
atgtctgata atggacccca aaatcagcga aatgcacccc gcattacgtt tggtggaccc 60
tcagattcaa ctggcagtaa ccagaatgga gaacgcagtg gggcgcgatc aaaacaacgt 120
cggccccaag gtttacccaa taatactgcg tcttggttca ccgctctcac tcaacatggc 180
aaggaagacc ttaaattccc tcgaggacaa ggcgttccaa ttaacaccaa tagcagtcca 240
gatgaccaaa ttggctacta ccgaagagct accagacgaa ttcgtggtgg tgacggtaaa 300
atgaaagatc tcagtccaag atggtatttc tactacctag gaactgggcc agaagctgga 360
cttccctatg gtgctaacaa agacggcatc atatgggttg caactgaggg agccttgaat 420
acaccaaaag atcacattgg cacccgcaat cctgctaaca atgctgcaat cgtgctacaa 480
cttcctcaag gaacaacatt gccaaaaggc ttctacgcag aagggagcag aggcggcagt 540
caagcctctt ctcgttcctc atcacgtagt cgcaacagtt caagaaattc aactccaggc 600
agcagtaggg gaacttctcc tgctagaatg gctggcaatg gcggtgatgc tgctcttgct 660
ttgctgctgc ttgacagatt gaaccagctt gagagcaaaa tgtctggtaa aggccaacaa 720
caacaaggcc aaactgtcac taagaaatct gctgctgagg cttctaagaa gcctcggcaa 780
aaacgtactg ccactaaagc atacaatgta acacaagctt tcggcagacg tggtccagaa 840
caaacccaag gaaattttgg ggaccaggaa ctaatcagac aaggaactga ttacaaacat 900
tggccgcaaa ttgcacaatt tgcccccagc gcttcagcgt tcttcggaat gtcgcgcatt 960
ggcatggaag tcacaccttc gggaacgtgg ttgacctaca caggtgccat caaattggat 1020
gacaaagatc caaatttcaa agatcaagtc attttgctga ataagcatat tgacgcatac 1080
aaaacattcc caccaacaga gcctaaaaag gacaaaaaga agaaggctga tgaaactcaa 1140
gccttaccgc agagacagaa gaaacagcaa actgtgactc ttcttcctgc tgcagatttg 1200
gatgatttct ccaaacaatt gcaacaatcc atgagcagtg ctgactcaac tcaggcctaa 1260
<210> 512
<211> 117
<212> DNA
<213> Severe acute respiratory syndrome coronavirus 2
<400> 512
atgggctata taaacgtttt cgcttttccg tttacgatat atagtctact cttgtgcaga 60
atgaattctc gtaactacat agcacaagta gatgtagtta actttaatct cacatag 117
<210> 513
<400> 513
000
<210> 514
<400> 514
000
<210> 515
<400> 515
000
<210> 516
<400> 516
000
<210> 517
<400> 517
000
<210> 518
<400> 518
000
<210> 519
<400> 519
000
<210> 520
<400> 520
000
<210> 521
<400> 521
000
<210> 522
<400> 522
000
<210> 523
<400> 523
000
<210> 524
<400> 524
000
<210> 525
<400> 525
000
<210> 526
<400> 526
000
<210> 527
<400> 527
000
<210> 528
<400> 528
000
<210> 529
<400> 529
000
<210> 530
<400> 530
000
<210> 531
<400> 531
000
<210> 532
<400> 532
000
<210> 533
<400> 533
000
<210> 534
<400> 534
000
<210> 535
<400> 535
000
<210> 536
<400> 536
000
<210> 537
<400> 537
000
<210> 538
<400> 538
000
<210> 539
<400> 539
000
<210> 540
<400> 540
000
<210> 541
<400> 541
000
<210> 542
<400> 542
000
<210> 543
<400> 543
000
<210> 544
<400> 544
000
<210> 545
<400> 545
000
<210> 546
<400> 546
000
<210> 547
<400> 547
000
<210> 548
<400> 548
000
<210> 549
<400> 549
000
<210> 550
<400> 550
000
<210> 551
<211> 7096
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 551
Met Glu Ser Leu Val Pro Gly Phe Asn Glu Lys Thr His Val Gln Leu
1 5 10 15
Ser Leu Pro Val Leu Gln Val Arg Asp Val Leu Val Arg Gly Phe Gly
20 25 30
Asp Ser Val Glu Glu Val Leu Ser Glu Ala Arg Gln His Leu Lys Asp
35 40 45
Gly Thr Cys Gly Leu Val Glu Val Glu Lys Gly Val Leu Pro Gln Leu
50 55 60
Glu Gln Pro Tyr Val Phe Ile Lys Arg Ser Asp Ala Arg Thr Ala Pro
65 70 75 80
His Gly His Val Met Val Glu Leu Val Ala Glu Leu Glu Gly Ile Gln
85 90 95
Tyr Gly Arg Ser Gly Glu Thr Leu Gly Val Leu Val Pro His Val Gly
100 105 110
Glu Ile Pro Val Ala Tyr Arg Lys Val Leu Leu Arg Lys Asn Gly Asn
115 120 125
Lys Gly Ala Gly Gly His Ser Tyr Gly Ala Asp Leu Lys Ser Phe Asp
130 135 140
Leu Gly Asp Glu Leu Gly Thr Asp Pro Tyr Glu Asp Phe Gln Glu Asn
145 150 155 160
Trp Asn Thr Lys His Ser Ser Gly Val Thr Arg Glu Leu Met Arg Glu
165 170 175
Leu Asn Gly Gly Ala Tyr Thr Arg Tyr Val Asp Asn Asn Phe Cys Gly
180 185 190
Pro Asp Gly Tyr Pro Leu Glu Cys Ile Lys Asp Leu Leu Ala Arg Ala
195 200 205
Gly Lys Ala Ser Cys Thr Leu Ser Glu Gln Leu Asp Phe Ile Asp Thr
210 215 220
Lys Arg Gly Val Tyr Cys Cys Arg Glu His Glu His Glu Ile Ala Trp
225 230 235 240
Tyr Thr Glu Arg Ser Glu Lys Ser Tyr Glu Leu Gln Thr Pro Phe Glu
245 250 255
Ile Lys Leu Ala Lys Lys Phe Asp Thr Phe Asn Gly Glu Cys Pro Asn
260 265 270
Phe Val Phe Pro Leu Asn Ser Ile Ile Lys Thr Ile Gln Pro Arg Val
275 280 285
Glu Lys Lys Lys Leu Asp Gly Phe Met Gly Arg Ile Arg Ser Val Tyr
290 295 300
Pro Val Ala Ser Pro Asn Glu Cys Asn Gln Met Cys Leu Ser Thr Leu
305 310 315 320
Met Lys Cys Asp His Cys Gly Glu Thr Ser Trp Gln Thr Gly Asp Phe
325 330 335
Val Lys Ala Thr Cys Glu Phe Cys Gly Thr Glu Asn Leu Thr Lys Glu
340 345 350
Gly Ala Thr Thr Cys Gly Tyr Leu Pro Gln Asn Ala Val Val Lys Ile
355 360 365
Tyr Cys Pro Ala Cys His Asn Ser Glu Val Gly Pro Glu His Ser Leu
370 375 380
Ala Glu Tyr His Asn Glu Ser Gly Leu Lys Thr Ile Leu Arg Lys Gly
385 390 395 400
Gly Arg Thr Ile Ala Phe Gly Gly Cys Val Phe Ser Tyr Val Gly Cys
405 410 415
His Asn Lys Cys Ala Tyr Trp Val Pro Arg Ala Ser Ala Asn Ile Gly
420 425 430
Cys Asn His Thr Gly Val Val Gly Glu Gly Ser Glu Gly Leu Asn Asp
435 440 445
Asn Leu Leu Glu Ile Leu Gln Lys Glu Lys Val Asn Ile Asn Ile Val
450 455 460
Gly Asp Phe Lys Leu Asn Glu Glu Ile Ala Ile Ile Leu Ala Ser Phe
465 470 475 480
Ser Ala Ser Thr Ser Ala Phe Val Glu Thr Val Lys Gly Leu Asp Tyr
485 490 495
Lys Ala Phe Lys Gln Ile Val Glu Ser Cys Gly Asn Phe Lys Val Thr
500 505 510
Lys Gly Lys Ala Lys Lys Gly Ala Trp Asn Ile Gly Glu Gln Lys Ser
515 520 525
Ile Leu Ser Pro Leu Tyr Ala Phe Ala Ser Glu Ala Ala Arg Val Val
530 535 540
Arg Ser Ile Phe Ser Arg Thr Leu Glu Thr Ala Gln Asn Ser Val Arg
545 550 555 560
Val Leu Gln Lys Ala Ala Ile Thr Ile Leu Asp Gly Ile Ser Gln Tyr
565 570 575
Ser Leu Arg Leu Ile Asp Ala Met Met Phe Thr Ser Asp Leu Ala Thr
580 585 590
Asn Asn Leu Val Val Met Ala Tyr Ile Thr Gly Gly Val Val Gln Leu
595 600 605
Thr Ser Gln Trp Leu Thr Asn Ile Phe Gly Thr Val Tyr Glu Lys Leu
610 615 620
Lys Pro Val Leu Asp Trp Leu Glu Glu Lys Phe Lys Glu Gly Val Glu
625 630 635 640
Phe Leu Arg Asp Gly Trp Glu Ile Val Lys Phe Ile Ser Thr Cys Ala
645 650 655
Cys Glu Ile Val Gly Gly Gln Ile Val Thr Cys Ala Lys Glu Ile Lys
660 665 670
Glu Ser Val Gln Thr Phe Phe Lys Leu Val Asn Lys Phe Leu Ala Leu
675 680 685
Cys Ala Asp Ser Ile Ile Ile Gly Gly Ala Lys Leu Lys Ala Leu Asn
690 695 700
Leu Gly Glu Thr Phe Val Thr His Ser Lys Gly Leu Tyr Arg Lys Cys
705 710 715 720
Val Lys Ser Arg Glu Glu Thr Gly Leu Leu Met Pro Leu Lys Ala Pro
725 730 735
Lys Glu Ile Ile Phe Leu Glu Gly Glu Thr Leu Pro Thr Glu Val Leu
740 745 750
Thr Glu Glu Val Val Leu Lys Thr Gly Asp Leu Gln Pro Leu Glu Gln
755 760 765
Pro Thr Ser Glu Ala Val Glu Ala Pro Leu Val Gly Thr Pro Val Cys
770 775 780
Ile Asn Gly Leu Met Leu Leu Glu Ile Lys Asp Thr Glu Lys Tyr Cys
785 790 795 800
Ala Leu Ala Pro Asn Met Met Val Thr Asn Asn Thr Phe Thr Leu Lys
805 810 815
Gly Gly Ala Pro Thr Lys Val Thr Phe Gly Asp Asp Thr Val Ile Glu
820 825 830
Val Gln Gly Tyr Lys Ser Val Asn Ile Thr Phe Glu Leu Asp Glu Arg
835 840 845
Ile Asp Lys Val Leu Asn Glu Lys Cys Ser Ala Tyr Thr Val Glu Leu
850 855 860
Gly Thr Glu Val Asn Glu Phe Ala Cys Val Val Ala Asp Ala Val Ile
865 870 875 880
Lys Thr Leu Gln Pro Val Ser Glu Leu Leu Thr Pro Leu Gly Ile Asp
885 890 895
Leu Asp Glu Trp Ser Met Ala Thr Tyr Tyr Leu Phe Asp Glu Ser Gly
900 905 910
Glu Phe Lys Leu Ala Ser His Met Tyr Cys Ser Phe Tyr Pro Pro Asp
915 920 925
Glu Asp Glu Glu Glu Gly Asp Cys Glu Glu Glu Glu Phe Glu Pro Ser
930 935 940
Thr Gln Tyr Glu Tyr Gly Thr Glu Asp Asp Tyr Gln Gly Lys Pro Leu
945 950 955 960
Glu Phe Gly Ala Thr Ser Ala Ala Leu Gln Pro Glu Glu Glu Gln Glu
965 970 975
Glu Asp Trp Leu Asp Asp Asp Ser Gln Gln Thr Val Gly Gln Gln Asp
980 985 990
Gly Ser Glu Asp Asn Gln Thr Thr Thr Ile Gln Thr Ile Val Glu Val
995 1000 1005
Gln Pro Gln Leu Glu Met Glu Leu Thr Pro Val Val Gln Thr Ile
1010 1015 1020
Glu Val Asn Ser Phe Ser Gly Tyr Leu Lys Leu Thr Asp Asn Val
1025 1030 1035
Tyr Ile Lys Asn Ala Asp Ile Val Glu Glu Ala Lys Lys Val Lys
1040 1045 1050
Pro Thr Val Val Val Asn Ala Ala Asn Val Tyr Leu Lys His Gly
1055 1060 1065
Gly Gly Val Ala Gly Ala Leu Asn Lys Ala Thr Asn Asn Ala Met
1070 1075 1080
Gln Val Glu Ser Asp Asp Tyr Ile Ala Thr Asn Gly Pro Leu Lys
1085 1090 1095
Val Gly Gly Ser Cys Val Leu Ser Gly His Asn Leu Ala Lys His
1100 1105 1110
Cys Leu His Val Val Gly Pro Asn Val Asn Lys Gly Glu Asp Ile
1115 1120 1125
Gln Leu Leu Lys Ser Ala Tyr Glu Asn Phe Asn Gln His Glu Val
1130 1135 1140
Leu Leu Ala Pro Leu Leu Ser Ala Gly Ile Phe Gly Ala Asp Pro
1145 1150 1155
Ile His Ser Leu Arg Val Cys Val Asp Thr Val Arg Thr Asn Val
1160 1165 1170
Tyr Leu Ala Val Phe Asp Lys Asn Leu Tyr Asp Lys Leu Val Ser
1175 1180 1185
Ser Phe Leu Glu Met Lys Ser Glu Lys Gln Val Glu Gln Lys Ile
1190 1195 1200
Ala Glu Ile Pro Lys Glu Glu Val Lys Pro Phe Ile Thr Glu Ser
1205 1210 1215
Lys Pro Ser Val Glu Gln Arg Lys Gln Asp Asp Lys Lys Ile Lys
1220 1225 1230
Ala Cys Val Glu Glu Val Thr Thr Thr Leu Glu Glu Thr Lys Phe
1235 1240 1245
Leu Thr Glu Asn Leu Leu Leu Tyr Ile Asp Ile Asn Gly Asn Leu
1250 1255 1260
His Pro Asp Ser Ala Thr Leu Val Ser Asp Ile Asp Ile Thr Phe
1265 1270 1275
Leu Lys Lys Asp Ala Pro Tyr Ile Val Gly Asp Val Val Gln Glu
1280 1285 1290
Gly Val Leu Thr Ala Val Val Ile Pro Thr Lys Lys Ala Gly Gly
1295 1300 1305
Thr Thr Glu Met Leu Ala Lys Ala Leu Arg Lys Val Pro Thr Asp
1310 1315 1320
Asn Tyr Ile Thr Thr Tyr Pro Gly Gln Gly Leu Asn Gly Tyr Thr
1325 1330 1335
Val Glu Glu Ala Lys Thr Val Leu Lys Lys Cys Lys Ser Ala Phe
1340 1345 1350
Tyr Ile Leu Pro Ser Ile Ile Ser Asn Glu Lys Gln Glu Ile Leu
1355 1360 1365
Gly Thr Val Ser Trp Asn Leu Arg Glu Met Leu Ala His Ala Glu
1370 1375 1380
Glu Thr Arg Lys Leu Met Pro Val Cys Val Glu Thr Lys Ala Ile
1385 1390 1395
Val Ser Thr Ile Gln Arg Lys Tyr Lys Gly Ile Lys Ile Gln Glu
1400 1405 1410
Gly Val Val Asp Tyr Gly Ala Arg Phe Tyr Phe Tyr Thr Ser Lys
1415 1420 1425
Thr Thr Val Ala Ser Leu Ile Asn Thr Leu Asn Asp Leu Asn Glu
1430 1435 1440
Thr Leu Val Thr Met Pro Leu Gly Tyr Val Thr His Gly Leu Asn
1445 1450 1455
Leu Glu Glu Ala Ala Arg Tyr Met Arg Ser Leu Lys Val Pro Ala
1460 1465 1470
Thr Val Ser Val Ser Ser Pro Asp Ala Val Thr Ala Tyr Asn Gly
1475 1480 1485
Tyr Leu Thr Ser Ser Ser Lys Thr Pro Glu Glu His Phe Ile Glu
1490 1495 1500
Thr Ile Ser Leu Ala Gly Ser Tyr Lys Asp Trp Ser Tyr Ser Gly
1505 1510 1515
Gln Ser Thr Gln Leu Gly Ile Glu Phe Leu Lys Arg Gly Asp Lys
1520 1525 1530
Ser Val Tyr Tyr Thr Ser Asn Pro Thr Thr Phe His Leu Asp Gly
1535 1540 1545
Glu Val Ile Thr Phe Asp Asn Leu Lys Thr Leu Leu Ser Leu Arg
1550 1555 1560
Glu Val Arg Thr Ile Lys Val Phe Thr Thr Val Asp Asn Ile Asn
1565 1570 1575
Leu His Thr Gln Val Val Asp Met Ser Met Thr Tyr Gly Gln Gln
1580 1585 1590
Phe Gly Pro Thr Tyr Leu Asp Gly Ala Asp Val Thr Lys Ile Lys
1595 1600 1605
Pro His Asn Ser His Glu Gly Lys Thr Phe Tyr Val Leu Pro Asn
1610 1615 1620
Asp Asp Thr Leu Arg Val Glu Ala Phe Glu Tyr Tyr His Thr Thr
1625 1630 1635
Asp Pro Ser Phe Leu Gly Arg Tyr Met Ser Ala Leu Asn His Thr
1640 1645 1650
Lys Lys Trp Lys Tyr Pro Gln Val Asn Gly Leu Thr Ser Ile Lys
1655 1660 1665
Trp Ala Asp Asn Asn Cys Tyr Leu Ala Thr Ala Leu Leu Thr Leu
1670 1675 1680
Gln Gln Ile Glu Leu Lys Phe Asn Pro Pro Ala Leu Gln Asp Ala
1685 1690 1695
Tyr Tyr Arg Ala Arg Ala Gly Glu Ala Ala Asn Phe Cys Ala Leu
1700 1705 1710
Ile Leu Ala Tyr Cys Asn Lys Thr Val Gly Glu Leu Gly Asp Val
1715 1720 1725
Arg Glu Thr Met Ser Tyr Leu Phe Gln His Ala Asn Leu Asp Ser
1730 1735 1740
Cys Lys Arg Val Leu Asn Val Val Cys Lys Thr Cys Gly Gln Gln
1745 1750 1755
Gln Thr Thr Leu Lys Gly Val Glu Ala Val Met Tyr Met Gly Thr
1760 1765 1770
Leu Ser Tyr Glu Gln Phe Lys Lys Gly Val Gln Ile Pro Cys Thr
1775 1780 1785
Cys Gly Lys Gln Ala Thr Lys Tyr Leu Val Gln Gln Glu Ser Pro
1790 1795 1800
Phe Val Met Met Ser Ala Pro Pro Ala Gln Tyr Glu Leu Lys His
1805 1810 1815
Gly Thr Phe Thr Cys Ala Ser Glu Tyr Thr Gly Asn Tyr Gln Cys
1820 1825 1830
Gly His Tyr Lys His Ile Thr Ser Lys Glu Thr Leu Tyr Cys Ile
1835 1840 1845
Asp Gly Ala Leu Leu Thr Lys Ser Ser Glu Tyr Lys Gly Pro Ile
1850 1855 1860
Thr Asp Val Phe Tyr Lys Glu Asn Ser Tyr Thr Thr Thr Ile Lys
1865 1870 1875
Pro Val Thr Tyr Lys Leu Asp Gly Val Val Cys Thr Glu Ile Asp
1880 1885 1890
Pro Lys Leu Asp Asn Tyr Tyr Lys Lys Asp Asn Ser Tyr Phe Thr
1895 1900 1905
Glu Gln Pro Ile Asp Leu Val Pro Asn Gln Pro Tyr Pro Asn Ala
1910 1915 1920
Ser Phe Asp Asn Phe Lys Phe Val Cys Asp Asn Ile Lys Phe Ala
1925 1930 1935
Asp Asp Leu Asn Gln Leu Thr Gly Tyr Lys Lys Pro Ala Ser Arg
1940 1945 1950
Glu Leu Lys Val Thr Phe Phe Pro Asp Leu Asn Gly Asp Val Val
1955 1960 1965
Ala Ile Asp Tyr Lys His Tyr Thr Pro Ser Phe Lys Lys Gly Ala
1970 1975 1980
Lys Leu Leu His Lys Pro Ile Val Trp His Val Asn Asn Ala Thr
1985 1990 1995
Asn Lys Ala Thr Tyr Lys Pro Asn Thr Trp Cys Ile Arg Cys Leu
2000 2005 2010
Trp Ser Thr Lys Pro Val Glu Thr Ser Asn Ser Phe Asp Val Leu
2015 2020 2025
Lys Ser Glu Asp Ala Gln Gly Met Asp Asn Leu Ala Cys Glu Asp
2030 2035 2040
Leu Lys Pro Val Ser Glu Glu Val Val Glu Asn Pro Thr Ile Gln
2045 2050 2055
Lys Asp Val Leu Glu Cys Asn Val Lys Thr Thr Glu Val Val Gly
2060 2065 2070
Asp Ile Ile Leu Lys Pro Ala Asn Asn Ser Leu Lys Ile Thr Glu
2075 2080 2085
Glu Val Gly His Thr Asp Leu Met Ala Ala Tyr Val Asp Asn Ser
2090 2095 2100
Ser Leu Thr Ile Lys Lys Pro Asn Glu Leu Ser Arg Val Leu Gly
2105 2110 2115
Leu Lys Thr Leu Ala Thr His Gly Leu Ala Ala Val Asn Ser Val
2120 2125 2130
Pro Trp Asp Thr Ile Ala Asn Tyr Ala Lys Pro Phe Leu Asn Lys
2135 2140 2145
Val Val Ser Thr Thr Thr Asn Ile Val Thr Arg Cys Leu Asn Arg
2150 2155 2160
Val Cys Thr Asn Tyr Met Pro Tyr Phe Phe Thr Leu Leu Leu Gln
2165 2170 2175
Leu Cys Thr Phe Thr Arg Ser Thr Asn Ser Arg Ile Lys Ala Ser
2180 2185 2190
Met Pro Thr Thr Ile Ala Lys Asn Thr Val Lys Ser Val Gly Lys
2195 2200 2205
Phe Cys Leu Glu Ala Ser Phe Asn Tyr Leu Lys Ser Pro Asn Phe
2210 2215 2220
Ser Lys Leu Ile Asn Ile Ile Ile Trp Phe Leu Leu Leu Ser Val
2225 2230 2235
Cys Leu Gly Ser Leu Ile Tyr Ser Thr Ala Ala Leu Gly Val Leu
2240 2245 2250
Met Ser Asn Leu Gly Met Pro Ser Tyr Cys Thr Gly Tyr Arg Glu
2255 2260 2265
Gly Tyr Leu Asn Ser Thr Asn Val Thr Ile Ala Thr Tyr Cys Thr
2270 2275 2280
Gly Ser Ile Pro Cys Ser Val Cys Leu Ser Gly Leu Asp Ser Leu
2285 2290 2295
Asp Thr Tyr Pro Ser Leu Glu Thr Ile Gln Ile Thr Ile Ser Ser
2300 2305 2310
Phe Lys Trp Asp Leu Thr Ala Phe Gly Leu Val Ala Glu Trp Phe
2315 2320 2325
Leu Ala Tyr Ile Leu Phe Thr Arg Phe Phe Tyr Val Leu Gly Leu
2330 2335 2340
Ala Ala Ile Met Gln Leu Phe Phe Ser Tyr Phe Ala Val His Phe
2345 2350 2355
Ile Ser Asn Ser Trp Leu Met Trp Leu Ile Ile Asn Leu Val Gln
2360 2365 2370
Met Ala Pro Ile Ser Ala Met Val Arg Met Tyr Ile Phe Phe Ala
2375 2380 2385
Ser Phe Tyr Tyr Val Trp Lys Ser Tyr Val His Val Val Asp Gly
2390 2395 2400
Cys Asn Ser Ser Thr Cys Met Met Cys Tyr Lys Arg Asn Arg Ala
2405 2410 2415
Thr Arg Val Glu Cys Thr Thr Ile Val Asn Gly Val Arg Arg Ser
2420 2425 2430
Phe Tyr Val Tyr Ala Asn Gly Gly Lys Gly Phe Cys Lys Leu His
2435 2440 2445
Asn Trp Asn Cys Val Asn Cys Asp Thr Phe Cys Ala Gly Ser Thr
2450 2455 2460
Phe Ile Ser Asp Glu Val Ala Arg Asp Leu Ser Leu Gln Phe Lys
2465 2470 2475
Arg Pro Ile Asn Pro Thr Asp Gln Ser Ser Tyr Ile Val Asp Ser
2480 2485 2490
Val Thr Val Lys Asn Gly Ser Ile His Leu Tyr Phe Asp Lys Ala
2495 2500 2505
Gly Gln Lys Thr Tyr Glu Arg His Ser Leu Ser His Phe Val Asn
2510 2515 2520
Leu Asp Asn Leu Arg Ala Asn Asn Thr Lys Gly Ser Leu Pro Ile
2525 2530 2535
Asn Val Ile Val Phe Asp Gly Lys Ser Lys Cys Glu Glu Ser Ser
2540 2545 2550
Ala Lys Ser Ala Ser Val Tyr Tyr Ser Gln Leu Met Cys Gln Pro
2555 2560 2565
Ile Leu Leu Leu Asp Gln Ala Leu Val Ser Asp Val Gly Asp Ser
2570 2575 2580
Ala Glu Val Ala Val Lys Met Phe Asp Ala Tyr Val Asn Thr Phe
2585 2590 2595
Ser Ser Thr Phe Asn Val Pro Met Glu Lys Leu Lys Thr Leu Val
2600 2605 2610
Ala Thr Ala Glu Ala Glu Leu Ala Lys Asn Val Ser Leu Asp Asn
2615 2620 2625
Val Leu Ser Thr Phe Ile Ser Ala Ala Arg Gln Gly Phe Val Asp
2630 2635 2640
Ser Asp Val Glu Thr Lys Asp Val Val Glu Cys Leu Lys Leu Ser
2645 2650 2655
His Gln Ser Asp Ile Glu Val Thr Gly Asp Ser Cys Asn Asn Tyr
2660 2665 2670
Met Leu Thr Tyr Asn Lys Val Glu Asn Met Thr Pro Arg Asp Leu
2675 2680 2685
Gly Ala Cys Ile Asp Cys Ser Ala Arg His Ile Asn Ala Gln Val
2690 2695 2700
Ala Lys Ser His Asn Ile Ala Leu Ile Trp Asn Val Lys Asp Phe
2705 2710 2715
Met Ser Leu Ser Glu Gln Leu Arg Lys Gln Ile Arg Ser Ala Ala
2720 2725 2730
Lys Lys Asn Asn Leu Pro Phe Lys Leu Thr Cys Ala Thr Thr Arg
2735 2740 2745
Gln Val Val Asn Val Val Thr Thr Lys Ile Ala Leu Lys Gly Gly
2750 2755 2760
Lys Ile Val Asn Asn Trp Leu Lys Gln Leu Ile Lys Val Thr Leu
2765 2770 2775
Val Phe Leu Phe Val Ala Ala Ile Phe Tyr Leu Ile Thr Pro Val
2780 2785 2790
His Val Met Ser Lys His Thr Asp Phe Ser Ser Glu Ile Ile Gly
2795 2800 2805
Tyr Lys Ala Ile Asp Gly Gly Val Thr Arg Asp Ile Ala Ser Thr
2810 2815 2820
Asp Thr Cys Phe Ala Asn Lys His Ala Asp Phe Asp Thr Trp Phe
2825 2830 2835
Ser Gln Arg Gly Gly Ser Tyr Thr Asn Asp Lys Ala Cys Pro Leu
2840 2845 2850
Ile Ala Ala Val Ile Thr Arg Glu Val Gly Phe Val Val Pro Gly
2855 2860 2865
Leu Pro Gly Thr Ile Leu Arg Thr Thr Asn Gly Asp Phe Leu His
2870 2875 2880
Phe Leu Pro Arg Val Phe Ser Ala Val Gly Asn Ile Cys Tyr Thr
2885 2890 2895
Pro Ser Lys Leu Ile Glu Tyr Thr Asp Phe Ala Thr Ser Ala Cys
2900 2905 2910
Val Leu Ala Ala Glu Cys Thr Ile Phe Lys Asp Ala Ser Gly Lys
2915 2920 2925
Pro Val Pro Tyr Cys Tyr Asp Thr Asn Val Leu Glu Gly Ser Val
2930 2935 2940
Ala Tyr Glu Ser Leu Arg Pro Asp Thr Arg Tyr Val Leu Met Asp
2945 2950 2955
Gly Ser Ile Ile Gln Phe Pro Asn Thr Tyr Leu Glu Gly Ser Val
2960 2965 2970
Arg Val Val Thr Thr Phe Asp Ser Glu Tyr Cys Arg His Gly Thr
2975 2980 2985
Cys Glu Arg Ser Glu Ala Gly Val Cys Val Ser Thr Ser Gly Arg
2990 2995 3000
Trp Val Leu Asn Asn Asp Tyr Tyr Arg Ser Leu Pro Gly Val Phe
3005 3010 3015
Cys Gly Val Asp Ala Val Asn Leu Leu Thr Asn Met Phe Thr Pro
3020 3025 3030
Leu Ile Gln Pro Ile Gly Ala Leu Asp Ile Ser Ala Ser Ile Val
3035 3040 3045
Ala Gly Gly Ile Val Ala Ile Val Val Thr Cys Leu Ala Tyr Tyr
3050 3055 3060
Phe Met Arg Phe Arg Arg Ala Phe Gly Glu Tyr Ser His Val Val
3065 3070 3075
Ala Phe Asn Thr Leu Leu Phe Leu Met Ser Phe Thr Val Leu Cys
3080 3085 3090
Leu Thr Pro Val Tyr Ser Phe Leu Pro Gly Val Tyr Ser Val Ile
3095 3100 3105
Tyr Leu Tyr Leu Thr Phe Tyr Leu Thr Asn Asp Val Ser Phe Leu
3110 3115 3120
Ala His Ile Gln Trp Met Val Met Phe Thr Pro Leu Val Pro Phe
3125 3130 3135
Trp Ile Thr Ile Ala Tyr Ile Ile Cys Ile Ser Thr Lys His Phe
3140 3145 3150
Tyr Trp Phe Phe Ser Asn Tyr Leu Lys Arg Arg Val Val Phe Asn
3155 3160 3165
Gly Val Ser Phe Ser Thr Phe Glu Glu Ala Ala Leu Cys Thr Phe
3170 3175 3180
Leu Leu Asn Lys Glu Met Tyr Leu Lys Leu Arg Ser Asp Val Leu
3185 3190 3195
Leu Pro Leu Thr Gln Tyr Asn Arg Tyr Leu Ala Leu Tyr Asn Lys
3200 3205 3210
Tyr Lys Tyr Phe Ser Gly Ala Met Asp Thr Thr Ser Tyr Arg Glu
3215 3220 3225
Ala Ala Cys Cys His Leu Ala Lys Ala Leu Asn Asp Phe Ser Asn
3230 3235 3240
Ser Gly Ser Asp Val Leu Tyr Gln Pro Pro Gln Thr Ser Ile Thr
3245 3250 3255
Ser Ala Val Leu Gln Ser Gly Phe Arg Lys Met Ala Phe Pro Ser
3260 3265 3270
Gly Lys Val Glu Gly Cys Met Val Gln Val Thr Cys Gly Thr Thr
3275 3280 3285
Thr Leu Asn Gly Leu Trp Leu Asp Asp Val Val Tyr Cys Pro Arg
3290 3295 3300
His Val Ile Cys Thr Ser Glu Asp Met Leu Asn Pro Asn Tyr Glu
3305 3310 3315
Asp Leu Leu Ile Arg Lys Ser Asn His Asn Phe Leu Val Gln Ala
3320 3325 3330
Gly Asn Val Gln Leu Arg Val Ile Gly His Ser Met Gln Asn Cys
3335 3340 3345
Val Leu Lys Leu Lys Val Asp Thr Ala Asn Pro Lys Thr Pro Lys
3350 3355 3360
Tyr Lys Phe Val Arg Ile Gln Pro Gly Gln Thr Phe Ser Val Leu
3365 3370 3375
Ala Cys Tyr Asn Gly Ser Pro Ser Gly Val Tyr Gln Cys Ala Met
3380 3385 3390
Arg Pro Asn Phe Thr Ile Lys Gly Ser Phe Leu Asn Gly Ser Cys
3395 3400 3405
Gly Ser Val Gly Phe Asn Ile Asp Tyr Asp Cys Val Ser Phe Cys
3410 3415 3420
Tyr Met His His Met Glu Leu Pro Thr Gly Val His Ala Gly Thr
3425 3430 3435
Asp Leu Glu Gly Asn Phe Tyr Gly Pro Phe Val Asp Arg Gln Thr
3440 3445 3450
Ala Gln Ala Ala Gly Thr Asp Thr Thr Ile Thr Val Asn Val Leu
3455 3460 3465
Ala Trp Leu Tyr Ala Ala Val Ile Asn Gly Asp Arg Trp Phe Leu
3470 3475 3480
Asn Arg Phe Thr Thr Thr Leu Asn Asp Phe Asn Leu Val Ala Met
3485 3490 3495
Lys Tyr Asn Tyr Glu Pro Leu Thr Gln Asp His Val Asp Ile Leu
3500 3505 3510
Gly Pro Leu Ser Ala Gln Thr Gly Ile Ala Val Leu Asp Met Cys
3515 3520 3525
Ala Ser Leu Lys Glu Leu Leu Gln Asn Gly Met Asn Gly Arg Thr
3530 3535 3540
Ile Leu Gly Ser Ala Leu Leu Glu Asp Glu Phe Thr Pro Phe Asp
3545 3550 3555
Val Val Arg Gln Cys Ser Gly Val Thr Phe Gln Ser Ala Val Lys
3560 3565 3570
Arg Thr Ile Lys Gly Thr His His Trp Leu Leu Leu Thr Ile Leu
3575 3580 3585
Thr Ser Leu Leu Val Leu Val Gln Ser Thr Gln Trp Ser Leu Phe
3590 3595 3600
Phe Phe Leu Tyr Glu Asn Ala Phe Leu Pro Phe Ala Met Gly Ile
3605 3610 3615
Ile Ala Met Ser Ala Phe Ala Met Met Phe Val Lys His Lys His
3620 3625 3630
Ala Phe Leu Cys Leu Phe Leu Leu Pro Ser Leu Ala Thr Val Ala
3635 3640 3645
Tyr Phe Asn Met Val Tyr Met Pro Ala Ser Trp Val Met Arg Ile
3650 3655 3660
Met Thr Trp Leu Asp Met Val Asp Thr Ser Leu Ser Gly Phe Lys
3665 3670 3675
Leu Lys Asp Cys Val Met Tyr Ala Ser Ala Val Val Leu Leu Ile
3680 3685 3690
Leu Met Thr Ala Arg Thr Val Tyr Asp Asp Gly Ala Arg Arg Val
3695 3700 3705
Trp Thr Leu Met Asn Val Leu Thr Leu Val Tyr Lys Val Tyr Tyr
3710 3715 3720
Gly Asn Ala Leu Asp Gln Ala Ile Ser Met Trp Ala Leu Ile Ile
3725 3730 3735
Ser Val Thr Ser Asn Tyr Ser Gly Val Val Thr Thr Val Met Phe
3740 3745 3750
Leu Ala Arg Gly Ile Val Phe Met Cys Val Glu Tyr Cys Pro Ile
3755 3760 3765
Phe Phe Ile Thr Gly Asn Thr Leu Gln Cys Ile Met Leu Val Tyr
3770 3775 3780
Cys Phe Leu Gly Tyr Phe Cys Thr Cys Tyr Phe Gly Leu Phe Cys
3785 3790 3795
Leu Leu Asn Arg Tyr Phe Arg Leu Thr Leu Gly Val Tyr Asp Tyr
3800 3805 3810
Leu Val Ser Thr Gln Glu Phe Arg Tyr Met Asn Ser Gln Gly Leu
3815 3820 3825
Leu Pro Pro Lys Asn Ser Ile Asp Ala Phe Lys Leu Asn Ile Lys
3830 3835 3840
Leu Leu Gly Val Gly Gly Lys Pro Cys Ile Lys Val Ala Thr Val
3845 3850 3855
Gln Ser Lys Met Ser Asp Val Lys Cys Thr Ser Val Val Leu Leu
3860 3865 3870
Ser Val Leu Gln Gln Leu Arg Val Glu Ser Ser Ser Lys Leu Trp
3875 3880 3885
Ala Gln Cys Val Gln Leu His Asn Asp Ile Leu Leu Ala Lys Asp
3890 3895 3900
Thr Thr Glu Ala Phe Glu Lys Met Val Ser Leu Leu Ser Val Leu
3905 3910 3915
Leu Ser Met Gln Gly Ala Val Asp Ile Asn Lys Leu Cys Glu Glu
3920 3925 3930
Met Leu Asp Asn Arg Ala Thr Leu Gln Ala Ile Ala Ser Glu Phe
3935 3940 3945
Ser Ser Leu Pro Ser Tyr Ala Ala Phe Ala Thr Ala Gln Glu Ala
3950 3955 3960
Tyr Glu Gln Ala Val Ala Asn Gly Asp Ser Glu Val Val Leu Lys
3965 3970 3975
Lys Leu Lys Lys Ser Leu Asn Val Ala Lys Ser Glu Phe Asp Arg
3980 3985 3990
Asp Ala Ala Met Gln Arg Lys Leu Glu Lys Met Ala Asp Gln Ala
3995 4000 4005
Met Thr Gln Met Tyr Lys Gln Ala Arg Ser Glu Asp Lys Arg Ala
4010 4015 4020
Lys Val Thr Ser Ala Met Gln Thr Met Leu Phe Thr Met Leu Arg
4025 4030 4035
Lys Leu Asp Asn Asp Ala Leu Asn Asn Ile Ile Asn Asn Ala Arg
4040 4045 4050
Asp Gly Cys Val Pro Leu Asn Ile Ile Pro Leu Thr Thr Ala Ala
4055 4060 4065
Lys Leu Met Val Val Ile Pro Asp Tyr Asn Thr Tyr Lys Asn Thr
4070 4075 4080
Cys Asp Gly Thr Thr Phe Thr Tyr Ala Ser Ala Leu Trp Glu Ile
4085 4090 4095
Gln Gln Val Val Asp Ala Asp Ser Lys Ile Val Gln Leu Ser Glu
4100 4105 4110
Ile Ser Met Asp Asn Ser Pro Asn Leu Ala Trp Pro Leu Ile Val
4115 4120 4125
Thr Ala Leu Arg Ala Asn Ser Ala Val Lys Leu Gln Asn Asn Glu
4130 4135 4140
Leu Ser Pro Val Ala Leu Arg Gln Met Ser Cys Ala Ala Gly Thr
4145 4150 4155
Thr Gln Thr Ala Cys Thr Asp Asp Asn Ala Leu Ala Tyr Tyr Asn
4160 4165 4170
Thr Thr Lys Gly Gly Arg Phe Val Leu Ala Leu Leu Ser Asp Leu
4175 4180 4185
Gln Asp Leu Lys Trp Ala Arg Phe Pro Lys Ser Asp Gly Thr Gly
4190 4195 4200
Thr Ile Tyr Thr Glu Leu Glu Pro Pro Cys Arg Phe Val Thr Asp
4205 4210 4215
Thr Pro Lys Gly Pro Lys Val Lys Tyr Leu Tyr Phe Ile Lys Gly
4220 4225 4230
Leu Asn Asn Leu Asn Arg Gly Met Val Leu Gly Ser Leu Ala Ala
4235 4240 4245
Thr Val Arg Leu Gln Ala Gly Asn Ala Thr Glu Val Pro Ala Asn
4250 4255 4260
Ser Thr Val Leu Ser Phe Cys Ala Phe Ala Val Asp Ala Ala Lys
4265 4270 4275
Ala Tyr Lys Asp Tyr Leu Ala Ser Gly Gly Gln Pro Ile Thr Asn
4280 4285 4290
Cys Val Lys Met Leu Cys Thr His Thr Gly Thr Gly Gln Ala Ile
4295 4300 4305
Thr Val Thr Pro Glu Ala Asn Met Asp Gln Glu Ser Phe Gly Gly
4310 4315 4320
Ala Ser Cys Cys Leu Tyr Cys Arg Cys His Ile Asp His Pro Asn
4325 4330 4335
Pro Lys Gly Phe Cys Asp Leu Lys Gly Lys Tyr Val Gln Ile Pro
4340 4345 4350
Thr Thr Cys Ala Asn Asp Pro Val Gly Phe Thr Leu Lys Asn Thr
4355 4360 4365
Val Cys Thr Val Cys Gly Met Trp Lys Gly Tyr Gly Cys Ser Cys
4370 4375 4380
Asp Gln Leu Arg Glu Pro Met Leu Gln Ser Ala Asp Ala Gln Ser
4385 4390 4395
Phe Leu Asn Arg Val Cys Gly Val Ser Ala Ala Arg Leu Thr Pro
4400 4405 4410
Cys Gly Thr Gly Thr Ser Thr Asp Val Val Tyr Arg Ala Phe Asp
4415 4420 4425
Ile Tyr Asn Asp Lys Val Ala Gly Phe Ala Lys Phe Leu Lys Thr
4430 4435 4440
Asn Cys Cys Arg Phe Gln Glu Lys Asp Glu Asp Asp Asn Leu Ile
4445 4450 4455
Asp Ser Tyr Phe Val Val Lys Arg His Thr Phe Ser Asn Tyr Gln
4460 4465 4470
His Glu Glu Thr Ile Tyr Asn Leu Leu Lys Asp Cys Pro Ala Val
4475 4480 4485
Ala Lys His Asp Phe Phe Lys Phe Arg Ile Asp Gly Asp Met Val
4490 4495 4500
Pro His Ile Ser Arg Gln Arg Leu Thr Lys Tyr Thr Met Ala Asp
4505 4510 4515
Leu Val Tyr Ala Leu Arg His Phe Asp Glu Gly Asn Cys Asp Thr
4520 4525 4530
Leu Lys Glu Ile Leu Val Thr Tyr Asn Cys Cys Asp Asp Asp Tyr
4535 4540 4545
Phe Asn Lys Lys Asp Trp Tyr Asp Phe Val Glu Asn Pro Asp Ile
4550 4555 4560
Leu Arg Val Tyr Ala Asn Leu Gly Glu Arg Val Arg Gln Ala Leu
4565 4570 4575
Leu Lys Thr Val Gln Phe Cys Asp Ala Met Arg Asn Ala Gly Ile
4580 4585 4590
Val Gly Val Leu Thr Leu Asp Asn Gln Asp Leu Asn Gly Asn Trp
4595 4600 4605
Tyr Asp Phe Gly Asp Phe Ile Gln Thr Thr Pro Gly Ser Gly Val
4610 4615 4620
Pro Val Val Asp Ser Tyr Tyr Ser Leu Leu Met Pro Ile Leu Thr
4625 4630 4635
Leu Thr Arg Ala Leu Thr Ala Glu Ser His Val Asp Thr Asp Leu
4640 4645 4650
Thr Lys Pro Tyr Ile Lys Trp Asp Leu Leu Lys Tyr Asp Phe Thr
4655 4660 4665
Glu Glu Arg Leu Lys Leu Phe Asp Arg Tyr Phe Lys Tyr Trp Asp
4670 4675 4680
Gln Thr Tyr His Pro Asn Cys Val Asn Cys Leu Asp Asp Arg Cys
4685 4690 4695
Ile Leu His Cys Ala Asn Phe Asn Val Leu Phe Ser Thr Val Phe
4700 4705 4710
Pro Pro Thr Ser Phe Gly Pro Leu Val Arg Lys Ile Phe Val Asp
4715 4720 4725
Gly Val Pro Phe Val Val Ser Thr Gly Tyr His Phe Arg Glu Leu
4730 4735 4740
Gly Val Val His Asn Gln Asp Val Asn Leu His Ser Ser Arg Leu
4745 4750 4755
Ser Phe Lys Glu Leu Leu Val Tyr Ala Ala Asp Pro Ala Met His
4760 4765 4770
Ala Ala Ser Gly Asn Leu Leu Leu Asp Lys Arg Thr Thr Cys Phe
4775 4780 4785
Ser Val Ala Ala Leu Thr Asn Asn Val Ala Phe Gln Thr Val Lys
4790 4795 4800
Pro Gly Asn Phe Asn Lys Asp Phe Tyr Asp Phe Ala Val Ser Lys
4805 4810 4815
Gly Phe Phe Lys Glu Gly Ser Ser Val Glu Leu Lys His Phe Phe
4820 4825 4830
Phe Ala Gln Asp Gly Asn Ala Ala Ile Ser Asp Tyr Asp Tyr Tyr
4835 4840 4845
Arg Tyr Asn Leu Pro Thr Met Cys Asp Ile Arg Gln Leu Leu Phe
4850 4855 4860
Val Val Glu Val Val Asp Lys Tyr Phe Asp Cys Tyr Asp Gly Gly
4865 4870 4875
Cys Ile Asn Ala Asn Gln Val Ile Val Asn Asn Leu Asp Lys Ser
4880 4885 4890
Ala Gly Phe Pro Phe Asn Lys Trp Gly Lys Ala Arg Leu Tyr Tyr
4895 4900 4905
Asp Ser Met Ser Tyr Glu Asp Gln Asp Ala Leu Phe Ala Tyr Thr
4910 4915 4920
Lys Arg Asn Val Ile Pro Thr Ile Thr Gln Met Asn Leu Lys Tyr
4925 4930 4935
Ala Ile Ser Ala Lys Asn Arg Ala Arg Thr Val Ala Gly Val Ser
4940 4945 4950
Ile Cys Ser Thr Met Thr Asn Arg Gln Phe His Gln Lys Leu Leu
4955 4960 4965
Lys Ser Ile Ala Ala Thr Arg Gly Ala Thr Val Val Ile Gly Thr
4970 4975 4980
Ser Lys Phe Tyr Gly Gly Trp His Asn Met Leu Lys Thr Val Tyr
4985 4990 4995
Ser Asp Val Glu Asn Pro His Leu Met Gly Trp Asp Tyr Pro Lys
5000 5005 5010
Cys Asp Arg Ala Met Pro Asn Met Leu Arg Ile Met Ala Ser Leu
5015 5020 5025
Val Leu Ala Arg Lys His Thr Thr Cys Cys Ser Leu Ser His Arg
5030 5035 5040
Phe Tyr Arg Leu Ala Asn Glu Cys Ala Gln Val Leu Ser Glu Met
5045 5050 5055
Val Met Cys Gly Gly Ser Leu Tyr Val Lys Pro Gly Gly Thr Ser
5060 5065 5070
Ser Gly Asp Ala Thr Thr Ala Tyr Ala Asn Ser Val Phe Asn Ile
5075 5080 5085
Cys Gln Ala Val Thr Ala Asn Val Asn Ala Leu Leu Ser Thr Asp
5090 5095 5100
Gly Asn Lys Ile Ala Asp Lys Tyr Val Arg Asn Leu Gln His Arg
5105 5110 5115
Leu Tyr Glu Cys Leu Tyr Arg Asn Arg Asp Val Asp Thr Asp Phe
5120 5125 5130
Val Asn Glu Phe Tyr Ala Tyr Leu Arg Lys His Phe Ser Met Met
5135 5140 5145
Ile Leu Ser Asp Asp Ala Val Val Cys Phe Asn Ser Thr Tyr Ala
5150 5155 5160
Ser Gln Gly Leu Val Ala Ser Ile Lys Asn Phe Lys Ser Val Leu
5165 5170 5175
Tyr Tyr Gln Asn Asn Val Phe Met Ser Glu Ala Lys Cys Trp Thr
5180 5185 5190
Glu Thr Asp Leu Thr Lys Gly Pro His Glu Phe Cys Ser Gln His
5195 5200 5205
Thr Met Leu Val Lys Gln Gly Asp Asp Tyr Val Tyr Leu Pro Tyr
5210 5215 5220
Pro Asp Pro Ser Arg Ile Leu Gly Ala Gly Cys Phe Val Asp Asp
5225 5230 5235
Ile Val Lys Thr Asp Gly Thr Leu Met Ile Glu Arg Phe Val Ser
5240 5245 5250
Leu Ala Ile Asp Ala Tyr Pro Leu Thr Lys His Pro Asn Gln Glu
5255 5260 5265
Tyr Ala Asp Val Phe His Leu Tyr Leu Gln Tyr Ile Arg Lys Leu
5270 5275 5280
His Asp Glu Leu Thr Gly His Met Leu Asp Met Tyr Ser Val Met
5285 5290 5295
Leu Thr Asn Asp Asn Thr Ser Arg Tyr Trp Glu Pro Glu Phe Tyr
5300 5305 5310
Glu Ala Met Tyr Thr Pro His Thr Val Leu Gln Ala Val Gly Ala
5315 5320 5325
Cys Val Leu Cys Asn Ser Gln Thr Ser Leu Arg Cys Gly Ala Cys
5330 5335 5340
Ile Arg Arg Pro Phe Leu Cys Cys Lys Cys Cys Tyr Asp His Val
5345 5350 5355
Ile Ser Thr Ser His Lys Leu Val Leu Ser Val Asn Pro Tyr Val
5360 5365 5370
Cys Asn Ala Pro Gly Cys Asp Val Thr Asp Val Thr Gln Leu Tyr
5375 5380 5385
Leu Gly Gly Met Ser Tyr Tyr Cys Lys Ser His Lys Pro Pro Ile
5390 5395 5400
Ser Phe Pro Leu Cys Ala Asn Gly Gln Val Phe Gly Leu Tyr Lys
5405 5410 5415
Asn Thr Cys Val Gly Ser Asp Asn Val Thr Asp Phe Asn Ala Ile
5420 5425 5430
Ala Thr Cys Asp Trp Thr Asn Ala Gly Asp Tyr Ile Leu Ala Asn
5435 5440 5445
Thr Cys Thr Glu Arg Leu Lys Leu Phe Ala Ala Glu Thr Leu Lys
5450 5455 5460
Ala Thr Glu Glu Thr Phe Lys Leu Ser Tyr Gly Ile Ala Thr Val
5465 5470 5475
Arg Glu Val Leu Ser Asp Arg Glu Leu His Leu Ser Trp Glu Val
5480 5485 5490
Gly Lys Pro Arg Pro Pro Leu Asn Arg Asn Tyr Val Phe Thr Gly
5495 5500 5505
Tyr Arg Val Thr Lys Asn Ser Lys Val Gln Ile Gly Glu Tyr Thr
5510 5515 5520
Phe Glu Lys Gly Asp Tyr Gly Asp Ala Val Val Tyr Arg Gly Thr
5525 5530 5535
Thr Thr Tyr Lys Leu Asn Val Gly Asp Tyr Phe Val Leu Thr Ser
5540 5545 5550
His Thr Val Met Pro Leu Ser Ala Pro Thr Leu Val Pro Gln Glu
5555 5560 5565
His Tyr Val Arg Ile Thr Gly Leu Tyr Pro Thr Leu Asn Ile Ser
5570 5575 5580
Asp Glu Phe Ser Ser Asn Val Ala Asn Tyr Gln Lys Val Gly Met
5585 5590 5595
Gln Lys Tyr Ser Thr Leu Gln Gly Pro Pro Gly Thr Gly Lys Ser
5600 5605 5610
His Phe Ala Ile Gly Leu Ala Leu Tyr Tyr Pro Ser Ala Arg Ile
5615 5620 5625
Val Tyr Thr Ala Cys Ser His Ala Ala Val Asp Ala Leu Cys Glu
5630 5635 5640
Lys Ala Leu Lys Tyr Leu Pro Ile Asp Lys Cys Ser Arg Ile Ile
5645 5650 5655
Pro Ala Arg Ala Arg Val Glu Cys Phe Asp Lys Phe Lys Val Asn
5660 5665 5670
Ser Thr Leu Glu Gln Tyr Val Phe Cys Thr Val Asn Ala Leu Pro
5675 5680 5685
Glu Thr Thr Ala Asp Ile Val Val Phe Asp Glu Ile Ser Met Ala
5690 5695 5700
Thr Asn Tyr Asp Leu Ser Val Val Asn Ala Arg Leu Arg Ala Lys
5705 5710 5715
His Tyr Val Tyr Ile Gly Asp Pro Ala Gln Leu Pro Ala Pro Arg
5720 5725 5730
Thr Leu Leu Thr Lys Gly Thr Leu Glu Pro Glu Tyr Phe Asn Ser
5735 5740 5745
Val Cys Arg Leu Met Lys Thr Ile Gly Pro Asp Met Phe Leu Gly
5750 5755 5760
Thr Cys Arg Arg Cys Pro Ala Glu Ile Val Asp Thr Val Ser Ala
5765 5770 5775
Leu Val Tyr Asp Asn Lys Leu Lys Ala His Lys Asp Lys Ser Ala
5780 5785 5790
Gln Cys Phe Lys Met Phe Tyr Lys Gly Val Ile Thr His Asp Val
5795 5800 5805
Ser Ser Ala Ile Asn Arg Pro Gln Ile Gly Val Val Arg Glu Phe
5810 5815 5820
Leu Thr Arg Asn Pro Ala Trp Arg Lys Ala Val Phe Ile Ser Pro
5825 5830 5835
Tyr Asn Ser Gln Asn Ala Val Ala Ser Lys Ile Leu Gly Leu Pro
5840 5845 5850
Thr Gln Thr Val Asp Ser Ser Gln Gly Ser Glu Tyr Asp Tyr Val
5855 5860 5865
Ile Phe Thr Gln Thr Thr Glu Thr Ala His Ser Cys Asn Val Asn
5870 5875 5880
Arg Phe Asn Val Ala Ile Thr Arg Ala Lys Val Gly Ile Leu Cys
5885 5890 5895
Ile Met Ser Asp Arg Asp Leu Tyr Asp Lys Leu Gln Phe Thr Ser
5900 5905 5910
Leu Glu Ile Pro Arg Arg Asn Val Ala Thr Leu Gln Ala Glu Asn
5915 5920 5925
Val Thr Gly Leu Phe Lys Asp Cys Ser Lys Val Ile Thr Gly Leu
5930 5935 5940
His Pro Thr Gln Ala Pro Thr His Leu Ser Val Asp Thr Lys Phe
5945 5950 5955
Lys Thr Glu Gly Leu Cys Val Asp Ile Pro Gly Ile Pro Lys Asp
5960 5965 5970
Met Thr Tyr Arg Arg Leu Ile Ser Met Met Gly Phe Lys Met Asn
5975 5980 5985
Tyr Gln Val Asn Gly Tyr Pro Asn Met Phe Ile Thr Arg Glu Glu
5990 5995 6000
Ala Ile Arg His Val Arg Ala Trp Ile Gly Phe Asp Val Glu Gly
6005 6010 6015
Cys His Ala Thr Arg Glu Ala Val Gly Thr Asn Leu Pro Leu Gln
6020 6025 6030
Leu Gly Phe Ser Thr Gly Val Asn Leu Val Ala Val Pro Thr Gly
6035 6040 6045
Tyr Val Asp Thr Pro Asn Asn Thr Asp Phe Ser Arg Val Ser Ala
6050 6055 6060
Lys Pro Pro Pro Gly Asp Gln Phe Lys His Leu Ile Pro Leu Met
6065 6070 6075
Tyr Lys Gly Leu Pro Trp Asn Val Val Arg Ile Lys Ile Val Gln
6080 6085 6090
Met Leu Ser Asp Thr Leu Lys Asn Leu Ser Asp Arg Val Val Phe
6095 6100 6105
Val Leu Trp Ala His Gly Phe Glu Leu Thr Ser Met Lys Tyr Phe
6110 6115 6120
Val Lys Ile Gly Pro Glu Arg Thr Cys Cys Leu Cys Asp Arg Arg
6125 6130 6135
Ala Thr Cys Phe Ser Thr Ala Ser Asp Thr Tyr Ala Cys Trp His
6140 6145 6150
His Ser Ile Gly Phe Asp Tyr Val Tyr Asn Pro Phe Met Ile Asp
6155 6160 6165
Val Gln Gln Trp Gly Phe Thr Gly Asn Leu Gln Ser Asn His Asp
6170 6175 6180
Leu Tyr Cys Gln Val His Gly Asn Ala His Val Ala Ser Cys Asp
6185 6190 6195
Ala Ile Met Thr Arg Cys Leu Ala Val His Glu Cys Phe Val Lys
6200 6205 6210
Arg Val Asp Trp Thr Ile Glu Tyr Pro Ile Ile Gly Asp Glu Leu
6215 6220 6225
Lys Ile Asn Ala Ala Cys Arg Lys Val Gln His Met Val Val Lys
6230 6235 6240
Ala Ala Leu Leu Ala Asp Lys Phe Pro Val Leu His Asp Ile Gly
6245 6250 6255
Asn Pro Lys Ala Ile Lys Cys Val Pro Gln Ala Asp Val Glu Trp
6260 6265 6270
Lys Phe Tyr Asp Ala Gln Pro Cys Ser Asp Lys Ala Tyr Lys Ile
6275 6280 6285
Glu Glu Leu Phe Tyr Ser Tyr Ala Thr His Ser Asp Lys Phe Thr
6290 6295 6300
Asp Gly Val Cys Leu Phe Trp Asn Cys Asn Val Asp Arg Tyr Pro
6305 6310 6315
Ala Asn Ser Ile Val Cys Arg Phe Asp Thr Arg Val Leu Ser Asn
6320 6325 6330
Leu Asn Leu Pro Gly Cys Asp Gly Gly Ser Leu Tyr Val Asn Lys
6335 6340 6345
His Ala Phe His Thr Pro Ala Phe Asp Lys Ser Ala Phe Val Asn
6350 6355 6360
Leu Lys Gln Leu Pro Phe Phe Tyr Tyr Ser Asp Ser Pro Cys Glu
6365 6370 6375
Ser His Gly Lys Gln Val Val Ser Asp Ile Asp Tyr Val Pro Leu
6380 6385 6390
Lys Ser Ala Thr Cys Ile Thr Arg Cys Asn Leu Gly Gly Ala Val
6395 6400 6405
Cys Arg His His Ala Asn Glu Tyr Arg Leu Tyr Leu Asp Ala Tyr
6410 6415 6420
Asn Met Met Ile Ser Ala Gly Phe Ser Leu Trp Val Tyr Lys Gln
6425 6430 6435
Phe Asp Thr Tyr Asn Leu Trp Asn Thr Phe Thr Arg Leu Gln Ser
6440 6445 6450
Leu Glu Asn Val Ala Phe Asn Val Val Asn Lys Gly His Phe Asp
6455 6460 6465
Gly Gln Gln Gly Glu Val Pro Val Ser Ile Ile Asn Asn Thr Val
6470 6475 6480
Tyr Thr Lys Val Asp Gly Val Asp Val Glu Leu Phe Glu Asn Lys
6485 6490 6495
Thr Thr Leu Pro Val Asn Val Ala Phe Glu Leu Trp Ala Lys Arg
6500 6505 6510
Asn Ile Lys Pro Val Pro Glu Val Lys Ile Leu Asn Asn Leu Gly
6515 6520 6525
Val Asp Ile Ala Ala Asn Thr Val Ile Trp Asp Tyr Lys Arg Asp
6530 6535 6540
Ala Pro Ala His Ile Ser Thr Ile Gly Val Cys Ser Met Thr Asp
6545 6550 6555
Ile Ala Lys Lys Pro Thr Glu Thr Ile Cys Ala Pro Leu Thr Val
6560 6565 6570
Phe Phe Asp Gly Arg Val Asp Gly Gln Val Asp Leu Phe Arg Asn
6575 6580 6585
Ala Arg Asn Gly Val Leu Ile Thr Glu Gly Ser Val Lys Gly Leu
6590 6595 6600
Gln Pro Ser Val Gly Pro Lys Gln Ala Ser Leu Asn Gly Val Thr
6605 6610 6615
Leu Ile Gly Glu Ala Val Lys Thr Gln Phe Asn Tyr Tyr Lys Lys
6620 6625 6630
Val Asp Gly Val Val Gln Gln Leu Pro Glu Thr Tyr Phe Thr Gln
6635 6640 6645
Ser Arg Asn Leu Gln Glu Phe Lys Pro Arg Ser Gln Met Glu Ile
6650 6655 6660
Asp Phe Leu Glu Leu Ala Met Asp Glu Phe Ile Glu Arg Tyr Lys
6665 6670 6675
Leu Glu Gly Tyr Ala Phe Glu His Ile Val Tyr Gly Asp Phe Ser
6680 6685 6690
His Ser Gln Leu Gly Gly Leu His Leu Leu Ile Gly Leu Ala Lys
6695 6700 6705
Arg Phe Lys Glu Ser Pro Phe Glu Leu Glu Asp Phe Ile Pro Met
6710 6715 6720
Asp Ser Thr Val Lys Asn Tyr Phe Ile Thr Asp Ala Gln Thr Gly
6725 6730 6735
Ser Ser Lys Cys Val Cys Ser Val Ile Asp Leu Leu Leu Asp Asp
6740 6745 6750
Phe Val Glu Ile Ile Lys Ser Gln Asp Leu Ser Val Val Ser Lys
6755 6760 6765
Val Val Lys Val Thr Ile Asp Tyr Thr Glu Ile Ser Phe Met Leu
6770 6775 6780
Trp Cys Lys Asp Gly His Val Glu Thr Phe Tyr Pro Lys Leu Gln
6785 6790 6795
Ser Ser Gln Ala Trp Gln Pro Gly Val Ala Met Pro Asn Leu Tyr
6800 6805 6810
Lys Met Gln Arg Met Leu Leu Glu Lys Cys Asp Leu Gln Asn Tyr
6815 6820 6825
Gly Asp Ser Ala Thr Leu Pro Lys Gly Ile Met Met Asn Val Ala
6830 6835 6840
Lys Tyr Thr Gln Leu Cys Gln Tyr Leu Asn Thr Leu Thr Leu Ala
6845 6850 6855
Val Pro Tyr Asn Met Arg Val Ile His Phe Gly Ala Gly Ser Asp
6860 6865 6870
Lys Gly Val Ala Pro Gly Thr Ala Val Leu Arg Gln Trp Leu Pro
6875 6880 6885
Thr Gly Thr Leu Leu Val Asp Ser Asp Leu Asn Asp Phe Val Ser
6890 6895 6900
Asp Ala Asp Ser Thr Leu Ile Gly Asp Cys Ala Thr Val His Thr
6905 6910 6915
Ala Asn Lys Trp Asp Leu Ile Ile Ser Asp Met Tyr Asp Pro Lys
6920 6925 6930
Thr Lys Asn Val Thr Lys Glu Asn Asp Ser Lys Glu Gly Phe Phe
6935 6940 6945
Thr Tyr Ile Cys Gly Phe Ile Gln Gln Lys Leu Ala Leu Gly Gly
6950 6955 6960
Ser Val Ala Ile Lys Ile Thr Glu His Ser Trp Asn Ala Asp Leu
6965 6970 6975
Tyr Lys Leu Met Gly His Phe Ala Trp Trp Thr Ala Phe Val Thr
6980 6985 6990
Asn Val Asn Ala Ser Ser Ser Glu Ala Phe Leu Ile Gly Cys Asn
6995 7000 7005
Tyr Leu Gly Lys Pro Arg Glu Gln Ile Asp Gly Tyr Val Met His
7010 7015 7020
Ala Asn Tyr Ile Phe Trp Arg Asn Thr Asn Pro Ile Gln Leu Ser
7025 7030 7035
Ser Tyr Ser Leu Phe Asp Met Ser Lys Phe Pro Leu Lys Leu Arg
7040 7045 7050
Gly Thr Ala Val Met Ser Leu Lys Glu Gly Gln Ile Asn Asp Met
7055 7060 7065
Ile Leu Ser Leu Leu Ser Lys Gly Arg Leu Ile Ile Arg Glu Asn
7070 7075 7080
Asn Arg Val Val Ile Ser Ser Asp Val Leu Val Asn Asn
7085 7090 7095
<210> 552
<211> 4405
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 552
Met Glu Ser Leu Val Pro Gly Phe Asn Glu Lys Thr His Val Gln Leu
1 5 10 15
Ser Leu Pro Val Leu Gln Val Arg Asp Val Leu Val Arg Gly Phe Gly
20 25 30
Asp Ser Val Glu Glu Val Leu Ser Glu Ala Arg Gln His Leu Lys Asp
35 40 45
Gly Thr Cys Gly Leu Val Glu Val Glu Lys Gly Val Leu Pro Gln Leu
50 55 60
Glu Gln Pro Tyr Val Phe Ile Lys Arg Ser Asp Ala Arg Thr Ala Pro
65 70 75 80
His Gly His Val Met Val Glu Leu Val Ala Glu Leu Glu Gly Ile Gln
85 90 95
Tyr Gly Arg Ser Gly Glu Thr Leu Gly Val Leu Val Pro His Val Gly
100 105 110
Glu Ile Pro Val Ala Tyr Arg Lys Val Leu Leu Arg Lys Asn Gly Asn
115 120 125
Lys Gly Ala Gly Gly His Ser Tyr Gly Ala Asp Leu Lys Ser Phe Asp
130 135 140
Leu Gly Asp Glu Leu Gly Thr Asp Pro Tyr Glu Asp Phe Gln Glu Asn
145 150 155 160
Trp Asn Thr Lys His Ser Ser Gly Val Thr Arg Glu Leu Met Arg Glu
165 170 175
Leu Asn Gly Gly Ala Tyr Thr Arg Tyr Val Asp Asn Asn Phe Cys Gly
180 185 190
Pro Asp Gly Tyr Pro Leu Glu Cys Ile Lys Asp Leu Leu Ala Arg Ala
195 200 205
Gly Lys Ala Ser Cys Thr Leu Ser Glu Gln Leu Asp Phe Ile Asp Thr
210 215 220
Lys Arg Gly Val Tyr Cys Cys Arg Glu His Glu His Glu Ile Ala Trp
225 230 235 240
Tyr Thr Glu Arg Ser Glu Lys Ser Tyr Glu Leu Gln Thr Pro Phe Glu
245 250 255
Ile Lys Leu Ala Lys Lys Phe Asp Thr Phe Asn Gly Glu Cys Pro Asn
260 265 270
Phe Val Phe Pro Leu Asn Ser Ile Ile Lys Thr Ile Gln Pro Arg Val
275 280 285
Glu Lys Lys Lys Leu Asp Gly Phe Met Gly Arg Ile Arg Ser Val Tyr
290 295 300
Pro Val Ala Ser Pro Asn Glu Cys Asn Gln Met Cys Leu Ser Thr Leu
305 310 315 320
Met Lys Cys Asp His Cys Gly Glu Thr Ser Trp Gln Thr Gly Asp Phe
325 330 335
Val Lys Ala Thr Cys Glu Phe Cys Gly Thr Glu Asn Leu Thr Lys Glu
340 345 350
Gly Ala Thr Thr Cys Gly Tyr Leu Pro Gln Asn Ala Val Val Lys Ile
355 360 365
Tyr Cys Pro Ala Cys His Asn Ser Glu Val Gly Pro Glu His Ser Leu
370 375 380
Ala Glu Tyr His Asn Glu Ser Gly Leu Lys Thr Ile Leu Arg Lys Gly
385 390 395 400
Gly Arg Thr Ile Ala Phe Gly Gly Cys Val Phe Ser Tyr Val Gly Cys
405 410 415
His Asn Lys Cys Ala Tyr Trp Val Pro Arg Ala Ser Ala Asn Ile Gly
420 425 430
Cys Asn His Thr Gly Val Val Gly Glu Gly Ser Glu Gly Leu Asn Asp
435 440 445
Asn Leu Leu Glu Ile Leu Gln Lys Glu Lys Val Asn Ile Asn Ile Val
450 455 460
Gly Asp Phe Lys Leu Asn Glu Glu Ile Ala Ile Ile Leu Ala Ser Phe
465 470 475 480
Ser Ala Ser Thr Ser Ala Phe Val Glu Thr Val Lys Gly Leu Asp Tyr
485 490 495
Lys Ala Phe Lys Gln Ile Val Glu Ser Cys Gly Asn Phe Lys Val Thr
500 505 510
Lys Gly Lys Ala Lys Lys Gly Ala Trp Asn Ile Gly Glu Gln Lys Ser
515 520 525
Ile Leu Ser Pro Leu Tyr Ala Phe Ala Ser Glu Ala Ala Arg Val Val
530 535 540
Arg Ser Ile Phe Ser Arg Thr Leu Glu Thr Ala Gln Asn Ser Val Arg
545 550 555 560
Val Leu Gln Lys Ala Ala Ile Thr Ile Leu Asp Gly Ile Ser Gln Tyr
565 570 575
Ser Leu Arg Leu Ile Asp Ala Met Met Phe Thr Ser Asp Leu Ala Thr
580 585 590
Asn Asn Leu Val Val Met Ala Tyr Ile Thr Gly Gly Val Val Gln Leu
595 600 605
Thr Ser Gln Trp Leu Thr Asn Ile Phe Gly Thr Val Tyr Glu Lys Leu
610 615 620
Lys Pro Val Leu Asp Trp Leu Glu Glu Lys Phe Lys Glu Gly Val Glu
625 630 635 640
Phe Leu Arg Asp Gly Trp Glu Ile Val Lys Phe Ile Ser Thr Cys Ala
645 650 655
Cys Glu Ile Val Gly Gly Gln Ile Val Thr Cys Ala Lys Glu Ile Lys
660 665 670
Glu Ser Val Gln Thr Phe Phe Lys Leu Val Asn Lys Phe Leu Ala Leu
675 680 685
Cys Ala Asp Ser Ile Ile Ile Gly Gly Ala Lys Leu Lys Ala Leu Asn
690 695 700
Leu Gly Glu Thr Phe Val Thr His Ser Lys Gly Leu Tyr Arg Lys Cys
705 710 715 720
Val Lys Ser Arg Glu Glu Thr Gly Leu Leu Met Pro Leu Lys Ala Pro
725 730 735
Lys Glu Ile Ile Phe Leu Glu Gly Glu Thr Leu Pro Thr Glu Val Leu
740 745 750
Thr Glu Glu Val Val Leu Lys Thr Gly Asp Leu Gln Pro Leu Glu Gln
755 760 765
Pro Thr Ser Glu Ala Val Glu Ala Pro Leu Val Gly Thr Pro Val Cys
770 775 780
Ile Asn Gly Leu Met Leu Leu Glu Ile Lys Asp Thr Glu Lys Tyr Cys
785 790 795 800
Ala Leu Ala Pro Asn Met Met Val Thr Asn Asn Thr Phe Thr Leu Lys
805 810 815
Gly Gly Ala Pro Thr Lys Val Thr Phe Gly Asp Asp Thr Val Ile Glu
820 825 830
Val Gln Gly Tyr Lys Ser Val Asn Ile Thr Phe Glu Leu Asp Glu Arg
835 840 845
Ile Asp Lys Val Leu Asn Glu Lys Cys Ser Ala Tyr Thr Val Glu Leu
850 855 860
Gly Thr Glu Val Asn Glu Phe Ala Cys Val Val Ala Asp Ala Val Ile
865 870 875 880
Lys Thr Leu Gln Pro Val Ser Glu Leu Leu Thr Pro Leu Gly Ile Asp
885 890 895
Leu Asp Glu Trp Ser Met Ala Thr Tyr Tyr Leu Phe Asp Glu Ser Gly
900 905 910
Glu Phe Lys Leu Ala Ser His Met Tyr Cys Ser Phe Tyr Pro Pro Asp
915 920 925
Glu Asp Glu Glu Glu Gly Asp Cys Glu Glu Glu Glu Phe Glu Pro Ser
930 935 940
Thr Gln Tyr Glu Tyr Gly Thr Glu Asp Asp Tyr Gln Gly Lys Pro Leu
945 950 955 960
Glu Phe Gly Ala Thr Ser Ala Ala Leu Gln Pro Glu Glu Glu Gln Glu
965 970 975
Glu Asp Trp Leu Asp Asp Asp Ser Gln Gln Thr Val Gly Gln Gln Asp
980 985 990
Gly Ser Glu Asp Asn Gln Thr Thr Thr Ile Gln Thr Ile Val Glu Val
995 1000 1005
Gln Pro Gln Leu Glu Met Glu Leu Thr Pro Val Val Gln Thr Ile
1010 1015 1020
Glu Val Asn Ser Phe Ser Gly Tyr Leu Lys Leu Thr Asp Asn Val
1025 1030 1035
Tyr Ile Lys Asn Ala Asp Ile Val Glu Glu Ala Lys Lys Val Lys
1040 1045 1050
Pro Thr Val Val Val Asn Ala Ala Asn Val Tyr Leu Lys His Gly
1055 1060 1065
Gly Gly Val Ala Gly Ala Leu Asn Lys Ala Thr Asn Asn Ala Met
1070 1075 1080
Gln Val Glu Ser Asp Asp Tyr Ile Ala Thr Asn Gly Pro Leu Lys
1085 1090 1095
Val Gly Gly Ser Cys Val Leu Ser Gly His Asn Leu Ala Lys His
1100 1105 1110
Cys Leu His Val Val Gly Pro Asn Val Asn Lys Gly Glu Asp Ile
1115 1120 1125
Gln Leu Leu Lys Ser Ala Tyr Glu Asn Phe Asn Gln His Glu Val
1130 1135 1140
Leu Leu Ala Pro Leu Leu Ser Ala Gly Ile Phe Gly Ala Asp Pro
1145 1150 1155
Ile His Ser Leu Arg Val Cys Val Asp Thr Val Arg Thr Asn Val
1160 1165 1170
Tyr Leu Ala Val Phe Asp Lys Asn Leu Tyr Asp Lys Leu Val Ser
1175 1180 1185
Ser Phe Leu Glu Met Lys Ser Glu Lys Gln Val Glu Gln Lys Ile
1190 1195 1200
Ala Glu Ile Pro Lys Glu Glu Val Lys Pro Phe Ile Thr Glu Ser
1205 1210 1215
Lys Pro Ser Val Glu Gln Arg Lys Gln Asp Asp Lys Lys Ile Lys
1220 1225 1230
Ala Cys Val Glu Glu Val Thr Thr Thr Leu Glu Glu Thr Lys Phe
1235 1240 1245
Leu Thr Glu Asn Leu Leu Leu Tyr Ile Asp Ile Asn Gly Asn Leu
1250 1255 1260
His Pro Asp Ser Ala Thr Leu Val Ser Asp Ile Asp Ile Thr Phe
1265 1270 1275
Leu Lys Lys Asp Ala Pro Tyr Ile Val Gly Asp Val Val Gln Glu
1280 1285 1290
Gly Val Leu Thr Ala Val Val Ile Pro Thr Lys Lys Ala Gly Gly
1295 1300 1305
Thr Thr Glu Met Leu Ala Lys Ala Leu Arg Lys Val Pro Thr Asp
1310 1315 1320
Asn Tyr Ile Thr Thr Tyr Pro Gly Gln Gly Leu Asn Gly Tyr Thr
1325 1330 1335
Val Glu Glu Ala Lys Thr Val Leu Lys Lys Cys Lys Ser Ala Phe
1340 1345 1350
Tyr Ile Leu Pro Ser Ile Ile Ser Asn Glu Lys Gln Glu Ile Leu
1355 1360 1365
Gly Thr Val Ser Trp Asn Leu Arg Glu Met Leu Ala His Ala Glu
1370 1375 1380
Glu Thr Arg Lys Leu Met Pro Val Cys Val Glu Thr Lys Ala Ile
1385 1390 1395
Val Ser Thr Ile Gln Arg Lys Tyr Lys Gly Ile Lys Ile Gln Glu
1400 1405 1410
Gly Val Val Asp Tyr Gly Ala Arg Phe Tyr Phe Tyr Thr Ser Lys
1415 1420 1425
Thr Thr Val Ala Ser Leu Ile Asn Thr Leu Asn Asp Leu Asn Glu
1430 1435 1440
Thr Leu Val Thr Met Pro Leu Gly Tyr Val Thr His Gly Leu Asn
1445 1450 1455
Leu Glu Glu Ala Ala Arg Tyr Met Arg Ser Leu Lys Val Pro Ala
1460 1465 1470
Thr Val Ser Val Ser Ser Pro Asp Ala Val Thr Ala Tyr Asn Gly
1475 1480 1485
Tyr Leu Thr Ser Ser Ser Lys Thr Pro Glu Glu His Phe Ile Glu
1490 1495 1500
Thr Ile Ser Leu Ala Gly Ser Tyr Lys Asp Trp Ser Tyr Ser Gly
1505 1510 1515
Gln Ser Thr Gln Leu Gly Ile Glu Phe Leu Lys Arg Gly Asp Lys
1520 1525 1530
Ser Val Tyr Tyr Thr Ser Asn Pro Thr Thr Phe His Leu Asp Gly
1535 1540 1545
Glu Val Ile Thr Phe Asp Asn Leu Lys Thr Leu Leu Ser Leu Arg
1550 1555 1560
Glu Val Arg Thr Ile Lys Val Phe Thr Thr Val Asp Asn Ile Asn
1565 1570 1575
Leu His Thr Gln Val Val Asp Met Ser Met Thr Tyr Gly Gln Gln
1580 1585 1590
Phe Gly Pro Thr Tyr Leu Asp Gly Ala Asp Val Thr Lys Ile Lys
1595 1600 1605
Pro His Asn Ser His Glu Gly Lys Thr Phe Tyr Val Leu Pro Asn
1610 1615 1620
Asp Asp Thr Leu Arg Val Glu Ala Phe Glu Tyr Tyr His Thr Thr
1625 1630 1635
Asp Pro Ser Phe Leu Gly Arg Tyr Met Ser Ala Leu Asn His Thr
1640 1645 1650
Lys Lys Trp Lys Tyr Pro Gln Val Asn Gly Leu Thr Ser Ile Lys
1655 1660 1665
Trp Ala Asp Asn Asn Cys Tyr Leu Ala Thr Ala Leu Leu Thr Leu
1670 1675 1680
Gln Gln Ile Glu Leu Lys Phe Asn Pro Pro Ala Leu Gln Asp Ala
1685 1690 1695
Tyr Tyr Arg Ala Arg Ala Gly Glu Ala Ala Asn Phe Cys Ala Leu
1700 1705 1710
Ile Leu Ala Tyr Cys Asn Lys Thr Val Gly Glu Leu Gly Asp Val
1715 1720 1725
Arg Glu Thr Met Ser Tyr Leu Phe Gln His Ala Asn Leu Asp Ser
1730 1735 1740
Cys Lys Arg Val Leu Asn Val Val Cys Lys Thr Cys Gly Gln Gln
1745 1750 1755
Gln Thr Thr Leu Lys Gly Val Glu Ala Val Met Tyr Met Gly Thr
1760 1765 1770
Leu Ser Tyr Glu Gln Phe Lys Lys Gly Val Gln Ile Pro Cys Thr
1775 1780 1785
Cys Gly Lys Gln Ala Thr Lys Tyr Leu Val Gln Gln Glu Ser Pro
1790 1795 1800
Phe Val Met Met Ser Ala Pro Pro Ala Gln Tyr Glu Leu Lys His
1805 1810 1815
Gly Thr Phe Thr Cys Ala Ser Glu Tyr Thr Gly Asn Tyr Gln Cys
1820 1825 1830
Gly His Tyr Lys His Ile Thr Ser Lys Glu Thr Leu Tyr Cys Ile
1835 1840 1845
Asp Gly Ala Leu Leu Thr Lys Ser Ser Glu Tyr Lys Gly Pro Ile
1850 1855 1860
Thr Asp Val Phe Tyr Lys Glu Asn Ser Tyr Thr Thr Thr Ile Lys
1865 1870 1875
Pro Val Thr Tyr Lys Leu Asp Gly Val Val Cys Thr Glu Ile Asp
1880 1885 1890
Pro Lys Leu Asp Asn Tyr Tyr Lys Lys Asp Asn Ser Tyr Phe Thr
1895 1900 1905
Glu Gln Pro Ile Asp Leu Val Pro Asn Gln Pro Tyr Pro Asn Ala
1910 1915 1920
Ser Phe Asp Asn Phe Lys Phe Val Cys Asp Asn Ile Lys Phe Ala
1925 1930 1935
Asp Asp Leu Asn Gln Leu Thr Gly Tyr Lys Lys Pro Ala Ser Arg
1940 1945 1950
Glu Leu Lys Val Thr Phe Phe Pro Asp Leu Asn Gly Asp Val Val
1955 1960 1965
Ala Ile Asp Tyr Lys His Tyr Thr Pro Ser Phe Lys Lys Gly Ala
1970 1975 1980
Lys Leu Leu His Lys Pro Ile Val Trp His Val Asn Asn Ala Thr
1985 1990 1995
Asn Lys Ala Thr Tyr Lys Pro Asn Thr Trp Cys Ile Arg Cys Leu
2000 2005 2010
Trp Ser Thr Lys Pro Val Glu Thr Ser Asn Ser Phe Asp Val Leu
2015 2020 2025
Lys Ser Glu Asp Ala Gln Gly Met Asp Asn Leu Ala Cys Glu Asp
2030 2035 2040
Leu Lys Pro Val Ser Glu Glu Val Val Glu Asn Pro Thr Ile Gln
2045 2050 2055
Lys Asp Val Leu Glu Cys Asn Val Lys Thr Thr Glu Val Val Gly
2060 2065 2070
Asp Ile Ile Leu Lys Pro Ala Asn Asn Ser Leu Lys Ile Thr Glu
2075 2080 2085
Glu Val Gly His Thr Asp Leu Met Ala Ala Tyr Val Asp Asn Ser
2090 2095 2100
Ser Leu Thr Ile Lys Lys Pro Asn Glu Leu Ser Arg Val Leu Gly
2105 2110 2115
Leu Lys Thr Leu Ala Thr His Gly Leu Ala Ala Val Asn Ser Val
2120 2125 2130
Pro Trp Asp Thr Ile Ala Asn Tyr Ala Lys Pro Phe Leu Asn Lys
2135 2140 2145
Val Val Ser Thr Thr Thr Asn Ile Val Thr Arg Cys Leu Asn Arg
2150 2155 2160
Val Cys Thr Asn Tyr Met Pro Tyr Phe Phe Thr Leu Leu Leu Gln
2165 2170 2175
Leu Cys Thr Phe Thr Arg Ser Thr Asn Ser Arg Ile Lys Ala Ser
2180 2185 2190
Met Pro Thr Thr Ile Ala Lys Asn Thr Val Lys Ser Val Gly Lys
2195 2200 2205
Phe Cys Leu Glu Ala Ser Phe Asn Tyr Leu Lys Ser Pro Asn Phe
2210 2215 2220
Ser Lys Leu Ile Asn Ile Ile Ile Trp Phe Leu Leu Leu Ser Val
2225 2230 2235
Cys Leu Gly Ser Leu Ile Tyr Ser Thr Ala Ala Leu Gly Val Leu
2240 2245 2250
Met Ser Asn Leu Gly Met Pro Ser Tyr Cys Thr Gly Tyr Arg Glu
2255 2260 2265
Gly Tyr Leu Asn Ser Thr Asn Val Thr Ile Ala Thr Tyr Cys Thr
2270 2275 2280
Gly Ser Ile Pro Cys Ser Val Cys Leu Ser Gly Leu Asp Ser Leu
2285 2290 2295
Asp Thr Tyr Pro Ser Leu Glu Thr Ile Gln Ile Thr Ile Ser Ser
2300 2305 2310
Phe Lys Trp Asp Leu Thr Ala Phe Gly Leu Val Ala Glu Trp Phe
2315 2320 2325
Leu Ala Tyr Ile Leu Phe Thr Arg Phe Phe Tyr Val Leu Gly Leu
2330 2335 2340
Ala Ala Ile Met Gln Leu Phe Phe Ser Tyr Phe Ala Val His Phe
2345 2350 2355
Ile Ser Asn Ser Trp Leu Met Trp Leu Ile Ile Asn Leu Val Gln
2360 2365 2370
Met Ala Pro Ile Ser Ala Met Val Arg Met Tyr Ile Phe Phe Ala
2375 2380 2385
Ser Phe Tyr Tyr Val Trp Lys Ser Tyr Val His Val Val Asp Gly
2390 2395 2400
Cys Asn Ser Ser Thr Cys Met Met Cys Tyr Lys Arg Asn Arg Ala
2405 2410 2415
Thr Arg Val Glu Cys Thr Thr Ile Val Asn Gly Val Arg Arg Ser
2420 2425 2430
Phe Tyr Val Tyr Ala Asn Gly Gly Lys Gly Phe Cys Lys Leu His
2435 2440 2445
Asn Trp Asn Cys Val Asn Cys Asp Thr Phe Cys Ala Gly Ser Thr
2450 2455 2460
Phe Ile Ser Asp Glu Val Ala Arg Asp Leu Ser Leu Gln Phe Lys
2465 2470 2475
Arg Pro Ile Asn Pro Thr Asp Gln Ser Ser Tyr Ile Val Asp Ser
2480 2485 2490
Val Thr Val Lys Asn Gly Ser Ile His Leu Tyr Phe Asp Lys Ala
2495 2500 2505
Gly Gln Lys Thr Tyr Glu Arg His Ser Leu Ser His Phe Val Asn
2510 2515 2520
Leu Asp Asn Leu Arg Ala Asn Asn Thr Lys Gly Ser Leu Pro Ile
2525 2530 2535
Asn Val Ile Val Phe Asp Gly Lys Ser Lys Cys Glu Glu Ser Ser
2540 2545 2550
Ala Lys Ser Ala Ser Val Tyr Tyr Ser Gln Leu Met Cys Gln Pro
2555 2560 2565
Ile Leu Leu Leu Asp Gln Ala Leu Val Ser Asp Val Gly Asp Ser
2570 2575 2580
Ala Glu Val Ala Val Lys Met Phe Asp Ala Tyr Val Asn Thr Phe
2585 2590 2595
Ser Ser Thr Phe Asn Val Pro Met Glu Lys Leu Lys Thr Leu Val
2600 2605 2610
Ala Thr Ala Glu Ala Glu Leu Ala Lys Asn Val Ser Leu Asp Asn
2615 2620 2625
Val Leu Ser Thr Phe Ile Ser Ala Ala Arg Gln Gly Phe Val Asp
2630 2635 2640
Ser Asp Val Glu Thr Lys Asp Val Val Glu Cys Leu Lys Leu Ser
2645 2650 2655
His Gln Ser Asp Ile Glu Val Thr Gly Asp Ser Cys Asn Asn Tyr
2660 2665 2670
Met Leu Thr Tyr Asn Lys Val Glu Asn Met Thr Pro Arg Asp Leu
2675 2680 2685
Gly Ala Cys Ile Asp Cys Ser Ala Arg His Ile Asn Ala Gln Val
2690 2695 2700
Ala Lys Ser His Asn Ile Ala Leu Ile Trp Asn Val Lys Asp Phe
2705 2710 2715
Met Ser Leu Ser Glu Gln Leu Arg Lys Gln Ile Arg Ser Ala Ala
2720 2725 2730
Lys Lys Asn Asn Leu Pro Phe Lys Leu Thr Cys Ala Thr Thr Arg
2735 2740 2745
Gln Val Val Asn Val Val Thr Thr Lys Ile Ala Leu Lys Gly Gly
2750 2755 2760
Lys Ile Val Asn Asn Trp Leu Lys Gln Leu Ile Lys Val Thr Leu
2765 2770 2775
Val Phe Leu Phe Val Ala Ala Ile Phe Tyr Leu Ile Thr Pro Val
2780 2785 2790
His Val Met Ser Lys His Thr Asp Phe Ser Ser Glu Ile Ile Gly
2795 2800 2805
Tyr Lys Ala Ile Asp Gly Gly Val Thr Arg Asp Ile Ala Ser Thr
2810 2815 2820
Asp Thr Cys Phe Ala Asn Lys His Ala Asp Phe Asp Thr Trp Phe
2825 2830 2835
Ser Gln Arg Gly Gly Ser Tyr Thr Asn Asp Lys Ala Cys Pro Leu
2840 2845 2850
Ile Ala Ala Val Ile Thr Arg Glu Val Gly Phe Val Val Pro Gly
2855 2860 2865
Leu Pro Gly Thr Ile Leu Arg Thr Thr Asn Gly Asp Phe Leu His
2870 2875 2880
Phe Leu Pro Arg Val Phe Ser Ala Val Gly Asn Ile Cys Tyr Thr
2885 2890 2895
Pro Ser Lys Leu Ile Glu Tyr Thr Asp Phe Ala Thr Ser Ala Cys
2900 2905 2910
Val Leu Ala Ala Glu Cys Thr Ile Phe Lys Asp Ala Ser Gly Lys
2915 2920 2925
Pro Val Pro Tyr Cys Tyr Asp Thr Asn Val Leu Glu Gly Ser Val
2930 2935 2940
Ala Tyr Glu Ser Leu Arg Pro Asp Thr Arg Tyr Val Leu Met Asp
2945 2950 2955
Gly Ser Ile Ile Gln Phe Pro Asn Thr Tyr Leu Glu Gly Ser Val
2960 2965 2970
Arg Val Val Thr Thr Phe Asp Ser Glu Tyr Cys Arg His Gly Thr
2975 2980 2985
Cys Glu Arg Ser Glu Ala Gly Val Cys Val Ser Thr Ser Gly Arg
2990 2995 3000
Trp Val Leu Asn Asn Asp Tyr Tyr Arg Ser Leu Pro Gly Val Phe
3005 3010 3015
Cys Gly Val Asp Ala Val Asn Leu Leu Thr Asn Met Phe Thr Pro
3020 3025 3030
Leu Ile Gln Pro Ile Gly Ala Leu Asp Ile Ser Ala Ser Ile Val
3035 3040 3045
Ala Gly Gly Ile Val Ala Ile Val Val Thr Cys Leu Ala Tyr Tyr
3050 3055 3060
Phe Met Arg Phe Arg Arg Ala Phe Gly Glu Tyr Ser His Val Val
3065 3070 3075
Ala Phe Asn Thr Leu Leu Phe Leu Met Ser Phe Thr Val Leu Cys
3080 3085 3090
Leu Thr Pro Val Tyr Ser Phe Leu Pro Gly Val Tyr Ser Val Ile
3095 3100 3105
Tyr Leu Tyr Leu Thr Phe Tyr Leu Thr Asn Asp Val Ser Phe Leu
3110 3115 3120
Ala His Ile Gln Trp Met Val Met Phe Thr Pro Leu Val Pro Phe
3125 3130 3135
Trp Ile Thr Ile Ala Tyr Ile Ile Cys Ile Ser Thr Lys His Phe
3140 3145 3150
Tyr Trp Phe Phe Ser Asn Tyr Leu Lys Arg Arg Val Val Phe Asn
3155 3160 3165
Gly Val Ser Phe Ser Thr Phe Glu Glu Ala Ala Leu Cys Thr Phe
3170 3175 3180
Leu Leu Asn Lys Glu Met Tyr Leu Lys Leu Arg Ser Asp Val Leu
3185 3190 3195
Leu Pro Leu Thr Gln Tyr Asn Arg Tyr Leu Ala Leu Tyr Asn Lys
3200 3205 3210
Tyr Lys Tyr Phe Ser Gly Ala Met Asp Thr Thr Ser Tyr Arg Glu
3215 3220 3225
Ala Ala Cys Cys His Leu Ala Lys Ala Leu Asn Asp Phe Ser Asn
3230 3235 3240
Ser Gly Ser Asp Val Leu Tyr Gln Pro Pro Gln Thr Ser Ile Thr
3245 3250 3255
Ser Ala Val Leu Gln Ser Gly Phe Arg Lys Met Ala Phe Pro Ser
3260 3265 3270
Gly Lys Val Glu Gly Cys Met Val Gln Val Thr Cys Gly Thr Thr
3275 3280 3285
Thr Leu Asn Gly Leu Trp Leu Asp Asp Val Val Tyr Cys Pro Arg
3290 3295 3300
His Val Ile Cys Thr Ser Glu Asp Met Leu Asn Pro Asn Tyr Glu
3305 3310 3315
Asp Leu Leu Ile Arg Lys Ser Asn His Asn Phe Leu Val Gln Ala
3320 3325 3330
Gly Asn Val Gln Leu Arg Val Ile Gly His Ser Met Gln Asn Cys
3335 3340 3345
Val Leu Lys Leu Lys Val Asp Thr Ala Asn Pro Lys Thr Pro Lys
3350 3355 3360
Tyr Lys Phe Val Arg Ile Gln Pro Gly Gln Thr Phe Ser Val Leu
3365 3370 3375
Ala Cys Tyr Asn Gly Ser Pro Ser Gly Val Tyr Gln Cys Ala Met
3380 3385 3390
Arg Pro Asn Phe Thr Ile Lys Gly Ser Phe Leu Asn Gly Ser Cys
3395 3400 3405
Gly Ser Val Gly Phe Asn Ile Asp Tyr Asp Cys Val Ser Phe Cys
3410 3415 3420
Tyr Met His His Met Glu Leu Pro Thr Gly Val His Ala Gly Thr
3425 3430 3435
Asp Leu Glu Gly Asn Phe Tyr Gly Pro Phe Val Asp Arg Gln Thr
3440 3445 3450
Ala Gln Ala Ala Gly Thr Asp Thr Thr Ile Thr Val Asn Val Leu
3455 3460 3465
Ala Trp Leu Tyr Ala Ala Val Ile Asn Gly Asp Arg Trp Phe Leu
3470 3475 3480
Asn Arg Phe Thr Thr Thr Leu Asn Asp Phe Asn Leu Val Ala Met
3485 3490 3495
Lys Tyr Asn Tyr Glu Pro Leu Thr Gln Asp His Val Asp Ile Leu
3500 3505 3510
Gly Pro Leu Ser Ala Gln Thr Gly Ile Ala Val Leu Asp Met Cys
3515 3520 3525
Ala Ser Leu Lys Glu Leu Leu Gln Asn Gly Met Asn Gly Arg Thr
3530 3535 3540
Ile Leu Gly Ser Ala Leu Leu Glu Asp Glu Phe Thr Pro Phe Asp
3545 3550 3555
Val Val Arg Gln Cys Ser Gly Val Thr Phe Gln Ser Ala Val Lys
3560 3565 3570
Arg Thr Ile Lys Gly Thr His His Trp Leu Leu Leu Thr Ile Leu
3575 3580 3585
Thr Ser Leu Leu Val Leu Val Gln Ser Thr Gln Trp Ser Leu Phe
3590 3595 3600
Phe Phe Leu Tyr Glu Asn Ala Phe Leu Pro Phe Ala Met Gly Ile
3605 3610 3615
Ile Ala Met Ser Ala Phe Ala Met Met Phe Val Lys His Lys His
3620 3625 3630
Ala Phe Leu Cys Leu Phe Leu Leu Pro Ser Leu Ala Thr Val Ala
3635 3640 3645
Tyr Phe Asn Met Val Tyr Met Pro Ala Ser Trp Val Met Arg Ile
3650 3655 3660
Met Thr Trp Leu Asp Met Val Asp Thr Ser Leu Ser Gly Phe Lys
3665 3670 3675
Leu Lys Asp Cys Val Met Tyr Ala Ser Ala Val Val Leu Leu Ile
3680 3685 3690
Leu Met Thr Ala Arg Thr Val Tyr Asp Asp Gly Ala Arg Arg Val
3695 3700 3705
Trp Thr Leu Met Asn Val Leu Thr Leu Val Tyr Lys Val Tyr Tyr
3710 3715 3720
Gly Asn Ala Leu Asp Gln Ala Ile Ser Met Trp Ala Leu Ile Ile
3725 3730 3735
Ser Val Thr Ser Asn Tyr Ser Gly Val Val Thr Thr Val Met Phe
3740 3745 3750
Leu Ala Arg Gly Ile Val Phe Met Cys Val Glu Tyr Cys Pro Ile
3755 3760 3765
Phe Phe Ile Thr Gly Asn Thr Leu Gln Cys Ile Met Leu Val Tyr
3770 3775 3780
Cys Phe Leu Gly Tyr Phe Cys Thr Cys Tyr Phe Gly Leu Phe Cys
3785 3790 3795
Leu Leu Asn Arg Tyr Phe Arg Leu Thr Leu Gly Val Tyr Asp Tyr
3800 3805 3810
Leu Val Ser Thr Gln Glu Phe Arg Tyr Met Asn Ser Gln Gly Leu
3815 3820 3825
Leu Pro Pro Lys Asn Ser Ile Asp Ala Phe Lys Leu Asn Ile Lys
3830 3835 3840
Leu Leu Gly Val Gly Gly Lys Pro Cys Ile Lys Val Ala Thr Val
3845 3850 3855
Gln Ser Lys Met Ser Asp Val Lys Cys Thr Ser Val Val Leu Leu
3860 3865 3870
Ser Val Leu Gln Gln Leu Arg Val Glu Ser Ser Ser Lys Leu Trp
3875 3880 3885
Ala Gln Cys Val Gln Leu His Asn Asp Ile Leu Leu Ala Lys Asp
3890 3895 3900
Thr Thr Glu Ala Phe Glu Lys Met Val Ser Leu Leu Ser Val Leu
3905 3910 3915
Leu Ser Met Gln Gly Ala Val Asp Ile Asn Lys Leu Cys Glu Glu
3920 3925 3930
Met Leu Asp Asn Arg Ala Thr Leu Gln Ala Ile Ala Ser Glu Phe
3935 3940 3945
Ser Ser Leu Pro Ser Tyr Ala Ala Phe Ala Thr Ala Gln Glu Ala
3950 3955 3960
Tyr Glu Gln Ala Val Ala Asn Gly Asp Ser Glu Val Val Leu Lys
3965 3970 3975
Lys Leu Lys Lys Ser Leu Asn Val Ala Lys Ser Glu Phe Asp Arg
3980 3985 3990
Asp Ala Ala Met Gln Arg Lys Leu Glu Lys Met Ala Asp Gln Ala
3995 4000 4005
Met Thr Gln Met Tyr Lys Gln Ala Arg Ser Glu Asp Lys Arg Ala
4010 4015 4020
Lys Val Thr Ser Ala Met Gln Thr Met Leu Phe Thr Met Leu Arg
4025 4030 4035
Lys Leu Asp Asn Asp Ala Leu Asn Asn Ile Ile Asn Asn Ala Arg
4040 4045 4050
Asp Gly Cys Val Pro Leu Asn Ile Ile Pro Leu Thr Thr Ala Ala
4055 4060 4065
Lys Leu Met Val Val Ile Pro Asp Tyr Asn Thr Tyr Lys Asn Thr
4070 4075 4080
Cys Asp Gly Thr Thr Phe Thr Tyr Ala Ser Ala Leu Trp Glu Ile
4085 4090 4095
Gln Gln Val Val Asp Ala Asp Ser Lys Ile Val Gln Leu Ser Glu
4100 4105 4110
Ile Ser Met Asp Asn Ser Pro Asn Leu Ala Trp Pro Leu Ile Val
4115 4120 4125
Thr Ala Leu Arg Ala Asn Ser Ala Val Lys Leu Gln Asn Asn Glu
4130 4135 4140
Leu Ser Pro Val Ala Leu Arg Gln Met Ser Cys Ala Ala Gly Thr
4145 4150 4155
Thr Gln Thr Ala Cys Thr Asp Asp Asn Ala Leu Ala Tyr Tyr Asn
4160 4165 4170
Thr Thr Lys Gly Gly Arg Phe Val Leu Ala Leu Leu Ser Asp Leu
4175 4180 4185
Gln Asp Leu Lys Trp Ala Arg Phe Pro Lys Ser Asp Gly Thr Gly
4190 4195 4200
Thr Ile Tyr Thr Glu Leu Glu Pro Pro Cys Arg Phe Val Thr Asp
4205 4210 4215
Thr Pro Lys Gly Pro Lys Val Lys Tyr Leu Tyr Phe Ile Lys Gly
4220 4225 4230
Leu Asn Asn Leu Asn Arg Gly Met Val Leu Gly Ser Leu Ala Ala
4235 4240 4245
Thr Val Arg Leu Gln Ala Gly Asn Ala Thr Glu Val Pro Ala Asn
4250 4255 4260
Ser Thr Val Leu Ser Phe Cys Ala Phe Ala Val Asp Ala Ala Lys
4265 4270 4275
Ala Tyr Lys Asp Tyr Leu Ala Ser Gly Gly Gln Pro Ile Thr Asn
4280 4285 4290
Cys Val Lys Met Leu Cys Thr His Thr Gly Thr Gly Gln Ala Ile
4295 4300 4305
Thr Val Thr Pro Glu Ala Asn Met Asp Gln Glu Ser Phe Gly Gly
4310 4315 4320
Ala Ser Cys Cys Leu Tyr Cys Arg Cys His Ile Asp His Pro Asn
4325 4330 4335
Pro Lys Gly Phe Cys Asp Leu Lys Gly Lys Tyr Val Gln Ile Pro
4340 4345 4350
Thr Thr Cys Ala Asn Asp Pro Val Gly Phe Thr Leu Lys Asn Thr
4355 4360 4365
Val Cys Thr Val Cys Gly Met Trp Lys Gly Tyr Gly Cys Ser Cys
4370 4375 4380
Asp Gln Leu Arg Glu Pro Met Leu Gln Ser Ala Asp Ala Gln Ser
4385 4390 4395
Phe Leu Asn Gly Phe Ala Val
4400 4405
<210> 553
<211> 1273
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 553
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
1145 1150 1155
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn
1160 1165 1170
Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu
1175 1180 1185
Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu
1205 1210 1215
Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met
1220 1225 1230
Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro
1250 1255 1260
Val Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 554
<211> 275
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 554
Met Asp Leu Phe Met Arg Ile Phe Thr Ile Gly Thr Val Thr Leu Lys
1 5 10 15
Gln Gly Glu Ile Lys Asp Ala Thr Pro Ser Asp Phe Val Arg Ala Thr
20 25 30
Ala Thr Ile Pro Ile Gln Ala Ser Leu Pro Phe Gly Trp Leu Ile Val
35 40 45
Gly Val Ala Leu Leu Ala Val Phe Gln Ser Ala Ser Lys Ile Ile Thr
50 55 60
Leu Lys Lys Arg Trp Gln Leu Ala Leu Ser Lys Gly Val His Phe Val
65 70 75 80
Cys Asn Leu Leu Leu Leu Phe Val Thr Val Tyr Ser His Leu Leu Leu
85 90 95
Val Ala Ala Gly Leu Glu Ala Pro Phe Leu Tyr Leu Tyr Ala Leu Val
100 105 110
Tyr Phe Leu Gln Ser Ile Asn Phe Val Arg Ile Ile Met Arg Leu Trp
115 120 125
Leu Cys Trp Lys Cys Arg Ser Lys Asn Pro Leu Leu Tyr Asp Ala Asn
130 135 140
Tyr Phe Leu Cys Trp His Thr Asn Cys Tyr Asp Tyr Cys Ile Pro Tyr
145 150 155 160
Asn Ser Val Thr Ser Ser Ile Val Ile Thr Ser Gly Asp Gly Thr Thr
165 170 175
Ser Pro Ile Ser Glu His Asp Tyr Gln Ile Gly Gly Tyr Thr Glu Lys
180 185 190
Trp Glu Ser Gly Val Lys Asp Cys Val Val Leu His Ser Tyr Phe Thr
195 200 205
Ser Asp Tyr Tyr Gln Leu Tyr Ser Thr Gln Leu Ser Thr Asp Thr Gly
210 215 220
Val Glu His Val Thr Phe Phe Ile Tyr Asn Lys Ile Val Asp Glu Pro
225 230 235 240
Glu Glu His Val Gln Ile His Thr Ile Asp Gly Ser Ser Gly Val Val
245 250 255
Asn Pro Val Met Glu Pro Ile Tyr Asp Glu Pro Thr Thr Thr Thr Ser
260 265 270
Val Pro Leu
275
<210> 555
<211> 75
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 555
Met Tyr Ser Phe Val Ser Glu Glu Thr Gly Thr Leu Ile Val Asn Ser
1 5 10 15
Val Leu Leu Phe Leu Ala Phe Val Val Phe Leu Leu Val Thr Leu Ala
20 25 30
Ile Leu Thr Ala Leu Arg Leu Cys Ala Tyr Cys Cys Asn Ile Val Asn
35 40 45
Val Ser Leu Val Lys Pro Ser Phe Tyr Val Tyr Ser Arg Val Lys Asn
50 55 60
Leu Asn Ser Ser Arg Val Pro Asp Leu Leu Val
65 70 75
<210> 556
<211> 222
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 556
Met Ala Asp Ser Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Lys Leu
1 5 10 15
Leu Glu Gln Trp Asn Leu Val Ile Gly Phe Leu Phe Leu Thr Trp Ile
20 25 30
Cys Leu Leu Gln Phe Ala Tyr Ala Asn Arg Asn Arg Phe Leu Tyr Ile
35 40 45
Ile Lys Leu Ile Phe Leu Trp Leu Leu Trp Pro Val Thr Leu Ala Cys
50 55 60
Phe Val Leu Ala Ala Val Tyr Arg Ile Asn Trp Ile Thr Gly Gly Ile
65 70 75 80
Ala Ile Ala Met Ala Cys Leu Val Gly Leu Met Trp Leu Ser Tyr Phe
85 90 95
Ile Ala Ser Phe Arg Leu Phe Ala Arg Thr Arg Ser Met Trp Ser Phe
100 105 110
Asn Pro Glu Thr Asn Ile Leu Leu Asn Val Pro Leu His Gly Thr Ile
115 120 125
Leu Thr Arg Pro Leu Leu Glu Ser Glu Leu Val Ile Gly Ala Val Ile
130 135 140
Leu Arg Gly His Leu Arg Ile Ala Gly His His Leu Gly Arg Cys Asp
145 150 155 160
Ile Lys Asp Leu Pro Lys Glu Ile Thr Val Ala Thr Ser Arg Thr Leu
165 170 175
Ser Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Ala Gly Asp Ser Gly
180 185 190
Phe Ala Ala Tyr Ser Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr
195 200 205
Asp His Ser Ser Ser Ser Asp Asn Ile Ala Leu Leu Val Gln
210 215 220
<210> 557
<211> 61
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 557
Met Phe His Leu Val Asp Phe Gln Val Thr Ile Ala Glu Ile Leu Leu
1 5 10 15
Ile Ile Met Arg Thr Phe Lys Val Ser Ile Trp Asn Leu Asp Tyr Ile
20 25 30
Ile Asn Leu Ile Ile Lys Asn Leu Ser Lys Ser Leu Thr Glu Asn Lys
35 40 45
Tyr Ser Gln Leu Asp Glu Glu Gln Pro Met Glu Ile Asp
50 55 60
<210> 558
<211> 121
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 558
Met Lys Ile Ile Leu Phe Leu Ala Leu Ile Thr Leu Ala Thr Cys Glu
1 5 10 15
Leu Tyr His Tyr Gln Glu Cys Val Arg Gly Thr Thr Val Leu Leu Lys
20 25 30
Glu Pro Cys Ser Ser Gly Thr Tyr Glu Gly Asn Ser Pro Phe His Pro
35 40 45
Leu Ala Asp Asn Lys Phe Ala Leu Thr Cys Phe Ser Thr Gln Phe Ala
50 55 60
Phe Ala Cys Pro Asp Gly Val Lys His Val Tyr Gln Leu Arg Ala Arg
65 70 75 80
Ser Val Ser Pro Lys Leu Phe Ile Arg Gln Glu Glu Val Gln Glu Leu
85 90 95
Tyr Ser Pro Ile Phe Leu Ile Val Ala Ala Ile Val Phe Ile Thr Leu
100 105 110
Cys Phe Thr Leu Lys Arg Lys Thr Glu
115 120
<210> 559
<211> 43
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 559
Met Ile Glu Leu Ser Leu Ile Asp Phe Tyr Leu Cys Phe Leu Ala Phe
1 5 10 15
Leu Leu Phe Leu Val Leu Ile Met Leu Ile Ile Phe Trp Phe Ser Leu
20 25 30
Glu Leu Gln Asp His Asn Glu Thr Cys His Ala
35 40
<210> 560
<211> 121
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 560
Met Lys Phe Leu Val Phe Leu Gly Ile Ile Thr Thr Val Ala Ala Phe
1 5 10 15
His Gln Glu Cys Ser Leu Gln Ser Cys Thr Gln His Gln Pro Tyr Val
20 25 30
Val Asp Asp Pro Cys Pro Ile His Phe Tyr Ser Lys Trp Tyr Ile Arg
35 40 45
Val Gly Ala Arg Lys Ser Ala Pro Leu Ile Glu Leu Cys Val Asp Glu
50 55 60
Ala Gly Ser Lys Ser Pro Ile Gln Tyr Ile Asp Ile Gly Asn Tyr Thr
65 70 75 80
Val Ser Cys Leu Pro Phe Thr Ile Asn Cys Gln Glu Pro Lys Leu Gly
85 90 95
Ser Leu Val Val Arg Cys Ser Phe Tyr Glu Asp Phe Leu Glu Tyr His
100 105 110
Asp Val Arg Val Val Leu Asp Phe Ile
115 120
<210> 561
<211> 419
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 561
Met Ser Asp Asn Gly Pro Gln Asn Gln Arg Asn Ala Pro Arg Ile Thr
1 5 10 15
Phe Gly Gly Pro Ser Asp Ser Thr Gly Ser Asn Gln Asn Gly Glu Arg
20 25 30
Ser Gly Ala Arg Ser Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn Asn
35 40 45
Thr Ala Ser Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Asp Leu
50 55 60
Lys Phe Pro Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Ser Pro
65 70 75 80
Asp Asp Gln Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Ile Arg Gly
85 90 95
Gly Asp Gly Lys Met Lys Asp Leu Ser Pro Arg Trp Tyr Phe Tyr Tyr
100 105 110
Leu Gly Thr Gly Pro Glu Ala Gly Leu Pro Tyr Gly Ala Asn Lys Asp
115 120 125
Gly Ile Ile Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys Asp
130 135 140
His Ile Gly Thr Arg Asn Pro Ala Asn Asn Ala Ala Ile Val Leu Gln
145 150 155 160
Leu Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly Ser
165 170 175
Arg Gly Gly Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg Asn
180 185 190
Ser Ser Arg Asn Ser Thr Pro Gly Ser Ser Arg Gly Thr Ser Pro Ala
195 200 205
Arg Met Ala Gly Asn Gly Gly Asp Ala Ala Leu Ala Leu Leu Leu Leu
210 215 220
Asp Arg Leu Asn Gln Leu Glu Ser Lys Met Ser Gly Lys Gly Gln Gln
225 230 235 240
Gln Gln Gly Gln Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser Lys
245 250 255
Lys Pro Arg Gln Lys Arg Thr Ala Thr Lys Ala Tyr Asn Val Thr Gln
260 265 270
Ala Phe Gly Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly Asp
275 280 285
Gln Glu Leu Ile Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln Ile
290 295 300
Ala Gln Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg Ile
305 310 315 320
Gly Met Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr Thr Gly Ala
325 330 335
Ile Lys Leu Asp Asp Lys Asp Pro Asn Phe Lys Asp Gln Val Ile Leu
340 345 350
Leu Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu Pro
355 360 365
Lys Lys Asp Lys Lys Lys Lys Ala Asp Glu Thr Gln Ala Leu Pro Gln
370 375 380
Arg Gln Lys Lys Gln Gln Thr Val Thr Leu Leu Pro Ala Ala Asp Leu
385 390 395 400
Asp Asp Phe Ser Lys Gln Leu Gln Gln Ser Met Ser Ser Ala Asp Ser
405 410 415
Thr Gln Ala
<210> 562
<211> 38
<212> PRT
<213> Severe acute respiratory syndrome coronavirus 2
<400> 562
Met Gly Tyr Ile Asn Val Phe Ala Phe Pro Phe Thr Ile Tyr Ser Leu
1 5 10 15
Leu Leu Cys Arg Met Asn Ser Arg Asn Tyr Ile Ala Gln Val Asp Val
20 25 30
Val Asn Phe Asn Leu Thr
35
<210> 563
<400> 563
000
<210> 564
<400> 564
000
<210> 565
<400> 565
000
<210> 566
<400> 566
000
<210> 567
<400> 567
000
<210> 568
<400> 568
000
<210> 569
<400> 569
000
<210> 570
<400> 570
000
<210> 571
<400> 571
000
<210> 572
<400> 572
000
<210> 573
<400> 573
000
<210> 574
<400> 574
000
<210> 575
<400> 575
000
<210> 576
<400> 576
000
<210> 577
<400> 577
000
<210> 578
<400> 578
000
<210> 579
<400> 579
000
<210> 580
<400> 580
000
<210> 581
<400> 581
000
<210> 582
<400> 582
000
<210> 583
<400> 583
000
<210> 584
<400> 584
000
<210> 585
<400> 585
000
<210> 586
<400> 586
000
<210> 587
<400> 587
000
<210> 588
<400> 588
000
<210> 589
<400> 589
000
<210> 590
<400> 590
000
<210> 591
<400> 591
000
<210> 592
<400> 592
000
<210> 593
<400> 593
000
<210> 594
<400> 594
000
<210> 595
<400> 595
000
<210> 596
<400> 596
000
<210> 597
<400> 597
000
<210> 598
<400> 598
000
<210> 599
<400> 599
000
<210> 600
<400> 600
000
<210> 601
<211> 4308
<212> DNA
<213> Human immunodeficiency virus 1
<400> 601
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acaaataatc cacctatccc agtaggagaa 780
atttataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccggttc 900
tataaaactc taagagccga gcaagcttca caggaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagcg 1020
gctacactag aagaaatgat gacagcatgt cagggagtag gaggacccgg ccataaggca 1080
agagttttgg ctgaagcaat gagccaagta acaaattcag ctaccataat gatgcagaga 1140
ggcaatttta ggaaccaaag aaagattgtt aagtgtttca attgtggcaa agaagggcac 1200
acagccagaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt taagggaaga tctggccttc 1320
ctacaaggga aggccaggga attttcttca gagcagacca gagccaacag ccccaccaga 1380
agagagcttc aggtctgggg tagagacaac aactccccct cagaagcagg agccgataga 1440
caaggaactg tatcctttaa cttccctcag gtcactcttt ggcaacgacc cctcgtcaca 1500
ataaagatag gggggcaact aaaggaagct ctattagata caggagcaga tgatacagta 1560
ttagaagaaa tgagtttgcc aggaagatgg aaaccaaaaa tgataggggg aattggaggt 1620
tttatcaaag taagacagta tgatcagata ctcatagaaa tctgtggaca taaagctata 1680
ggtacagtat tagtaggacc tacacctgtc aacataattg gaagaaatct gttgactcag 1740
attggttgca ctttaaattt tcccattagc cctattgaga ctgtaccagt aaaattaaag 1800
ccaggaatgg atggcccaaa agttaaacaa tggccattga cagaagaaaa aataaaagca 1860
ttagtagaaa tttgtacaga gatggaaaag gaagggaaaa tttcaaaaat tgggcctgaa 1920
aatccataca atactccagt atttgccata aagaaaaaag acagtactaa atggagaaaa 1980
ttagtagatt tcagagaact taataagaga actcaagact tctgggaagt tcaattagga 2040
ataccacatc ccgcagggtt aaaaaagaaa aaatcagtaa cagtactgga tgtgggtgat 2100
gcatattttt cagttccctt agatgaagac ttcaggaagt atactgcatt taccatacct 2160
agtataaaca atgagacacc agggattaga tatcagtaca atgtgcttcc acagggatgg 2220
aaaggatcac cagcaatatt ccaaagtagc atgacaaaaa tcttagagcc ttttagaaaa 2280
caaaatccag acatagttat ctatcaatac atggatgatt tgtatgtagg atctgactta 2340
gaaatagggc agcatagaac aaaaatagag gagctgagac aacatctgtt gaggtgggga 2400
cttaccacac cagacaaaaa acatcagaaa gaacctccat tcctttggat gggttatgaa 2460
ctccatcctg ataaatggac agtacagcct atagtgctgc cagaaaaaga cagctggact 2520
gtcaatgaca tacagaagtt agtggggaaa ttgaattggg caagtcagat ttacccaggg 2580
attaaagtaa ggcaattatg taaactcctt agaggaacca aagcactaac agaagtaata 2640
ccactaacag aagaagcaga gctagaactg gcagaaaaca gagagattct aaaagaacca 2700
gtacatggag tgtattatga cccatcaaaa gacttaatag cagaaataca gaagcagggg 2760
caaggccaat ggacatatca aatttatcaa gagccattta aaaatctgaa aacaggaaaa 2820
tatgcaagaa tgaggggtgc ccacactaat gatgtaaaac aattaacaga ggcagtgcaa 2880
aaaataacca cagaaagcat agtaatatgg ggaaagactc ctaaatttaa actgcccata 2940
caaaaggaaa catgggaaac atggtggaca gagtattggc aagccacctg gattcctgag 3000
tgggagtttg ttaatacccc tcccttagtg aaattatggt accagttaga gaaagaaccc 3060
atagtaggag cagaaacctt ctatgtagat ggggcagcta acagggagac taaattagga 3120
aaagcaggat atgttactaa tagaggaaga caaaaagttg tcaccctaac tgacacaaca 3180
aatcagaaga ctgagttaca agcaatttat ctagctttgc aggattcggg attagaagta 3240
aacatagtaa cagactcaca atatgcatta ggaatcattc aagcacaacc agatcaaagt 3300
gaatcagagt tagtcaatca aataatagag cagttaataa aaaaggaaaa ggtctatctg 3360
gcatgggtac cagcacacaa aggaattgga ggaaatgaac aagtagataa attagtcagt 3420
gctggaatca ggaaagtact atttttagat ggaatagata aggcccaaga tgaacatgag 3480
aaatatcaca gtaattggag agcaatggct agtgatttta acctgccacc tgtagtagca 3540
aaagaaatag tagccagctg tgataaatgt cagctaaaag gagaagccat gcatggacaa 3600
gtagactgta gtccaggaat atggcaacta gattgtacac atttagaagg aaaagttatc 3660
ctggtagcag ttcatgtagc cagtggatat atagaagcag aagttattcc agcagaaaca 3720
gggcaggaaa cagcatattt tcttttaaaa ttagcaggaa gatggccagt aaaaacaata 3780
catactgaca atggcagcaa tttcaccggt gctacggtta gggccgcctg ttggtgggcg 3840
ggaatcaagc aggaatttgg aattccctac aatccccaaa gtcaaggagt agtagaatct 3900
atgaataaag aattaaagaa aattatagga caggtaagag atcaggctga acatcttaag 3960
acagcagtac aaatggcagt attcatccac aattttaaaa gaaaaggggg gattgggggg 4020
tacagtgcag gggaaagaat agtagacata atagcaacag acatacaaac taaagaatta 4080
caaaaacaaa ttacaaaaat tcaaaatttt cgggtttatt acagggacag cagaaatcca 4140
ctttggaaag gaccagcaaa gctcctctgg aaaggtgaag gggcagtagt aatacaagat 4200
aatagtgaca taaaagtagt gccaagaaga aaagcaaaga tcattaggga ttatggaaaa 4260
cagatggcag gtgatgattg tgtggcaagt agacaggatg aggattag 4308
<210> 602
<211> 1503
<212> DNA
<213> Human immunodeficiency virus 1
<400> 602
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acaaataatc cacctatccc agtaggagaa 780
atttataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccggttc 900
tataaaactc taagagccga gcaagcttca caggaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagcg 1020
gctacactag aagaaatgat gacagcatgt cagggagtag gaggacccgg ccataaggca 1080
agagttttgg ctgaagcaat gagccaagta acaaattcag ctaccataat gatgcagaga 1140
ggcaatttta ggaaccaaag aaagattgtt aagtgtttca attgtggcaa agaagggcac 1200
acagccagaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
tacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtctggggt agagacaaca actccccctc agaagcagga gccgatagac 1440
aaggaactgt atcctttaac ttccctcagg tcactctttg gcaacgaccc ctcgtcacaa 1500
taa 1503
<210> 603
<211> 579
<212> DNA
<213> Human immunodeficiency virus 1
<400> 603
atggaaaaca gatggcaggt gatgattgtg tggcaagtag acaggatgag gattagaaca 60
tggaaaagtt tagtaaaaca ccatatgtat gtttcaggga aagctagggg atggttttat 120
agacatcact atgaaagccc tcatccaaga ataagttcag aagtacacat cccactaggg 180
gatgctagat tggtaataac aacatattgg ggtctgcata caggagaaag agactggcat 240
ttgggtcagg gagtctccat agaatggagg aaaaagagat atagcacaca agtagaccct 300
gaactagcag accaactaat tcatctgtat tactttgact gtttttcaga ctctgctata 360
agaaaggcct tattaggaca catagttagc cctaggtgtg aatatcaagc aggacataac 420
aaggtaggat ctctacaata cttggcacta gcagcattaa taacaccaaa aaagataaag 480
ccacctttgc ctagtgttac gaaactgaca gaggatagat ggaacaagcc ccagaagacc 540
aagggccaca gagggagcca cacaatgaat ggacactag 579
<210> 604
<211> 291
<212> DNA
<213> Human immunodeficiency virus 1
<400> 604
atggaacaag ccccagaaga ccaagggcca cagagggagc cacacaatga atggacacta 60
gagcttttag aggagcttaa gaatgaagct gttagacatt ttcctaggat ttggctccat 120
ggcttagggc aacatatcta tgaaacttat ggggatactt gggcaggagt ggaagccata 180
ataagaattc tgcaacaact gctgtttatc catttcagaa ttgggtgtcg acatagcaga 240
ataggcgtta ctcgacagag gagagcaaga aatggagcca gtagatccta g 291
<210> 605
<211> 261
<212> DNA
<213> Human immunodeficiency virus 1
<400> 605
atggagccag tagatcctag actagagccc tggaagcatc caggaagtca gcctaaaact 60
gcttgtacca attgctattg taaaaagtgt tgctttcatt gccaagtttg tttcataaca 120
aaagccttag gcatctccta tggcaggaag aagcggagac agcgacgaag agctcatcag 180
aacagtcaga ctcatcaagc ttctctatca aagcaaccca cctcccaacc ccgaggggac 240
ccgacaggcc cgaaggaata g 261
<210> 606
<211> 351
<212> DNA
<213> Human immunodeficiency virus 1
<400> 606
atggcaggaa gaagcggaga cagcgacgaa gagctcatca gaacagtcag actcatcaag 60
cttctctatc aaagcaaccc acctcccaac cccgagggga cccgacaggc ccgaaggaat 120
agaagaagaa ggtggagaga gagacagaga cagatccatt cgattagtga acggatcctt 180
ggcacttatc tgggacgatc tgcggagcct gtgcctcttc agctaccacc gcttgagaga 240
cttactcttg attgtaacga ggattgtgga acttctggga cgcagggggt gggaagccct 300
caaatattgg tggaatctcc tacagtattg gagtcaggaa ctaaagaata g 351
<210> 607
<211> 249
<212> DNA
<213> Human immunodeficiency virus 1
<400> 607
atgcaaccta taccaatagt agcaatagta gcattagtag tagcaataat aatagcaata 60
gttgtgtggt ccatagtaat catagaatat aggaaaatat taagacaaag aaaaatagac 120
aggttaattg atagactaat agaaagagca gaagacagtg gcaatgagag tgaaggagaa 180
atatcagcac ttgtggagat gggggtggag atggggcacc atgctccttg ggatgttgat 240
gatctgtag 249
<210> 608
<211> 2571
<212> DNA
<213> Human immunodeficiency virus 1
<400> 608
atgagagtga aggagaaata tcagcacttg tggagatggg ggtggagatg gggcaccatg 60
ctccttggga tgttgatgat ctgtagtgct acagaaaaat tgtgggtcac agtctattat 120
ggggtacctg tgtggaagga agcaaccacc actctatttt gtgcatcaga tgctaaagca 180
tatgatacag aggtacataa tgtttgggcc acacatgcct gtgtacccac agaccccaac 240
ccacaagaag tagtattggt aaatgtgaca gaaaatttta acatgtggaa aaatgacatg 300
gtagaacaga tgcatgagga tataatcagt ttatgggatc aaagcctaaa gccatgtgta 360
aaattaaccc cactctgtgt tagtttaaag tgcactgatt tgaagaatga tactaatacc 420
aatagtagta gcgggagaat gataatggag aaaggagaga taaaaaactg ctctttcaat 480
atcagcacaa gcataagagg taaggtgcag aaagaatatg cattttttta taaacttgat 540
ataataccaa tagataatga tactaccagc tataagttga caagttgtaa cacctcagtc 600
attacacagg cctgtccaaa ggtatccttt gagccaattc ccatacatta ttgtgccccg 660
gctggttttg cgattctaaa atgtaataat aagacgttca atggaacagg accatgtaca 720
aatgtcagca cagtacaatg tacacatgga attaggccag tagtatcaac tcaactgctg 780
ttaaatggca gtctagcaga agaagaggta gtaattagat ctgtcaattt cacggacaat 840
gctaaaacca taatagtaca gctgaacaca tctgtagaaa ttaattgtac aagacccaac 900
aacaatacaa gaaaaagaat ccgtatccag agaggaccag ggagagcatt tgttacaata 960
ggaaaaatag gaaatatgag acaagcacat tgtaacatta gtagagcaaa atggaataac 1020
actttaaaac agatagctag caaattaaga gaacaatttg gaaataataa aacaataatc 1080
tttaagcaat cctcaggagg ggacccagaa attgtaacgc acagttttaa ttgtggaggg 1140
gaatttttct actgtaattc aacacaactg tttaatagta cttggtttaa tagtacttgg 1200
agtactgaag ggtcaaataa cactgaagga agtgacacaa tcaccctccc atgcagaata 1260
aaacaaatta taaacatgtg gcagaaagta ggaaaagcaa tgtatgcccc tcccatcagt 1320
ggacaaatta gatgttcatc aaatattaca gggctgctat taacaagaga tggtggtaat 1380
agcaacaatg agtccgagat cttcagacct ggaggaggag atatgaggga caattggaga 1440
agtgaattat ataaatataa agtagtaaaa attgaaccat taggagtagc acccaccaag 1500
gcaaagagaa gagtggtgca gagagaaaaa agagcagtgg gaataggagc tttgttcctt 1560
gggttcttgg gagcagcagg aagcactatg ggcgcagcct caatgacgct gacggtacag 1620
gccagacaat tattgtctgg tatagtgcag cagcagaaca atttgctgag ggctattgag 1680
gcgcaacagc atctgttgca actcacagtc tggggcatca agcagctcca ggcaagaatc 1740
ctggctgtgg aaagatacct aaaggatcaa cagctcctgg ggatttgggg ttgctctgga 1800
aaactcattt gcaccactgc tgtgccttgg aatgctagtt ggagtaataa atctctggaa 1860
cagatttgga atcacacgac ctggatggag tgggacagag aaattaacaa ttacacaagc 1920
ttaatacact ccttaattga agaatcgcaa aaccagcaag aaaagaatga acaagaatta 1980
ttggaattag ataaatgggc aagtttgtgg aattggttta acataacaaa ttggctgtgg 2040
tatataaaat tattcataat gatagtagga ggcttggtag gtttaagaat agtttttgct 2100
gtactttcta tagtgaatag agttaggcag ggatattcac cattatcgtt tcagacccac 2160
ctcccaaccc cgaggggacc cgacaggccc gaaggaatag aagaagaagg tggagagaga 2220
gacagagaca gatccattcg attagtgaac ggatccttgg cacttatctg ggacgatctg 2280
cggagcctgt gcctcttcag ctaccaccgc ttgagagact tactcttgat tgtaacgagg 2340
attgtggaac ttctgggacg cagggggtgg gaagccctca aatattggtg gaatctccta 2400
cagtattgga gtcaggaact aaagaatagt gctgttagct tgctcaatgc cacagccata 2460
gcagtagctg aggggacaga tagggttata gaagtagtac aaggagcttg tagagctatt 2520
cgccacatac ctagaagaat aagacagggc ttggaaagga ttttgctata a 2571
<210> 609
<211> 570
<212> DNA
<213> Human immunodeficiency virus 1
<400> 609
atgccccaga ctgtgagttg caacagatgc tgttgcgcct caatagccct cagcaaattg 60
ttctgctgct gcactatacc agacaataat tgtctggcct gtaccgtcag cgtcattgag 120
gctgcgccca tagtgcttcc tgctgctccc aagaacccaa ggaacaaagc tcctattccc 180
actgctcttt tttctctctg caccactctt ctctttgcct tggtgggtgc tactcctaat 240
ggttcaattt ttactacttt atatttatat aattcacttc tccaattgtc cctcatatct 300
cctcctccag gtctgaagat ctcggactca ttgttgctat taccaccatc tcttgttaat 360
agcagccctg taatatttga tgaacatcta atttgtccac tgatgggagg ggcatacatt 420
gcttttccta ctttctgcca catgtttata atttgtttta ttctgcatgg gagggtgatt 480
gtgtcacttc cttcagtgtt atttgaccct tcagtactcc aagtactatt aaaccaagta 540
ctattaaaca gttgtgttga attacagtag 570
<210> 610
<211> 621
<212> DNA
<213> Human immunodeficiency virus 1
<400> 610
atgggtggca agtggtcaaa aagtagtgtg attggatggc ctactgtaag ggaaagaatg 60
agacgagctg agccagcagc agatagggtg ggagcagcat ctcgagacct ggaaaaacat 120
ggagcaatca caagtagcaa tacagcagct accaatgctg cttgtgcctg gctagaagca 180
caagaggagg aggaggtggg ttttccagtc acacctcagg tacctttaag accaatgact 240
tacaaggcag ctgtagatct tagccacttt ttaaaagaaa aggggggact ggaagggcta 300
attcactccc aaagaagaca agatatcctt gatctgtgga tctaccacac acaaggctac 360
ttccctgatt agcagaacta cacaccaggg ccaggggtca gatatccact gacctttgga 420
tggtgctaca agctagtacc agttgagcca gataagatag aagaggccaa taaaggagag 480
aacaccagct tgttacaccc tgtgagcctg catgggatgg atgacccgga gagagaagtg 540
ttagagtgga ggtttgacag ccgcctagca tttcatcacg tggcccgaga gctgcatccg 600
gagtacttca agaactgctg a 621
<210> 611
<400> 611
000
<210> 612
<400> 612
000
<210> 613
<400> 613
000
<210> 614
<400> 614
000
<210> 615
<400> 615
000
<210> 616
<400> 616
000
<210> 617
<400> 617
000
<210> 618
<400> 618
000
<210> 619
<400> 619
000
<210> 620
<400> 620
000
<210> 621
<400> 621
000
<210> 622
<400> 622
000
<210> 623
<400> 623
000
<210> 624
<400> 624
000
<210> 625
<400> 625
000
<210> 626
<400> 626
000
<210> 627
<400> 627
000
<210> 628
<400> 628
000
<210> 629
<400> 629
000
<210> 630
<400> 630
000
<210> 631
<400> 631
000
<210> 632
<400> 632
000
<210> 633
<400> 633
000
<210> 634
<400> 634
000
<210> 635
<400> 635
000
<210> 636
<400> 636
000
<210> 637
<400> 637
000
<210> 638
<400> 638
000
<210> 639
<400> 639
000
<210> 640
<400> 640
000
<210> 641
<400> 641
000
<210> 642
<400> 642
000
<210> 643
<400> 643
000
<210> 644
<400> 644
000
<210> 645
<400> 645
000
<210> 646
<400> 646
000
<210> 647
<400> 647
000
<210> 648
<400> 648
000
<210> 649
<400> 649
000
<210> 650
<400> 650
000
<210> 651
<211> 1435
<212> PRT
<213> Human immunodeficiency virus 1
<400> 651
Met Gly Ala Arg Ala Ser Val Leu Ser Gly Gly Glu Leu Asp Arg Trp
1 5 10 15
Glu Lys Ile Arg Leu Arg Pro Gly Gly Lys Lys Lys Tyr Lys Leu Lys
20 25 30
His Ile Val Trp Ala Ser Arg Glu Leu Glu Arg Phe Ala Val Asn Pro
35 40 45
Gly Leu Leu Glu Thr Ser Glu Gly Cys Arg Gln Ile Leu Gly Gln Leu
50 55 60
Gln Pro Ser Leu Gln Thr Gly Ser Glu Glu Leu Arg Ser Leu Tyr Asn
65 70 75 80
Thr Val Ala Thr Leu Tyr Cys Val His Gln Arg Ile Glu Ile Lys Asp
85 90 95
Thr Lys Glu Ala Leu Asp Lys Ile Glu Glu Glu Gln Asn Lys Ser Lys
100 105 110
Lys Lys Ala Gln Gln Ala Ala Ala Asp Thr Gly His Ser Asn Gln Val
115 120 125
Ser Gln Asn Tyr Pro Ile Val Gln Asn Ile Gln Gly Gln Met Val His
130 135 140
Gln Ala Ile Ser Pro Arg Thr Leu Asn Ala Trp Val Lys Val Val Glu
145 150 155 160
Glu Lys Ala Phe Ser Pro Glu Val Ile Pro Met Phe Ser Ala Leu Ser
165 170 175
Glu Gly Ala Thr Pro Gln Asp Leu Asn Thr Met Leu Asn Thr Val Gly
180 185 190
Gly His Gln Ala Ala Met Gln Met Leu Lys Glu Thr Ile Asn Glu Glu
195 200 205
Ala Ala Glu Trp Asp Arg Val His Pro Val His Ala Gly Pro Ile Ala
210 215 220
Pro Gly Gln Met Arg Glu Pro Arg Gly Ser Asp Ile Ala Gly Thr Thr
225 230 235 240
Ser Thr Leu Gln Glu Gln Ile Gly Trp Met Thr Asn Asn Pro Pro Ile
245 250 255
Pro Val Gly Glu Ile Tyr Lys Arg Trp Ile Ile Leu Gly Leu Asn Lys
260 265 270
Ile Val Arg Met Tyr Ser Pro Thr Ser Ile Leu Asp Ile Arg Gln Gly
275 280 285
Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe Tyr Lys Thr Leu
290 295 300
Arg Ala Glu Gln Ala Ser Gln Glu Val Lys Asn Trp Met Thr Glu Thr
305 310 315 320
Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys Thr Ile Leu Lys Ala
325 330 335
Leu Gly Pro Ala Ala Thr Leu Glu Glu Met Met Thr Ala Cys Gln Gly
340 345 350
Val Gly Gly Pro Gly His Lys Ala Arg Val Leu Ala Glu Ala Met Ser
355 360 365
Gln Val Thr Asn Ser Ala Thr Ile Met Met Gln Arg Gly Asn Phe Arg
370 375 380
Asn Gln Arg Lys Ile Val Lys Cys Phe Asn Cys Gly Lys Glu Gly His
385 390 395 400
Thr Ala Arg Asn Cys Arg Ala Pro Arg Lys Lys Gly Cys Trp Lys Cys
405 410 415
Gly Lys Glu Gly His Gln Met Lys Asp Cys Thr Glu Arg Gln Ala Asn
420 425 430
Phe Leu Arg Glu Asp Leu Ala Phe Leu Gln Gly Lys Ala Arg Glu Phe
435 440 445
Ser Ser Glu Gln Thr Arg Ala Asn Ser Pro Thr Arg Arg Glu Leu Gln
450 455 460
Val Trp Gly Arg Asp Asn Asn Ser Pro Ser Glu Ala Gly Ala Asp Arg
465 470 475 480
Gln Gly Thr Val Ser Phe Asn Phe Pro Gln Val Thr Leu Trp Gln Arg
485 490 495
Pro Leu Val Thr Ile Lys Ile Gly Gly Gln Leu Lys Glu Ala Leu Leu
500 505 510
Asp Thr Gly Ala Asp Asp Thr Val Leu Glu Glu Met Ser Leu Pro Gly
515 520 525
Arg Trp Lys Pro Lys Met Ile Gly Gly Ile Gly Gly Phe Ile Lys Val
530 535 540
Arg Gln Tyr Asp Gln Ile Leu Ile Glu Ile Cys Gly His Lys Ala Ile
545 550 555 560
Gly Thr Val Leu Val Gly Pro Thr Pro Val Asn Ile Ile Gly Arg Asn
565 570 575
Leu Leu Thr Gln Ile Gly Cys Thr Leu Asn Phe Pro Ile Ser Pro Ile
580 585 590
Glu Thr Val Pro Val Lys Leu Lys Pro Gly Met Asp Gly Pro Lys Val
595 600 605
Lys Gln Trp Pro Leu Thr Glu Glu Lys Ile Lys Ala Leu Val Glu Ile
610 615 620
Cys Thr Glu Met Glu Lys Glu Gly Lys Ile Ser Lys Ile Gly Pro Glu
625 630 635 640
Asn Pro Tyr Asn Thr Pro Val Phe Ala Ile Lys Lys Lys Asp Ser Thr
645 650 655
Lys Trp Arg Lys Leu Val Asp Phe Arg Glu Leu Asn Lys Arg Thr Gln
660 665 670
Asp Phe Trp Glu Val Gln Leu Gly Ile Pro His Pro Ala Gly Leu Lys
675 680 685
Lys Lys Lys Ser Val Thr Val Leu Asp Val Gly Asp Ala Tyr Phe Ser
690 695 700
Val Pro Leu Asp Glu Asp Phe Arg Lys Tyr Thr Ala Phe Thr Ile Pro
705 710 715 720
Ser Ile Asn Asn Glu Thr Pro Gly Ile Arg Tyr Gln Tyr Asn Val Leu
725 730 735
Pro Gln Gly Trp Lys Gly Ser Pro Ala Ile Phe Gln Ser Ser Met Thr
740 745 750
Lys Ile Leu Glu Pro Phe Arg Lys Gln Asn Pro Asp Ile Val Ile Tyr
755 760 765
Gln Tyr Met Asp Asp Leu Tyr Val Gly Ser Asp Leu Glu Ile Gly Gln
770 775 780
His Arg Thr Lys Ile Glu Glu Leu Arg Gln His Leu Leu Arg Trp Gly
785 790 795 800
Leu Thr Thr Pro Asp Lys Lys His Gln Lys Glu Pro Pro Phe Leu Trp
805 810 815
Met Gly Tyr Glu Leu His Pro Asp Lys Trp Thr Val Gln Pro Ile Val
820 825 830
Leu Pro Glu Lys Asp Ser Trp Thr Val Asn Asp Ile Gln Lys Leu Val
835 840 845
Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr Pro Gly Ile Lys Val Arg
850 855 860
Gln Leu Cys Lys Leu Leu Arg Gly Thr Lys Ala Leu Thr Glu Val Ile
865 870 875 880
Pro Leu Thr Glu Glu Ala Glu Leu Glu Leu Ala Glu Asn Arg Glu Ile
885 890 895
Leu Lys Glu Pro Val His Gly Val Tyr Tyr Asp Pro Ser Lys Asp Leu
900 905 910
Ile Ala Glu Ile Gln Lys Gln Gly Gln Gly Gln Trp Thr Tyr Gln Ile
915 920 925
Tyr Gln Glu Pro Phe Lys Asn Leu Lys Thr Gly Lys Tyr Ala Arg Met
930 935 940
Arg Gly Ala His Thr Asn Asp Val Lys Gln Leu Thr Glu Ala Val Gln
945 950 955 960
Lys Ile Thr Thr Glu Ser Ile Val Ile Trp Gly Lys Thr Pro Lys Phe
965 970 975
Lys Leu Pro Ile Gln Lys Glu Thr Trp Glu Thr Trp Trp Thr Glu Tyr
980 985 990
Trp Gln Ala Thr Trp Ile Pro Glu Trp Glu Phe Val Asn Thr Pro Pro
995 1000 1005
Leu Val Lys Leu Trp Tyr Gln Leu Glu Lys Glu Pro Ile Val Gly
1010 1015 1020
Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala Asn Arg Glu Thr Lys
1025 1030 1035
Leu Gly Lys Ala Gly Tyr Val Thr Asn Arg Gly Arg Gln Lys Val
1040 1045 1050
Val Thr Leu Thr Asp Thr Thr Asn Gln Lys Thr Glu Leu Gln Ala
1055 1060 1065
Ile Tyr Leu Ala Leu Gln Asp Ser Gly Leu Glu Val Asn Ile Val
1070 1075 1080
Thr Asp Ser Gln Tyr Ala Leu Gly Ile Ile Gln Ala Gln Pro Asp
1085 1090 1095
Gln Ser Glu Ser Glu Leu Val Asn Gln Ile Ile Glu Gln Leu Ile
1100 1105 1110
Lys Lys Glu Lys Val Tyr Leu Ala Trp Val Pro Ala His Lys Gly
1115 1120 1125
Ile Gly Gly Asn Glu Gln Val Asp Lys Leu Val Ser Ala Gly Ile
1130 1135 1140
Arg Lys Val Leu Phe Leu Asp Gly Ile Asp Lys Ala Gln Asp Glu
1145 1150 1155
His Glu Lys Tyr His Ser Asn Trp Arg Ala Met Ala Ser Asp Phe
1160 1165 1170
Asn Leu Pro Pro Val Val Ala Lys Glu Ile Val Ala Ser Cys Asp
1175 1180 1185
Lys Cys Gln Leu Lys Gly Glu Ala Met His Gly Gln Val Asp Cys
1190 1195 1200
Ser Pro Gly Ile Trp Gln Leu Asp Cys Thr His Leu Glu Gly Lys
1205 1210 1215
Val Ile Leu Val Ala Val His Val Ala Ser Gly Tyr Ile Glu Ala
1220 1225 1230
Glu Val Ile Pro Ala Glu Thr Gly Gln Glu Thr Ala Tyr Phe Leu
1235 1240 1245
Leu Lys Leu Ala Gly Arg Trp Pro Val Lys Thr Ile His Thr Asp
1250 1255 1260
Asn Gly Ser Asn Phe Thr Gly Ala Thr Val Arg Ala Ala Cys Trp
1265 1270 1275
Trp Ala Gly Ile Lys Gln Glu Phe Gly Ile Pro Tyr Asn Pro Gln
1280 1285 1290
Ser Gln Gly Val Val Glu Ser Met Asn Lys Glu Leu Lys Lys Ile
1295 1300 1305
Ile Gly Gln Val Arg Asp Gln Ala Glu His Leu Lys Thr Ala Val
1310 1315 1320
Gln Met Ala Val Phe Ile His Asn Phe Lys Arg Lys Gly Gly Ile
1325 1330 1335
Gly Gly Tyr Ser Ala Gly Glu Arg Ile Val Asp Ile Ile Ala Thr
1340 1345 1350
Asp Ile Gln Thr Lys Glu Leu Gln Lys Gln Ile Thr Lys Ile Gln
1355 1360 1365
Asn Phe Arg Val Tyr Tyr Arg Asp Ser Arg Asn Pro Leu Trp Lys
1370 1375 1380
Gly Pro Ala Lys Leu Leu Trp Lys Gly Glu Gly Ala Val Val Ile
1385 1390 1395
Gln Asp Asn Ser Asp Ile Lys Val Val Pro Arg Arg Lys Ala Lys
1400 1405 1410
Ile Ile Arg Asp Tyr Gly Lys Gln Met Ala Gly Asp Asp Cys Val
1415 1420 1425
Ala Ser Arg Gln Asp Glu Asp
1430 1435
<210> 652
<211> 500
<212> PRT
<213> Human immunodeficiency virus 1
<400> 652
Met Gly Ala Arg Ala Ser Val Leu Ser Gly Gly Glu Leu Asp Arg Trp
1 5 10 15
Glu Lys Ile Arg Leu Arg Pro Gly Gly Lys Lys Lys Tyr Lys Leu Lys
20 25 30
His Ile Val Trp Ala Ser Arg Glu Leu Glu Arg Phe Ala Val Asn Pro
35 40 45
Gly Leu Leu Glu Thr Ser Glu Gly Cys Arg Gln Ile Leu Gly Gln Leu
50 55 60
Gln Pro Ser Leu Gln Thr Gly Ser Glu Glu Leu Arg Ser Leu Tyr Asn
65 70 75 80
Thr Val Ala Thr Leu Tyr Cys Val His Gln Arg Ile Glu Ile Lys Asp
85 90 95
Thr Lys Glu Ala Leu Asp Lys Ile Glu Glu Glu Gln Asn Lys Ser Lys
100 105 110
Lys Lys Ala Gln Gln Ala Ala Ala Asp Thr Gly His Ser Asn Gln Val
115 120 125
Ser Gln Asn Tyr Pro Ile Val Gln Asn Ile Gln Gly Gln Met Val His
130 135 140
Gln Ala Ile Ser Pro Arg Thr Leu Asn Ala Trp Val Lys Val Val Glu
145 150 155 160
Glu Lys Ala Phe Ser Pro Glu Val Ile Pro Met Phe Ser Ala Leu Ser
165 170 175
Glu Gly Ala Thr Pro Gln Asp Leu Asn Thr Met Leu Asn Thr Val Gly
180 185 190
Gly His Gln Ala Ala Met Gln Met Leu Lys Glu Thr Ile Asn Glu Glu
195 200 205
Ala Ala Glu Trp Asp Arg Val His Pro Val His Ala Gly Pro Ile Ala
210 215 220
Pro Gly Gln Met Arg Glu Pro Arg Gly Ser Asp Ile Ala Gly Thr Thr
225 230 235 240
Ser Thr Leu Gln Glu Gln Ile Gly Trp Met Thr Asn Asn Pro Pro Ile
245 250 255
Pro Val Gly Glu Ile Tyr Lys Arg Trp Ile Ile Leu Gly Leu Asn Lys
260 265 270
Ile Val Arg Met Tyr Ser Pro Thr Ser Ile Leu Asp Ile Arg Gln Gly
275 280 285
Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe Tyr Lys Thr Leu
290 295 300
Arg Ala Glu Gln Ala Ser Gln Glu Val Lys Asn Trp Met Thr Glu Thr
305 310 315 320
Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys Thr Ile Leu Lys Ala
325 330 335
Leu Gly Pro Ala Ala Thr Leu Glu Glu Met Met Thr Ala Cys Gln Gly
340 345 350
Val Gly Gly Pro Gly His Lys Ala Arg Val Leu Ala Glu Ala Met Ser
355 360 365
Gln Val Thr Asn Ser Ala Thr Ile Met Met Gln Arg Gly Asn Phe Arg
370 375 380
Asn Gln Arg Lys Ile Val Lys Cys Phe Asn Cys Gly Lys Glu Gly His
385 390 395 400
Thr Ala Arg Asn Cys Arg Ala Pro Arg Lys Lys Gly Cys Trp Lys Cys
405 410 415
Gly Lys Glu Gly His Gln Met Lys Asp Cys Thr Glu Arg Gln Ala Asn
420 425 430
Phe Leu Gly Lys Ile Trp Pro Ser Tyr Lys Gly Arg Pro Gly Asn Phe
435 440 445
Leu Gln Ser Arg Pro Glu Pro Thr Ala Pro Pro Glu Glu Ser Phe Arg
450 455 460
Ser Gly Val Glu Thr Thr Thr Pro Pro Gln Lys Gln Glu Pro Ile Asp
465 470 475 480
Lys Glu Leu Tyr Pro Leu Thr Ser Leu Arg Ser Leu Phe Gly Asn Asp
485 490 495
Pro Ser Ser Gln
500
<210> 653
<211> 192
<212> PRT
<213> Human immunodeficiency virus 1
<400> 653
Met Glu Asn Arg Trp Gln Val Met Ile Val Trp Gln Val Asp Arg Met
1 5 10 15
Arg Ile Arg Thr Trp Lys Ser Leu Val Lys His His Met Tyr Val Ser
20 25 30
Gly Lys Ala Arg Gly Trp Phe Tyr Arg His His Tyr Glu Ser Pro His
35 40 45
Pro Arg Ile Ser Ser Glu Val His Ile Pro Leu Gly Asp Ala Arg Leu
50 55 60
Val Ile Thr Thr Tyr Trp Gly Leu His Thr Gly Glu Arg Asp Trp His
65 70 75 80
Leu Gly Gln Gly Val Ser Ile Glu Trp Arg Lys Lys Arg Tyr Ser Thr
85 90 95
Gln Val Asp Pro Glu Leu Ala Asp Gln Leu Ile His Leu Tyr Tyr Phe
100 105 110
Asp Cys Phe Ser Asp Ser Ala Ile Arg Lys Ala Leu Leu Gly His Ile
115 120 125
Val Ser Pro Arg Cys Glu Tyr Gln Ala Gly His Asn Lys Val Gly Ser
130 135 140
Leu Gln Tyr Leu Ala Leu Ala Ala Leu Ile Thr Pro Lys Lys Ile Lys
145 150 155 160
Pro Pro Leu Pro Ser Val Thr Lys Leu Thr Glu Asp Arg Trp Asn Lys
165 170 175
Pro Gln Lys Thr Lys Gly His Arg Gly Ser His Thr Met Asn Gly His
180 185 190
<210> 654
<211> 96
<212> PRT
<213> Human immunodeficiency virus 1
<400> 654
Met Glu Gln Ala Pro Glu Asp Gln Gly Pro Gln Arg Glu Pro His Asn
1 5 10 15
Glu Trp Thr Leu Glu Leu Leu Glu Glu Leu Lys Asn Glu Ala Val Arg
20 25 30
His Phe Pro Arg Ile Trp Leu His Gly Leu Gly Gln His Ile Tyr Glu
35 40 45
Thr Tyr Gly Asp Thr Trp Ala Gly Val Glu Ala Ile Ile Arg Ile Leu
50 55 60
Gln Gln Leu Leu Phe Ile His Phe Arg Ile Gly Cys Arg His Ser Arg
65 70 75 80
Ile Gly Val Thr Arg Gln Arg Arg Ala Arg Asn Gly Ala Ser Arg Ser
85 90 95
<210> 655
<211> 86
<212> PRT
<213> Human immunodeficiency virus 1
<400> 655
Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser
1 5 10 15
Gln Pro Lys Thr Ala Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Phe
20 25 30
His Cys Gln Val Cys Phe Ile Thr Lys Ala Leu Gly Ile Ser Tyr Gly
35 40 45
Arg Lys Lys Arg Arg Gln Arg Arg Arg Ala His Gln Asn Ser Gln Thr
50 55 60
His Gln Ala Ser Leu Ser Lys Gln Pro Thr Ser Gln Pro Arg Gly Asp
65 70 75 80
Pro Thr Gly Pro Lys Glu
85
<210> 656
<211> 116
<212> PRT
<213> Human immunodeficiency virus 1
<400> 656
Met Ala Gly Arg Ser Gly Asp Ser Asp Glu Glu Leu Ile Arg Thr Val
1 5 10 15
Arg Leu Ile Lys Leu Leu Tyr Gln Ser Asn Pro Pro Pro Asn Pro Glu
20 25 30
Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Glu Arg
35 40 45
Gln Arg Gln Ile His Ser Ile Ser Glu Arg Ile Leu Gly Thr Tyr Leu
50 55 60
Gly Arg Ser Ala Glu Pro Val Pro Leu Gln Leu Pro Pro Leu Glu Arg
65 70 75 80
Leu Thr Leu Asp Cys Asn Glu Asp Cys Gly Thr Ser Gly Thr Gln Gly
85 90 95
Val Gly Ser Pro Gln Ile Leu Val Glu Ser Pro Thr Val Leu Glu Ser
100 105 110
Gly Thr Lys Glu
115
<210> 657
<211> 82
<212> PRT
<213> Human immunodeficiency virus 1
<400> 657
Met Gln Pro Ile Pro Ile Val Ala Ile Val Ala Leu Val Val Ala Ile
1 5 10 15
Ile Ile Ala Ile Val Val Trp Ser Ile Val Ile Ile Glu Tyr Arg Lys
20 25 30
Ile Leu Arg Gln Arg Lys Ile Asp Arg Leu Ile Asp Arg Leu Ile Glu
35 40 45
Arg Ala Glu Asp Ser Gly Asn Glu Ser Glu Gly Glu Ile Ser Ala Leu
50 55 60
Val Glu Met Gly Val Glu Met Gly His His Ala Pro Trp Asp Val Asp
65 70 75 80
Asp Leu
<210> 658
<211> 856
<212> PRT
<213> Human immunodeficiency virus 1
<400> 658
Met Arg Val Lys Glu Lys Tyr Gln His Leu Trp Arg Trp Gly Trp Arg
1 5 10 15
Trp Gly Thr Met Leu Leu Gly Met Leu Met Ile Cys Ser Ala Thr Glu
20 25 30
Lys Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala
35 40 45
Thr Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Asp Thr Glu
50 55 60
Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn
65 70 75 80
Pro Gln Glu Val Val Leu Val Asn Val Thr Glu Asn Phe Asn Met Trp
85 90 95
Lys Asn Asp Met Val Glu Gln Met His Glu Asp Ile Ile Ser Leu Trp
100 105 110
Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Ser
115 120 125
Leu Lys Cys Thr Asp Leu Lys Asn Asp Thr Asn Thr Asn Ser Ser Ser
130 135 140
Gly Arg Met Ile Met Glu Lys Gly Glu Ile Lys Asn Cys Ser Phe Asn
145 150 155 160
Ile Ser Thr Ser Ile Arg Gly Lys Val Gln Lys Glu Tyr Ala Phe Phe
165 170 175
Tyr Lys Leu Asp Ile Ile Pro Ile Asp Asn Asp Thr Thr Ser Tyr Lys
180 185 190
Leu Thr Ser Cys Asn Thr Ser Val Ile Thr Gln Ala Cys Pro Lys Val
195 200 205
Ser Phe Glu Pro Ile Pro Ile His Tyr Cys Ala Pro Ala Gly Phe Ala
210 215 220
Ile Leu Lys Cys Asn Asn Lys Thr Phe Asn Gly Thr Gly Pro Cys Thr
225 230 235 240
Asn Val Ser Thr Val Gln Cys Thr His Gly Ile Arg Pro Val Val Ser
245 250 255
Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu Glu Val Val Ile
260 265 270
Arg Ser Val Asn Phe Thr Asp Asn Ala Lys Thr Ile Ile Val Gln Leu
275 280 285
Asn Thr Ser Val Glu Ile Asn Cys Thr Arg Pro Asn Asn Asn Thr Arg
290 295 300
Lys Arg Ile Arg Ile Gln Arg Gly Pro Gly Arg Ala Phe Val Thr Ile
305 310 315 320
Gly Lys Ile Gly Asn Met Arg Gln Ala His Cys Asn Ile Ser Arg Ala
325 330 335
Lys Trp Asn Asn Thr Leu Lys Gln Ile Ala Ser Lys Leu Arg Glu Gln
340 345 350
Phe Gly Asn Asn Lys Thr Ile Ile Phe Lys Gln Ser Ser Gly Gly Asp
355 360 365
Pro Glu Ile Val Thr His Ser Phe Asn Cys Gly Gly Glu Phe Phe Tyr
370 375 380
Cys Asn Ser Thr Gln Leu Phe Asn Ser Thr Trp Phe Asn Ser Thr Trp
385 390 395 400
Ser Thr Glu Gly Ser Asn Asn Thr Glu Gly Ser Asp Thr Ile Thr Leu
405 410 415
Pro Cys Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Lys Val Gly Lys
420 425 430
Ala Met Tyr Ala Pro Pro Ile Ser Gly Gln Ile Arg Cys Ser Ser Asn
435 440 445
Ile Thr Gly Leu Leu Leu Thr Arg Asp Gly Gly Asn Ser Asn Asn Glu
450 455 460
Ser Glu Ile Phe Arg Pro Gly Gly Gly Asp Met Arg Asp Asn Trp Arg
465 470 475 480
Ser Glu Leu Tyr Lys Tyr Lys Val Val Lys Ile Glu Pro Leu Gly Val
485 490 495
Ala Pro Thr Lys Ala Lys Arg Arg Val Val Gln Arg Glu Lys Arg Ala
500 505 510
Val Gly Ile Gly Ala Leu Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser
515 520 525
Thr Met Gly Ala Ala Ser Met Thr Leu Thr Val Gln Ala Arg Gln Leu
530 535 540
Leu Ser Gly Ile Val Gln Gln Gln Asn Asn Leu Leu Arg Ala Ile Glu
545 550 555 560
Ala Gln Gln His Leu Leu Gln Leu Thr Val Trp Gly Ile Lys Gln Leu
565 570 575
Gln Ala Arg Ile Leu Ala Val Glu Arg Tyr Leu Lys Asp Gln Gln Leu
580 585 590
Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Thr Thr Ala Val
595 600 605
Pro Trp Asn Ala Ser Trp Ser Asn Lys Ser Leu Glu Gln Ile Trp Asn
610 615 620
His Thr Thr Trp Met Glu Trp Asp Arg Glu Ile Asn Asn Tyr Thr Ser
625 630 635 640
Leu Ile His Ser Leu Ile Glu Glu Ser Gln Asn Gln Gln Glu Lys Asn
645 650 655
Glu Gln Glu Leu Leu Glu Leu Asp Lys Trp Ala Ser Leu Trp Asn Trp
660 665 670
Phe Asn Ile Thr Asn Trp Leu Trp Tyr Ile Lys Leu Phe Ile Met Ile
675 680 685
Val Gly Gly Leu Val Gly Leu Arg Ile Val Phe Ala Val Leu Ser Ile
690 695 700
Val Asn Arg Val Arg Gln Gly Tyr Ser Pro Leu Ser Phe Gln Thr His
705 710 715 720
Leu Pro Thr Pro Arg Gly Pro Asp Arg Pro Glu Gly Ile Glu Glu Glu
725 730 735
Gly Gly Glu Arg Asp Arg Asp Arg Ser Ile Arg Leu Val Asn Gly Ser
740 745 750
Leu Ala Leu Ile Trp Asp Asp Leu Arg Ser Leu Cys Leu Phe Ser Tyr
755 760 765
His Arg Leu Arg Asp Leu Leu Leu Ile Val Thr Arg Ile Val Glu Leu
770 775 780
Leu Gly Arg Arg Gly Trp Glu Ala Leu Lys Tyr Trp Trp Asn Leu Leu
785 790 795 800
Gln Tyr Trp Ser Gln Glu Leu Lys Asn Ser Ala Val Ser Leu Leu Asn
805 810 815
Ala Thr Ala Ile Ala Val Ala Glu Gly Thr Asp Arg Val Ile Glu Val
820 825 830
Val Gln Gly Ala Cys Arg Ala Ile Arg His Ile Pro Arg Arg Ile Arg
835 840 845
Gln Gly Leu Glu Arg Ile Leu Leu
850 855
<210> 659
<211> 189
<212> PRT
<213> Human immunodeficiency virus 1
<400> 659
Met Pro Gln Thr Val Ser Cys Asn Arg Cys Cys Cys Ala Ser Ile Ala
1 5 10 15
Leu Ser Lys Leu Phe Cys Cys Cys Thr Ile Pro Asp Asn Asn Cys Leu
20 25 30
Ala Cys Thr Val Ser Val Ile Glu Ala Ala Pro Ile Val Leu Pro Ala
35 40 45
Ala Pro Lys Asn Pro Arg Asn Lys Ala Pro Ile Pro Thr Ala Leu Phe
50 55 60
Ser Leu Cys Thr Thr Leu Leu Phe Ala Leu Val Gly Ala Thr Pro Asn
65 70 75 80
Gly Ser Ile Phe Thr Thr Leu Tyr Leu Tyr Asn Ser Leu Leu Gln Leu
85 90 95
Ser Leu Ile Ser Pro Pro Pro Gly Leu Lys Ile Ser Asp Ser Leu Leu
100 105 110
Leu Leu Pro Pro Ser Leu Val Asn Ser Ser Pro Val Ile Phe Asp Glu
115 120 125
His Leu Ile Cys Pro Leu Met Gly Gly Ala Tyr Ile Ala Phe Pro Thr
130 135 140
Phe Cys His Met Phe Ile Ile Cys Phe Ile Leu His Gly Arg Val Ile
145 150 155 160
Val Ser Leu Pro Ser Val Leu Phe Asp Pro Ser Val Leu Gln Val Leu
165 170 175
Leu Asn Gln Val Leu Leu Asn Ser Cys Val Glu Leu Gln
180 185
<210> 660
<211> 206
<212> PRT
<213> Human immunodeficiency virus 1
<400> 660
Met Gly Gly Lys Trp Ser Lys Ser Ser Val Ile Gly Trp Pro Thr Val
1 5 10 15
Arg Glu Arg Met Arg Arg Ala Glu Pro Ala Ala Asp Arg Val Gly Ala
20 25 30
Ala Ser Arg Asp Leu Glu Lys His Gly Ala Ile Thr Ser Ser Asn Thr
35 40 45
Ala Ala Thr Asn Ala Ala Cys Ala Trp Leu Glu Ala Gln Glu Glu Glu
50 55 60
Glu Val Gly Phe Pro Val Thr Pro Gln Val Pro Leu Arg Pro Met Thr
65 70 75 80
Tyr Lys Ala Ala Val Asp Leu Ser His Phe Leu Lys Glu Lys Gly Gly
85 90 95
Leu Glu Gly Leu Ile His Ser Gln Arg Arg Gln Asp Ile Leu Asp Leu
100 105 110
Trp Ile Tyr His Thr Gln Gly Tyr Phe Pro Asp Trp Gln Asn Tyr Thr
115 120 125
Pro Gly Pro Gly Val Arg Tyr Pro Leu Thr Phe Gly Trp Cys Tyr Lys
130 135 140
Leu Val Pro Val Glu Pro Asp Lys Ile Glu Glu Ala Asn Lys Gly Glu
145 150 155 160
Asn Thr Ser Leu Leu His Pro Val Ser Leu His Gly Met Asp Asp Pro
165 170 175
Glu Arg Glu Val Leu Glu Trp Arg Phe Asp Ser Arg Leu Ala Phe His
180 185 190
His Val Ala Arg Glu Leu His Pro Glu Tyr Phe Lys Asn Cys
195 200 205
<210> 661
<400> 661
000
<210> 662
<400> 662
000
<210> 663
<400> 663
000
<210> 664
<400> 664
000
<210> 665
<400> 665
000
<210> 666
<400> 666
000
<210> 667
<400> 667
000
<210> 668
<400> 668
000
<210> 669
<400> 669
000
<210> 670
<400> 670
000
<210> 671
<400> 671
000
<210> 672
<400> 672
000
<210> 673
<400> 673
000
<210> 674
<400> 674
000
<210> 675
<400> 675
000
<210> 676
<400> 676
000
<210> 677
<400> 677
000
<210> 678
<400> 678
000
<210> 679
<400> 679
000
<210> 680
<400> 680
000
<210> 681
<400> 681
000
<210> 682
<400> 682
000
<210> 683
<400> 683
000
<210> 684
<400> 684
000
<210> 685
<400> 685
000
<210> 686
<400> 686
000
<210> 687
<400> 687
000
<210> 688
<400> 688
000
<210> 689
<400> 689
000
<210> 690
<400> 690
000
<210> 691
<400> 691
000
<210> 692
<400> 692
000
<210> 693
<400> 693
000
<210> 694
<400> 694
000
<210> 695
<400> 695
000
<210> 696
<400> 696
000
<210> 697
<400> 697
000
<210> 698
<400> 698
000
<210> 699
<400> 699
000
<210> 700
<400> 700
000
<210> 701
<211> 420
<212> DNA
<213> Respiratory syncytial virus
<400> 701
atgggcagca attcattgag tatgataaaa gttagattgc aaaatttatt tgacaatgat 60
gaagtagcat tgttaaaaat aacctgctat actgacaaat tgatacattt aactaatgct 120
ttggctaagg cagtgataca tacaatcaaa ttgaatggca ttgtatttgt gcatgttatt 180
acaagtagtg atatttgccc taataataat attgtagtga aatccaactt cacaacaatg 240
ccagtgttac aaaatggagg ttatatatgg gaaatgatgg aattaacaca ctgctctcaa 300
cccaatggcc taatagatga caattgtgaa atcaaattct ccaaaaaact aagcgattca 360
acaatgacca actatatgaa tcaattatct gaattacttg gatttgatct caatccataa 420
<210> 702
<211> 375
<212> DNA
<213> Respiratory syncytial virus
<400> 702
atggacacaa cacacaatgg tactacacca caaagactga tgatcacaga catgagacca 60
ttgtcacttg agactataat aacatcacta accagagaca tcataacaca cagatttata 120
tacttgataa atcatgaatg tatagtgaga aaacttgatg aaagacaggc cacatttaca 180
ttcctggtca actatgaaat gaaactattg cacaaagtgg gaagcactaa gtacaaaaaa 240
tatactgaat acaacacaaa atatggcact tttcctatgc caatatttat caatcatgat 300
gggttcttag aatgcattgg cattaagcct acaaagcaca ctcccataat atacaagtat 360
gatctcaatc catga 375
<210> 703
<211> 1176
<212> DNA
<213> Respiratory syncytial virus
<400> 703
atggctctta gcaaagtcaa gttgaacgat acactcaaca aagatcaact tctgtcatcc 60
agcaaataca ccatccaacg gagcacagga gatagtattg atactcctaa ttatgatgtg 120
cagaaacaca tcaacaagtt atgtggcatg ttattaatca cagaagatgc taatcataaa 180
ttcactgggg taataggtat gttatatgct atgtctagat taggaagaga agacaccata 240
aaaatactca gagatgcggg atatcatgta aaagcaaatg gagtggatgt aacaacacat 300
cgtcaagaca ttaatggaaa agaaatgaaa tttgaagtgt taacattggc aagcttaaca 360
actgaaattc aaatcaacat tgagatagaa tctaggaaat cctacaaaaa aatgctaaaa 420
gaaatgggag aggtggctcc agaatacagg catgactctc ctgattgtgg aatgataata 480
ttatgtatag cagcattagt aataaccaaa ttagcagcag gggatagatc tggtcttact 540
gctgtgatta ggagagctaa taatgttcta aaaaatgaaa tgaaacgtta taaaggctta 600
ctaccaaagg atatagccaa cagcttctat gaagtgtttg aaaaatatcc tcactttata 660
gatgtttttg ttcattttgg tatagcacaa tcttctacca gaggtggcag tagagttgaa 720
gggatttttg caggattgtt tatgaatgcc tatggtgcag ggcaagtgat gttacggtgg 780
ggagtcttag caaaatcagt taaaaatatt atgctaggac atgctagtgt gcaagcagaa 840
atggaacaag ttgtggaagt ttatgaatat gcccaaaaat tgggtggaga agcaggattc 900
taccatatat tgaacaatcc aaaagcatca ttattatctt tgactcaatt tccccacttc 960
tccagtgtag tattgggcaa tgctgctggc ctaggcataa tgggagaata cagaggtaca 1020
ccaaggaatc aagatctata tgatgctgca aaggcatatg ctgaacaact caaagaaaat 1080
ggtgtgatta actacagtgt attagacttg acagcagaag aactagaggc tatcaaacat 1140
cagcttaatc caaaagataa tgatgtagag ctttga 1176
<210> 704
<211> 726
<212> DNA
<213> Respiratory syncytial virus
<400> 704
atggaaaagt ttgctcctga attccatgga gaagacgcaa acaacagagc cactaaattc 60
ctagaatcaa taaagggcaa attcacatca cctaaagatc ccaagaaaaa agatagtatc 120
atatctgtca actcaataga tatagaagta accaaagaaa gccctataac ttcaaattca 180
accattataa accctacaaa tgagacagat gatactgcag ggaacaagcc caattatcaa 240
agaaaaccac tagtgagttt caaagaagac cctacgccaa gtgataatcc cttttcaaaa 300
ctatacaaag aaaccataga aacatttgat aacaatgaag aagaatctag ctattcatat 360
gaagaaataa atgatcagac aaacgataat ataacagcaa gattagatag gattgatgaa 420
aaattaagtg aaatactagg aatgcttcac acactagtag tagcaagtgc aggacctaca 480
tctgctcggg atggtataag agatgccatg gttggtttaa gagaagaaat gatagaaaaa 540
atcagaactg aagcattgat gaccaatgat agattagaag ctatggcaag actcaggaat 600
gaggaaagtg aaaagatggc aaaagacaca tcagatgaag tgtctctcaa tccaacatca 660
gagaaattga acaacctgtt ggaaggaaat gatagtgata atgatctatc acttgaagat 720
ttctga 726
<210> 705
<211> 771
<212> DNA
<213> Respiratory syncytial virus
<400> 705
atggaaacat acgtgaacaa acttcacgaa ggctccacat acacagctgc tgttcaatac 60
aatgtcctag aaaaagacga tgaccctgca tcacttacaa tatgggtgcc catgttccaa 120
tcatccatgc cagcagattt acttataaaa gaactagcta atgtcaacat actagtgaaa 180
caaatatcca cacccaaagg accttcatta agagtcatga taaactcaag aagtgcagtg 240
ctagcacaaa tgcccagcaa attcactata tgtgccaatg tgtccttgga tgaaagaagc 300
aagctggcat atgatgtaac cacaccctgc gaaatcaagg catgtagtct aacatgccta 360
aaatcaaaaa atatgttaac tacagttaaa gatctcacta tgaaaacact caacccaaca 420
catgacatca ttgctttatg tgaatttgaa aatatagtaa catcaaaaaa agtcataata 480
ccaacatact taagatccat cagtgtcaga aataaagatc tgaacacact tgaaaatata 540
acaaccaccg aattcaaaaa tgccatcaca aatgcaaaaa tcatccctta ctcaggatta 600
ctgttagtca tcacagtgac tgacaacaaa ggagcattta aatacataaa gccacaaagt 660
caattcatag tagatcttgg agcttaccta gaaaaagaaa gtatatatta tgttacaaca 720
aattggaagc acacagctac acgatttgca atcaaaccca tggaagatta a 771
<210> 706
<211> 195
<212> DNA
<213> Respiratory syncytial virus
<400> 706
atggaaaata catccataac aatagaattc tcaagcaaat tctggcctta ctttacacta 60
atacatatga tcacaacaat aatctctttg ctaatcataa tctccatcat gattgcaata 120
ctaaacaaac tctgtgaata taacgtattc cataacaaaa cctttgagct accaagagct 180
cgagtcaata catag 195
<210> 707
<211> 897
<212> DNA
<213> Respiratory syncytial virus
<400> 707
atgtccaaaa ccaaggacca acgcaccgcc aagacactag aaaagacctg ggacactctc 60
aatcatctat tattcatatc atcgtgctta tacaagttaa atcttaaatc tatagcacaa 120
atcacattat ccattctggc aatgataatc tcaacttcac ttataattgt agctatcata 180
ttcatagcct cagcaaacaa caaagtcaca ctaacaactg caatcataca agatgcaaca 240
agccagatca agaacacaac cccaacatac ctgacccaga atccccagct tggaatcagc 300
ttcttcaatc tgtctggaac tatatcacaa accaccgcca tactagcttt aacaacacca 360
agtgtcgagt caatcctgca atctacaaca gtcaagacca aaaacacaac aacaacccaa 420
atacaaccca gcaagcccac cacaaaacaa cgccaaaaca aaccaccaaa caaacccaat 480
gatgattttc actttgaagt gttcaacttt gtaccctgca gcatatgcag caacaatcca 540
acttgctggg ccatctgcaa aagaatacca agcaaaaaac ctggaaagaa aaccaccacc 600
aagcccacga aaaaaccaac catcaagaca accaaaaaag atctcaaacc tcaaaccaca 660
aaaccaaagg aagcacccac caccaagccc acagataagc caaccatcaa catcaccaaa 720
ccaaacatca gaactacact gctcaccaac agtaccacag gaaatccaga acacacaagt 780
caagaggaaa ccctccattc aacctcctcc gaaggcaaca caagcccttc acaaatctat 840
acaacatccg agtacctatc acaacctcca tctccatcca acataacaga ccagtag 897
<210> 708
<211> 1725
<212> DNA
<213> Respiratory syncytial virus
<400> 708
atggagttgc caatcctcaa aacaaatgca attaccacaa tccttgctgc agtcacactc 60
tgtttcgctt ccagtcaaaa catcactgaa gaattttatc aatcaacatg cagtgcagtt 120
agcaaaggct atcttagtgc tttaagaact ggttggtata ctagtgttat aactatagaa 180
ttaagtaata tcaaggaaaa taagtgtaat ggaacagatg ctaaggtaaa attgataaaa 240
caagaattag ataaatataa aaatgctgta acagaattgc agttgctcat gcaaagcaca 300
ccagcagcca acaatcgagc cagaagagaa ctaccaaggt ttatgaatta tacactcaac 360
aataccaaaa ataacaatgt aacattaagc aagaaaagga aaagaagatt tcttggcttt 420
ttgttaggtg ttggatctgc aatcgccagt ggcattgctg tatctaaagt cctgcaccta 480
gaaggggaag tgaacaaaat caaaaatgct ctactatcca caaacaaggc tgtagtcagc 540
ttatcaaatg gagttagtgt cttaaccagc aaagtgttag acctcaaaaa ctatatagat 600
aaacagttgt tacccattgt gaacaagcaa agctgcagca tatcaaacat tgaaactgtg 660
atagaattcc aacaaaagaa caacagacta ctagagatta ccagggaatt tagtgttaat 720
gcaggtgtaa ctacacctgt aagcacttat atgttaacaa atagtgaatt attatcatta 780
atcaatgata tgcctataac aaatgatcag aaaaagttaa tgtccaacaa tgttcaaata 840
gttagacagc aaagttactc tatcatgtcc ataataaagg aggaagtctt agcatatgta 900
gttcaattac cactatatgg tgtaatagat acaccttgtt ggaaactaca cacatcccct 960
ctatgcacaa ccaacacaaa ggaagggtcc aacatctgtt taacaagaac cgacagagga 1020
tggtactgtg acaatgcagg atcagtgtct ttcttcccac aagctgaaac atgcaaagtt 1080
caatcgaatc gagtattttg tgacacaatg aacagtctaa cattaccaag tgaagtaaat 1140
ctctgcaaca ttgacatatt caaccctaaa tatgattgca aaattatgac ttcaaaaaca 1200
gatgtgagca gctccgttat cacatctcta ggagccattg tgtcatgcta tggcaaaact 1260
aaatgtacag catccaataa aaatcgtgga atcataaaga cattttctaa cgggtgtgat 1320
tatgtatcaa ataagggggt ggacactgta tctgtaggta atacattata ttatgtaaat 1380
aagcaagaag gaaaaagcct ctatgtaaaa ggtgaaccaa taataaattt ctatgaccca 1440
ttagtgttcc cttctgatga atttgatgca tcaatatctc aagtcaatga gaagattaac 1500
cagagcctag catttattcg taaatccgat gaattattac ataatgtaaa tgttggtaaa 1560
tccaccacaa atatcatgat aactactata attatagtga ttatagtaat attgttatta 1620
ttaattgcag ttgggctgtt cctatactgc aaggccagaa gcacaccagt cacactaagc 1680
aaggatcaac tgagtggtat aaataatatt gcatttagta actga 1725
<210> 709
<211> 585
<212> DNA
<213> Respiratory syncytial virus
<400> 709
atgtcacgaa ggaatccttg caaatttgaa attcgaggtc attgcttgaa tggtaagagg 60
tgtcatttta gtcataatta ttttgaatgg ccaccccatg cactgcttgt aagacaaaac 120
tttatgttaa acagaatact taagtctatg gataaaagca tagatacttt atcagaaata 180
agtggagctg cagagttgga cagaactgaa gagtatgccc tcggtgtagt tggagtgcta 240
gagagttata taggatcaat aaataatata actaaacaat cagcatgtgt tgccatgagc 300
aaactcctca ctgaactcaa cagtgatgac atcaaaaaac taagagataa tgaagagcca 360
aattcaccta agataagagt gtacaatact gtcatatcat atattgaaag caacaggaaa 420
aacaataaac aaactatcca tctgttaaaa agattgccag cagacgtatt gaagaaaacc 480
atcaaaaaca cattggatat ccacaagagc ataaccatca acaacccaaa agaatcaact 540
gttaatgata caaatgacca tgccaaaaat aatgatacta cctga 585
<210> 710
<211> 267
<212> DNA
<213> Respiratory syncytial virus
<400> 710
atgccaaaaa taatgatact acctgacaaa tatccttgta gtataaattc catactaata 60
acaagtagtt gtagagttac tatgtataat caaaagaaca cactatattt caatcaaaac 120
aaccaaaata accatacata ctcaccaaat caaccattca atgaaatcca ttggacctct 180
caagacttga ttgatgcaat tcaaaatttt ctacaacatc taggtattac tgatgatata 240
tatacaatat atatattagt gtcataa 267
<210> 711
<211> 6498
<212> DNA
<213> Respiratory syncytial virus
<400> 711
atggatccca ttattaatgg aaattctgct aatgtttatc taaccgatag ttatttaaaa 60
ggtgttattt ctttctcaga atgtaatgct ttaggaagtt acatattcaa tggtccttat 120
ctcaaaaatg attacaccaa cttaattagt agacaaaatc cattaataga acacataaat 180
ctaaagaaat taaatataac acagtcttta atatctaagt atcataaagg tgaaataaaa 240
atagaagaac ctacttattt tcagtcatta cttatgacat acaagagtat gacctcgtca 300
gaacagatta ctaccactaa tttacttaaa aagataataa gaagagcaat agaaattagt 360
gatgtcaaag tctatgctat attgaataaa ctggggctta aagaaaaaga caagattaaa 420
tccaacaatg gacaagatga aaacaactca gttattacaa ccataatcaa agatgatata 480
cttttagctg ttaaggataa tcaatctcat cttaaagcag gcaaaaatca ctctacaaaa 540
caaaaagata ctatcaaaac aacactcttg aaaaaattaa tgtgttcgat gcaacatcct 600
ccatcatggt taatacattg gtttaattta tacacaaaat taaacaacat attaacacag 660
tatcgatcaa atgaggtaaa aaaccatggt tttatattga tagataatca aactctcaat 720
ggattccaat ttattttgaa tcaatatggt tgtatagttt atcataagga actcaaaaga 780
attactgtga caacctataa tcaattcttg acatggaaag atattagcct tagtagatta 840
aatgtttgtt taattacatg gattagtaac tgtttgaaca cattaaacaa aagcttaggc 900
ttaagatgcg gattcaataa tgttatcttg acacaactat tcctttatgg agattgtata 960
ttaaaactat ttcacaatga agggttctac ataataaaag aggtagaggg ttttattatg 1020
tctctaattt taaacataac agaagaagat caattcagaa aacggtttta taatagtatg 1080
ctcaacaaca tcacagatgc tgctaataaa gctcagaaaa atctgttatc aagagtatgt 1140
catacattat tagataagac agtgtccgat aatataataa atggcagatg gataattcta 1200
ttaagtaagt ttcttaaatt aattaagctt gcaggtgaca acaaccttaa caatctgagt 1260
gaattatatt ttttattcag aatatttgga cacccaatgg tagatgaaag acaagccatg 1320
gatgctgtta aagttaattg caacgagacc aaattttact tgttaagcag tttgagtatg 1380
ttaagaggtg cctttatata tagaattata aaagggtttg taaataatta caacagatgg 1440
cctactttaa ggaatgctat tgttttaccc ttaagatggt taacttacta taaactaaac 1500
acttatcctt ccttattgga acttacagaa agagatttga ttgttttatc aggactacgt 1560
ttctatcgtg agtttcggtt gcctaaaaaa gtggatcttg aaatgatcat aaatgataag 1620
gctatatcac ctcctaaaaa tttgatatgg actagtttcc ctagaaatta tatgccgtca 1680
cacatacaaa attatataga acatgaaaaa ttaaaatttt ccgagagtga taaatcaaga 1740
agagtattag agtactattt aagagataac aaattcaatg aatgtgattt atataactgt 1800
gtagttaatc aaagctatct taacaaccct aatcatgtgg tatcattgac tggcaaagaa 1860
agagaactca gtgtaggtag aatgtttgca atgcaaccag gaatgttcag gcaagttcaa 1920
atattagcag agaaaatgat agctgaaaac attttacaat tctttcctga aagtcttaca 1980
agatatggtg atctagaatt acagaaaata ttagaattga aagcgggaat aagtaacaaa 2040
tcaaatcgtt acaatgacaa ttacaacaat tacatcagta agtgctctat catcacagat 2100
ctcagcaaat tcaatcaagc attccggtat gaaacatcat gtatttgtag tgatgtatta 2160
gatgaactgc atggtgtaca atctctattt tcctggttac atttaactat tcctcatgtc 2220
acaataatat gcacatatag gcatgcaccc ccctatataa gagatcacat tgtagatctt 2280
aacaatgtag atgaacaaag tggattatat agatatcata tgggtggtat cgaagggtgg 2340
tgtcaaaaac tatggaccat agaagctata tcactattgg atctaatatc tctcaagggg 2400
aaattctcaa ttactgcctt aattaatggt gacaatcaat caatagatat aagcaaacca 2460
gtcagactca tggaaggtca aactcatgct caagcagatt atttgctagc attaaatagt 2520
cttaaattgc tgtataaaga gtatgcaggc ataggccaca aattaaaagg aactgagact 2580
tatatatcaa gagatatgca atttatgagt aaaacaattc aacataacgg tgtatattac 2640
ccagctagta taaagaaagt cctaagagtg ggaccatgga taaacactat acttgatgat 2700
ttcaaagtga gtctagaatc tataggtagt ttgacacaag aattagaata tagaggtgaa 2760
agtctattat gcagtttaat atttagaaat gtgtggttat ataatcaaat tgctttacaa 2820
ctaaaaaatc atgcattatg taacaataaa ttatatttgg acatattaaa ggttctgaaa 2880
cacttaaaaa ccttttttaa tcttgataat attgatacag cattaacatt gtatatgaat 2940
ttgcccatgc tatttggtgg tggtgatccc aacttgttat atcgaagttt ctatagaaga 3000
actcctgatt tcctcacaga ggctatagtt cactctgtgt tcatacttag ttattataca 3060
aaccatgatt taaaggataa acttcaagat ctgtcagacg atagattgaa taagttctta 3120
acatgcataa tcacgtttga caaaaaccct aatgctgaat tcgtaacatt gatgagagat 3180
cctcaagctt tagggtctga gaggcaagct aaaattacta gcgaaatcaa tagactggca 3240
gttactgagg ttttgagcac agctccaaac aaaatattct ccaaaagtgc acaacactat 3300
accactacag agatagatct aaatgatatt atgcaaaata tagaacctac atatcctcat 3360
gggctaagag ttgtttatga aagtttaccc ttttataaag cagagaaaat agtaaatctt 3420
atatccggta caaaatctat aactaacata ctggaaaaga cttctgccat agacttaaca 3480
gatattgata gagccactga gatgatgagg aaaaacataa ctttgcttat aaggatattt 3540
ccattagatt gtaacagaga taaaagagaa atattgagta tggaaaacct aagtattact 3600
gaattaagca aatatgttag agaaagatct tggtctttat ccaatatagt tggtgttaca 3660
tcacccagta tcatgtatac aatggacatc aaatatacaa caagcactat agctagtggc 3720
ataatcatag agaaatataa tgtcaacagt ttaacacgtg gtgagagagg acccactaaa 3780
ccatgggttg gttcatctac acaagagaaa aaaacaatgc cagtttacaa tagacaagtt 3840
ttaaccaaaa aacagagaga tcaaattgat ctattagcaa aattggactg ggtgtatgca 3900
tctatagata acaaggatga attcatggaa gaactcagca taggaactct tgggttaaca 3960
tatgagaaag ccaaaaaatt atttccacaa tatttaagtg ttaactattt gcatcgcctt 4020
acagtcagta gtagaccatg tgaattccct gcatcaatac cagcttatag aactacaaat 4080
tatcactttg atactagccc tattaatcgc atattaacag aaaagtatgg tgatgaagat 4140
attgatatag tattccaaaa ctgtataagt tttggcctta gcttaatgtc agtagtagag 4200
caatttacca atgtatgtcc taacagaatt attctcatac ccaagcttaa tgagatacat 4260
ttgatgaaac ctcccatatt cacaggtgat gttgatattc acaagttaaa acaagtgatc 4320
caaaaacagc atatgttttt accagacaaa ataagtttga ctcaatatgt ggaattattt 4380
ttaagtaata aaacactcaa atctggatct catgttaatt ctaatttaat attggcacat 4440
aagatatctg actattttca taatacttac attttaagta ctaatttagc tggacattgg 4500
attctgatta tacaacttat gaaagattct aaaggtattt ttgaaaaaga ttggggagag 4560
ggatatataa ctgatcatat gttcattaat ttgaaagttt tcttcaatgc ttataagacc 4620
tatctcttgt gttttcataa aggttacggc agagcaaagc tagagtgcga tatgaatact 4680
tcagatctcc tatgtgtatt ggaattaata gacagtagtt attggaagtc tatgtctaag 4740
gtatttttag aacaaaaagt tatcaaatac attctcagcc aggatgcaag tttacataga 4800
gtaaaaggat gtcatagctt caaactatgg tttcttaaac gtcttaatgt agcagaattc 4860
acagtttgcc cttgggttgt taacatagat tatcatccaa cacatatgaa agcaatatta 4920
acttatatag atcttgttag aatgggattg ataaatatag atagaatata cattaaaaat 4980
aaacacaaat tcaatgatga attttatact tctaatctct tttacattaa ttataacttc 5040
tcagataata ctcatctatt aactaaacat ataaggattg ctaattctga attagaaaat 5100
aattacaaca aattatatca tcctacacct gaaactctag aaaatatact aaccaatccg 5160
gttaaatgtg atgacaaaaa gacactgaat gactattgta taggtaaaaa tgttgactca 5220
ataatgttac cattgttatc taataagaag cttattaaat cgtctacaat gattagaacc 5280
aattacagca aacaagattt gtataattta tttcctacgg ttgtgattga taaaattata 5340
gatcattcag gtaatacagc caaatctaac caactttaca ctactacttc tcatcaaata 5400
tctttagtac acaatagcac atcactttat tgcatgcttc cttggcatca tattaataga 5460
ttcaattttg tgtttagttc tacaggttgt aaaattagta tagagtatat tttaaaagac 5520
cttaaaatta aagatcctaa ttgtatagca ttcataggtg aaggagcagg gaatttattg 5580
ttgcgtacag tagtggaact tcatcctgat ataaaatata tttacagaag tctgaaagat 5640
tgcaatgatc atagtttacc tattgagttt ttaaggctgt acaatgggca tatcaacatt 5700
gattatggtg aaaatttgac cattcccgct acagatgcaa ccaacaacat tcattggtct 5760
tatttgcata taaagtttgc tgaacctatc agtctttttg tttgtgatgc tgaattgcct 5820
gtaacagtca actggagtaa aattataata gagtggagca agcatgtaag aaaatgcaag 5880
tactgttcct cagttaataa atgtacgtta atagtaaaat atcatgctca agatgatatc 5940
gatttcaaat tagacaacat aactatatta aaaacttatg tatgcttagg cagtaagtta 6000
aaggggtctg aagtttactt agtccttaca ataggtcctg caaatgtgtt cccagtattt 6060
aatgtagtac aaaatgctaa attgatacta tcaagaacca aaaatttcat catgcctaag 6120
aaggctgata aagagtctat tgatgcaaat attaaaagtt tgataccctt tctttgttac 6180
cctataacaa aaaaaggaat taatactgca ttatcaaaac taaagagtgt tgttagtgga 6240
gatatactat catattctat agctggacgt aatgaagttt tcagcaataa acttataaat 6300
cataagcata tgaacatctt aaagtggttc aaccatgttt taaatttcag atcaacagaa 6360
cttaactata atcatttata tatggtagaa tccacatatc cttatctaag tgaattgtta 6420
aacagcttga caactaatga acttaaaaaa ctgattaaaa tcacaggtag tttgttatac 6480
aactttcata atgaataa 6498
<210> 712
<400> 712
000
<210> 713
<400> 713
000
<210> 714
<400> 714
000
<210> 715
<400> 715
000
<210> 716
<400> 716
000
<210> 717
<400> 717
000
<210> 718
<400> 718
000
<210> 719
<400> 719
000
<210> 720
<400> 720
000
<210> 721
<400> 721
000
<210> 722
<400> 722
000
<210> 723
<400> 723
000
<210> 724
<400> 724
000
<210> 725
<400> 725
000
<210> 726
<400> 726
000
<210> 727
<400> 727
000
<210> 728
<400> 728
000
<210> 729
<400> 729
000
<210> 730
<400> 730
000
<210> 731
<400> 731
000
<210> 732
<400> 732
000
<210> 733
<400> 733
000
<210> 734
<400> 734
000
<210> 735
<400> 735
000
<210> 736
<400> 736
000
<210> 737
<400> 737
000
<210> 738
<400> 738
000
<210> 739
<400> 739
000
<210> 740
<400> 740
000
<210> 741
<400> 741
000
<210> 742
<400> 742
000
<210> 743
<400> 743
000
<210> 744
<400> 744
000
<210> 745
<400> 745
000
<210> 746
<400> 746
000
<210> 747
<400> 747
000
<210> 748
<400> 748
000
<210> 749
<400> 749
000
<210> 750
<400> 750
000
<210> 751
<211> 139
<212> PRT
<213> Respiratory syncytial virus
<400> 751
Met Gly Ser Asn Ser Leu Ser Met Ile Lys Val Arg Leu Gln Asn Leu
1 5 10 15
Phe Asp Asn Asp Glu Val Ala Leu Leu Lys Ile Thr Cys Tyr Thr Asp
20 25 30
Lys Leu Ile His Leu Thr Asn Ala Leu Ala Lys Ala Val Ile His Thr
35 40 45
Ile Lys Leu Asn Gly Ile Val Phe Val His Val Ile Thr Ser Ser Asp
50 55 60
Ile Cys Pro Asn Asn Asn Ile Val Val Lys Ser Asn Phe Thr Thr Met
65 70 75 80
Pro Val Leu Gln Asn Gly Gly Tyr Ile Trp Glu Met Met Glu Leu Thr
85 90 95
His Cys Ser Gln Pro Asn Gly Leu Ile Asp Asp Asn Cys Glu Ile Lys
100 105 110
Phe Ser Lys Lys Leu Ser Asp Ser Thr Met Thr Asn Tyr Met Asn Gln
115 120 125
Leu Ser Glu Leu Leu Gly Phe Asp Leu Asn Pro
130 135
<210> 752
<211> 124
<212> PRT
<213> Respiratory syncytial virus
<400> 752
Met Asp Thr Thr His Asn Gly Thr Thr Pro Gln Arg Leu Met Ile Thr
1 5 10 15
Asp Met Arg Pro Leu Ser Leu Glu Thr Ile Ile Thr Ser Leu Thr Arg
20 25 30
Asp Ile Ile Thr His Arg Phe Ile Tyr Leu Ile Asn His Glu Cys Ile
35 40 45
Val Arg Lys Leu Asp Glu Arg Gln Ala Thr Phe Thr Phe Leu Val Asn
50 55 60
Tyr Glu Met Lys Leu Leu His Lys Val Gly Ser Thr Lys Tyr Lys Lys
65 70 75 80
Tyr Thr Glu Tyr Asn Thr Lys Tyr Gly Thr Phe Pro Met Pro Ile Phe
85 90 95
Ile Asn His Asp Gly Phe Leu Glu Cys Ile Gly Ile Lys Pro Thr Lys
100 105 110
His Thr Pro Ile Ile Tyr Lys Tyr Asp Leu Asn Pro
115 120
<210> 753
<211> 391
<212> PRT
<213> Respiratory syncytial virus
<400> 753
Met Ala Leu Ser Lys Val Lys Leu Asn Asp Thr Leu Asn Lys Asp Gln
1 5 10 15
Leu Leu Ser Ser Ser Lys Tyr Thr Ile Gln Arg Ser Thr Gly Asp Ser
20 25 30
Ile Asp Thr Pro Asn Tyr Asp Val Gln Lys His Ile Asn Lys Leu Cys
35 40 45
Gly Met Leu Leu Ile Thr Glu Asp Ala Asn His Lys Phe Thr Gly Val
50 55 60
Ile Gly Met Leu Tyr Ala Met Ser Arg Leu Gly Arg Glu Asp Thr Ile
65 70 75 80
Lys Ile Leu Arg Asp Ala Gly Tyr His Val Lys Ala Asn Gly Val Asp
85 90 95
Val Thr Thr His Arg Gln Asp Ile Asn Gly Lys Glu Met Lys Phe Glu
100 105 110
Val Leu Thr Leu Ala Ser Leu Thr Thr Glu Ile Gln Ile Asn Ile Glu
115 120 125
Ile Glu Ser Arg Lys Ser Tyr Lys Lys Met Leu Lys Glu Met Gly Glu
130 135 140
Val Ala Pro Glu Tyr Arg His Asp Ser Pro Asp Cys Gly Met Ile Ile
145 150 155 160
Leu Cys Ile Ala Ala Leu Val Ile Thr Lys Leu Ala Ala Gly Asp Arg
165 170 175
Ser Gly Leu Thr Ala Val Ile Arg Arg Ala Asn Asn Val Leu Lys Asn
180 185 190
Glu Met Lys Arg Tyr Lys Gly Leu Leu Pro Lys Asp Ile Ala Asn Ser
195 200 205
Phe Tyr Glu Val Phe Glu Lys Tyr Pro His Phe Ile Asp Val Phe Val
210 215 220
His Phe Gly Ile Ala Gln Ser Ser Thr Arg Gly Gly Ser Arg Val Glu
225 230 235 240
Gly Ile Phe Ala Gly Leu Phe Met Asn Ala Tyr Gly Ala Gly Gln Val
245 250 255
Met Leu Arg Trp Gly Val Leu Ala Lys Ser Val Lys Asn Ile Met Leu
260 265 270
Gly His Ala Ser Val Gln Ala Glu Met Glu Gln Val Val Glu Val Tyr
275 280 285
Glu Tyr Ala Gln Lys Leu Gly Gly Glu Ala Gly Phe Tyr His Ile Leu
290 295 300
Asn Asn Pro Lys Ala Ser Leu Leu Ser Leu Thr Gln Phe Pro His Phe
305 310 315 320
Ser Ser Val Val Leu Gly Asn Ala Ala Gly Leu Gly Ile Met Gly Glu
325 330 335
Tyr Arg Gly Thr Pro Arg Asn Gln Asp Leu Tyr Asp Ala Ala Lys Ala
340 345 350
Tyr Ala Glu Gln Leu Lys Glu Asn Gly Val Ile Asn Tyr Ser Val Leu
355 360 365
Asp Leu Thr Ala Glu Glu Leu Glu Ala Ile Lys His Gln Leu Asn Pro
370 375 380
Lys Asp Asn Asp Val Glu Leu
385 390
<210> 754
<211> 241
<212> PRT
<213> Respiratory syncytial virus
<400> 754
Met Glu Lys Phe Ala Pro Glu Phe His Gly Glu Asp Ala Asn Asn Arg
1 5 10 15
Ala Thr Lys Phe Leu Glu Ser Ile Lys Gly Lys Phe Thr Ser Pro Lys
20 25 30
Asp Pro Lys Lys Lys Asp Ser Ile Ile Ser Val Asn Ser Ile Asp Ile
35 40 45
Glu Val Thr Lys Glu Ser Pro Ile Thr Ser Asn Ser Thr Ile Ile Asn
50 55 60
Pro Thr Asn Glu Thr Asp Asp Thr Ala Gly Asn Lys Pro Asn Tyr Gln
65 70 75 80
Arg Lys Pro Leu Val Ser Phe Lys Glu Asp Pro Thr Pro Ser Asp Asn
85 90 95
Pro Phe Ser Lys Leu Tyr Lys Glu Thr Ile Glu Thr Phe Asp Asn Asn
100 105 110
Glu Glu Glu Ser Ser Tyr Ser Tyr Glu Glu Ile Asn Asp Gln Thr Asn
115 120 125
Asp Asn Ile Thr Ala Arg Leu Asp Arg Ile Asp Glu Lys Leu Ser Glu
130 135 140
Ile Leu Gly Met Leu His Thr Leu Val Val Ala Ser Ala Gly Pro Thr
145 150 155 160
Ser Ala Arg Asp Gly Ile Arg Asp Ala Met Val Gly Leu Arg Glu Glu
165 170 175
Met Ile Glu Lys Ile Arg Thr Glu Ala Leu Met Thr Asn Asp Arg Leu
180 185 190
Glu Ala Met Ala Arg Leu Arg Asn Glu Glu Ser Glu Lys Met Ala Lys
195 200 205
Asp Thr Ser Asp Glu Val Ser Leu Asn Pro Thr Ser Glu Lys Leu Asn
210 215 220
Asn Leu Leu Glu Gly Asn Asp Ser Asp Asn Asp Leu Ser Leu Glu Asp
225 230 235 240
Phe
<210> 755
<211> 256
<212> PRT
<213> Respiratory syncytial virus
<400> 755
Met Glu Thr Tyr Val Asn Lys Leu His Glu Gly Ser Thr Tyr Thr Ala
1 5 10 15
Ala Val Gln Tyr Asn Val Leu Glu Lys Asp Asp Asp Pro Ala Ser Leu
20 25 30
Thr Ile Trp Val Pro Met Phe Gln Ser Ser Met Pro Ala Asp Leu Leu
35 40 45
Ile Lys Glu Leu Ala Asn Val Asn Ile Leu Val Lys Gln Ile Ser Thr
50 55 60
Pro Lys Gly Pro Ser Leu Arg Val Met Ile Asn Ser Arg Ser Ala Val
65 70 75 80
Leu Ala Gln Met Pro Ser Lys Phe Thr Ile Cys Ala Asn Val Ser Leu
85 90 95
Asp Glu Arg Ser Lys Leu Ala Tyr Asp Val Thr Thr Pro Cys Glu Ile
100 105 110
Lys Ala Cys Ser Leu Thr Cys Leu Lys Ser Lys Asn Met Leu Thr Thr
115 120 125
Val Lys Asp Leu Thr Met Lys Thr Leu Asn Pro Thr His Asp Ile Ile
130 135 140
Ala Leu Cys Glu Phe Glu Asn Ile Val Thr Ser Lys Lys Val Ile Ile
145 150 155 160
Pro Thr Tyr Leu Arg Ser Ile Ser Val Arg Asn Lys Asp Leu Asn Thr
165 170 175
Leu Glu Asn Ile Thr Thr Thr Glu Phe Lys Asn Ala Ile Thr Asn Ala
180 185 190
Lys Ile Ile Pro Tyr Ser Gly Leu Leu Leu Val Ile Thr Val Thr Asp
195 200 205
Asn Lys Gly Ala Phe Lys Tyr Ile Lys Pro Gln Ser Gln Phe Ile Val
210 215 220
Asp Leu Gly Ala Tyr Leu Glu Lys Glu Ser Ile Tyr Tyr Val Thr Thr
225 230 235 240
Asn Trp Lys His Thr Ala Thr Arg Phe Ala Ile Lys Pro Met Glu Asp
245 250 255
<210> 756
<211> 64
<212> PRT
<213> Respiratory syncytial virus
<400> 756
Met Glu Asn Thr Ser Ile Thr Ile Glu Phe Ser Ser Lys Phe Trp Pro
1 5 10 15
Tyr Phe Thr Leu Ile His Met Ile Thr Thr Ile Ile Ser Leu Leu Ile
20 25 30
Ile Ile Ser Ile Met Ile Ala Ile Leu Asn Lys Leu Cys Glu Tyr Asn
35 40 45
Val Phe His Asn Lys Thr Phe Glu Leu Pro Arg Ala Arg Val Asn Thr
50 55 60
<210> 757
<211> 298
<212> PRT
<213> Respiratory syncytial virus
<400> 757
Met Ser Lys Thr Lys Asp Gln Arg Thr Ala Lys Thr Leu Glu Lys Thr
1 5 10 15
Trp Asp Thr Leu Asn His Leu Leu Phe Ile Ser Ser Cys Leu Tyr Lys
20 25 30
Leu Asn Leu Lys Ser Ile Ala Gln Ile Thr Leu Ser Ile Leu Ala Met
35 40 45
Ile Ile Ser Thr Ser Leu Ile Ile Val Ala Ile Ile Phe Ile Ala Ser
50 55 60
Ala Asn Asn Lys Val Thr Leu Thr Thr Ala Ile Ile Gln Asp Ala Thr
65 70 75 80
Ser Gln Ile Lys Asn Thr Thr Pro Thr Tyr Leu Thr Gln Asn Pro Gln
85 90 95
Leu Gly Ile Ser Phe Phe Asn Leu Ser Gly Thr Ile Ser Gln Thr Thr
100 105 110
Ala Ile Leu Ala Leu Thr Thr Pro Ser Val Glu Ser Ile Leu Gln Ser
115 120 125
Thr Thr Val Lys Thr Lys Asn Thr Thr Thr Thr Gln Ile Gln Pro Ser
130 135 140
Lys Pro Thr Thr Lys Gln Arg Gln Asn Lys Pro Pro Asn Lys Pro Asn
145 150 155 160
Asp Asp Phe His Phe Glu Val Phe Asn Phe Val Pro Cys Ser Ile Cys
165 170 175
Ser Asn Asn Pro Thr Cys Trp Ala Ile Cys Lys Arg Ile Pro Ser Lys
180 185 190
Lys Pro Gly Lys Lys Thr Thr Thr Lys Pro Thr Lys Lys Pro Thr Ile
195 200 205
Lys Thr Thr Lys Lys Asp Leu Lys Pro Gln Thr Thr Lys Pro Lys Glu
210 215 220
Ala Pro Thr Thr Lys Pro Thr Asp Lys Pro Thr Ile Asn Ile Thr Lys
225 230 235 240
Pro Asn Ile Arg Thr Thr Leu Leu Thr Asn Ser Thr Thr Gly Asn Pro
245 250 255
Glu His Thr Ser Gln Glu Glu Thr Leu His Ser Thr Ser Ser Glu Gly
260 265 270
Asn Thr Ser Pro Ser Gln Ile Tyr Thr Thr Ser Glu Tyr Leu Ser Gln
275 280 285
Pro Pro Ser Pro Ser Asn Ile Thr Asp Gln
290 295
<210> 758
<211> 574
<212> PRT
<213> Respiratory syncytial virus
<400> 758
Met Glu Leu Pro Ile Leu Lys Thr Asn Ala Ile Thr Thr Ile Leu Ala
1 5 10 15
Ala Val Thr Leu Cys Phe Ala Ser Ser Gln Asn Ile Thr Glu Glu Phe
20 25 30
Tyr Gln Ser Thr Cys Ser Ala Val Ser Lys Gly Tyr Leu Ser Ala Leu
35 40 45
Arg Thr Gly Trp Tyr Thr Ser Val Ile Thr Ile Glu Leu Ser Asn Ile
50 55 60
Lys Glu Asn Lys Cys Asn Gly Thr Asp Ala Lys Val Lys Leu Ile Lys
65 70 75 80
Gln Glu Leu Asp Lys Tyr Lys Asn Ala Val Thr Glu Leu Gln Leu Leu
85 90 95
Met Gln Ser Thr Pro Ala Ala Asn Asn Arg Ala Arg Arg Glu Leu Pro
100 105 110
Arg Phe Met Asn Tyr Thr Leu Asn Asn Thr Lys Asn Asn Asn Val Thr
115 120 125
Leu Ser Lys Lys Arg Lys Arg Arg Phe Leu Gly Phe Leu Leu Gly Val
130 135 140
Gly Ser Ala Ile Ala Ser Gly Ile Ala Val Ser Lys Val Leu His Leu
145 150 155 160
Glu Gly Glu Val Asn Lys Ile Lys Asn Ala Leu Leu Ser Thr Asn Lys
165 170 175
Ala Val Val Ser Leu Ser Asn Gly Val Ser Val Leu Thr Ser Lys Val
180 185 190
Leu Asp Leu Lys Asn Tyr Ile Asp Lys Gln Leu Leu Pro Ile Val Asn
195 200 205
Lys Gln Ser Cys Ser Ile Ser Asn Ile Glu Thr Val Ile Glu Phe Gln
210 215 220
Gln Lys Asn Asn Arg Leu Leu Glu Ile Thr Arg Glu Phe Ser Val Asn
225 230 235 240
Ala Gly Val Thr Thr Pro Val Ser Thr Tyr Met Leu Thr Asn Ser Glu
245 250 255
Leu Leu Ser Leu Ile Asn Asp Met Pro Ile Thr Asn Asp Gln Lys Lys
260 265 270
Leu Met Ser Asn Asn Val Gln Ile Val Arg Gln Gln Ser Tyr Ser Ile
275 280 285
Met Ser Ile Ile Lys Glu Glu Val Leu Ala Tyr Val Val Gln Leu Pro
290 295 300
Leu Tyr Gly Val Ile Asp Thr Pro Cys Trp Lys Leu His Thr Ser Pro
305 310 315 320
Leu Cys Thr Thr Asn Thr Lys Glu Gly Ser Asn Ile Cys Leu Thr Arg
325 330 335
Thr Asp Arg Gly Trp Tyr Cys Asp Asn Ala Gly Ser Val Ser Phe Phe
340 345 350
Pro Gln Ala Glu Thr Cys Lys Val Gln Ser Asn Arg Val Phe Cys Asp
355 360 365
Thr Met Asn Ser Leu Thr Leu Pro Ser Glu Val Asn Leu Cys Asn Ile
370 375 380
Asp Ile Phe Asn Pro Lys Tyr Asp Cys Lys Ile Met Thr Ser Lys Thr
385 390 395 400
Asp Val Ser Ser Ser Val Ile Thr Ser Leu Gly Ala Ile Val Ser Cys
405 410 415
Tyr Gly Lys Thr Lys Cys Thr Ala Ser Asn Lys Asn Arg Gly Ile Ile
420 425 430
Lys Thr Phe Ser Asn Gly Cys Asp Tyr Val Ser Asn Lys Gly Val Asp
435 440 445
Thr Val Ser Val Gly Asn Thr Leu Tyr Tyr Val Asn Lys Gln Glu Gly
450 455 460
Lys Ser Leu Tyr Val Lys Gly Glu Pro Ile Ile Asn Phe Tyr Asp Pro
465 470 475 480
Leu Val Phe Pro Ser Asp Glu Phe Asp Ala Ser Ile Ser Gln Val Asn
485 490 495
Glu Lys Ile Asn Gln Ser Leu Ala Phe Ile Arg Lys Ser Asp Glu Leu
500 505 510
Leu His Asn Val Asn Val Gly Lys Ser Thr Thr Asn Ile Met Ile Thr
515 520 525
Thr Ile Ile Ile Val Ile Ile Val Ile Leu Leu Leu Leu Ile Ala Val
530 535 540
Gly Leu Phe Leu Tyr Cys Lys Ala Arg Ser Thr Pro Val Thr Leu Ser
545 550 555 560
Lys Asp Gln Leu Ser Gly Ile Asn Asn Ile Ala Phe Ser Asn
565 570
<210> 759
<211> 194
<212> PRT
<213> Respiratory syncytial virus
<400> 759
Met Ser Arg Arg Asn Pro Cys Lys Phe Glu Ile Arg Gly His Cys Leu
1 5 10 15
Asn Gly Lys Arg Cys His Phe Ser His Asn Tyr Phe Glu Trp Pro Pro
20 25 30
His Ala Leu Leu Val Arg Gln Asn Phe Met Leu Asn Arg Ile Leu Lys
35 40 45
Ser Met Asp Lys Ser Ile Asp Thr Leu Ser Glu Ile Ser Gly Ala Ala
50 55 60
Glu Leu Asp Arg Thr Glu Glu Tyr Ala Leu Gly Val Val Gly Val Leu
65 70 75 80
Glu Ser Tyr Ile Gly Ser Ile Asn Asn Ile Thr Lys Gln Ser Ala Cys
85 90 95
Val Ala Met Ser Lys Leu Leu Thr Glu Leu Asn Ser Asp Asp Ile Lys
100 105 110
Lys Leu Arg Asp Asn Glu Glu Pro Asn Ser Pro Lys Ile Arg Val Tyr
115 120 125
Asn Thr Val Ile Ser Tyr Ile Glu Ser Asn Arg Lys Asn Asn Lys Gln
130 135 140
Thr Ile His Leu Leu Lys Arg Leu Pro Ala Asp Val Leu Lys Lys Thr
145 150 155 160
Ile Lys Asn Thr Leu Asp Ile His Lys Ser Ile Thr Ile Asn Asn Pro
165 170 175
Lys Glu Ser Thr Val Asn Asp Thr Asn Asp His Ala Lys Asn Asn Asp
180 185 190
Thr Thr
<210> 760
<211> 88
<212> PRT
<213> Respiratory syncytial virus
<400> 760
Met Pro Lys Ile Met Ile Leu Pro Asp Lys Tyr Pro Cys Ser Ile Asn
1 5 10 15
Ser Ile Leu Ile Thr Ser Ser Cys Arg Val Thr Met Tyr Asn Gln Lys
20 25 30
Asn Thr Leu Tyr Phe Asn Gln Asn Asn Gln Asn Asn His Thr Tyr Ser
35 40 45
Pro Asn Gln Pro Phe Asn Glu Ile His Trp Thr Ser Gln Asp Leu Ile
50 55 60
Asp Ala Ile Gln Asn Phe Leu Gln His Leu Gly Ile Thr Asp Asp Ile
65 70 75 80
Tyr Thr Ile Tyr Ile Leu Val Ser
85
<210> 761
<211> 2165
<212> PRT
<213> Respiratory syncytial virus
<400> 761
Met Asp Pro Ile Ile Asn Gly Asn Ser Ala Asn Val Tyr Leu Thr Asp
1 5 10 15
Ser Tyr Leu Lys Gly Val Ile Ser Phe Ser Glu Cys Asn Ala Leu Gly
20 25 30
Ser Tyr Ile Phe Asn Gly Pro Tyr Leu Lys Asn Asp Tyr Thr Asn Leu
35 40 45
Ile Ser Arg Gln Asn Pro Leu Ile Glu His Ile Asn Leu Lys Lys Leu
50 55 60
Asn Ile Thr Gln Ser Leu Ile Ser Lys Tyr His Lys Gly Glu Ile Lys
65 70 75 80
Ile Glu Glu Pro Thr Tyr Phe Gln Ser Leu Leu Met Thr Tyr Lys Ser
85 90 95
Met Thr Ser Ser Glu Gln Ile Thr Thr Thr Asn Leu Leu Lys Lys Ile
100 105 110
Ile Arg Arg Ala Ile Glu Ile Ser Asp Val Lys Val Tyr Ala Ile Leu
115 120 125
Asn Lys Leu Gly Leu Lys Glu Lys Asp Lys Ile Lys Ser Asn Asn Gly
130 135 140
Gln Asp Glu Asn Asn Ser Val Ile Thr Thr Ile Ile Lys Asp Asp Ile
145 150 155 160
Leu Leu Ala Val Lys Asp Asn Gln Ser His Leu Lys Ala Gly Lys Asn
165 170 175
His Ser Thr Lys Gln Lys Asp Thr Ile Lys Thr Thr Leu Leu Lys Lys
180 185 190
Leu Met Cys Ser Met Gln His Pro Pro Ser Trp Leu Ile His Trp Phe
195 200 205
Asn Leu Tyr Thr Lys Leu Asn Asn Ile Leu Thr Gln Tyr Arg Ser Asn
210 215 220
Glu Val Lys Asn His Gly Phe Ile Leu Ile Asp Asn Gln Thr Leu Asn
225 230 235 240
Gly Phe Gln Phe Ile Leu Asn Gln Tyr Gly Cys Ile Val Tyr His Lys
245 250 255
Glu Leu Lys Arg Ile Thr Val Thr Thr Tyr Asn Gln Phe Leu Thr Trp
260 265 270
Lys Asp Ile Ser Leu Ser Arg Leu Asn Val Cys Leu Ile Thr Trp Ile
275 280 285
Ser Asn Cys Leu Asn Thr Leu Asn Lys Ser Leu Gly Leu Arg Cys Gly
290 295 300
Phe Asn Asn Val Ile Leu Thr Gln Leu Phe Leu Tyr Gly Asp Cys Ile
305 310 315 320
Leu Lys Leu Phe His Asn Glu Gly Phe Tyr Ile Ile Lys Glu Val Glu
325 330 335
Gly Phe Ile Met Ser Leu Ile Leu Asn Ile Thr Glu Glu Asp Gln Phe
340 345 350
Arg Lys Arg Phe Tyr Asn Ser Met Leu Asn Asn Ile Thr Asp Ala Ala
355 360 365
Asn Lys Ala Gln Lys Asn Leu Leu Ser Arg Val Cys His Thr Leu Leu
370 375 380
Asp Lys Thr Val Ser Asp Asn Ile Ile Asn Gly Arg Trp Ile Ile Leu
385 390 395 400
Leu Ser Lys Phe Leu Lys Leu Ile Lys Leu Ala Gly Asp Asn Asn Leu
405 410 415
Asn Asn Leu Ser Glu Leu Tyr Phe Leu Phe Arg Ile Phe Gly His Pro
420 425 430
Met Val Asp Glu Arg Gln Ala Met Asp Ala Val Lys Val Asn Cys Asn
435 440 445
Glu Thr Lys Phe Tyr Leu Leu Ser Ser Leu Ser Met Leu Arg Gly Ala
450 455 460
Phe Ile Tyr Arg Ile Ile Lys Gly Phe Val Asn Asn Tyr Asn Arg Trp
465 470 475 480
Pro Thr Leu Arg Asn Ala Ile Val Leu Pro Leu Arg Trp Leu Thr Tyr
485 490 495
Tyr Lys Leu Asn Thr Tyr Pro Ser Leu Leu Glu Leu Thr Glu Arg Asp
500 505 510
Leu Ile Val Leu Ser Gly Leu Arg Phe Tyr Arg Glu Phe Arg Leu Pro
515 520 525
Lys Lys Val Asp Leu Glu Met Ile Ile Asn Asp Lys Ala Ile Ser Pro
530 535 540
Pro Lys Asn Leu Ile Trp Thr Ser Phe Pro Arg Asn Tyr Met Pro Ser
545 550 555 560
His Ile Gln Asn Tyr Ile Glu His Glu Lys Leu Lys Phe Ser Glu Ser
565 570 575
Asp Lys Ser Arg Arg Val Leu Glu Tyr Tyr Leu Arg Asp Asn Lys Phe
580 585 590
Asn Glu Cys Asp Leu Tyr Asn Cys Val Val Asn Gln Ser Tyr Leu Asn
595 600 605
Asn Pro Asn His Val Val Ser Leu Thr Gly Lys Glu Arg Glu Leu Ser
610 615 620
Val Gly Arg Met Phe Ala Met Gln Pro Gly Met Phe Arg Gln Val Gln
625 630 635 640
Ile Leu Ala Glu Lys Met Ile Ala Glu Asn Ile Leu Gln Phe Phe Pro
645 650 655
Glu Ser Leu Thr Arg Tyr Gly Asp Leu Glu Leu Gln Lys Ile Leu Glu
660 665 670
Leu Lys Ala Gly Ile Ser Asn Lys Ser Asn Arg Tyr Asn Asp Asn Tyr
675 680 685
Asn Asn Tyr Ile Ser Lys Cys Ser Ile Ile Thr Asp Leu Ser Lys Phe
690 695 700
Asn Gln Ala Phe Arg Tyr Glu Thr Ser Cys Ile Cys Ser Asp Val Leu
705 710 715 720
Asp Glu Leu His Gly Val Gln Ser Leu Phe Ser Trp Leu His Leu Thr
725 730 735
Ile Pro His Val Thr Ile Ile Cys Thr Tyr Arg His Ala Pro Pro Tyr
740 745 750
Ile Arg Asp His Ile Val Asp Leu Asn Asn Val Asp Glu Gln Ser Gly
755 760 765
Leu Tyr Arg Tyr His Met Gly Gly Ile Glu Gly Trp Cys Gln Lys Leu
770 775 780
Trp Thr Ile Glu Ala Ile Ser Leu Leu Asp Leu Ile Ser Leu Lys Gly
785 790 795 800
Lys Phe Ser Ile Thr Ala Leu Ile Asn Gly Asp Asn Gln Ser Ile Asp
805 810 815
Ile Ser Lys Pro Val Arg Leu Met Glu Gly Gln Thr His Ala Gln Ala
820 825 830
Asp Tyr Leu Leu Ala Leu Asn Ser Leu Lys Leu Leu Tyr Lys Glu Tyr
835 840 845
Ala Gly Ile Gly His Lys Leu Lys Gly Thr Glu Thr Tyr Ile Ser Arg
850 855 860
Asp Met Gln Phe Met Ser Lys Thr Ile Gln His Asn Gly Val Tyr Tyr
865 870 875 880
Pro Ala Ser Ile Lys Lys Val Leu Arg Val Gly Pro Trp Ile Asn Thr
885 890 895
Ile Leu Asp Asp Phe Lys Val Ser Leu Glu Ser Ile Gly Ser Leu Thr
900 905 910
Gln Glu Leu Glu Tyr Arg Gly Glu Ser Leu Leu Cys Ser Leu Ile Phe
915 920 925
Arg Asn Val Trp Leu Tyr Asn Gln Ile Ala Leu Gln Leu Lys Asn His
930 935 940
Ala Leu Cys Asn Asn Lys Leu Tyr Leu Asp Ile Leu Lys Val Leu Lys
945 950 955 960
His Leu Lys Thr Phe Phe Asn Leu Asp Asn Ile Asp Thr Ala Leu Thr
965 970 975
Leu Tyr Met Asn Leu Pro Met Leu Phe Gly Gly Gly Asp Pro Asn Leu
980 985 990
Leu Tyr Arg Ser Phe Tyr Arg Arg Thr Pro Asp Phe Leu Thr Glu Ala
995 1000 1005
Ile Val His Ser Val Phe Ile Leu Ser Tyr Tyr Thr Asn His Asp
1010 1015 1020
Leu Lys Asp Lys Leu Gln Asp Leu Ser Asp Asp Arg Leu Asn Lys
1025 1030 1035
Phe Leu Thr Cys Ile Ile Thr Phe Asp Lys Asn Pro Asn Ala Glu
1040 1045 1050
Phe Val Thr Leu Met Arg Asp Pro Gln Ala Leu Gly Ser Glu Arg
1055 1060 1065
Gln Ala Lys Ile Thr Ser Glu Ile Asn Arg Leu Ala Val Thr Glu
1070 1075 1080
Val Leu Ser Thr Ala Pro Asn Lys Ile Phe Ser Lys Ser Ala Gln
1085 1090 1095
His Tyr Thr Thr Thr Glu Ile Asp Leu Asn Asp Ile Met Gln Asn
1100 1105 1110
Ile Glu Pro Thr Tyr Pro His Gly Leu Arg Val Val Tyr Glu Ser
1115 1120 1125
Leu Pro Phe Tyr Lys Ala Glu Lys Ile Val Asn Leu Ile Ser Gly
1130 1135 1140
Thr Lys Ser Ile Thr Asn Ile Leu Glu Lys Thr Ser Ala Ile Asp
1145 1150 1155
Leu Thr Asp Ile Asp Arg Ala Thr Glu Met Met Arg Lys Asn Ile
1160 1165 1170
Thr Leu Leu Ile Arg Ile Phe Pro Leu Asp Cys Asn Arg Asp Lys
1175 1180 1185
Arg Glu Ile Leu Ser Met Glu Asn Leu Ser Ile Thr Glu Leu Ser
1190 1195 1200
Lys Tyr Val Arg Glu Arg Ser Trp Ser Leu Ser Asn Ile Val Gly
1205 1210 1215
Val Thr Ser Pro Ser Ile Met Tyr Thr Met Asp Ile Lys Tyr Thr
1220 1225 1230
Thr Ser Thr Ile Ala Ser Gly Ile Ile Ile Glu Lys Tyr Asn Val
1235 1240 1245
Asn Ser Leu Thr Arg Gly Glu Arg Gly Pro Thr Lys Pro Trp Val
1250 1255 1260
Gly Ser Ser Thr Gln Glu Lys Lys Thr Met Pro Val Tyr Asn Arg
1265 1270 1275
Gln Val Leu Thr Lys Lys Gln Arg Asp Gln Ile Asp Leu Leu Ala
1280 1285 1290
Lys Leu Asp Trp Val Tyr Ala Ser Ile Asp Asn Lys Asp Glu Phe
1295 1300 1305
Met Glu Glu Leu Ser Ile Gly Thr Leu Gly Leu Thr Tyr Glu Lys
1310 1315 1320
Ala Lys Lys Leu Phe Pro Gln Tyr Leu Ser Val Asn Tyr Leu His
1325 1330 1335
Arg Leu Thr Val Ser Ser Arg Pro Cys Glu Phe Pro Ala Ser Ile
1340 1345 1350
Pro Ala Tyr Arg Thr Thr Asn Tyr His Phe Asp Thr Ser Pro Ile
1355 1360 1365
Asn Arg Ile Leu Thr Glu Lys Tyr Gly Asp Glu Asp Ile Asp Ile
1370 1375 1380
Val Phe Gln Asn Cys Ile Ser Phe Gly Leu Ser Leu Met Ser Val
1385 1390 1395
Val Glu Gln Phe Thr Asn Val Cys Pro Asn Arg Ile Ile Leu Ile
1400 1405 1410
Pro Lys Leu Asn Glu Ile His Leu Met Lys Pro Pro Ile Phe Thr
1415 1420 1425
Gly Asp Val Asp Ile His Lys Leu Lys Gln Val Ile Gln Lys Gln
1430 1435 1440
His Met Phe Leu Pro Asp Lys Ile Ser Leu Thr Gln Tyr Val Glu
1445 1450 1455
Leu Phe Leu Ser Asn Lys Thr Leu Lys Ser Gly Ser His Val Asn
1460 1465 1470
Ser Asn Leu Ile Leu Ala His Lys Ile Ser Asp Tyr Phe His Asn
1475 1480 1485
Thr Tyr Ile Leu Ser Thr Asn Leu Ala Gly His Trp Ile Leu Ile
1490 1495 1500
Ile Gln Leu Met Lys Asp Ser Lys Gly Ile Phe Glu Lys Asp Trp
1505 1510 1515
Gly Glu Gly Tyr Ile Thr Asp His Met Phe Ile Asn Leu Lys Val
1520 1525 1530
Phe Phe Asn Ala Tyr Lys Thr Tyr Leu Leu Cys Phe His Lys Gly
1535 1540 1545
Tyr Gly Arg Ala Lys Leu Glu Cys Asp Met Asn Thr Ser Asp Leu
1550 1555 1560
Leu Cys Val Leu Glu Leu Ile Asp Ser Ser Tyr Trp Lys Ser Met
1565 1570 1575
Ser Lys Val Phe Leu Glu Gln Lys Val Ile Lys Tyr Ile Leu Ser
1580 1585 1590
Gln Asp Ala Ser Leu His Arg Val Lys Gly Cys His Ser Phe Lys
1595 1600 1605
Leu Trp Phe Leu Lys Arg Leu Asn Val Ala Glu Phe Thr Val Cys
1610 1615 1620
Pro Trp Val Val Asn Ile Asp Tyr His Pro Thr His Met Lys Ala
1625 1630 1635
Ile Leu Thr Tyr Ile Asp Leu Val Arg Met Gly Leu Ile Asn Ile
1640 1645 1650
Asp Arg Ile Tyr Ile Lys Asn Lys His Lys Phe Asn Asp Glu Phe
1655 1660 1665
Tyr Thr Ser Asn Leu Phe Tyr Ile Asn Tyr Asn Phe Ser Asp Asn
1670 1675 1680
Thr His Leu Leu Thr Lys His Ile Arg Ile Ala Asn Ser Glu Leu
1685 1690 1695
Glu Asn Asn Tyr Asn Lys Leu Tyr His Pro Thr Pro Glu Thr Leu
1700 1705 1710
Glu Asn Ile Leu Thr Asn Pro Val Lys Cys Asp Asp Lys Lys Thr
1715 1720 1725
Leu Asn Asp Tyr Cys Ile Gly Lys Asn Val Asp Ser Ile Met Leu
1730 1735 1740
Pro Leu Leu Ser Asn Lys Lys Leu Ile Lys Ser Ser Thr Met Ile
1745 1750 1755
Arg Thr Asn Tyr Ser Lys Gln Asp Leu Tyr Asn Leu Phe Pro Thr
1760 1765 1770
Val Val Ile Asp Lys Ile Ile Asp His Ser Gly Asn Thr Ala Lys
1775 1780 1785
Ser Asn Gln Leu Tyr Thr Thr Thr Ser His Gln Ile Ser Leu Val
1790 1795 1800
His Asn Ser Thr Ser Leu Tyr Cys Met Leu Pro Trp His His Ile
1805 1810 1815
Asn Arg Phe Asn Phe Val Phe Ser Ser Thr Gly Cys Lys Ile Ser
1820 1825 1830
Ile Glu Tyr Ile Leu Lys Asp Leu Lys Ile Lys Asp Pro Asn Cys
1835 1840 1845
Ile Ala Phe Ile Gly Glu Gly Ala Gly Asn Leu Leu Leu Arg Thr
1850 1855 1860
Val Val Glu Leu His Pro Asp Ile Lys Tyr Ile Tyr Arg Ser Leu
1865 1870 1875
Lys Asp Cys Asn Asp His Ser Leu Pro Ile Glu Phe Leu Arg Leu
1880 1885 1890
Tyr Asn Gly His Ile Asn Ile Asp Tyr Gly Glu Asn Leu Thr Ile
1895 1900 1905
Pro Ala Thr Asp Ala Thr Asn Asn Ile His Trp Ser Tyr Leu His
1910 1915 1920
Ile Lys Phe Ala Glu Pro Ile Ser Leu Phe Val Cys Asp Ala Glu
1925 1930 1935
Leu Pro Val Thr Val Asn Trp Ser Lys Ile Ile Ile Glu Trp Ser
1940 1945 1950
Lys His Val Arg Lys Cys Lys Tyr Cys Ser Ser Val Asn Lys Cys
1955 1960 1965
Thr Leu Ile Val Lys Tyr His Ala Gln Asp Asp Ile Asp Phe Lys
1970 1975 1980
Leu Asp Asn Ile Thr Ile Leu Lys Thr Tyr Val Cys Leu Gly Ser
1985 1990 1995
Lys Leu Lys Gly Ser Glu Val Tyr Leu Val Leu Thr Ile Gly Pro
2000 2005 2010
Ala Asn Val Phe Pro Val Phe Asn Val Val Gln Asn Ala Lys Leu
2015 2020 2025
Ile Leu Ser Arg Thr Lys Asn Phe Ile Met Pro Lys Lys Ala Asp
2030 2035 2040
Lys Glu Ser Ile Asp Ala Asn Ile Lys Ser Leu Ile Pro Phe Leu
2045 2050 2055
Cys Tyr Pro Ile Thr Lys Lys Gly Ile Asn Thr Ala Leu Ser Lys
2060 2065 2070
Leu Lys Ser Val Val Ser Gly Asp Ile Leu Ser Tyr Ser Ile Ala
2075 2080 2085
Gly Arg Asn Glu Val Phe Ser Asn Lys Leu Ile Asn His Lys His
2090 2095 2100
Met Asn Ile Leu Lys Trp Phe Asn His Val Leu Asn Phe Arg Ser
2105 2110 2115
Thr Glu Leu Asn Tyr Asn His Leu Tyr Met Val Glu Ser Thr Tyr
2120 2125 2130
Pro Tyr Leu Ser Glu Leu Leu Asn Ser Leu Thr Thr Asn Glu Leu
2135 2140 2145
Lys Lys Leu Ile Lys Ile Thr Gly Ser Leu Leu Tyr Asn Phe His
2150 2155 2160
Asn Glu
2165
<210> 762
<400> 762
000
<210> 763
<400> 763
000
<210> 764
<400> 764
000
<210> 765
<400> 765
000
<210> 766
<400> 766
000
<210> 767
<400> 767
000
<210> 768
<400> 768
000
<210> 769
<400> 769
000
<210> 770
<400> 770
000
<210> 771
<400> 771
000
<210> 772
<400> 772
000
<210> 773
<400> 773
000
<210> 774
<400> 774
000
<210> 775
<400> 775
000
<210> 776
<400> 776
000
<210> 777
<400> 777
000
<210> 778
<400> 778
000
<210> 779
<400> 779
000
<210> 780
<400> 780
000
<210> 781
<400> 781
000
<210> 782
<400> 782
000
<210> 783
<400> 783
000
<210> 784
<400> 784
000
<210> 785
<400> 785
000
<210> 786
<400> 786
000
<210> 787
<400> 787
000
<210> 788
<400> 788
000
<210> 789
<400> 789
000
<210> 790
<400> 790
000
<210> 791
<400> 791
000
<210> 792
<400> 792
000
<210> 793
<400> 793
000
<210> 794
<400> 794
000
<210> 795
<400> 795
000
<210> 796
<400> 796
000
<210> 797
<400> 797
000
<210> 798
<400> 798
000
<210> 799
<400> 799
000
<210> 800
<400> 800
000
<210> 801
<211> 2220
<212> DNA
<213> Zaire ebolavirus
<400> 801
atggattctc gtcctcagaa aatctggatg gcgccgagtc tcactgaatc tgacatggat 60
taccacaaga tcttgacagc aggtctgtcc gttcaacagg ggattgttcg gcaaagagtc 120
atcccagtgt atcaagtaaa caatcttgaa gaaatttgcc aacttatcat acaggccttt 180
gaagcaggtg ttgattttca agagagtgcg gacagtttcc ttctcatgct ttgtcttcat 240
catgcgtacc agggagatta caaacttttc ttggaaagtg gcgcagtcaa gtatttggaa 300
gggcacgggt tccgttttga agtcaagaag cgtgatggag tgaagcgcct tgaggaattg 360
ctgccagcag tatctagtgg aaaaaacatt aagagaacac ttgctgccat gccggaagag 420
gagacaactg aagctaatgc cggtcagttt ctctcctttg caagtctatt ccttccgaaa 480
ttggtagtag gagaaaaggc ttgccttgag aaggttcaaa ggcaaattca agtacatgca 540
gagcaaggac tgatacaata tccaacagct tggcaatcag taggacacat gatggtgatt 600
ttccgtttga tgcgaacaaa ttttctgatc aaatttctcc taatacacca agggatgcac 660
atggttgccg ggcatgatgc caacgatgct gtgatttcaa attcagtggc tcaagctcgt 720
ttttcaggct tattgattgt caaaacagta cttgatcata tcctacaaaa gacagaacga 780
ggagttcgtc tccatcctct tgcaaggacc gccaaggtaa aaaatgaggt gaactccttt 840
aaggctgcac tcagctccct ggccaagcat ggagagtatg ctcctttcgc ccgacttttg 900
aacctttctg gagtaaataa tcttgagcat ggtcttttcc ctcaactatc ggcaattgca 960
ctcggagtcg ccacagcaca cgggagtacc ctcgcaggag taaatgttgg agaacagtat 1020
caacaactca gagaggctgc cactgaggct gagaagcaac tccaacaata tgcagagtct 1080
cgcgaacttg accatcttgg acttgatgat caggaaaaga aaattcttat gaacttccat 1140
cagaaaaaga acgaaatcag cttccagcaa acaaacgcta tggtaactct aagaaaagag 1200
cgcctggcca agctgacaga agctatcact gctgcgtcac tgcccaaaac aagtggacat 1260
tacgatgatg atgacgacat tccctttcca ggacccatca atgatgacga caatcctggc 1320
catcaagatg atgatccgac tgactcacag gatacgacca ttcccgatgt ggtggttgat 1380
cccgatgatg gaagctacgg cgaataccag agttactcgg aaaacggcat gaatgcacca 1440
gatgacttgg tcctattcga tctagacgag gacgacgagg acactaagcc agtgcctaat 1500
agatcgacca agggtggaca acagaagaac agtcaaaagg gccagcatat agagggcaga 1560
cagacacaat ccaggccaat tcaaaatgtc ccaggccctc acagaacaat ccaccacgcc 1620
agtgcgccac tcacggacaa tgacagaaga aatgaaccct ccggctcaac cagccctcgc 1680
atgctgacac caattaacga agaggcagac ccactggacg atgccgacga cgagacgtct 1740
agccttccgc ccttggagtc agatgatgaa gagcaggaca gggacggaac ttccaaccgc 1800
acacccactg tcgccccacc ggctcccgta tacagagatc actctgaaaa gaaagaactc 1860
ccgcaagacg agcaacaaga tcaggaccac actcaagagg ccaggaacca ggacagtgac 1920
aacacccagt cagaacactc ttttgaggag atgtatcgcc acattctaag atcacagggg 1980
ccatttgatg ctgttttgta ttatcatatg atgaaggatg agcctgtagt tttcagtacc 2040
agtgatggca aagagtacac gtatccagac tcccttgaag aggaatatcc accatggctc 2100
actgaaaaag aggctatgaa tgaagagaat agatttgtta cattggatgg tcaacaattt 2160
tattggccgg tgatgaatca caagaataaa ttcatggcaa tcctgcaaca tcatcagtga 2220
<210> 802
<211> 1023
<212> DNA
<213> Zaire ebolavirus
<400> 802
atgacaacta gaacaaaggg caggggccat actgcggcca cgactcaaaa cgacagaatg 60
ccaggccctg agctttcggg ctggatctct gagcagctaa tgaccggaag aattcctgta 120
agcgacatct tctgtgatat tgagaacaat ccaggattat gctacgcatc ccaaatgcaa 180
caaacgaagc caaacccgaa gacgcgcaac agtcaaaccc aaacggaccc aatttgcaat 240
catagttttg aggaggtagt acaaacattg gcttcattgg ctactgttgt gcaacaacaa 300
accatcgcat cagaatcatt agaacaacgc attacgagtc ttgagaatgg tctaaagcca 360
gtttatgata tggcaaaaac aatctcctca ttgaacaggg tttgtgctga gatggttgca 420
aaatatgatc ttctggtgat gacaaccggt cgggcaacag caaccgctgc ggcaactgag 480
gcttattggg ccgaacatgg tcaaccacca cctggaccat cactttatga agaaagtgcg 540
attcggggta agattgaatc tagagatgag accgtccctc aaagtgttag ggaggcattc 600
aacaatctaa acagtaccac ttcactaact gaggaaaatt ttgggaaacc tgacatttcg 660
gcaaaggatt tgagaaacat tatgtatgat cacttgcctg gttttggaac tgctttccac 720
caattagtac aagtgatttg taaattggga aaagatagca actcattgga catcattcat 780
gctgagttcc aggccagcct ggctgaagga gactctcctc aatgtgccct aattcaaatt 840
acaaaaagag ttccaatctt ccaagatgct gctccacctg tcatccacat ccgctctcga 900
ggtgacattc cccgagcttg ccagaaaagc ttgcgtccag tcccaccatc gcccaagatt 960
gatcgaggtt gggtatgtgt ttttcagctt caagatggta aaacacttgg actcaaaatt 1020
tga 1023
<210> 803
<211> 981
<212> DNA
<213> Zaire ebolavirus
<400> 803
atgaggcggg ttatattgcc tactgctcct cctgaatata tggaggccat ataccctgtc 60
aggtcaaatt caacaattgc tagaggtggc aacagcaata caggcttcct gacaccggag 120
tcagtcaatg gggacactcc atcgaatcca ctcaggccaa ttgccgatga caccatcgac 180
catgccagcc acacaccagg cagtgtgtca tcagcattca tccttgaagc tatggtgaat 240
gtcatatcgg gccccaaagt gctaatgaag caaattccaa tttggcttcc tctaggtgtc 300
gctgatcaaa agacctacag ctttgactca actacggccg ccatcatgct tgcttcatac 360
actatcaccc atttcggcaa ggcaaccaat ccacttgtca gagtcaatcg gctgggtcct 420
ggaatcccgg atcatcccct caggctcctg cgaattggaa accaggcttt cctccaggag 480
ttcgttcttc cgccagtcca actaccccag tatttcacct ttgatttgac agcactcaaa 540
ctgatcaccc aaccactgcc tgctgcaaca tggaccgatg acactccaac aggatcaaat 600
ggagcgttgc gtccaggaat ttcatttcat ccaaaacttc gccccattct tttacccaac 660
aaaagtggga agaaggggaa cagtgccgat ctaacatctc cggagaaaat ccaagcaata 720
atgacttcac tccaggactt taagatcgtt ccaattgatc caaccaaaaa tatcatggga 780
atcgaagtgc cagaaactct ggtccacaag ctgaccggta agaaggtgac ttctaaaaat 840
ggacaaccaa tcatccctgt tcttttgcca aagtacattg ggttggaccc ggtggctcca 900
ggagacctca ccatggtaat cacacaggat tgtgacacgt gtcattctcc tgcaagtctt 960
ccagctgtga ttgagaagta a 981
<210> 804
<211> 2031
<212> DNA
<213> Zaire ebolavirus
<400> 804
atgggcgtta caggaatatt gcagttacct cgtgatcgat tcaagaggac atcattcttt 60
ctttgggtaa ttatcctttt ccaaagaaca ttttccatcc cacttggagt catccacaat 120
agcacattac aggttagtga tgtcgacaaa ctagtttgtc gtgacaaact gtcatccaca 180
aatcaattga gatcagttgg actgaatctc gaagggaatg gagtggcaac tgacgtgcca 240
tctgcaacta aaagatgggg cttcaggtcc ggtgtcccac caaaggtggt caattatgaa 300
gctggtgaat gggctgaaaa ctgctacaat cttgaaatca aaaaacctga cgggagtgag 360
tgtctaccag cagcgccaga cgggattcgg ggcttccccc ggtgccggta tgtgcacaaa 420
gtatcaggaa cgggaccgtg tgccggagac tttgccttcc ataaagaggg tgctttcttc 480
ctgtatgatc gacttgcttc cacagttatc taccgaggaa cgactttcgc tgaaggtgtc 540
gttgcatttc tgatactgcc ccaagctaag aaggacttct tcagctcaca ccccttgaga 600
gagccggtca atgcaacgga ggacccgtct agtggctact attctaccac aattagatat 660
caggctaccg gttttggaac caatgagaca gagtacttgt tcgaggttga caatttgacc 720
tacgtccaac ttgaatcaag attcacacca cagtttctgc tccagctgaa tgagacaata 780
tatacaagtg ggaaaaggag caataccacg ggaaaactaa tttggaaggt caaccccgaa 840
attgatacaa caatcgggga gtgggccttc tgggaaacta aaaaaaacct cactagaaaa 900
attcgcagtg aagagttgtc tttcacagtt gtatcaaacg gagccaaaaa catcagtggt 960
cagagtccgg cgcgaacttc ttccgaccca gggaccaaca caacaactga agaccacaaa 1020
atcatggctt cagaaaattc ctctgcaatg gttcaagtgc acagtcaagg aagggaagct 1080
gcagtgtcgc atctaacaac ccttgccaca atctccacga gtccccaatc cctcacaacc 1140
aaaccaggtc cggacaacag cacccataat acacccgtgt ataaacttga catctctgag 1200
gcaactcaag ttgaacaaca tcaccgcaga acagacaacg acagcacagc ctccgacact 1260
ccctctgcca cgaccgcagc cggaccccca aaagcagaga acaccaacac gagcaagagc 1320
actgacttcc tggaccccgc caccacaaca agtccccaaa accacagcga gaccgctggc 1380
aacaacaaca ctcatcacca agataccgga gaagagagtg ccagcagcgg gaagctaggc 1440
ttaattacca atactattgc tggagtcgca ggactgatca caggcgggag aagaactcga 1500
agagaagcaa ttgtcaatgc tcaacccaaa tgcaacccta atttacatta ctggactact 1560
caggatgaag gtgctgcaat cggactggcc tggataccat atttcgggcc agcagccgag 1620
ggaatttaca tagaggggct aatgcacaat caagatggtt taatctgtgg gttgagacag 1680
ctggccaacg agacgactca agctcttcaa ctgttcctga gagccacaac tgagctacgc 1740
accttttcaa tcctcaaccg taaggcaatt gatttcttgc tgcagcgatg gggcggcaca 1800
tgccacattc tgggaccgga ctgctgtatc gaaccacatg attggaccaa gaacataaca 1860
gacaaaattg atcagattat tcatgatttt gttgataaaa cccttccgga ccagggggac 1920
aatgacaatt ggtggacagg atggagacaa tggataccgg caggtattgg agttacaggc 1980
gttataattg cagttatcgc tttattctgt atatgcaaat ttgtctttta g 2031
<210> 805
<211> 1095
<212> DNA
<213> Zaire ebolavirus
<400> 805
atgggcgtta caggaatatt gcagttacct cgtgatcgat tcaagaggac atcattcttt 60
ctttgggtaa ttatcctttt ccaaagaaca ttttccatcc cacttggagt catccacaat 120
agcacattac aggttagtga tgtcgacaaa ctagtttgtc gtgacaaact gtcatccaca 180
aatcaattga gatcagttgg actgaatctc gaagggaatg gagtggcaac tgacgtgcca 240
tctgcaacta aaagatgggg cttcaggtcc ggtgtcccac caaaggtggt caattatgaa 300
gctggtgaat gggctgaaaa ctgctacaat cttgaaatca aaaaacctga cgggagtgag 360
tgtctaccag cagcgccaga cgggattcgg ggcttccccc ggtgccggta tgtgcacaaa 420
gtatcaggaa cgggaccgtg tgccggagac tttgccttcc ataaagaggg tgctttcttc 480
ctgtatgatc gacttgcttc cacagttatc taccgaggaa cgactttcgc tgaaggtgtc 540
gttgcatttc tgatactgcc ccaagctaag aaggacttct tcagctcaca ccccttgaga 600
gagccggtca atgcaacgga ggacccgtct agtggctact attctaccac aattagatat 660
caggctaccg gttttggaac caatgagaca gagtacttgt tcgaggttga caatttgacc 720
tacgtccaac ttgaatcaag attcacacca cagtttctgc tccagctgaa tgagacaata 780
tatacaagtg ggaaaaggag caataccacg ggaaaactaa tttggaaggt caaccccgaa 840
attgatacaa caatcgggga gtgggccttc tgggaaacta aaaaaacctc actagaaaaa 900
ttcgcagtga agagttgtct ttcacagttg tatcaaacgg agccaaaaac atcagtggtc 960
agagtccggc gcgaacttct tccgacccag ggaccaacac aacaactgaa gaccacaaaa 1020
tcatggcttc agaaaattcc tctgcaatgg ttcaagtgca cagtcaagga agggaagctg 1080
cagtgtcgca tctaa 1095
<210> 806
<211> 894
<212> DNA
<213> Zaire ebolavirus
<400> 806
atgggcgtta caggaatatt gcagttacct cgtgatcgat tcaagaggac atcattcttt 60
ctttgggtaa ttatcctttt ccaaagaaca ttttccatcc cacttggagt catccacaat 120
agcacattac aggttagtga tgtcgacaaa ctagtttgtc gtgacaaact gtcatccaca 180
aatcaattga gatcagttgg actgaatctc gaagggaatg gagtggcaac tgacgtgcca 240
tctgcaacta aaagatgggg cttcaggtcc ggtgtcccac caaaggtggt caattatgaa 300
gctggtgaat gggctgaaaa ctgctacaat cttgaaatca aaaaacctga cgggagtgag 360
tgtctaccag cagcgccaga cgggattcgg ggcttccccc ggtgccggta tgtgcacaaa 420
gtatcaggaa cgggaccgtg tgccggagac tttgccttcc ataaagaggg tgctttcttc 480
ctgtatgatc gacttgcttc cacagttatc taccgaggaa cgactttcgc tgaaggtgtc 540
gttgcatttc tgatactgcc ccaagctaag aaggacttct tcagctcaca ccccttgaga 600
gagccggtca atgcaacgga ggacccgtct agtggctact attctaccac aattagatat 660
caggctaccg gttttggaac caatgagaca gagtacttgt tcgaggttga caatttgacc 720
tacgtccaac ttgaatcaag attcacacca cagtttctgc tccagctgaa tgagacaata 780
tatacaagtg ggaaaaggag caataccacg ggaaaactaa tttggaaggt caaccccgaa 840
attgatacaa caatcgggga gtgggccttc tgggaaacta aaaaacctca ctag 894
<210> 807
<211> 867
<212> DNA
<213> Zaire ebolavirus
<400> 807
atggaagctt catatgagag aggacgccca cgagctgcca gacagcattc aagggatgga 60
cacgaccacc atgttcgagc acgatcatca tccagagaga attatcgagg tgagtaccgt 120
caatcaagga gcgcctcaca agtgcgcgtt cctactgtat ttcataagaa gagagttgaa 180
ccattaacag ttcctccagc acctaaagac atatgtccga ccttgaaaaa aggatttttg 240
tgtgacagta gtttttgcaa aaaagatcac cagttggaga gtttaactga tagggaatta 300
ctcctactaa tcgcccgtaa gacttgtgga tcagtagaac aacaattaaa tataactgca 360
cccaaggact cgcgcttagc aaatccaacg gctgatgatt tccagcaaga ggaaggtcca 420
aaaattacct tgttgacact gatcaagacg gcagaacact gggcgagaca agacatcaga 480
accatagagg attcaaaatt aagagcattg ttgactctat gtgctgtgat gacgaggaaa 540
ttctcaaaat cccagctgag tcttttatgt gagacacacc taaggcgcga ggggcttggg 600
caagatcagg cagaacccgt tctcgaagta tatcaacgat tacacagtga taaaggaggc 660
agttttgaag ctgcactatg gcaacaatgg gaccgacaat ccctaattat gtttatcact 720
gcattcttga atattgctct ccagttaccg tgtgaaagtt ctgctgtcgt tgtttcaggg 780
ttaagaacat tggttcctca atcagataat gaggaagctt caaccaaccc ggggacatgc 840
tcatggtctg atgagggtac cccttaa 867
<210> 808
<211> 756
<212> DNA
<213> Zaire ebolavirus
<400> 808
atggctaaag ctacgggacg atacaatcta atatcgccca aaaaggacct ggagaaaggg 60
gttgtcttaa gcgacctctg taacttctta gttagccaaa ctattcaggg gtggaaggtt 120
tattgggctg gtattgagtt tgatgtgact cacaaaggaa tggccctatt gcatagactg 180
aaaactaatg actttgcccc tgcatggtca atgacaagga atctctttcc tcatttattt 240
caaaatccga attccacaat tgaatcaccg ctgtgggcat tgagagtcat ccttgcagca 300
gggatacagg accagctgat tgaccagtct ttgattgaac ccttagcagg agcccttggt 360
ctgatctctg attggctgct aacaaccaac actaaccatt tcaacatgcg aacacaacgt 420
gtcaaggaac aattgagcct aaaaatgctg tcgttgattc gatccaatat tctcaagttt 480
attaacaaat tggatgctct acatgtcgtg aactacaacg gattgttgag cagtattgaa 540
attggaactc aaaatcatac aatcatcata actcgaacta acatgggttt tctggtggag 600
ctccaagaac ccgacaaatc ggcaatgaac cgcatgaagc ctgggccggc gaaattttcc 660
ctccttcatg agtccacact gaaagcattt acacaaggat cctcgacacg aatgcaaagt 720
ttgattcttg aatttaatag ctctcttgct atctaa 756
<210> 809
<211> 6639
<212> DNA
<213> Zaire ebolavirus
<400> 809
atggctacac aacataccca atacccagac gctaggttat catcaccaat tgtattggac 60
caatgtgacc tagtcactag agcttgcggg ttatattcat catactccct taatccgcaa 120
ctacgcaact gtaaactccc gaaacatatc taccgtttga aatacgatgt aactgttacc 180
aagttcttga gtgatgtacc agtggcgaca ttgcccatag atttcatagt cccagttctt 240
ctcaaggcac tgtcaggcaa tggattctgt cctgttgagc cgcggtgcca acagttctta 300
gatgaaatca ttaagtacac aatgcaagat gctctcttct tgaaatatta tctcaaaaat 360
gtgggtgctc aagaagactg tgttgatgaa cactttcaag agaaaatctt atcttcaatt 420
cagggcaatg aatttttaca tcaaatgttt ttctggtatg atctggctat tttaactcga 480
aggggtagat taaatcgagg aaactctaga tcaacatggt ttgttcatga tgatttaata 540
gacatcttag gctatgggga ctatgttttt tggaagatcc caatttcaat gttaccactg 600
aacacacaag gaatccccca tgctgctatg gactggtatc aggcatcagt attcaaagaa 660
gcggttcaag ggcatacaca cattgtttct gtttctactg ccgacgtctt gataatgtgc 720
aaagatttaa ttacatgtcg attcaacaca actctaatct caaaaatagc agagattgag 780
gatccagttt gttctgatta tcccaatttt aagattgtgt ctatgcttta ccagagcgga 840
gattacttac tctccatatt agggtctgat gggtataaaa ttattaagtt cctcgaacca 900
ttgtgcttgg ccaaaattca attatgctca aagtacactg agaggaaggg ccgattctta 960
acacaaatgc atttagctgt aaatcacacc ctagaagaaa ttacagaaat gcgtgcacta 1020
aagccttcac aggctcaaaa gatccgtgaa ttccatagaa cattgataag gctggagatg 1080
acgccacaac aactttgtga gctattttcc attcaaaaac actgggggca tcctgtgcta 1140
catagtgaaa cagcaatcca aaaagttaaa aaacatgcta cggtgctaaa agcattacgc 1200
cctatagtga ttttcgagac atactgtgtt tttaaatata gtattgccaa acattatttt 1260
gatagtcaag gatcttggta cagtgttact tcagatagga atctaacacc gggtcttaat 1320
tcttatatca aaagaaatca attccctccg ttgccaatga ttaaagaact actatgggaa 1380
ttttaccacc ttgaccaccc tccacttttc tcaaccaaaa ttattagtga cttaagtatt 1440
tttataaaag acagagctac cgcagtagaa aggacatgct gggatgcagt attcgagcct 1500
aatgttctag gatataatcc acctcacaaa tttagtacta aacgtgtacc ggaacaattt 1560
ttagagcaag aaaacttttc tattgagaat gttctttcct acgcacaaaa actcgagtat 1620
ctactaccac aatatcggaa cttttctttc tcattgaaag agaaagagtt gaatgtaggt 1680
agaaccttcg gaaaattgcc ttatccgact cgcaatgttc aaacactttg tgaagctctg 1740
ttagctgatg gtcttgctaa agcatttcct agcaatatga tggtagttac ggaacgtgag 1800
caaaaagaaa gcttattgca tcaagcatca tggcaccaca caagtgatga ttttggtgaa 1860
catgccacag ttagagggag tagctttgta actgatttag agaaatacaa tcttgcattt 1920
agatatgagt ttacagcacc ttttatagaa tattgcaacc gttgctatgg tgttaagaat 1980
gtttttaatt ggatgcatta tacaatccca cagtgttata tgcatgtcag tgattattat 2040
aatccaccac ataacctcac actggagaat cgagacaacc cccccgaagg gcctagttca 2100
tacaggggtc atatgggagg gattgaagga ctgcaacaaa aactctggac aagtatttca 2160
tgtgctcaaa tttctttagt tgaaattaag actggtttta agttacgctc agctgtgatg 2220
ggtgacaatc agtgcattac tgttttatca gtcttcccct tagagactga cgcagacgag 2280
caggaacaga gcgccgaaga caatgcagcg agggtggccg ccagcctagc aaaagttaca 2340
agtgcctgtg gaatcttttt aaaacctgat gaaacatttg tacattcagg ttttatctat 2400
tttggaaaaa aacaatattt gaatggggtc caattgcctc agtcccttaa aacggctaca 2460
agaatggcac cattgtctga tgcaattttt gatgatcttc aagggaccct ggctagtata 2520
ggcactgctt ttgagcgatc catctctgag acacgacata tctttccttg caggataacc 2580
gcagctttcc atacgttttt ttcggtgaga atcttgcaat atcatcatct cgggttcaat 2640
aaaggttttg accttggaca gttaacactc ggcaaacctc tggatttcgg aacaatatca 2700
ttggcactag cggtaccgca ggtgcttgga gggttatcct tcttgaatcc tgagaaatgt 2760
ttctaccgga atctaggaga tccagttacc tcaggcttat tccagttaaa aacttatctc 2820
cgaatgattg agatggatga tttattctta cctttaattg cgaagaaccc tgggaactgc 2880
actgccattg actttgtgct aaatcctagc ggattaaatg tccctgggtc gcaagactta 2940
acttcatttc tgcgccagat tgtacgcagg accatcaccc taagtgcgaa aaacaaactt 3000
attaatacct tatttcatgc gtcagctgac ttcgaagacg aaatggtttg taaatggcta 3060
ttatcatcaa ctcctgttat gagtcgtttt gcggccgata tcttttcacg cacgccgagc 3120
gggaagcgat tgcaaattct aggatacctg gaaggaacac gcacattatt agcctctaag 3180
atcatcaaca ataatacaga gacaccggtt ttggacagac tgaggaaaat aacattgcaa 3240
aggtggagcc tatggtttag ttatcttgat cattgtgata atatcctggc ggaggcttta 3300
acccaaataa cttgcacagt tgatttagca cagattctga gggaatattc atgggctcat 3360
attttagagg gaagacctct tattggagcc acactcccat gtatgattga gcaattcaaa 3420
gtgttttggc tgaaacccta cgaacaatgt ccgcagtgtt caaatgcaaa gcaaccaggt 3480
gggaaaccat tcgtgtcagt ggcagtcaag aaacatattg ttagtgcatg gccgaacgca 3540
tcccgaataa gctggactat cggggatgga atcccataca ttggatcaag gacagaagat 3600
aagataggac aacctgctat taaaccaaaa tgtccttccg cagccttaag agaggccatt 3660
gaattggcgt cccgtttaac atgggtaact caaggcagtt cgaacagtga cttgctaata 3720
aaaccatttt tggaagcacg agtaaattta agtgttcaag aaatacttca aatgacccct 3780
tcacattact caggaaatat tgttcacagg tacaacgatc aatacagtcc tcattctttc 3840
atggccaatc gtatgagtaa ttcagcaacg cgattgattg tttctacaaa cactttaggt 3900
gagttttcag gaggtggcca gtctgcacgc gacagcaata ttattttcca gaatgttata 3960
aattatgcag ttgcactgtt cgatattaaa tttagaaaca ctgaggctac agatatccaa 4020
tataatcgtg ctcaccttca tctaactaag tgttgcaccc gggaagtacc agctcagtat 4080
ttaacataca catctacatt ggatttagat ttaacaagat accgagaaaa cgaattgatt 4140
tatgacagta atcctctaaa aggaggactc aattgcaata tctcattcga taatccattt 4200
ttccaaggta aacggctgaa cattatagaa gatgatctta ttcgactgcc tcacttatct 4260
ggatgggagc tagccaagac catcatgcaa tcaattattt cagatagcaa caattcatct 4320
acagacccaa ttagcagtgg agaaacaaga tcattcacta cccatttctt aacttatccc 4380
aagataggac ttctgtacag ttttggggcc tttgtaagtt attatcttgg caatacaatt 4440
cttcggacta agaaattaac acttgacaat tttttatatt acttaactac tcaaattcat 4500
aatctaccac atcgctcatt gcgaatactt aagccaacat tcaaacatgc aagcgttatg 4560
tcacggttaa tgagtattga tcctcatttt tctatttaca taggcggtgc tgcaggtgac 4620
agaggactct cagatgcggc caggttattt ttgagaacgt ccatttcatc ttttcttaca 4680
tttgtaaaag aatggataat taatcgcgga acaattgtcc ctttatggat agtatatccg 4740
ctagagggtc aaaacccaac acctgtgaat aattttctct atcagatcgt agaactgctg 4800
gtgcatgatt catcaagaca acaggctttt aaaactacca taagtgatca tgtacatcct 4860
cacgacaatc ttgtttacac atgtaagagt acagccagca atttcttcca tgcatcattg 4920
gcgtactgga ggagcagaca cagaaacagc aaccgaaaat acttggcaag agactcttca 4980
actggatcaa gcacaaacaa cagtgatggt catattgaga gaagtcaaga acaaaccacc 5040
agagatccac atgatggcac tgaacggaat ctagtcctac aaatgagcca tgaaataaaa 5100
agaacgacaa ttccacaaga aaacacgcac cagggtccgt cgttccagtc ctttctaagt 5160
gactctgctt gtggtacagc aaatccaaaa ctaaatttcg atcgatcgag acacaatgtg 5220
aaatttcagg atcataactc ggcatccaag agggaaggtc atcaaataat ctcacaccgt 5280
ctagtcctac ctttctttac attatctcaa gggacacgcc aattaacgtc atccaatgag 5340
tcacaaaccc aagacgagat atcaaagtac ttacggcaat tgagatccgt cattgatacc 5400
acagtttatt gtagatttac cggtatagtc tcgtccatgc attacaaact tgatgaggtc 5460
ctttgggaaa tagagagttt caagtcggct gtgacgctag cagagggaga aggtgctggt 5520
gccttactat tgattcagaa ataccaagtt aagaccttat ttttcaacac gctagctact 5580
gagtccagta tagagtcaga aatagtatca ggaatgacta ctcctaggat gcttctacct 5640
gttatgtcaa aattccataa tgaccaaatt gagattattc ttaacaactc agcaagccaa 5700
ataacagaca taacaaatcc tacttggttt aaagaccaaa gagcaaggct acctaagcaa 5760
gtcgaggtta taaccatgga tgcagagaca acagagaata taaacagatc gaaattgtac 5820
gaagctgtat ataaattgat cttacaccat attgatccta gcgtattgaa agcagtggtc 5880
cttaaagtct ttctaagtga tactgagggt atgttatggc taaatgataa tttagccccg 5940
ttttttgcca ctggttattt aattaagcca ataacgtcaa gtgctagatc tagtgagtgg 6000
tatctttgtc tgacgaactt cttatcaact acacgtaaga tgccacacca aaaccatctc 6060
agttgtaaac aggtaatact tacggcattg caactgcaaa ttcaacgaag cccatactgg 6120
ctaagtcatt taactcagta tgctgactgt gagttacatt taagttatat ccgccttggt 6180
tttccatcat tagagaaagt actataccac aggtataacc tcgtcgattc aaaaagaggt 6240
ccactagtct ctatcactca gcacttagca catcttagag cagagattcg agaattaact 6300
aatgattata atcaacagcg acaaagtcgg actcaaacat atcactttat tcgtactgca 6360
aaaggacgaa tcacaaaact agtcaatgat tatttaaaat tctttcttat tgtgcaagca 6420
ttaaaacata atgggacatg gcaagctgag tttaagaaat taccagagtt gattagtgtg 6480
tgcaataggt tctaccatat tagagattgc aattgtgaag aacgtttctt agttcaaacc 6540
ttatatttac atagaatgca ggattctgaa gttaagctta tcgaaaggct gacagggctt 6600
ctgagtttat ttccggatgg tctctacagg tttgattga 6639
<210> 810
<400> 810
000
<210> 811
<400> 811
000
<210> 812
<400> 812
000
<210> 813
<400> 813
000
<210> 814
<400> 814
000
<210> 815
<400> 815
000
<210> 816
<400> 816
000
<210> 817
<400> 817
000
<210> 818
<400> 818
000
<210> 819
<400> 819
000
<210> 820
<400> 820
000
<210> 821
<400> 821
000
<210> 822
<400> 822
000
<210> 823
<400> 823
000
<210> 824
<400> 824
000
<210> 825
<400> 825
000
<210> 826
<400> 826
000
<210> 827
<400> 827
000
<210> 828
<400> 828
000
<210> 829
<400> 829
000
<210> 830
<400> 830
000
<210> 831
<400> 831
000
<210> 832
<400> 832
000
<210> 833
<400> 833
000
<210> 834
<400> 834
000
<210> 835
<400> 835
000
<210> 836
<400> 836
000
<210> 837
<400> 837
000
<210> 838
<400> 838
000
<210> 839
<400> 839
000
<210> 840
<400> 840
000
<210> 841
<400> 841
000
<210> 842
<400> 842
000
<210> 843
<400> 843
000
<210> 844
<400> 844
000
<210> 845
<400> 845
000
<210> 846
<400> 846
000
<210> 847
<400> 847
000
<210> 848
<400> 848
000
<210> 849
<400> 849
000
<210> 850
<400> 850
000
<210> 851
<211> 739
<212> PRT
<213> Zaire ebolavirus
<400> 851
Met Asp Ser Arg Pro Gln Lys Ile Trp Met Ala Pro Ser Leu Thr Glu
1 5 10 15
Ser Asp Met Asp Tyr His Lys Ile Leu Thr Ala Gly Leu Ser Val Gln
20 25 30
Gln Gly Ile Val Arg Gln Arg Val Ile Pro Val Tyr Gln Val Asn Asn
35 40 45
Leu Glu Glu Ile Cys Gln Leu Ile Ile Gln Ala Phe Glu Ala Gly Val
50 55 60
Asp Phe Gln Glu Ser Ala Asp Ser Phe Leu Leu Met Leu Cys Leu His
65 70 75 80
His Ala Tyr Gln Gly Asp Tyr Lys Leu Phe Leu Glu Ser Gly Ala Val
85 90 95
Lys Tyr Leu Glu Gly His Gly Phe Arg Phe Glu Val Lys Lys Arg Asp
100 105 110
Gly Val Lys Arg Leu Glu Glu Leu Leu Pro Ala Val Ser Ser Gly Lys
115 120 125
Asn Ile Lys Arg Thr Leu Ala Ala Met Pro Glu Glu Glu Thr Thr Glu
130 135 140
Ala Asn Ala Gly Gln Phe Leu Ser Phe Ala Ser Leu Phe Leu Pro Lys
145 150 155 160
Leu Val Val Gly Glu Lys Ala Cys Leu Glu Lys Val Gln Arg Gln Ile
165 170 175
Gln Val His Ala Glu Gln Gly Leu Ile Gln Tyr Pro Thr Ala Trp Gln
180 185 190
Ser Val Gly His Met Met Val Ile Phe Arg Leu Met Arg Thr Asn Phe
195 200 205
Leu Ile Lys Phe Leu Leu Ile His Gln Gly Met His Met Val Ala Gly
210 215 220
His Asp Ala Asn Asp Ala Val Ile Ser Asn Ser Val Ala Gln Ala Arg
225 230 235 240
Phe Ser Gly Leu Leu Ile Val Lys Thr Val Leu Asp His Ile Leu Gln
245 250 255
Lys Thr Glu Arg Gly Val Arg Leu His Pro Leu Ala Arg Thr Ala Lys
260 265 270
Val Lys Asn Glu Val Asn Ser Phe Lys Ala Ala Leu Ser Ser Leu Ala
275 280 285
Lys His Gly Glu Tyr Ala Pro Phe Ala Arg Leu Leu Asn Leu Ser Gly
290 295 300
Val Asn Asn Leu Glu His Gly Leu Phe Pro Gln Leu Ser Ala Ile Ala
305 310 315 320
Leu Gly Val Ala Thr Ala His Gly Ser Thr Leu Ala Gly Val Asn Val
325 330 335
Gly Glu Gln Tyr Gln Gln Leu Arg Glu Ala Ala Thr Glu Ala Glu Lys
340 345 350
Gln Leu Gln Gln Tyr Ala Glu Ser Arg Glu Leu Asp His Leu Gly Leu
355 360 365
Asp Asp Gln Glu Lys Lys Ile Leu Met Asn Phe His Gln Lys Lys Asn
370 375 380
Glu Ile Ser Phe Gln Gln Thr Asn Ala Met Val Thr Leu Arg Lys Glu
385 390 395 400
Arg Leu Ala Lys Leu Thr Glu Ala Ile Thr Ala Ala Ser Leu Pro Lys
405 410 415
Thr Ser Gly His Tyr Asp Asp Asp Asp Asp Ile Pro Phe Pro Gly Pro
420 425 430
Ile Asn Asp Asp Asp Asn Pro Gly His Gln Asp Asp Asp Pro Thr Asp
435 440 445
Ser Gln Asp Thr Thr Ile Pro Asp Val Val Val Asp Pro Asp Asp Gly
450 455 460
Ser Tyr Gly Glu Tyr Gln Ser Tyr Ser Glu Asn Gly Met Asn Ala Pro
465 470 475 480
Asp Asp Leu Val Leu Phe Asp Leu Asp Glu Asp Asp Glu Asp Thr Lys
485 490 495
Pro Val Pro Asn Arg Ser Thr Lys Gly Gly Gln Gln Lys Asn Ser Gln
500 505 510
Lys Gly Gln His Ile Glu Gly Arg Gln Thr Gln Ser Arg Pro Ile Gln
515 520 525
Asn Val Pro Gly Pro His Arg Thr Ile His His Ala Ser Ala Pro Leu
530 535 540
Thr Asp Asn Asp Arg Arg Asn Glu Pro Ser Gly Ser Thr Ser Pro Arg
545 550 555 560
Met Leu Thr Pro Ile Asn Glu Glu Ala Asp Pro Leu Asp Asp Ala Asp
565 570 575
Asp Glu Thr Ser Ser Leu Pro Pro Leu Glu Ser Asp Asp Glu Glu Gln
580 585 590
Asp Arg Asp Gly Thr Ser Asn Arg Thr Pro Thr Val Ala Pro Pro Ala
595 600 605
Pro Val Tyr Arg Asp His Ser Glu Lys Lys Glu Leu Pro Gln Asp Glu
610 615 620
Gln Gln Asp Gln Asp His Thr Gln Glu Ala Arg Asn Gln Asp Ser Asp
625 630 635 640
Asn Thr Gln Ser Glu His Ser Phe Glu Glu Met Tyr Arg His Ile Leu
645 650 655
Arg Ser Gln Gly Pro Phe Asp Ala Val Leu Tyr Tyr His Met Met Lys
660 665 670
Asp Glu Pro Val Val Phe Ser Thr Ser Asp Gly Lys Glu Tyr Thr Tyr
675 680 685
Pro Asp Ser Leu Glu Glu Glu Tyr Pro Pro Trp Leu Thr Glu Lys Glu
690 695 700
Ala Met Asn Glu Glu Asn Arg Phe Val Thr Leu Asp Gly Gln Gln Phe
705 710 715 720
Tyr Trp Pro Val Met Asn His Lys Asn Lys Phe Met Ala Ile Leu Gln
725 730 735
His His Gln
<210> 852
<211> 340
<212> PRT
<213> Zaire ebolavirus
<400> 852
Met Thr Thr Arg Thr Lys Gly Arg Gly His Thr Ala Ala Thr Thr Gln
1 5 10 15
Asn Asp Arg Met Pro Gly Pro Glu Leu Ser Gly Trp Ile Ser Glu Gln
20 25 30
Leu Met Thr Gly Arg Ile Pro Val Ser Asp Ile Phe Cys Asp Ile Glu
35 40 45
Asn Asn Pro Gly Leu Cys Tyr Ala Ser Gln Met Gln Gln Thr Lys Pro
50 55 60
Asn Pro Lys Thr Arg Asn Ser Gln Thr Gln Thr Asp Pro Ile Cys Asn
65 70 75 80
His Ser Phe Glu Glu Val Val Gln Thr Leu Ala Ser Leu Ala Thr Val
85 90 95
Val Gln Gln Gln Thr Ile Ala Ser Glu Ser Leu Glu Gln Arg Ile Thr
100 105 110
Ser Leu Glu Asn Gly Leu Lys Pro Val Tyr Asp Met Ala Lys Thr Ile
115 120 125
Ser Ser Leu Asn Arg Val Cys Ala Glu Met Val Ala Lys Tyr Asp Leu
130 135 140
Leu Val Met Thr Thr Gly Arg Ala Thr Ala Thr Ala Ala Ala Thr Glu
145 150 155 160
Ala Tyr Trp Ala Glu His Gly Gln Pro Pro Pro Gly Pro Ser Leu Tyr
165 170 175
Glu Glu Ser Ala Ile Arg Gly Lys Ile Glu Ser Arg Asp Glu Thr Val
180 185 190
Pro Gln Ser Val Arg Glu Ala Phe Asn Asn Leu Asn Ser Thr Thr Ser
195 200 205
Leu Thr Glu Glu Asn Phe Gly Lys Pro Asp Ile Ser Ala Lys Asp Leu
210 215 220
Arg Asn Ile Met Tyr Asp His Leu Pro Gly Phe Gly Thr Ala Phe His
225 230 235 240
Gln Leu Val Gln Val Ile Cys Lys Leu Gly Lys Asp Ser Asn Ser Leu
245 250 255
Asp Ile Ile His Ala Glu Phe Gln Ala Ser Leu Ala Glu Gly Asp Ser
260 265 270
Pro Gln Cys Ala Leu Ile Gln Ile Thr Lys Arg Val Pro Ile Phe Gln
275 280 285
Asp Ala Ala Pro Pro Val Ile His Ile Arg Ser Arg Gly Asp Ile Pro
290 295 300
Arg Ala Cys Gln Lys Ser Leu Arg Pro Val Pro Pro Ser Pro Lys Ile
305 310 315 320
Asp Arg Gly Trp Val Cys Val Phe Gln Leu Gln Asp Gly Lys Thr Leu
325 330 335
Gly Leu Lys Ile
340
<210> 853
<211> 326
<212> PRT
<213> Zaire ebolavirus
<400> 853
Met Arg Arg Val Ile Leu Pro Thr Ala Pro Pro Glu Tyr Met Glu Ala
1 5 10 15
Ile Tyr Pro Val Arg Ser Asn Ser Thr Ile Ala Arg Gly Gly Asn Ser
20 25 30
Asn Thr Gly Phe Leu Thr Pro Glu Ser Val Asn Gly Asp Thr Pro Ser
35 40 45
Asn Pro Leu Arg Pro Ile Ala Asp Asp Thr Ile Asp His Ala Ser His
50 55 60
Thr Pro Gly Ser Val Ser Ser Ala Phe Ile Leu Glu Ala Met Val Asn
65 70 75 80
Val Ile Ser Gly Pro Lys Val Leu Met Lys Gln Ile Pro Ile Trp Leu
85 90 95
Pro Leu Gly Val Ala Asp Gln Lys Thr Tyr Ser Phe Asp Ser Thr Thr
100 105 110
Ala Ala Ile Met Leu Ala Ser Tyr Thr Ile Thr His Phe Gly Lys Ala
115 120 125
Thr Asn Pro Leu Val Arg Val Asn Arg Leu Gly Pro Gly Ile Pro Asp
130 135 140
His Pro Leu Arg Leu Leu Arg Ile Gly Asn Gln Ala Phe Leu Gln Glu
145 150 155 160
Phe Val Leu Pro Pro Val Gln Leu Pro Gln Tyr Phe Thr Phe Asp Leu
165 170 175
Thr Ala Leu Lys Leu Ile Thr Gln Pro Leu Pro Ala Ala Thr Trp Thr
180 185 190
Asp Asp Thr Pro Thr Gly Ser Asn Gly Ala Leu Arg Pro Gly Ile Ser
195 200 205
Phe His Pro Lys Leu Arg Pro Ile Leu Leu Pro Asn Lys Ser Gly Lys
210 215 220
Lys Gly Asn Ser Ala Asp Leu Thr Ser Pro Glu Lys Ile Gln Ala Ile
225 230 235 240
Met Thr Ser Leu Gln Asp Phe Lys Ile Val Pro Ile Asp Pro Thr Lys
245 250 255
Asn Ile Met Gly Ile Glu Val Pro Glu Thr Leu Val His Lys Leu Thr
260 265 270
Gly Lys Lys Val Thr Ser Lys Asn Gly Gln Pro Ile Ile Pro Val Leu
275 280 285
Leu Pro Lys Tyr Ile Gly Leu Asp Pro Val Ala Pro Gly Asp Leu Thr
290 295 300
Met Val Ile Thr Gln Asp Cys Asp Thr Cys His Ser Pro Ala Ser Leu
305 310 315 320
Pro Ala Val Ile Glu Lys
325
<210> 854
<211> 676
<212> PRT
<213> Zaire ebolavirus
<400> 854
Met Gly Val Thr Gly Ile Leu Gln Leu Pro Arg Asp Arg Phe Lys Arg
1 5 10 15
Thr Ser Phe Phe Leu Trp Val Ile Ile Leu Phe Gln Arg Thr Phe Ser
20 25 30
Ile Pro Leu Gly Val Ile His Asn Ser Thr Leu Gln Val Ser Asp Val
35 40 45
Asp Lys Leu Val Cys Arg Asp Lys Leu Ser Ser Thr Asn Gln Leu Arg
50 55 60
Ser Val Gly Leu Asn Leu Glu Gly Asn Gly Val Ala Thr Asp Val Pro
65 70 75 80
Ser Ala Thr Lys Arg Trp Gly Phe Arg Ser Gly Val Pro Pro Lys Val
85 90 95
Val Asn Tyr Glu Ala Gly Glu Trp Ala Glu Asn Cys Tyr Asn Leu Glu
100 105 110
Ile Lys Lys Pro Asp Gly Ser Glu Cys Leu Pro Ala Ala Pro Asp Gly
115 120 125
Ile Arg Gly Phe Pro Arg Cys Arg Tyr Val His Lys Val Ser Gly Thr
130 135 140
Gly Pro Cys Ala Gly Asp Phe Ala Phe His Lys Glu Gly Ala Phe Phe
145 150 155 160
Leu Tyr Asp Arg Leu Ala Ser Thr Val Ile Tyr Arg Gly Thr Thr Phe
165 170 175
Ala Glu Gly Val Val Ala Phe Leu Ile Leu Pro Gln Ala Lys Lys Asp
180 185 190
Phe Phe Ser Ser His Pro Leu Arg Glu Pro Val Asn Ala Thr Glu Asp
195 200 205
Pro Ser Ser Gly Tyr Tyr Ser Thr Thr Ile Arg Tyr Gln Ala Thr Gly
210 215 220
Phe Gly Thr Asn Glu Thr Glu Tyr Leu Phe Glu Val Asp Asn Leu Thr
225 230 235 240
Tyr Val Gln Leu Glu Ser Arg Phe Thr Pro Gln Phe Leu Leu Gln Leu
245 250 255
Asn Glu Thr Ile Tyr Thr Ser Gly Lys Arg Ser Asn Thr Thr Gly Lys
260 265 270
Leu Ile Trp Lys Val Asn Pro Glu Ile Asp Thr Thr Ile Gly Glu Trp
275 280 285
Ala Phe Trp Glu Thr Lys Lys Asn Leu Thr Arg Lys Ile Arg Ser Glu
290 295 300
Glu Leu Ser Phe Thr Val Val Ser Asn Gly Ala Lys Asn Ile Ser Gly
305 310 315 320
Gln Ser Pro Ala Arg Thr Ser Ser Asp Pro Gly Thr Asn Thr Thr Thr
325 330 335
Glu Asp His Lys Ile Met Ala Ser Glu Asn Ser Ser Ala Met Val Gln
340 345 350
Val His Ser Gln Gly Arg Glu Ala Ala Val Ser His Leu Thr Thr Leu
355 360 365
Ala Thr Ile Ser Thr Ser Pro Gln Ser Leu Thr Thr Lys Pro Gly Pro
370 375 380
Asp Asn Ser Thr His Asn Thr Pro Val Tyr Lys Leu Asp Ile Ser Glu
385 390 395 400
Ala Thr Gln Val Glu Gln His His Arg Arg Thr Asp Asn Asp Ser Thr
405 410 415
Ala Ser Asp Thr Pro Ser Ala Thr Thr Ala Ala Gly Pro Pro Lys Ala
420 425 430
Glu Asn Thr Asn Thr Ser Lys Ser Thr Asp Phe Leu Asp Pro Ala Thr
435 440 445
Thr Thr Ser Pro Gln Asn His Ser Glu Thr Ala Gly Asn Asn Asn Thr
450 455 460
His His Gln Asp Thr Gly Glu Glu Ser Ala Ser Ser Gly Lys Leu Gly
465 470 475 480
Leu Ile Thr Asn Thr Ile Ala Gly Val Ala Gly Leu Ile Thr Gly Gly
485 490 495
Arg Arg Thr Arg Arg Glu Ala Ile Val Asn Ala Gln Pro Lys Cys Asn
500 505 510
Pro Asn Leu His Tyr Trp Thr Thr Gln Asp Glu Gly Ala Ala Ile Gly
515 520 525
Leu Ala Trp Ile Pro Tyr Phe Gly Pro Ala Ala Glu Gly Ile Tyr Ile
530 535 540
Glu Gly Leu Met His Asn Gln Asp Gly Leu Ile Cys Gly Leu Arg Gln
545 550 555 560
Leu Ala Asn Glu Thr Thr Gln Ala Leu Gln Leu Phe Leu Arg Ala Thr
565 570 575
Thr Glu Leu Arg Thr Phe Ser Ile Leu Asn Arg Lys Ala Ile Asp Phe
580 585 590
Leu Leu Gln Arg Trp Gly Gly Thr Cys His Ile Leu Gly Pro Asp Cys
595 600 605
Cys Ile Glu Pro His Asp Trp Thr Lys Asn Ile Thr Asp Lys Ile Asp
610 615 620
Gln Ile Ile His Asp Phe Val Asp Lys Thr Leu Pro Asp Gln Gly Asp
625 630 635 640
Asn Asp Asn Trp Trp Thr Gly Trp Arg Gln Trp Ile Pro Ala Gly Ile
645 650 655
Gly Val Thr Gly Val Ile Ile Ala Val Ile Ala Leu Phe Cys Ile Cys
660 665 670
Lys Phe Val Phe
675
<210> 855
<211> 364
<212> PRT
<213> Zaire ebolavirus
<400> 855
Met Gly Val Thr Gly Ile Leu Gln Leu Pro Arg Asp Arg Phe Lys Arg
1 5 10 15
Thr Ser Phe Phe Leu Trp Val Ile Ile Leu Phe Gln Arg Thr Phe Ser
20 25 30
Ile Pro Leu Gly Val Ile His Asn Ser Thr Leu Gln Val Ser Asp Val
35 40 45
Asp Lys Leu Val Cys Arg Asp Lys Leu Ser Ser Thr Asn Gln Leu Arg
50 55 60
Ser Val Gly Leu Asn Leu Glu Gly Asn Gly Val Ala Thr Asp Val Pro
65 70 75 80
Ser Ala Thr Lys Arg Trp Gly Phe Arg Ser Gly Val Pro Pro Lys Val
85 90 95
Val Asn Tyr Glu Ala Gly Glu Trp Ala Glu Asn Cys Tyr Asn Leu Glu
100 105 110
Ile Lys Lys Pro Asp Gly Ser Glu Cys Leu Pro Ala Ala Pro Asp Gly
115 120 125
Ile Arg Gly Phe Pro Arg Cys Arg Tyr Val His Lys Val Ser Gly Thr
130 135 140
Gly Pro Cys Ala Gly Asp Phe Ala Phe His Lys Glu Gly Ala Phe Phe
145 150 155 160
Leu Tyr Asp Arg Leu Ala Ser Thr Val Ile Tyr Arg Gly Thr Thr Phe
165 170 175
Ala Glu Gly Val Val Ala Phe Leu Ile Leu Pro Gln Ala Lys Lys Asp
180 185 190
Phe Phe Ser Ser His Pro Leu Arg Glu Pro Val Asn Ala Thr Glu Asp
195 200 205
Pro Ser Ser Gly Tyr Tyr Ser Thr Thr Ile Arg Tyr Gln Ala Thr Gly
210 215 220
Phe Gly Thr Asn Glu Thr Glu Tyr Leu Phe Glu Val Asp Asn Leu Thr
225 230 235 240
Tyr Val Gln Leu Glu Ser Arg Phe Thr Pro Gln Phe Leu Leu Gln Leu
245 250 255
Asn Glu Thr Ile Tyr Thr Ser Gly Lys Arg Ser Asn Thr Thr Gly Lys
260 265 270
Leu Ile Trp Lys Val Asn Pro Glu Ile Asp Thr Thr Ile Gly Glu Trp
275 280 285
Ala Phe Trp Glu Thr Lys Lys Thr Ser Leu Glu Lys Phe Ala Val Lys
290 295 300
Ser Cys Leu Ser Gln Leu Tyr Gln Thr Glu Pro Lys Thr Ser Val Val
305 310 315 320
Arg Val Arg Arg Glu Leu Leu Pro Thr Gln Gly Pro Thr Gln Gln Leu
325 330 335
Lys Thr Thr Lys Ser Trp Leu Gln Lys Ile Pro Leu Gln Trp Phe Lys
340 345 350
Cys Thr Val Lys Glu Gly Lys Leu Gln Cys Arg Ile
355 360
<210> 856
<211> 297
<212> PRT
<213> Zaire ebolavirus
<400> 856
Met Gly Val Thr Gly Ile Leu Gln Leu Pro Arg Asp Arg Phe Lys Arg
1 5 10 15
Thr Ser Phe Phe Leu Trp Val Ile Ile Leu Phe Gln Arg Thr Phe Ser
20 25 30
Ile Pro Leu Gly Val Ile His Asn Ser Thr Leu Gln Val Ser Asp Val
35 40 45
Asp Lys Leu Val Cys Arg Asp Lys Leu Ser Ser Thr Asn Gln Leu Arg
50 55 60
Ser Val Gly Leu Asn Leu Glu Gly Asn Gly Val Ala Thr Asp Val Pro
65 70 75 80
Ser Ala Thr Lys Arg Trp Gly Phe Arg Ser Gly Val Pro Pro Lys Val
85 90 95
Val Asn Tyr Glu Ala Gly Glu Trp Ala Glu Asn Cys Tyr Asn Leu Glu
100 105 110
Ile Lys Lys Pro Asp Gly Ser Glu Cys Leu Pro Ala Ala Pro Asp Gly
115 120 125
Ile Arg Gly Phe Pro Arg Cys Arg Tyr Val His Lys Val Ser Gly Thr
130 135 140
Gly Pro Cys Ala Gly Asp Phe Ala Phe His Lys Glu Gly Ala Phe Phe
145 150 155 160
Leu Tyr Asp Arg Leu Ala Ser Thr Val Ile Tyr Arg Gly Thr Thr Phe
165 170 175
Ala Glu Gly Val Val Ala Phe Leu Ile Leu Pro Gln Ala Lys Lys Asp
180 185 190
Phe Phe Ser Ser His Pro Leu Arg Glu Pro Val Asn Ala Thr Glu Asp
195 200 205
Pro Ser Ser Gly Tyr Tyr Ser Thr Thr Ile Arg Tyr Gln Ala Thr Gly
210 215 220
Phe Gly Thr Asn Glu Thr Glu Tyr Leu Phe Glu Val Asp Asn Leu Thr
225 230 235 240
Tyr Val Gln Leu Glu Ser Arg Phe Thr Pro Gln Phe Leu Leu Gln Leu
245 250 255
Asn Glu Thr Ile Tyr Thr Ser Gly Lys Arg Ser Asn Thr Thr Gly Lys
260 265 270
Leu Ile Trp Lys Val Asn Pro Glu Ile Asp Thr Thr Ile Gly Glu Trp
275 280 285
Ala Phe Trp Glu Thr Lys Lys Pro His
290 295
<210> 857
<211> 288
<212> PRT
<213> Zaire ebolavirus
<400> 857
Met Glu Ala Ser Tyr Glu Arg Gly Arg Pro Arg Ala Ala Arg Gln His
1 5 10 15
Ser Arg Asp Gly His Asp His His Val Arg Ala Arg Ser Ser Ser Arg
20 25 30
Glu Asn Tyr Arg Gly Glu Tyr Arg Gln Ser Arg Ser Ala Ser Gln Val
35 40 45
Arg Val Pro Thr Val Phe His Lys Lys Arg Val Glu Pro Leu Thr Val
50 55 60
Pro Pro Ala Pro Lys Asp Ile Cys Pro Thr Leu Lys Lys Gly Phe Leu
65 70 75 80
Cys Asp Ser Ser Phe Cys Lys Lys Asp His Gln Leu Glu Ser Leu Thr
85 90 95
Asp Arg Glu Leu Leu Leu Leu Ile Ala Arg Lys Thr Cys Gly Ser Val
100 105 110
Glu Gln Gln Leu Asn Ile Thr Ala Pro Lys Asp Ser Arg Leu Ala Asn
115 120 125
Pro Thr Ala Asp Asp Phe Gln Gln Glu Glu Gly Pro Lys Ile Thr Leu
130 135 140
Leu Thr Leu Ile Lys Thr Ala Glu His Trp Ala Arg Gln Asp Ile Arg
145 150 155 160
Thr Ile Glu Asp Ser Lys Leu Arg Ala Leu Leu Thr Leu Cys Ala Val
165 170 175
Met Thr Arg Lys Phe Ser Lys Ser Gln Leu Ser Leu Leu Cys Glu Thr
180 185 190
His Leu Arg Arg Glu Gly Leu Gly Gln Asp Gln Ala Glu Pro Val Leu
195 200 205
Glu Val Tyr Gln Arg Leu His Ser Asp Lys Gly Gly Ser Phe Glu Ala
210 215 220
Ala Leu Trp Gln Gln Trp Asp Arg Gln Ser Leu Ile Met Phe Ile Thr
225 230 235 240
Ala Phe Leu Asn Ile Ala Leu Gln Leu Pro Cys Glu Ser Ser Ala Val
245 250 255
Val Val Ser Gly Leu Arg Thr Leu Val Pro Gln Ser Asp Asn Glu Glu
260 265 270
Ala Ser Thr Asn Pro Gly Thr Cys Ser Trp Ser Asp Glu Gly Thr Pro
275 280 285
<210> 858
<211> 251
<212> PRT
<213> Zaire ebolavirus
<400> 858
Met Ala Lys Ala Thr Gly Arg Tyr Asn Leu Ile Ser Pro Lys Lys Asp
1 5 10 15
Leu Glu Lys Gly Val Val Leu Ser Asp Leu Cys Asn Phe Leu Val Ser
20 25 30
Gln Thr Ile Gln Gly Trp Lys Val Tyr Trp Ala Gly Ile Glu Phe Asp
35 40 45
Val Thr His Lys Gly Met Ala Leu Leu His Arg Leu Lys Thr Asn Asp
50 55 60
Phe Ala Pro Ala Trp Ser Met Thr Arg Asn Leu Phe Pro His Leu Phe
65 70 75 80
Gln Asn Pro Asn Ser Thr Ile Glu Ser Pro Leu Trp Ala Leu Arg Val
85 90 95
Ile Leu Ala Ala Gly Ile Gln Asp Gln Leu Ile Asp Gln Ser Leu Ile
100 105 110
Glu Pro Leu Ala Gly Ala Leu Gly Leu Ile Ser Asp Trp Leu Leu Thr
115 120 125
Thr Asn Thr Asn His Phe Asn Met Arg Thr Gln Arg Val Lys Glu Gln
130 135 140
Leu Ser Leu Lys Met Leu Ser Leu Ile Arg Ser Asn Ile Leu Lys Phe
145 150 155 160
Ile Asn Lys Leu Asp Ala Leu His Val Val Asn Tyr Asn Gly Leu Leu
165 170 175
Ser Ser Ile Glu Ile Gly Thr Gln Asn His Thr Ile Ile Ile Thr Arg
180 185 190
Thr Asn Met Gly Phe Leu Val Glu Leu Gln Glu Pro Asp Lys Ser Ala
195 200 205
Met Asn Arg Met Lys Pro Gly Pro Ala Lys Phe Ser Leu Leu His Glu
210 215 220
Ser Thr Leu Lys Ala Phe Thr Gln Gly Ser Ser Thr Arg Met Gln Ser
225 230 235 240
Leu Ile Leu Glu Phe Asn Ser Ser Leu Ala Ile
245 250
<210> 859
<211> 2212
<212> PRT
<213> Zaire ebolavirus
<400> 859
Met Ala Thr Gln His Thr Gln Tyr Pro Asp Ala Arg Leu Ser Ser Pro
1 5 10 15
Ile Val Leu Asp Gln Cys Asp Leu Val Thr Arg Ala Cys Gly Leu Tyr
20 25 30
Ser Ser Tyr Ser Leu Asn Pro Gln Leu Arg Asn Cys Lys Leu Pro Lys
35 40 45
His Ile Tyr Arg Leu Lys Tyr Asp Val Thr Val Thr Lys Phe Leu Ser
50 55 60
Asp Val Pro Val Ala Thr Leu Pro Ile Asp Phe Ile Val Pro Val Leu
65 70 75 80
Leu Lys Ala Leu Ser Gly Asn Gly Phe Cys Pro Val Glu Pro Arg Cys
85 90 95
Gln Gln Phe Leu Asp Glu Ile Ile Lys Tyr Thr Met Gln Asp Ala Leu
100 105 110
Phe Leu Lys Tyr Tyr Leu Lys Asn Val Gly Ala Gln Glu Asp Cys Val
115 120 125
Asp Glu His Phe Gln Glu Lys Ile Leu Ser Ser Ile Gln Gly Asn Glu
130 135 140
Phe Leu His Gln Met Phe Phe Trp Tyr Asp Leu Ala Ile Leu Thr Arg
145 150 155 160
Arg Gly Arg Leu Asn Arg Gly Asn Ser Arg Ser Thr Trp Phe Val His
165 170 175
Asp Asp Leu Ile Asp Ile Leu Gly Tyr Gly Asp Tyr Val Phe Trp Lys
180 185 190
Ile Pro Ile Ser Met Leu Pro Leu Asn Thr Gln Gly Ile Pro His Ala
195 200 205
Ala Met Asp Trp Tyr Gln Ala Ser Val Phe Lys Glu Ala Val Gln Gly
210 215 220
His Thr His Ile Val Ser Val Ser Thr Ala Asp Val Leu Ile Met Cys
225 230 235 240
Lys Asp Leu Ile Thr Cys Arg Phe Asn Thr Thr Leu Ile Ser Lys Ile
245 250 255
Ala Glu Ile Glu Asp Pro Val Cys Ser Asp Tyr Pro Asn Phe Lys Ile
260 265 270
Val Ser Met Leu Tyr Gln Ser Gly Asp Tyr Leu Leu Ser Ile Leu Gly
275 280 285
Ser Asp Gly Tyr Lys Ile Ile Lys Phe Leu Glu Pro Leu Cys Leu Ala
290 295 300
Lys Ile Gln Leu Cys Ser Lys Tyr Thr Glu Arg Lys Gly Arg Phe Leu
305 310 315 320
Thr Gln Met His Leu Ala Val Asn His Thr Leu Glu Glu Ile Thr Glu
325 330 335
Met Arg Ala Leu Lys Pro Ser Gln Ala Gln Lys Ile Arg Glu Phe His
340 345 350
Arg Thr Leu Ile Arg Leu Glu Met Thr Pro Gln Gln Leu Cys Glu Leu
355 360 365
Phe Ser Ile Gln Lys His Trp Gly His Pro Val Leu His Ser Glu Thr
370 375 380
Ala Ile Gln Lys Val Lys Lys His Ala Thr Val Leu Lys Ala Leu Arg
385 390 395 400
Pro Ile Val Ile Phe Glu Thr Tyr Cys Val Phe Lys Tyr Ser Ile Ala
405 410 415
Lys His Tyr Phe Asp Ser Gln Gly Ser Trp Tyr Ser Val Thr Ser Asp
420 425 430
Arg Asn Leu Thr Pro Gly Leu Asn Ser Tyr Ile Lys Arg Asn Gln Phe
435 440 445
Pro Pro Leu Pro Met Ile Lys Glu Leu Leu Trp Glu Phe Tyr His Leu
450 455 460
Asp His Pro Pro Leu Phe Ser Thr Lys Ile Ile Ser Asp Leu Ser Ile
465 470 475 480
Phe Ile Lys Asp Arg Ala Thr Ala Val Glu Arg Thr Cys Trp Asp Ala
485 490 495
Val Phe Glu Pro Asn Val Leu Gly Tyr Asn Pro Pro His Lys Phe Ser
500 505 510
Thr Lys Arg Val Pro Glu Gln Phe Leu Glu Gln Glu Asn Phe Ser Ile
515 520 525
Glu Asn Val Leu Ser Tyr Ala Gln Lys Leu Glu Tyr Leu Leu Pro Gln
530 535 540
Tyr Arg Asn Phe Ser Phe Ser Leu Lys Glu Lys Glu Leu Asn Val Gly
545 550 555 560
Arg Thr Phe Gly Lys Leu Pro Tyr Pro Thr Arg Asn Val Gln Thr Leu
565 570 575
Cys Glu Ala Leu Leu Ala Asp Gly Leu Ala Lys Ala Phe Pro Ser Asn
580 585 590
Met Met Val Val Thr Glu Arg Glu Gln Lys Glu Ser Leu Leu His Gln
595 600 605
Ala Ser Trp His His Thr Ser Asp Asp Phe Gly Glu His Ala Thr Val
610 615 620
Arg Gly Ser Ser Phe Val Thr Asp Leu Glu Lys Tyr Asn Leu Ala Phe
625 630 635 640
Arg Tyr Glu Phe Thr Ala Pro Phe Ile Glu Tyr Cys Asn Arg Cys Tyr
645 650 655
Gly Val Lys Asn Val Phe Asn Trp Met His Tyr Thr Ile Pro Gln Cys
660 665 670
Tyr Met His Val Ser Asp Tyr Tyr Asn Pro Pro His Asn Leu Thr Leu
675 680 685
Glu Asn Arg Asp Asn Pro Pro Glu Gly Pro Ser Ser Tyr Arg Gly His
690 695 700
Met Gly Gly Ile Glu Gly Leu Gln Gln Lys Leu Trp Thr Ser Ile Ser
705 710 715 720
Cys Ala Gln Ile Ser Leu Val Glu Ile Lys Thr Gly Phe Lys Leu Arg
725 730 735
Ser Ala Val Met Gly Asp Asn Gln Cys Ile Thr Val Leu Ser Val Phe
740 745 750
Pro Leu Glu Thr Asp Ala Asp Glu Gln Glu Gln Ser Ala Glu Asp Asn
755 760 765
Ala Ala Arg Val Ala Ala Ser Leu Ala Lys Val Thr Ser Ala Cys Gly
770 775 780
Ile Phe Leu Lys Pro Asp Glu Thr Phe Val His Ser Gly Phe Ile Tyr
785 790 795 800
Phe Gly Lys Lys Gln Tyr Leu Asn Gly Val Gln Leu Pro Gln Ser Leu
805 810 815
Lys Thr Ala Thr Arg Met Ala Pro Leu Ser Asp Ala Ile Phe Asp Asp
820 825 830
Leu Gln Gly Thr Leu Ala Ser Ile Gly Thr Ala Phe Glu Arg Ser Ile
835 840 845
Ser Glu Thr Arg His Ile Phe Pro Cys Arg Ile Thr Ala Ala Phe His
850 855 860
Thr Phe Phe Ser Val Arg Ile Leu Gln Tyr His His Leu Gly Phe Asn
865 870 875 880
Lys Gly Phe Asp Leu Gly Gln Leu Thr Leu Gly Lys Pro Leu Asp Phe
885 890 895
Gly Thr Ile Ser Leu Ala Leu Ala Val Pro Gln Val Leu Gly Gly Leu
900 905 910
Ser Phe Leu Asn Pro Glu Lys Cys Phe Tyr Arg Asn Leu Gly Asp Pro
915 920 925
Val Thr Ser Gly Leu Phe Gln Leu Lys Thr Tyr Leu Arg Met Ile Glu
930 935 940
Met Asp Asp Leu Phe Leu Pro Leu Ile Ala Lys Asn Pro Gly Asn Cys
945 950 955 960
Thr Ala Ile Asp Phe Val Leu Asn Pro Ser Gly Leu Asn Val Pro Gly
965 970 975
Ser Gln Asp Leu Thr Ser Phe Leu Arg Gln Ile Val Arg Arg Thr Ile
980 985 990
Thr Leu Ser Ala Lys Asn Lys Leu Ile Asn Thr Leu Phe His Ala Ser
995 1000 1005
Ala Asp Phe Glu Asp Glu Met Val Cys Lys Trp Leu Leu Ser Ser
1010 1015 1020
Thr Pro Val Met Ser Arg Phe Ala Ala Asp Ile Phe Ser Arg Thr
1025 1030 1035
Pro Ser Gly Lys Arg Leu Gln Ile Leu Gly Tyr Leu Glu Gly Thr
1040 1045 1050
Arg Thr Leu Leu Ala Ser Lys Ile Ile Asn Asn Asn Thr Glu Thr
1055 1060 1065
Pro Val Leu Asp Arg Leu Arg Lys Ile Thr Leu Gln Arg Trp Ser
1070 1075 1080
Leu Trp Phe Ser Tyr Leu Asp His Cys Asp Asn Ile Leu Ala Glu
1085 1090 1095
Ala Leu Thr Gln Ile Thr Cys Thr Val Asp Leu Ala Gln Ile Leu
1100 1105 1110
Arg Glu Tyr Ser Trp Ala His Ile Leu Glu Gly Arg Pro Leu Ile
1115 1120 1125
Gly Ala Thr Leu Pro Cys Met Ile Glu Gln Phe Lys Val Phe Trp
1130 1135 1140
Leu Lys Pro Tyr Glu Gln Cys Pro Gln Cys Ser Asn Ala Lys Gln
1145 1150 1155
Pro Gly Gly Lys Pro Phe Val Ser Val Ala Val Lys Lys His Ile
1160 1165 1170
Val Ser Ala Trp Pro Asn Ala Ser Arg Ile Ser Trp Thr Ile Gly
1175 1180 1185
Asp Gly Ile Pro Tyr Ile Gly Ser Arg Thr Glu Asp Lys Ile Gly
1190 1195 1200
Gln Pro Ala Ile Lys Pro Lys Cys Pro Ser Ala Ala Leu Arg Glu
1205 1210 1215
Ala Ile Glu Leu Ala Ser Arg Leu Thr Trp Val Thr Gln Gly Ser
1220 1225 1230
Ser Asn Ser Asp Leu Leu Ile Lys Pro Phe Leu Glu Ala Arg Val
1235 1240 1245
Asn Leu Ser Val Gln Glu Ile Leu Gln Met Thr Pro Ser His Tyr
1250 1255 1260
Ser Gly Asn Ile Val His Arg Tyr Asn Asp Gln Tyr Ser Pro His
1265 1270 1275
Ser Phe Met Ala Asn Arg Met Ser Asn Ser Ala Thr Arg Leu Ile
1280 1285 1290
Val Ser Thr Asn Thr Leu Gly Glu Phe Ser Gly Gly Gly Gln Ser
1295 1300 1305
Ala Arg Asp Ser Asn Ile Ile Phe Gln Asn Val Ile Asn Tyr Ala
1310 1315 1320
Val Ala Leu Phe Asp Ile Lys Phe Arg Asn Thr Glu Ala Thr Asp
1325 1330 1335
Ile Gln Tyr Asn Arg Ala His Leu His Leu Thr Lys Cys Cys Thr
1340 1345 1350
Arg Glu Val Pro Ala Gln Tyr Leu Thr Tyr Thr Ser Thr Leu Asp
1355 1360 1365
Leu Asp Leu Thr Arg Tyr Arg Glu Asn Glu Leu Ile Tyr Asp Ser
1370 1375 1380
Asn Pro Leu Lys Gly Gly Leu Asn Cys Asn Ile Ser Phe Asp Asn
1385 1390 1395
Pro Phe Phe Gln Gly Lys Arg Leu Asn Ile Ile Glu Asp Asp Leu
1400 1405 1410
Ile Arg Leu Pro His Leu Ser Gly Trp Glu Leu Ala Lys Thr Ile
1415 1420 1425
Met Gln Ser Ile Ile Ser Asp Ser Asn Asn Ser Ser Thr Asp Pro
1430 1435 1440
Ile Ser Ser Gly Glu Thr Arg Ser Phe Thr Thr His Phe Leu Thr
1445 1450 1455
Tyr Pro Lys Ile Gly Leu Leu Tyr Ser Phe Gly Ala Phe Val Ser
1460 1465 1470
Tyr Tyr Leu Gly Asn Thr Ile Leu Arg Thr Lys Lys Leu Thr Leu
1475 1480 1485
Asp Asn Phe Leu Tyr Tyr Leu Thr Thr Gln Ile His Asn Leu Pro
1490 1495 1500
His Arg Ser Leu Arg Ile Leu Lys Pro Thr Phe Lys His Ala Ser
1505 1510 1515
Val Met Ser Arg Leu Met Ser Ile Asp Pro His Phe Ser Ile Tyr
1520 1525 1530
Ile Gly Gly Ala Ala Gly Asp Arg Gly Leu Ser Asp Ala Ala Arg
1535 1540 1545
Leu Phe Leu Arg Thr Ser Ile Ser Ser Phe Leu Thr Phe Val Lys
1550 1555 1560
Glu Trp Ile Ile Asn Arg Gly Thr Ile Val Pro Leu Trp Ile Val
1565 1570 1575
Tyr Pro Leu Glu Gly Gln Asn Pro Thr Pro Val Asn Asn Phe Leu
1580 1585 1590
Tyr Gln Ile Val Glu Leu Leu Val His Asp Ser Ser Arg Gln Gln
1595 1600 1605
Ala Phe Lys Thr Thr Ile Ser Asp His Val His Pro His Asp Asn
1610 1615 1620
Leu Val Tyr Thr Cys Lys Ser Thr Ala Ser Asn Phe Phe His Ala
1625 1630 1635
Ser Leu Ala Tyr Trp Arg Ser Arg His Arg Asn Ser Asn Arg Lys
1640 1645 1650
Tyr Leu Ala Arg Asp Ser Ser Thr Gly Ser Ser Thr Asn Asn Ser
1655 1660 1665
Asp Gly His Ile Glu Arg Ser Gln Glu Gln Thr Thr Arg Asp Pro
1670 1675 1680
His Asp Gly Thr Glu Arg Asn Leu Val Leu Gln Met Ser His Glu
1685 1690 1695
Ile Lys Arg Thr Thr Ile Pro Gln Glu Asn Thr His Gln Gly Pro
1700 1705 1710
Ser Phe Gln Ser Phe Leu Ser Asp Ser Ala Cys Gly Thr Ala Asn
1715 1720 1725
Pro Lys Leu Asn Phe Asp Arg Ser Arg His Asn Val Lys Phe Gln
1730 1735 1740
Asp His Asn Ser Ala Ser Lys Arg Glu Gly His Gln Ile Ile Ser
1745 1750 1755
His Arg Leu Val Leu Pro Phe Phe Thr Leu Ser Gln Gly Thr Arg
1760 1765 1770
Gln Leu Thr Ser Ser Asn Glu Ser Gln Thr Gln Asp Glu Ile Ser
1775 1780 1785
Lys Tyr Leu Arg Gln Leu Arg Ser Val Ile Asp Thr Thr Val Tyr
1790 1795 1800
Cys Arg Phe Thr Gly Ile Val Ser Ser Met His Tyr Lys Leu Asp
1805 1810 1815
Glu Val Leu Trp Glu Ile Glu Ser Phe Lys Ser Ala Val Thr Leu
1820 1825 1830
Ala Glu Gly Glu Gly Ala Gly Ala Leu Leu Leu Ile Gln Lys Tyr
1835 1840 1845
Gln Val Lys Thr Leu Phe Phe Asn Thr Leu Ala Thr Glu Ser Ser
1850 1855 1860
Ile Glu Ser Glu Ile Val Ser Gly Met Thr Thr Pro Arg Met Leu
1865 1870 1875
Leu Pro Val Met Ser Lys Phe His Asn Asp Gln Ile Glu Ile Ile
1880 1885 1890
Leu Asn Asn Ser Ala Ser Gln Ile Thr Asp Ile Thr Asn Pro Thr
1895 1900 1905
Trp Phe Lys Asp Gln Arg Ala Arg Leu Pro Lys Gln Val Glu Val
1910 1915 1920
Ile Thr Met Asp Ala Glu Thr Thr Glu Asn Ile Asn Arg Ser Lys
1925 1930 1935
Leu Tyr Glu Ala Val Tyr Lys Leu Ile Leu His His Ile Asp Pro
1940 1945 1950
Ser Val Leu Lys Ala Val Val Leu Lys Val Phe Leu Ser Asp Thr
1955 1960 1965
Glu Gly Met Leu Trp Leu Asn Asp Asn Leu Ala Pro Phe Phe Ala
1970 1975 1980
Thr Gly Tyr Leu Ile Lys Pro Ile Thr Ser Ser Ala Arg Ser Ser
1985 1990 1995
Glu Trp Tyr Leu Cys Leu Thr Asn Phe Leu Ser Thr Thr Arg Lys
2000 2005 2010
Met Pro His Gln Asn His Leu Ser Cys Lys Gln Val Ile Leu Thr
2015 2020 2025
Ala Leu Gln Leu Gln Ile Gln Arg Ser Pro Tyr Trp Leu Ser His
2030 2035 2040
Leu Thr Gln Tyr Ala Asp Cys Glu Leu His Leu Ser Tyr Ile Arg
2045 2050 2055
Leu Gly Phe Pro Ser Leu Glu Lys Val Leu Tyr His Arg Tyr Asn
2060 2065 2070
Leu Val Asp Ser Lys Arg Gly Pro Leu Val Ser Ile Thr Gln His
2075 2080 2085
Leu Ala His Leu Arg Ala Glu Ile Arg Glu Leu Thr Asn Asp Tyr
2090 2095 2100
Asn Gln Gln Arg Gln Ser Arg Thr Gln Thr Tyr His Phe Ile Arg
2105 2110 2115
Thr Ala Lys Gly Arg Ile Thr Lys Leu Val Asn Asp Tyr Leu Lys
2120 2125 2130
Phe Phe Leu Ile Val Gln Ala Leu Lys His Asn Gly Thr Trp Gln
2135 2140 2145
Ala Glu Phe Lys Lys Leu Pro Glu Leu Ile Ser Val Cys Asn Arg
2150 2155 2160
Phe Tyr His Ile Arg Asp Cys Asn Cys Glu Glu Arg Phe Leu Val
2165 2170 2175
Gln Thr Leu Tyr Leu His Arg Met Gln Asp Ser Glu Val Lys Leu
2180 2185 2190
Ile Glu Arg Leu Thr Gly Leu Leu Ser Leu Phe Pro Asp Gly Leu
2195 2200 2205
Tyr Arg Phe Asp
2210
<210> 860
<400> 860
000
<210> 861
<400> 861
000
<210> 862
<400> 862
000
<210> 863
<400> 863
000
<210> 864
<400> 864
000
<210> 865
<400> 865
000
<210> 866
<400> 866
000
<210> 867
<400> 867
000
<210> 868
<400> 868
000
<210> 869
<400> 869
000
<210> 870
<400> 870
000
<210> 871
<400> 871
000
<210> 872
<400> 872
000
<210> 873
<400> 873
000
<210> 874
<400> 874
000
<210> 875
<400> 875
000
<210> 876
<400> 876
000
<210> 877
<400> 877
000
<210> 878
<400> 878
000
<210> 879
<400> 879
000
<210> 880
<400> 880
000
<210> 881
<400> 881
000
<210> 882
<400> 882
000
<210> 883
<400> 883
000
<210> 884
<400> 884
000
<210> 885
<400> 885
000
<210> 886
<400> 886
000
<210> 887
<400> 887
000
<210> 888
<400> 888
000
<210> 889
<400> 889
000
<210> 890
<400> 890
000
<210> 891
<400> 891
000
<210> 892
<400> 892
000
<210> 893
<400> 893
000
<210> 894
<400> 894
000
<210> 895
<400> 895
000
<210> 896
<400> 896
000
<210> 897
<400> 897
000
<210> 898
<400> 898
000
<210> 899
<400> 899
000
<210> 900
<400> 900
000
<210> 901
<211> 1338
<212> DNA
<213> Clostridium botulinum
<400> 901
atgagtaccc accttacaga aacctgggaa aaagcaataa atattataaa aggtgaactt 60
acagaagtaa gttttaatac atggattaaa agtattaacc ctatttctct tgaaaataat 120
tcattgaaac tagctgtacc aaatgatttt acaaaaggaa ttcttgaaag taggtacaaa 180
gatcttatag ttaatgcgct aaaattactt acctcaaaaa aatataatat agattttatt 240
gtaactactg aagaaaaaat agaaaaaaat cataataacg aaaaatctaa tatagttgta 300
aatgatgaaa tgtctactat gttaaatcct aaatatactt ttgattcgtt tgtaatagga 360
aatagtaata gattcgctca tgcagcatct ttagcagtag cagaatcacc tgctaaagca 420
tataatcctt tatttatata tggtggagtt ggtcttggta aaactcactt aatgcatgct 480
atcggtcatt atatattaca taacaatcct aaatctcaag tagtttatgt atcttctgag 540
aaatttacaa atgaattaat taattctata aaagatgata aaaatgtaga atttagaaat 600
aaatatagaa atatagatat tttattagtt gatgatattc aatttattgc tggaaaagaa 660
agaactcaag aggaattttt ccatactttt aatgcactgt atgaagctaa caaacaaata 720
attatatcaa gtgaccgccc cccaaaagaa atacctacct tagaagatag attaagatct 780
agatttgaat ggggacttat agctgatatt caagcacctg attttgaaac caggatggct 840
attttaaaga aaaaagctga tgtagaaaaa ttaaatattc ctaatgaagt aatggtatat 900
atagctacaa aaattaaatc aaatattcgt gaattagaag gagctttgat aagaatagta 960
gccttttcat cacttactaa taaagaaata agtgtagatt tagcttctga agcactgaaa 1020
gatataatct caagtaagca aacaaggcaa gtcactatag atattatcca agaagttgta 1080
gcaaactatt ataatctaaa aatagaagat ctaaaatcag ctagaagaac acgaaatatt 1140
gcttttcctc gccaaatagc tatgtacctt tctagaaaac taacggatat gtcattacct 1200
aaaattggtg aagaatttgg aggacgtgat catactacag ttatccatgc ctatgaaaaa 1260
atatctaata acttaaaaaa agatgaaagt cttcaaaatg caataaacga attaaataaa 1320
cgaattaatc aaaaataa 1338
<210> 902
<211> 1104
<212> DNA
<213> Clostridium botulinum
<400> 902
atgaaaataa cttgtcaaaa aaacatttta ctagaaggta tatctatagt tcaaaaagca 60
gtaactggaa aatcaacctt acctatatta tctggaatac ttattagagc taataaaaat 120
gaattggtct taactggttc tgatatggat cttagtattg aaactaaagt aaaagctaat 180
attttagaag agggaactat agttttggat gctagacttt ttggtgaaat aataaggaaa 240
ttaccgaatg atctaataga aataaataca ttagaagata attctataga aataatatgt 300
caaaattcta gatttaatct aatatatatg aatccagatg aatttcctaa tccacctatt 360
attaatgaaa atatgatttt ttcaataggt gaaaataaat taaaaaatat gattaaagga 420
actatatttg ctacagctca agatgaaaca agacctattc ttacaggtgt tttatttcaa 480
ataaaagata aaatgttgaa tttagtagct ttagatggtt acagattagc tttaagaagt 540
gaaattgttg ataatgataa taccataaat gccgttattc caggaaaaac attaaatgaa 600
gtttcaaaga tcttagaaga agatgatgaa aatgttaata ttacatttac tcctaatcat 660
attttattta gtataggaga aacaaaaata atttctagat tattggaagg agaatttatt 720
agctataaat ctataatacc tgaagaatat aatctaaaaa taatagctaa aagattagaa 780
cttttaaatt ccatagaaag agcctctctt atggctaaag aaggaaatac taatctagtt 840
aaatttgatt tttcaaatga taaaattgta ataacatcaa attctcaatt aggaatggtt 900
agagaagaat taaaggttgt attgcaagga gaagatttgc aaattgcatt taactcaaaa 960
tatcttttag atgtattaaa aactatggaa ggcgatgagg ttgtattgga attttcaagt 1020
agtgtaagtc cttgtattat aaaaaataca gaactaaata attgtactta tttagtttta 1080
ccagtaagat taaataataa ttaa 1104
<210> 903
<211> 207
<212> DNA
<213> Clostridium botulinum
<400> 903
atgattgaag taaaaattaa ttcagaagta ataaaattag actctttttt aaaatggtca 60
ggggcaacaa ctttaggttc agaggctaaa ttttttatac aaaacggaga agttaaagtt 120
aatggagaaa tagaaaaaag aagaggtaga aaacttaaaa tcggagactt gatagagttt 180
aataatgaaa catataaaat tatttaa 207
<210> 904
<211> 1095
<212> DNA
<213> Clostridium botulinum
<400> 904
atgtatataa aaaatgtgca cttaataaat tttagaaatt atgatgatat gtatttagaa 60
ttaagtccaa atacaaatat ttttgtaggt aataatgctc aagggaaaac taacatacta 120
gaaagtatat attattcaag tataggaaag tctcatagaa caaataaaga taaagatctt 180
ataaaatggg ataaaaataa tacatactta aggacatatg tatccagaga aagattagat 240
aaaactatag atataaatat atttaaaaat ggcaaaaaag ctataactgt aaataaaata 300
aaaataaaaa aaatatctga actaatgggg aacttaaatg ttgttatgtt ttctccagaa 360
gacttaagaa taattaagga ttctcctggg aatagaagga aatttctaga tatagaatta 420
tgtaaaataa acaatgttta ttatcatgat ttagtccaat ataataaaat tttatctgaa 480
agaaatacag ctttaaaaaa ttggaataac aaaattaatg atataattga tgtttatgat 540
gagcaacttt ctaaatatgg agcttttata attaaagaga gaaataagta tttggataaa 600
ttaaatatta ttggcaaaaa tatacataac aagataacca atgatttaga agatataaac 660
tttaggtatt taactaatat aaaagatttt gataatgcag aaaaagaatt attaatgctt 720
tttaagaaaa atcgaaaaaa agatcttgag agaaattcaa cttctattgg tcctcataga 780
gatgattttg aagtcagtat aaacaatata gatactagaa tttttggatc acaaggacaa 840
caaagaacag ctgtactaac tttaaagttt gcatcattgg aaataataaa gaatataata 900
ggggaatatc ctgtactttt attagatgat gtactatctg aattagattc aaatagacaa 960
aagtttgtat tgaattctat tgataaaata caaactataa taacttgtac tggtatagaa 1020
gaaatagaca aatacttaga taagaaacaa tctcaattat atttagttaa taatggtaag 1080
ataaaaagag tttaa 1095
<210> 905
<211> 264
<212> DNA
<213> Clostridium botulinum
<400> 905
atgtttcttc acttaggaga aaatgtagta gtaccgataa aagatgttat aggaatattc 60
gacatggaaa cttctatgta tagttcagat actatacaat ttttaagatt agctgaagag 120
gatggatttg ttgaaagaat aactaaagag aaaccaaaat cttttgttat agctgaagta 180
gataaaaaga gtaagatata tttgtctcct atatcttcag ctacactaac taaaagaaca 240
aaagttttgt ataatgagct ataa 264
<210> 906
<211> 1914
<212> DNA
<213> Clostridium botulinum
<400> 906
atgtcacaag aaaataaaca agtttatgat gaaagtcaaa ttcaagtgct agaaggttta 60
gaagctgtta gaaaaagacc aggaatgtat attggaagca ctagtttaag gggacttcat 120
catttggttt atgaaatagt tgataatagt atagatgaag cacttgctgg cttttgtaca 180
catatagaag tttttataca taaagataat tctataactg ttgtagatga tggacgtgga 240
atgccagttg gtatgcattc aaaggtaaaa aaacctgctg ttgaagtaat aatgactata 300
ttacatgcag gtggaaaatt tggtggtgga ggctacaagg tttctggtgg acttcatggt 360
gttggagctt ctgttgttaa tgccttatca gaacaatgtg aagtagaagt aagaagagaa 420
ggccatattt ggaaacaaaa attcgaaaga ggtataacaa aaactggatt agatatagtt 480
ggagatacgg aagatcatgg tacaaaaata tattttaaac cagatatcga aatatttgat 540
gaactagaat ttgaatatga tactttagct cacagactca gagaattagc ctttttaaac 600
aaaggtataa aaatttcatt aacagatgaa agatatgata aaaaagaaat gttccactat 660
gagggcggat tgagatcttt tgtactttat ttaaatagaa ataaggaaaa attacatcaa 720
caacctatat atgttgatga aaataaagat ggatgtatag ttgagattgc tatgcaatat 780
aacgatggtt atgcagaaaa tattttttcc tttgctaaca atatagatac catagaaggt 840
ggaactcatt tagctggatt taaatcagct ctaacaagag ttataaatga ctatgctagg 900
aaatttaatt acttaaagga tacagataaa aatttatcag gggatgatgt tagagaggga 960
ttaacagcag ttatttcagt aaaattaaca gatcctcaat ttgaaggtca aacaaagaca 1020
aaattaggaa atggtgaagt aagaggaatt gtagatacaa tagtaggtca gagtataggt 1080
tcttttttag aggaaaatcc taatgtaggt aaaataataa ttgaaaaagg cctatcagct 1140
tcaagagcta gagaggctgc aaaaagagca agagaactta ctagaagaaa atctatttta 1200
gaaagcacgt ctcttccagg aaaattatca gattgttctt caaaggatcc atcattatgt 1260
gaaatttatt tggtcgaagg agattccgca ggtggatctg caaaacaggg aagaaataga 1320
gaattccaag ctatattacc tttaaagggt aaaataatga atgtggaaaa gcaaagattg 1380
gataaaatat tagcttcaga tgaaatacgt gctatgataa ctgcatttgg agcaggtata 1440
ggaaaagaat ttgatattga taaaataaga tataatagaa taattataat gacagatgct 1500
gacgtagatg gagcccatat aagaacttta cttttaacat tcttttatag atacatgaaa 1560
gaattaatag aggaaggtca tgtttatata gctcaaccac cactttatag aatatataag 1620
gctaaaaaag aaatttatgt ttattcagat ccagaattgg atgctgcatt attagaattg 1680
ggtggaaaag ataccaatac taatattcaa agatacaaag gtcttggaga aatgaatcca 1740
gaacaacttt gggaaactac tatggaccca gaacatagaa ctttattaca ggtaacagta 1800
gaggacgcta tggaggcaga tgaaatattt actatactta tgggaacaaa agtagaacca 1860
agaagagact ttatagaaag taatgctgat aaagtagtta acttggatat ataa 1914
<210> 907
<211> 2466
<212> DNA
<213> Clostridium botulinum
<400> 907
atgctaaacg aaggaaagat tttgcctgta gatgtaagta aagaaatgaa gaaatgttat 60
atagactatg ccatgagtgt aatagctggc cgtgcattac cagatgtaag ggatgggtta 120
aagccagtac atagaagaat aatatattca atgcagggat taggattagc tccagaaaaa 180
ggttatagaa aatgtgcaag aattgtagga gatgtactgg gtaagtatca tcctcatgga 240
gatacagcag tttatgaagc tttagtaaga atggctcaga atttttcaat aagatataca 300
ttagtagatg gtcatggaaa ttttggttct gtagatggtg atggagcagc agcaatgaga 360
tatacagaag ctaagatgag taaaatatct atggaactta taaaagacat aaataaaaat 420
acagttgatt ttattcctaa ctttgatggt gaagaagaag aaccatctgt attaccatca 480
aggtttccta atcttttagt taatggttct tcaggtatag cagtaggtat ggctactaat 540
attccacctc ataatttaac agaggttata gatggaataa taatgctaat agaaaatgaa 600
gatgtaaata tacttgattt aatgactaaa ataaaaggac cagatttccc tacttctgga 660
ttaatcgtag gtacaagagg aataagggaa gcttatgaaa cgggtagggg aaaagttata 720
attagagcta aagctgagat tgaagaggaa aaagggaaaa ataagataat agttacagaa 780
ataccttatc aagttaataa agctagactt atagaaaata tggctaacct tgtaaaggat 840
aaaaaaataa atggaatttc agacttaaga gatgaatcag atagagatgg tatgagaatt 900
gttatagaat taaaaaggga tgcaaatcct aatatagttt taaaccaatt atataagcat 960
acaaaacttc aagatacctt tggaataatt atgttagctt tagttaataa ccaacctcaa 1020
attttaaatt taaaagaaat attagttaat tatgtggaat tccaaaagga agtaataaga 1080
agaagaacta gatttgactt agataaagca ttagcaaggg ctcatatatt agaaggttta 1140
agaatagcct tagatcatat tgatgaagtt ataaagctta taagagcatc taaaaataca 1200
gctgaagcta aagagggatt aatgaataac tttaatcttt cagaaaaaca agctcaagct 1260
atattagata tgaagttaca aaggcttaca ggtttagaaa gagaaaaaat agaagaagaa 1320
tataaagaac ttatggaaaa gataagttat tttagagaaa tattagataa agaagaatta 1380
gtactaagta taataaaaga agaattaata gagataaaaa ataaatatgg tgatgaaaga 1440
aaaacagaaa tagtaaaagg tgaacatgat atagacatag aggacttaat tgaagataaa 1500
aaggtgatag taactttaac tcatggtgga tacataaaaa gattagatat ggatacatac 1560
tcttcacaaa aaagaggagg aaagggtatt caagctacat ctacaaaaca ggatgatttt 1620
atagaaaata tgtttgtaac atctactcat agtactatat tattctttac taataggggt 1680
aaggtatata aacttaaagc ttatgaaata ccagaagcag gaagaacagc taaaggtaca 1740
aatatagtaa atcttatacc tatagaaaat aatgagaaaa tacaaacagt aataggttta 1800
aaagacatag atgacatgaa gcattttgta atgtgtacga gaaatggaat aattaaaaag 1860
acagagataa gtaaatattc ttccataaga aaaggtggat taaatgctat taatctgcga 1920
gaagatgatg aattaataga tgtaaaaatg accaaaggaa atgatgaaat aatagtagta 1980
acacaaaatg ggtactgtat aagatttaat gaagaagatg taagacctat gggaagagtt 2040
gcaacaggtg ttaaggctat aacactaaga aaagctgata aggctgtatc tatggatgta 2100
gtaatagaag atgaaacact attatctata agtgaaaatg gatttggtaa acgaacagac 2160
atagaagaat atcctatcca tagaaggggt ggaaaaggtg ttataactta taagataact 2220
gacaaaacag gacctatagt tggagcaagg tttgtaaaag aagatgatga acttatgctt 2280
gtaaatagtg gcgatgttgc aataagaata aatgtttcgg aaatatctaa aactagtaga 2340
aatgctatgg gtgtaaaact aatgagaact agtgaagaag aaaaaatagt agctatagct 2400
aaaataaaga gtgaagacat aatagaagaa gaaattttaa atgaagaaaa tctaaatgaa 2460
gaataa 2466
<210> 908
<211> 453
<212> DNA
<213> Clostridium botulinum
<400> 908
ttggaatatg aagacatagt atatataaat atgcacttag ataatgagga attaaagatt 60
tttaataaat tatctataag cgaacaaaag cattctataa aggtagctta tgatatagaa 120
aagttatatg aaaagggtaa atataatcta acaaaagatg agtttataaa ggtagcttta 180
ctacacgata taggaaaatt aaattataaa gttgatatta taaaaaaaag cataatagta 240
attatggata gaattacaaa ttccagaata aaaaaatttc aaaatattaa gtcagtttat 300
gttcattata atcatcctta tttaggttat tgtattttga aacaatataa taaatatagt 360
gaaaaaatgt tatatttaat taaaaaccat cataatgaaa atattataaa taaagagtta 420
agcttattaa tatatagtga taatttaaat taa 453
<210> 909
<211> 522
<212> DNA
<213> Clostridium botulinum
<400> 909
atgaattcaa tagaaagaag aaaaaatatt gaaaatatgt taatgaaaaa caataaacct 60
attaaaggta gtgaaatggg acaaaaatta ggtgtaacaa ggcaggttat agtaaaagat 120
atagctattt taagagcttc tggtaaaaat ataattgcta cgcctgaagg ttatttaata 180
cctaatgaaa ataaacaatt aataaggaaa attatagctg tatgccatga tagtaaagat 240
ataaaagacg aattagagat tataattaaa tttggaggaa tagtagaaga tgttgtagta 300
gaacatccta tatatggaga aataaaagcc atgttgatga taaaatctat gtatgacata 360
gataatttta taaaaaatat acaaaacaat aaggctgaac cgttattaat acttactggt 420
ggaattcatt tgcatacaat atcttcagat aatgaagata taatgaataa aataatagaa 480
caattaaacc aaaaaaatta tttagtagat gaggaagtat aa 522
<210> 910
<211> 1164
<212> DNA
<213> Clostridium botulinum
<400> 910
atggataaag tagccctttt aaaatgtgat gaatatgatt tagaaaaggt agagaaaact 60
ataagaaatg gatttgaact tttaggagga aactcttttt tgaataaact tataccttat 120
aatagtaaag ttcttttaaa acctaacatg cttagtattg aaaatgaagg ttctcctgtg 180
gtaactaata gtgtagtttt tgaagcagta ataagaatat taggagatta ttctaataac 240
atatcctttg gagattctcc tggatttgga gattctaaaa aggcagctga aaaatctgga 300
ttacttaata tagcaaagaa atataatata gaatttaaag attttaaaga atctattaat 360
gtaagttgtg ataattctat tttatgcaga tcctggactg tagcgaaggc agcttatgaa 420
acagatgtac taataacatt acctaaatta aagacacatg ctatggctta ctttacaggt 480
gcagttaaga atcagtttgg atgtatacca ggaactttaa aagctacttg gcatacaaga 540
atgcctaatg caaataattt ttgtaaaatg ttattagatc taaatacatt gttagaaact 600
gattttgcta tactagatgg cattatagct atggaaggaa atggtcctaa aaatggaact 660
ccttataatc ttaatacaat tataatgggg gatagcctta cagcggtaga ttccgttgct 720
gttaaaataa taggatatga caatccatta gatatacctg tattaaaaga agcttatgat 780
agcaattggg gaagtgtttt tttaaaggac atagatatat taggtgaaaa aatagatagc 840
atggtcgtag ataattttaa actttgtaga gagggtgggg atttttattt tataaatcct 900
aaagttacaa attttttaaa ggatattatt gcaccagatc ctactttaat aaaagaaaag 960
tgtataggat gcaatagatg tgctgaagta tgtcctgaaa aaccatatgt tatagatatg 1020
ataaaaaaag gggataaaaa aataccagtt tggaatatga aaaaatgtat aagatgtttt 1080
tgttgtcagg aactttgtcc caaaggagct atagaaacta aatattcttt tattggaaga 1140
tttttaaata gagatggcag gtga 1164
<210> 911
<211> 2682
<212> DNA
<213> Clostridium botulinum
<400> 911
atgaaaaata aaaaagcatt gtttatacca ttattcataa taattttatt tatagcattt 60
tttaataaaa taataaattt tattattaat ataaaatggt ttaaagaagt aaactattta 120
gcggtatatt ttactaaaat gagagctata attattttaa tgattcctat atttataata 180
ttttttatat ctatatggat gtattataaa agccttatta taaacaagaa taaaagtgta 240
gtagatatag gattaaataa aaacaattat gggaaaaaat tattctttat ttttaacttt 300
atagtatcta tatttttagc ttatatattt tcaagcagtt attggtatag aatattacaa 360
tttaataatt ctgtagattt taatgtgaaa gatcctatct tttttaaaga tgtttctttt 420
tatatattta aattgccact ttttgaatct ttatataaag ttataatttc tttattatta 480
tttttagtta taacaacatt tatagcttat tttattttag aggctaaata taaaattcaa 540
agtagaaagg atataaattt aaaaaatata aatcatggca taaaatcctt tgcgggaaaa 600
caattagcta ttgtatctgg tcttataatt ctatttatat cctttggaca tttaataaaa 660
atatggaatt tagtttatag ctctaatgga gtatcttttg gtgccagcta tactgatgtt 720
cacgctactt tattattcta taaaataata gtagtaatta cactaatttc atctatagta 780
acattattaa gtatagtaaa aggtaaattt aagccagtaa gcatatgtat aggtataact 840
atatttttga tagtatcaca aaatatagca tcttttttag tacaaaactt tatagtcaaa 900
tctaatgaaa aaactttaga gcaaccatat ataaaaaata atatagattt aacaagaaaa 960
gcttttgcat tagatgatat tgaaataaga gattttgata ttaaaaatga tttacaaaag 1020
caagatattg cagacaacaa agcaagtata gataacgtaa gaataaattc ttttaaacct 1080
acattagaat tttataatca agttcaaata ataagatatt actatacttt taatgacata 1140
gatatagata ggtataatat aaatggaaaa tacaatcaag tattcctagc tgcaagagaa 1200
atagatacag atgcattaaa tccaaataca tggcaaaata gacacttaat atatacacat 1260
ggttttggag cagttatgaa taaagtaaat tctgtaacaa gtgaaggaca acctgacttt 1320
gttataaaag atataccacc ttataataaa acaaatataa aattgactaa tcctaggata 1380
tattttggag aaaaaactaa tgactatgtt atagtaaaca ctaagataaa tgaatttgat 1440
tatcctagag aagattctaa taaaactaat aaatataatg gacatgcagg tataaaaatg 1500
agctttatta atagattatt atttgctata aataaaaaag atattaattt tcttttatca 1560
aaggatataa aaaaagatag taaaataata ataaatagaa atattgtaga gagggcaaaa 1620
aaaatagcac cctttttaac ttatgatagt gatccttata tggttatata taatggcaaa 1680
atatattgga taatagatgc ttatactact acaaatagat atccttattc agagccttac 1740
gatagtataa attatataag gaattcagct aaagtagtaa tagattctgt agatggagat 1800
accaattttt atattacaga taaaaaggat cctatagtta ataattatgc taaaatattt 1860
aagggattat ttaaagaaga aaaagatgcg cctaaagaaa taagagaaca ttttagatat 1920
ccaaaagatt tatttagtat tcaaagcaaa gtattaggaa aatatcatgt aaaagatcct 1980
ggtgtgtttt ataatggtga agatctatgg gaagtgtcta aggatcaaaa acatgttgaa 2040
ggagaaacaa atacaaatga tgctccttat ataattatga aattaccaga ccaaaataaa 2100
gaagaaatgg tacttttgaa ttattttaat gtaatgaaaa aggataatat gatagcttta 2160
tttggagcaa gaatggatgg agagcaatat ggtaaaaaaa tattatataa acttccatca 2220
gacaaaacag tatatagtcc atatttattt aagcaaaaaa taaatcaaga tactaatata 2280
tctaaggaat tatcattatg gaatagagaa ggttcaaagg tgcaatatgg agacactata 2340
atattaccta taaaaaattc tcttctttat atagaaccac tatatttgcg ggctagtggg 2400
aaaaatagta taccagaaat gaaaagagta atattatcct ataatgataa attagtttta 2460
tcatctagta ttcaagaagg tataaaagaa atatttaatt ctaaagataa taaaatcaat 2520
gataaaaatg aaaaagatag tacaaagact atagatgatt caaaattgaa aaaagctcaa 2580
gaatattata ataaagccat agaagctcaa aaaaatggag actggactaa atatggagaa 2640
aatataaatg aattaggtaa tatattaaat agtataaaat aa 2682
<210> 912
<211> 777
<212> DNA
<213> Clostridium botulinum
<400> 912
ttgaaattta aaaaaagcgt atatattgtt gtatttactt taatattatt atttatacct 60
tgctttatac atacaaaaaa agatgtaagc acaactaata atttagacaa taaaacaaaa 120
gaaataaata aaagtgaagt ggatagaaat gaaatgtcag tattttcatc taatacttgt 180
tttaaaaaaa cttattatat aaataaaaat aaagtaccag tatataaaaa ttttgattgt 240
aatagcgaag tattatatta tttatatgaa gatgatataa ttgttagcta taaggagcaa 300
aatggatata tattttgtga agaaggaaat ttaggaagaa aaggatggat taaaaaaaat 360
aaagaaaatc ttaaaggaat tttacataaa aatactgaat ataaagtaga tgtggactta 420
atagatcaaa agataagggt atacaaaaat gataaaataa taaaaaatat caaatgctca 480
acaggagtta taggaaaaca agatacagaa actccattag gtatttttta tattacaaat 540
aagggaaaat atttttatag taacaaatat aatcaaggtg gtagatatta tattaaattt 600
tttgcaaatt atttaattca ttctatacct gtagacaaga atggtaatat aatagaagaa 660
gaaaaagaca aattaggatt tcctacatct catggatgta taagagtacc tatggaggat 720
tcaaagtggt tatatagaaa tatacctaat aaatctttga taattataca ttattaa 777
<210> 913
<211> 1398
<212> DNA
<213> Clostridium botulinum
<400> 913
atggattatg atgtgatgat attaggtggg ggaataatcg gatgtgcatt agcttatgaa 60
ttatcaaaat atagtttaaa tatagcttta atagaaaagg attatgatat agcagatgat 120
gtagcattta taaattcatc tgtagtgtat gatggagtgg aatgtgaaga tgatttagca 180
gctaatttgg agttaaatgg taataaatta atggaagata tagctaaaaa atttaaaatt 240
ccatttaaaa aaacagggtc attaataata gctcaaaatg ataatgaagt atacaatata 300
gaaaatatgt ataaaaaagc tttaaaaaga ggaataaaaa atatagaagt attaactaag 360
gatgaggtag aaaaaataga accaaattta aatatagatt ttaaaaaggc attatattct 420
agcaatacag catctatagc accttttgat ctagctatat cttatggaga aattgccttt 480
gataatgggg taaattttaa attagaagaa caggttttag aaatacaaaa attatctaaa 540
ggatataaaa ttataactaa taaaaacaaa tttaactgta atatagttat aaatacaacc 600
cctgatgaaa attttggaat atattcagac accaaaagaa attataaaaa aagtaattta 660
aattatttat taatagaaaa aaattcaatt aaggaattta ataatatagt ggtaaagcta 720
ggtaataatg aaaatataaa aaaaatttta gctgtaccaa ctgttcaagg tagtatggtt 780
ttagctgtag atacttatga gaagataaat tataaaaata cattagatgt gtctgctttg 840
attttagatg aaataaatga gatggatata aataattttt atcaatttcc atattatgat 900
gatagcatag taatagatga tagtttaata gataagggat atataaaagt tatagtcaat 960
cattatggac aagtaacgat gacaccttat atagccaaga ctgttacaga aactatagtt 1020
agtaatataa aatgtgtact aaagaaagag tttatagata aaagaaggga ttattataaa 1080
tttaatgagt tatctttaga agaaagaaat aaaattataa atatggacaa aaggtatgga 1140
aaaataatat gtgcctgcaa taaagtaaca gaaggagaaa ttatagatgc aataagaagg 1200
cctttaggtg cacgaacatt agagggaata aaaagaagga caggagcagc ttttggtagt 1260
tgtcagggag cctattgttt aaataaagtt gtatcgatat tagctagaga aacaaataaa 1320
tttatgacag atatagttaa ggactcaaaa aattctaaaa ttataccctg tagaattaaa 1380
gaatttgata caatttaa 1398
<210> 914
<211> 354
<212> DNA
<213> Clostridium botulinum
<400> 914
gtgcttagag aatttatttg taatggatgc aataaaaaat gtataatatc tctttataat 60
agtaattata atactataaa aggtaaccaa tgtaacttag gaatagatta tgctaaaaat 120
tatgttaata atactaaaga tatttttact acgttagtta ggataaaagg atctaaatat 180
aatgtattac cagtaaaaag cagtgaacct atagaaaaat ctttatggat agagtgttct 240
aaagctttaa gcagattata tgtaggttat cctatagaaa ttggagatgt aatttgtaaa 300
aatattttga acacaggagt agatataata gctattaaaa atattaatga ataa 354
<210> 915
<211> 1281
<212> DNA
<213> Clostridium botulinum
<400> 915
atgttagatt taaaaagaat aagaaataat tcaaatgaaa taaaagaagc attaaacaat 60
agaggagaaa agtttgatgt aactgtaatt gatgaagttt taaaattaga tgaagaaaga 120
agaaatattt tagttaaagt tgaggtttta aaaagtaaga gaaatcaagt ttcttctgaa 180
gttcctaaat taaaaaaaga aggaaaagat gtatctaata tagtagctga aatgaagaat 240
ttatcagaag agataaaagg atttgatgct actttagcta aaatagatga aaaaatacaa 300
tatataatgc ttagaatacc taatatacca aacccacaag ttccagatgg tgaaacagat 360
gaggataata tagaaataag aaattggctg gaaccaacaa aatttgattt tgaacctaaa 420
gcacattggg atataggaac aaatttaaat attcttgatt ttgaaagagc tggaaaagta 480
acaggatcaa gatttacttt ttataaagga ttaggggcta gattagaaag agcagtaata 540
tcttattttt tagatactca tacagaaaaa catggttata ctgaaatatt accaccttat 600
atggtaaata gaacaagtat gataggaaca ggacaattac ctaaatttga agaagacgct 660
tttaaaatct cagaggatga ttacttctta ataccaactg cagaggttcc tgtaactaat 720
ttatatagag atgaaatctt aaaaggtgat gaattaccat taaaacatgt agcttatagt 780
gcttgtttta gatcagaagc aggttcagca ggtagagata caagaggtct tgttagacaa 840
catcaattta ataaagtaga gcttgttaaa tttacaaaac cagaacaatc ctatgaagaa 900
ttggaaaaat taactaatga tgctgaaaca gtattaaaag agttgggtat tccatataga 960
gttgtaagaa tatgcaaagg tgatttagga tttacagctg cattaaaata tgatttagaa 1020
gtttggatgc caagttacaa tagatatgtt gaaatatcaa gctgtagtaa ctttgaagac 1080
ttccaagcaa gacgtgctaa tataagatat aaagaagatg caaaagcaaa accacaatat 1140
gttcatacat taaatggatc aggagttgct attggaagaa ctgttgcagc tatacttgaa 1200
aactatcaaa gtgaagatgg atcagttaca ataccagaag tgttaagacc ttatatggga 1260
ggaagagaag taataaaata a 1281
<210> 916
<211> 888
<212> DNA
<213> Clostridium botulinum
<400> 916
atgataaaat attacaatag aaaaactaac gattatgata tagaaaaagt tgcaggtgaa 60
aaatatttaa attggactta ttcatcacct attggtatga atcttttaga agtttttata 120
aaaaagaagt ttttttcaaa aatatatgga ttttattgtg atagaaagtt aagtagtaaa 180
aaaataaata aatttattaa tgattttgaa attgatatgt ctttaagtga gaatcaatca 240
agtaaattta aatgctttaa tgattttttt actagaaaat taaaaaaaga agctagacct 300
ataaaagctg ataaaaatat tttaatatcc ccaggtgatg gtaaaatact tgcatataaa 360
aatttaaatc taaattcagt aactgaagta aaaggaatca attatagttt ttatgaatta 420
ataaataatg attcattagc aaaagaatat gacaatggaa cttgcttagt tttaagatta 480
tgtcccacag actatcatag atttcatttt atagacaatg gtacctgtga aaatactata 540
aagctagatg gtttttacta ttcagtaaat ccaattgcat tatctaaaat tcctagttta 600
ttttgcaaaa acaaaagaga gtatgctatt tttcatagtg aaaactttgg tgatgtaata 660
tttatggaag ttggagcaac ctgtgtaggt tctataatac agacttataa acctaatact 720
aaaattttaa aaggtgatga aaaaggttat tttaaatttg gaggatctac agtaatttta 780
ttcttcaaaa aaaatactat aaaaattgat aatgatatat taaatcaaag taaattagga 840
tatgaaacat ctgttataat gggagaacct attgggagca aaaaataa 888
<210> 917
<211> 1599
<212> DNA
<213> Clostridium botulinum
<400> 917
atgtacttaa attctgttca aagatttaaa gaaataataa aaatattagc attctatggt 60
tttggtcata tagtagattc aaaatttaac gaagataaag ctcctgaaaa tttaagaaaa 120
gcttttgagg aattaggacc tacctttata aaaataggcc aaatattaag cacaagacct 180
gatatattat cagcgcccta tataaaagaa ttatcaaaac ttcaagacag tgtacctgaa 240
gataatttta gtgatataaa caaaatattt tttgaagaat ttaatatatc catagaagat 300
gctttcttaa attttaatag aaaaccttta gcttctgctt ctatatccca agtttattct 360
gctaaacttc ataataatga ggaagttata gtaaaaattc aaaggccaga aataaaagaa 420
aaaatgaaca tggatttagc tatattaaga aaaatattta ctcttggaaa aattaaaacc 480
tttgatacat taatagatcc taaagaagct atagatgagc taataaatgc aactaattta 540
gaattagatt ttaataatga aaaagaaaat attaaaaaat ttaaatactt taataaaaat 600
ctaaaatgta tttatgttcc taatactata gataaatact gtagtagcaa gataattact 660
atggaaaaaa ttcatggttt taagataacc gatacaaaat ctttagataa attaaattat 720
gataaaaaag atgtagctca taaattagct atatctatat taaaacaaat ttttgaagat 780
ggattttttc atggtgatcc tcatcctgga aatattttta tatatgaagg taaaatatgt 840
tatatagatt ttggaataat gggtactcta tcgtctgatc taaaaaatta tttaaataag 900
gctatggtag ctgtggcttt taaagatgta gataaactta tatctgtact tttgtctatt 960
ggtataaaaa aaggttatat aaataaaaat aatttatttg aagatataaa ttatttattt 1020
gatatttatc tttctactcc tttaaagaat ataaaaatgt ccaccatgct tcaagaagtc 1080
tttgaatgtg ctaatcgtaa taatattagt ttacctaaag aattgactat gctcataaga 1140
agcttaatta taatagaagg tatcttagaa aaaatagatc ctaatattca aatattagat 1200
attgcgattc cctatgtaga aaataataat aaagttaatt tttttaaaaa tattgatttg 1260
gacgaattaa tattaaatag ttataaaact gcagaagatt tatcaaaaat tcctactaaa 1320
actgttcaac tattaaatag tattttaaat ggtagatcaa aaattcaact taatgtcaat 1380
aatctagata gatcaattaa tgaattaaac aaaatgataa acagaatagt ttttgcttta 1440
ataatatcct caatgataat tggtttctct tttatactta attctaacat tggtcctaaa 1500
ttttatgata tatctataat aggaatatta ggatacctca ttgcagcctt tatgggtttt 1560
tggcttctta tatctataat aaaatctggt aaattataa 1599
<210> 918
<211> 321
<212> DNA
<213> Clostridium botulinum
<400> 918
gtgataaacg aatttaaaaa tatactttta gctggtattg gttcagcggc ttatacctat 60
gaaaaagcct ctaatttagt agacgaaatg gttcaaaagg gtaaaattac tgtaaatgaa 120
ggtaaggaat tatctgaaga actaaaaaga actattgatg aaaataaaaa gtctaaaaat 180
tcatctgaag aaaaacagct tacaagagaa gatataattt ctatatttaa tgaattaaat 240
tttgttaata aaaatgattt aaatgatata aacaataaaa taaaatcact tgaagataaa 300
atttctcaat tagaaaaata a 321
<210> 919
<211> 1551
<212> DNA
<213> Clostridium botulinum
<400> 919
atgaaattag aaataataac agaagatcgt ttaggcatgg tgctagatat tttaaatgtg 60
ttatacaatg agagtatgga tataaaatct ctagaggtat ttcctaaaaa aatatatata 120
aaaataaata aaaagatttc ttacaacaaa aacatgataa tcaagaaaat aaaaaatata 180
aagggagtag taagggtaaa aaagatagat atactacctt atgaaaagga tgaaaaaaaa 240
ttgtttacta taattgattc tttggaggag ggagtaattt ttgtcaatga aaaatgtcaa 300
gtagaggttt ttaataaata ctgtgaaaac ttatttaata ctttaaaaga aaatgcaatt 360
agaaagcata taaaagaaat tttcggacaa aatcaactca tattagatgc tttaaaaatg 420
ggaaaagatt atgataattt acaagtcttc attaataata aagatagaaa gggaatgtat 480
gtatctacag caagagctat taaagatgat aagaataaaa caataggatt tgttatatta 540
ataaaagatt taaaagaaac tattgaaata gtaaattcta ttaaatataa ggaagatgaa 600
gcatttaagg ggataatagg aaaaagtatc tgtattgata atttaaaaga aatatgtaaa 660
tcagttgcta aaacaaattc aaccgtatta atttgtggag aatctggaac aggaaaagaa 720
ctttttgcaa aagctattta taaattaagc ttgagaaata ataaaaactt tgttactgta 780
aattgtgctg gtttacagga taatttaata gaaagtgaac ttttcggtta tgaagcagga 840
agttttacag gagctaaatc taatggtaaa gaaggttttt ttaagttagc ggataaaggt 900
actatatttt tagatgaaat tggagaactt cctcttaata ttcaatgtaa atttttaaga 960
gtattacaag aaggaactat aagaaaaata ggaagtacaa aggaagaaaa aatagatgtg 1020
agaataattg ctgctactaa taaaaattta gaagaaatgg tttcaaacgg aaaatttaga 1080
gaagacttat actatagatt aaatgtagta cctatagaaa tacctccact aagagaaaga 1140
aaagaagata tacaattatt agtagataat tttgtaaaag ctttaaataa aagtttaaat 1200
aaaaatatta ggtatataga taaaaaattt ataaataaat tattaaaata taatttccca 1260
ggtaatatta gggaacttca aaatataatt gaaagaacta tgaatttgtg ttcggacaat 1320
atattaagtg ataaaaatct cagtataaat actaatatta cattaaataa tgataaaaat 1380
aatgatagtg gtgcattact tttacaagat atagtggaga aagcagaaaa atgtgctata 1440
cagaaggtaa tgaatgaata taaaagttta agaaaagtag gcaaagtatt aggagtttct 1500
catactactg taatgaataa aataaaaaaa tatggaattg tatgtaaata a 1551
<210> 920
<211> 1203
<212> DNA
<213> Clostridium botulinum
<400> 920
atggaaaata taaagaaaat gggatttgcg acaaaggcta tacatggagg gctcattgga 60
gataaacagt ttggttcatt ggcaactcca atataccaaa catctacatt catatttgat 120
tcagcagagc aagggggtag gcgatttgca ggagaagaaa gtggatatat atattcaaga 180
ttaggaaatc ctacatctac agaagtagag aacaagttag ctttgttgga atgtggagag 240
gcagctgttg tagctgcctc aggtatgggt gctatagctg catctttgtg gtcagcttta 300
aaatcaggag atcatgtagt tgcatcagat actttatatg gatgcacatt tgcactatta 360
aatcatggat taacaagata tggagtagag gtcacatttg tagacgtatc taatttagat 420
gaagtaagaa atgcattgaa agcaaatact aaagtagttt atttagaaac tccagctaat 480
ccaacattaa aggttactga tattaaacaa atatcaaata tggttcatga aaataataaa 540
gaatgtcttg tatttgttga taatacattt tgtacaccat acatacaaag gccattacaa 600
ttaggcgctg atgtagttgt acattctgct actaaatatt taaatgggca tggagatgtt 660
atagctggat ttgcagtagg aaaagaggaa tttataaatc aagttaaatt atttggtata 720
aaagacatga caggatcagt tataggacct tttgaggcat ttttaataat aagaggaatg 780
aaaacattac aattaaggat ggaaaaacat tgtaagaatg ctatggaagt atcaaagttt 840
ttagagtccc atcctgcagt taaaaaagtt tattatccag gattagaaag ttttgaatac 900
tatgagcttg ctaaaaagca aatgagtttg cctggtgcta tgatttcttt tgaactaaaa 960
ggtggagtag aagaaggtaa agtagttatg aataatgtta aattagctac tcttgcagta 1020
agtcttgggg atgctgaaac attaattcaa catccagcat caatgacaca ttcaccttat 1080
acagcagaag aaagaaaaga agctggtata agtgatgggc tagtaagact atccgtagga 1140
cttgaagatg tgggtgatat aattagtgat ttaaaacaag cattagattt aatagttaag 1200
taa 1203
<210> 921
<211> 438
<212> DNA
<213> Clostridium botulinum
<400> 921
atgaatgatt atatagaata tgcaataatt gaagcaaaaa aagcattagc aataggagaa 60
gtacctgttg gagctattat agttaaagaa aataaaatta tagcaaaaag tcataattta 120
aaagagtcat tgaaggatcc aacagctcat gcagagatat tagctataaa agaagcttgt 180
aatacaatac ataattggag attaaaagga tgtaagatgt atgtaacatt agaaccatgt 240
gctatgtgtg ctagtgcaat aattcaatct agaataagtg aattgcatat aggaaccttt 300
gatccagtgg gaggggcttg tgggtcagta gtaaatataa caaataatag ttatttaaaa 360
aataatttaa atattaaatg gttatatgat gatgaatgta gtagaataat aacaaatttt 420
tttaaaaata ttagataa 438
<210> 922
<211> 1626
<212> DNA
<213> Clostridium botulinum
<400> 922
gtgggttata ccgcattata tagagagtgg agaccaagaa catttaaaga ggtagttgga 60
caaaaacata taacagtaac acttaaaaat caagttatag aaaaaagaat agctcatgct 120
tatctttttt gtggaacaag aggtacaggt aagacatcta cagcaaaaat actatcaaaa 180
gcagtaaatt gtttaaatcc caaggatggt gaaccttgta acgaatgtga aatttgtaat 240
aaaataaata gtggaacttt aatggatgta atagaaatgg atgctgcttc taaaaggaaa 300
ttagaggaca taaaggaagt tatagaaaat gtaaaatatc caccacagga agggaaaaat 360
aaggtttata taatggatga ggttcatatg ttaactcaag aggcagtaaa tgcttttttg 420
aaaactttag aagaacctcc gagcaatgta atattcatat tagcaactac agatcctcaa 480
aaattaccta taactatatt atctagatgt caacgatttg attttagaag aataagaaat 540
gaggaaatat ttgaaaggct tagagcaata gtgtcagaac agggcatata tgcagatgat 600
aaaagtctta atcttatagc tagaatgtca gatggggcca tgagagatgc tcttagtata 660
ttagatcaag ttatatctac tggagatggg aaggtagagt atgatcaagt cttagatatg 720
ctaggattag ttactaatga aaatcttcta agaattacaa acagcataat agaaaaagat 780
gtagagaaat ctatgaggat aatagaagat atagtgctaa gtggaaaaga catatataat 840
tttataaaag atatgataac tcatcttaga aatatactta tggttaaagt aagcaaaaat 900
ccaaatgaaa tattagatat gtccagtgaa aatattgatt tagtaaaaga gcaatctgaa 960
aaaataagaa tagaagaaat aatgagggat ataaaaatac ttcaagaagc agaacaacaa 1020
tccaaatggg taaagcaaaa cagaatatat ttagaattgg ctgtacttaa aatgtgtaaa 1080
atagaatatg atacatctaa agaagttata ctttctaggc ttaataaaat agaagagctt 1140
ataaaatcag gtaatataaa attagcaata aatgaagaaa agaaaaaaat agagccaaag 1200
gaatttaatc taaaaagaga aaaagaaagt atacaacata gtaaaataga aaaaaattca 1260
ttagaagatt ataataagga ctctaaatta actgtagaaa ctgtcaaaaa aatgtggcgc 1320
gatatattag aagcttttaa agcaagaaga cttatggtat tatatgcagc tttagttact 1380
gcaaacataa cagattgcaa agaaggtatt attactttaa attataataa gcagtattct 1440
tttaataaaa agagattaga aaagccagaa aataataaag tagttcagga aattttttct 1500
gaggtactaa aagagaaaat tagaataata tatattgtag aggaaaaggc taaagaagaa 1560
aatttaccag aagagatttt aaaaaatact tttggagaga atatactaga aataattgat 1620
gaatag 1626
<210> 923
<211> 342
<212> DNA
<213> Clostridium botulinum
<400> 923
atggcaagag gtggattccc taacatgggt ggagcaaata tgaataactt aatgaaacag 60
gctcaaaagc ttcaacaaga tatggaaaaa atgcagggag aaatggaaaa gaaagaattt 120
tcagctacag ttggaggagg agcagttaca gctgttgcta atgggaaaaa acaaatagta 180
gatataaaaa ttgaaccaga agttgtagat gaagatgaca tagaaatgct tgaagatcta 240
ataatgagtg catgcaacga agctttaaag aaagctgaag aagacacttc aagcgaagtg 300
aaaagattaa ctggaggaat gaacttacca ggaatgttct aa 342
<210> 924
<211> 597
<212> DNA
<213> Clostridium botulinum
<400> 924
ttggattttt atcctatagc tatagaaaaa ttaatagaag agttcgctaa attaccgggt 60
ataggttata aaacagctca aagacttact ctatatgtac taaatttacc taaagaagag 120
gtaaaggaat tctcagaggc cttagtaaaa gctagaggta caattaaata ttgttctgta 180
tgtggtaatt ttacagataa agatccttgt gctatatgta gtaatcctaa taggaataaa 240
tctattattt gtgtaataga acaacctaaa gatataatgt ctatggaaaa aataagagaa 300
tataatggag tatatcatgt attacatggg aatatatctc ctatggcagg aagaggtcct 360
gaagacataa aattaaaaga attaataaga agaatagatg gtagtgtaaa tgaagttata 420
gttgctacta atcctaatgt agaaggagaa gcaacagcta tgtatatatc taaaatatta 480
aaacctctag gagttaaagt tacaagaatt gcccacggag taccagtagg tggggattta 540
gaatatgcag atgaggttac tttagctaaa gctttagaag gaagaataga attataa 597
<210> 925
<211> 264
<212> DNA
<213> Clostridium botulinum
<400> 925
atgggaggtt tttttataat gaaaaaatta aatgatggaa aaaatgaaaa aaagttatta 60
ctagaatcta tagacagcgt aatatcagag ataaacaaca taagaagatt gtttgaaaac 120
gcaagtgatc ctaaattaat tgattatgct atatacatgg aagaggcact aaaagctaaa 180
tatatttatc tcttaaaaga agctaaagaa gaaggtatta aggtagaata ttgtgataca 240
ataaaagaag ttgaagtagg ataa 264
<210> 926
<211> 261
<212> DNA
<213> Clostridium botulinum
<400> 926
atgggaatag aatatattgc ttattttatt ttagctatat ttttgttgtt tgtagtagta 60
aaaatatttt catggccatt aaaaatcctc ttaagtttaa taggaaatgc cattttagga 120
acagtattgt tatttatttt aaatgtgatt ggaggagctt ttaattttta cataggtata 180
aatatatgga cagcattaat agcaggattc tttggaatac caggagttat atttcttata 240
atatttaaat tatttttata g 261
<210> 927
<211> 693
<212> DNA
<213> Clostridium botulinum
<400> 927
ttgaaaataa ctaaaaatat actaaaagct gaatttataa aaaggccaaa tagatttcag 60
gcttatgtaa aaataaatga gaaaatagaa atggttcatg ttcctaatac aggaagatgc 120
aaagagatat tgattccagg ttctacggtc atattgagag aagaaaataa tgaaaataga 180
aaaactcgat atgatttaat agctggatat aagggagata tgcttataag tatagattcc 240
caaataccta ataaggtagt ctatgaagca ttaatgaact ttaaaataga aattcttaaa 300
gagtatacta atattaaaag ggaaaaaacc tttggtaaaa gtagatttga ttttagatta 360
gaaaaagaaa atggagaagt atattattta gaagtaaaag gagtaactct tgaaaatgat 420
ggtttaacta tgtttccaga tgctcctaca gaaagaggaa caaaacatat attagaactt 480
atagatgtga aaaataaagg tatgggtgca ggtgtgctat ttttaataca attaaatggt 540
gtaaaaaaat ttacaccaaa ctataaaatg gataagaatt ttggagaagc tttaaggtta 600
gcaaaagaaa agggtgtaga tattttagcc tatgattgtt tagttgagga gagtagtatt 660
tctttaaata atcctgtatc aatagaaatc tag 693
<210> 928
<211> 489
<212> DNA
<213> Clostridium botulinum
<400> 928
atgaaattta aatactgtcc actatgtggg gaaaaattaa ttgaaaaata cagctgggat 60
gaagggggag ttccatactg taaaagacat aatataatgt attttgatac ccctaaacct 120
tgtattgtag taggtgtact taaagaagat catgttttat tattaaagca aagctatata 180
ttcaaaaatt ctaaagttct tttatcagga tatgtatcta gtggagagac cgttgaagaa 240
gctgttcaca gagaagttaa agaagaagct ggtattaata taagagattt aaaatatcta 300
ggaagtgatt atctagagag taaagatata gtcatgatta catttatggc aacatataga 360
gatggaattt taaacaaatc agaagaagta gaatggattg attggatacc tataaaagaa 420
gccatagatc atatggaaga agatgaaata gggaaaaaaa taataaaaaa aataatgaag 480
aattgttaa 489
<210> 929
<211> 723
<212> DNA
<213> Clostridium botulinum
<400> 929
atgagtaaca aaattgaaaa aacacctaaa cgtgtaccag aaataaaagg tgtgttaaga 60
agtcatatga tagaagttcc ttcaattatt agagaagcta gtggcattaa agtttttggg 120
aaaagaataa aatcctttgt atacagcaca gatgttgctg ttattaaaaa taccaatgca 180
gatgctgtaa tagcagtata tccttttact cctcagccta taataactca atctttagtt 240
ttagctgcag atattcctgt attttgtggt gtaggaggag gattaactac tggaaaacga 300
gttgttaatt tagctttaga tgctgaattt aaaggtgcta tgggagttgt tataaataat 360
ccaactccta atgatgtatt acagcaaata aaagatacta tagatattcc aattgtagta 420
acggttgtat cggagtatga agacatagaa gctagaatta attcaggagc cactatactg 480
aatatatcag gagctaaaaa gacagcgtac atagttagag aaataagaaa acgatatcct 540
gatttcccta taatagctac aggaggtcca aatgaagcca gtataaaaga aaccatagaa 600
gcaggtgcaa atgctataac atatacacca cctccagcat cagacatatt tagtgaagtt 660
atggataaat atagagttaa ctttaaaaag gaacatgata gagaagaaaa tgaacaatcc 720
taa 723
<210> 930
<211> 789
<212> DNA
<213> Clostridium botulinum
<400> 930
atgaatggca tactatttta ctttagtgga acaggtaata ccaaatgggt agcagataga 60
ataggagata aattgtgtaa attagataat actatacata aagttaatat agagaatctt 120
gatgatgatg tattaattaa aattcataat tatgatttta taataatagg aacacctatt 180
tatgctgaga tgggtccaaa attaatacag gattttgtta ataatattcc taaagtaaaa 240
gaaaaaatta aatgtatact atattcaact caaggaggca attcaggttg tgaaacagag 300
agtatgcata aaatcttatg taataaaggt tatgatgtag ttataaaggt taatataaaa 360
atgataaata attattattt ttctgtaggg aaaaagccag atgaagctga gatggcaaat 420
atactaaggg atgcagaaaa aaaggtggat ttagttgtag ataaattttc aaaaggagaa 480
gtatatttag aaaatataag taaaactaga gtatttttgg ggaaaattgc atctaaggga 540
tttaataaat ttcttcctaa attatcaaac aatcttaaat ctacagagca ttgtattaaa 600
tgtggtatgt gtgttaggaa ttgtccaaaa ggaaatatag tatttgagaa cgggggagta 660
gtttttcata gtaattgtat attatgttta agatgtatat atatatgtcc aagcaatgca 720
atagtttata aagaaaagag aatagatcaa atagaaaaaa atataataaa attattggac 780
ataaaatag 789
<210> 931
<211> 162
<212> DNA
<213> Clostridium botulinum
<400> 931
atgaatataa ataatgataa ttgtagtaaa tgtataaata tattaaaaag taattgtaat 60
ggtaatttag aaaattgtat ttgccaaaag tgtgttagaa atatagaaaa gtgtataatt 120
actaagtatt gttcagaaac agaatctaca ttgagtatat aa 162
<210> 932
<211> 705
<212> DNA
<213> Clostridium botulinum
<400> 932
atggagaact ggttacaaag aactgaattt ttaataggaa aagaggctat agaaaaatta 60
aacaaaagta aaattgtggt tttaggtgtt ggaggagttg gaagttttgt aatagaagca 120
ttagttagat ctggagtagg taatataaca attgttgata atgatacaat agatataact 180
aatataaaca ggcaaatcca cgctaattta aatactgttg gaaaatctaa agttgaggta 240
atgaaagaga gaatactatc tataaatcct aattgtaatg ttaaaatcca tgaagaattt 300
ataaataaag ataatataag tgaattagtg gctaaagata cagattatgt tgtggatgct 360
atagatacgg cttcttctaa aatattaagt atagtatggt gtgataagaa taatataaac 420
ataataagta gtatgggtac agcaaataaa ttgcacccta ccaaattaag aatagctgat 480
atatatgata ctaaagtatg tccattagct aagattatga gatatgaact tagaaagagg 540
aatataaaaa gtttgaaggt tttatattca gaagaaactc caataaaaaa taataataga 600
ccattaaacg ataaaggtag gccaacgcca gctagtatag cttttgtccc accatgcgct 660
ggtcttataa tagcaggaga ggtagtaaga gatataatta aataa 705
<210> 933
<211> 1110
<212> DNA
<213> Clostridium botulinum
<400> 933
atgatattag tagcagtttg tgatagtaca agagggatct ttatccccat atttaaaaat 60
gagtttaata taaataatac taaaatagga ttgatgatta ctataagtac attgggatac 120
acagtattta catacttagg tggcatattg tgccaaaaga aagggcagaa gagggtttat 180
tctataggac ttttaataat aagtatatct ttcttactat taaattttac gcctaattat 240
ataattctta ttattttaat gtttttaata aacggaggcc aagctttctt agctatatct 300
agtaatacaa taatacctat aatttttata agttttcagg ctataataat gaatttagct 360
cattttaatt atggaatggg attagcttta tcacaaagga tttctggtat gcttttgtat 420
agaggtataa cttggagaag gatatacctt tatttatcaa ttataacttt catagtgtat 480
ctattgttat tttttattaa tatacctgtg attaataagt caaaagacga taataaatta 540
aagtcgaaag aaatttttaa agataagtta ttatattttt atatatttgc attaggattt 600
tatgtattta gcgaaatagc tacaggaaat tggttcgtta atttaatgga gaatggatac 660
agatataata aaaatcaaag ttcatattat atatttttat tttcagcttt atttgcatta 720
gggagattat tagggggatt tttagtagaa aaattcaact atataaaggc cgtatgcaca 780
tctttggctg tggctttaat gatgtatact ataggtataa cattagggca aaaggggcta 840
attttaatat cattatctgg aatatttttt tctatagtat atcctacagt agtattaact 900
attagcaaag tatattccac taatagttct tatgtgacgg gaatagtagt aaccttatct 960
tcttttgtaa atatgattat aagtttttta atgggatatt taaatgattt aataggtatt 1020
tatacatcat attatcttat tcctataagt ttatttattt ctttaatgtt tatgttttta 1080
atacacaaaa atataaaaaa attagcttaa 1110
<210> 934
<211> 945
<212> DNA
<213> Clostridium botulinum
<400> 934
atgaacaata aatttaaggt aagcatagaa ttagctaaag gtacagtgga tgaatatata 60
gttaaagata ttacaggtat aagtataggt agaatattca tattagagtt atctaaaaaa 120
aataaatatg gttgttttag attaaatctt tatagagatg gtgaaaattc aaatatttat 180
ttaaattata tattaaaaga ttttttacaa tatttatttt ataaaaaaga agtttgtaaa 240
ataaatatta taataaatga aaatatgaat acaaatgttt ttatagaata tggattttat 300
ttagaaggaa ttataaatga tagtagatta atagatggta taaaaactag tgaattttta 360
tttggattag atatagatac ttttaggaaa gctaatttgt ataaagaatt aagtatagaa 420
gggaaaaata taagcttaaa gctattgacg cctataaatg cacaagaatt attagattat 480
tatataagaa atgaaaggca tctaaaaagc tatgaaccca cacgagataa aactttttat 540
actttaaaag agcaaaggga tttattaatg gattcatata aacaatattt aaatggaaat 600
agtttagaac ttggtatata taaagataaa aaatttatag gtaaaataaa gatatcaaat 660
ataataatgg gcatatttaa aaattgtatt gtaggatatt caatagacaa agatttccaa 720
ggaaatggat atatgaagga agcacttaaa ttattgatag attatacatt taatgaaatt 780
gatatacata gaatagaagc ttcaacttta atagataata ttagatctca aaaagtattg 840
gaagggtgcg gatttaaaaa gctaggtata aatgaaaaat acttatatat agatggaaaa 900
tggcaagatc atgttactta ttatatagta aataataata tataa 945
<210> 935
<400> 935
000
<210> 936
<400> 936
000
<210> 937
<400> 937
000
<210> 938
<400> 938
000
<210> 939
<400> 939
000
<210> 940
<400> 940
000
<210> 941
<400> 941
000
<210> 942
<400> 942
000
<210> 943
<400> 943
000
<210> 944
<400> 944
000
<210> 945
<400> 945
000
<210> 946
<400> 946
000
<210> 947
<400> 947
000
<210> 948
<400> 948
000
<210> 949
<400> 949
000
<210> 950
<400> 950
000
<210> 951
<211> 445
<212> PRT
<213> Clostridium botulinum
<400> 951
Met Ser Thr His Leu Thr Glu Thr Trp Glu Lys Ala Ile Asn Ile Ile
1 5 10 15
Lys Gly Glu Leu Thr Glu Val Ser Phe Asn Thr Trp Ile Lys Ser Ile
20 25 30
Asn Pro Ile Ser Leu Glu Asn Asn Ser Leu Lys Leu Ala Val Pro Asn
35 40 45
Asp Phe Thr Lys Gly Ile Leu Glu Ser Arg Tyr Lys Asp Leu Ile Val
50 55 60
Asn Ala Leu Lys Leu Leu Thr Ser Lys Lys Tyr Asn Ile Asp Phe Ile
65 70 75 80
Val Thr Thr Glu Glu Lys Ile Glu Lys Asn His Asn Asn Glu Lys Ser
85 90 95
Asn Ile Val Val Asn Asp Glu Met Ser Thr Met Leu Asn Pro Lys Tyr
100 105 110
Thr Phe Asp Ser Phe Val Ile Gly Asn Ser Asn Arg Phe Ala His Ala
115 120 125
Ala Ser Leu Ala Val Ala Glu Ser Pro Ala Lys Ala Tyr Asn Pro Leu
130 135 140
Phe Ile Tyr Gly Gly Val Gly Leu Gly Lys Thr His Leu Met His Ala
145 150 155 160
Ile Gly His Tyr Ile Leu His Asn Asn Pro Lys Ser Gln Val Val Tyr
165 170 175
Val Ser Ser Glu Lys Phe Thr Asn Glu Leu Ile Asn Ser Ile Lys Asp
180 185 190
Asp Lys Asn Val Glu Phe Arg Asn Lys Tyr Arg Asn Ile Asp Ile Leu
195 200 205
Leu Val Asp Asp Ile Gln Phe Ile Ala Gly Lys Glu Arg Thr Gln Glu
210 215 220
Glu Phe Phe His Thr Phe Asn Ala Leu Tyr Glu Ala Asn Lys Gln Ile
225 230 235 240
Ile Ile Ser Ser Asp Arg Pro Pro Lys Glu Ile Pro Thr Leu Glu Asp
245 250 255
Arg Leu Arg Ser Arg Phe Glu Trp Gly Leu Ile Ala Asp Ile Gln Ala
260 265 270
Pro Asp Phe Glu Thr Arg Met Ala Ile Leu Lys Lys Lys Ala Asp Val
275 280 285
Glu Lys Leu Asn Ile Pro Asn Glu Val Met Val Tyr Ile Ala Thr Lys
290 295 300
Ile Lys Ser Asn Ile Arg Glu Leu Glu Gly Ala Leu Ile Arg Ile Val
305 310 315 320
Ala Phe Ser Ser Leu Thr Asn Lys Glu Ile Ser Val Asp Leu Ala Ser
325 330 335
Glu Ala Leu Lys Asp Ile Ile Ser Ser Lys Gln Thr Arg Gln Val Thr
340 345 350
Ile Asp Ile Ile Gln Glu Val Val Ala Asn Tyr Tyr Asn Leu Lys Ile
355 360 365
Glu Asp Leu Lys Ser Ala Arg Arg Thr Arg Asn Ile Ala Phe Pro Arg
370 375 380
Gln Ile Ala Met Tyr Leu Ser Arg Lys Leu Thr Asp Met Ser Leu Pro
385 390 395 400
Lys Ile Gly Glu Glu Phe Gly Gly Arg Asp His Thr Thr Val Ile His
405 410 415
Ala Tyr Glu Lys Ile Ser Asn Asn Leu Lys Lys Asp Glu Ser Leu Gln
420 425 430
Asn Ala Ile Asn Glu Leu Asn Lys Arg Ile Asn Gln Lys
435 440 445
<210> 952
<211> 367
<212> PRT
<213> Clostridium botulinum
<400> 952
Met Lys Ile Thr Cys Gln Lys Asn Ile Leu Leu Glu Gly Ile Ser Ile
1 5 10 15
Val Gln Lys Ala Val Thr Gly Lys Ser Thr Leu Pro Ile Leu Ser Gly
20 25 30
Ile Leu Ile Arg Ala Asn Lys Asn Glu Leu Val Leu Thr Gly Ser Asp
35 40 45
Met Asp Leu Ser Ile Glu Thr Lys Val Lys Ala Asn Ile Leu Glu Glu
50 55 60
Gly Thr Ile Val Leu Asp Ala Arg Leu Phe Gly Glu Ile Ile Arg Lys
65 70 75 80
Leu Pro Asn Asp Leu Ile Glu Ile Asn Thr Leu Glu Asp Asn Ser Ile
85 90 95
Glu Ile Ile Cys Gln Asn Ser Arg Phe Asn Leu Ile Tyr Met Asn Pro
100 105 110
Asp Glu Phe Pro Asn Pro Pro Ile Ile Asn Glu Asn Met Ile Phe Ser
115 120 125
Ile Gly Glu Asn Lys Leu Lys Asn Met Ile Lys Gly Thr Ile Phe Ala
130 135 140
Thr Ala Gln Asp Glu Thr Arg Pro Ile Leu Thr Gly Val Leu Phe Gln
145 150 155 160
Ile Lys Asp Lys Met Leu Asn Leu Val Ala Leu Asp Gly Tyr Arg Leu
165 170 175
Ala Leu Arg Ser Glu Ile Val Asp Asn Asp Asn Thr Ile Asn Ala Val
180 185 190
Ile Pro Gly Lys Thr Leu Asn Glu Val Ser Lys Ile Leu Glu Glu Asp
195 200 205
Asp Glu Asn Val Asn Ile Thr Phe Thr Pro Asn His Ile Leu Phe Ser
210 215 220
Ile Gly Glu Thr Lys Ile Ile Ser Arg Leu Leu Glu Gly Glu Phe Ile
225 230 235 240
Ser Tyr Lys Ser Ile Ile Pro Glu Glu Tyr Asn Leu Lys Ile Ile Ala
245 250 255
Lys Arg Leu Glu Leu Leu Asn Ser Ile Glu Arg Ala Ser Leu Met Ala
260 265 270
Lys Glu Gly Asn Thr Asn Leu Val Lys Phe Asp Phe Ser Asn Asp Lys
275 280 285
Ile Val Ile Thr Ser Asn Ser Gln Leu Gly Met Val Arg Glu Glu Leu
290 295 300
Lys Val Val Leu Gln Gly Glu Asp Leu Gln Ile Ala Phe Asn Ser Lys
305 310 315 320
Tyr Leu Leu Asp Val Leu Lys Thr Met Glu Gly Asp Glu Val Val Leu
325 330 335
Glu Phe Ser Ser Ser Val Ser Pro Cys Ile Ile Lys Asn Thr Glu Leu
340 345 350
Asn Asn Cys Thr Tyr Leu Val Leu Pro Val Arg Leu Asn Asn Asn
355 360 365
<210> 953
<211> 68
<212> PRT
<213> Clostridium botulinum
<400> 953
Met Ile Glu Val Lys Ile Asn Ser Glu Val Ile Lys Leu Asp Ser Phe
1 5 10 15
Leu Lys Trp Ser Gly Ala Thr Thr Leu Gly Ser Glu Ala Lys Phe Phe
20 25 30
Ile Gln Asn Gly Glu Val Lys Val Asn Gly Glu Ile Glu Lys Arg Arg
35 40 45
Gly Arg Lys Leu Lys Ile Gly Asp Leu Ile Glu Phe Asn Asn Glu Thr
50 55 60
Tyr Lys Ile Ile
65
<210> 954
<211> 364
<212> PRT
<213> Clostridium botulinum
<400> 954
Met Tyr Ile Lys Asn Val His Leu Ile Asn Phe Arg Asn Tyr Asp Asp
1 5 10 15
Met Tyr Leu Glu Leu Ser Pro Asn Thr Asn Ile Phe Val Gly Asn Asn
20 25 30
Ala Gln Gly Lys Thr Asn Ile Leu Glu Ser Ile Tyr Tyr Ser Ser Ile
35 40 45
Gly Lys Ser His Arg Thr Asn Lys Asp Lys Asp Leu Ile Lys Trp Asp
50 55 60
Lys Asn Asn Thr Tyr Leu Arg Thr Tyr Val Ser Arg Glu Arg Leu Asp
65 70 75 80
Lys Thr Ile Asp Ile Asn Ile Phe Lys Asn Gly Lys Lys Ala Ile Thr
85 90 95
Val Asn Lys Ile Lys Ile Lys Lys Ile Ser Glu Leu Met Gly Asn Leu
100 105 110
Asn Val Val Met Phe Ser Pro Glu Asp Leu Arg Ile Ile Lys Asp Ser
115 120 125
Pro Gly Asn Arg Arg Lys Phe Leu Asp Ile Glu Leu Cys Lys Ile Asn
130 135 140
Asn Val Tyr Tyr His Asp Leu Val Gln Tyr Asn Lys Ile Leu Ser Glu
145 150 155 160
Arg Asn Thr Ala Leu Lys Asn Trp Asn Asn Lys Ile Asn Asp Ile Ile
165 170 175
Asp Val Tyr Asp Glu Gln Leu Ser Lys Tyr Gly Ala Phe Ile Ile Lys
180 185 190
Glu Arg Asn Lys Tyr Leu Asp Lys Leu Asn Ile Ile Gly Lys Asn Ile
195 200 205
His Asn Lys Ile Thr Asn Asp Leu Glu Asp Ile Asn Phe Arg Tyr Leu
210 215 220
Thr Asn Ile Lys Asp Phe Asp Asn Ala Glu Lys Glu Leu Leu Met Leu
225 230 235 240
Phe Lys Lys Asn Arg Lys Lys Asp Leu Glu Arg Asn Ser Thr Ser Ile
245 250 255
Gly Pro His Arg Asp Asp Phe Glu Val Ser Ile Asn Asn Ile Asp Thr
260 265 270
Arg Ile Phe Gly Ser Gln Gly Gln Gln Arg Thr Ala Val Leu Thr Leu
275 280 285
Lys Phe Ala Ser Leu Glu Ile Ile Lys Asn Ile Ile Gly Glu Tyr Pro
290 295 300
Val Leu Leu Leu Asp Asp Val Leu Ser Glu Leu Asp Ser Asn Arg Gln
305 310 315 320
Lys Phe Val Leu Asn Ser Ile Asp Lys Ile Gln Thr Ile Ile Thr Cys
325 330 335
Thr Gly Ile Glu Glu Ile Asp Lys Tyr Leu Asp Lys Lys Gln Ser Gln
340 345 350
Leu Tyr Leu Val Asn Asn Gly Lys Ile Lys Arg Val
355 360
<210> 955
<211> 87
<212> PRT
<213> Clostridium botulinum
<400> 955
Met Phe Leu His Leu Gly Glu Asn Val Val Val Pro Ile Lys Asp Val
1 5 10 15
Ile Gly Ile Phe Asp Met Glu Thr Ser Met Tyr Ser Ser Asp Thr Ile
20 25 30
Gln Phe Leu Arg Leu Ala Glu Glu Asp Gly Phe Val Glu Arg Ile Thr
35 40 45
Lys Glu Lys Pro Lys Ser Phe Val Ile Ala Glu Val Asp Lys Lys Ser
50 55 60
Lys Ile Tyr Leu Ser Pro Ile Ser Ser Ala Thr Leu Thr Lys Arg Thr
65 70 75 80
Lys Val Leu Tyr Asn Glu Leu
85
<210> 956
<211> 637
<212> PRT
<213> Clostridium botulinum
<400> 956
Met Ser Gln Glu Asn Lys Gln Val Tyr Asp Glu Ser Gln Ile Gln Val
1 5 10 15
Leu Glu Gly Leu Glu Ala Val Arg Lys Arg Pro Gly Met Tyr Ile Gly
20 25 30
Ser Thr Ser Leu Arg Gly Leu His His Leu Val Tyr Glu Ile Val Asp
35 40 45
Asn Ser Ile Asp Glu Ala Leu Ala Gly Phe Cys Thr His Ile Glu Val
50 55 60
Phe Ile His Lys Asp Asn Ser Ile Thr Val Val Asp Asp Gly Arg Gly
65 70 75 80
Met Pro Val Gly Met His Ser Lys Val Lys Lys Pro Ala Val Glu Val
85 90 95
Ile Met Thr Ile Leu His Ala Gly Gly Lys Phe Gly Gly Gly Gly Tyr
100 105 110
Lys Val Ser Gly Gly Leu His Gly Val Gly Ala Ser Val Val Asn Ala
115 120 125
Leu Ser Glu Gln Cys Glu Val Glu Val Arg Arg Glu Gly His Ile Trp
130 135 140
Lys Gln Lys Phe Glu Arg Gly Ile Thr Lys Thr Gly Leu Asp Ile Val
145 150 155 160
Gly Asp Thr Glu Asp His Gly Thr Lys Ile Tyr Phe Lys Pro Asp Ile
165 170 175
Glu Ile Phe Asp Glu Leu Glu Phe Glu Tyr Asp Thr Leu Ala His Arg
180 185 190
Leu Arg Glu Leu Ala Phe Leu Asn Lys Gly Ile Lys Ile Ser Leu Thr
195 200 205
Asp Glu Arg Tyr Asp Lys Lys Glu Met Phe His Tyr Glu Gly Gly Leu
210 215 220
Arg Ser Phe Val Leu Tyr Leu Asn Arg Asn Lys Glu Lys Leu His Gln
225 230 235 240
Gln Pro Ile Tyr Val Asp Glu Asn Lys Asp Gly Cys Ile Val Glu Ile
245 250 255
Ala Met Gln Tyr Asn Asp Gly Tyr Ala Glu Asn Ile Phe Ser Phe Ala
260 265 270
Asn Asn Ile Asp Thr Ile Glu Gly Gly Thr His Leu Ala Gly Phe Lys
275 280 285
Ser Ala Leu Thr Arg Val Ile Asn Asp Tyr Ala Arg Lys Phe Asn Tyr
290 295 300
Leu Lys Asp Thr Asp Lys Asn Leu Ser Gly Asp Asp Val Arg Glu Gly
305 310 315 320
Leu Thr Ala Val Ile Ser Val Lys Leu Thr Asp Pro Gln Phe Glu Gly
325 330 335
Gln Thr Lys Thr Lys Leu Gly Asn Gly Glu Val Arg Gly Ile Val Asp
340 345 350
Thr Ile Val Gly Gln Ser Ile Gly Ser Phe Leu Glu Glu Asn Pro Asn
355 360 365
Val Gly Lys Ile Ile Ile Glu Lys Gly Leu Ser Ala Ser Arg Ala Arg
370 375 380
Glu Ala Ala Lys Arg Ala Arg Glu Leu Thr Arg Arg Lys Ser Ile Leu
385 390 395 400
Glu Ser Thr Ser Leu Pro Gly Lys Leu Ser Asp Cys Ser Ser Lys Asp
405 410 415
Pro Ser Leu Cys Glu Ile Tyr Leu Val Glu Gly Asp Ser Ala Gly Gly
420 425 430
Ser Ala Lys Gln Gly Arg Asn Arg Glu Phe Gln Ala Ile Leu Pro Leu
435 440 445
Lys Gly Lys Ile Met Asn Val Glu Lys Gln Arg Leu Asp Lys Ile Leu
450 455 460
Ala Ser Asp Glu Ile Arg Ala Met Ile Thr Ala Phe Gly Ala Gly Ile
465 470 475 480
Gly Lys Glu Phe Asp Ile Asp Lys Ile Arg Tyr Asn Arg Ile Ile Ile
485 490 495
Met Thr Asp Ala Asp Val Asp Gly Ala His Ile Arg Thr Leu Leu Leu
500 505 510
Thr Phe Phe Tyr Arg Tyr Met Lys Glu Leu Ile Glu Glu Gly His Val
515 520 525
Tyr Ile Ala Gln Pro Pro Leu Tyr Arg Ile Tyr Lys Ala Lys Lys Glu
530 535 540
Ile Tyr Val Tyr Ser Asp Pro Glu Leu Asp Ala Ala Leu Leu Glu Leu
545 550 555 560
Gly Gly Lys Asp Thr Asn Thr Asn Ile Gln Arg Tyr Lys Gly Leu Gly
565 570 575
Glu Met Asn Pro Glu Gln Leu Trp Glu Thr Thr Met Asp Pro Glu His
580 585 590
Arg Thr Leu Leu Gln Val Thr Val Glu Asp Ala Met Glu Ala Asp Glu
595 600 605
Ile Phe Thr Ile Leu Met Gly Thr Lys Val Glu Pro Arg Arg Asp Phe
610 615 620
Ile Glu Ser Asn Ala Asp Lys Val Val Asn Leu Asp Ile
625 630 635
<210> 957
<211> 821
<212> PRT
<213> Clostridium botulinum
<400> 957
Met Leu Asn Glu Gly Lys Ile Leu Pro Val Asp Val Ser Lys Glu Met
1 5 10 15
Lys Lys Cys Tyr Ile Asp Tyr Ala Met Ser Val Ile Ala Gly Arg Ala
20 25 30
Leu Pro Asp Val Arg Asp Gly Leu Lys Pro Val His Arg Arg Ile Ile
35 40 45
Tyr Ser Met Gln Gly Leu Gly Leu Ala Pro Glu Lys Gly Tyr Arg Lys
50 55 60
Cys Ala Arg Ile Val Gly Asp Val Leu Gly Lys Tyr His Pro His Gly
65 70 75 80
Asp Thr Ala Val Tyr Glu Ala Leu Val Arg Met Ala Gln Asn Phe Ser
85 90 95
Ile Arg Tyr Thr Leu Val Asp Gly His Gly Asn Phe Gly Ser Val Asp
100 105 110
Gly Asp Gly Ala Ala Ala Met Arg Tyr Thr Glu Ala Lys Met Ser Lys
115 120 125
Ile Ser Met Glu Leu Ile Lys Asp Ile Asn Lys Asn Thr Val Asp Phe
130 135 140
Ile Pro Asn Phe Asp Gly Glu Glu Glu Glu Pro Ser Val Leu Pro Ser
145 150 155 160
Arg Phe Pro Asn Leu Leu Val Asn Gly Ser Ser Gly Ile Ala Val Gly
165 170 175
Met Ala Thr Asn Ile Pro Pro His Asn Leu Thr Glu Val Ile Asp Gly
180 185 190
Ile Ile Met Leu Ile Glu Asn Glu Asp Val Asn Ile Leu Asp Leu Met
195 200 205
Thr Lys Ile Lys Gly Pro Asp Phe Pro Thr Ser Gly Leu Ile Val Gly
210 215 220
Thr Arg Gly Ile Arg Glu Ala Tyr Glu Thr Gly Arg Gly Lys Val Ile
225 230 235 240
Ile Arg Ala Lys Ala Glu Ile Glu Glu Glu Lys Gly Lys Asn Lys Ile
245 250 255
Ile Val Thr Glu Ile Pro Tyr Gln Val Asn Lys Ala Arg Leu Ile Glu
260 265 270
Asn Met Ala Asn Leu Val Lys Asp Lys Lys Ile Asn Gly Ile Ser Asp
275 280 285
Leu Arg Asp Glu Ser Asp Arg Asp Gly Met Arg Ile Val Ile Glu Leu
290 295 300
Lys Arg Asp Ala Asn Pro Asn Ile Val Leu Asn Gln Leu Tyr Lys His
305 310 315 320
Thr Lys Leu Gln Asp Thr Phe Gly Ile Ile Met Leu Ala Leu Val Asn
325 330 335
Asn Gln Pro Gln Ile Leu Asn Leu Lys Glu Ile Leu Val Asn Tyr Val
340 345 350
Glu Phe Gln Lys Glu Val Ile Arg Arg Arg Thr Arg Phe Asp Leu Asp
355 360 365
Lys Ala Leu Ala Arg Ala His Ile Leu Glu Gly Leu Arg Ile Ala Leu
370 375 380
Asp His Ile Asp Glu Val Ile Lys Leu Ile Arg Ala Ser Lys Asn Thr
385 390 395 400
Ala Glu Ala Lys Glu Gly Leu Met Asn Asn Phe Asn Leu Ser Glu Lys
405 410 415
Gln Ala Gln Ala Ile Leu Asp Met Lys Leu Gln Arg Leu Thr Gly Leu
420 425 430
Glu Arg Glu Lys Ile Glu Glu Glu Tyr Lys Glu Leu Met Glu Lys Ile
435 440 445
Ser Tyr Phe Arg Glu Ile Leu Asp Lys Glu Glu Leu Val Leu Ser Ile
450 455 460
Ile Lys Glu Glu Leu Ile Glu Ile Lys Asn Lys Tyr Gly Asp Glu Arg
465 470 475 480
Lys Thr Glu Ile Val Lys Gly Glu His Asp Ile Asp Ile Glu Asp Leu
485 490 495
Ile Glu Asp Lys Lys Val Ile Val Thr Leu Thr His Gly Gly Tyr Ile
500 505 510
Lys Arg Leu Asp Met Asp Thr Tyr Ser Ser Gln Lys Arg Gly Gly Lys
515 520 525
Gly Ile Gln Ala Thr Ser Thr Lys Gln Asp Asp Phe Ile Glu Asn Met
530 535 540
Phe Val Thr Ser Thr His Ser Thr Ile Leu Phe Phe Thr Asn Arg Gly
545 550 555 560
Lys Val Tyr Lys Leu Lys Ala Tyr Glu Ile Pro Glu Ala Gly Arg Thr
565 570 575
Ala Lys Gly Thr Asn Ile Val Asn Leu Ile Pro Ile Glu Asn Asn Glu
580 585 590
Lys Ile Gln Thr Val Ile Gly Leu Lys Asp Ile Asp Asp Met Lys His
595 600 605
Phe Val Met Cys Thr Arg Asn Gly Ile Ile Lys Lys Thr Glu Ile Ser
610 615 620
Lys Tyr Ser Ser Ile Arg Lys Gly Gly Leu Asn Ala Ile Asn Leu Arg
625 630 635 640
Glu Asp Asp Glu Leu Ile Asp Val Lys Met Thr Lys Gly Asn Asp Glu
645 650 655
Ile Ile Val Val Thr Gln Asn Gly Tyr Cys Ile Arg Phe Asn Glu Glu
660 665 670
Asp Val Arg Pro Met Gly Arg Val Ala Thr Gly Val Lys Ala Ile Thr
675 680 685
Leu Arg Lys Ala Asp Lys Ala Val Ser Met Asp Val Val Ile Glu Asp
690 695 700
Glu Thr Leu Leu Ser Ile Ser Glu Asn Gly Phe Gly Lys Arg Thr Asp
705 710 715 720
Ile Glu Glu Tyr Pro Ile His Arg Arg Gly Gly Lys Gly Val Ile Thr
725 730 735
Tyr Lys Ile Thr Asp Lys Thr Gly Pro Ile Val Gly Ala Arg Phe Val
740 745 750
Lys Glu Asp Asp Glu Leu Met Leu Val Asn Ser Gly Asp Val Ala Ile
755 760 765
Arg Ile Asn Val Ser Glu Ile Ser Lys Thr Ser Arg Asn Ala Met Gly
770 775 780
Val Lys Leu Met Arg Thr Ser Glu Glu Glu Lys Ile Val Ala Ile Ala
785 790 795 800
Lys Ile Lys Ser Glu Asp Ile Ile Glu Glu Glu Ile Leu Asn Glu Glu
805 810 815
Asn Leu Asn Glu Glu
820
<210> 958
<211> 150
<212> PRT
<213> Clostridium botulinum
<400> 958
Met Glu Tyr Glu Asp Ile Val Tyr Ile Asn Met His Leu Asp Asn Glu
1 5 10 15
Glu Leu Lys Ile Phe Asn Lys Leu Ser Ile Ser Glu Gln Lys His Ser
20 25 30
Ile Lys Val Ala Tyr Asp Ile Glu Lys Leu Tyr Glu Lys Gly Lys Tyr
35 40 45
Asn Leu Thr Lys Asp Glu Phe Ile Lys Val Ala Leu Leu His Asp Ile
50 55 60
Gly Lys Leu Asn Tyr Lys Val Asp Ile Ile Lys Lys Ser Ile Ile Val
65 70 75 80
Ile Met Asp Arg Ile Thr Asn Ser Arg Ile Lys Lys Phe Gln Asn Ile
85 90 95
Lys Ser Val Tyr Val His Tyr Asn His Pro Tyr Leu Gly Tyr Cys Ile
100 105 110
Leu Lys Gln Tyr Asn Lys Tyr Ser Glu Lys Met Leu Tyr Leu Ile Lys
115 120 125
Asn His His Asn Glu Asn Ile Ile Asn Lys Glu Leu Ser Leu Leu Ile
130 135 140
Tyr Ser Asp Asn Leu Asn
145 150
<210> 959
<211> 173
<212> PRT
<213> Clostridium botulinum
<400> 959
Met Asn Ser Ile Glu Arg Arg Lys Asn Ile Glu Asn Met Leu Met Lys
1 5 10 15
Asn Asn Lys Pro Ile Lys Gly Ser Glu Met Gly Gln Lys Leu Gly Val
20 25 30
Thr Arg Gln Val Ile Val Lys Asp Ile Ala Ile Leu Arg Ala Ser Gly
35 40 45
Lys Asn Ile Ile Ala Thr Pro Glu Gly Tyr Leu Ile Pro Asn Glu Asn
50 55 60
Lys Gln Leu Ile Arg Lys Ile Ile Ala Val Cys His Asp Ser Lys Asp
65 70 75 80
Ile Lys Asp Glu Leu Glu Ile Ile Ile Lys Phe Gly Gly Ile Val Glu
85 90 95
Asp Val Val Val Glu His Pro Ile Tyr Gly Glu Ile Lys Ala Met Leu
100 105 110
Met Ile Lys Ser Met Tyr Asp Ile Asp Asn Phe Ile Lys Asn Ile Gln
115 120 125
Asn Asn Lys Ala Glu Pro Leu Leu Ile Leu Thr Gly Gly Ile His Leu
130 135 140
His Thr Ile Ser Ser Asp Asn Glu Asp Ile Met Asn Lys Ile Ile Glu
145 150 155 160
Gln Leu Asn Gln Lys Asn Tyr Leu Val Asp Glu Glu Val
165 170
<210> 960
<211> 387
<212> PRT
<213> Clostridium botulinum
<400> 960
Met Asp Lys Val Ala Leu Leu Lys Cys Asp Glu Tyr Asp Leu Glu Lys
1 5 10 15
Val Glu Lys Thr Ile Arg Asn Gly Phe Glu Leu Leu Gly Gly Asn Ser
20 25 30
Phe Leu Asn Lys Leu Ile Pro Tyr Asn Ser Lys Val Leu Leu Lys Pro
35 40 45
Asn Met Leu Ser Ile Glu Asn Glu Gly Ser Pro Val Val Thr Asn Ser
50 55 60
Val Val Phe Glu Ala Val Ile Arg Ile Leu Gly Asp Tyr Ser Asn Asn
65 70 75 80
Ile Ser Phe Gly Asp Ser Pro Gly Phe Gly Asp Ser Lys Lys Ala Ala
85 90 95
Glu Lys Ser Gly Leu Leu Asn Ile Ala Lys Lys Tyr Asn Ile Glu Phe
100 105 110
Lys Asp Phe Lys Glu Ser Ile Asn Val Ser Cys Asp Asn Ser Ile Leu
115 120 125
Cys Arg Ser Trp Thr Val Ala Lys Ala Ala Tyr Glu Thr Asp Val Leu
130 135 140
Ile Thr Leu Pro Lys Leu Lys Thr His Ala Met Ala Tyr Phe Thr Gly
145 150 155 160
Ala Val Lys Asn Gln Phe Gly Cys Ile Pro Gly Thr Leu Lys Ala Thr
165 170 175
Trp His Thr Arg Met Pro Asn Ala Asn Asn Phe Cys Lys Met Leu Leu
180 185 190
Asp Leu Asn Thr Leu Leu Glu Thr Asp Phe Ala Ile Leu Asp Gly Ile
195 200 205
Ile Ala Met Glu Gly Asn Gly Pro Lys Asn Gly Thr Pro Tyr Asn Leu
210 215 220
Asn Thr Ile Ile Met Gly Asp Ser Leu Thr Ala Val Asp Ser Val Ala
225 230 235 240
Val Lys Ile Ile Gly Tyr Asp Asn Pro Leu Asp Ile Pro Val Leu Lys
245 250 255
Glu Ala Tyr Asp Ser Asn Trp Gly Ser Val Phe Leu Lys Asp Ile Asp
260 265 270
Ile Leu Gly Glu Lys Ile Asp Ser Met Val Val Asp Asn Phe Lys Leu
275 280 285
Cys Arg Glu Gly Gly Asp Phe Tyr Phe Ile Asn Pro Lys Val Thr Asn
290 295 300
Phe Leu Lys Asp Ile Ile Ala Pro Asp Pro Thr Leu Ile Lys Glu Lys
305 310 315 320
Cys Ile Gly Cys Asn Arg Cys Ala Glu Val Cys Pro Glu Lys Pro Tyr
325 330 335
Val Ile Asp Met Ile Lys Lys Gly Asp Lys Lys Ile Pro Val Trp Asn
340 345 350
Met Lys Lys Cys Ile Arg Cys Phe Cys Cys Gln Glu Leu Cys Pro Lys
355 360 365
Gly Ala Ile Glu Thr Lys Tyr Ser Phe Ile Gly Arg Phe Leu Asn Arg
370 375 380
Asp Gly Arg
385
<210> 961
<211> 893
<212> PRT
<213> Clostridium botulinum
<400> 961
Met Lys Asn Lys Lys Ala Leu Phe Ile Pro Leu Phe Ile Ile Ile Leu
1 5 10 15
Phe Ile Ala Phe Phe Asn Lys Ile Ile Asn Phe Ile Ile Asn Ile Lys
20 25 30
Trp Phe Lys Glu Val Asn Tyr Leu Ala Val Tyr Phe Thr Lys Met Arg
35 40 45
Ala Ile Ile Ile Leu Met Ile Pro Ile Phe Ile Ile Phe Phe Ile Ser
50 55 60
Ile Trp Met Tyr Tyr Lys Ser Leu Ile Ile Asn Lys Asn Lys Ser Val
65 70 75 80
Val Asp Ile Gly Leu Asn Lys Asn Asn Tyr Gly Lys Lys Leu Phe Phe
85 90 95
Ile Phe Asn Phe Ile Val Ser Ile Phe Leu Ala Tyr Ile Phe Ser Ser
100 105 110
Ser Tyr Trp Tyr Arg Ile Leu Gln Phe Asn Asn Ser Val Asp Phe Asn
115 120 125
Val Lys Asp Pro Ile Phe Phe Lys Asp Val Ser Phe Tyr Ile Phe Lys
130 135 140
Leu Pro Leu Phe Glu Ser Leu Tyr Lys Val Ile Ile Ser Leu Leu Leu
145 150 155 160
Phe Leu Val Ile Thr Thr Phe Ile Ala Tyr Phe Ile Leu Glu Ala Lys
165 170 175
Tyr Lys Ile Gln Ser Arg Lys Asp Ile Asn Leu Lys Asn Ile Asn His
180 185 190
Gly Ile Lys Ser Phe Ala Gly Lys Gln Leu Ala Ile Val Ser Gly Leu
195 200 205
Ile Ile Leu Phe Ile Ser Phe Gly His Leu Ile Lys Ile Trp Asn Leu
210 215 220
Val Tyr Ser Ser Asn Gly Val Ser Phe Gly Ala Ser Tyr Thr Asp Val
225 230 235 240
His Ala Thr Leu Leu Phe Tyr Lys Ile Ile Val Val Ile Thr Leu Ile
245 250 255
Ser Ser Ile Val Thr Leu Leu Ser Ile Val Lys Gly Lys Phe Lys Pro
260 265 270
Val Ser Ile Cys Ile Gly Ile Thr Ile Phe Leu Ile Val Ser Gln Asn
275 280 285
Ile Ala Ser Phe Leu Val Gln Asn Phe Ile Val Lys Ser Asn Glu Lys
290 295 300
Thr Leu Glu Gln Pro Tyr Ile Lys Asn Asn Ile Asp Leu Thr Arg Lys
305 310 315 320
Ala Phe Ala Leu Asp Asp Ile Glu Ile Arg Asp Phe Asp Ile Lys Asn
325 330 335
Asp Leu Gln Lys Gln Asp Ile Ala Asp Asn Lys Ala Ser Ile Asp Asn
340 345 350
Val Arg Ile Asn Ser Phe Lys Pro Thr Leu Glu Phe Tyr Asn Gln Val
355 360 365
Gln Ile Ile Arg Tyr Tyr Tyr Thr Phe Asn Asp Ile Asp Ile Asp Arg
370 375 380
Tyr Asn Ile Asn Gly Lys Tyr Asn Gln Val Phe Leu Ala Ala Arg Glu
385 390 395 400
Ile Asp Thr Asp Ala Leu Asn Pro Asn Thr Trp Gln Asn Arg His Leu
405 410 415
Ile Tyr Thr His Gly Phe Gly Ala Val Met Asn Lys Val Asn Ser Val
420 425 430
Thr Ser Glu Gly Gln Pro Asp Phe Val Ile Lys Asp Ile Pro Pro Tyr
435 440 445
Asn Lys Thr Asn Ile Lys Leu Thr Asn Pro Arg Ile Tyr Phe Gly Glu
450 455 460
Lys Thr Asn Asp Tyr Val Ile Val Asn Thr Lys Ile Asn Glu Phe Asp
465 470 475 480
Tyr Pro Arg Glu Asp Ser Asn Lys Thr Asn Lys Tyr Asn Gly His Ala
485 490 495
Gly Ile Lys Met Ser Phe Ile Asn Arg Leu Leu Phe Ala Ile Asn Lys
500 505 510
Lys Asp Ile Asn Phe Leu Leu Ser Lys Asp Ile Lys Lys Asp Ser Lys
515 520 525
Ile Ile Ile Asn Arg Asn Ile Val Glu Arg Ala Lys Lys Ile Ala Pro
530 535 540
Phe Leu Thr Tyr Asp Ser Asp Pro Tyr Met Val Ile Tyr Asn Gly Lys
545 550 555 560
Ile Tyr Trp Ile Ile Asp Ala Tyr Thr Thr Thr Asn Arg Tyr Pro Tyr
565 570 575
Ser Glu Pro Tyr Asp Ser Ile Asn Tyr Ile Arg Asn Ser Ala Lys Val
580 585 590
Val Ile Asp Ser Val Asp Gly Asp Thr Asn Phe Tyr Ile Thr Asp Lys
595 600 605
Lys Asp Pro Ile Val Asn Asn Tyr Ala Lys Ile Phe Lys Gly Leu Phe
610 615 620
Lys Glu Glu Lys Asp Ala Pro Lys Glu Ile Arg Glu His Phe Arg Tyr
625 630 635 640
Pro Lys Asp Leu Phe Ser Ile Gln Ser Lys Val Leu Gly Lys Tyr His
645 650 655
Val Lys Asp Pro Gly Val Phe Tyr Asn Gly Glu Asp Leu Trp Glu Val
660 665 670
Ser Lys Asp Gln Lys His Val Glu Gly Glu Thr Asn Thr Asn Asp Ala
675 680 685
Pro Tyr Ile Ile Met Lys Leu Pro Asp Gln Asn Lys Glu Glu Met Val
690 695 700
Leu Leu Asn Tyr Phe Asn Val Met Lys Lys Asp Asn Met Ile Ala Leu
705 710 715 720
Phe Gly Ala Arg Met Asp Gly Glu Gln Tyr Gly Lys Lys Ile Leu Tyr
725 730 735
Lys Leu Pro Ser Asp Lys Thr Val Tyr Ser Pro Tyr Leu Phe Lys Gln
740 745 750
Lys Ile Asn Gln Asp Thr Asn Ile Ser Lys Glu Leu Ser Leu Trp Asn
755 760 765
Arg Glu Gly Ser Lys Val Gln Tyr Gly Asp Thr Ile Ile Leu Pro Ile
770 775 780
Lys Asn Ser Leu Leu Tyr Ile Glu Pro Leu Tyr Leu Arg Ala Ser Gly
785 790 795 800
Lys Asn Ser Ile Pro Glu Met Lys Arg Val Ile Leu Ser Tyr Asn Asp
805 810 815
Lys Leu Val Leu Ser Ser Ser Ile Gln Glu Gly Ile Lys Glu Ile Phe
820 825 830
Asn Ser Lys Asp Asn Lys Ile Asn Asp Lys Asn Glu Lys Asp Ser Thr
835 840 845
Lys Thr Ile Asp Asp Ser Lys Leu Lys Lys Ala Gln Glu Tyr Tyr Asn
850 855 860
Lys Ala Ile Glu Ala Gln Lys Asn Gly Asp Trp Thr Lys Tyr Gly Glu
865 870 875 880
Asn Ile Asn Glu Leu Gly Asn Ile Leu Asn Ser Ile Lys
885 890
<210> 962
<211> 258
<212> PRT
<213> Clostridium botulinum
<400> 962
Met Lys Phe Lys Lys Ser Val Tyr Ile Val Val Phe Thr Leu Ile Leu
1 5 10 15
Leu Phe Ile Pro Cys Phe Ile His Thr Lys Lys Asp Val Ser Thr Thr
20 25 30
Asn Asn Leu Asp Asn Lys Thr Lys Glu Ile Asn Lys Ser Glu Val Asp
35 40 45
Arg Asn Glu Met Ser Val Phe Ser Ser Asn Thr Cys Phe Lys Lys Thr
50 55 60
Tyr Tyr Ile Asn Lys Asn Lys Val Pro Val Tyr Lys Asn Phe Asp Cys
65 70 75 80
Asn Ser Glu Val Leu Tyr Tyr Leu Tyr Glu Asp Asp Ile Ile Val Ser
85 90 95
Tyr Lys Glu Gln Asn Gly Tyr Ile Phe Cys Glu Glu Gly Asn Leu Gly
100 105 110
Arg Lys Gly Trp Ile Lys Lys Asn Lys Glu Asn Leu Lys Gly Ile Leu
115 120 125
His Lys Asn Thr Glu Tyr Lys Val Asp Val Asp Leu Ile Asp Gln Lys
130 135 140
Ile Arg Val Tyr Lys Asn Asp Lys Ile Ile Lys Asn Ile Lys Cys Ser
145 150 155 160
Thr Gly Val Ile Gly Lys Gln Asp Thr Glu Thr Pro Leu Gly Ile Phe
165 170 175
Tyr Ile Thr Asn Lys Gly Lys Tyr Phe Tyr Ser Asn Lys Tyr Asn Gln
180 185 190
Gly Gly Arg Tyr Tyr Ile Lys Phe Phe Ala Asn Tyr Leu Ile His Ser
195 200 205
Ile Pro Val Asp Lys Asn Gly Asn Ile Ile Glu Glu Glu Lys Asp Lys
210 215 220
Leu Gly Phe Pro Thr Ser His Gly Cys Ile Arg Val Pro Met Glu Asp
225 230 235 240
Ser Lys Trp Leu Tyr Arg Asn Ile Pro Asn Lys Ser Leu Ile Ile Ile
245 250 255
His Tyr
<210> 963
<211> 465
<212> PRT
<213> Clostridium botulinum
<400> 963
Met Asp Tyr Asp Val Met Ile Leu Gly Gly Gly Ile Ile Gly Cys Ala
1 5 10 15
Leu Ala Tyr Glu Leu Ser Lys Tyr Ser Leu Asn Ile Ala Leu Ile Glu
20 25 30
Lys Asp Tyr Asp Ile Ala Asp Asp Val Ala Phe Ile Asn Ser Ser Val
35 40 45
Val Tyr Asp Gly Val Glu Cys Glu Asp Asp Leu Ala Ala Asn Leu Glu
50 55 60
Leu Asn Gly Asn Lys Leu Met Glu Asp Ile Ala Lys Lys Phe Lys Ile
65 70 75 80
Pro Phe Lys Lys Thr Gly Ser Leu Ile Ile Ala Gln Asn Asp Asn Glu
85 90 95
Val Tyr Asn Ile Glu Asn Met Tyr Lys Lys Ala Leu Lys Arg Gly Ile
100 105 110
Lys Asn Ile Glu Val Leu Thr Lys Asp Glu Val Glu Lys Ile Glu Pro
115 120 125
Asn Leu Asn Ile Asp Phe Lys Lys Ala Leu Tyr Ser Ser Asn Thr Ala
130 135 140
Ser Ile Ala Pro Phe Asp Leu Ala Ile Ser Tyr Gly Glu Ile Ala Phe
145 150 155 160
Asp Asn Gly Val Asn Phe Lys Leu Glu Glu Gln Val Leu Glu Ile Gln
165 170 175
Lys Leu Ser Lys Gly Tyr Lys Ile Ile Thr Asn Lys Asn Lys Phe Asn
180 185 190
Cys Asn Ile Val Ile Asn Thr Thr Pro Asp Glu Asn Phe Gly Ile Tyr
195 200 205
Ser Asp Thr Lys Arg Asn Tyr Lys Lys Ser Asn Leu Asn Tyr Leu Leu
210 215 220
Ile Glu Lys Asn Ser Ile Lys Glu Phe Asn Asn Ile Val Val Lys Leu
225 230 235 240
Gly Asn Asn Glu Asn Ile Lys Lys Ile Leu Ala Val Pro Thr Val Gln
245 250 255
Gly Ser Met Val Leu Ala Val Asp Thr Tyr Glu Lys Ile Asn Tyr Lys
260 265 270
Asn Thr Leu Asp Val Ser Ala Leu Ile Leu Asp Glu Ile Asn Glu Met
275 280 285
Asp Ile Asn Asn Phe Tyr Gln Phe Pro Tyr Tyr Asp Asp Ser Ile Val
290 295 300
Ile Asp Asp Ser Leu Ile Asp Lys Gly Tyr Ile Lys Val Ile Val Asn
305 310 315 320
His Tyr Gly Gln Val Thr Met Thr Pro Tyr Ile Ala Lys Thr Val Thr
325 330 335
Glu Thr Ile Val Ser Asn Ile Lys Cys Val Leu Lys Lys Glu Phe Ile
340 345 350
Asp Lys Arg Arg Asp Tyr Tyr Lys Phe Asn Glu Leu Ser Leu Glu Glu
355 360 365
Arg Asn Lys Ile Ile Asn Met Asp Lys Arg Tyr Gly Lys Ile Ile Cys
370 375 380
Ala Cys Asn Lys Val Thr Glu Gly Glu Ile Ile Asp Ala Ile Arg Arg
385 390 395 400
Pro Leu Gly Ala Arg Thr Leu Glu Gly Ile Lys Arg Arg Thr Gly Ala
405 410 415
Ala Phe Gly Ser Cys Gln Gly Ala Tyr Cys Leu Asn Lys Val Val Ser
420 425 430
Ile Leu Ala Arg Glu Thr Asn Lys Phe Met Thr Asp Ile Val Lys Asp
435 440 445
Ser Lys Asn Ser Lys Ile Ile Pro Cys Arg Ile Lys Glu Phe Asp Thr
450 455 460
Ile
465
<210> 964
<211> 117
<212> PRT
<213> Clostridium botulinum
<400> 964
Met Leu Arg Glu Phe Ile Cys Asn Gly Cys Asn Lys Lys Cys Ile Ile
1 5 10 15
Ser Leu Tyr Asn Ser Asn Tyr Asn Thr Ile Lys Gly Asn Gln Cys Asn
20 25 30
Leu Gly Ile Asp Tyr Ala Lys Asn Tyr Val Asn Asn Thr Lys Asp Ile
35 40 45
Phe Thr Thr Leu Val Arg Ile Lys Gly Ser Lys Tyr Asn Val Leu Pro
50 55 60
Val Lys Ser Ser Glu Pro Ile Glu Lys Ser Leu Trp Ile Glu Cys Ser
65 70 75 80
Lys Ala Leu Ser Arg Leu Tyr Val Gly Tyr Pro Ile Glu Ile Gly Asp
85 90 95
Val Ile Cys Lys Asn Ile Leu Asn Thr Gly Val Asp Ile Ile Ala Ile
100 105 110
Lys Asn Ile Asn Glu
115
<210> 965
<211> 426
<212> PRT
<213> Clostridium botulinum
<400> 965
Met Leu Asp Leu Lys Arg Ile Arg Asn Asn Ser Asn Glu Ile Lys Glu
1 5 10 15
Ala Leu Asn Asn Arg Gly Glu Lys Phe Asp Val Thr Val Ile Asp Glu
20 25 30
Val Leu Lys Leu Asp Glu Glu Arg Arg Asn Ile Leu Val Lys Val Glu
35 40 45
Val Leu Lys Ser Lys Arg Asn Gln Val Ser Ser Glu Val Pro Lys Leu
50 55 60
Lys Lys Glu Gly Lys Asp Val Ser Asn Ile Val Ala Glu Met Lys Asn
65 70 75 80
Leu Ser Glu Glu Ile Lys Gly Phe Asp Ala Thr Leu Ala Lys Ile Asp
85 90 95
Glu Lys Ile Gln Tyr Ile Met Leu Arg Ile Pro Asn Ile Pro Asn Pro
100 105 110
Gln Val Pro Asp Gly Glu Thr Asp Glu Asp Asn Ile Glu Ile Arg Asn
115 120 125
Trp Leu Glu Pro Thr Lys Phe Asp Phe Glu Pro Lys Ala His Trp Asp
130 135 140
Ile Gly Thr Asn Leu Asn Ile Leu Asp Phe Glu Arg Ala Gly Lys Val
145 150 155 160
Thr Gly Ser Arg Phe Thr Phe Tyr Lys Gly Leu Gly Ala Arg Leu Glu
165 170 175
Arg Ala Val Ile Ser Tyr Phe Leu Asp Thr His Thr Glu Lys His Gly
180 185 190
Tyr Thr Glu Ile Leu Pro Pro Tyr Met Val Asn Arg Thr Ser Met Ile
195 200 205
Gly Thr Gly Gln Leu Pro Lys Phe Glu Glu Asp Ala Phe Lys Ile Ser
210 215 220
Glu Asp Asp Tyr Phe Leu Ile Pro Thr Ala Glu Val Pro Val Thr Asn
225 230 235 240
Leu Tyr Arg Asp Glu Ile Leu Lys Gly Asp Glu Leu Pro Leu Lys His
245 250 255
Val Ala Tyr Ser Ala Cys Phe Arg Ser Glu Ala Gly Ser Ala Gly Arg
260 265 270
Asp Thr Arg Gly Leu Val Arg Gln His Gln Phe Asn Lys Val Glu Leu
275 280 285
Val Lys Phe Thr Lys Pro Glu Gln Ser Tyr Glu Glu Leu Glu Lys Leu
290 295 300
Thr Asn Asp Ala Glu Thr Val Leu Lys Glu Leu Gly Ile Pro Tyr Arg
305 310 315 320
Val Val Arg Ile Cys Lys Gly Asp Leu Gly Phe Thr Ala Ala Leu Lys
325 330 335
Tyr Asp Leu Glu Val Trp Met Pro Ser Tyr Asn Arg Tyr Val Glu Ile
340 345 350
Ser Ser Cys Ser Asn Phe Glu Asp Phe Gln Ala Arg Arg Ala Asn Ile
355 360 365
Arg Tyr Lys Glu Asp Ala Lys Ala Lys Pro Gln Tyr Val His Thr Leu
370 375 380
Asn Gly Ser Gly Val Ala Ile Gly Arg Thr Val Ala Ala Ile Leu Glu
385 390 395 400
Asn Tyr Gln Ser Glu Asp Gly Ser Val Thr Ile Pro Glu Val Leu Arg
405 410 415
Pro Tyr Met Gly Gly Arg Glu Val Ile Lys
420 425
<210> 966
<211> 295
<212> PRT
<213> Clostridium botulinum
<400> 966
Met Ile Lys Tyr Tyr Asn Arg Lys Thr Asn Asp Tyr Asp Ile Glu Lys
1 5 10 15
Val Ala Gly Glu Lys Tyr Leu Asn Trp Thr Tyr Ser Ser Pro Ile Gly
20 25 30
Met Asn Leu Leu Glu Val Phe Ile Lys Lys Lys Phe Phe Ser Lys Ile
35 40 45
Tyr Gly Phe Tyr Cys Asp Arg Lys Leu Ser Ser Lys Lys Ile Asn Lys
50 55 60
Phe Ile Asn Asp Phe Glu Ile Asp Met Ser Leu Ser Glu Asn Gln Ser
65 70 75 80
Ser Lys Phe Lys Cys Phe Asn Asp Phe Phe Thr Arg Lys Leu Lys Lys
85 90 95
Glu Ala Arg Pro Ile Lys Ala Asp Lys Asn Ile Leu Ile Ser Pro Gly
100 105 110
Asp Gly Lys Ile Leu Ala Tyr Lys Asn Leu Asn Leu Asn Ser Val Thr
115 120 125
Glu Val Lys Gly Ile Asn Tyr Ser Phe Tyr Glu Leu Ile Asn Asn Asp
130 135 140
Ser Leu Ala Lys Glu Tyr Asp Asn Gly Thr Cys Leu Val Leu Arg Leu
145 150 155 160
Cys Pro Thr Asp Tyr His Arg Phe His Phe Ile Asp Asn Gly Thr Cys
165 170 175
Glu Asn Thr Ile Lys Leu Asp Gly Phe Tyr Tyr Ser Val Asn Pro Ile
180 185 190
Ala Leu Ser Lys Ile Pro Ser Leu Phe Cys Lys Asn Lys Arg Glu Tyr
195 200 205
Ala Ile Phe His Ser Glu Asn Phe Gly Asp Val Ile Phe Met Glu Val
210 215 220
Gly Ala Thr Cys Val Gly Ser Ile Ile Gln Thr Tyr Lys Pro Asn Thr
225 230 235 240
Lys Ile Leu Lys Gly Asp Glu Lys Gly Tyr Phe Lys Phe Gly Gly Ser
245 250 255
Thr Val Ile Leu Phe Phe Lys Lys Asn Thr Ile Lys Ile Asp Asn Asp
260 265 270
Ile Leu Asn Gln Ser Lys Leu Gly Tyr Glu Thr Ser Val Ile Met Gly
275 280 285
Glu Pro Ile Gly Ser Lys Lys
290 295
<210> 967
<211> 532
<212> PRT
<213> Clostridium botulinum
<400> 967
Met Tyr Leu Asn Ser Val Gln Arg Phe Lys Glu Ile Ile Lys Ile Leu
1 5 10 15
Ala Phe Tyr Gly Phe Gly His Ile Val Asp Ser Lys Phe Asn Glu Asp
20 25 30
Lys Ala Pro Glu Asn Leu Arg Lys Ala Phe Glu Glu Leu Gly Pro Thr
35 40 45
Phe Ile Lys Ile Gly Gln Ile Leu Ser Thr Arg Pro Asp Ile Leu Ser
50 55 60
Ala Pro Tyr Ile Lys Glu Leu Ser Lys Leu Gln Asp Ser Val Pro Glu
65 70 75 80
Asp Asn Phe Ser Asp Ile Asn Lys Ile Phe Phe Glu Glu Phe Asn Ile
85 90 95
Ser Ile Glu Asp Ala Phe Leu Asn Phe Asn Arg Lys Pro Leu Ala Ser
100 105 110
Ala Ser Ile Ser Gln Val Tyr Ser Ala Lys Leu His Asn Asn Glu Glu
115 120 125
Val Ile Val Lys Ile Gln Arg Pro Glu Ile Lys Glu Lys Met Asn Met
130 135 140
Asp Leu Ala Ile Leu Arg Lys Ile Phe Thr Leu Gly Lys Ile Lys Thr
145 150 155 160
Phe Asp Thr Leu Ile Asp Pro Lys Glu Ala Ile Asp Glu Leu Ile Asn
165 170 175
Ala Thr Asn Leu Glu Leu Asp Phe Asn Asn Glu Lys Glu Asn Ile Lys
180 185 190
Lys Phe Lys Tyr Phe Asn Lys Asn Leu Lys Cys Ile Tyr Val Pro Asn
195 200 205
Thr Ile Asp Lys Tyr Cys Ser Ser Lys Ile Ile Thr Met Glu Lys Ile
210 215 220
His Gly Phe Lys Ile Thr Asp Thr Lys Ser Leu Asp Lys Leu Asn Tyr
225 230 235 240
Asp Lys Lys Asp Val Ala His Lys Leu Ala Ile Ser Ile Leu Lys Gln
245 250 255
Ile Phe Glu Asp Gly Phe Phe His Gly Asp Pro His Pro Gly Asn Ile
260 265 270
Phe Ile Tyr Glu Gly Lys Ile Cys Tyr Ile Asp Phe Gly Ile Met Gly
275 280 285
Thr Leu Ser Ser Asp Leu Lys Asn Tyr Leu Asn Lys Ala Met Val Ala
290 295 300
Val Ala Phe Lys Asp Val Asp Lys Leu Ile Ser Val Leu Leu Ser Ile
305 310 315 320
Gly Ile Lys Lys Gly Tyr Ile Asn Lys Asn Asn Leu Phe Glu Asp Ile
325 330 335
Asn Tyr Leu Phe Asp Ile Tyr Leu Ser Thr Pro Leu Lys Asn Ile Lys
340 345 350
Met Ser Thr Met Leu Gln Glu Val Phe Glu Cys Ala Asn Arg Asn Asn
355 360 365
Ile Ser Leu Pro Lys Glu Leu Thr Met Leu Ile Arg Ser Leu Ile Ile
370 375 380
Ile Glu Gly Ile Leu Glu Lys Ile Asp Pro Asn Ile Gln Ile Leu Asp
385 390 395 400
Ile Ala Ile Pro Tyr Val Glu Asn Asn Asn Lys Val Asn Phe Phe Lys
405 410 415
Asn Ile Asp Leu Asp Glu Leu Ile Leu Asn Ser Tyr Lys Thr Ala Glu
420 425 430
Asp Leu Ser Lys Ile Pro Thr Lys Thr Val Gln Leu Leu Asn Ser Ile
435 440 445
Leu Asn Gly Arg Ser Lys Ile Gln Leu Asn Val Asn Asn Leu Asp Arg
450 455 460
Ser Ile Asn Glu Leu Asn Lys Met Ile Asn Arg Ile Val Phe Ala Leu
465 470 475 480
Ile Ile Ser Ser Met Ile Ile Gly Phe Ser Phe Ile Leu Asn Ser Asn
485 490 495
Ile Gly Pro Lys Phe Tyr Asp Ile Ser Ile Ile Gly Ile Leu Gly Tyr
500 505 510
Leu Ile Ala Ala Phe Met Gly Phe Trp Leu Leu Ile Ser Ile Ile Lys
515 520 525
Ser Gly Lys Leu
530
<210> 968
<211> 106
<212> PRT
<213> Clostridium botulinum
<400> 968
Met Ile Asn Glu Phe Lys Asn Ile Leu Leu Ala Gly Ile Gly Ser Ala
1 5 10 15
Ala Tyr Thr Tyr Glu Lys Ala Ser Asn Leu Val Asp Glu Met Val Gln
20 25 30
Lys Gly Lys Ile Thr Val Asn Glu Gly Lys Glu Leu Ser Glu Glu Leu
35 40 45
Lys Arg Thr Ile Asp Glu Asn Lys Lys Ser Lys Asn Ser Ser Glu Glu
50 55 60
Lys Gln Leu Thr Arg Glu Asp Ile Ile Ser Ile Phe Asn Glu Leu Asn
65 70 75 80
Phe Val Asn Lys Asn Asp Leu Asn Asp Ile Asn Asn Lys Ile Lys Ser
85 90 95
Leu Glu Asp Lys Ile Ser Gln Leu Glu Lys
100 105
<210> 969
<211> 516
<212> PRT
<213> Clostridium botulinum
<400> 969
Met Lys Leu Glu Ile Ile Thr Glu Asp Arg Leu Gly Met Val Leu Asp
1 5 10 15
Ile Leu Asn Val Leu Tyr Asn Glu Ser Met Asp Ile Lys Ser Leu Glu
20 25 30
Val Phe Pro Lys Lys Ile Tyr Ile Lys Ile Asn Lys Lys Ile Ser Tyr
35 40 45
Asn Lys Asn Met Ile Ile Lys Lys Ile Lys Asn Ile Lys Gly Val Val
50 55 60
Arg Val Lys Lys Ile Asp Ile Leu Pro Tyr Glu Lys Asp Glu Lys Lys
65 70 75 80
Leu Phe Thr Ile Ile Asp Ser Leu Glu Glu Gly Val Ile Phe Val Asn
85 90 95
Glu Lys Cys Gln Val Glu Val Phe Asn Lys Tyr Cys Glu Asn Leu Phe
100 105 110
Asn Thr Leu Lys Glu Asn Ala Ile Arg Lys His Ile Lys Glu Ile Phe
115 120 125
Gly Gln Asn Gln Leu Ile Leu Asp Ala Leu Lys Met Gly Lys Asp Tyr
130 135 140
Asp Asn Leu Gln Val Phe Ile Asn Asn Lys Asp Arg Lys Gly Met Tyr
145 150 155 160
Val Ser Thr Ala Arg Ala Ile Lys Asp Asp Lys Asn Lys Thr Ile Gly
165 170 175
Phe Val Ile Leu Ile Lys Asp Leu Lys Glu Thr Ile Glu Ile Val Asn
180 185 190
Ser Ile Lys Tyr Lys Glu Asp Glu Ala Phe Lys Gly Ile Ile Gly Lys
195 200 205
Ser Ile Cys Ile Asp Asn Leu Lys Glu Ile Cys Lys Ser Val Ala Lys
210 215 220
Thr Asn Ser Thr Val Leu Ile Cys Gly Glu Ser Gly Thr Gly Lys Glu
225 230 235 240
Leu Phe Ala Lys Ala Ile Tyr Lys Leu Ser Leu Arg Asn Asn Lys Asn
245 250 255
Phe Val Thr Val Asn Cys Ala Gly Leu Gln Asp Asn Leu Ile Glu Ser
260 265 270
Glu Leu Phe Gly Tyr Glu Ala Gly Ser Phe Thr Gly Ala Lys Ser Asn
275 280 285
Gly Lys Glu Gly Phe Phe Lys Leu Ala Asp Lys Gly Thr Ile Phe Leu
290 295 300
Asp Glu Ile Gly Glu Leu Pro Leu Asn Ile Gln Cys Lys Phe Leu Arg
305 310 315 320
Val Leu Gln Glu Gly Thr Ile Arg Lys Ile Gly Ser Thr Lys Glu Glu
325 330 335
Lys Ile Asp Val Arg Ile Ile Ala Ala Thr Asn Lys Asn Leu Glu Glu
340 345 350
Met Val Ser Asn Gly Lys Phe Arg Glu Asp Leu Tyr Tyr Arg Leu Asn
355 360 365
Val Val Pro Ile Glu Ile Pro Pro Leu Arg Glu Arg Lys Glu Asp Ile
370 375 380
Gln Leu Leu Val Asp Asn Phe Val Lys Ala Leu Asn Lys Ser Leu Asn
385 390 395 400
Lys Asn Ile Arg Tyr Ile Asp Lys Lys Phe Ile Asn Lys Leu Leu Lys
405 410 415
Tyr Asn Phe Pro Gly Asn Ile Arg Glu Leu Gln Asn Ile Ile Glu Arg
420 425 430
Thr Met Asn Leu Cys Ser Asp Asn Ile Leu Ser Asp Lys Asn Leu Ser
435 440 445
Ile Asn Thr Asn Ile Thr Leu Asn Asn Asp Lys Asn Asn Asp Ser Gly
450 455 460
Ala Leu Leu Leu Gln Asp Ile Val Glu Lys Ala Glu Lys Cys Ala Ile
465 470 475 480
Gln Lys Val Met Asn Glu Tyr Lys Ser Leu Arg Lys Val Gly Lys Val
485 490 495
Leu Gly Val Ser His Thr Thr Val Met Asn Lys Ile Lys Lys Tyr Gly
500 505 510
Ile Val Cys Lys
515
<210> 970
<211> 400
<212> PRT
<213> Clostridium botulinum
<400> 970
Met Glu Asn Ile Lys Lys Met Gly Phe Ala Thr Lys Ala Ile His Gly
1 5 10 15
Gly Leu Ile Gly Asp Lys Gln Phe Gly Ser Leu Ala Thr Pro Ile Tyr
20 25 30
Gln Thr Ser Thr Phe Ile Phe Asp Ser Ala Glu Gln Gly Gly Arg Arg
35 40 45
Phe Ala Gly Glu Glu Ser Gly Tyr Ile Tyr Ser Arg Leu Gly Asn Pro
50 55 60
Thr Ser Thr Glu Val Glu Asn Lys Leu Ala Leu Leu Glu Cys Gly Glu
65 70 75 80
Ala Ala Val Val Ala Ala Ser Gly Met Gly Ala Ile Ala Ala Ser Leu
85 90 95
Trp Ser Ala Leu Lys Ser Gly Asp His Val Val Ala Ser Asp Thr Leu
100 105 110
Tyr Gly Cys Thr Phe Ala Leu Leu Asn His Gly Leu Thr Arg Tyr Gly
115 120 125
Val Glu Val Thr Phe Val Asp Val Ser Asn Leu Asp Glu Val Arg Asn
130 135 140
Ala Leu Lys Ala Asn Thr Lys Val Val Tyr Leu Glu Thr Pro Ala Asn
145 150 155 160
Pro Thr Leu Lys Val Thr Asp Ile Lys Gln Ile Ser Asn Met Val His
165 170 175
Glu Asn Asn Lys Glu Cys Leu Val Phe Val Asp Asn Thr Phe Cys Thr
180 185 190
Pro Tyr Ile Gln Arg Pro Leu Gln Leu Gly Ala Asp Val Val Val His
195 200 205
Ser Ala Thr Lys Tyr Leu Asn Gly His Gly Asp Val Ile Ala Gly Phe
210 215 220
Ala Val Gly Lys Glu Glu Phe Ile Asn Gln Val Lys Leu Phe Gly Ile
225 230 235 240
Lys Asp Met Thr Gly Ser Val Ile Gly Pro Phe Glu Ala Phe Leu Ile
245 250 255
Ile Arg Gly Met Lys Thr Leu Gln Leu Arg Met Glu Lys His Cys Lys
260 265 270
Asn Ala Met Glu Val Ser Lys Phe Leu Glu Ser His Pro Ala Val Lys
275 280 285
Lys Val Tyr Tyr Pro Gly Leu Glu Ser Phe Glu Tyr Tyr Glu Leu Ala
290 295 300
Lys Lys Gln Met Ser Leu Pro Gly Ala Met Ile Ser Phe Glu Leu Lys
305 310 315 320
Gly Gly Val Glu Glu Gly Lys Val Val Met Asn Asn Val Lys Leu Ala
325 330 335
Thr Leu Ala Val Ser Leu Gly Asp Ala Glu Thr Leu Ile Gln His Pro
340 345 350
Ala Ser Met Thr His Ser Pro Tyr Thr Ala Glu Glu Arg Lys Glu Ala
355 360 365
Gly Ile Ser Asp Gly Leu Val Arg Leu Ser Val Gly Leu Glu Asp Val
370 375 380
Gly Asp Ile Ile Ser Asp Leu Lys Gln Ala Leu Asp Leu Ile Val Lys
385 390 395 400
<210> 971
<211> 145
<212> PRT
<213> Clostridium botulinum
<400> 971
Met Asn Asp Tyr Ile Glu Tyr Ala Ile Ile Glu Ala Lys Lys Ala Leu
1 5 10 15
Ala Ile Gly Glu Val Pro Val Gly Ala Ile Ile Val Lys Glu Asn Lys
20 25 30
Ile Ile Ala Lys Ser His Asn Leu Lys Glu Ser Leu Lys Asp Pro Thr
35 40 45
Ala His Ala Glu Ile Leu Ala Ile Lys Glu Ala Cys Asn Thr Ile His
50 55 60
Asn Trp Arg Leu Lys Gly Cys Lys Met Tyr Val Thr Leu Glu Pro Cys
65 70 75 80
Ala Met Cys Ala Ser Ala Ile Ile Gln Ser Arg Ile Ser Glu Leu His
85 90 95
Ile Gly Thr Phe Asp Pro Val Gly Gly Ala Cys Gly Ser Val Val Asn
100 105 110
Ile Thr Asn Asn Ser Tyr Leu Lys Asn Asn Leu Asn Ile Lys Trp Leu
115 120 125
Tyr Asp Asp Glu Cys Ser Arg Ile Ile Thr Asn Phe Phe Lys Asn Ile
130 135 140
Arg
145
<210> 972
<211> 541
<212> PRT
<213> Clostridium botulinum
<400> 972
Met Gly Tyr Thr Ala Leu Tyr Arg Glu Trp Arg Pro Arg Thr Phe Lys
1 5 10 15
Glu Val Val Gly Gln Lys His Ile Thr Val Thr Leu Lys Asn Gln Val
20 25 30
Ile Glu Lys Arg Ile Ala His Ala Tyr Leu Phe Cys Gly Thr Arg Gly
35 40 45
Thr Gly Lys Thr Ser Thr Ala Lys Ile Leu Ser Lys Ala Val Asn Cys
50 55 60
Leu Asn Pro Lys Asp Gly Glu Pro Cys Asn Glu Cys Glu Ile Cys Asn
65 70 75 80
Lys Ile Asn Ser Gly Thr Leu Met Asp Val Ile Glu Met Asp Ala Ala
85 90 95
Ser Lys Arg Lys Leu Glu Asp Ile Lys Glu Val Ile Glu Asn Val Lys
100 105 110
Tyr Pro Pro Gln Glu Gly Lys Asn Lys Val Tyr Ile Met Asp Glu Val
115 120 125
His Met Leu Thr Gln Glu Ala Val Asn Ala Phe Leu Lys Thr Leu Glu
130 135 140
Glu Pro Pro Ser Asn Val Ile Phe Ile Leu Ala Thr Thr Asp Pro Gln
145 150 155 160
Lys Leu Pro Ile Thr Ile Leu Ser Arg Cys Gln Arg Phe Asp Phe Arg
165 170 175
Arg Ile Arg Asn Glu Glu Ile Phe Glu Arg Leu Arg Ala Ile Val Ser
180 185 190
Glu Gln Gly Ile Tyr Ala Asp Asp Lys Ser Leu Asn Leu Ile Ala Arg
195 200 205
Met Ser Asp Gly Ala Met Arg Asp Ala Leu Ser Ile Leu Asp Gln Val
210 215 220
Ile Ser Thr Gly Asp Gly Lys Val Glu Tyr Asp Gln Val Leu Asp Met
225 230 235 240
Leu Gly Leu Val Thr Asn Glu Asn Leu Leu Arg Ile Thr Asn Ser Ile
245 250 255
Ile Glu Lys Asp Val Glu Lys Ser Met Arg Ile Ile Glu Asp Ile Val
260 265 270
Leu Ser Gly Lys Asp Ile Tyr Asn Phe Ile Lys Asp Met Ile Thr His
275 280 285
Leu Arg Asn Ile Leu Met Val Lys Val Ser Lys Asn Pro Asn Glu Ile
290 295 300
Leu Asp Met Ser Ser Glu Asn Ile Asp Leu Val Lys Glu Gln Ser Glu
305 310 315 320
Lys Ile Arg Ile Glu Glu Ile Met Arg Asp Ile Lys Ile Leu Gln Glu
325 330 335
Ala Glu Gln Gln Ser Lys Trp Val Lys Gln Asn Arg Ile Tyr Leu Glu
340 345 350
Leu Ala Val Leu Lys Met Cys Lys Ile Glu Tyr Asp Thr Ser Lys Glu
355 360 365
Val Ile Leu Ser Arg Leu Asn Lys Ile Glu Glu Leu Ile Lys Ser Gly
370 375 380
Asn Ile Lys Leu Ala Ile Asn Glu Glu Lys Lys Lys Ile Glu Pro Lys
385 390 395 400
Glu Phe Asn Leu Lys Arg Glu Lys Glu Ser Ile Gln His Ser Lys Ile
405 410 415
Glu Lys Asn Ser Leu Glu Asp Tyr Asn Lys Asp Ser Lys Leu Thr Val
420 425 430
Glu Thr Val Lys Lys Met Trp Arg Asp Ile Leu Glu Ala Phe Lys Ala
435 440 445
Arg Arg Leu Met Val Leu Tyr Ala Ala Leu Val Thr Ala Asn Ile Thr
450 455 460
Asp Cys Lys Glu Gly Ile Ile Thr Leu Asn Tyr Asn Lys Gln Tyr Ser
465 470 475 480
Phe Asn Lys Lys Arg Leu Glu Lys Pro Glu Asn Asn Lys Val Val Gln
485 490 495
Glu Ile Phe Ser Glu Val Leu Lys Glu Lys Ile Arg Ile Ile Tyr Ile
500 505 510
Val Glu Glu Lys Ala Lys Glu Glu Asn Leu Pro Glu Glu Ile Leu Lys
515 520 525
Asn Thr Phe Gly Glu Asn Ile Leu Glu Ile Ile Asp Glu
530 535 540
<210> 973
<211> 113
<212> PRT
<213> Clostridium botulinum
<400> 973
Met Ala Arg Gly Gly Phe Pro Asn Met Gly Gly Ala Asn Met Asn Asn
1 5 10 15
Leu Met Lys Gln Ala Gln Lys Leu Gln Gln Asp Met Glu Lys Met Gln
20 25 30
Gly Glu Met Glu Lys Lys Glu Phe Ser Ala Thr Val Gly Gly Gly Ala
35 40 45
Val Thr Ala Val Ala Asn Gly Lys Lys Gln Ile Val Asp Ile Lys Ile
50 55 60
Glu Pro Glu Val Val Asp Glu Asp Asp Ile Glu Met Leu Glu Asp Leu
65 70 75 80
Ile Met Ser Ala Cys Asn Glu Ala Leu Lys Lys Ala Glu Glu Asp Thr
85 90 95
Ser Ser Glu Val Lys Arg Leu Thr Gly Gly Met Asn Leu Pro Gly Met
100 105 110
Phe
<210> 974
<211> 198
<212> PRT
<213> Clostridium botulinum
<400> 974
Met Asp Phe Tyr Pro Ile Ala Ile Glu Lys Leu Ile Glu Glu Phe Ala
1 5 10 15
Lys Leu Pro Gly Ile Gly Tyr Lys Thr Ala Gln Arg Leu Thr Leu Tyr
20 25 30
Val Leu Asn Leu Pro Lys Glu Glu Val Lys Glu Phe Ser Glu Ala Leu
35 40 45
Val Lys Ala Arg Gly Thr Ile Lys Tyr Cys Ser Val Cys Gly Asn Phe
50 55 60
Thr Asp Lys Asp Pro Cys Ala Ile Cys Ser Asn Pro Asn Arg Asn Lys
65 70 75 80
Ser Ile Ile Cys Val Ile Glu Gln Pro Lys Asp Ile Met Ser Met Glu
85 90 95
Lys Ile Arg Glu Tyr Asn Gly Val Tyr His Val Leu His Gly Asn Ile
100 105 110
Ser Pro Met Ala Gly Arg Gly Pro Glu Asp Ile Lys Leu Lys Glu Leu
115 120 125
Ile Arg Arg Ile Asp Gly Ser Val Asn Glu Val Ile Val Ala Thr Asn
130 135 140
Pro Asn Val Glu Gly Glu Ala Thr Ala Met Tyr Ile Ser Lys Ile Leu
145 150 155 160
Lys Pro Leu Gly Val Lys Val Thr Arg Ile Ala His Gly Val Pro Val
165 170 175
Gly Gly Asp Leu Glu Tyr Ala Asp Glu Val Thr Leu Ala Lys Ala Leu
180 185 190
Glu Gly Arg Ile Glu Leu
195
<210> 975
<211> 87
<212> PRT
<213> Clostridium botulinum
<400> 975
Met Gly Gly Phe Phe Ile Met Lys Lys Leu Asn Asp Gly Lys Asn Glu
1 5 10 15
Lys Lys Leu Leu Leu Glu Ser Ile Asp Ser Val Ile Ser Glu Ile Asn
20 25 30
Asn Ile Arg Arg Leu Phe Glu Asn Ala Ser Asp Pro Lys Leu Ile Asp
35 40 45
Tyr Ala Ile Tyr Met Glu Glu Ala Leu Lys Ala Lys Tyr Ile Tyr Leu
50 55 60
Leu Lys Glu Ala Lys Glu Glu Gly Ile Lys Val Glu Tyr Cys Asp Thr
65 70 75 80
Ile Lys Glu Val Glu Val Gly
85
<210> 976
<211> 86
<212> PRT
<213> Clostridium botulinum
<400> 976
Met Gly Ile Glu Tyr Ile Ala Tyr Phe Ile Leu Ala Ile Phe Leu Leu
1 5 10 15
Phe Val Val Val Lys Ile Phe Ser Trp Pro Leu Lys Ile Leu Leu Ser
20 25 30
Leu Ile Gly Asn Ala Ile Leu Gly Thr Val Leu Leu Phe Ile Leu Asn
35 40 45
Val Ile Gly Gly Ala Phe Asn Phe Tyr Ile Gly Ile Asn Ile Trp Thr
50 55 60
Ala Leu Ile Ala Gly Phe Phe Gly Ile Pro Gly Val Ile Phe Leu Ile
65 70 75 80
Ile Phe Lys Leu Phe Leu
85
<210> 977
<211> 230
<212> PRT
<213> Clostridium botulinum
<400> 977
Met Lys Ile Thr Lys Asn Ile Leu Lys Ala Glu Phe Ile Lys Arg Pro
1 5 10 15
Asn Arg Phe Gln Ala Tyr Val Lys Ile Asn Glu Lys Ile Glu Met Val
20 25 30
His Val Pro Asn Thr Gly Arg Cys Lys Glu Ile Leu Ile Pro Gly Ser
35 40 45
Thr Val Ile Leu Arg Glu Glu Asn Asn Glu Asn Arg Lys Thr Arg Tyr
50 55 60
Asp Leu Ile Ala Gly Tyr Lys Gly Asp Met Leu Ile Ser Ile Asp Ser
65 70 75 80
Gln Ile Pro Asn Lys Val Val Tyr Glu Ala Leu Met Asn Phe Lys Ile
85 90 95
Glu Ile Leu Lys Glu Tyr Thr Asn Ile Lys Arg Glu Lys Thr Phe Gly
100 105 110
Lys Ser Arg Phe Asp Phe Arg Leu Glu Lys Glu Asn Gly Glu Val Tyr
115 120 125
Tyr Leu Glu Val Lys Gly Val Thr Leu Glu Asn Asp Gly Leu Thr Met
130 135 140
Phe Pro Asp Ala Pro Thr Glu Arg Gly Thr Lys His Ile Leu Glu Leu
145 150 155 160
Ile Asp Val Lys Asn Lys Gly Met Gly Ala Gly Val Leu Phe Leu Ile
165 170 175
Gln Leu Asn Gly Val Lys Lys Phe Thr Pro Asn Tyr Lys Met Asp Lys
180 185 190
Asn Phe Gly Glu Ala Leu Arg Leu Ala Lys Glu Lys Gly Val Asp Ile
195 200 205
Leu Ala Tyr Asp Cys Leu Val Glu Glu Ser Ser Ile Ser Leu Asn Asn
210 215 220
Pro Val Ser Ile Glu Ile
225 230
<210> 978
<211> 162
<212> PRT
<213> Clostridium botulinum
<400> 978
Met Lys Phe Lys Tyr Cys Pro Leu Cys Gly Glu Lys Leu Ile Glu Lys
1 5 10 15
Tyr Ser Trp Asp Glu Gly Gly Val Pro Tyr Cys Lys Arg His Asn Ile
20 25 30
Met Tyr Phe Asp Thr Pro Lys Pro Cys Ile Val Val Gly Val Leu Lys
35 40 45
Glu Asp His Val Leu Leu Leu Lys Gln Ser Tyr Ile Phe Lys Asn Ser
50 55 60
Lys Val Leu Leu Ser Gly Tyr Val Ser Ser Gly Glu Thr Val Glu Glu
65 70 75 80
Ala Val His Arg Glu Val Lys Glu Glu Ala Gly Ile Asn Ile Arg Asp
85 90 95
Leu Lys Tyr Leu Gly Ser Asp Tyr Leu Glu Ser Lys Asp Ile Val Met
100 105 110
Ile Thr Phe Met Ala Thr Tyr Arg Asp Gly Ile Leu Asn Lys Ser Glu
115 120 125
Glu Val Glu Trp Ile Asp Trp Ile Pro Ile Lys Glu Ala Ile Asp His
130 135 140
Met Glu Glu Asp Glu Ile Gly Lys Lys Ile Ile Lys Lys Ile Met Lys
145 150 155 160
Asn Cys
<210> 979
<211> 240
<212> PRT
<213> Clostridium botulinum
<400> 979
Met Ser Asn Lys Ile Glu Lys Thr Pro Lys Arg Val Pro Glu Ile Lys
1 5 10 15
Gly Val Leu Arg Ser His Met Ile Glu Val Pro Ser Ile Ile Arg Glu
20 25 30
Ala Ser Gly Ile Lys Val Phe Gly Lys Arg Ile Lys Ser Phe Val Tyr
35 40 45
Ser Thr Asp Val Ala Val Ile Lys Asn Thr Asn Ala Asp Ala Val Ile
50 55 60
Ala Val Tyr Pro Phe Thr Pro Gln Pro Ile Ile Thr Gln Ser Leu Val
65 70 75 80
Leu Ala Ala Asp Ile Pro Val Phe Cys Gly Val Gly Gly Gly Leu Thr
85 90 95
Thr Gly Lys Arg Val Val Asn Leu Ala Leu Asp Ala Glu Phe Lys Gly
100 105 110
Ala Met Gly Val Val Ile Asn Asn Pro Thr Pro Asn Asp Val Leu Gln
115 120 125
Gln Ile Lys Asp Thr Ile Asp Ile Pro Ile Val Val Thr Val Val Ser
130 135 140
Glu Tyr Glu Asp Ile Glu Ala Arg Ile Asn Ser Gly Ala Thr Ile Leu
145 150 155 160
Asn Ile Ser Gly Ala Lys Lys Thr Ala Tyr Ile Val Arg Glu Ile Arg
165 170 175
Lys Arg Tyr Pro Asp Phe Pro Ile Ile Ala Thr Gly Gly Pro Asn Glu
180 185 190
Ala Ser Ile Lys Glu Thr Ile Glu Ala Gly Ala Asn Ala Ile Thr Tyr
195 200 205
Thr Pro Pro Pro Ala Ser Asp Ile Phe Ser Glu Val Met Asp Lys Tyr
210 215 220
Arg Val Asn Phe Lys Lys Glu His Asp Arg Glu Glu Asn Glu Gln Ser
225 230 235 240
<210> 980
<211> 262
<212> PRT
<213> Clostridium botulinum
<400> 980
Met Asn Gly Ile Leu Phe Tyr Phe Ser Gly Thr Gly Asn Thr Lys Trp
1 5 10 15
Val Ala Asp Arg Ile Gly Asp Lys Leu Cys Lys Leu Asp Asn Thr Ile
20 25 30
His Lys Val Asn Ile Glu Asn Leu Asp Asp Asp Val Leu Ile Lys Ile
35 40 45
His Asn Tyr Asp Phe Ile Ile Ile Gly Thr Pro Ile Tyr Ala Glu Met
50 55 60
Gly Pro Lys Leu Ile Gln Asp Phe Val Asn Asn Ile Pro Lys Val Lys
65 70 75 80
Glu Lys Ile Lys Cys Ile Leu Tyr Ser Thr Gln Gly Gly Asn Ser Gly
85 90 95
Cys Glu Thr Glu Ser Met His Lys Ile Leu Cys Asn Lys Gly Tyr Asp
100 105 110
Val Val Ile Lys Val Asn Ile Lys Met Ile Asn Asn Tyr Tyr Phe Ser
115 120 125
Val Gly Lys Lys Pro Asp Glu Ala Glu Met Ala Asn Ile Leu Arg Asp
130 135 140
Ala Glu Lys Lys Val Asp Leu Val Val Asp Lys Phe Ser Lys Gly Glu
145 150 155 160
Val Tyr Leu Glu Asn Ile Ser Lys Thr Arg Val Phe Leu Gly Lys Ile
165 170 175
Ala Ser Lys Gly Phe Asn Lys Phe Leu Pro Lys Leu Ser Asn Asn Leu
180 185 190
Lys Ser Thr Glu His Cys Ile Lys Cys Gly Met Cys Val Arg Asn Cys
195 200 205
Pro Lys Gly Asn Ile Val Phe Glu Asn Gly Gly Val Val Phe His Ser
210 215 220
Asn Cys Ile Leu Cys Leu Arg Cys Ile Tyr Ile Cys Pro Ser Asn Ala
225 230 235 240
Ile Val Tyr Lys Glu Lys Arg Ile Asp Gln Ile Glu Lys Asn Ile Ile
245 250 255
Lys Leu Leu Asp Ile Lys
260
<210> 981
<211> 53
<212> PRT
<213> Clostridium botulinum
<400> 981
Met Asn Ile Asn Asn Asp Asn Cys Ser Lys Cys Ile Asn Ile Leu Lys
1 5 10 15
Ser Asn Cys Asn Gly Asn Leu Glu Asn Cys Ile Cys Gln Lys Cys Val
20 25 30
Arg Asn Ile Glu Lys Cys Ile Ile Thr Lys Tyr Cys Ser Glu Thr Glu
35 40 45
Ser Thr Leu Ser Ile
50
<210> 982
<211> 234
<212> PRT
<213> Clostridium botulinum
<400> 982
Met Glu Asn Trp Leu Gln Arg Thr Glu Phe Leu Ile Gly Lys Glu Ala
1 5 10 15
Ile Glu Lys Leu Asn Lys Ser Lys Ile Val Val Leu Gly Val Gly Gly
20 25 30
Val Gly Ser Phe Val Ile Glu Ala Leu Val Arg Ser Gly Val Gly Asn
35 40 45
Ile Thr Ile Val Asp Asn Asp Thr Ile Asp Ile Thr Asn Ile Asn Arg
50 55 60
Gln Ile His Ala Asn Leu Asn Thr Val Gly Lys Ser Lys Val Glu Val
65 70 75 80
Met Lys Glu Arg Ile Leu Ser Ile Asn Pro Asn Cys Asn Val Lys Ile
85 90 95
His Glu Glu Phe Ile Asn Lys Asp Asn Ile Ser Glu Leu Val Ala Lys
100 105 110
Asp Thr Asp Tyr Val Val Asp Ala Ile Asp Thr Ala Ser Ser Lys Ile
115 120 125
Leu Ser Ile Val Trp Cys Asp Lys Asn Asn Ile Asn Ile Ile Ser Ser
130 135 140
Met Gly Thr Ala Asn Lys Leu His Pro Thr Lys Leu Arg Ile Ala Asp
145 150 155 160
Ile Tyr Asp Thr Lys Val Cys Pro Leu Ala Lys Ile Met Arg Tyr Glu
165 170 175
Leu Arg Lys Arg Asn Ile Lys Ser Leu Lys Val Leu Tyr Ser Glu Glu
180 185 190
Thr Pro Ile Lys Asn Asn Asn Arg Pro Leu Asn Asp Lys Gly Arg Pro
195 200 205
Thr Pro Ala Ser Ile Ala Phe Val Pro Pro Cys Ala Gly Leu Ile Ile
210 215 220
Ala Gly Glu Val Val Arg Asp Ile Ile Lys
225 230
<210> 983
<211> 369
<212> PRT
<213> Clostridium botulinum
<400> 983
Met Ile Leu Val Ala Val Cys Asp Ser Thr Arg Gly Ile Phe Ile Pro
1 5 10 15
Ile Phe Lys Asn Glu Phe Asn Ile Asn Asn Thr Lys Ile Gly Leu Met
20 25 30
Ile Thr Ile Ser Thr Leu Gly Tyr Thr Val Phe Thr Tyr Leu Gly Gly
35 40 45
Ile Leu Cys Gln Lys Lys Gly Gln Lys Arg Val Tyr Ser Ile Gly Leu
50 55 60
Leu Ile Ile Ser Ile Ser Phe Leu Leu Leu Asn Phe Thr Pro Asn Tyr
65 70 75 80
Ile Ile Leu Ile Ile Leu Met Phe Leu Ile Asn Gly Gly Gln Ala Phe
85 90 95
Leu Ala Ile Ser Ser Asn Thr Ile Ile Pro Ile Ile Phe Ile Ser Phe
100 105 110
Gln Ala Ile Ile Met Asn Leu Ala His Phe Asn Tyr Gly Met Gly Leu
115 120 125
Ala Leu Ser Gln Arg Ile Ser Gly Met Leu Leu Tyr Arg Gly Ile Thr
130 135 140
Trp Arg Arg Ile Tyr Leu Tyr Leu Ser Ile Ile Thr Phe Ile Val Tyr
145 150 155 160
Leu Leu Leu Phe Phe Ile Asn Ile Pro Val Ile Asn Lys Ser Lys Asp
165 170 175
Asp Asn Lys Leu Lys Ser Lys Glu Ile Phe Lys Asp Lys Leu Leu Tyr
180 185 190
Phe Tyr Ile Phe Ala Leu Gly Phe Tyr Val Phe Ser Glu Ile Ala Thr
195 200 205
Gly Asn Trp Phe Val Asn Leu Met Glu Asn Gly Tyr Arg Tyr Asn Lys
210 215 220
Asn Gln Ser Ser Tyr Tyr Ile Phe Leu Phe Ser Ala Leu Phe Ala Leu
225 230 235 240
Gly Arg Leu Leu Gly Gly Phe Leu Val Glu Lys Phe Asn Tyr Ile Lys
245 250 255
Ala Val Cys Thr Ser Leu Ala Val Ala Leu Met Met Tyr Thr Ile Gly
260 265 270
Ile Thr Leu Gly Gln Lys Gly Leu Ile Leu Ile Ser Leu Ser Gly Ile
275 280 285
Phe Phe Ser Ile Val Tyr Pro Thr Val Val Leu Thr Ile Ser Lys Val
290 295 300
Tyr Ser Thr Asn Ser Ser Tyr Val Thr Gly Ile Val Val Thr Leu Ser
305 310 315 320
Ser Phe Val Asn Met Ile Ile Ser Phe Leu Met Gly Tyr Leu Asn Asp
325 330 335
Leu Ile Gly Ile Tyr Thr Ser Tyr Tyr Leu Ile Pro Ile Ser Leu Phe
340 345 350
Ile Ser Leu Met Phe Met Phe Leu Ile His Lys Asn Ile Lys Lys Leu
355 360 365
Ala
<210> 984
<211> 314
<212> PRT
<213> Clostridium botulinum
<400> 984
Met Asn Asn Lys Phe Lys Val Ser Ile Glu Leu Ala Lys Gly Thr Val
1 5 10 15
Asp Glu Tyr Ile Val Lys Asp Ile Thr Gly Ile Ser Ile Gly Arg Ile
20 25 30
Phe Ile Leu Glu Leu Ser Lys Lys Asn Lys Tyr Gly Cys Phe Arg Leu
35 40 45
Asn Leu Tyr Arg Asp Gly Glu Asn Ser Asn Ile Tyr Leu Asn Tyr Ile
50 55 60
Leu Lys Asp Phe Leu Gln Tyr Leu Phe Tyr Lys Lys Glu Val Cys Lys
65 70 75 80
Ile Asn Ile Ile Ile Asn Glu Asn Met Asn Thr Asn Val Phe Ile Glu
85 90 95
Tyr Gly Phe Tyr Leu Glu Gly Ile Ile Asn Asp Ser Arg Leu Ile Asp
100 105 110
Gly Ile Lys Thr Ser Glu Phe Leu Phe Gly Leu Asp Ile Asp Thr Phe
115 120 125
Arg Lys Ala Asn Leu Tyr Lys Glu Leu Ser Ile Glu Gly Lys Asn Ile
130 135 140
Ser Leu Lys Leu Leu Thr Pro Ile Asn Ala Gln Glu Leu Leu Asp Tyr
145 150 155 160
Tyr Ile Arg Asn Glu Arg His Leu Lys Ser Tyr Glu Pro Thr Arg Asp
165 170 175
Lys Thr Phe Tyr Thr Leu Lys Glu Gln Arg Asp Leu Leu Met Asp Ser
180 185 190
Tyr Lys Gln Tyr Leu Asn Gly Asn Ser Leu Glu Leu Gly Ile Tyr Lys
195 200 205
Asp Lys Lys Phe Ile Gly Lys Ile Lys Ile Ser Asn Ile Ile Met Gly
210 215 220
Ile Phe Lys Asn Cys Ile Val Gly Tyr Ser Ile Asp Lys Asp Phe Gln
225 230 235 240
Gly Asn Gly Tyr Met Lys Glu Ala Leu Lys Leu Leu Ile Asp Tyr Thr
245 250 255
Phe Asn Glu Ile Asp Ile His Arg Ile Glu Ala Ser Thr Leu Ile Asp
260 265 270
Asn Ile Arg Ser Gln Lys Val Leu Glu Gly Cys Gly Phe Lys Lys Leu
275 280 285
Gly Ile Asn Glu Lys Tyr Leu Tyr Ile Asp Gly Lys Trp Gln Asp His
290 295 300
Val Thr Tyr Tyr Ile Val Asn Asn Asn Ile
305 310
<210> 985
<400> 985
000
<210> 986
<400> 986
000
<210> 987
<400> 987
000
<210> 988
<400> 988
000
<210> 989
<400> 989
000
<210> 990
<400> 990
000
<210> 991
<400> 991
000
<210> 992
<400> 992
000
<210> 993
<400> 993
000
<210> 994
<400> 994
000
<210> 995
<400> 995
000
<210> 996
<400> 996
000
<210> 997
<400> 997
000
<210> 998
<400> 998
000
<210> 999
<400> 999
000
<210> 1000
<400> 1000
000
<210> 1001
<211> 1533
<212> DNA
<213> Ricinus communis
<220>
<221> modified_base
<222> (350)..(351)
<223> a, c, t, g, unknown or other
<220>
<221> modified_base
<222> (365)..(366)
<223> a, c, t, g, unknown or other
<400> 1001
atggctgcag gattggccat tacaagtgaa gggggtcagt acaatggcag gatgacctcc 60
tttgttgctc tatcttgcat gatggctgcc atgggaggag tcatttttgg ctatgatatt 120
ggagtttcag gtggtgtgac atcaatggat cccttcttga agaaattctt tccggatgtg 180
tacaggaaaa tgaaagaaga cacagaaatt agcaactact gcaagtttga tagtcaactt 240
ttaacctcct tcacatcctc actatatgtt gctggccttg ttgcttcctt cttcgcctcg 300
tcggtcacta gagcttttgg gcgcaagcca tcaattcttt taggcggtgn ngttttcctt 360
gccgnngcag cccttggtgg tgctgcagtt aatgtgtata tgttgatatt tggccgcgtc 420
ttgcttggag ttggtgtcgg ttttgcaaac caggcagttc cactttatct gtctgaaatg 480
gcaccgccaa gatatagagg ggcaatcaac aacggcttcc aatttagtgt tggtattggg 540
gcattgtctg ccaaccttat aaactatgga actgaaaaga ttgaaggtgg ctggggttgg 600
cgaatttccc tagcaatggc agcagttcca gctgcaatcc tgacatttgg tgcacttttc 660
ctcccagaga cacccaatag cctgattcag cgcagcaatg atcatgagag agccaaactt 720
atgttacaac gtgtgcgagg taccactgat gtccaagcag aacttgacga tctcatcaaa 780
gctagcataa tctcaagaac tattcagcac ccatttaaga atataatgcg aagaaagtat 840
cggcctcaac tagtaatggc agtagccata ccatttttcc agcaagtaac agggatcaat 900
gtcattgcat tttatgctcc aatacttttc aggacaatcg gcctggaaga aagtgcatcc 960
ctcttatctt ctattgtgac agggcttgtg ggtagtgcgt caacgttcat atcgatgctt 1020
atagtcgata aacttggaag aagagcattg tttatatttg ggggtgtaca gatgtttgta 1080
gcacagataa tggttgggag tattatggca gctgagctag gcgatcatgg tggtataggt 1140
aaagggtatg cttatatagt tctgattttg atctgtattt acgtggctgg attcgggtgg 1200
tcatggggtc ctcttggatg gttggttcct agtgagatat tcccattaga gattcgatca 1260
gcagggcaaa gtattgtggt ggcagtgagc tttttattca ctttcgttgt tgcacaaact 1320
tttctatcta tgctttgcca cttcaaatct ggaattttct tcttttttgg aggatgggtt 1380
gtagtgatga ctgcctttgt gcactttttg ctgccagaga cgaagaaggt gccaattgag 1440
aaaatggata tagtgtggag ggaccactgg ttttggaaga aaattatagg ggaagaagct 1500
gctgaggaaa ataataaaat ggaagcagca tga 1533
<210> 1002
<211> 660
<212> DNA
<213> Ricinus communis
<400> 1002
atggctgatg aggtgatact tttggatttc tgggcaagtc cttttgggat gagagttaga 60
atagcactag cagagaaagg agtaaagtat gagtatagag aagagaattt aaggaacaaa 120
agccctcttc ttttggagat gaatccagtt cataaaaaga ttcctgttct catccataat 180
ggaaaaccca tttgtgaatc acttattgct gttcaatata ttgatgaggt ttggcatgat 240
gagtctcctc ttttgccttc tgattcttac ccaagagcac atgctagatt ctgggctgat 300
tttgttgaca agaagattta tgaacttggg aggaagatat ggactacaaa aggagaggat 360
caggaggcgg gcaagaaaga attcatcgac gccattaagt tgttggaagg tgagcttgga 420
gacaagccgt actttggtgg tgagagcttt gggtatgttg atgttgcact tatcccattc 480
tattcctggt tttatgccta tgaaacctgt gggaacttca gcatagaggc tgagtgtccc 540
aagttcatgg catggattaa gaggtgcctg cagaaagagt ctgtctccaa ggcccttcct 600
gaccagcaga aggtctatga atttgttttg gagctgaaga aggtatttgg tattgagtaa 660
<210> 1003
<211> 618
<212> DNA
<213> Ricinus communis
<400> 1003
atggacaaaa gcaaagtaag cacagcagtt ggaggggaga ctccagtagg attaattacg 60
ggttcaagag atgatgagtt agaaagtggc tccatgcgca cagccgagac tgtgctgcgg 120
cttgtaccca tggctttttg catctcagct cttgttctca tgctcaagaa ttctcagact 180
aatgactttg gcactctttc ctactcagat cttggagctt tcaggtattt ggtgcatgcc 240
aatggcatat gtgctggcta ttcccttctg tcagctatca ttgtagccat gcctcgacca 300
tccaccatgt cccgagcctg gacattcttc ttccttgacc aggtgttgac atatgtaatc 360
ttggcggcag ccgccgtgtc tgtggaggcg ttgtacctgg ccagaaaggg ggacattgcc 420
atcacctgga gtgcagcttg tgtgtctttt ggtggattct gccacaaggc cataacatct 480
gctgtcatca catttattgt agtagtctgc tatgcactac tttcacttgt ctcctcctac 540
aagcttttta gcagatatgg tgcaccagat gtgagctacc caggcaaggg gattgaggtt 600
gctgcctttc acagttaa 618
<210> 1004
<211> 3102
<212> DNA
<213> Ricinus communis
<400> 1004
atgggttcaa tggtagttct tgttgggagc atgccgtctt tggcttcctt gattagctta 60
ggaagtttaa gtgtggcagc agcgacttct agttcttcag actcatatta ttcatcctca 120
tattcacttg ttcgaagagt ttctttatcg aaaaggggtc ttaagagtgc caaaagatgg 180
cattgcgttt gtaaatgctc tgttactacc acagatttta ttgctgatca aggcaatgct 240
gtatccattg attctaataa ttcatttaga gcaagcagta atggtggaga tgctgacagt 300
gaaatcttgc ttaagcctgc tcctaggcct gtcttaaaac cttcattagg gtctaaaggt 360
gattcccttt taggtatgag ctcttctcag ttgaattctg gagattctga taatgatgat 420
gaacaagaga ggaataaagt aattgagtcg cttggtgagg tgttggagaa ggctgaaaag 480
cttgaaactt ctaaaccaag tggaccgggt aatcctagca gtagtgggaa agacaatgga 540
aatgtaaata aaataacacc acctaacatt ggtactaatt cacgaattgc taaatctgag 600
agttcaggag ccactcgtaa aactaaaact ttgaagagcg tgtggcgaaa aggggatact 660
gtgtcctccg tgcaaaaggt tgtaaaggaa gctcctaaag ttattaataa gcttgtgaaa 720
gaagatacta taacagggga aggcacaaag ctagaatctc aatctagttt tcctttaaga 780
cctgtgcagc cacccttgag acctcaacca aagttacagg caaagccatc tgtagctcct 840
cctcctgtga tgaaaaagcc tgttatcttg aaggatgtgg gagcagcccc aagaccacca 900
gttagtggtg aagctgattc gaaaaataat ggacggcagc ctattttagt tgataaattt 960
gcccgcaaaa aaccagttgt agatcctcta attgctcagg cagttttagc ccccacaaaa 1020
ccaggaaagg gcccagcccc tggaaaattc aaggaccgaa agaagagtat ttcacctgga 1080
ggaccaagga gacgacttgt taataatgat gaacttgaga ttcctgatga ggagacatca 1140
gaactgaatg tctctattcc aggtacagct aggaaaggga ggaagtggag taaagctagc 1200
cggaaggctg ccagactcca ggctgccaaa gatgcagctc ctgtcaaagt agaaatttta 1260
gaggttgggg aaaatggtat gttaattgag gagttagcct acaacttaac catcagtgaa 1320
ggtgaaattc ttgggtattt gtactcaaag gggattaaac ctgatggagt gcagactttg 1380
gataaggaca tggtaaagat gatatgcaag gaacacgatg tggaagtcat agatgttgct 1440
ccagttagat ttgaagaaat ggcaaggaaa agagaaattc ttgatgaaga tgatcttgac 1500
aaactagagg acaggcctcc agttctaact ataatggggc atgtggatca tggcaagaca 1560
actctactgg attacattcg taaaagcaag gtgactgcct cagaagctgg tggaattaca 1620
caaggaattg gagcatataa agtcctcaca cctgtggatg gaaaaatgca accttgtgtt 1680
tttcttgata ctcctggaca tgaggcattt ggtgcaatga gagctcgtgg ggcaagggtg 1740
acagatattg ctattattgt ggtggcagct gatgatggga tccgtcctca aacaaatgag 1800
gccatagctc atgcaaaagc agctggagtt ccaattgttg ttgctataaa caagatagat 1860
aaagatgggg ctaatccaga aagagtcatg caagatcttt cttcaattgg tcttatgcct 1920
gaagactggg gcggtgacat cccaatggtt cagattagtg ctctcaaggg ggataacata 1980
gatgatttgc tagaaactgt tatgcttgtt gctgagttac aagagttgaa ggctaatccg 2040
catagaaatg caaagggtac agttattgag gcaggtcttg ataaatccaa aggtccaata 2100
gctacattta ttatacagaa tggcacactt aaaagagggg atgttgtggt ttgcggagaa 2160
gcctttggaa aggttcgggc tttatttgat gatggtggaa aacgagtgga tgaagctgga 2220
ccatctattc ctgtacaggt tattggattg agtaacgtac caaaagctgg cgatgaattt 2280
gaggctgttg cctctcttga tattgcacgt gaaaaggcgg aagcacgtgc tgaattattg 2340
cgaaatgagc gaataacagc caaggctgga gatggcaaga ttacactatc ttccttagca 2400
tcagctgttt catcaggaag gctgtctgga atagacttgc accaactgaa tattatatta 2460
aaagttgatg ttcagggatc tgttgaagct gtccgacaag ccttacaggt gctccctcaa 2520
gataatgtca ccttgaagtt cctcttacaa gcaacagggg atgtaagctc aagtgatgtt 2580
gatcttgcca ttgccagtga agctattatt ttaggattta atgtcaaagc accgggttct 2640
gtcaagagca atgcagaaaa caaaggtgtt gagattcggc tatatagagt tatatatgat 2700
cttattgatg atgtacgaaa tgcaatggaa ggacttctag agcctgttga ggaacaagaa 2760
acaattgggt cagcagtagt tcgggctgta tttagcagtg gaagcggccg tgttgctgga 2820
tgcatggtaa cagatgggaa agtagtgaaa ggctgtggtg ttaaggttat tcgaaagcga 2880
aagacaatcc atgttggcgt tctcgattcc ttgagacgag taaaggaact tgtaaaagag 2940
gtaagtgctg ggctagagtg tggtattgca atggaagatt atgatgattg ggaggaagga 3000
gatactattg aagccttcaa tacagtcgag aagaagcgga cccttgaaga ggcatcggct 3060
tcgatggcag ctgcactgga acatgcaggt attaatgtgt ag 3102
<210> 1005
<211> 3498
<212> DNA
<213> Ricinus communis
<400> 1005
atggcagatc cagatcctta ttcttcttct tctacttctg atattccaca taacgatgtg 60
tcttggaact caaatcaaat cttggaatca gttgataccc aaatgctaat tgacccagtt 120
gccaataatg ggattgatgc aggacgttcg gtgctgggtt tttctttaac atcacctgat 180
cttgttattt gtgctggttc gtgtggagat tcacctgaat tctttaatag aacgacaaag 240
aactactctt ttgagctctc gttggagaat ggtatcaacg gtactaatac caaagatacc 300
cagaagattc agtctgtaaa gttttctcca atttgtcaaa cattcaacaa acaattgtct 360
cctgaatctt ccttagaaga gcttgttgca gaaccttcaa gaatgagaaa tgatgataat 420
ttgctaaaag atcctttaat tggtgtaagc attaatgtag gatctaccaa tgaaggtgtg 480
gtcttgaatg gtgtgcagtt tttggaggac acttgttaca ccggcggtga tactgtgaag 540
actaatgcta caattggaga tttagataga gaagaagatg gtctttcttt gtaccaaacg 600
gctcgttttg gtaacttctc gtattgcatt cctgcaatgg aaccagggaa ttatgttgtt 660
accttgcatc ttgctgaaat tgtattcact gatgggcctc ctggaaggag agtgtttgat 720
gtttttatac aagagaagaa ggttgtttct tccctagata tatatgctca agtaggtgca 780
aataagcctc tagttatatc tcaacttaag acttgtgtcg atggagagga gggcttaacc 840
attaggtttc aaggagttat tggaagtccc attgtatgtg gcatttctat aaccgaagat 900
tcttctgctc atgctggtga agctcaattt tcaaaacaaa tgggaatgtc ccaagtggca 960
gaatgcaact tactgaaaca atataatagt gagcaagagc cggatggaga tcatcagaag 1020
ctagaaagac acgttgagtt tcaggaaaag gaactgacgg aaatgaggag ggcattggag 1080
gagcttaaga gggaaaacca acttaagaat agggaatgcc aagacgcttg gaactcttta 1140
catgaactcc agaatgagct tatgcgcaag tctatgcatg ttgggtcatt ggcatttgcc 1200
attgaaggac aagttaaaga gaagagcaag tggttctcat ctttgaggga catgactaga 1260
aaattgaaga ttatgaggat agagcactta aagatatcag aggaggcact ggcatataag 1320
aaatgcctca gagatatgga ggaaatgagg tccactattc agtctacaat gaagcagcaa 1380
gtagatttgc acgaggacct caagattaaa tttattgaag gggagaagaa aagaaaggaa 1440
ctctacaaca gggttttaga gttgaaagga aacataaagg tgttttgcag atgtaggccc 1500
ttaaatgctg aggaagtagc atcaggggat tctatggcta ttgattttga atctgctaaa 1560
gacggtgagc tcacagtaat atcaaatgga cttcccagaa aaaccttcaa gtttgatgct 1620
gtttttagcc ctgaggcaga ccaagctgat gtttttggag acactgcgcc atttgcaact 1680
tcagttttgg atgggtacaa tgtatgcata tttgcttatg gacaaactgg aactggaaaa 1740
acctttacca tggagggctc cgaagaagct cgtggagtaa actttaggac tcttgaggag 1800
atatttcgca taatcaagga gcgctataag ctttttcggt atgatatctt tgtgagtgtt 1860
ctagaagtct ataatgagca aatacgagat ttgttgggct caggctctca gccaggagtg 1920
gccacaaaga ggcttgaaat aaggcaagcg ggtgaagggc tgcatcatgt tccagggttg 1980
gttgaagcac aagtaaacaa cataagtgag gcctgggaag ttctacaaac tggaagtaac 2040
gcaagggcaa ttggctcaac caatgccaat gagcacagca gccgatccca ttgcatacac 2100
tgtgtgatgg tgaaaggaga gaatttattg aatggagaat gtacaaagag caagttatgg 2160
ttggttgatc tagcaggaag tgagcgagta gcgaagacag aagttcaagg agatagactt 2220
aaggaaacac aaaatattaa cagatccttg tctgcacttg gtgatgtcat atctgccctt 2280
gcaactaaaa gtcctcatat cccattcagg aattccaagc tcactcacct gcttcaagat 2340
tccctaggag gagattcaaa gaccctcatg tttgtccaga taagtcccag tgagaatgac 2400
ctgggtgaga ccgtatgctc tctgaatttt gcaagcagag ttagagggat agagttgggt 2460
cctgcaagac ggcaattgga caatactgaa cttcagagat acaaacagat ggctgaaaaa 2520
tcaaaacaag acatgaagag caaagatata cagatcaaga agatggagga aacaatcaat 2580
ggcttggtct tgaggataaa agaaaaagac cttagaaata agaatctgca agagaagttg 2640
aaggagctgg agtcgcaact tctcattgaa agaaagctag cacgtcagca tgttgacaca 2700
aagatagctg agcaacagca acaacaacaa atgaaacaac agcaggatga gcagagtagt 2760
gccccaccaa ggccaccact tgcaaatcga ctattaggaa gtaacaagaa tttcagtgaa 2820
gccgcaagta ctgcaacaac caaagagcaa gtaaattcct ggcaaccact tgtggaaaat 2880
aacagttata ggcctacact ttgcattctt ccaacagatg gcatggtcaa gtatattgat 2940
cccacagaaa aagaaaacaa ccctggcatg gctgaacatc cacgattgcc gaagaggacc 3000
ggcagagctt caatttgcac aacagcacaa cggataccag tagctccagc accaaggcgc 3060
acatcgatga ttccactccc aagtgtacca ggtttagcac atctaccttc accattagca 3120
ccattgtcgt tatgcgagat tgacataaag gaagaagaca caggagggtc tgaaattaat 3180
tgcttgccag agcaaacaca ttgcaacagt cccaaaggaa taaaacatgg gactagaaag 3240
ctaagcacca tactaagaca aagccttcaa aagaaaatgc agctgaattc tccaatgcag 3300
caacacctga gaaaacgagg tataaatgtt gggatggaga aagtcagggt ctctattgga 3360
agtcgaggga ggatggcaca cagagttttg ctaggcaatg gtagaagaac aggaataaag 3420
gatacccagc agaacaggag tcatagagaa aaagagagag gatggaatat tggaacagcg 3480
ggaagaactg caatctaa 3498
<210> 1006
<211> 3495
<212> DNA
<213> Ricinus communis
<400> 1006
atggcagatc cagatcctta ttcttcttct tctacttctg atattccaca taacgatgtg 60
tcttggaact caaatcaaat cttggaatca gttgataccc aaatgctaat tgacccagtt 120
gccaataatg ggattgatgg acgttcggtg ctgggttttt ctttaacatc acctgatctt 180
gttatttgtg ctggttcgtg tggagattca cctgaattct ttaatagaac gacaaagaac 240
tactcttttg agctctcgtt ggagaatggt atcaacggta ctaataccaa agatacccag 300
aagattcagt ctgtaaagtt ttctccaatt tgtcaaacat tcaacaaaca attgtctcct 360
gaatcttcct tagaagagct tgttgcagaa ccttcaagaa tgagaaatga tgataatttg 420
ctaaaagatc ctttaattgg tgtaagcatt aatgtaggat ctaccaatga aggtgtggtc 480
ttgaatggtg tgcagttttt ggaggacact tgttacaccg gcggtgatac tgtgaagact 540
aatgctacaa ttggagattt agatagagaa gaagatggtc tttctttgta ccaaacggct 600
cgttttggta acttctcgta ttgcattcct gcaatggaac cagggaatta tgttgttacc 660
ttgcatcttg ctgaaattgt attcactgat gggcctcctg gaaggagagt gtttgatgtt 720
tttatacaag agaagaaggt tgtttcttcc ctagatatat atgctcaagt aggtgcaaat 780
aagcctctag ttatatctca acttaagact tgtgtcgatg gagaggaggg cttaaccatt 840
aggtttcaag gagttattgg aagtcccatt gtatgtggca tttctataac cgaagattct 900
tctgctcatg ctggtgaagc tcaattttca aaacaaatgg gaatgtccca agtggcagaa 960
tgcaacttac tgaaacaata taatagtgag caagagccgg atggagatca tcagaagcta 1020
gaaagacacg ttgagtttca ggaaaaggaa ctgacggaaa tgaggagggc attggaggag 1080
cttaagaggg aaaaccaact taagaatagg gaatgccaag acgcttggaa ctctttacat 1140
gaactccaga atgagcttat gcgcaagtct atgcatgttg ggtcattggc atttgccatt 1200
gaaggacaag ttaaagagaa gagcaagtgg ttctcatctt tgagggacat gactagaaaa 1260
ttgaagatta tgaggataga gcacttaaag atatcagagg aggcactggc atataagaaa 1320
tgcctcagag atatggagga aatgaggtcc actattcagt ctacaatgaa gcagcaagta 1380
gatttgcacg aggacctcaa gattaaattt attgaagggg agaagaaaag aaaggaactc 1440
tacaacaggg ttttagagtt gaaaggaaac ataaaggtgt tttgcagatg taggccctta 1500
aatgctgagg aagtagcatc aggggattct atggctattg attttgaatc tgctaaagac 1560
ggtgagctca cagtaatatc aaatggactt cccagaaaaa ccttcaagtt tgatgctgtt 1620
tttagccctg aggcagacca agctgatgtt tttggagaca ctgcgccatt tgcaacttca 1680
gttttggatg ggtacaatgt atgcatattt gcttatggac aaactggaac tggaaaaacc 1740
tttaccatgg agggctccga agaagctcgt ggagtaaact ttaggactct tgaggagata 1800
tttcgcataa tcaaggagcg ctataagctt tttcggtatg atatctttgt gagtgttcta 1860
gaagtctata atgagcaaat acgagatttg ttgggctcag gctctcagcc aggagtggcc 1920
acaaagaggc ttgaaataag gcaagcgggt gaagggctgc atcatgttcc agggttggtt 1980
gaagcacaag taaacaacat aagtgaggcc tgggaagttc tacaaactgg aagtaacgca 2040
agggcaattg gctcaaccaa tgccaatgag cacagcagcc gatcccattg catacactgt 2100
gtgatggtga aaggagagaa tttattgaat ggagaatgta caaagagcaa gttatggttg 2160
gttgatctag caggaagtga gcgagtagcg aagacagaag ttcaaggaga tagacttaag 2220
gaaacacaaa atattaacag atccttgtct gcacttggtg atgtcatatc tgcccttgca 2280
actaaaagtc ctcatatccc attcaggaat tccaagctca ctcacctgct tcaagattcc 2340
ctaggaggag attcaaagac cctcatgttt gtccagataa gtcccagtga gaatgacctg 2400
ggtgagaccg tatgctctct gaattttgca agcagagtta gagggataga gttgggtcct 2460
gcaagacggc aattggacaa tactgaactt cagagataca aacagatggc tgaaaaatca 2520
aaacaagaca tgaagagcaa agatatacag atcaagaaga tggaggaaac aatcaatggc 2580
ttggtcttga ggataaaaga aaaagacctt agaaataaga atctgcaaga gaagttgaag 2640
gagctggagt cgcaacttct cattgaaaga aagctagcac gtcagcatgt tgacacaaag 2700
atagctgagc aacagcaaca acaacaaatg aaacaacagc aggatgagca gagtagtgcc 2760
ccaccaaggc caccacttgc aaatcgacta ttaggaagta acaagaattt cagtgaagcc 2820
gcaagtactg caacaaccaa agagcaagta aattcctggc aaccacttgt ggaaaataac 2880
agttataggc ctacactttg cattcttcca acagatggca tggtcaagta tattgatccc 2940
acagaaaaag aaaacaaccc tggcatggct gaacatccac gattgccgaa gaggaccggc 3000
agagcttcaa tttgcacaac agcacaacgg ataccagtag ctccagcacc aaggcgcaca 3060
tcgatgattc cactcccaag tgtaccaggt ttagcacatc taccttcacc attagcacca 3120
ttgtcgttat gcgagattga cataaaggaa gaagacacag gagggtctga aattaattgc 3180
ttgccagagc aaacacattg caacagtccc aaaggaataa aacatgggac tagaaagcta 3240
agcaccatac taagacaaag ccttcaaaag aaaatgcagc tgaattctcc aatgcagcaa 3300
cacctgagaa aacgaggtat aaatgttggg atggagaaag tcagggtctc tattggaagt 3360
cgagggagga tggcacacag agttttgcta ggcaatggta gaagaacagg aataaaggat 3420
acccagcaga acaggagtca tagagaaaaa gagagaggat ggaatattgg aacagcggga 3480
agaactgcaa tctaa 3495
<210> 1007
<211> 1285
<212> DNA
<213> Ricinus communis
<400> 1007
atggaggaat caaaattgga gaaaaagaat gtaccggttt tgccatggat gagatgtcca 60
gttgacatta aacaatttga agaatgctct cttgatcttg ttccttgcct tgaccctagg 120
ttaaaggtgg ctttagagaa tatgggtttc acatcattat ttgcagttca agttgctgtt 180
tggcaagaaa caataggacc tggtaatttt gaaagagacc tttgtataaa tgcaccaaca 240
ggaagtggta aaactctagc ttatgcttta ccaattattc aaatgctatc aacccgctct 300
atcaagtgcc tacgcgcttt gattgtgttg cctacacgag atttagcatt gcaggttaaa 360
caagtatttg ctgcacttgc acctgcagtg ggattatctg ttggtttggc tgttggtcaa 420
tcttcaattg ctggtgaaat ttctgagctt attaaaagac ctaagcttga ggctggcatt 480
tgttatgatc gagatgattt gaaaggggtt ttaagggaaa atcttaccct cgacttgcaa 540
agatggtttt atctgccaca ttaacccaag atccaagcaa gcttgttcaa cttgatctgc 600
atcacccttt gttcctgaca accgggcaaa gtcgttatca gctacctgaa aagttggaat 660
cctacagagt gatttgcgag ccaaagttaa aacctttata cttggttgcc cttctacaaa 720
atttagtagg ggagaagtgt attgtttttg catcatccgt ggagtcaact catcggcttt 780
gcacattatt aaaatttttt ggtgatttga aagtgaagat caaagagtat tcaggtcttc 840
aacatcaatc tgtaagaagc aagaccctga aggcattccg ggaaggaaag atacaagtac 900
ttgtttcctc agatgcaatg actcgtggaa tggatgttga aggggtgaga aatgtcatta 960
actatgataa gcctgcatac ataaagacgt acatacatcg ggctggtcgg acagcaagag 1020
caggccaggt tgggcgttgt ttcacattat tgcataaaga agaggtaagg catttcagga 1080
aacttttaca gaaggccgac aatgattcct ttccggttta ttctcttcct ccagttacat 1140
tgagcctctt taccctactt atgagtcagc attggagaaa ttgaaagaga aagttcagtc 1200
agaaacatcc aggaagcgca gaactggttt caaatttcag ggccaggtga aggagaggcg 1260
aaaagaaaaa caatcaaact catga 1285
<210> 1008
<400> 1008
000
<210> 1009
<400> 1009
000
<210> 1010
<400> 1010
000
<210> 1011
<400> 1011
000
<210> 1012
<400> 1012
000
<210> 1013
<400> 1013
000
<210> 1014
<400> 1014
000
<210> 1015
<400> 1015
000
<210> 1016
<400> 1016
000
<210> 1017
<400> 1017
000
<210> 1018
<400> 1018
000
<210> 1019
<400> 1019
000
<210> 1020
<400> 1020
000
<210> 1021
<400> 1021
000
<210> 1022
<400> 1022
000
<210> 1023
<400> 1023
000
<210> 1024
<400> 1024
000
<210> 1025
<400> 1025
000
<210> 1026
<400> 1026
000
<210> 1027
<400> 1027
000
<210> 1028
<400> 1028
000
<210> 1029
<400> 1029
000
<210> 1030
<400> 1030
000
<210> 1031
<400> 1031
000
<210> 1032
<400> 1032
000
<210> 1033
<400> 1033
000
<210> 1034
<400> 1034
000
<210> 1035
<400> 1035
000
<210> 1036
<400> 1036
000
<210> 1037
<400> 1037
000
<210> 1038
<400> 1038
000
<210> 1039
<400> 1039
000
<210> 1040
<400> 1040
000
<210> 1041
<400> 1041
000
<210> 1042
<400> 1042
000
<210> 1043
<400> 1043
000
<210> 1044
<400> 1044
000
<210> 1045
<400> 1045
000
<210> 1046
<400> 1046
000
<210> 1047
<400> 1047
000
<210> 1048
<400> 1048
000
<210> 1049
<400> 1049
000
<210> 1050
<400> 1050
000
<210> 1051
<211> 510
<212> PRT
<213> Ricinus communis
<220>
<221> MOD_RES
<222> (117)..(117)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (122)..(122)
<223> Any amino acid
<400> 1051
Met Ala Ala Gly Leu Ala Ile Thr Ser Glu Gly Gly Gln Tyr Asn Gly
1 5 10 15
Arg Met Thr Ser Phe Val Ala Leu Ser Cys Met Met Ala Ala Met Gly
20 25 30
Gly Val Ile Phe Gly Tyr Asp Ile Gly Val Ser Gly Gly Val Thr Ser
35 40 45
Met Asp Pro Phe Leu Lys Lys Phe Phe Pro Asp Val Tyr Arg Lys Met
50 55 60
Lys Glu Asp Thr Glu Ile Ser Asn Tyr Cys Lys Phe Asp Ser Gln Leu
65 70 75 80
Leu Thr Ser Phe Thr Ser Ser Leu Tyr Val Ala Gly Leu Val Ala Ser
85 90 95
Phe Phe Ala Ser Ser Val Thr Arg Ala Phe Gly Arg Lys Pro Ser Ile
100 105 110
Leu Leu Gly Gly Xaa Val Phe Leu Ala Xaa Ala Ala Leu Gly Gly Ala
115 120 125
Ala Val Asn Val Tyr Met Leu Ile Phe Gly Arg Val Leu Leu Gly Val
130 135 140
Gly Val Gly Phe Ala Asn Gln Ala Val Pro Leu Tyr Leu Ser Glu Met
145 150 155 160
Ala Pro Pro Arg Tyr Arg Gly Ala Ile Asn Asn Gly Phe Gln Phe Ser
165 170 175
Val Gly Ile Gly Ala Leu Ser Ala Asn Leu Ile Asn Tyr Gly Thr Glu
180 185 190
Lys Ile Glu Gly Gly Trp Gly Trp Arg Ile Ser Leu Ala Met Ala Ala
195 200 205
Val Pro Ala Ala Ile Leu Thr Phe Gly Ala Leu Phe Leu Pro Glu Thr
210 215 220
Pro Asn Ser Leu Ile Gln Arg Ser Asn Asp His Glu Arg Ala Lys Leu
225 230 235 240
Met Leu Gln Arg Val Arg Gly Thr Thr Asp Val Gln Ala Glu Leu Asp
245 250 255
Asp Leu Ile Lys Ala Ser Ile Ile Ser Arg Thr Ile Gln His Pro Phe
260 265 270
Lys Asn Ile Met Arg Arg Lys Tyr Arg Pro Gln Leu Val Met Ala Val
275 280 285
Ala Ile Pro Phe Phe Gln Gln Val Thr Gly Ile Asn Val Ile Ala Phe
290 295 300
Tyr Ala Pro Ile Leu Phe Arg Thr Ile Gly Leu Glu Glu Ser Ala Ser
305 310 315 320
Leu Leu Ser Ser Ile Val Thr Gly Leu Val Gly Ser Ala Ser Thr Phe
325 330 335
Ile Ser Met Leu Ile Val Asp Lys Leu Gly Arg Arg Ala Leu Phe Ile
340 345 350
Phe Gly Gly Val Gln Met Phe Val Ala Gln Ile Met Val Gly Ser Ile
355 360 365
Met Ala Ala Glu Leu Gly Asp His Gly Gly Ile Gly Lys Gly Tyr Ala
370 375 380
Tyr Ile Val Leu Ile Leu Ile Cys Ile Tyr Val Ala Gly Phe Gly Trp
385 390 395 400
Ser Trp Gly Pro Leu Gly Trp Leu Val Pro Ser Glu Ile Phe Pro Leu
405 410 415
Glu Ile Arg Ser Ala Gly Gln Ser Ile Val Val Ala Val Ser Phe Leu
420 425 430
Phe Thr Phe Val Val Ala Gln Thr Phe Leu Ser Met Leu Cys His Phe
435 440 445
Lys Ser Gly Ile Phe Phe Phe Phe Gly Gly Trp Val Val Val Met Thr
450 455 460
Ala Phe Val His Phe Leu Leu Pro Glu Thr Lys Lys Val Pro Ile Glu
465 470 475 480
Lys Met Asp Ile Val Trp Arg Asp His Trp Phe Trp Lys Lys Ile Ile
485 490 495
Gly Glu Glu Ala Ala Glu Glu Asn Asn Lys Met Glu Ala Ala
500 505 510
<210> 1052
<211> 219
<212> PRT
<213> Ricinus communis
<400> 1052
Met Ala Asp Glu Val Ile Leu Leu Asp Phe Trp Ala Ser Pro Phe Gly
1 5 10 15
Met Arg Val Arg Ile Ala Leu Ala Glu Lys Gly Val Lys Tyr Glu Tyr
20 25 30
Arg Glu Glu Asn Leu Arg Asn Lys Ser Pro Leu Leu Leu Glu Met Asn
35 40 45
Pro Val His Lys Lys Ile Pro Val Leu Ile His Asn Gly Lys Pro Ile
50 55 60
Cys Glu Ser Leu Ile Ala Val Gln Tyr Ile Asp Glu Val Trp His Asp
65 70 75 80
Glu Ser Pro Leu Leu Pro Ser Asp Ser Tyr Pro Arg Ala His Ala Arg
85 90 95
Phe Trp Ala Asp Phe Val Asp Lys Lys Ile Tyr Glu Leu Gly Arg Lys
100 105 110
Ile Trp Thr Thr Lys Gly Glu Asp Gln Glu Ala Gly Lys Lys Glu Phe
115 120 125
Ile Asp Ala Ile Lys Leu Leu Glu Gly Glu Leu Gly Asp Lys Pro Tyr
130 135 140
Phe Gly Gly Glu Ser Phe Gly Tyr Val Asp Val Ala Leu Ile Pro Phe
145 150 155 160
Tyr Ser Trp Phe Tyr Ala Tyr Glu Thr Cys Gly Asn Phe Ser Ile Glu
165 170 175
Ala Glu Cys Pro Lys Phe Met Ala Trp Ile Lys Arg Cys Leu Gln Lys
180 185 190
Glu Ser Val Ser Lys Ala Leu Pro Asp Gln Gln Lys Val Tyr Glu Phe
195 200 205
Val Leu Glu Leu Lys Lys Val Phe Gly Ile Glu
210 215
<210> 1053
<211> 205
<212> PRT
<213> Ricinus communis
<400> 1053
Met Asp Lys Ser Lys Val Ser Thr Ala Val Gly Gly Glu Thr Pro Val
1 5 10 15
Gly Leu Ile Thr Gly Ser Arg Asp Asp Glu Leu Glu Ser Gly Ser Met
20 25 30
Arg Thr Ala Glu Thr Val Leu Arg Leu Val Pro Met Ala Phe Cys Ile
35 40 45
Ser Ala Leu Val Leu Met Leu Lys Asn Ser Gln Thr Asn Asp Phe Gly
50 55 60
Thr Leu Ser Tyr Ser Asp Leu Gly Ala Phe Arg Tyr Leu Val His Ala
65 70 75 80
Asn Gly Ile Cys Ala Gly Tyr Ser Leu Leu Ser Ala Ile Ile Val Ala
85 90 95
Met Pro Arg Pro Ser Thr Met Ser Arg Ala Trp Thr Phe Phe Phe Leu
100 105 110
Asp Gln Val Leu Thr Tyr Val Ile Leu Ala Ala Ala Ala Val Ser Val
115 120 125
Glu Ala Leu Tyr Leu Ala Arg Lys Gly Asp Ile Ala Ile Thr Trp Ser
130 135 140
Ala Ala Cys Val Ser Phe Gly Gly Phe Cys His Lys Ala Ile Thr Ser
145 150 155 160
Ala Val Ile Thr Phe Ile Val Val Val Cys Tyr Ala Leu Leu Ser Leu
165 170 175
Val Ser Ser Tyr Lys Leu Phe Ser Arg Tyr Gly Ala Pro Asp Val Ser
180 185 190
Tyr Pro Gly Lys Gly Ile Glu Val Ala Ala Phe His Ser
195 200 205
<210> 1054
<211> 1033
<212> PRT
<213> Ricinus communis
<400> 1054
Met Gly Ser Met Val Val Leu Val Gly Ser Met Pro Ser Leu Ala Ser
1 5 10 15
Leu Ile Ser Leu Gly Ser Leu Ser Val Ala Ala Ala Thr Ser Ser Ser
20 25 30
Ser Asp Ser Tyr Tyr Ser Ser Ser Tyr Ser Leu Val Arg Arg Val Ser
35 40 45
Leu Ser Lys Arg Gly Leu Lys Ser Ala Lys Arg Trp His Cys Val Cys
50 55 60
Lys Cys Ser Val Thr Thr Thr Asp Phe Ile Ala Asp Gln Gly Asn Ala
65 70 75 80
Val Ser Ile Asp Ser Asn Asn Ser Phe Arg Ala Ser Ser Asn Gly Gly
85 90 95
Asp Ala Asp Ser Glu Ile Leu Leu Lys Pro Ala Pro Arg Pro Val Leu
100 105 110
Lys Pro Ser Leu Gly Ser Lys Gly Asp Ser Leu Leu Gly Met Ser Ser
115 120 125
Ser Gln Leu Asn Ser Gly Asp Ser Asp Asn Asp Asp Glu Gln Glu Arg
130 135 140
Asn Lys Val Ile Glu Ser Leu Gly Glu Val Leu Glu Lys Ala Glu Lys
145 150 155 160
Leu Glu Thr Ser Lys Pro Ser Gly Pro Gly Asn Pro Ser Ser Ser Gly
165 170 175
Lys Asp Asn Gly Asn Val Asn Lys Ile Thr Pro Pro Asn Ile Gly Thr
180 185 190
Asn Ser Arg Ile Ala Lys Ser Glu Ser Ser Gly Ala Thr Arg Lys Thr
195 200 205
Lys Thr Leu Lys Ser Val Trp Arg Lys Gly Asp Thr Val Ser Ser Val
210 215 220
Gln Lys Val Val Lys Glu Ala Pro Lys Val Ile Asn Lys Leu Val Lys
225 230 235 240
Glu Asp Thr Ile Thr Gly Glu Gly Thr Lys Leu Glu Ser Gln Ser Ser
245 250 255
Phe Pro Leu Arg Pro Val Gln Pro Pro Leu Arg Pro Gln Pro Lys Leu
260 265 270
Gln Ala Lys Pro Ser Val Ala Pro Pro Pro Val Met Lys Lys Pro Val
275 280 285
Ile Leu Lys Asp Val Gly Ala Ala Pro Arg Pro Pro Val Ser Gly Glu
290 295 300
Ala Asp Ser Lys Asn Asn Gly Arg Gln Pro Ile Leu Val Asp Lys Phe
305 310 315 320
Ala Arg Lys Lys Pro Val Val Asp Pro Leu Ile Ala Gln Ala Val Leu
325 330 335
Ala Pro Thr Lys Pro Gly Lys Gly Pro Ala Pro Gly Lys Phe Lys Asp
340 345 350
Arg Lys Lys Ser Ile Ser Pro Gly Gly Pro Arg Arg Arg Leu Val Asn
355 360 365
Asn Asp Glu Leu Glu Ile Pro Asp Glu Glu Thr Ser Glu Leu Asn Val
370 375 380
Ser Ile Pro Gly Thr Ala Arg Lys Gly Arg Lys Trp Ser Lys Ala Ser
385 390 395 400
Arg Lys Ala Ala Arg Leu Gln Ala Ala Lys Asp Ala Ala Pro Val Lys
405 410 415
Val Glu Ile Leu Glu Val Gly Glu Asn Gly Met Leu Ile Glu Glu Leu
420 425 430
Ala Tyr Asn Leu Thr Ile Ser Glu Gly Glu Ile Leu Gly Tyr Leu Tyr
435 440 445
Ser Lys Gly Ile Lys Pro Asp Gly Val Gln Thr Leu Asp Lys Asp Met
450 455 460
Val Lys Met Ile Cys Lys Glu His Asp Val Glu Val Ile Asp Val Ala
465 470 475 480
Pro Val Arg Phe Glu Glu Met Ala Arg Lys Arg Glu Ile Leu Asp Glu
485 490 495
Asp Asp Leu Asp Lys Leu Glu Asp Arg Pro Pro Val Leu Thr Ile Met
500 505 510
Gly His Val Asp His Gly Lys Thr Thr Leu Leu Asp Tyr Ile Arg Lys
515 520 525
Ser Lys Val Thr Ala Ser Glu Ala Gly Gly Ile Thr Gln Gly Ile Gly
530 535 540
Ala Tyr Lys Val Leu Thr Pro Val Asp Gly Lys Met Gln Pro Cys Val
545 550 555 560
Phe Leu Asp Thr Pro Gly His Glu Ala Phe Gly Ala Met Arg Ala Arg
565 570 575
Gly Ala Arg Val Thr Asp Ile Ala Ile Ile Val Val Ala Ala Asp Asp
580 585 590
Gly Ile Arg Pro Gln Thr Asn Glu Ala Ile Ala His Ala Lys Ala Ala
595 600 605
Gly Val Pro Ile Val Val Ala Ile Asn Lys Ile Asp Lys Asp Gly Ala
610 615 620
Asn Pro Glu Arg Val Met Gln Asp Leu Ser Ser Ile Gly Leu Met Pro
625 630 635 640
Glu Asp Trp Gly Gly Asp Ile Pro Met Val Gln Ile Ser Ala Leu Lys
645 650 655
Gly Asp Asn Ile Asp Asp Leu Leu Glu Thr Val Met Leu Val Ala Glu
660 665 670
Leu Gln Glu Leu Lys Ala Asn Pro His Arg Asn Ala Lys Gly Thr Val
675 680 685
Ile Glu Ala Gly Leu Asp Lys Ser Lys Gly Pro Ile Ala Thr Phe Ile
690 695 700
Ile Gln Asn Gly Thr Leu Lys Arg Gly Asp Val Val Val Cys Gly Glu
705 710 715 720
Ala Phe Gly Lys Val Arg Ala Leu Phe Asp Asp Gly Gly Lys Arg Val
725 730 735
Asp Glu Ala Gly Pro Ser Ile Pro Val Gln Val Ile Gly Leu Ser Asn
740 745 750
Val Pro Lys Ala Gly Asp Glu Phe Glu Ala Val Ala Ser Leu Asp Ile
755 760 765
Ala Arg Glu Lys Ala Glu Ala Arg Ala Glu Leu Leu Arg Asn Glu Arg
770 775 780
Ile Thr Ala Lys Ala Gly Asp Gly Lys Ile Thr Leu Ser Ser Leu Ala
785 790 795 800
Ser Ala Val Ser Ser Gly Arg Leu Ser Gly Ile Asp Leu His Gln Leu
805 810 815
Asn Ile Ile Leu Lys Val Asp Val Gln Gly Ser Val Glu Ala Val Arg
820 825 830
Gln Ala Leu Gln Val Leu Pro Gln Asp Asn Val Thr Leu Lys Phe Leu
835 840 845
Leu Gln Ala Thr Gly Asp Val Ser Ser Ser Asp Val Asp Leu Ala Ile
850 855 860
Ala Ser Glu Ala Ile Ile Leu Gly Phe Asn Val Lys Ala Pro Gly Ser
865 870 875 880
Val Lys Ser Asn Ala Glu Asn Lys Gly Val Glu Ile Arg Leu Tyr Arg
885 890 895
Val Ile Tyr Asp Leu Ile Asp Asp Val Arg Asn Ala Met Glu Gly Leu
900 905 910
Leu Glu Pro Val Glu Glu Gln Glu Thr Ile Gly Ser Ala Val Val Arg
915 920 925
Ala Val Phe Ser Ser Gly Ser Gly Arg Val Ala Gly Cys Met Val Thr
930 935 940
Asp Gly Lys Val Val Lys Gly Cys Gly Val Lys Val Ile Arg Lys Arg
945 950 955 960
Lys Thr Ile His Val Gly Val Leu Asp Ser Leu Arg Arg Val Lys Glu
965 970 975
Leu Val Lys Glu Val Ser Ala Gly Leu Glu Cys Gly Ile Ala Met Glu
980 985 990
Asp Tyr Asp Asp Trp Glu Glu Gly Asp Thr Ile Glu Ala Phe Asn Thr
995 1000 1005
Val Glu Lys Lys Arg Thr Leu Glu Glu Ala Ser Ala Ser Met Ala
1010 1015 1020
Ala Ala Leu Glu His Ala Gly Ile Asn Val
1025 1030
<210> 1055
<211> 1165
<212> PRT
<213> Ricinus communis
<400> 1055
Met Ala Asp Pro Asp Pro Tyr Ser Ser Ser Ser Thr Ser Asp Ile Pro
1 5 10 15
His Asn Asp Val Ser Trp Asn Ser Asn Gln Ile Leu Glu Ser Val Asp
20 25 30
Thr Gln Met Leu Ile Asp Pro Val Ala Asn Asn Gly Ile Asp Ala Gly
35 40 45
Arg Ser Val Leu Gly Phe Ser Leu Thr Ser Pro Asp Leu Val Ile Cys
50 55 60
Ala Gly Ser Cys Gly Asp Ser Pro Glu Phe Phe Asn Arg Thr Thr Lys
65 70 75 80
Asn Tyr Ser Phe Glu Leu Ser Leu Glu Asn Gly Ile Asn Gly Thr Asn
85 90 95
Thr Lys Asp Thr Gln Lys Ile Gln Ser Val Lys Phe Ser Pro Ile Cys
100 105 110
Gln Thr Phe Asn Lys Gln Leu Ser Pro Glu Ser Ser Leu Glu Glu Leu
115 120 125
Val Ala Glu Pro Ser Arg Met Arg Asn Asp Asp Asn Leu Leu Lys Asp
130 135 140
Pro Leu Ile Gly Val Ser Ile Asn Val Gly Ser Thr Asn Glu Gly Val
145 150 155 160
Val Leu Asn Gly Val Gln Phe Leu Glu Asp Thr Cys Tyr Thr Gly Gly
165 170 175
Asp Thr Val Lys Thr Asn Ala Thr Ile Gly Asp Leu Asp Arg Glu Glu
180 185 190
Asp Gly Leu Ser Leu Tyr Gln Thr Ala Arg Phe Gly Asn Phe Ser Tyr
195 200 205
Cys Ile Pro Ala Met Glu Pro Gly Asn Tyr Val Val Thr Leu His Leu
210 215 220
Ala Glu Ile Val Phe Thr Asp Gly Pro Pro Gly Arg Arg Val Phe Asp
225 230 235 240
Val Phe Ile Gln Glu Lys Lys Val Val Ser Ser Leu Asp Ile Tyr Ala
245 250 255
Gln Val Gly Ala Asn Lys Pro Leu Val Ile Ser Gln Leu Lys Thr Cys
260 265 270
Val Asp Gly Glu Glu Gly Leu Thr Ile Arg Phe Gln Gly Val Ile Gly
275 280 285
Ser Pro Ile Val Cys Gly Ile Ser Ile Thr Glu Asp Ser Ser Ala His
290 295 300
Ala Gly Glu Ala Gln Phe Ser Lys Gln Met Gly Met Ser Gln Val Ala
305 310 315 320
Glu Cys Asn Leu Leu Lys Gln Tyr Asn Ser Glu Gln Glu Pro Asp Gly
325 330 335
Asp His Gln Lys Leu Glu Arg His Val Glu Phe Gln Glu Lys Glu Leu
340 345 350
Thr Glu Met Arg Arg Ala Leu Glu Glu Leu Lys Arg Glu Asn Gln Leu
355 360 365
Lys Asn Arg Glu Cys Gln Asp Ala Trp Asn Ser Leu His Glu Leu Gln
370 375 380
Asn Glu Leu Met Arg Lys Ser Met His Val Gly Ser Leu Ala Phe Ala
385 390 395 400
Ile Glu Gly Gln Val Lys Glu Lys Ser Lys Trp Phe Ser Ser Leu Arg
405 410 415
Asp Met Thr Arg Lys Leu Lys Ile Met Arg Ile Glu His Leu Lys Ile
420 425 430
Ser Glu Glu Ala Leu Ala Tyr Lys Lys Cys Leu Arg Asp Met Glu Glu
435 440 445
Met Arg Ser Thr Ile Gln Ser Thr Met Lys Gln Gln Val Asp Leu His
450 455 460
Glu Asp Leu Lys Ile Lys Phe Ile Glu Gly Glu Lys Lys Arg Lys Glu
465 470 475 480
Leu Tyr Asn Arg Val Leu Glu Leu Lys Gly Asn Ile Lys Val Phe Cys
485 490 495
Arg Cys Arg Pro Leu Asn Ala Glu Glu Val Ala Ser Gly Asp Ser Met
500 505 510
Ala Ile Asp Phe Glu Ser Ala Lys Asp Gly Glu Leu Thr Val Ile Ser
515 520 525
Asn Gly Leu Pro Arg Lys Thr Phe Lys Phe Asp Ala Val Phe Ser Pro
530 535 540
Glu Ala Asp Gln Ala Asp Val Phe Gly Asp Thr Ala Pro Phe Ala Thr
545 550 555 560
Ser Val Leu Asp Gly Tyr Asn Val Cys Ile Phe Ala Tyr Gly Gln Thr
565 570 575
Gly Thr Gly Lys Thr Phe Thr Met Glu Gly Ser Glu Glu Ala Arg Gly
580 585 590
Val Asn Phe Arg Thr Leu Glu Glu Ile Phe Arg Ile Ile Lys Glu Arg
595 600 605
Tyr Lys Leu Phe Arg Tyr Asp Ile Phe Val Ser Val Leu Glu Val Tyr
610 615 620
Asn Glu Gln Ile Arg Asp Leu Leu Gly Ser Gly Ser Gln Pro Gly Val
625 630 635 640
Ala Thr Lys Arg Leu Glu Ile Arg Gln Ala Gly Glu Gly Leu His His
645 650 655
Val Pro Gly Leu Val Glu Ala Gln Val Asn Asn Ile Ser Glu Ala Trp
660 665 670
Glu Val Leu Gln Thr Gly Ser Asn Ala Arg Ala Ile Gly Ser Thr Asn
675 680 685
Ala Asn Glu His Ser Ser Arg Ser His Cys Ile His Cys Val Met Val
690 695 700
Lys Gly Glu Asn Leu Leu Asn Gly Glu Cys Thr Lys Ser Lys Leu Trp
705 710 715 720
Leu Val Asp Leu Ala Gly Ser Glu Arg Val Ala Lys Thr Glu Val Gln
725 730 735
Gly Asp Arg Leu Lys Glu Thr Gln Asn Ile Asn Arg Ser Leu Ser Ala
740 745 750
Leu Gly Asp Val Ile Ser Ala Leu Ala Thr Lys Ser Pro His Ile Pro
755 760 765
Phe Arg Asn Ser Lys Leu Thr His Leu Leu Gln Asp Ser Leu Gly Gly
770 775 780
Asp Ser Lys Thr Leu Met Phe Val Gln Ile Ser Pro Ser Glu Asn Asp
785 790 795 800
Leu Gly Glu Thr Val Cys Ser Leu Asn Phe Ala Ser Arg Val Arg Gly
805 810 815
Ile Glu Leu Gly Pro Ala Arg Arg Gln Leu Asp Asn Thr Glu Leu Gln
820 825 830
Arg Tyr Lys Gln Met Ala Glu Lys Ser Lys Gln Asp Met Lys Ser Lys
835 840 845
Asp Ile Gln Ile Lys Lys Met Glu Glu Thr Ile Asn Gly Leu Val Leu
850 855 860
Arg Ile Lys Glu Lys Asp Leu Arg Asn Lys Asn Leu Gln Glu Lys Leu
865 870 875 880
Lys Glu Leu Glu Ser Gln Leu Leu Ile Glu Arg Lys Leu Ala Arg Gln
885 890 895
His Val Asp Thr Lys Ile Ala Glu Gln Gln Gln Gln Gln Gln Met Lys
900 905 910
Gln Gln Gln Asp Glu Gln Ser Ser Ala Pro Pro Arg Pro Pro Leu Ala
915 920 925
Asn Arg Leu Leu Gly Ser Asn Lys Asn Phe Ser Glu Ala Ala Ser Thr
930 935 940
Ala Thr Thr Lys Glu Gln Val Asn Ser Trp Gln Pro Leu Val Glu Asn
945 950 955 960
Asn Ser Tyr Arg Pro Thr Leu Cys Ile Leu Pro Thr Asp Gly Met Val
965 970 975
Lys Tyr Ile Asp Pro Thr Glu Lys Glu Asn Asn Pro Gly Met Ala Glu
980 985 990
His Pro Arg Leu Pro Lys Arg Thr Gly Arg Ala Ser Ile Cys Thr Thr
995 1000 1005
Ala Gln Arg Ile Pro Val Ala Pro Ala Pro Arg Arg Thr Ser Met
1010 1015 1020
Ile Pro Leu Pro Ser Val Pro Gly Leu Ala His Leu Pro Ser Pro
1025 1030 1035
Leu Ala Pro Leu Ser Leu Cys Glu Ile Asp Ile Lys Glu Glu Asp
1040 1045 1050
Thr Gly Gly Ser Glu Ile Asn Cys Leu Pro Glu Gln Thr His Cys
1055 1060 1065
Asn Ser Pro Lys Gly Ile Lys His Gly Thr Arg Lys Leu Ser Thr
1070 1075 1080
Ile Leu Arg Gln Ser Leu Gln Lys Lys Met Gln Leu Asn Ser Pro
1085 1090 1095
Met Gln Gln His Leu Arg Lys Arg Gly Ile Asn Val Gly Met Glu
1100 1105 1110
Lys Val Arg Val Ser Ile Gly Ser Arg Gly Arg Met Ala His Arg
1115 1120 1125
Val Leu Leu Gly Asn Gly Arg Arg Thr Gly Ile Lys Asp Thr Gln
1130 1135 1140
Gln Asn Arg Ser His Arg Glu Lys Glu Arg Gly Trp Asn Ile Gly
1145 1150 1155
Thr Ala Gly Arg Thr Ala Ile
1160 1165
<210> 1056
<211> 1164
<212> PRT
<213> Ricinus communis
<400> 1056
Met Ala Asp Pro Asp Pro Tyr Ser Ser Ser Ser Thr Ser Asp Ile Pro
1 5 10 15
His Asn Asp Val Ser Trp Asn Ser Asn Gln Ile Leu Glu Ser Val Asp
20 25 30
Thr Gln Met Leu Ile Asp Pro Val Ala Asn Asn Gly Ile Asp Gly Arg
35 40 45
Ser Val Leu Gly Phe Ser Leu Thr Ser Pro Asp Leu Val Ile Cys Ala
50 55 60
Gly Ser Cys Gly Asp Ser Pro Glu Phe Phe Asn Arg Thr Thr Lys Asn
65 70 75 80
Tyr Ser Phe Glu Leu Ser Leu Glu Asn Gly Ile Asn Gly Thr Asn Thr
85 90 95
Lys Asp Thr Gln Lys Ile Gln Ser Val Lys Phe Ser Pro Ile Cys Gln
100 105 110
Thr Phe Asn Lys Gln Leu Ser Pro Glu Ser Ser Leu Glu Glu Leu Val
115 120 125
Ala Glu Pro Ser Arg Met Arg Asn Asp Asp Asn Leu Leu Lys Asp Pro
130 135 140
Leu Ile Gly Val Ser Ile Asn Val Gly Ser Thr Asn Glu Gly Val Val
145 150 155 160
Leu Asn Gly Val Gln Phe Leu Glu Asp Thr Cys Tyr Thr Gly Gly Asp
165 170 175
Thr Val Lys Thr Asn Ala Thr Ile Gly Asp Leu Asp Arg Glu Glu Asp
180 185 190
Gly Leu Ser Leu Tyr Gln Thr Ala Arg Phe Gly Asn Phe Ser Tyr Cys
195 200 205
Ile Pro Ala Met Glu Pro Gly Asn Tyr Val Val Thr Leu His Leu Ala
210 215 220
Glu Ile Val Phe Thr Asp Gly Pro Pro Gly Arg Arg Val Phe Asp Val
225 230 235 240
Phe Ile Gln Glu Lys Lys Val Val Ser Ser Leu Asp Ile Tyr Ala Gln
245 250 255
Val Gly Ala Asn Lys Pro Leu Val Ile Ser Gln Leu Lys Thr Cys Val
260 265 270
Asp Gly Glu Glu Gly Leu Thr Ile Arg Phe Gln Gly Val Ile Gly Ser
275 280 285
Pro Ile Val Cys Gly Ile Ser Ile Thr Glu Asp Ser Ser Ala His Ala
290 295 300
Gly Glu Ala Gln Phe Ser Lys Gln Met Gly Met Ser Gln Val Ala Glu
305 310 315 320
Cys Asn Leu Leu Lys Gln Tyr Asn Ser Glu Gln Glu Pro Asp Gly Asp
325 330 335
His Gln Lys Leu Glu Arg His Val Glu Phe Gln Glu Lys Glu Leu Thr
340 345 350
Glu Met Arg Arg Ala Leu Glu Glu Leu Lys Arg Glu Asn Gln Leu Lys
355 360 365
Asn Arg Glu Cys Gln Asp Ala Trp Asn Ser Leu His Glu Leu Gln Asn
370 375 380
Glu Leu Met Arg Lys Ser Met His Val Gly Ser Leu Ala Phe Ala Ile
385 390 395 400
Glu Gly Gln Val Lys Glu Lys Ser Lys Trp Phe Ser Ser Leu Arg Asp
405 410 415
Met Thr Arg Lys Leu Lys Ile Met Arg Ile Glu His Leu Lys Ile Ser
420 425 430
Glu Glu Ala Leu Ala Tyr Lys Lys Cys Leu Arg Asp Met Glu Glu Met
435 440 445
Arg Ser Thr Ile Gln Ser Thr Met Lys Gln Gln Val Asp Leu His Glu
450 455 460
Asp Leu Lys Ile Lys Phe Ile Glu Gly Glu Lys Lys Arg Lys Glu Leu
465 470 475 480
Tyr Asn Arg Val Leu Glu Leu Lys Gly Asn Ile Lys Val Phe Cys Arg
485 490 495
Cys Arg Pro Leu Asn Ala Glu Glu Val Ala Ser Gly Asp Ser Met Ala
500 505 510
Ile Asp Phe Glu Ser Ala Lys Asp Gly Glu Leu Thr Val Ile Ser Asn
515 520 525
Gly Leu Pro Arg Lys Thr Phe Lys Phe Asp Ala Val Phe Ser Pro Glu
530 535 540
Ala Asp Gln Ala Asp Val Phe Gly Asp Thr Ala Pro Phe Ala Thr Ser
545 550 555 560
Val Leu Asp Gly Tyr Asn Val Cys Ile Phe Ala Tyr Gly Gln Thr Gly
565 570 575
Thr Gly Lys Thr Phe Thr Met Glu Gly Ser Glu Glu Ala Arg Gly Val
580 585 590
Asn Phe Arg Thr Leu Glu Glu Ile Phe Arg Ile Ile Lys Glu Arg Tyr
595 600 605
Lys Leu Phe Arg Tyr Asp Ile Phe Val Ser Val Leu Glu Val Tyr Asn
610 615 620
Glu Gln Ile Arg Asp Leu Leu Gly Ser Gly Ser Gln Pro Gly Val Ala
625 630 635 640
Thr Lys Arg Leu Glu Ile Arg Gln Ala Gly Glu Gly Leu His His Val
645 650 655
Pro Gly Leu Val Glu Ala Gln Val Asn Asn Ile Ser Glu Ala Trp Glu
660 665 670
Val Leu Gln Thr Gly Ser Asn Ala Arg Ala Ile Gly Ser Thr Asn Ala
675 680 685
Asn Glu His Ser Ser Arg Ser His Cys Ile His Cys Val Met Val Lys
690 695 700
Gly Glu Asn Leu Leu Asn Gly Glu Cys Thr Lys Ser Lys Leu Trp Leu
705 710 715 720
Val Asp Leu Ala Gly Ser Glu Arg Val Ala Lys Thr Glu Val Gln Gly
725 730 735
Asp Arg Leu Lys Glu Thr Gln Asn Ile Asn Arg Ser Leu Ser Ala Leu
740 745 750
Gly Asp Val Ile Ser Ala Leu Ala Thr Lys Ser Pro His Ile Pro Phe
755 760 765
Arg Asn Ser Lys Leu Thr His Leu Leu Gln Asp Ser Leu Gly Gly Asp
770 775 780
Ser Lys Thr Leu Met Phe Val Gln Ile Ser Pro Ser Glu Asn Asp Leu
785 790 795 800
Gly Glu Thr Val Cys Ser Leu Asn Phe Ala Ser Arg Val Arg Gly Ile
805 810 815
Glu Leu Gly Pro Ala Arg Arg Gln Leu Asp Asn Thr Glu Leu Gln Arg
820 825 830
Tyr Lys Gln Met Ala Glu Lys Ser Lys Gln Asp Met Lys Ser Lys Asp
835 840 845
Ile Gln Ile Lys Lys Met Glu Glu Thr Ile Asn Gly Leu Val Leu Arg
850 855 860
Ile Lys Glu Lys Asp Leu Arg Asn Lys Asn Leu Gln Glu Lys Leu Lys
865 870 875 880
Glu Leu Glu Ser Gln Leu Leu Ile Glu Arg Lys Leu Ala Arg Gln His
885 890 895
Val Asp Thr Lys Ile Ala Glu Gln Gln Gln Gln Gln Gln Met Lys Gln
900 905 910
Gln Gln Asp Glu Gln Ser Ser Ala Pro Pro Arg Pro Pro Leu Ala Asn
915 920 925
Arg Leu Leu Gly Ser Asn Lys Asn Phe Ser Glu Ala Ala Ser Thr Ala
930 935 940
Thr Thr Lys Glu Gln Val Asn Ser Trp Gln Pro Leu Val Glu Asn Asn
945 950 955 960
Ser Tyr Arg Pro Thr Leu Cys Ile Leu Pro Thr Asp Gly Met Val Lys
965 970 975
Tyr Ile Asp Pro Thr Glu Lys Glu Asn Asn Pro Gly Met Ala Glu His
980 985 990
Pro Arg Leu Pro Lys Arg Thr Gly Arg Ala Ser Ile Cys Thr Thr Ala
995 1000 1005
Gln Arg Ile Pro Val Ala Pro Ala Pro Arg Arg Thr Ser Met Ile
1010 1015 1020
Pro Leu Pro Ser Val Pro Gly Leu Ala His Leu Pro Ser Pro Leu
1025 1030 1035
Ala Pro Leu Ser Leu Cys Glu Ile Asp Ile Lys Glu Glu Asp Thr
1040 1045 1050
Gly Gly Ser Glu Ile Asn Cys Leu Pro Glu Gln Thr His Cys Asn
1055 1060 1065
Ser Pro Lys Gly Ile Lys His Gly Thr Arg Lys Leu Ser Thr Ile
1070 1075 1080
Leu Arg Gln Ser Leu Gln Lys Lys Met Gln Leu Asn Ser Pro Met
1085 1090 1095
Gln Gln His Leu Arg Lys Arg Gly Ile Asn Val Gly Met Glu Lys
1100 1105 1110
Val Arg Val Ser Ile Gly Ser Arg Gly Arg Met Ala His Arg Val
1115 1120 1125
Leu Leu Gly Asn Gly Arg Arg Thr Gly Ile Lys Asp Thr Gln Gln
1130 1135 1140
Asn Arg Ser His Arg Glu Lys Glu Arg Gly Trp Asn Ile Gly Thr
1145 1150 1155
Ala Gly Arg Thr Ala Ile
1160
<210> 1057
<211> 465
<212> PRT
<213> Ricinus communis
<220>
<221> MOD_RES
<222> (415)..(415)
<223> Any amino acid
<400> 1057
Met Glu Glu Ser Lys Leu Glu Lys Lys Asn Val Pro Val Leu Pro Trp
1 5 10 15
Met Arg Cys Pro Val Asp Ile Lys Gln Phe Glu Glu Cys Ser Leu Asp
20 25 30
Leu Val Pro Cys Leu Asp Pro Arg Leu Lys Val Ala Leu Glu Asn Met
35 40 45
Gly Phe Thr Ser Leu Phe Ala Val Gln Val Ala Val Trp Gln Glu Thr
50 55 60
Ile Gly Pro Gly Asn Phe Glu Arg Asp Leu Cys Ile Asn Ala Pro Thr
65 70 75 80
Gly Ser Gly Lys Thr Leu Ala Tyr Ala Leu Pro Ile Ile Gln Met Leu
85 90 95
Ser Thr Arg Ser Ile Lys Cys Leu Arg Ala Leu Ile Val Leu Pro Thr
100 105 110
Arg Asp Leu Ala Leu Gln Val Lys Gln Val Phe Ala Ala Leu Ala Pro
115 120 125
Ala Val Gly Leu Ser Val Gly Leu Ala Val Gly Gln Ser Ser Ile Ala
130 135 140
Gly Glu Ile Ser Glu Leu Ile Lys Arg Pro Lys Leu Glu Ala Gly Ile
145 150 155 160
Cys Tyr Asp Arg Asp Asp Leu Met Gln Glu Leu Gln Thr Ser Val Asp
165 170 175
Ile Leu Val Ala Thr Pro Gly Arg Leu Met Asp His Ile Thr Asn Thr
180 185 190
Lys Gly Phe Thr Leu Glu His Leu Cys Tyr Leu Val Glu Arg Gly Phe
195 200 205
Lys Gly Lys Ser Tyr Pro Arg Leu Ala Lys Met Val Leu Ser Ala Thr
210 215 220
Leu Thr Gln Asp Pro Ser Lys Leu Val Gln Leu Asp Leu His His Pro
225 230 235 240
Leu Phe Leu Thr Thr Gly Gln Ser Arg Tyr Gln Leu Pro Glu Lys Leu
245 250 255
Glu Ser Tyr Arg Val Ile Cys Glu Pro Lys Leu Lys Pro Leu Tyr Leu
260 265 270
Val Ala Leu Leu Gln Asn Leu Val Gly Glu Lys Cys Ile Val Phe Ala
275 280 285
Ser Ser Val Glu Ser Thr His Arg Leu Cys Thr Leu Leu Lys Phe Phe
290 295 300
Gly Asp Leu Lys Val Lys Ile Lys Glu Tyr Ser Gly Leu Gln His Gln
305 310 315 320
Ser Val Arg Ser Lys Thr Leu Lys Ala Phe Arg Glu Gly Lys Ile Gln
325 330 335
Val Leu Val Ser Ser Asp Ala Met Thr Arg Gly Met Asp Val Glu Gly
340 345 350
Val Arg Asn Val Ile Asn Tyr Asp Lys Pro Ala Tyr Ile Lys Thr Tyr
355 360 365
Ile His Arg Ala Gly Arg Thr Ala Arg Ala Gly Gln Val Gly Arg Cys
370 375 380
Phe Thr Leu Leu His Lys Glu Glu Val Arg His Phe Arg Lys Leu Leu
385 390 395 400
Gln Lys Ala Asp Asn Asp Ser Phe Pro Val Tyr Ser Leu Pro Xaa Ser
405 410 415
Tyr Ile Glu Pro Leu Tyr Pro Thr Tyr Glu Ser Ala Leu Glu Lys Leu
420 425 430
Lys Glu Lys Val Gln Ser Glu Thr Ser Arg Lys Arg Arg Thr Gly Phe
435 440 445
Lys Phe Gln Gly Gln Val Lys Glu Arg Arg Lys Glu Lys Gln Ser Asn
450 455 460
Ser
465
<210> 1058
<400> 1058
000
<210> 1059
<400> 1059
000
<210> 1060
<400> 1060
000
<210> 1061
<400> 1061
000
<210> 1062
<400> 1062
000
<210> 1063
<400> 1063
000
<210> 1064
<400> 1064
000
<210> 1065
<400> 1065
000
<210> 1066
<400> 1066
000
<210> 1067
<400> 1067
000
<210> 1068
<400> 1068
000
<210> 1069
<400> 1069
000
<210> 1070
<400> 1070
000
<210> 1071
<400> 1071
000
<210> 1072
<400> 1072
000
<210> 1073
<400> 1073
000
<210> 1074
<400> 1074
000
<210> 1075
<400> 1075
000
<210> 1076
<400> 1076
000
<210> 1077
<400> 1077
000
<210> 1078
<400> 1078
000
<210> 1079
<400> 1079
000
<210> 1080
<400> 1080
000
<210> 1081
<400> 1081
000
<210> 1082
<400> 1082
000
<210> 1083
<400> 1083
000
<210> 1084
<400> 1084
000
<210> 1085
<400> 1085
000
<210> 1086
<400> 1086
000
<210> 1087
<400> 1087
000
<210> 1088
<400> 1088
000
<210> 1089
<400> 1089
000
<210> 1090
<400> 1090
000
<210> 1091
<400> 1091
000
<210> 1092
<400> 1092
000
<210> 1093
<400> 1093
000
<210> 1094
<400> 1094
000
<210> 1095
<400> 1095
000
<210> 1096
<400> 1096
000
<210> 1097
<400> 1097
000
<210> 1098
<400> 1098
000
<210> 1099
<400> 1099
000
<210> 1100
<400> 1100
000
<210> 1101
<211> 429
<212> DNA
<213> Bacillus anthracis
<400> 1101
atgttaaaaa aattatcagt atttcttatt ggtactttgc tattgtttgg tttagcagcc 60
tgtgatagca tcaaatcggt ggctagcgat gttacagtag gaaaagtaat tgaagaattt 120
aaggctgcag gacttgaagc agaacagcct agtgatctac cggaaaaaga atttgggaat 180
actagaaaag atgcgaaacg cattcttgta ccagcactag gagaagatag tggtggtaga 240
atatttgagt ttaaaaacaa acaagatctt gaacaagcga aaaagtacta tgacgattta 300
ggtaacggta atcaaatgtt attctctcat acttacgcaa aaggtaattt tcttttacaa 360
atgaatggtg acatggaaga tgcccaattt aacaaatata aagaagtaat ggacaaaata 420
attaagtaa 429
<210> 1102
<211> 210
<212> DNA
<213> Bacillus anthracis
<400> 1102
gtgtatatca taattaattt cgagccatta agtccagtta tgaatgacat agcaatcaag 60
cttgccatgg tactatttat accgttattc ctagcattaa ttgtcaaagt tatacttatg 120
aaatttatga aagagtcgat tgctggcaga attgcaagtc tatctctctt atttttcatg 180
tactatgtat ttatatttgt tacagggtaa 210
<210> 1103
<211> 639
<212> DNA
<213> Bacillus anthracis
<400> 1103
atggaagtgt tgatatttga attaattctc attgcggttc tgattccgtt gaatagtgtt 60
gtgaaaaaac atgtaccgaa atggaaagga aaagccggag agaaactggt gaaacgtatg 120
ctaagtaaat tagatccaaa aagttactat gtattacata atgtgacggt ttatacggag 180
tacggtgata caacacaaat tgaccatatt gttattgctg aaacaggtgt atttgttgtg 240
gagacgaaga actatgaggg ctggatctat ggaagtgaga aagcggcaag gtggacacag 300
ggtattttta gaaagaaatc ctcttttcaa aatccatttc accaaaacta taaacatata 360
aaagccattg aatggttaat agaacaacag ctgccgtgta tctctatggc agcatttcat 420
ccaaaatgca gtctaaaaag agtaaatgtt cattctaaag agaaacatgt cctgtattat 480
aacgatctac aaaaatgtat tgaatcatat actgatgtgc aactaacaaa tgatgaggtc 540
cagcatatct atcacacaat attacgagcg aatattatgg ataaggatat tgaaaagaaa 600
catgtgaagt atttacacaa taagttcgct aagcaataa 639
<210> 1104
<400> 1104
000
<210> 1105
<400> 1105
000
<210> 1106
<400> 1106
000
<210> 1107
<400> 1107
000
<210> 1108
<400> 1108
000
<210> 1109
<400> 1109
000
<210> 1110
<400> 1110
000
<210> 1111
<400> 1111
000
<210> 1112
<400> 1112
000
<210> 1113
<400> 1113
000
<210> 1114
<400> 1114
000
<210> 1115
<400> 1115
000
<210> 1116
<400> 1116
000
<210> 1117
<400> 1117
000
<210> 1118
<400> 1118
000
<210> 1119
<400> 1119
000
<210> 1120
<400> 1120
000
<210> 1121
<400> 1121
000
<210> 1122
<400> 1122
000
<210> 1123
<400> 1123
000
<210> 1124
<400> 1124
000
<210> 1125
<400> 1125
000
<210> 1126
<400> 1126
000
<210> 1127
<400> 1127
000
<210> 1128
<400> 1128
000
<210> 1129
<400> 1129
000
<210> 1130
<400> 1130
000
<210> 1131
<400> 1131
000
<210> 1132
<400> 1132
000
<210> 1133
<400> 1133
000
<210> 1134
<400> 1134
000
<210> 1135
<400> 1135
000
<210> 1136
<400> 1136
000
<210> 1137
<400> 1137
000
<210> 1138
<400> 1138
000
<210> 1139
<400> 1139
000
<210> 1140
<400> 1140
000
<210> 1141
<400> 1141
000
<210> 1142
<400> 1142
000
<210> 1143
<400> 1143
000
<210> 1144
<400> 1144
000
<210> 1145
<400> 1145
000
<210> 1146
<400> 1146
000
<210> 1147
<400> 1147
000
<210> 1148
<400> 1148
000
<210> 1149
<400> 1149
000
<210> 1150
<400> 1150
000
<210> 1151
<211> 142
<212> PRT
<213> Bacillus anthracis
<400> 1151
Met Leu Lys Lys Leu Ser Val Phe Leu Ile Gly Thr Leu Leu Leu Phe
1 5 10 15
Gly Leu Ala Ala Cys Asp Ser Ile Lys Ser Val Ala Ser Asp Val Thr
20 25 30
Val Gly Lys Val Ile Glu Glu Phe Lys Ala Ala Gly Leu Glu Ala Glu
35 40 45
Gln Pro Ser Asp Leu Pro Glu Lys Glu Phe Gly Asn Thr Arg Lys Asp
50 55 60
Ala Lys Arg Ile Leu Val Pro Ala Leu Gly Glu Asp Ser Gly Gly Arg
65 70 75 80
Ile Phe Glu Phe Lys Asn Lys Gln Asp Leu Glu Gln Ala Lys Lys Tyr
85 90 95
Tyr Asp Asp Leu Gly Asn Gly Asn Gln Met Leu Phe Ser His Thr Tyr
100 105 110
Ala Lys Gly Asn Phe Leu Leu Gln Met Asn Gly Asp Met Glu Asp Ala
115 120 125
Gln Phe Asn Lys Tyr Lys Glu Val Met Asp Lys Ile Ile Lys
130 135 140
<210> 1152
<211> 69
<212> PRT
<213> Bacillus anthracis
<400> 1152
Met Tyr Ile Ile Ile Asn Phe Glu Pro Leu Ser Pro Val Met Asn Asp
1 5 10 15
Ile Ala Ile Lys Leu Ala Met Val Leu Phe Ile Pro Leu Phe Leu Ala
20 25 30
Leu Ile Val Lys Val Ile Leu Met Lys Phe Met Lys Glu Ser Ile Ala
35 40 45
Gly Arg Ile Ala Ser Leu Ser Leu Leu Phe Phe Met Tyr Tyr Val Phe
50 55 60
Ile Phe Val Thr Gly
65
<210> 1153
<211> 212
<212> PRT
<213> Bacillus anthracis
<400> 1153
Met Glu Val Leu Ile Phe Glu Leu Ile Leu Ile Ala Val Leu Ile Pro
1 5 10 15
Leu Asn Ser Val Val Lys Lys His Val Pro Lys Trp Lys Gly Lys Ala
20 25 30
Gly Glu Lys Leu Val Lys Arg Met Leu Ser Lys Leu Asp Pro Lys Ser
35 40 45
Tyr Tyr Val Leu His Asn Val Thr Val Tyr Thr Glu Tyr Gly Asp Thr
50 55 60
Thr Gln Ile Asp His Ile Val Ile Ala Glu Thr Gly Val Phe Val Val
65 70 75 80
Glu Thr Lys Asn Tyr Glu Gly Trp Ile Tyr Gly Ser Glu Lys Ala Ala
85 90 95
Arg Trp Thr Gln Gly Ile Phe Arg Lys Lys Ser Ser Phe Gln Asn Pro
100 105 110
Phe His Gln Asn Tyr Lys His Ile Lys Ala Ile Glu Trp Leu Ile Glu
115 120 125
Gln Gln Leu Pro Cys Ile Ser Met Ala Ala Phe His Pro Lys Cys Ser
130 135 140
Leu Lys Arg Val Asn Val His Ser Lys Glu Lys His Val Leu Tyr Tyr
145 150 155 160
Asn Asp Leu Gln Lys Cys Ile Glu Ser Tyr Thr Asp Val Gln Leu Thr
165 170 175
Asn Asp Glu Val Gln His Ile Tyr His Thr Ile Leu Arg Ala Asn Ile
180 185 190
Met Asp Lys Asp Ile Glu Lys Lys His Val Lys Tyr Leu His Asn Lys
195 200 205
Phe Ala Lys Gln
210
<210> 1154
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 1154
Arg Arg Arg Arg Arg Arg Arg Arg Arg
1 5
Claims (60)
- 핵의 부재하에서 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2)에 대한 백신의 합성 또는 분비를 위한 하나 이상의 세포내 세포소기관을 포함하는 핵이 없는 세포.
- 제1항에 있어서, 하나 이상의 세포내 세포소기관이 소포체 또는 골지체인 핵이 없는 세포.
- 제1항에 있어서, 핵이 없는 세포의 표면에 백신이 커플링된 것인 핵이 없는 세포.
- 제3항에 있어서, 백신이 핵이 없는 세포의 표면에 백신을 커플링시키는 막횡단 도메인을 포함하는 것인 핵이 없는 세포.
- 제1항에 있어서, 과립구-대식세포 콜로니 자극 인자를 포함하는 면역조정제를 추가로 포함하는 핵이 없는 세포.
- 제1항에 있어서,
(a) 류코시아린;
(b) L-셀렉틴, 림프구 기능 연관 항원 1;
(c) 초후기 항원-4;
(d) (a) 내지 (c) 중 어느 하나의 일부; 또는
(e) (a) 내지 (d)의 임의의 조합
을 포함하는 귀소 수용체를 추가로 포함하는 핵이 없는 세포. - 제1항에 있어서, 직경이 약 1 마이크로미터(㎛) 내지 100 ㎛인 핵이 없는 세포.
- 제7항에 있어서, 직경이 약 8 ㎛인 핵이 없는 세포.
- 제1항에 있어서,
(a) 현탁액 중에서 복수의 핵이 없는 세포의 분취량을 원심분리하여 세포 펠릿을 생성하는 단계;
(b) 무혈청 배지 중에 세포 펠릿을 재현탁시켜 무혈청 세포 현탁액을 생성하는 단계;
(c) 1부 트리판 블루 염료 및 1부의 무혈청 세포 현탁액을 혼합하하는 단계;
(d) (c)의 3-5분 이내에 복수의 핵이 없는 세포를 계수하는 단계로서, 복수의 핵이 없는 세포 중 적어도 일부는 트리판 블루 염료로 염색되지 않고, 이는 생존능을 시사하는 것인 단계
에 의해 생존능을 측정할 때, 핵이 없는 세포는 적어도 24시간 동안 냉동동면 후 생존가능한 것인 핵이 없는 세포. - 제1항에 있어서, 생존능이
(a) 현탁액 중에서 복수의 핵이 없는 세포의 분취량을 원심분리하여 세포 펠릿을 생성하는 단계;
(b) 무혈청 배지 중에 세포 펠릿을 재현탁시켜 무혈청 세포 현탁액을 생성하는 단계;
(c) 1부 트리판 블루 염료 및 1부의 무혈청 세포 현탁액을 혼합하는 단계;
(d) (c)의 3-5분 이내에 복수의 핵이 없는 세포를 계수하는 단계로서, 복수의 핵이 없는 세포 중 적어도 일부는 트리판 블루 염료로 염색되지 않고, 이는 생존능을 시사하는 것인 단계
에 의해 생존능을 측정할 때, 핵이 없는 세포는 적어도 24시간 동안 동결보존 후 생존가능한 것인 핵이 없는 세포. - 제1항에 있어서, 동결보존, 냉동동면, 또는 동결건조된 것인 핵이 없는 세포.
- 제1항에 있어서, 단리 또는 정제된 것인 핵이 없는 세포.
- (a) 제1항의 핵이 없는 세포 또는 복수의 제1항의 핵이 없는 세포; 및
(b) 약학적으로 허용되는 부형제, 희석제, 또는 담체
를 포함하는 약학적 제제. - (a) 세포로부터 핵을 제거하여, 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2)에 대한 백신의 합성 또는 분비를 위한 하나 이상의 세포내 세포소기관을 포함하는 제핵 세포를 생성하는 단계; 및
(b) 백신을 코딩하는 외인성 mRNA를 제핵 세포에 도입하는 단계로서, 제핵 세포는 핵의 부재하에서 백신을 발현하는 것인 단계
를 포함하는 백신 제조 방법. - 제14항에 있어서, 제핵 세포를 4℃ 이하에서 보관하여 제핵 세포의 생물학적 활성을 가역적으로 저속화 또는 정지시킨 후, 이어서, (b)에서의 도입 전에 해동시키는 것인 방법.
- 제14항에 있어서, 핵이 없는 세포를 동결건조시킨 후, 이어서, (b)에서의 도입 전에 재수화시키는 것인 방법.
- 제14항에 있어서, 제핵 세포를 -120℃ 이하에서 보관하여 제핵 세포의 생물학적 활성을 가역적으로 저속화 또는 정지시킨 후, 이어서, (b)에서의 도입 전에 해동시키는 것인 방법.
- 제14항에 있어서, (a)에서 세포로부터 핵을 제거하는 단계가 세포 분화 없이 수행되는 것인 방법.
- 제14항에 있어서, 하나 이상의 세포내 세포소기관이 소포체 또는 골지체인 방법.
- 제14항에 있어서, 핵이 없는 세포의 직경이 약 1 마이크로미터(㎛) 내지 100 ㎛인 방법.
- 제20항에 있어서, 직경이 약 8 ㎛인 방법.
- 제14항에 있어서, (a)에서 핵을 제거하기 전에 과립구-대식세포 콜로니 자극 인자를 포함하는 면역조정제를 코딩하는 핵산 서열을 포함하는 외인성 핵산 분자를 세포에 도입하는 단계를 추가로 포함하는 방법.
- 제14항에 있어서, (a)에서 핵을 제거하기 전에
a) 류코시아린;
b) L-셀렉틴, 림프구 기능 연관 항원 1;
c) 초후기 항원-4;
d) C-X-C 케모카인 수용체 타입 3;
e) CD44 항원;
f) C-C 케모카인 수용체 타입 7;
g) (a) 내지 (f) 중 어느 하나의 일부; 또는
h) (a) 내지 (g)의 임의의 조합
을 포함하는 귀소 수용체를 코딩하는 핵산 서열을 갖는 외인성 핵산 분자를 세포에 도입하는 단계를 추가로 포함하는 방법. - 제14항에 있어서, 과립구-대식세포 콜로니 자극 인자를 포함하는 면역조정제를 코딩하는 서열을 포함하는 외인성 mRNA 분자를 핵이 없는 세포에 도입하는 단계를 추가로 포함하는 방법.
- 제14항에 있어서,
(a) 류코시아린;
(b) L-셀렉틴, 림프구 기능 연관 항원 1;
(c) 초후기 항원-4;
(d) C-X-C 케모카인 수용체 타입 3;
(e) CD44 항원;
(f) C-C 케모카인 수용체 타입 7;
(g) (a) 내지 (f) 중 어느 하나의 일부; 또는
(h) (a) 내지 (g)의 임의의 조합
을 포함하는 귀소 수용체를 코딩하는 서열을 포함하는 외인성 mRNA 분자를 핵이 없는 세포에 도입하는 단계를 추가로 포함하는 방법. - 핵의 부재하에서 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2)에 대한 백신의 합성 또는 분비를 위한 하나 이상의 세포내 세포소기관을 포함하는 핵이 없는 세포를 피험체에게 투여하는 단계를 포함하는, 피험체에게 SARS-CoV-2에 대한 백신을 전달하는 방법.
- 제26항에 있어서, 하나 이상의 세포내 세포소기관이 소포체 또는 골지체인 것인 방법.
- 제26항에 있어서, 핵이 없는 세포가 과립구-대식세포 콜로니 자극 인자를 포함하는 면역조정제를 추가로 포함하는 것인 방법.
- 제26항에 있어서, 핵이 없는 세포가
(a) 류코시아린;
(b) L-셀렉틴, 림프구 기능 연관 항원 1;
(c) 초후기 항원-4;
(d) (a) 내지 (c) 중 어느 하나의 일부; 또는
(e) (a) 내지 (d)의 임의의 조합
을 포함하는 귀소 수용체를 추가로 포함하는 것인 방법. - 제26항에 있어서, 핵이 없는 세포의 직경이 약 1 마이크로미터(㎛) 내지 100 ㎛인 방법.
- 제30항에 있어서, 직경이 약 8 ㎛인 방법.
- 제26항에 있어서, 투여 단계가 전신 투여를 포함하는 것인 방법.
- 제26항에 있어서, 핵이 없는 세포가 약 103개의 세포/kg(체중) 내지 약 1012 개의 세포/kg(체중)의 투여량으로 투여되는 것인 방법.
- 제26항에 있어서, 핵이 없는 세포가 피험체에게 적어도 1시간, 2시간, 4시간, 6시간, 8시간, 12시간, 1일, 2일, 1주, 2주, 3주, 1개월, 2개월, 3개월, 4개월, 5개월, 6개월, 7개월, 8개월, 9개월, 10개월, 11개월, 1년, 2년, 3년, 또는 4년 이내에 2회 투여되는 것인 방법.
- 제26항에 있어서, 피험체가 인간인 방법.
- 제26항에 있어서, 애주번트를 투여하는 단계를 추가로 포함하는 방법.
- (a) 실질적으로 핵이 없는 복수의 세포로서, 이 중 적어도 하나의 핵이 없는 세포는 핵의 부재하에서 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2)에 대한 백신의 합성 또는 분비를 위한 하나 이상의 세포내 세포소기관을 포함하는 것인 실질적으로 핵이 없는 복수의 세포; 및
(b) 실질적으로 핵이 없는 복수의 세포를 피험체에게 투여하는 것에 관한 사용설명서
를 포함하는 키트. - 제37항에 있어서, 실질적으로 핵이 없는 복수의 세포가 동결보존, 냉동동면, 또는 동결건조된 것인 키트.
- 제38항에 있어서, 피험체에게 실질적으로 핵이 없는 복수의 세포를 투여하기 전 실질적으로 핵이 없는 복수의 세포의 생물학적 활성을 회복시키는 것에 관한 사용설명서를 추가로 포함하는 키트.
- 제37항에 있어서, 백신을 코딩하는 외인성 mRNA를 제핵 세포에 도입하는 것에 관한 사용설명서를 추가로 포함하는 키트.
- 핵의 부재하에서 병원체 항원에 대한 수용체 또는 그의 병원체 항원 결합 단편의 합성을 위한 하나 이상의 세포내 세포소기관을 포함하는 핵이 없는 세포로서, 수용체 또는 수용체의 발현 수준은 핵이 없는 세포에 대해 외인성인 것인 핵이 없는 세포.
- 제41항에 있어서, 하나 이상의 세포내 세포소기관이 소포체 또는 골지체인 핵이 없는 세포.
- 제41항에 있어서, 병원체 항원에 대한 수용체 또는 그의 병원체 항원 결합 단편이 핵이 없는 세포의 표면에 커플링된 것인 핵이 없는 세포.
- 제41항에 있어서, 병원체 항원에 대한 수용체 또는 그의 병원체 항원 결합 단편이 핵이 없는 세포의 세포막 내에 막횡단 도메인을 포함하는 것인 핵이 없는 세포.
- 제41항에 있어서, 핵이 없는 세포가 과립구-대식세포 콜로니 자극 인자를 포함하는 면역조정제를 코딩하는 서열 또는 그의 일부를 갖는 외인성 mRNA 분자를 추가로 포함하는 것인 핵이 없는 세포.
- 제41항에 있어서, 핵이 없는 세포의 직경이 약 1 마이크로미터(㎛) 내지 100 ㎛인 핵이 없는 세포.
- 제46항에 있어서, 직경이 약 8 ㎛인 핵이 없는 세포.
- 제41항에 있어서, 생존능이
(a) 현탁액 중에서 복수의 핵이 없는 세포의 분취량을 원심분리하여 세포 펠릿을 생성하는 단계;
(b) 무혈청 배지 중에 세포 펠릿을 재현탁시켜 무혈청 세포 현탁액을 생성하는 단계;
(c) 1부 트리판 블루 염료 및 1부의 무혈청 세포 현탁액을 혼합하는 단계;
(d) (c)의 3-5분 이내에 복수의 핵이 없는 세포를 계수하는 단계로서, 복수의 핵이 없는 세포 중 적어도 일부는 트리판 블루 염료로 염색되지 않고, 이는 생존능을 시사하는 것인 단계
에 의해 생존능을 측정할 때, 핵이 없는 세포는 적어도 24시간 동안 냉동동면 또는 동결보존 후 생존가능한 것인 핵이 없는 세포. - 제41항에 있어서, 동결보존, 냉동동면, 또는 동결건조된 것인 핵이 없는 세포.
- 제41항에 있어서, 단리 또는 정제된 것인 핵이 없는 세포.
- 제41항에 있어서, 병원체 항원과 숙주 세포에 의해 생산된 그의 천연 수용체 사이의 결합을 차단하는 중화 항체를 추가로 포함하는 핵이 없는 세포.
- 제51항에 있어서, 중화 항체가 핵이 없는 세포의 하나 이상의 세포내 세포소기관에 의해 합성되는 것인 핵이 없는 세포.
- 제41항에 있어서,
(a) 류코시아린;
(b) L-셀렉틴, 림프구 기능 연관 항원 1;
(c) 초후기 항원-4;
(d) C-X-C 케모카인 수용체 타입 3;
(e) CD44 항원;
(f) C-C 케모카인 수용체 타입 7;
(g) (a) 내지 (f) 중 어느 하나의 일부; 또는
(h) (a) 내지 (g)의 임의의 조합
을 포함하는 귀소 수용체를 추가로 포함하는 핵이 없는 세포. - (a) 제41항 내지 제53항 중 어느 한 항의 핵이 없는 세포 또는 제41항 내지 제53항 중 어느 한 항의 복수의 핵이 없는 세포; 및
(b) 약학적으로 허용되는 부형제, 희석제, 또는 담체
를 포함하는 약학적 제제. - 피험체에게 제1항 내지 제53항 중 어느 한 항의 핵이 없는 세포 또는 제54항의 약학적 제제를 투여하여 세포에 병원체 항원을 갖는 병원체를 포획하는 단계 및 병원체가 세포 내에서 증식하지 못하게 방해하는 단계를 포함하는, 피험체를 감염시키는 프로세스에서 병원체를 감소시키거나 또는 피험체에서 병원체에 의한 감염을 감소시키는 방법.
- 제55항에 있어서, 병원체가 투여 후 약 14일 이하인 기간 내에 피험체로부터 제거되는 것인 방법.
- 제55항에 있어서, 핵이 없는 세포가 중화 항체 또는 나노바디를 방출하여 병원체의 병원체 항원과 숙주 세포에 의해 생산된 그의 천연 수용체 사이의 결합을 차단하는 것인 방법.
- 제55항에 있어서, 투여 단계가 전신 투여를 포함하는 것인 방법.
- 제55항에 있어서, 핵이 없는 세포가 약 103 개의 세포/kg(체중) 내지 약 1012 개의 세포/kg(체중)의 투여량으로 투여되는 것인 방법.
- 제55항에 있어서, 핵이 없는 세포가 피험체에게 적어도 1시간, 2시간, 4시간, 6시간, 8시간, 12시간, 1일, 2일, 1주, 2주, 3주, 1개월, 2개월, 3개월, 4개월, 5개월, 6개월, 7개월, 8개월, 9개월, 10개월, 11개월, 1년, 2년, 3년, 또는 4년 이내에 2회 투여되는 것인 방법.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202062975044P | 2020-02-11 | 2020-02-11 | |
US62/975,044 | 2020-02-11 | ||
US202063014002P | 2020-04-22 | 2020-04-22 | |
US63/014,002 | 2020-04-22 | ||
PCT/US2021/017506 WO2021163222A1 (en) | 2020-02-11 | 2021-02-10 | Rapid vaccine platform |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220152226A true KR20220152226A (ko) | 2022-11-15 |
Family
ID=77291860
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227031285A KR20220152226A (ko) | 2020-02-11 | 2021-02-10 | 신속한 백신 플랫폼 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20230218733A1 (ko) |
EP (1) | EP4103722A4 (ko) |
JP (1) | JP2023515355A (ko) |
KR (1) | KR20220152226A (ko) |
CN (1) | CN116113424A (ko) |
AU (1) | AU2021220188A1 (ko) |
CA (1) | CA3170538A1 (ko) |
WO (1) | WO2021163222A1 (ko) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2018316166A1 (en) * | 2017-08-07 | 2020-02-06 | The Regents Of The University Of California | Platform for generating safe cell therapeutics |
US11241493B2 (en) | 2020-02-04 | 2022-02-08 | Curevac Ag | Coronavirus vaccine |
US20240277830A1 (en) | 2020-02-04 | 2024-08-22 | CureVac SE | Coronavirus vaccine |
JP2024502210A (ja) | 2020-12-22 | 2024-01-17 | キュアバック エスイー | SARS-CoV-2バリアントに対するRNAワクチン |
GB2606693A (en) * | 2021-04-08 | 2022-11-23 | Exosis Inc | Fusion protein |
EP4322995A1 (en) * | 2021-04-12 | 2024-02-21 | La Jolla Institute for Immunology | Coronavirus t cell epitopes and uses thereof |
WO2023056293A1 (en) * | 2021-09-28 | 2023-04-06 | The Johns Hopkins University | Polymeric nanoparticle genetic vaccines |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1995010291A1 (en) * | 1993-10-08 | 1995-04-20 | Cellpro Ii | Methods for collection and cryopreservation of human granulocytes |
CA2401117C (en) * | 2000-03-03 | 2010-06-29 | Juridical Foundation The Chemo-Sero-Therapeutic Research Institute | Cell usable in serum-free culture and suspension culture and process for producing virus for vaccine by using the cell |
CN101405026B (zh) * | 2006-02-02 | 2015-04-22 | 全球免疫股份有限公司 | 用于诱导免疫应答的基于酵母的疫苗 |
CA2798616A1 (en) * | 2010-05-07 | 2011-11-10 | Baylor Research Institute | Dendritic cell immunoreceptors (dcir)-mediated crosspriming of human cd8+ t cells |
AU2018316166A1 (en) * | 2017-08-07 | 2020-02-06 | The Regents Of The University Of California | Platform for generating safe cell therapeutics |
-
2021
- 2021-02-10 CN CN202180027948.4A patent/CN116113424A/zh active Pending
- 2021-02-10 EP EP21753822.2A patent/EP4103722A4/en active Pending
- 2021-02-10 KR KR1020227031285A patent/KR20220152226A/ko unknown
- 2021-02-10 WO PCT/US2021/017506 patent/WO2021163222A1/en unknown
- 2021-02-10 CA CA3170538A patent/CA3170538A1/en active Pending
- 2021-02-10 JP JP2022548519A patent/JP2023515355A/ja active Pending
- 2021-02-10 AU AU2021220188A patent/AU2021220188A1/en active Pending
-
2023
- 2023-03-27 US US18/190,838 patent/US20230218733A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CA3170538A1 (en) | 2021-08-19 |
US20230218733A1 (en) | 2023-07-13 |
AU2021220188A1 (en) | 2022-09-08 |
EP4103722A4 (en) | 2024-05-22 |
JP2023515355A (ja) | 2023-04-13 |
CN116113424A (zh) | 2023-05-12 |
WO2021163222A1 (en) | 2021-08-19 |
EP4103722A1 (en) | 2022-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20220152226A (ko) | 신속한 백신 플랫폼 | |
AU2017272721B2 (en) | Novel genetically engineered vaccinia viruses | |
CN112673092B (zh) | 工程化的免疫刺激性细菌菌株及其用途 | |
KR102557818B1 (ko) | 키메라 폭스바이러스 조성물 및 이의 용도 | |
KR20230057487A (ko) | 게놈 조정을 위한 방법 및 조성물 | |
AU2024216517A1 (en) | Enhanced systems for cell-mediated oncolytic viral therapy | |
RU2725726C2 (ru) | Бактериофаги, фаговые пептиды и способы их применения | |
KR20230053735A (ko) | 게놈의 조정을 위한 개선된 방법 및 조성물 | |
KR101234062B1 (ko) | 림프구 내 유전자 도입용 재조합 바이러스 벡터 | |
KR20230111189A (ko) | 재프로그램 가능한 iscb 뉴클레아제 및 이의 용도 | |
AU2021201338A1 (en) | Complete genome sequence of the methanogen methanobrevibacter ruminantium | |
KR20240019791A (ko) | 원형 rna 조성물 및 방법 | |
KR102531695B1 (ko) | 프로바이오틱으로서 사용하기 위한 락토바실러스, 및 프로바이오틱을 비롯한 제제에 대한 면역 반응을 평가하기 위해 사용되는 혈액 세포 집단 | |
KR20210132003A (ko) | 변형된 오르토폭스 바이러스 벡터 | |
KR20220165731A (ko) | Sars-cov-2 바이러스에 대한 재조합 폭스바이러스 기반 백신 | |
KR20230012583A (ko) | 합성 변형된 백시니아 앙카라 (sMVA) 기반 코로나바이러스 백신 | |
CN112543806A (zh) | 合成嵌合痘苗病毒 | |
CN112243377A (zh) | 用于治疗和预防细菌相关的癌症的噬菌体 | |
FR3055339A1 (fr) | Methode de detection et d'identification in vitro d'un ou plusieurs pathogenes cibles presents dans un echantillon biologique | |
KR20240052720A (ko) | 신규한 omni 117, 140, 150-158, 160-165, 167-177, 180-188, 191-198, 200, 201, 203, 205-209, 211-217, 219, 220, 222, 223, 226, 227, 229, 231-236, 238-245, 247, 250, 254, 256, 257, 260 및 262 crispr 뉴클레아제 | |
KR20230160823A (ko) | 치료 전달을 위한 조성물 및 방법 | |
KR20230038205A (ko) | 키메라 rsv 및 코로나바이러스 단백질, 면역원성 조성물, 및 사용 방법 | |
KR20240032184A (ko) | Sos 유전자 발현을 조절하기 위한 조성물 및 방법 | |
KR20240006496A (ko) | Omni 90-99, 101, 104-110, 114, 116, 118-123, 125, 126, 128, 129, 및 131-138 crispr 뉴클레아제 | |
KR20220082033A (ko) | 레트로바이러스의 계내 생성을 위한 생산자 바이러스 |