KR20220152226A - 신속한 백신 플랫폼 - Google Patents

신속한 백신 플랫폼 Download PDF

Info

Publication number
KR20220152226A
KR20220152226A KR1020227031285A KR20227031285A KR20220152226A KR 20220152226 A KR20220152226 A KR 20220152226A KR 1020227031285 A KR1020227031285 A KR 1020227031285A KR 20227031285 A KR20227031285 A KR 20227031285A KR 20220152226 A KR20220152226 A KR 20220152226A
Authority
KR
South Korea
Prior art keywords
cell
cells
amino acids
virus
antigen
Prior art date
Application number
KR1020227031285A
Other languages
English (en)
Inventor
레모 무미에
리차드 클렘크
Original Assignee
사이토누스 테라퓨틱스, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 사이토누스 테라퓨틱스, 인크. filed Critical 사이토누스 테라퓨틱스, 인크.
Publication of KR20220152226A publication Critical patent/KR20220152226A/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/0005Vertebrate antigens
    • A61K39/0011Cancer antigens
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/12Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/12Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
    • A61K35/28Bone marrow; Haematopoietic stem cells; Mesenchymal stem cells of any origin, e.g. adipose-derived stem cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/66Microorganisms or materials therefrom
    • A61K35/76Viruses; Subviral particles; Bacteriophages
    • A61K35/761Adenovirus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/66Microorganisms or materials therefrom
    • A61K35/76Viruses; Subviral particles; Bacteriophages
    • A61K35/763Herpes virus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/66Microorganisms or materials therefrom
    • A61K35/76Viruses; Subviral particles; Bacteriophages
    • A61K35/768Oncolytic viruses not provided for in groups A61K35/761 - A61K35/766
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • A61K39/215Coronaviridae, e.g. avian infectious bronchitis virus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/88Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation using microencapsulation, e.g. using amphiphile liposome vesicle
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0652Cells of skeletal and connective tissues; Mesenchyme
    • C12N5/0662Stem cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/515Animal cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/515Animal cells
    • A61K2039/5156Animal cells expressing foreign proteins
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/525Virus
    • A61K2039/5256Virus expressing foreign proteins
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/60Medicinal preparations containing antigens or antibodies characteristics by the carrier linked to the antigen
    • A61K2039/6006Cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/16011Herpesviridae
    • C12N2710/16611Simplexvirus, e.g. human herpesvirus 1, 2
    • C12N2710/16622New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/16011Herpesviridae
    • C12N2710/16611Simplexvirus, e.g. human herpesvirus 1, 2
    • C12N2710/16632Use of virus as therapeutic agent, other than vaccine, e.g. as cytolytic agent
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/16011Herpesviridae
    • C12N2710/16611Simplexvirus, e.g. human herpesvirus 1, 2
    • C12N2710/16671Demonstrated in vivo effect
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20034Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20051Methods of production or purification of viral material
    • C12N2770/20052Methods of production or purification of viral material relating to complementing cells and packaging systems for producing virus or viral particles
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20061Methods of inactivation or attenuation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20071Demonstrated in vivo effect
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Virology (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Medicinal Chemistry (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Microbiology (AREA)
  • Epidemiology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Immunology (AREA)
  • General Engineering & Computer Science (AREA)
  • Developmental Biology & Embryology (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Oncology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Rheumatology (AREA)
  • Communicable Diseases (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Hematology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Pulmonology (AREA)

Abstract

제핵 세포 기반 플랫폼을 사용하여 백신 조성물을 제조하고, 전달하는 방법을 제공한다. 제핵 세포 기반 플랫폼을 사용하여 피험체에서 병원성 감염을 제거하는 방법 또한 제공한다. 상기 제핵 세포 기반 플랫폼은 종래 생물학적 백신에 비해 백신 개발 타임라인을 단축하고, 백신 효능을 개선시킨다.

Description

신속한 백신 플랫폼
상호 참조
본 출원은 2020년 2월 11일 출원된 미국 가출원 제62/975,044호, 및 2020년 4월 22일 출원된 미국 가출원 제63/014,002호의 우선권을 주장하며, 상기 가출원은 각각 그 전문이 본원에서 참조로 포함된다.
서열 목록
본 출원은 ASCII 포맷으로 전자 제출된 서열 목록을 포함하고, 이는 그 전문이 본원에서 참조로 포함된다. 2021년 2월 9일 작성된 상기 ASCII 사본의 명칭은 53712-706_601_SL.txt이고, 그 크기는 1,695,927 바이트이다.
중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2: severe acute respiratory syndrome coronavirus) 대유행 및 그에 수반되는 이환율 및 사망률은 방어적이고, 지속적인 면역 반응을 유도하는 안전하고 효과적인 백신의 필요성을 강조한다. 대유행은 또한 코로나바이러스 질환 2019(COVID-19: Coronavirus disease 2019)의 광범위한 전파와 같은 긴급 의료 요구를 해결하기 위한 전 세계의 종래 백신 개발 파이프라인의 심각한 단점을 드러냈다. SARS-CoV-2와 같이 빠르게 진화하는 병원체에 의해 유발되는 질환 또는 병태를 치료하기 위한 안전하고, 효과적인 백신 및 치료제의 출시시간을 개선할 수 있는 새로운 백신 개발 플랫폼에 대한 긴급하고, 충족되지 않은 요구가 존재한다.
요약
일부 실시양태에서, 본원에서는 핵의 부재하에서 병원체에 대한 백신의 합성 또는 분비를 위한 하나 이상의 세포내 세포소기관을 포함하는 핵이 없는 세포를 기술한다. 일부 실시양태에서, 병원체는 바이러스이다. 일부 실시양태에서, 바이러스는 코로나 바이러스이다. 일부 실시양태에서, 코로나 바이러스는 중증 급성 호흡기 증후군(SARS: severe acute respiratory syndrome) 코로나 바이러스이다. 일부 실시양태에서, SARS 코로나 바이러스는 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2)이다. 일부 실시양태에서, 바이러스는 종양용해성 바이러스이다. 일부 실시양태에서, 병원체는 박테리아이다. 일부 실시양태에서, 박테리아는 바실러스 안트라시스(Bacillus anthracis), 예르시니아 페스티스(Yersinia pestis), 프란시셀라 툴라렌시스(Francisella tularensis), 브루셀라(Brucella), 살모넬라(Salmonella), 에스케리키아 콜라이(Escherichia coli) O157:H7, 시겔라(Shigella), 부르크홀데리아 말레이(Burkholderia mallei), 부르크홀데리아 슈도말레이(Burkholderia pseudomallei), 클라미디아 시타시(Chlamydia psittaci), 콕시엘라 번에티이, 리케차 프로와제키(Rickettsia prowazekii), 비브리오 콜레라에(Vibrio cholerae), 또는 크립토스포리디움 파르붐(Cryptosporidium parvum) 또는 그의 임의의 조합이다. 일부 실시양태에서, 병원체는 독소이다. 일부 실시양태에서, 독소는 클로스트리디움 보툴리눔(Clostridium botulinum) 독소, 클로스트리디움 페르프린겐스(Clostridium perfringens)의 엡실론 독소, 포도상구균 장독소 B, 또는 리시누스 코무니스(Ricinus communis)로부터의 리신 독소, 또는 그의 임의의 조합이다. 일부 실시양태에서, 하나 이상의 세포내 세포소기관은 소포체 또는 골지체이다. 일부 실시양태에서, 백신은 핵이 없는 세포의 표면에 커플링된다. 일부 실시양태에서, 백신은 백신을 핵이 없는 세포의 표면에 커플링시키는 막횡단 도메인을 포함한다. 일부 실시양태에서, 핵이 없는 세포는 과립구-대식세포 콜로니 자극 인자를 포함하는 면역조정제를 추가로 포함한다. 면역조정제는 (a) 류코시아린; (b) L-셀렉틴, 림프구 기능 연관 항원 1; (c) 초후기 항원-4; (a) 내지 (c) 중 어느 하나의 일부; (a) 내지 (d)의 임의의 조합을 포함하는 귀소 수용체를 추가로 포함한다. 일부 실시양태에서, 핵이 없는 세포의 직경은 약 1 마이크로미터 (㎛) 내지 100 ㎛이다. 일부 실시양태에서, 직경은 약 8 ㎛이다. 일부 실시양태에서, 핵이 없는 세포는 적어도 24시간 동안 냉동동면 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 48시간 냉동동면 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 24시간 동안 동결보존 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 24시간 동안 동결건조 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 동결보존, 냉동동면, 또는 동결건조된 것이다. 일부 실시양태에서, 핵이 없는 세포는 단리 또는 정제된 것이다. 일부 실시양태에서, 생존능은 본원에 기술된 바와 같이 트리판 블루 염료 배제를 사용하여 측정된다. 일부 실시양태에서, 트리판 블루 염료 배제는 (a) 현탁액 중에서 분취량의 복수의 핵이 없는 세포를 원심분리하여 세포 펠릿을 생성하고; (b) 무혈청 배지 중에 세포 펠릿을 재현탁시켜 무혈청 세포 현탁액을 생성하고; (c) 1부 트리판 블루 염료 및 1부의 무혈청 세포 현탁액을 혼합하고; (d) (c)의 3-5분 이내에 복수의 핵이 없는 세포를 계수함으로써 수행되며, 여기서, 복수의 핵이 없는 세포 중 적어도 일부는 트리판 블루 염료로 염색되지 않고, 이는 생존능을 시사하는 것이다. 일부 실시양태에서, 생존능은 본원에 기술된 바와 같이 아넥신-5 세포 표면 염색을 사용하여 측정된다. 일부 실시양태에서, 핵이 없는 세포는 적혈구 또는 적혈구 전구체가 아니다.
일부 실시양태에서, 본원에서는 본원에 기술된 핵이 없는 세포 또는 복수의 핵이 없는 세포; 및 약학적으로 허용되는: 부형제, 희석제, 또는 담체를 포함하는 약학적 제제를 기술한다.
일부 실시양태에서, 본원에서는 (a) 세포로부터 핵을 제거하여 병원체에 대한 백신의 합성 또는 분비를 위한 하나 이상의 세포내 세포소기관을 포함하는 제핵 세포를 생성하는 단계; 및 (b) 백신을 코딩하는 외인성 mRNA를 제핵 세포에 도입하는 단계로서, 여기서, 제핵 세포는 핵의 부재하에서서 백신을 발현하는 것인 단계를 포함하는, 백신을 제조하는 방법을 기술한다. 일부 실시양태에서, 병원체는 바이러스이다. 일부 실시양태에서, 바이러스는 코로나 바이러스이다. 일부 실시양태에서, 코로나 바이러스는 중증 급성 호흡기 증후군(SARS) 코로나 바이러스이다. 일부 실시양태에서, SARS 코로나 바이러스는 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2)이다. 일부 실시양태에서, 바이러스는 종양용해성 바이러스이다. 일부 실시양태에서, 병원체는 박테리아이다. 일부 실시양태에서, 박테리아는 바실러스 안트라시스, 예르시니아 페스티스, 프란시셀라 툴라렌시스, 브루셀라, 살모넬라, 에스케리키아 콜라이 O157:H7, 시겔라, 부르크홀데리아 말레이, 부르크홀데리아 슈도말레이, 클라미디아 시타시, 콕시엘라 번에티이, 리케차 프로와제키, 비브리오 콜레라에, 또는 크립토스포리디움 파르붐 또는 그의 임의의 조합이다. 일부 실시양태에서, 병원체는 독소이다. 일부 실시양태에서, 독소는 클로스트리디움 보툴리눔 독소, 클로스트리디움 페르프린겐스의 엡실론 독소, 포도상구균 장독소 B, 또는 리시누스 코무니스로부터의 리신 독소, 또는 그의 임의의 조합이다. 일부 실시양태에서, 제핵 세포를 4℃ 이하에서 보관하여 제핵 세포의 생물학적 활성을 가역적으로 저속화 또는 정지시킨 후, 이어서, (b)에서의 도입 전에 해동시켰다. 일부 실시양태에서, 핵이 없는 세포를 동결건조시킨 후, 이어서, (b)에서의 도입 전에 재수화시켰다. 일부 실시양태에서, 제핵 세포를 -120℃ 이하에서 보관하여 제핵 세포의 생물학적 활성을 가역적으로 저속화 또는 정지시킨 후, 이어서, (b)에서의 도입 전에 해동시켰다. 일부 실시양태에서, (a)에서 세포로부터 핵을 제거하는 단계는 세포 분화 없이 수행된다. 일부 실시양태에서, 하나 이상의 세포내 세포소기관은 소포체 또는 골지체이다. 일부 실시양태에서, 핵이 없는 세포의 직경은 약 1 마이크로미터(㎛) 내지 100 ㎛이다. 일부 실시양태에서, 직경은 약 8 ㎛이다. 일부 실시양태에서, 본 방법은 (a)에서 핵을 제거하기 전에 과립구-대식세포 콜로니 자극 인자를 포함하는 면역조정제를 코딩하는 핵산 서열을 포함하는 외인성 핵산 분자를 세포에 도입하는 단계를 추가로 포함한다. 일부 실시양태에서, 본 방법은 (a)에서 핵을 제거하기 전에 류코시아린; L-셀렉틴, 림프구 기능 연관 항원 1; 초후기 항원-4; C-X-C 케모카인 수용체 타입 3; CD44 항원; C-C 케모카인 수용체 타입 7; 그의 귀소 수용체 중 어느 하나의 일부; 또는 그의 귀소 수용체 중 어느 하나의 임의의 조합을 포함하는 귀소 수용체를 코딩하는 핵산 서열을 포함하는 외인성 핵산 분자를 세포에 도입하는 단계를 추가로 포함한다. 일부 실시양태에서, 본 방법은 과립구-대식세포 콜로니 자극 인자를 포함하는 면역조정제를 코딩하는 서열을 포함하는 외인성 mRNA 분자를 핵이 없는 세포에 도입하는 단계를 추가로 포함한다. 일부 실시양태에서, 본 방법은 류코시아린; L-셀렉틴, 림프구 기능 연관 항원 1; 초후기 항원-4; C-X-C 케모카인 수용체 타입 3; CD44 항원; C-C 케모카인 수용체 타입 7; 그의 귀소 수용체 중 어느 하나의 일부; 또는 그의 귀소 수용체 중 어느 하나의 임의의 조합을 포함하는 귀소 수용체를 코딩하는 서열을 포함하는 외인성 mRNA 분자를 핵이 없는 세포에 도입하는 단계를 추가로 포함한다. 일부 실시양태에서, 핵이 없는 세포는 적혈구 또는 적혈구 전구체가 아니다.
일부 실시양태에서, 본원에서는 피험체에게 핵의 부재하에서 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2)에 대한 백신의 합성 또는 분비를 위한 하나 이상의 세포내 세포소기관을 포함하는 핵이 없는 세포를 투여하는 단계를 포함하는, 피험체에게 SARS-CoV-2에 대한 백신을 전달하는 방법을 기술한다. 일부 실시양태에서, 하나 이상의 세포내 세포소기관은 소포체 또는 골지체이다. 일부 실시양태에서, 핵이 없는 세포는 과립구-대식세포 콜로니 자극 인자를 포함하는 면역조정제를 추가로 포함한다. 일부 실시양태에서, 핵이 없는 세포는 류코시아린; L-셀렉틴, 림프구 기능 연관 항원 1; 초후기 항원-4; C-X-C 케모카인 수용체 타입 3; CD44 항원; C-C 케모카인 수용체 타입 7; 그의 귀소 수용체 중 어느 하나의 일부; 또는 그의 귀소 수용체 중 어느 하나의 임의의 조합을 포함하는 귀소 수용체를 추가로 포함한다. 일부 실시양태에서, 핵이 없는 세포의 직경은 약 1 마이크로미터(㎛) 내지 100 ㎛이다. 일부 실시양태에서, 직경은 약 8 ㎛이다. 일부 실시양태에서, 투여 단계는 전신 투여를 포함한다. 일부 실시양태에서, 핵이 없는 세포는 약 103개의 세포/kg(체중) 내지 약 1012개의 세포/kg(체중)의 투여량으로 투여된다. 일부 실시양태에서, 핵이 없는 세포는 피험체에게 적어도 1시간, 2시간, 4시간, 6시간, 8시간, 12시간, 1일, 2일, 1주, 2주, 3주, 1개월, 2개월, 3개월, 4개월, 5개월, 6개월, 7개월, 8개월, 9개월, 10개월, 11개월, 1년, 2년, 3년, 또는 4년 이내에 2회 투여된다. 일부 실시양태에서, 피험체는 인간이다. 일부 실시양태에서, 본 방법은 애주번트를 투여하는 단계를 추가로 포함한다. 일부 실시양태에서, 핵이 없는 세포는 적혈구 또는 적혈구 전구체가 아니다.
일부 실시양태에서, 본원에서는 실질적으로 핵이 없는 복수의 세포로서, 여기서, 복수의 것 중 적어도 하나의 핵이 없는 세포는 핵의 부재하에서 병원체에 대한 백신의 합성 또는 분비를 위한 하나 이상의 세포내 세포소기관을 포함하는 것인 복수의 세포; 및 실질적으로 핵이 없는 복수의 세포를 피험체에게 투여하는 것에 관한 사용설명서를 포함하는 키트를 기술한다. 일부 실시양태에서, 실질적으로 핵이 없는 복수의 세포는 동결보존, 냉동동면, 또는 동결건조된 것이다. 일부 실시양태에서, 키트는 피험체에게 실질적으로 핵이 없는 복수의 세포를 투여하기 전 실질적으로 핵이 없는 복수의 세포의 생물학적 활성을 회복시키는 것에 관한 사용설명서를 추가로 포함한다. 일부 실시양태에서, 키트는 백신을 코딩하는 외인성 mRNA를 제핵 세포에 도입하는 것에 관한 사용설명서를 추가로 포함한다.
일부 실시양태에서, 본원에서는 핵의 부재하에서 병원체 항원에 대한 수용체 또는 그의 병원체 항원 결합 단편의 합성을 위한 하나 이상의 세포내 세포소기관을 포함하는 핵이 없는 세포로서, 여기서, 수용체 또는 수용체의 발현 수준은 핵이 없는 세포에 대해 외인성인 것인 핵이 없는 세포를 기술한다. 일부 실시양태에서, 하나 이상의 세포내 세포소기관은 소포체 또는 골지체이다. 일부 실시양태에서, 병원체 항원에 대한 수용체 또는 그의 병원체 항원 결합 단편은 핵이 없는 세포의 표면에 커플링된다. 일부 실시양태에서, 병원체 항원에 대한 수용체 또는 그의 병원체 항원 결합 단편은 핵이 없는 세포의 세포막 내에 막횡단 도메인을 포함한다. 일부 실시양태에서, 핵이 없는 세포는 과립구-대식세포 콜로니 자극 인자를 포함하는 면역조정제를 코딩하는 서열, 또는 그의 일부를 갖는 외인성 mRNA 분자를 추가로 포함한다. 일부 실시양태에서, 핵이 없는 세포의 직경은 약 1 마이크로미터(㎛) 내지 100 ㎛이다. 일부 실시양태에서, 직경은 약 8 ㎛이다. 일부 실시양태에서, 핵이 없는 세포는 적어도 24시간 동안 냉동동면 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 48시간 냉동동면 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 24시간 동안 동결보존 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 24시간 동안 동결건조 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 동결보존, 냉동동면, 또는 동결건조된 것이다. 일부 실시양태에서, 핵이 없는 세포는 단리 또는 정제된 것이다. 일부 실시양태에서, 생존능은 본원에 기술된 바와 같이 트리판 블루 염료 배제를 사용하여 측정된다. 일부 실시양태에서, 트리판 블루 염료 배제는 (a) 현탁액 중에서 분취량의 복수의 핵이 없는 세포를 원심분리하여 세포 펠릿을 생성하고; (b) 무혈청 배지 중에 세포 펠릿을 재현탁시켜 무혈청 세포 현탁액을 생성하고; (c) 1부 트리판 블루 염료 및 1부의 무혈청 세포 현탁액을 혼합하고; (d) (c)의 3-5분 이내에 복수의 핵이 없는 세포를 계수함으로써 수행되며, 여기서, 복수의 핵이 없는 세포 중 적어도 일부는 트리판 블루 염료로 염색되지 않고, 이는 생존능을 시사하는 것이다. 일부 실시양태에서, 생존능은 본원에 기술된 바와 같이 아넥신-5 세포 표면 염색을 사용하여 측정된다. 일부 실시양태에서, 핵이 없는 세포는 단리 또는 정제된 것이다. 일부 실시양태에서, 세포는 병원체 항원과 숙주 세포에 의해 생산된 그의 천연 수용체 사이의 결합을 차단하는 중화 항체를 추가로 포함한다. 일부 실시양태에서, 중화 항체는 핵이 없는 세포의 하나 이상의 세포내 세포소기관에 의해 합성된다. 일부 실시양태에서, 세포는 류코시아린; L-셀렉틴, 림프구 기능 연관 항원 1; 초후기 항원-4; C-X-C 케모카인 수용체 타입 3; CD44 항원; C-C 케모카인 수용체 타입 7; 그의 귀소 수용체 중 어느 하나의 일부; 또는 그의 귀소 수용체 중 어느 하나의 임의의 조합을 포함하는 귀소 수용체를 추가로 포함한다. 일부 실시양태에서, 병원체는 바이러스이다. 일부 실시양태에서, 바이러스는 코로나 바이러스이다. 일부 실시양태에서, 코로나 바이러스는 중증 급성 호흡기 증후군(SARS) 코로나 바이러스이다. 일부 실시양태에서, SARS 코로나 바이러스는 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2)이다. 일부 실시양태에서, 바이러스는 종양용해성 바이러스이다. 일부 실시양태에서, 병원체는 박테리아이다. 일부 실시양태에서, 박테리아는 바실러스 안트라시스, 예르시니아 페스티스, 프란시셀라 툴라렌시스, 브루셀라, 살모넬라, 에스케리키아 콜라이 O157:H7, 시겔라, 부르크홀데리아 말레이, 부르크홀데리아 슈도말레이, 클라미디아 시타시, 콕시엘라 번에티이, 리케차 프로와제키, 비브리오 콜레라에, 또는 크립토스포리디움 파르붐 또는 그의 임의의 조합이다. 일부 실시양태에서, 병원체는 독소이다. 일부 실시양태에서, 독소는 클로스트리디움 보툴리눔 독소, 클로스트리디움 페르프린겐스의 엡실론 독소, 포도상구균 장독소 B, 또는 리시누스 코무니스로부터의 리신 독소, 또는 그의 임의의 조합이다. 일부 실시양태에서, 백신은 본원에 기술된 백신이다. 일부 실시양태에서, 핵이 없는 세포는 적혈구 또는 적혈구 전구체가 아니다.
일부 실시양태에서, 본원에서는 피험체에게 본원에 기술된 핵이 없는 세포, 또는 본원에 기술된 약학적 제제를 투여하여 세포에 병원체 항원을 갖는 병원체를 포획하고, 병원체가 세포 내에서 증식하지 못하게 방해하는 단계를 포함하는, 피험체에서 병원체에 의한 감염을 감소시키는 방법, 또는 피험체를 감염시키는 프로세스에서 병원체를 감소시키는 방법을 기술한다. 일부 실시양태에서, 병원체는 투여 후 약 14일 이하인 기간 내에 피험체로부터 제거된다. 일부 실시양태에서, 핵이 없는 세포는 중화 항체 또는 나노바디를 방출하여 병원체의 병원체 항원과 숙주 세포에 의해 생산된 그의 천연 수용체 사이의 결합을 차단한다. 일부 실시양태에서, 투여 단계는 전신 투여를 포함한다. 일부 실시양태에서, 핵이 없는 세포는 약 103개의 세포/kg(체중) 내지 약 1012개의 세포/kg(체중)의 투여량으로 투여된다. 일부 실시양태에서, 핵이 없는 세포는 피험체에게 적어도 1시간, 2시간, 4시간, 6시간, 8시간, 12시간, 1일, 2일, 1주, 2주, 3주, 1개월, 2개월, 3개월, 4개월, 5개월, 6개월, 7개월, 8개월, 9개월, 10개월, 11개월, 1년, 2년, 3년, 또는 4년 이내에 2회 투여된다. 일부 실시양태에서, 병원체는 바이러스이다. 일부 실시양태에서, 바이러스는 코로나 바이러스이다. 일부 실시양태에서, 코로나 바이러스는 중증 급성 호흡기 증후군(SARS) 코로나 바이러스이다. 일부 실시양태에서, SARS 코로나 바이러스는 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2)이다. 일부 실시양태에서, 바이러스는 종양용해성 바이러스이다. 일부 실시양태에서, 병원체는 박테리아이다. 일부 실시양태에서, 박테리아는 바실러스 안트라시스, 예르시니아 페스티스, 프란시셀라 툴라렌시스, 브루셀라, 살모넬라, 에스케리키아 콜라이 O157:H7, 시겔라, 부르크홀데리아 말레이, 부르크홀데리아 슈도말레이, 클라미디아 시타시, 콕시엘라 번에티이, 리케차 프로와제키, 비브리오 콜레라에, 또는 크립토스포리디움 파르붐 또는 그의 임의의 조합이다. 일부 실시양태에서, 병원체는 독소이다. 일부 실시양태에서, 독소는 클로스트리디움 보툴리눔 독소, 클로스트리디움 페르프린겐스의 엡실론 독소, 포도상구균 장독소 B, 또는 리시누스 코무니스로부터의 리신 독소, 또는 그의 임의의 조합이다. 일부 실시양태에서, 백신은 본원에 기술된 백신이다. 일부 실시양태에서, 핵이 없는 세포는 과립구-대식세포 콜로니 자극 인자를 포함하는 면역조정제를 추가로 포함한다. 일부 실시양태에서, 핵이 없는 세포는 림프 조직에서 하나 이상의 세포 상에서 발현된 리간드에 특이적인 귀소 수용체를 추가로 포함한다. 일부 실시양태에서, 귀소 수용체는 C-X-C 케모카인 수용체 타입 3, 류코시아린, CD44 항원, C-C 케모카인 수용체 타입 7, L-셀렉틴, 림프구 기능 연관 항원 1, 또는 초후기 항원-4, 또는 그의 조합을 포함한다. 일부 실시양태에서, 핵이 없는 세포의 직경은 약 1 마이크로미터(㎛) 내지 100 ㎛이다. 일부 실시양태에서, 핵이 없는 세포의 직경은 약 8 ㎛이다. 일부 실시양태에서, 핵이 없는 세포는 적어도 24시간 동안 냉동동면 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 48시간 냉동동면 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 24시간 동안 동결보존 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 24시간 동안 동결건조 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 동결보존, 냉동동면, 또는 동결건조된 것이다. 일부 실시양태에서, 핵이 없는 세포는 단리 또는 정제된 것이다. 일부 실시양태에서, 생존능은 본원에 기술된 바와 같이 트리판 블루 염료 배제를 사용하여 측정된다. 일부 실시양태에서, 트리판 블루 염료 배제는 (a) 현탁액 중에서 분취량의 복수의 핵이 없는 세포를 원심분리하여 세포 펠릿을 생성하고; (b) 무혈청 배지 중에 세포 펠릿을 재현탁시켜 무혈청 세포 현탁액을 생성하고; (c) 1부 트리판 블루 염료 및 1부의 무혈청 세포 현탁액을 혼합하고; (d) (c)의 3-5분 이내에 복수의 핵이 없는 세포를 계수함으로써 수행되며, 여기서, 복수의 핵이 없는 세포 중 적어도 일부는 트리판 블루 염료로 염색되지 않고, 이는 생존능을 시사하는 것이다. 일부 실시양태에서, 생존능은 본원에 기술된 바와 같이 아넥신-5 세포 표면 염색을 사용하여 측정된다. 일부 실시양태에서, 핵이 없는 세포는 적혈구 또는 적혈구 전구체가 아니다.
본원에 개시된 측면은 핵의 부재하에서, 서열 번호 1, 301-347, 또는 501-512 중 하나 이상의 것과 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87% 88%, 89% 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 서열에 의해 코딩되는, 바이러스에 대한 백신의 합성 또는 분비를 위한 하나 이상의 세포내 세포소기관을 포함하는 핵이 없는 세포를 기술한다. 일부 실시양태에서, 핵이 없는 세포는 적혈구 또는 적혈구 전구체가 아니다. 일부 실시양태에서, 핵이 없는 세포는 하나 이상의 세포내 세포소기관이 내인성인 유핵 모세포로부터 유래된 것이다. 일부 실시양태에서, 바이러스는 코로나 바이러스이다. 일부 실시양태에서, 백신 조성물은 DNA, RNA, 항원성 펩티드, 약독화된 생 바이러스, 또는 불활성화된 바이러스, 또는 그의 조합이다. 일부 실시양태에서, 항원성 펩티드는 서열 번호 2, 3-7, 151-154, 251-260, 401-447, 551-562, 651-660, 751-761, 851-859, 951-984, 1051-1057, 또는 1151-1153 중 하나 이상의 것과 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87% 88%, 89% 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, 항원성 펩티드는 서열 번호 2, 8, 401-447 또는 551-562 중 하나 이상의 것과 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87% 88%, 89% 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, 항원성 펩티드는 서열 번호 101-104, 201-209, 301-347, 501-512, 601-610, 701-711, 801-809, 901-934, 1001-1007, 또는 1101-1103 중 하나 이상의 것과 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87% 88%, 89% 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 핵산 서열로부터 코딩된다. 일부 실시양태에서, 항원성 펩티드는 알부민을 코딩하는 아미노산 서열, 또는 그의 일부를 추가로 포함한다. 일부 실시양태에서, 백신은 세포의 표면에 커플링된다. 일부 실시양태에서, 백신은 분비성이다. 일부 실시양태에서, 핵이 없는 세포는 과립구-대식세포 콜로니 자극 인자를 포함하는 면역조정제를 추가로 포함한다. 일부 실시양태에서, 핵이 없는 세포는 림프 조직에서 하나 이상의 세포 상에서 발현된 리간드에 특이적인 귀소 수용체를 추가로 포함한다. 일부 실시양태에서, 귀소 수용체는 C-X-C 케모카인 수용체 타입 3, 류코시아린, CD44 항원, C-C 케모카인 수용체 타입 7, L-셀렉틴, 림프구 기능 연관 항원 1, 또는 초후기 항원-4, 또는 그의 조합을 포함한다. 일부 실시양태에서, 핵이 없는 세포의 직경은 약 1 마이크로미터(㎛) 내지 100 ㎛이다. 일부 실시양태에서, 핵이 없는 세포의 직경은 약 8 ㎛이다. 일부 실시양태에서, 핵이 없는 세포는 적어도 24시간 동안 냉동동면 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 24시간 동안 동결보존 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 48시간 냉동동면 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 48시간 동안의 동결보존 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 24시간 동안 동결건조 후 생존가능하다. 일부 실시양태에서, 생존능은 본원에 기술된 바와 같이 트리판 블루 염료 배제를 사용하여 측정된다. 일부 실시양태에서, 트리판 블루 염료 배제는 (a) 현탁액 중에서 분취량의 복수의 핵이 없는 세포를 원심분리하여 세포 펠릿을 생성하고; (b) 무혈청 배지 중에 세포 펠릿을 재현탁시켜 무혈청 세포 현탁액을 생성하고; (c) 1부 트리판 블루 염료 및 1부의 무혈청 세포 현탁액을 혼합하고; (d) (c)의 3-5분 이내에 복수의 핵이 없는 세포를 계수함으로써 수행되며, 여기서, 복수의 핵이 없는 세포 중 적어도 일부는 트리판 블루 염료로 염색되지 않고, 이는 생존능을 시사하는 것이다. 일부 실시양태에서, 생존능은 본원에 기술된 바와 같이 아넥신-5 세포 표면 염색을 사용하여 측정된다. 일부 실시양태에서, 핵이 없는 세포는 동결보존, 냉동동면, 또는 동결건조된 것이다. 일부 실시양태에서, 핵의 부재하에서 백신의 합성 또는 분비는 약 3일 이상의 기간 동안 핵이 없는 세포에 의해 수행된다. 일부 실시양태에서, 핵이 없는 세포는 약학적으로 허용되는 담체 중에 존재한다. 일부 실시양태에서, 핵이 없는 세포는 약 103개의 세포/kg(체중) 내지 약 1012개의 세포/kg(체중)의 투여량으로 존재한다. 일부 실시양태에서, 핵이 없는 세포는 적어도 약 103, 104, 105, 106, 107, 108, 109, 1010, 1011, 1012개의 세포/kg(체중) 이상의 투여량으로 존재한다. 일부 실시양태에서, 핵이 없는 세포는 최대 약 103, 104, 105, 106, 107, 108, 109, 1010, 1011, 1012개의 세포/kg(체중)의 투여량으로 존재한다. 일부 실시양태에서, 핵이 없는 세포는 단리 및 정제된 것이다.
본원에 개시된 측면은 핵의 부재하에서 박테리아 또는 독소에 대한 백신의 합성 또는 분비를 위한 하나 이상의 세포내 세포소기관을 포함하는 핵이 없는 세포를 기술한다. 일부 실시양태에서, 핵이 없는 세포는 적혈구 또는 적혈구 전구체가 아니다. 일부 실시양태에서, 핵이 없는 세포는 하나 이상의 세포내 세포소기관이 내인성인 유핵 모세포로부터 유래된 것이다. 일부 실시양태에서, 독소는 클로스트리디움 보툴리눔 독소, 클로스트리디움 페르프린겐스의 엡실론 독소, 포도상구균 장독소 B, 또는 리시누스 코무니스로부터의 리신 독소, 또는 그의 임의의 조합이다. 일부 실시양태에서, 박테리아는 바실러스 안트라시스, 예르시니아 페스티스, 프란시셀라 툴라렌시스, 브루셀라, 살모넬라, 에스케리키아 콜라이 O157:H7, 시겔라, 부르크홀데리아 말레이, 부르크홀데리아 슈도말레이, 클라미디아 시타시, 콕시엘라 번에티이, 리케차 프로와제키, 비브리오 콜레라에, 또는 크립토스포리디움 파르붐 또는 그의 임의의 조합이다. 일부 실시양태에서, 백신은 세포의 표면에 커플링된다. 일부 실시양태에서, 백신은 분비성이다. 일부 실시양태에서, 핵이 없는 세포는 과립구-대식세포 콜로니 자극 인자를 포함하는 면역조정제를 추가로 포함한다. 일부 실시양태에서, 핵이 없는 세포는 림프 조직에서 하나 이상의 세포 상에서 발현된 리간드에 특이적인 귀소 수용체를 추가로 포함한다. 일부 실시양태에서, 귀소 수용체는 C-X-C 케모카인 수용체 타입 3, 류코시아린, CD44 항원, C-C 케모카인 수용체 타입 7, L-셀렉틴, 림프구 기능 연관 항원 1, 또는 초후기 항원-4, 또는 그의 조합을 포함한다. 일부 실시양태에서, 핵이 없는 세포의 직경은 약 1 마이크로미터(㎛) 내지 100 ㎛이다. 일부 실시양태에서, 핵이 없는 세포의 직경은 약 8 ㎛이다. 일부 실시양태에서, 핵이 없는 세포는 적어도 24시간 동안 냉동동면 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 24시간 동안 동결보존 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 48시간 냉동동면 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 48시간 동안의 동결보존 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 24시간 동안 동결건조 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 동결보존, 냉동동면, 또는 동결건조된 것이다. 일부 실시양태에서, 핵이 없는 세포는 단리 또는 정제된 것이다. 일부 실시양태에서, 생존능은 본원에 기술된 바와 같이 트리판 블루 염료 배제를 사용하여 측정된다. 일부 실시양태에서, 트리판 블루 염료 배제는 (a) 현탁액 중에서 분취량의 복수의 핵이 없는 세포를 원심분리하여 세포 펠릿을 생성하고; (b) 무혈청 배지 중에 세포 펠릿을 재현탁시켜 무혈청 세포 현탁액을 생성하고; (c) 1부 트리판 블루 염료 및 1부의 무혈청 세포 현탁액을 혼합하고; (d) (c)의 3-5분 이내에 복수의 핵이 없는 세포를 계수함으로써 수행되며, 여기서, 복수의 핵이 없는 세포 중 적어도 일부는 트리판 블루 염료로 염색되지 않고, 이는 생존능을 시사하는 것이다. 일부 실시양태에서, 생존능은 본원에 기술된 바와 같이 아넥신-5 세포 표면 염색을 사용하여 측정된다. 일부 실시양태에서, 핵이 없는 세포는 동결보존, 냉동동면, 또는 동결건조된 것이다. 일부 실시양태에서, 핵의 부재하에서 백신의 합성 또는 분비는 약 3일 이상의 기간 동안 핵이 없는 세포에 의해 수행된다. 일부 실시양태에서, 핵이 없는 세포는 약학적으로 허용되는 담체 중에 존재한다. 일부 실시양태에서, 핵이 없는 세포는 약 103개의 세포/kg(체중) 내지 약 1012개의 세포/kg(체중)의 투여량으로 존재한다. 일부 실시양태에서, 핵이 없는 세포는 적어도 약 103, 104, 105, 106, 107, 108, 109, 1010, 1011, 1012개의 세포/kg(체중) 이상의 투여량으로 존재한다. 일부 실시양태에서, 핵이 없는 세포는 최대 약 103, 104, 105, 106, 107, 108, 109, 1010, 1011, 1012개의 세포/kg(체중)의 투여량으로 존재한다. 일부 실시양태에서, 핵이 없는 세포는 단리 및 정제된 것이다.
본원에 개시된 측면은 본원에 기술된 복수의 핵이 없는 세포를 포함하는 세포 집단을 제공한다.
본원에 개시된 측면은 피험체에게 본원에 기술된 복수의 중 한 세포를 제1 용량으로 투여하는 단계를 포함하는, 피험체에게 백신을 전달하는 방법을 제공한다. 일부 실시양태에서, 피험체는 투여 후에 백신 접종을 받는다. 일부 실시양태에서, 투여는 냉동동면 또는 동결보존으로부터 세포를 제거한 후 적어도 24시간 후에 수행된다. 일부 실시양태에서, 투여는 냉동동면 또는 동결보존으로부터 세포를 제거한 후 적어도 48시간 후에 수행된다. 일부 실시양태에서, 핵이 없는 세포는 적어도 24시간 동안 동결건조 후 생존가능하다. 일부 실시양태에서, 생존능은 본원에 기술된 바와 같이 트리판 블루 염료 배제를 사용하여 측정된다. 일부 실시양태에서, 트리판 블루 염료 배제는 (a) 현탁액 중에서 분취량의 복수의 핵이 없는 세포를 원심분리하여 세포 펠릿을 생성하고; (b) 무혈청 배지 중에 세포 펠릿을 재현탁시켜 무혈청 세포 현탁액을 생성하고; (c) 1부 트리판 블루 염료 및 1부의 무혈청 세포 현탁액을 혼합하고; (d) (c)의 3-5분 이내에 복수의 핵이 없는 세포를 계수함으로써 수행되며, 여기서, 복수의 핵이 없는 세포 중 적어도 일부는 트리판 블루 염료로 염색되지 않고, 이는 생존능을 시사하는 것이다. 일부 실시양태에서, 생존능은 본원에 기술된 바와 같이 아넥신-5 세포 표면 염색을 사용하여 측정된다. 일부 실시양태에서, 세포는 피험체에서 핵의 부재하에서 3일 이상의 기간 동안 백신을 합성 또는 분비한다. 일부 실시양태에서, 세포는 피험체에서 핵의 부재하에서 약 3 내지 5일 동안 백신을 합성 또는 분비한다. 일부 실시양태에서, 본 방법은 제1 용량의 한 세포를 투여한 후 적어도 1개월 후에 피험체에게 세포 집단 중 제2 세포를 제2 용량으로 투여하는 단계를 추가로 포함한다. 일부 실시양태에서, 본 방법은 제1 용량의 한 세포를 투여한 후 적어도 2개월 후에 피험체에게 세포 집단 중 제2 세포를 제3 용량으로 투여하는 단계를 추가로 포함한다.
본원에 개시된 측면은 핵의 부재하에서 치료제를 합성 또는 분비하는 핵이 없는 세포를 그를 필요로 하는 피험체에게 투여하는 단계를 포함하고, 여기서, 치료제는 바이러스에 의한 감염과 연관된 질환 또는 병태를 치료하는 데 치료적으로 효과적이며, 서열 번호 1과 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87% 88%, 89% 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 서열에 의해 코딩된 것인 방법을 제공한다. 일부 실시양태에서, 본 방법은 피험체에서 질환 또는 병태를 치료하는 단계를 추가로 포함한다. 일부 실시양태에서, 치료제는 (a) 인터류킨 10의 효능제; (b) 인터류킨 10의 길항제; (c) 인터류킨 6; (d) 종양 괴사 인자(TNF: tumor necrosis factor); (e) (a) 내지 (d) 중 어느 하나의 일부; 또는 (e) (a) 내지 (d) 중 임의의 것의 조합이다. 일부 실시양태에서, 인터류킨 10의 효능제는 인터류킨 10, 또는 그의 일부이고, 서열 번호 13과 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87% 88%, 89% 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, 인터류킨 10의 효능제, 또는 그의 일부는 알부민 또는 그의 일부을 코딩하는 아미노산 서열을 추가로 포함한다. 일부 실시양태에서, 치료제는 세포에 의해 분비된다. 일부 실시양태에서, 인터류킨 6의 효능제, 또는 그의 일부는 서열 번호 14와 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87% 88%, 89% 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, TNF의 효능제는 서열 번호 15와 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87% 88%, 89% 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, 핵이 없는 세포는 피험체의 폐 조직에서 하나 이상의 세포 상에서 발현된 리간드에 특이적인 귀소 수용체를 추가로 포함한다. 일부 실시양태에서, 귀소 수용체는 P-셀렉틴 당단백질 리간드-1, C-C 모티프 케모카인 수용체 2, 또는 C-X-C 모티프 케모카인 수용체 4, 또는 그의 조합을 포함한다. 일부 실시양태에서, 세포는 피험체의 림프 조직에서 하나 이상의 세포 상에서 발현된 리간드에 특이적인 귀소 수용체를 추가로 포함한다. 일부 실시양태에서, 귀소 수용체는 C-X-C 케모카인 수용체 타입 3, 류코시아린, CD44 항원, C-C 케모카인 수용체 타입 7, L-셀렉틴, 림프구 기능 연관 항원 1, 또는 초후기 항원-4, 또는 그의 조합을 포함한다. 일부 실시양태에서, 핵이 없는 세포는 과립구-대식세포 콜로니 자극 인자(GM-CSF: granulocyte-macrophage colony-stimulating factor)를 포함하는 면역조정제를 추가로 포함한다. 일부 실시양태에서, 질환 또는 병태는 호흡기 질환 또는 병태이다. 일부 실시양태에서, 질환 또는 병태는 코로나바이러스 질환(COVID)의 증상을 포함한다. 일부 실시양태에서, COVID는 COVID-19이다.
본원에 개시된 측면은 핵의 부재하에서 치료제를 합성 또는 분비하는 핵이 없는 세포를 그를 필요로 하는 피험체에게 투여하는 단계를 포함하고, 여기서, 치료제는 적어도 부분적으로 병원체에 의한 감염에 의해 유발된 질환 또는 병태를 치료하는 데 치료적으로 효과적인 것인 방법을 제공한다. 일부 실시양태에서, 병원체는 바이러스, 박테리아, 진균, 또는 독소이다. 일부 실시양태에서, 바이러스는 종양용해성 바이러스이다. 일부 실시양태에서, 독소는 클로스트리디움 보툴리눔 독소, 클로스트리디움 페르프린겐스의 엡실론 독소, 포도상구균 장독소 B, 또는 리시누스 코무니스로부터의 리신 독소, 또는 그의 임의의 조합이다. 일부 실시양태에서, 박테리아는 바실러스 안트라시스, 예르시니아 페스티스, 프란시셀라 툴라렌시스, 브루셀라, 살모넬라, 에스케리키아 콜라이 O157:H7, 시겔라, 부르크홀데리아 말레이, 부르크홀데리아 슈도말레이, 클라미디아 시타시, 콕시엘라 번에티이, 리케차 프로와제키, 비브리오 콜레라에, 또는 크립토스포리디움 파르붐 또는 그의 임의의 조합이다. 일부 실시양태에서, 치료제는: (a) 인터류킨 10의 효능제; (b) 인터류킨 10의 길항제(예컨대, GIT27, AS101, 메소프람, 또는 리툭시맙); (c) 인터류킨 6; (d) 종양 괴사 인자(TNF); (e) (a) 내지 (d) 중 어느 하나의 일부; 또는 (e) (a) 내지 (d) 중 임의의 것의 조합이다. 일부 실시양태에서, 인터류킨 10의 효능제는 인터류킨 10, 또는 그의 일부이고, 서열 번호 13과 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87% 88%, 89% 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, 인터류킨 10의 효능제, 또는 그의 일부는 알부민 또는 그의 일부을 코딩하는 아미노산 서열을 추가로 포함한다. 일부 실시양태에서, 치료제는 세포에 의해 분비된다. 일부 실시양태에서, 인터류킨 6의 효능제, 또는 그의 일부는 서열 번호 14와 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87% 88%, 89% 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, TNF의 효능제는 서열 번호 15와 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87% 88%, 89% 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, 핵이 없는 세포는 피험체의 폐 조직에서 하나 이상의 세포 상에서 발현된 리간드에 특이적인 귀소 수용체를 추가로 포함한다. 일부 실시양태에서, 귀소 수용체는 P-셀렉틴 당단백질 리간드-1, C-C 모티프 케모카인 수용체 2, 또는 C-X-C 모티프 케모카인 수용체 4, 또는 그의 조합을 포함한다. 일부 실시양태에서, 세포는 피험체의 림프 조직에서 하나 이상의 세포 상에서 발현된 리간드에 특이적인 귀소 수용체를 추가로 포함한다. 일부 실시양태에서, 귀소 수용체는 C-X-C 케모카인 수용체 타입 3, 류코시아린, CD44 항원, C-C 케모카인 수용체 타입 7, L-셀렉틴, 림프구 기능 연관 항원 1, 또는 초후기 항원-4, 또는 그의 조합을 포함한다. 일부 실시양태에서, 핵이 없는 세포는 과립구-대식세포 콜로니 자극 인자(GM-CSF)를 포함하는 면역조정제를 추가로 포함한다. 일부 실시양태에서, 질환 또는 병태는 표 3-6에 제공되어 있다.
본원에 개시된 측면은 (a) 병원체에 의한 감염을 앓는 피험체에게 실질적으로 핵이 없는 복수의 세포를 투여하여 (i) (a)에서 피험체에게 투여된 복수의 세포 중 적어도 하나의 핵이 없는 세포의 병원체에 의한 감염을 허용하고; (ii) (i) 후, 적어도 하나의 핵이 없는 세포 내에서의 병원체의 증식을 방해함으로써 생체내에서 피험체로부터 병원체를 격리시키는 단계; 및 (b) (i) 생체내에서 복수의 세포 중 적어도 하나의 세포로부터 병원체를 제거 또는 감소; 및 (ii) 피험체로부터 적어도 하나의 핵이 없는 세포를 실질적으로 제거 중 적어도 하나에 의해 병원체 연관된 질환 또는 병태를 치료하는 단계를 포함하는, 병원체 연관된 질환 또는 병태를 치료하는 방법을 제공한다. 일부 실시양태에서, 적어도 하나의 핵이 없는 세포는 피험체의 림프 조직에서 하나 이상의 세포 상에서 발현된 리간드에 특이적인 귀소 수용체를 포함한다. 일부 실시양태에서, 귀소 수용체는 C-X-C 케모카인 수용체 타입 3, 류코시아린, CD44 항원, C-C 케모카인 수용체 타입 7, L-셀렉틴, 림프구 기능 연관 항원 1, 또는 초후기 항원-4, 또는 그의 조합을 포함한다. 일부 실시양태에서, 병원체는 코로나 바이러스이다. 일부 실시양태에서, 코로나 바이러스는 서열 번호 1과 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87% 88%, 89% 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 핵산 서열에 의해 코딩된다. 일부 실시양태에서, 적어도 하나의 핵이 없는 세포는 (a) 과립구-대식세포 콜로니 자극 인자; (b) 사이토카인; (c) (a) 또는 (b)의 일부; 또는 (d) (a) 내지 (c)의 임의의 조합을 포함하는 면역조정제를 포함한다. 일부 실시양태에서, 적어도 하나의 핵이 없는 세포는 (a) 내지 (d) 중 하나 이상의 것을 합성 또는 분비하는 데 충분한 하나 이상의 세포내 세포소기관을 포함한다. 일부 실시양태에서, 사이토카인은 서열 번호 13, 14, 또는 15, 또는 그의 조합과 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87% 88%, 89% 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, 사이토카인은 분비성이다. 일부 실시양태에서, 적어도 하나의 핵이 없는 세포의 직경은 1 마이크로미터(㎛) 내지 100 ㎛이다. 일부 실시양태에서, 적어도 하나의 핵이 없는 세포의 직경은 약 8 ㎛이다. 일부 실시양태에서, 본 방법은 (a)에서의 투여 이전에 냉동동면 또는 동결보존으로부터 실질적으로 핵이 없는 복수의 세포를 제거하는 단계를 추가로 포함한다. 일부 실시양태에서, 실질적으로 핵이 없는 복수의 세포는 냉동동면, 동결보존, 또는 동결건조로부터 실질적으로 핵이 없는 복수의 세포를 제거한 후 적어도 24시간 동안 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 적어도 24시간 동안 동결건조 후 생존가능하다. 일부 실시양태에서, 핵이 없는 세포는 동결보존, 냉동동면, 또는 동결건조된 것이다. 일부 실시양태에서, 핵이 없는 세포는 단리 또는 정제된 것이다. 일부 실시양태에서, 생존능은 본원에 기술된 바와 같이 트리판 블루 염료 배제를 사용하여 측정된다. 일부 실시양태에서, 트리판 블루 염료 배제는 (a) 현탁액 중에서 분취량의 복수의 핵이 없는 세포를 원심분리하여 세포 펠릿을 생성하고; (b) 무혈청 배지 중에 세포 펠릿을 재현탁시켜 무혈청 세포 현탁액을 생성하고; (c) 1부 트리판 블루 염료 및 1부의 무혈청 세포 현탁액을 혼합하고; (d) (c)의 3-5분 이내에 복수의 핵이 없는 세포를 계수함으로써 수행되며, 여기서, 복수의 핵이 없는 세포 중 적어도 일부는 트리판 블루 염료로 염색되지 않고, 이는 생존능을 시사하는 것이다. 일부 실시양태에서, 생존능은 본원에 기술된 바와 같이 아넥신-5 세포 표면 염색을 사용하여 측정된다. 일부 실시양태에서, (b)에서 병원체 연관된 질환 또는 병태를 치료하는 단계는 복수의 세포 중 적어도 하나의 세포로부터 병원체를 제거 또는 감소시킴으로써 이루어진다. 일부 실시양태에서, 적어도 하나의 세포는 적어도 하나의 세포로부터 병원체를 제거 또는 감소시키는 데 효과적인 항바이러스제를 포함한다. 일부 실시양태에서, (b)에서 병원체 연관된 질환 또는 병태를 치료하는 단계는 피험체로부터 적어도 하나의 핵이 없는 세포를 실질적으로 제거함으로써 이루어진다. 일부 실시양태에서, 복수의 세포는 적혈구 또는 적혈구 전구체가 아니다. 일부 실시양태에서, 적어도 하나의 핵이 없는 세포는 병원체와, 피험체의 세포에 의해 발현된 병원체 인식 수용체 사이의 결합을 차단하는 중화 항체를 코딩하는 이종성 폴리뉴클레오티드를 포함한다.
일부 실시양태에서, 본 방법은 핵의 부재하에서 적어도 하나의 핵이 없는 세포에 의해 중화 항체를 분비하여 병원체와, 피험체의 세포의 병원체 인식 모이어티 사이의 결합을 감소 또는 호전시키는 단계를 추가로 포함한다. 일부 실시양태에서, 병원체는 바이러스, 박테리아, 독소, 또는 진균이다. 일부 실시양태에서, 바이러스는 종양용해성 바이러스이다. 일부 실시양태에서, 바이러스는 코로나 바이러스이다. 일부 실시양태에서, 코로나 바이러스는 SARS-CoV-2, 또는 그의 변이체이다. 일부 실시양태에서, 독소는 클로스트리디움 보툴리눔 독소, 클로스트리디움 페르프린겐스의 엡실론 독소, 포도상구균 장독소 B, 또는 리시누스 코무니스로부터의 리신 독소, 또는 그의 임의의 조합이다. 일부 실시양태에서, 박테리아는 바실러스 안트라시스, 예르시니아 페스티스, 프란시셀라 툴라렌시스, 브루셀라, 살모넬라, 에스케리키아 콜라이 O157:H7, 시겔라, 부르크홀데리아 말레이, 부르크홀데리아 슈도말레이, 클라미디아 시타시, 콕시엘라 번에티이, 리케차 프로와제키, 비브리오 콜레라에, 또는 크립토스포리디움 파르붐 또는 그의 임의의 조합이다.
참조로 포함
본 명세서에 언급된 모든 공개문헌, 특허 및 특허 출원은 마치 각각의 개별 공개문헌, 특허 또는 특허 출원이 참조로 포함되는 것으로 구체적이고 개별적으로 명시된 것처럼 동일한 정도로 본원에서 참조로 포함된다. 참고로 포함된 공개문헌 및 특허 또는 특허 출원이 명세서에 포함된 개시내용과 모순되는 한, 본 명세서는 그러한 모순되는 자료를 대체 및/또는 우선한다.
본원에 개시된 방법 및 조성물의 일부 신규한 특징이 본 개시내용에 기재되어 있다. 개시된 조성물 및 방법의 원리가 활용되는 예시적인 실시양태를 기술하는 하기의 상세한 설명, 및 이에 대한 첨부 도면을 참조함으로써 본원에 개시된 방법 및 조성물의 특징 및 이점에 대한 더욱 잘 이해할 수 있게 될 것이다:
도 1은 본 개시내용의 한 실시양태에 따른 신속한 바이러스 백신 플랫폼을 위해 세포를 조작하는 프로세스를 보여주는 것이다.
도 2는 종래 백신 개발 타임라인과 비교하여, 본 개시내용의 한 실시양태에 따른 신속한 바이러스 백신 플랫폼을 이용한 백신 생산 타임라인을 보여주는 것이다.
도 3은 본 개시내용의 한 실시양태에 따라 새롭게 확인된 바이러스를 처리하기 위해 신속한 바이러스 백신 플랫폼을 보급하기 위한 프로세스를 보여주는 것이다.
도 4는 본 개시내용의 실시양태에 따른 본원에 기술된 세포질체가 살아있는 바이러스(예를 들어, 코로나바이러스)를 포획하고, 제거하는 프로세스를 보여주는 것이다.
도 5는 본원에 기술된 신속한 바이러스 백신 플랫폼의 이점의 비제한적인 예를 보여주는 것이다.
도 6a는 명시된 시간 동안 4℃에서 냉동동면으로부터 회복된 직후 MSC 및 MSC 유래 세포질체의 생존능을 보여주는 대표적인 선 그래프이다. 생존능을 트리판 블루 염료 배제를 사용하여 자동화된 세포 계수(Cell Countess)에서 평가하였고, 입력된 세포 개수 대비 비로 제시하였다.
도 6b는 명시된 시간 동안 4℃에서 냉동동면으로부터 회복된 직후 보이덴(Boyden) 챔버 검정법에서 이동된 MSC 및 MSC 유래 세포질체를 비교하는 대표적인 막대 그래프이다. 세포와 세포질체를 무혈청(음성 대조군) 또는 10% 프리미엄 FBS(P-FBS)를 바닥 챔버에서 화학유인물질로 사용하여 3시간 동안 이동하도록 하고, 계수를 로딩 대조군 대비로 정규화하였다.
도 7a는 MSC 및 세포질체 내로 형질감염된 인터류킨 10(IL-10) mRNA의 개략도이다. IL-10 mRNA 코딩 영역(CDS)의 시작 코돈 앞에 코작(Kozak) 서열을 부가하였다. 인간 베타 글로빈(HBB) mRNA의 5'UTR 및 3'UTR은 각각 IL-10 CDS의 5' 및 3' 단부에 부가하였다. 인공 5'Cap은 IL-10 mRNA의 5' 단부에 부가하였고, mRNA 안정성을 증가시키기 위해 슈도우리딘 변형을 조작하였다.
도 7b는 형질감염(++) 또는 비-형질감염(--) MSC 또는 MSC 유래 세포질체의 배양 배지 중 IL-10 농도를 보여주는 막대 그래프이다. MSC 유래 세포질체를 IL-10 mRNA로 형질감염시킨 후, 2.5 x 104개의 세포/웰로 24 웰 플레이트에 시딩하였다. 조절 배지(CM: conditioned medium)를 형질감염 24시간 후에 수집하고, IL-10 농도를 ELISA에 의해 측정하였다.
도 7c는 1시간 7b에서와 같이 처리된 MSC 또는 세포질체로부터의 명시된 조절 배지(CM)로 처리된 혈청 고갈 RAW 대식세포에서 Stat3 및 인산화된 Stat3(P-Stat3, IL-10 활성화의 마커)의 단백질 발현을 보여주는 면역블롯이다. 비처리 = 비처리 CM 대조군. 완전 배지 = MSC 완전 배양 배지로 처리된 RAW 세포. MSC Ctrl = 형질감염되지 않은 MSC로부터의 CM으로 처리된 RAW 세포. MSC IL-10 = IL-10 mRNA 형질감염된 MSC로부터의 CM으로 처리된 RAW 세포. 세포질체 Ctrl = 형질감염되지 않은 세포질체로부터의 CM으로 처리된 RAW 세포. 세포질체 IL-10 = IL-10 mRNA 형질감염 세포질체로부터의 CM으로 처리된 RAW 세포.
도 7d는 ELISA에 의해 측정된 마우스 혈액 중 분비된 IL-10 사이토카인의 농도를 보여주는 막대 그래프이다. MSC 또는 MSC 유래 세포질체를 7b에서와 같이 처리하고, C57BL/6 마우스의 혈관 구조 내로 안와후 주사하였다. 주사 2시간 후, 동물을 안락사시키고, 심장 천자로 혈액 샘플을 수집하였다. 평균 ± SEM; n=3.
도 8a는 24시간 화학유인물질로서의 10% FBS를 향해 기저 막 추출물(BME: Basement Membrane Extract)로 코팅된 8.0 ㎛ 다공성 필터의 밑면을 침범한, 보이덴 챔버 분석에서 크리스탈 바이올렛(Crystal Violet) 염색 MSC 또는 MSC 유래 세포질체의 대표적인 명시야 현미경 이미지이다. 음성 = FBS 부재(음성 대조군). 스케일 바 = 50 ㎛.
도 8b는 로딩 대조군 대비 막의 밑면을 침범한, 8a에서와 같이 처리된 MSC 또는 MSC 유래 세포질체의 비를 보여주는 대표적인 막 그래프이다.
도 9a는 현탁 배지 중 MSC 및 세포질체의 대표적인 표면형광 현미경 이미지(상단 패널) 및 위상차 현미경 이미지(하단 패널)이다. 액틴 피질을 라이프액트(Lifeact) RFP로 염색한 반면, 세포 핵은 바이브란트® 다이사이클™ 그린(Vybrant® Dyecycle™ Green)으로 염색하였다. 화살표는 세포질체를 가리키고, 화살촉은 MSC 핵을 가리킨다. 스케일 바 = 20 ㎛.
도 9b는 니콘 엘리먼트(Nikon Element) 소프트웨어로 측정한, MSC 및 세포질체의 크기 분포를 보여주는 대표적인 산점도이다.
도 9c는 폐에 존재하는, 검출된 바이브란트® DiD 표지된 MSC 또는 세포질체를 보여주는 대표적인 막대 그래프이다. MSC 또는 세포질을 DiD 염료로 표지하고, C57BL/6 마우스의 혈관 구조 내로 안와후 주사하였다. 조직을 24시간 후에 수거하고, 세포 현탁액을 유세포 분석법에 의해 분석하였다. 평균 ± SEM; n=3.
도 9d는 간에 존재하는, 검출된 바이브란트® DiD 표지된 MSC 또는 세포질체를 보여주는 대표적인 막대 그래프이다. 평균 ± SEM; n=3. MSC 또는 세포질을 DiD 염료로 표지하고, C57BL/6 마우스의 혈관 구조 내로 안와후 주사하였다. 조직을 24시간 후에 수거하고, 세포 현탁액을 유세포 분석법에 의해 분석하였다.
도 10a는 폐에서 검출된 DiD 표지된 MSC 또는 세포질체의 개수를 보여주는 대표적인 산점도이다. MSC를 표준 부착 조건하에(2D) 또는 3D 세포질체를 생성하기 위해 핸드 드롭 방법(3D)에 의해 현탁액 중에서 배양하였다. MSC 및 세포질체를 바이브란트® DiD 염료로 표지하고, C57BL/6 마우스의 혈관 구조에 안와후 주사하였다. 조직을 24시간 후에 수거하고, 세포 현탁액을 유세포 분석법에 의해 분석하였다. 평균 ± SEM; n=2.
도 10b는 간에서 검출된 DiD 표지된 MSC 또는 세포질체의 개수를 보여주는 대표적인 산점도이다. MSC를 표준 부착 조건하에(2D) 또는 3D 세포질체를 생성하기 위해 핸드 드롭 방법(3D)에 의해 현탁액 중에서 배양하였다. MSC 및 세포질체를 바이브란트® DiD 염료로 표지하고, C57BL/6 마우스의 혈관 구조에 안와후 주사하였다. 조직을 24시간 후에 수거하고, 세포 현탁액을 유세포 분석법에 의해 분석하였다. 평균 ± SEM; n=2.
도 10c는 비장에서 검출된 바이브란트® DiD 표지된 MSC 또는 세포질체의 개수를 보여주는 대표적인 산점도이다. MSC를 표준 부착 조건하에(2D) 또는 3D 세포질체를 생성하기 위해 핸드 드롭 방법(3D)에 의해 현탁액 중에서 배양하였다. MSC 및 세포질체를 DiD 염료로 표지하고, C57BL/6 마우스의 혈관 구조에 안와후 주사하였다. 조직을 24시간 후에 수거하고, 세포 현탁액을 유세포 분석법에 의해 분석하였다. 평균 ± SEM; n=2.
도 11a-11b는 감염 후 12 hr째의 MOI 0.05로 VSV-GFP(화살표)로 감염된 유핵 모 MSC(상단) 및 MSC 유래 세포질체(하단)의 표면형광 현미경 이미지를 도시한 것이다. GFP 항원은 핵이 없는 MSC에 의해 명확하고, 강건하게 발현되었으며, 이는 제핵 세포에서의 바이러스 복제 및 항원 생산을 시사하는 것이다. 스케일 바 = 50 ㎛. 11b. 감염 후 12시간째의 MOI 0.05로 MOI 0.1로 VSV-GFP(화살촉)로 감염된 핵이 없는 MSC 유래 세포의 고배율 표면형광 이미지. 세포질체를 로다민 팔로이딘 (화살표)을 이용하여 F-액틴 필라멘트에 대해 염색하고, 핵 결여를 도시하기 위해 DAPI를 사용하여 핵 염색을 수행하였다.
도 12a-12d는 감염 후 48 hr째의 MOI 0.05로 GFP 항원을 코딩하는 oHSV로 감염된 MSC 및 핵이 없는 MSC의 표면형광 현미경 이미지를 도시한 것이다. oHSV-GFP 접종 후 18 hr째 MSC로부터 핵이 없는 MSC(세포질체)를 생성하였다. 스케일 바 = 50 ㎛. 도 12b는 라이프액트-RFP를 발현하는 MSC 또는 핵이 없는 MSC를 GFP를 코딩하는 종양용해성 단순 헤르페스 바이러스(oHSV-GFP: oncolytic herpes simplex virus encoding GFP) 0.05 MOI로 감염시킨 후, 이어서, 누드 마우스에서 성장하는 확립된 U87 교아세포종 종양에 주사한 것을 도시한 것이다. 이미지는 주사 후 7일째에 촬영하였다. 강력한 GFP 신호로 나타난 바와 같이, MSC 및 핵이 없는 MSC는 oHSV를 종양 세포로 전달하였다. 7일 후 종양에서 핵이 없는 MSC는 거의 검출되지 않은 반면, 성장하는 종양의 중앙(주사 부위)과 바깥쪽 가장자리에는 다수의 MSC가 존재한다는 것이 주목할 만하였다. 도 12c는 oHSV-GFP 바이러스를 보유하는 MSC 또는 핵이 없는 MSC에 의해 감염된 종양 세포의 부분을 나타내는 GFP로 커버된 종양 면적의 비율(%)을 보여주는 막대 그래프이다. 도 12d는 PBS 주사 대조군과 비교하여 IL-12(애주번트) 조작된 핵이 없는 MSC 및 oHSV 조작된 핵이 없는 MSC의 조합으로 처리된 확립된 교아세포종 종양에 존재하는 CD8+ 이펙터 T 세포의 비가 증가된 것을 보여주는 그래프이다.
도 13a-13b는 제핵 중간엽 기질 세포(MSC: mesenchymal stromal cel)(세포질체)가 세포 투과성 항원 펩티드를 쉽게 흡수한다는 것을 도시한 것이다. 도 13a는 100 μM의 세포 투과성 항원 펩티드(Arg)9-FAM(6-카복시플루오르세인, FAM-Arg-Arg-Arg-Arg-Arg-Arg-Arg-Arg-Arg-OH)과 함께 인큐베이션된 MSC(좌측) 및 제핵 MSC(세포질체)(우측)를 보여주는 것이다. 스케일 바 = 50 ㎛. 화살표는 훽스트(Hoechst) 염색된 핵을 나타내고, 화살촉은 양성 (Arg)9-FAM을 나타낸다. 도 13b는 이미지J(ImageJ)에서 측정된 상대 형광 강도를 나타내는 막대 그래프를 도시한 것이다. 보정된 총 세포 형광 = 적분된 밀도 - (선택한 세포 면적 X 배경 판독값의 평균 형광). 평균 ± SEM; n=10.
상세한 설명
본원에서는 병원성 감염(예컨대, 바이러스, 진균, 기생충, 박테리아) 또는 상기 병원성 감염과 연관된 질환 또는 병태를 치료하거나, 또는 예방하기 위한 조성물 및 키트, 및 그의 사용 방법을 개시한다. 본 개시내용의 조성물은 병원성 감염과 연관된 질환 또는 병태를 치료하고/거나, 병원성 감염을 예방하는 데 효과적인 치료제를 함유하고, 일부 경우에서는 그를 생산하도록 조작된 제핵 세포인 세포질체를 포함한다. 일부 실시양태에서, 본원에 기술된 치료제는 백신(예컨대, 약독화된 바이러스 항원), 급성 바이러스 감염을 치료하는 데 효과적인 바이러스 표적화제, 또는 상기 둘의 조합일 수 있다. 일부 실시양태에서, 세포질은 또한 병원체를 포획하고(예컨대, 생체내), 이들을 불활성화시켜 급성 감염을 치료하고, 추가 감염을 예방하도록 조작될 수 있다. 일부 실시양태에서, 병원체는 예컨대, 코로나바이러스와 같은 하나 이상의 바이러스이다.
기존의 세포 기반 요법은 많은 단점을 가지고 있다. 효과적인 세포 기반 치료제의 개발은 종종 유전 공학 및 생체외 세포의 게놈 내로 새로운 유전 물질의 도입을 필요로 한다. 그러나, 이러한 프로세스는 특히 조작된 세포가 신체에 영구적으로 생착되거나, 또는 숙주 세포와 융합하는 경우, 암 및 생명을 위협하는 다른 질환을 생성하는 위험한 돌연변이를 게놈에 도입할 수 있다. 기존의 많은 세포 기반 치료제의 또 다른 중요한 문제는 신체에 전달된 후, 세포가 제어할 수 없을 정도로 증식하고, 신체에 영구적으로 생착될 수 있어 생명을 위협할 수 있다는 것이다. 또한, 피험체에 투여한 후 세포 제어가 부족하면 정확한 용량의 치료 세포 및 그의 생체활성 생성물의 전달이 어려워질 수 있다(예컨대, 약동학적 성질 불량). 따라서, 치료제 또는 다른 생체분자를 전달하기 위한 안전하고 제어가능한 세포 기반 요법이 필요하다.
환자 또는 피험체 전달 전에, 전통적인 세포 기반 치료제는 바람직한 세포 및 치료 기능을 생성하도록 생체외에서 일반적으로 변형되거나, 또는 유전적으로 변경된다. 그러나, 이러한 세포가 피험체에 도입되면, 새로운 숙주 환경이 크게 리프로그래밍되고, 부정적으로 변경되거나, 또는 그렇지 않으면 효과가 없게 만들 수 있다. 따라서, 리프로그래밍 및 유해한 외부 신호에 반응할 수 없는 더욱 예측가능한 세포 기반 요법이 필요하다.
현존하는 세포 기반 요법은 암 또는 다른 질환에 대한 치료제로서 피험체에게 전달하기 위해 그에 로딩될 수 있는 DNA 손상/유전자 표적화제의 양에 의해 제한된다. 이는 DNA 손상 화학요법 약물, DNA 통합 바이러스, 종양용해성 바이러스, 및 일정한 간격을 두고 주기적으로 분포하는 짧은 회문 반복부(CRISPR: cluster regularly interspaced short palindromic repeat), Cas의 작은 클러스터(CRISPR/Cas 시스템), 및 플라스미드를 포함하나, 이에 제한되지 않는 유전자 요법 적용 프로그램/전달을 포함하나, 이에 제한되지 않는다. 따라서, 이러한 제한이 없는 세포 기반 요법이 필요하며, 이는 고용량의 세포독성 치료제를 전달하는 이상적인 플랫폼이 될 수 있다.
본 개시내용의 세포질체를 사용하여 피험체에게 치료제를 전달하는 데에는 몇 가지 이점이 있다. 그의 핵으로부터의 DNA(예컨대, 핵-코딩 유전자 또는 외래 또는 돌연변이체 DNA)를 의도하지 않게 숙주 세포로 전달하는 종래 세포 기반과 달리, 본 개시내용의 세포질체는 핵 없이는 그렇게 할 수 없다. 추가로, 본원에 기술된 세포질체를 사용하여 피험체에 치료제를 전달하는 것은 제어가능하고, 유한하며(예컨대, 14일 이하), 적어도 핵이 없으면, 세포질체가 다른 세포 유형으로 증식하거나 분화할 수 없기 때문이다. 본 개시내용의 세포질체는 핵의 부재하에서 본원에 기술된 치료제 또는 다른 생체분자를 발현 및/또는 분비할 수 있을 뿐만 아니라, 생체내 표적 세포 또는 표적 조직 또는 환경으로 이동하거나, 또는 귀소할 수 있다. 이는 적어도 부분적으로는, 생성된 세포질체가 정상적인 생물학적 기능(예컨대, 단백질 생산/분비, 세포 운동성, 케모카인 감지 등)에 충분한 모세포로부터의 세포소기관을 보유하도록 본원에 기술된 방법을 사용하여 모세포로부터 제핵함으로써 달성된다. 심지어 피험체에게 전신적으로 전달되는 경우에도, 본원에 기술된 세포질체는 안전하고, 제어가능한 방식으로 피험체의 표적 조직 또는 표적 세포(예컨대, 림프 조직, 폐 조직)에 치료제를 효율적이고 효과적으로 전달한다. 또한, 종래 세포 기반 요법을 대량으로 제조하는 것은 시간 집약적이고, 고가인 바, 임상 적용이 제한된다. 핵을 포함하는 불멸화 세포(예컨대, hTERT)를 사용하여 제조 능력을 향상시키면 제조 규모가 증가하고, 제조 비용이 낮아질 수 있다고 생각되지만, 불멸화 세포는 염색체 이상을 일으키기 쉽고, 종양 또는 이소성 조직 형성을 촉진하여, 임상 적용에 안전하지 않게 만든다. 본 개시내용의 실시양태에 따라 이러한 세포 또는 임의의 세포 유형으로부터 제핵함으로써, 세포질체 제조와 연관된 규모 증가 및 비용 절감을 달성할 수 있으며, 동시에 종래 세포 기반에 의해 야기되는 인간 건강에 대한 위험을 완화시킬 수 있다.
본원에 기술된 조성물의 개선된 제조 규모 및 비용, 안전성 프로파일, 및 효율성은 백신 개발에 중요한 이점을 갖는다. 본원에 기술된 조성물을 제조하는 방법은, 일반적으로 생산자 세포주로부터 백신(예컨대, 항원, mRNA)의 단리 및 정제가 요구되는 종래 백신 개발 타임라인보다 더 빠르다. 대조적으로, 본 개시내용의 세포질체는 항바이러스 조성물을 연속적으로 생산하도록 조작되어 백신의 단리 및 정제의 필요성을 제거한다. 필요한 시점에서, 본원에 기술된 조성물은 근육내 주사보다는 전신으로(예컨대, 흡입) 투여되어 의료 시설이 백신을 투여할 필요가 없게 만들고, 환자 경험을 개선시킬 수 있다. 세포질체는 림프 조직(또는 다른 표적 조직)으로 신속하게 이동할 수 있기 때문에, 백신은 전신 투여된 특정의 종래 세포 기반 요법(예컨대, 엑소좀)의 경우 아주 짧은 시간 동안 피험체의 림프계에 보급될 수 있다. 추가로, 세포질체의 작은 크기(예컨대, 약 8 마이크로미터)는 세포질체가 혈 구조 및 조직 실질의 작은 개구에 포획되지 않도록 하여 종래 세포 기반 요법과 비교하여 생체 분포를 개선시킨다. 본원에 개시된 세포질체는 활동성 감염과 퇴칠할 뿐만 아니라, 추후 감염을 예방하기 위해 사실상 임의 유형의 백신 또는 항바이러스제(예컨대, 항바이러스 및/또는 중화 항체)를 발현하도록 조작될 수 있다. 추가로, 본원에 기술된 세포질체는 1 초과의 백신 유형(예컨대, 1 초과의 병원체 유형에 대한 것)을 발현하도록 조작될 수 있고, 이로써, 백신 패널이 단일 투여 형태로 피험체에게 투여될 수 있다. 이는 효과적인 면역 전략법을 위해 향후에 여러 백신이 필요할 수 있는 신속하게 진화하는 병원체(예컨대, SARS-CoV-2)에 특히 유용하다.
본원에 개시된 세포질체는 긴급한 의학적 필요에 대한 기성 솔루션이다. 세포질체는 제핵 이전 또는 이후에, 그가 림프 조직에 도달하기 이전에 면역계에 의해 제거될 위험 없이, 세포질체를 림프 조직으로 표적화하는 데 충분한 다른 생체들 중에서 표적화 모이어티(예컨대, 귀소 수용체), 면역 회피 모이어티(예컨대, "날 먹지마(don't eat me)" 신호전달 펩티드)를 발현하도록 조작될 수 있다. 세포질체는 동결보존, 냉동동면, 또는 동결건조되고, 장기간 동안 보관될 수 있으며, 이로써, 그의 생물학적 활성은 저속화되거나, 정지될 수 있다. 긴급하게 의학적으로 필요한 경우, 세포질체의 생물학적 기능은 전달 전 필요에 따라 회복될 수 있고(예컨대, 해동, 재수화), 추가 조작을 위해(예컨대, 백신 또는 항바이러스제 발현을 위해) 최대 5일 동안 실행가능하게 유지될 수 있다. 이러한 생물학적 기능으로는 치료 표면 단백질, 면역 자극 항원 또는 수용체 발현, 사이토카인, 호르몬 또는 단백질 분비, 엑소좀 방출, 막 입자 방출, 사멸 과정을 통한 면역계 자극 또는 터널링 나노튜브 생성을 포함하나, 이에 제한되지 않는다. 본 개시내용의 세포질체는 세포질체의 의도된 기능에 부정적인 영향을 미치지 않으면서, 제조 및 유통 과정 동안 다회에 걸쳐 동결 및 해동될 수 있어, 신속한 백신 보급을 위한 이상적인 플랫폼이 된다.
일부 실시양태에서, 본 개시내용의 세포질체는 본원에 기술된 외인성 백신 또는 다른 생체분자를 생산하거나, 또는 전달하도록 조작되지 않고 치료적일 수 있다. 예를 들어, 조작되지 않은 세포질체는 그 자체가 회복기 혈장 요법 접근법과 유사하게, 예를 들어, 관심 병원체에 대해 면역된 피험체로부터 수득된 세포로부터 유래된 세포질체와 같이 환자 또는 피험체로 전달될 때 치료 특성을 가질 수 있다. 상기 세포는 병원체-숙주 수용체 인게이지먼트를 차단하는 중화 항체를 자연적으로 생산할 수 있다. 일부 실시양태에서, 조작되지 않은 세포질체는 본원에 기술된 치료제 또는 생체분자 중 임의의 어느 하나를 자연적으로 생산할 수 있으며, 이는 이를 필요로 하는 피험체에서 치료 효과를 달성하기 위해 사용될 수 있다.
본원에 기술된 신속한 백신 플랫폼의 많은 이점의 비제한적인 예는 도 5에 제공되어 있다. 세포질체의 생산은 빠르게 확장될 수 있으며, 바이러스 항원을 발현하도록 조작된 수억 개의 세포질체는 쉽게 제조될 수 있고, 필요할 때까지 보관될 수 있다. 바이러스 항원을 발현하도록 조작되는 것 외에도, 본원에 기술된 세포질체는 트랩으로 작용할 수 있다. 이러한 기술적 특징은 조작된 세포질체가 병원체에 감염되도록 하여 병원체를 격리하고, 병원체가 다른 세포를 감염시키는 것을 방지한다. 예를 들어, 본원에 기술된 세포질체는 스파이크 단백질을 발현하는 SARS-CoV-2 바이러스에 의해 감염되게 ACE2 수용체를 발현하도록 조작될 수 있다. 감염 시, SARS-CoV-2 바이러스는 세포질체에 포획되어 더 이상 복제할 수 없다. 감염된 세포질체는 분해를 위해 면역계의 표적이 될 수 있다. 세포질체는 세포질체를 표적 조직 또는 미세환경, 예컨대, 림프절로 귀소시키도록 케모카인 수용체를 발현하도록 조작될 수 있다.
본원에서는 피험체에서 병원성 감염의 예방 또는 치료를 위한 조성물, 방법 및 키트를 제공된다. 일부 실시양태에서, 병원성 감염은 바이러스 감염, 예컨대, 코로나바이러스 또는 인플루엔자 바이러스의 감염이다. 일부 실시양태에서, 병원성 감염은 박테리아 감염이다. 본원에서는 바이러스 감염 또는 발생을 예방하거나, 또는급성 감염을 치료하기에 적합한 항바이러스 조성물을 발현하도록 조작된 세포질체를 개시한다. 피험체에게 전달될 때, 세포질체는 항바이러스 조성물을 세포질체 표면에 제시하거나, 또는 항바이러스 조성물을 표적 조직을 둘러싼 세포외 공간으로 분비함으로써 표적 조직에 항바이러스 조성물을 전달한다.
일부 실시양태에서, 본 개시내용의 세포질체는 또한 병원체에 의한 세포질체의 감염을 허용하고, 생체내 병원체의 증식을 방지함으로써 피험체에서 병원체를 포획하는 데 적합하다. 도 4에 제시된 바와 같이, 본원에 기술된 세포질체는 병원체에 의해 인식될 수 있는 바이러스 수용체를 발현하여 세포질체의 감염을 촉진할 수 있다. 병원체는 세포질체를 감염시키면 핵 게놈의 부재하에서 복제 또는 증식할 수 없는 세포질체 내에 격리된다. 5일 이하 후, 세포질체는 식세포 작용의 자연적 프로세스를 사용하여 피험체로부터 제거된다. 일부 실시양태에서, 세포질체는 피험체에서 면역계를 활성화시켜 바이러스의 제거를 가속화시킨다. 생체내에서 병원체의 증식을 방지하기 위한 본원에 개시된 세포질체의 적어도 하나의 이점은 많은 병원체가 복제하는 데 필요한 유전 정보를 포함하는 핵이 결여되어 있다는 점이다.
도 1을 참조하면. 일부 실시양태에서, 제핵 이전에 피험체에서 예컨대, 림프 조직(예컨대, 림프절) 또는 폐 조직과 같은 표적 세포 또는 조직을 표적화하는 부착 분자, 케모카인 또는 보유 수용체, 또는 그 둘 모두를 발현하도록 유전자 조작된 케모카인(단계 1). 이어서, 본원에 기술된 방법을 사용하여 조작된 세포에서 제핵을 수행하여 세포질체를 생성한다(단계 2). 이어서, 피험체에서 적응 면역 반응을 증진시키기 위해 백신 또는 다른 생체분자(예컨대, 치료제, 중화 항체), 및/또는 면역 조정제(예컨대, 면역 활성제)를 발현, 및 일부 실시양태에서, 그를 분비하도록 조작될 수 있다(단계 3). 세포질체는 의도된 기능에 따라 필요에 따라 추가로 조작된다. 생성된 세포질체는 바이러스 포획을 위한 트랩으로서, 또는 백신 보급을 위해 사용될 수 있다. 바이러스 트랩의 비제한적인 예에서, 세포질체는 치료제(예컨대, 백신) 페이로드로 조작되지 않을 수 있다. 일부 경우에는 바이러스에 의한 향후 감염을 예방하기 위해 관심 병원체에 대한 중화 항체를 발현 및/또는 분비하는 것이 유리할 수 있다. 일부 실시양태에서, 이 예의 바이러스는 코로나 바이러스, 예컨대, SARS-CoV-2이다. 그러나, 도 1의 워크플로우는 박테리아 병원체(예컨대, 바실러스 안트라시스) 또는 인체 건강에 상당한 위험을 초래하는 독소를 비롯한, 본원에 기술된 모든 병원체에 적용될 수 있다.
12개월 이상이 소요되는 전통적인 백신 개발과 비교하여, 새로운 병원체(예컨대, 바이러스) 확인에서부터 배포까지의, 본 개시내용의 세포질체를 제조하는 프로세스는 대략 2개월이 소요된다. 도 2에 제시된 바와 같이, 본 개시내용의 세포질체는 바이러스 발생에 앞서 미리 제조될 수 있고, 장기간 동결보존될 수 있다. 이는 (예컨대, 귀소 수용체, 면역 활성제를 발현하도록 조작된) 본 개시내용의 세포질체가 다음 바이러스 발생을 처리하기 위해 신속하게 보급될 수 있다는 것을 의미한다. 도 3을 참조하면, 미리 제조되고, 동결보존된 세포질체는 약독화된 바이러스 단백질을 분비하도록 조작된다. 그를 필요로 하는 피험체에게 투여되었을 때, 세포질체는 피험체에서 면역 활성화 및 바이러스에 대한 중화 항체의 생성을 유도한다.
본 개시내용의 세포질체를 제조하는 방법을 제공된다. 일부 실시양태에서, 세포를 사이토칼라신 B로 처리하여 피질 액틴 세포골격을 연화시킨다. 이어서, 피콜(Ficoll) 구배로 고속 원심분리에 의해 세포로부터 핵을 물리적으로 추출하여 핵이 없는 (제핵) 세포질체를 생성할 수 있다. 세포질체 및 무손상 유핵 세포는 피콜 구배에서 상이한 층으로 침강하기 때문에, 일부 실시양태에서, 세포질체는 쉽게 단리되고, 치료 목적 또는 다른 세포와의 융합을 위해 제조될 수 있다 (유핵화 또는 제핵화). 제핵 프로세스는 수천만 개의 세포를 프로세스할 수 수 있도록 임상적으로 확장될 수 있다.
본원에서는 본 개시내용의 세포질체를 사용 또는 전달하는 방법을 개시한다. 세포질체는 건강한 개체를 치료하기 위해(예컨대, 에너지를 개선하거나, 운동으로부터 회복시키기 위해, 또는 천연물을 전달하기 위해) 또는 다양한 질환(예컨대, 본원에 기술된 질환 중 임의의 것)을 치료하기 위해 임상적으로 관련된 카르고/페이로드를 전달하는 귀소 비히클로서 사용될 수 있다. 예를 들어, 세포질체는 건강한 개체, 예컨대, 전달되는 치료제가 효과적인 특정 장애로 진단받지 않은 개체에게 보충제, 항노화 인자, 예방 치료 등을 전달하는 데 사용될 수 있다.
또한, 본원에서는 본원에 기술된 임의의 조성물을 포함하는 키트를 제공한다. 예를 들어, 키트는 본원에 기술된 임의의 조성물 또는 방법에 관한 사용 설명서를 포함할 수 있다. 일부 실시양태에서, 키트는 적어도 하나의 용량의 임의의 조성물을 포함할 수 있다.
I. 조성물
본원에서는 피험체에서 병원체 연관된 질환 또는 병태를 치료하거나, 또는 예방하는 데 유용한 조성물을 제공한다. 일부 실시양태에서, 본원에 개시된 조성물은 병원체 연관된 질환 또는 병태의 치료 또는 예방에 적합한 활성제를 발현하도록 조작된 세포질체(예컨대, 제핵 세포)을 포함한다. 일부 실시양태에서, 병원체 연관된 질환 또는 병태는 바이러스 감염, 예컨대, 코로나바이러스 감염이다. 일부 실시양태에서, 세포질체는 항바이러스 조성물, 예컨대, 약독화된 바이러스 항원 또는 항바이러스 항체, 또는 그의 조합을 발현하도록 조작된다. 일부 실시양태에서, 세포질체는 세포질체의 표면에 항바이러스 조성물을 포함한다(예컨대, 항원 제시). 일부 실시양태에서, 항바이러스 조성물은 세포질체에 의해 표적 조직의 세포외 공간으로 분비된다. 일부 실시양태에서, 세포질체는 세포질체의 감염을 허용하고, 생체내에서 병원체의 증식을 방지함으로써 생체내에서 병원체를 포획하거나, 또는 포획하도록 조작되어 급성 병원성 감염, 또는 병원체 연관 질환 또는 병태를 치료한다.
본원에 기술된 세포질체는 제한되거나, 또는 정의된(예컨대, 공지된 또는 프로그램 가능한) 수명을 갖도록 조작된다. 본원에 기술된 세포질체는 일부 다른 세포 기반 요법(예컨대, 엑소좀, 적혈구, 입양 세포 요법)에서 세포와 비교하여 감소된 크기를 가지며, 이는 일부 실시양태에서 생체분포를 개선시킨다.
본원에 기술된 세포질체는 냉동동면 또는 동결보존 후 생존능을 유지하는 바, 이를 통해 세포질체는 약물 전달을 위한 플랫폼으로서 널리 채택될 수 있도록 독특하게 적합화될 수 있다. 동결보존은 생물학적 물질(예컨대, 세포, 세포질체)을 매우 낮은 온도(예컨대, 고체 CO2 중에서 -80℃, 액체 질소에서 -196℃ 등)에서 단기 또는 장기로 냉각 또는 동결 및 저장하는 것을 포함한다. 냉동동면은 예컨대, 4℃와 같은 비동결 온도에서 가사 상태로 생물학적 물질(예컨대, 세포, 세포질체)을 단기 냉각 및 보관하는 것을 포함한다. 세포질체의 냉동동면은 하기 이유 중 하나 이상의 이유로 유리할 수 있다: 냉동동면은 동결보존보다 덜 노동 집약적이고, 냉동동면된 세포질체는 운송(예컨대, 배송)될 수 있다. 일부 실시양태에서, 세포질체는 동결보존된다. 일부 실시양태에서, 세포질체는 냉동동면된다. 냉동동면 또는 동결보존으로부터 세포질체를 제거한 후, 세포질체는 본원에 기술된 방법에 따라 사용될 수 있다. 일부 실시양태에서, 세포질체는 냉동동면 또는 동결보존으로부터의 제거 후 적어도 약 24시간, 48시간, 72, 또는 24 내지 72시간 사이의 임의의 증분된 시간 동안 생존가능하다. 일부 실시양태에서, 세포질체는 약 24 내지 약 48시간 동안 생존가능하다. 일부 실시양태에서, 세포질체는 약 48 내지 약 72시간동안 생존가능하다. 일부 실시양태에서, 생존능은 본원에 기술된 바와 같이 트리판 블루 염료 배제를 사용하여 측정된다. 일부 실시양태에서, 생존능은 본원에 기술된 바와 같이 아넥신-5 세포 표면 염색을 사용하여 측정된다.
본원에 기술된 세포질체는 주어진 치료 적용에 가장 적합하도록 광범위하게 조작된다. 예를 들어, 세포질체는 표적 병원체에 의한 세포질체의 감염을 증가시키는 (예컨대, 세포 표면 수용체로) 조작된다. 일부 실시양태에서, 세포질체는 백신으로서 사용하기 위한 약독화된 바이러스 항원 또는 급성 바이러스 감염을 치료하는 데 사용하기 위한 항바이러스 항체를 발현하도록 조작된다. 또 다른 예에서, 세포질체는 어려운 조직(예컨대, 근육)을 특이적으로 표적화하는 단백질, 및 활성제, 예컨대, 약독화된 바이러스 항원 또는 항바이러스 항체를 생산하거나 발현하도록 조작된다. 추가로, 일부 실시양태에서, 세포질체는 숙주에서 항원 반응을 피하기 위해 면역 회피 모이어티(예컨대, CD34+)로 조작된다. 세포질체는 또한 세포 귀소, 케모카인 감지 및 주로 이환된 부위에서 손상된 조직을 표적화하는 데 필수적인 다른 생물학적 기능에 사용되는 세포 표면 수용체(예컨대, 부착 분자, 케모카인 수용체)를 발현하도록 조작된다.
일부 실시양태에서, 세포질체는 1시간 미만 내지 14일(예컨대, 1시간 미만 내지 1시간, 1시간 미만 내지 6시간, 6시간 내지 12시간, 12시간 내지 1일, 1일, 2일, 3일, 4일, 5,일, 6일, 7일, 8일, 9일, 10일, 11일, 13일, 14일, 1 내지 14일, 1 내지 12일, 1 내지 10일, 1 내지 9일, 1 내지 8일, 1 내지 7일, 1 내지 6일, 1 내지 5일, 1 내지 4일, 1 내지 3일, 1 내지 2일, 2 내지 14일, 2 내지 12일, 2 내지 10일, 2 내지 8일, 2 내지 7일, 2 내지 6일, 2 내지 5일, 2 내지 4일, 2 내지 3일, 3 내지 14일, 3 내지 12일, 3 내지 10일, 3 내지 8일, 3 내지 7일, 3 내지 6일, 3 내지 5일, 3 내지 4일, 4 내지 14일, 4 내지 12일, 4 내지 10일, 4 내지 8일, 4 내지 7일, 4 내지 6일, 4 내지 5일, 4 내지 7일, 5 내지 14일, 5 내지 12일, 5 내지 10일, 5 내지 8일, 5 내지 7일, 5 내지 6일, 6 내지 14일, 6 내지 12일, 6 내지 10일, 6 내지 8일, 6 내지 7일, 7 내지 14일, 7 내지 12일, 7 내지 10일, 7 내지 8일, 8 내지 14일, 8 내지 12일, 8 내지 10일, 10 내지 14일, 10 내지 12일, 12 내지 14일 미만, 14일 미만, 12일 미만, 10일 미만, 8일 미만, 7일 미만, 6일 미만, 5일 미만, 4일 미만, 3일 미만, 2일 미만, 1일 미만, 12시간 미만, 또는 6시간 미만)의 정의된 수명을 갖는다. 일부 실시양태에서, 세포질체 집단의 수명은 세포질체 집단 중 일부(예컨대, 집단 중 적어도 50%, 적어도 60% 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 98%)가 사멸된 것으로 결정된 평균 시간을 측정함으로써 평가될 수 있다. 세포 사멸은 당업계에 공지된 임의의 방법에 의해 결정될 수 있다. 일부 실시양태에서, 예컨대, 하나 이상의 시점에서 세포질의 생존능은 (예컨대, 트립판 블루 염료 배제에 의해, 무손상 세포막에 대한 평가함으로써, (예컨대, 부착성 세포질체에서) 플라스틱에의 부착을 평가함으로써, 세포질체 이동을 평가함으로써, 아폽토시스 마커를 사용한 음성 염색 등에 의해) 형태학적 또는 기능적 파라미터가 무손상인지 여부를 측정함으로써 평가될 수 있다. 일부 실시양태에서, 세포질체의 수명은 그의 수득 기점이 된 세포의 수명과 관련될 수 있다. 예를 들어, 일부 실시양태에서, 대식세포로부터 수득된 세포질체는 12 내지 24시간 동안 생존할 수 있다.
일부 실시양태에서, 세포질체의 직경은 1 ㎛ 이상이다. 일부 실시양태에서, 세포질체의 직경은 1 ㎛ 초과이다. 일부 실시양태에서, 세포질체의 직경은 1-100 ㎛(예컨대, 1- 90 ㎛, 1-80 ㎛, 1-70 ㎛, 1-60 ㎛, 1-50 ㎛, 1-40 ㎛, 1-30 ㎛, 1-20 ㎛, 1-10 ㎛, 1-5 ㎛, 5- 90 ㎛, 5-80 ㎛, 5-70 ㎛, 5-60 ㎛, 5-50 ㎛, 5-40 ㎛, 5-30 ㎛, 5-20 ㎛, 5-10 ㎛, 10-90 ㎛, 10-80 ㎛, 10-70 ㎛, 10-60 ㎛, 10-50 ㎛, 10-40 ㎛, 10-30 ㎛, 10-20 ㎛, 10-15 ㎛ 15-90 ㎛, 15-80 ㎛, 15-70 ㎛, 15-60 ㎛, 15-50 ㎛, 15-40 ㎛, 15-30 ㎛, 15-20 ㎛)이다. 일부 실시양태에서, 세포질체의 직경은 10-30 ㎛이다. 일부 실시양태에서, 세포질체의 직경은 5-25 ㎛(예컨대, 5-20 ㎛, 5-15 ㎛. 5-10 ㎛, 10-25 ㎛, 10-20 ㎛, 10-15 ㎛, 15-25 ㎛, 15-20 ㎛, 또는 20-25 ㎛)이다. 일부 실시양태에서, 세포질체는 엑소좀이 아니다. 임의의 특정 이론에 얽매이지 않고, 일부 실시양태에서, 일부 세포질체는 유리하게는 더 나은 생체분포를 허용하거나, 피험체의 폐에 포획될 가능성이 더 작을 만큼 충분히 작을 수 있다고 간주된다.
일부 실시양태에서, 세포질체는 그의 특성을 변경하기 위해 세포(예컨대, 이종배양된 세포)에 적용되거나, 또는 그와 함께 배양될 수 있다. 예를 들어, 일부 실시양태에서, 세포질체(예컨대, 조작되지 않은 세포질체 또는 조작된 세포질체)는 이종배양된 세포에서 건강 증진 인자를 상향조절할 수 있고, 일부 실시양태에서, 이종배양된 세포는 그가 채취된 피험체에게 반환될 수 있다.
A. 세포
본원에서는 본 개시내용의 세포질체를 생산하도록 조작된 세포 및 세포주를 제공한다. 세포질체는 상응하는 모세포, 예컨대, 유핵 모세포로부터 유래될 수 있다. 모세포의 비제한적 예로는 불멸화 세포, 암세포(예를 들어, 임의의 암세포), 1차(예를 들어, 숙주 유래) 세포, 또는 세포주를 포함한다. 일부 실시양태에서, 세포로부터 유래된 모세포는 예컨대, 문헌 [Huang et al., J. Exp. Clin. Med. 2010 Oct. 22l 2(5):202-217]에 기술된 것과 같은 적합한 방법을 이용하여 불멸화된다. 일부 실시양태에서, 세포질체는 미국 특허 출원 제16/715,859호(상기 특허는 그 전문이 본원에서 참조로 포함된다)에 제공된 적합한 방법을 사용하여 모세포로부터 유래된 것이다.
일부 실시양태에서, 세포는 하나 이상의 세포를 갖는 임의의 유기체로부터 유래할 수 있다. 일부 비제한적인 예에는 원핵 세포, 진핵 세포, 박테리아 세포, 고세균 세포, 단세포 진핵 유기체의 세포, 원생동물 세포, 식물 세포, 조류 세포, 진균 세포, 동물 세포, 무척추 동물의 세포, 척추 동물의 세포, 포유동물(예컨대, 돼지, 소, 염소, 양, 설치류, 래트, 마우스, 인간이 아닌 영장류, 인간 등)의 세포 등을 포함한다. 일부 실시양태에서, 세포는 체세포이다. 일부 실시양태에서, 세포는 줄기 세포 또는 전구 세포이다. 일부 실시양태에서, 세포는 중간엽 줄기 또는 전구 세포이다. 일부 실시양태에서, 세포는 중간엽 간질 세포이다. 세포는 하나 이상의 세포를 가진 임의의 유기체에서 유래할 수 있다.
세포의 일부 비제한적인 예에는 원핵 세포, 진핵 세포, 박테리아 세포, 고세균 세포, 단세포 진핵 유기체의 세포, 원생동물 세포, 식물 세포(예컨대, 식물 작물, 과일, 야채, 곡물, 대두, 옥수수(corn), 옥수수(maize), 밀, 씨앗, 토마토, 쌀, 카사바, 사탕수수, 호박, 건초, 감자, 목화, 대마초, 담배, 현화 식물, 침엽수, 겉씨 식물, 양치류, 석송, 뿔풀, 우산이끼, 이끼), 조류 세포(예컨대, 보트리오코커스 브라우니(Botryococcus braunii), 클라미도모나스 레인하티(Chlamydomonas reinhardtii), 나노클로롭시스 가디타나(Nannochloropsis gaditana), 클로렐라 피레노이도사(Chlorella pyrenoidosa), 사르가숨 파텐스 C. 아가르드(Sargassum patens C. Agardh) 등), 해조류(예컨대, 해조), 진균 세포(예컨대, 효모세포, 버섯 세포), 동물 세포, 무척추 동물 세포(예컨대, 초파리, 자포동물, 극피동물, 선충류 등), 척추동물 세포(예컨대, 어류, 양서류, 파충류, 조류, 포유동물), 포유동물(예컨대, 돼지, 소, 염소, 양, 설치류, 래트, 마우스, 인간이 아닌 영장류, 인간 등) 세포 등을 포함한다. 종종, 세포는 천연 유기체에서 유래하지 않은 것이다(예컨대, 세포는 합성에 의해 제조될 수 있으며, 이는 종종 인공 세포로 명명). 일부 실시양태에서, 세포는 체세포이다. 일부 실시양태에서, 세포는 줄기 세포 또는 전구 세포이다. 일부 실시양태에서, 세포는 중간엽 줄기 또는 전구 세포이다. 일부 실시양태에서, 세포는 조혈 줄기 또는 전구 세포이다. 일부 실시양태에서, 세포는 근육 세포, 피부 세포, 혈액 세포, 또는 면역 세포이다. 다른 예시적인 세포는 림프 세포, 예컨대, B 세포, T 세포(세포독성 T 세포, 자연 살해 T 세포, 조절 T 세포, T 헬퍼 세포), 자연 살해 세포, 사이토카인 유도 살해(CIK: cytokine induced killer) 세포; 골수 세포, 예컨대, 과립구(호염구 과립구, 호산구 과립구, 호중구 과립구/과분절 호중구), 단핵구/대식세포, 적혈구(망상적혈구), 비만 세포, 혈소판/거핵구, 수지상 세포와 같은 골수 세포; 갑상선(갑상선 상피 세포, 소포곁세포), 부갑상선(부갑상선 주 세포, 호산성 세포), 부신(크롬친화성 세포), 송과체(솔방울샘세포) 세포를 포함하는 내분비계 세포; 신경교 세포(성상, 미세아교세포), 거대세포 신경분비 세포, 성상세포, 뵈처 세포, 및 뇌하수체(고나도트로프, 코르티코트로프, 소마토트로프, 락토트로프)를 포함하는 신경계의 세포; 폐포세포(타입 I 폐포세포, 타입 II 폐포세포), 클라라 세포, 배상 세포, 먼지 세포를 포함하는 호흡계 세포; 심근세포, 혈관주위세포를 포함하는 순환계 세포; 위(위장 세포, 정수리 세포), 배상 세포, 파네스 세포, G 세포, D 세포, ECL 세포, I 세포, K 세포, S 세포를 포함하는 소화계 세포; 장염색세포, APUD 세포, 간(간세포, 쿠퍼 세포), 연골/뼈/근육을 포함하는 장내분비 세포; 조골세포, 골세포, 파골세포, 치아(백아질모세포, 에나멜 모세포)를 포함하는 뼈 세포; 연골모세포, 연골세포를 포함하는 연골 세포; 트리코사이트, 케라티노사이트, 멜라닌세포(모반 세포)를 포함한 피부 세포; 근세포를 포함하는 근육 세포; 족세포, 사구체 인접 세포, 사구체내 간질 세포/사구체외 간질 세포 세포, 신장 근위 세뇨관 브러시 경계 세포, 황반 조밀 세포를 포함하는 비뇨계 세포; 정자, 세르톨리 세포, 라이디히 세포, 난자를 포함하는 생식계 세포; 및 다른 세포, 지방세포, 섬유아세포, 힘줄 세포, 표피 각질세포(분화 표피 세포), 표피 기저 세포(줄기 세포), 손톱 및 발톱의 각질 세포, 손톱 바닥 기저 세포(줄기 세포), 수질 모간 세포, 피질 모간 세포, 표피 모간 세포, 표피 모근 초세포, 헉슬리층의 모근 초세포, 헨레층의 모근 초세포, 외부 모근 초세포, 모발 기질세포(줄기세포), 습식 중층 장벽 상피 세포, 각막, 혀, 구강, 식도, 항문관, 원위 요도 및 질의 중층 편평 상피의 표면 상피 세포, 각막, 혀, 구강, 식도, 항문관, 원위 요도 및 질의 상피의 기저 세포(줄기 세포), 요로상피세포(방광과 요관 내막), 외분비 상피 세포, 침샘 점액 세포(다당류가 풍부한 분비물), 침샘 장액 세포(당단백질 효소가 풍부한 분비물), 혀의 폰 에브너선 세포(미뢰 세척액), 유선 세포(젖 분비), 눈물샘 세포(눈물 분비), 귀의 귀지샘 세포(왁스 분비), 에크린 땀샘 암 세포(당단백질 분비), 에크린 땀샘 투명 세포(소분자 분비), 아포크린 땀샘 세포(냄새 분비, 성호르몬 민감), 눈꺼풀의 몰 세포(분화된 땀샘), 피지선 세포(지질이 풍부한 피지 분비), 코의 보우만샘 세포(후각 상피 세척), 브루너선 십이지장 세포(효소 및 알칼리성 점액), 정낭 세포(정액 수영을 위한 프럭토스 포함한 정액 성분 분비), 전립선 세포(정액 성분 분비), 구도샘 세포(점액 분비), 바르톨린선 세포(질 활택제 분비), 분비샘 세포(점액 분비), 자궁내막 세포(탄수화물 분비), 호흡기 및 소화관의 분리된 배상 세포(점액 분비), 위 내벽 점액 세포(점액 분비), 위샘 자이모겐 세포(펩시노겐 분비), 위선 산소 세포(염산 분비), 췌장 포상 세포(중탄산염 및 소화 효소 분비), 소장 파네스 세포(리소자임 분비), 폐의 타입 II 폐포세포(계면활성제 분비), 폐의 클라라 세포, 호르몬 분비 세포, 뇌하수체 전엽 세포, 소마토트로프, 락토트로프, 티로트로프, 고나도트로프, 코르티코트로프, 뇌하수체 중엽 세포, 거대세포 신경분비 세포, 소화관 및 기도 세포, 갑상선 세포, 갑상선 상피 세포, 소포곁세포 세포, 부갑상선 세포, 부갑상선 주 세포, 산소 세포, 부신 세포, 크로마핀 세포, 고환의 라이디히 세포, 난포의 내층 세포, 파열된 난포의 황체 세포, 과립구 루테인 세포, 테카 루테인 세포, 사구체 인접 세포(레닌 분비), 신장의 황반 조밀 세포, 대사 및 저장 세포, 장벽 기능 세포(폐, 장, 외분비선 및 비뇨생식기 관), 신장, 타입 I 폐포세포(폐의 내벽 공기 공간), 췌관 세포(샘꽈리중심세포), 민무늬관 세포(땀샘, 침샘, 유선 등), 도관 세포(정낭, 전립선 등), 닫힌 내부 체강을 둘러싸고 있는 상피 세포, 추진 기능이 있는 섬모 세포, 세포외 기질 분비 세포, 수축성 세포; 골격근 세포, 줄기 세포, 심장 근육 세포, 혈액 및 면역계 세포, 적혈구(적혈구), 거핵구(혈소판 전구체), 단핵구, 결합 조직 대식세포(다양한 유형), 표피 랑게르한스 세포, 파골세포(골내), 수지상 세포(림프 조직 내), 미세아교세포(중추 신경계내), 호중구 과립구, 호산구 과립구, 호염기구 과립구, 비만 세포, 헬퍼 T 세포, 억제 T 세포, 세포독성 T 세포, 자연 살해 T 세포, B 세포, 자연 살해 세포, 망상적혈구, 줄기 세포 및 혈액 및 면역계 수임 전구체(다양한 유형), 만능 줄기 세포, 전능 줄기 세포, 유도 만능 줄기 세포, 성체 줄기 세포, 감각 변환기 세포, 자율 신경 세포, 감각 기관 및 말초 뉴런 지지 세포, 중추 신경계 뉴런 및 신경교 세포, 수정체 세포, 색소 세포, 멜라닌세포, 망막 색소 상피세포, 생식 세포, 난자/난모세포, 정자, 정자세포, 정자세포(정자세포를 위한 줄기세포), 정자, 영양 세포, 난포 세포, 세르톨리 세포(고환내), 흉선 상피 세포, 간질 세포 및 간질 신장 세포를 포함할 수 있다.
진핵 세포의 비제한적인 예는 포유동물(예컨대, 설치류, 인간이 아닌 영장류, 또는 인간), 비포유동물(예컨대, 어류, 조류, 파충류 또는 양서류), 무척추동물, 곤충, 진균, 또는 식물 세포를 포함한다. 일부 실시양태에서, 진핵 세포는 사카로마이세스 세레비지아에(Saccharomyces cerevisiae)와 같은 효모 세포이다. 일부 실시양태에서, 진핵 세포는 예컨대, 포유동물, 조류, 식물 또는 곤충 세포와 같은 고등 진핵생물이다. 일부 실시양태에서, 유핵 세포는 1차 세포이다. 일부 실시양태에서, 유핵 세포는 면역 세포(예컨대, 림프구(예컨대, T 세포, B 세포), 대식세포, 자연 살해 세포, 호중구, 비만 세포, 호염기구, 수지상 세포, 단핵구, 골수 유래 억제 세포, 호산구)이다. 일부 실시양태에서, 유핵 세포는 식세포 또는 백혈구이다. 일부 실시양태에서, 유핵 세포는 줄기 세포(예컨대, 성체 줄기 세포(예컨대, 조혈 줄기 세포, 유방 줄기 세포, 장 줄기 세포, 중간엽 줄기 세포, 내피 줄기 세포, 신경 줄기 세포, 후각 성체 줄기 세포, 신경 능선 줄기 세포, 고환 세포), 배아 줄기 세포, 유도 만능성 줄기 세포 (iPS))이다. 일부 실시양태에서, 유핵 세포는 전구 세포이다. 일부 실시양태에서, 유핵 세포는 세포주로부터의 것이다. 일부 실시양태에서, 유핵 세포는 부유 세포이다. 일부 실시양태에서, 유핵 세포는 부착성 세포이다. 일부 실시양태에서, 유핵 세포는 온코진의 발현에 의해 불멸화된 세포이다. 일부 실시양태에서, 유핵 세포는 인간 텔로머라제 역전사효소(hTERT: human telomerase reverse transcriptase) 또는 임의의 온코진의 발현에 의해 불멸화된다. 일부 실시양태에서, 유핵 세포는 환자 또는 피험체 유래 세포(예컨대, 자가 환자 유래 세포, 또는 동종이계 환자 유래 세포)이다. 일부 실시양태에서, 유핵 세포는 본원에 기술되고, 당업계에 공지된 제핵 기술 중 임의의 것을 사용하는 유핵 세포 제핵 이전에 벡터(예컨대, 바이러스 벡터(예컨대, 레트로바이러스 벡터(예컨대, 렌티바이러스 벡터), 아데노 연관 바이러스(AAV: adeno-associated virus) 벡터, 수포성 바이러스 벡터(예컨대, 수포성 구내염 바이러스(VSV: vesicular stomatitis virus) 벡터), 또는 하이브리드 바이러스 벡터), 플라스미드)로 형질감염된다.
일부 실시양태에서, 세포질체는 피험체의 자가 세포로부터 유래될 수 있다. 일부 실시양태에서, 세포질체는 피험체에 동종이계 세포로부터 유래될 수 있다.
일부 실시양태에서, 세포질체는 면역 세포로부터 유래된다. 일부 실시양태에서, 세포질체는 자연 살해(NK: natural killer) 세포, 호중구, 대식세포, 림프구, 섬유아세포, 성체 줄기 세포(예컨대, 조혈 줄기 세포, 유방 줄기 세포, 장 줄기 세포, 중간엽 줄기 세포, 중간엽 간질 세포, 내피 줄기 세포, 신경 줄기 세포, 후각 성체 줄기 세포, 신경 능선 줄기 세포, 피부 줄기 세포, 또는 고환 세포), 비만 세포, 호염구, 호산구, 또는 유도성 만능 줄기 세포로부터 유래된다.
일부 실시양태에서, 제핵 전에 2개 이상의 세포(예컨대,본원에 개시된 임의의 세포)가 본원에 개시되거나 당업계에 공지된 임의의 방법에 의해 융합된다. 융합 생성물의 제핵 결과로 세포질체가 생성될 수 있다.
일부 실시양태에서, 제1 세포질체는 세포 또는 제2 세포질체에 융합된다. 일부 실시양태에서, 세포는 임의의 유핵 세포(예컨대, 포유동물 세포(예컨대, 인간 세포, 또는 본원에 기술된 임의의 포유동물 세포), 원생동물 세포(예컨대, 아메바 세포), 조류 세포, 식물 세포, 진균 세포, 무척추동물 세포, 어류 세포, 양서류 세포, 파충류 세포, 또는 조류 세포)이다. 일부 실시양태에서, 제2 세포는 합성 세포이다. 따라서, 세포를 본원에 기술된 임의의 세포질체와 융합시키는 단계를 포함하는 세포의 거동을 변경시키는 방법을 제공한다. 또한 본원에서는 세포질체가 융합된 세포를 치료 유효량으로 피험체에게 투여하는 것을 포함하는 방법을 제공한다.
일부 실시양태에서, 제2 세포질체는 제1 세포질체과 동일한 유형의 세포로부터 유래된 것이다. 일부 실시양태에서, 제2 세포질체는 제1 세포질체과 상이한 유형의 세포로부터 유래된 것이다. 일부 실시양태에서, 제2 세포질체는 적어도 하나의 치료 DNA 분자, 치료 RNA 분자, 치료 단백질, 치료 펩티드, 소분자 치료제, 치료 유전자 편집 인자, 치료 나노입자, 또는 제1 세포질체에 함유되어 있거나, 또는 제1 세포질체에 의해 발현되는 치료 DNA 분자, 치료 RNA 분자, 치료 단백질, 치료 펩티드, 소분자 치료제, 치료 유전자 편집 인자, 치료 나노입자와 동일한 또 다른 활성제를 함유하거나, 또는 발현한다. 일부 실시양태에서, 제2 세포질체는 적어도 하나의 치료 DNA 분자, 치료 RNA 분자, 치료 단백질, 치료 펩티드, 소분자 치료제, 치료 유전자 편집 인자, 치료 나노입자, 또는 제1 세포질체에 의해 발현되는 치료 DNA 분자, 치료 RNA 분자, 치료 단백질, 치료 펩티드, 소분자 치료제, 치료 유전자 편집 인자, 치료 나노입자와 상이한 또 다른 활성제를 함유하거나, 또는 발현한다. 일부 실시양태에서, 제1 세포질체는 당업계에 공지된 임의의 방법, 예를 들어, 바이러스-기반 세포 표면 펩티드를 사용한 전기융합 또는 바이러스 융합을 사용하여 세포 또는 제2 세포질체에 융합될 수 있다.
일부 실시양태에서, 세포질체는 자연적으로 발생된 제핵 세포가 아니다. 일부 실시양태에서, 세포질체는 자연적으로 제핵된 세포로부터 수득된 것이 아니다. 일부 실시양태에서, 세포질체는 피험체의 신체에서 제핵된 세포가 아니다. 일부 실시양태에서, 세포질체는 피험체의 신체에서 제핵될 세포로부터 수득된 것이 아니다. 일부 실시양태에서, 세포질체는 적혈구아세포로부터 수득된 것이 아니다. 일부 실시양태에서, 세포질체는 (예컨대, 본원에 기술된 바와 같은 제핵과 같은 조작의 부재하에) 그의 수명 동안 핵을 유지하는 세포로부터 수득된다. 일부 실시양태에서, 세포질체는 무핵 세포(예컨대, 적혈구(적혈구), 혈소판, 수정체 세포, 또는 그의 직계 유핵 전구체)로서 피험체에서 발견되는 세포가 아니다. 일부 실시양태에서, 세포질체는 소포체, 골지체, 미토콘드리아, 리보솜, 프로테아솜 또는 스플라이세오솜으로 구성된 군으로부터 선택되는 하나 이상의 성분을 포함한다. 일부 실시양태에서, 세포질체는 하기 특징: 부착, 터널링 나노튜브 형성, 액틴 매개 스프레딩(2D 및/또는 3D), 이동, 화학유인물질 구배 감지, 미토콘드리아 전달, mRNA 번역, 단백질 합성, 및 엑소좀 및/또는 다른 생체활성 분자의 분비 중 하나 이상의 것을 특징으로 한다. 일부 실시양태에서, 세포질체는 (예컨대, 엑소좀을 사용하여) 단백질을 분비하는 능력을 특징으로 한다. 일부 실시양태에서, 세포질체는 생체외에서 제핵된 것이다. 일부 실시양태에서, 세포질체는 시험관내에서 제핵된 것이다. 일부 실시양태에서, 세포질체는 (예컨대, 원심분리에 의해) 물리적으로 제핵된 것이다. 일부 실시양태에서, 세포질체는 조작된 제핵 세포이다. 일부 실시양태에서, 세포질체는 적혈구가 아니다. 일부 실시양태에서, 세포질체는 헤모글로빈을 함유하지 않는다. 일부 실시양태에서, 세포질체는 양면 오목 형상을 갖지 않는다.
일부 실시양태에서, 세포질체는 적혈구아세포로부터 수득된 것이 아니다. 일부 실시양태에서, 세포질체는 적혈구(RBC)가 되지 않는 세포로부터 수득된 것이다다. RBC와 달리 세포질체는 많은 활성 생물학적 프로세스 및 모든 세포 세포소기관(에컨대, ER/골지체, 미토콘드리아, 엔도솜, 리소솜, 세포골격 등)을 유지할 수 있는 생존가능한 세포 유사 엔티티일 수 있다. 따라서, 세포질체는 유핵 세포처럼 작용할 수 있으며, 예컨대, 부착, 터널링 나노튜브 형성, 액틴 매개 스프레딩(2D 및 3D), 이동, 화학유인물질 구배 감지, 미토콘드리아 전달, mRNA 번역, 단백질 합성, 및 엑소좀 및 다른 생체활성 분자 분비와 같은 중요한 생물학적 기능을 나타낼 수 있다. 이러한 기능 중 하나 이상의 것은 적혈구에 의해 나타나지 않을 수 있다. 적혈구아세포로부터 유래된 RBC와 비교하여, 세포질체는 iPSC(유도 만능 줄기 세포: induced pluripotent stem cell), 임의의 불멸화 세포, 줄기 세포, 1차 세포(예컨대, 숙주 유래 세포), 세포주, 임의의 면역 세포, 암성 세포를 포함하나, 이에 제한되지 않는 임의의 유형의 유핵 세포, 또는 임의의 진핵 세포로부터 유래될 수 있다. 일부 실시양태에서, 세포질체는 림프 전구 세포로부터 수득된다. 일부 실시양태에서, 세포질체는 림프구로부터 수득된다. 일부 실시양태에서, 세포질체는 중간엽 줄기 세포(예컨대, 골수로부터의 것)로부터 수득된다. 일부 실시양태에서, 세포질체는 내피 줄기 세포로부터 수득된다. 일부 실시양태에서, 세포질체는 신경 줄기 세포로부터 수득된다. 일부 실시양태에서, 세포질체 피부 줄기 세포로부터 수득된다.
B. 병원체
일부 실시양태에서, 본원에 기술된 세포질체 및 세포질체를 함유하는 조성물은 병원체를 표적화 및/또는 사멸시키거나, 또는 다르게는 작동불가능하게 만드는 생체분자(예컨대, 백신, 치료제, 표적화 모이어티)를 포함한다. 일부 실시양태에서, 병원체는 박테리아, 바이러스, 진균 또는 독소이다. 일부 실시양태에서, 병원체는 자연적으로 발생된 것이다. 일부 실시양태에서, 병원체는 합성이다.
일부 실시양태에서, 병원체는 바이러스이다. 일부 실시양태에서, 바이러스는 동물 바이러스, 식물 바이러스, 박테리아 바이러스, 또는 고세균 바이러스이다. 일부 실시양태에서, 동물 바이러스는 동일하거나, 또는 상이한 동물에서 질환 또는 병태를 유발한다. 일부 실시양태에서, 바이러스는 RNA 바이러스 또는 DNA 바이러스이다. 일부 실시양태에서, RNA 또는 DNA 바이러스는 단일 가닥 또는 이중 가닥이다. 일부 실시양태에서, DNA 또는 RNA 바이러스는 + 센스 또는 - 센스 바이러스이다.
일부 실시양태에서, 이중 가닥 바이러스(dsDNA) 바이러스는 미오비리대(Myoviridae) 과, 포도비리대(Podoviridae) 과, 시포비리대(Siphoviridae) 과, 알로헤르페스비리대(Alloherpesviridae) 과, 헤르페스비리대(Herpesviridae) 과, 말라코헤르페스비리대(Malacoherpesviridae) 과, 리포트릭스비리대(Lipothrixviridae) 과, 루디비리대(Rudiviridae) 과, 아데노비리대(Adenoviridae) 과, 암풀라비리대(Ampullaviridae) 과, 아스코비리대(Ascoviridae) 과, 아스파비리대(Asfaviridae) 과, 배큘로비리대(Baculoviridae) 과, 비카우다비리대(Bicaudaviridae) 과, 클라바비리대(Clavaviridae) 과, 코르티코비리대(Corticoviridae) 과, 푸셀로비리대(Fuselloviridae) 과, 글로불로비리대(Globuloviridae) 과, 구타비리대(Guttaviridae) 과, 히트로사비리대(Hytrosaviridae) 과, 이리도비리대(Iridoviridae) 과, 마르세일레비리대(Marseilleviridae) 과, 미미비리대(Mimiviridae) 과, 니마비리대(Nimaviridae) 과, 판도라비리대(Pandoraviridae) 과, 파필로마비리대(Papillomaviridae) 과, 피코드나비리대(Phycodnaviridae) 과, 플라스마비리대(Plasmaviridae) 과, 폴리드나바이러스(Polydnaviruse) 과, 폴리오마비리대(Polyomaviridae) 과, 폭스비리대(Poxviridae) 과, 스파에로리포비리대(Sphaerolipoviridae) 과, 및 텍티비리대(Tectiviridae) 과로부터의 것이다.
일부 실시양태에서, 단일 가닥(ssDNA) 바이러스는 아넬로비리대(Anelloviridae) 과, 바실라리오드나비리대(Bacillariodnaviridae) 과, 비드나비리대(Bidnaviridae) 과, 써코비리대(Circoviridae) 과, 게미니비리대(Geminiviridae) 과, 이노비리대(Inoviridae) 과, 마이크로비리대(Microviridae) 과, 나노비리대(Nanoviridae) 과, 파보비리대(Parvoviridae) 과, 및 스피라비리대(Spiraviridae) 과로부터의 것이다.
ss 및 ds DNA 영역 모두를 함유하는 DNA 바이러스는 플레오리포바이러스 군으로부터 유래할 수 있다. 일부 실시양태에서, 플레오리포바이러스는 할로아르쿨라 히스패니카(Haloarcula hispanica) 다형 바이러스 1, 할로게노메트리쿰(Halogeometricum) 다형 바이러스 1, 할로루브룸(Halorubrum) 다형 바이러스 1, 할로루브룸 다형 바이러스 2, 할로루브룸 다형 바이러스 3, 및 할로루브룸 다형 바이러스 6을 포함한다.
일부 실시양태에서, dsRNA 바이러스는 비르나비리대(Birnaviridae) 과, 크르소비리대(Chrysoviridae) 과, 시스토비리대(Cystoviridae) 과, 엔도나비리대(Endornaviridae) 과, 히포비리대(Hypoviridae) 과, 메가비나비리대(Megavirnaviridae) 과, 파티티비리대(Partitiviridae) 과, 피코비나비리대(Picobirnaviridae) 과, 레오비리대(Reoviridae) 과, 로타바이러스 과 및 토티비리대(Totiviridae) 과로부터의 것이다.
일부 실시양태에서, + 센스 ssRNA 바이러스는 알파플렉시비리대(Alphaflexiviridae) 과, 알파테트라비리대(Alphatetraviridae) 과, 알베나비리대(Alvernaviridae) 과, 아르테리비리대(Arteriviridae) 과, 아스트로비리대(Astroviridae) 과, 바나비리대(Barnaviridae) 과, 베타플렉시비리대(Betaflexiviridae) 과, 브로모비리대(Bromoviridae) 과, 카리시비리대(Caliciviridae) 과, 카르모테트라비리대(Carmotetraviridae) 과, 클로스테로비리대(Closteroviridae) 과, 코로나비리대(Coronaviridae) 과, 디시스트로비리대(Dicistroviridae) 과, 플라비비리대(Flaviviridae) 과, 감마플렉시비리대(Gammaflexiviridae) 과, 이플라비리대(Iflaviridae) 과, 레비비리대(Leviviridae) 과, 루테오비리대(Luteoviridae) 과, 마르나비리대(Marnaviridae) 과, 메소니비리대(Mesoniviridae) 과, 나나비리대(Narnaviridae) 과, 노다비리대(Nodaviridae) 과, 페르무토테트라비리대(Permutotetraviridae) 과, 피코나비리대(Picornaviridae) 과, 포티비리대(Potyviridae) 과, 로니비리대(Roniviridae) 과, 세코비리대(Secoviridae) 과, 토가비리대(Togaviridae) 과, 톰부스비리대(Tombusviridae) 과, 티모비리대(Tymoviridae) 과, 및 비가비리대(Virgaviridae) 과로부터의 것일 수 있다.
일부 실시양태에서, - 센스 ssRNA 바이러스는 보나비리대(Bornaviridae) 과, 필로비리대(Filoviridae) 과, 파라믹소비리대(파라믹소viridae) 과, 랍도비리대(Rhabdoviridae) 과, 니아미비리대(Nyamiviridae) 과, 아레나비리대(Arenaviridae) 과, 분야비리대(Bunyaviridae) 과, 오피오비리대(Ophioviridae) 과, 및 오르토믹소비리대(Orthomyxoviridae) 과로부터의 것일 수 있다.
바이러스의 비제한적인 예로는 아벨손 백혈병 바이러스, 아벨손 뮤린 백혈병 바이러스, 아벨손 바이러스, 급성 후두기관기관지염 바이러스, 애들레이드 리버 바이러스, 아데노 연관 바이러스 군, 아데노바이러스, 아프리카 말 병 바이러스, 아프리카 돼지 열 바이러스, AIDS 바이러스, 알류샨 밍크 병 파보바이러스, 알파레트로바이러스, 알파바이러스, ALV 관련 바이러스, 아마파리바이러스, 아프토바이러스, 아쿠아레오바이러스, 아르보바이러스, 아르보바이러스 C, 아르보바이러스 군 A, 아르보바이러스 군 B, 아레나바이러스 군, 아르헨티나 출혈 열 바이러스, 아르헨티나 출혈 열 바이러스, 아르테리바이러스, 아스트로바이러스, 아텔린 헤르페스바이러스 군, 아우제스키병 바이러스, 아우라바이러스, 아우스둑병 바이러스, 호주 박쥐 리사바이러스, 아비아데노모세포증, 조류 적혈구아세포증 바이러스, 조류 감염성 기관지염 바이러스, 조류 백혈병 바이러스, 조류 백혈증 바이러스, 조류 림프종증 바이러스, 조류 골수모세포 백혈증 바이러스, 조류 파라믹소바이러스, 조류 폐렴뇌염 바이러스, 조류 세망내피증 바이러스, 조류 육종 바이러스, 조류 C형 레트로바이러스 군, 아비헤파드나바이러스, 아피복스바이러스, B 바이러스, B19 바이러스, 바반키 바이러스, 개코원숭이 헤르페스바이러스, 배큘로바이러스, 바마 포레스트 바이러스, 베바루바이러스, 베리마바이러스, 베타레트로바이러스, 비나바이러스, 비트너 바이러스, BK 바이러스, 블랙 크릭 카날 바이러스, 청설 바이러스, 볼리비아 출혈 열 바이러스, 보마병 바이러스, 양 바이러스 국경병, 보나바이러스, 소 알파헤르페스바이러스 1, 소 알파헤르페스바이러스 2, 소 코로나 바이러스, 소 유행 열 바이러스, 소 면역결핍 바이러스, 소 백혈병 바이러스, 소 백혈증 바이러스, 소 유선염 바이러스, 소 유두종바이러스, 소 구진 구내염 바이러스, 소 파보바이러스, 소 세포융합 바이러스, 소 C형 온코바이러스, 소 바이러스 설사 바이러스, 버기 크릭 바이러스, 총알 모양의 바이러스 그룹, 부냠웨라 바이러스 상위군, 분야바이러스, 버킷 림프종 바이러스, 브왐바 열, CA 바이러스, 카리시바이러스, 캘리포니아 뇌염 바이러스, 낙타 두창 바이러스, 카나리아 두창 바이러스, 개과 헤르페스바이러스, 개 코로나 바이러스, 개 홍역 바이러스, 개 헤르페스바이러스, 개 미닛 바이러스, 개 파보바이러스, 카노 델가디토 바이러스, 염소 관절염 바이러스, 염소 뇌염 바이러스, 염소 헤르페스바이러스, 염소두창 바이러스, 카디오바이러스, 카비드 헤르페스바이러스 1, 세르코피테시드 헤르페스바이러스 1, 세르코피테신 헤르페스바이러스 1, 세르코피테신 헤르페스바이러스 2, 찬디푸라 바이러스, 창귀놀라 바이러스, 얼룩메기류 바이러스, 샤를빌 바이러스, 수두 바이러스, 치쿤구니야 바이러스, 침팬지 헤르페스바이러스, 처브 레오바이러스, 백 연어 바이러스, 코칼 바이러스, 은연어 레오바이러스, 성교 구진 바이러스, 콜로라도 진드기열 바이러스, 콜티바이러스, 콜롬비아 SK 바이러스, 감기 바이러스, 전염성 농창 바이러스, 전염성 농포성 피부염 바이러스, 코로나바이러스, 코리파르타 바이러스, 코리자 바이러스, 우두 바이러스, 콕사키 바이러스, CPV(세포질 다면체형성 바이러스: cytoplasmic polyhedrosis virus), 귀뚜라미 마비 바이러스, 크림-콩고 출혈 열 바이러스, 크룹 연관 바이러스, 크립토바이러스, 사이포바이러스, 사이토메갈로바이러스, 사이토메갈로바이러스 군, 세포질 다면체형성 바이러스, 사슴 유두종바이러스, 델타레트로바이러스, 뎅기 바이러스, 덴소바이러스, 디펜도바이러스, 도리 바이러스, 디플로마 바이러스, 드로소필라 C 바이러스, 오리 B형 간염 바이러스, 오리 간염 바이러스 1, 오리 간염 바이러스 2, 듀오바이러스, 듀벤헤이즈 바이러스, 변형 날개 바이러스 DWV, 동부 말 뇌염 바이러스, 동부 말 뇌염 바이러스, EB 바이러스, 에볼라 바이러스, 에볼라 유사 바이러스, 에코 바이러스, 에코바이러스, 에코바이러스 10, 에코바이러스 28, 에코바이러스 9, 사지결손증 바이러스, EEE 바이러스, EIA 바이러스, EIA 바이러스, 뇌염 바이러스, 뇌심근염 군 바이러스, 뇌심근염 바이러스, 엔테로바이러스, 효소 상승 바이러스, 상승 바이러스(LDH), 유행성 출혈열 바이러스, 가축 유행성 출혈 병 바이러스, 엡스테인-바 바이러스, 말과 알파헤르페스바이러스 1, 말과 알파헤르페스바이러스 4, 말과 헤르페스바이러스 2, 말 유산 바이러스, 말 동맥염 바이러스, 말 뇌병변 바이러스, 말 감염성 빈혈 바이러스, 말 모르빌리바이러스, 말 비폐렴 바이러스, 말 리노바이러스, 유베난구 바이러스, 유럽 엘크 유두종바이러스, 유럽 돼지 열 바이러스, 에버글레이즈 바이러스, 이야크 바이러스, 고양이과 헤르페스바이러스 1, 고양이 칼리시바이러스, 고양이 섬유육종 바이러스, 고양이 헤르페스바이러스, 고양이 면역결핍 바이러스, 고양이 감염성 복막염 바이러스, 고양이 백혈병/육종 바이러스, 고양이 백혈병 바이러스, 고양이 범백혈구감소증 바이러스, 고양이 파보바이러스, 고양이 육종 바이러스, 고양이 세포융합 바이러스, 필로바이러스, 플란더스 바이러스, 플라비바이러스, 수족구병 바이러스, 포트 모간 바이러스, 포 코너스 한타바이러스, 가금류 아데노바이러스 1, 가금류 두창 바이러스, 프리엔드 바이러스, 감마레트로바이러스, GB 간염 바이러스, GB 바이러스, 풍진 바이러스, 제타 바이러스, 긴팔원숭이 백혈병 바이러스, 선열 바이러스, 염소 두창 바이러스, 황금잉어 바이러스, 고노메타 바이러스, 거위 파보바이러스, 과립증 바이러스,그로스 바이러스, 얼룩 다람쥐 간염 B 바이러스, 군 A 아르보바이러스, 구아나리토 바이러스, 기니아 피그 사이토메갈로바이러스, 기니아 피그 C형 바이러스, 한타안 바이러스, 한타바이러스, 대합조개 레오바이러스, 산토끼 섬유종 바이러스, HCMV(인간 사이토메갈로바이러스), 혈구흡착 바이러스 2, 일본 혈구응집 바이러스, 출혈 열 바이러스, 헨드라 바이러스, 헤니파바이러스, 헤파드나바이러스, A형 간염 바이러스, B형 간염 바이러스 군, 간염 C 바이러스, 간염 D 바이러스, 간염 델타바이러스, 간염 E 바이러스, 간염 F 바이러스, 간염 G 바이러스, 간염 비A 비B 바이러스, 간염 바이러스, 간염 바이러스(비인간), 간뇌척수염 레오바이러스 3, 헤파토바이러스, 왜가리 간염 B 바이러스, 헤르페스 B 바이러스, 단순 헤르페스 바이러스, 단순 헤르페스 바이러스 1, 단순 헤르페스 바이러스 2, 헤르페스바이러스, 헤르페스바이러스 7, 헤르페스바이러스 아텔레스, 헤르페스바이러스 호미니스, 헤르페스바이러스 감염, 헤르페스바이러스 사이미리, 헤르페스바이러스 수이스, 수두 헤르페스바이러스, 하이랜즈 J 바이러스, 히람 랍도바이러스, 돼지 콜레라 바이러스, 인간 아데노바이러스 2, 인간 알파헤르페스바이러스 1, 인간 알파헤르페스바이러스 2, 인간 알파헤르페스바이러스 3, 인간 B 림프친화성 바이러스, 인간 베타헤르페스바이러스 5, 인간 코로나 바이러스, 인간 사이토메갈로바이러스 군, 인간 기포형 바이러스, 인간 감마헤르페스바이러스 4, 인간 감마헤르페스바이러스 6, 인간 A형 간염 바이러스, 인간 헤르페스바이러스 1 군, 인간 헤르페스바이러스 2 군, 인간 헤르페스바이러스 3 군, 인간 헤르페스바이러스 4 군, 인간 헤르페스바이러스 6, 인간 헤르페스바이러스 8, 인간 면역결핍 바이러스, 인간 면역결핍 바이러스 1, 인간 면역결핍 바이러스 2, 인간 유두종바이러스, 인간 T 세포 백혈병 바이러스, 인간 T 세포 백혈병 바이러스 I, 인간 T 세포 백혈병 바이러스 II, 인간 T 세포 백혈병 바이러스 III, 인간 T 세포 림프종 바이러스 I, 인간 T 세포 림프종 바이러스 II, 인간 T 세포 림프친화성 바이러스 타입 1, 인간 T 세포 림프친화성 바이러스 타입 2, 인간 T 림프친화성 바이러스 I, 인간 T 림프친화성 바이러스 II, 인간 T 림프친화성 바이러스 III, 이크노바이러스, 유아 위장염 바이러스, 감염성 소 비기관염 바이러스, 감염성 조혈 괴사 바이러스, 감염성 췌장 괴사 바이러스, 인플루엔자 바이러스 A, 인플루엔자 바이러스 B, 인플루엔자 바이러스 C, 인플루엔자 바이러스 D, 인플루엔자 바이러스 pr8, 곤충 무지개 바이러스, 곤충 바이러스, 이리도바이러스, 일본 B 바이러스, 일본 뇌염 바이러스, JC 바이러스, 주닌 바이러스, 카포시 육종 연관 헤르페스바이러스, 케메로보 바이러스, 킬햄 래트 바이러스, 클라매쓰 바이러스, 콜롱고 바이러스, 한국 출혈 열 바이러스, 쿰바 바이러스, 키사누르 포레스트 질환 바이러스, 키질아가크 바이러스, 라 크로스 바이러스, 락트산 탈수소효소 상승 바이러스, 락트산 탈수소효소 바이러스, 라고스 박쥐 바이러스, 랑구르 바이러스, 라핀 파보바이러스, 라사(Lassa) 열 바이러스, 라사 바이러스, 잠복 래트 바이러스, LCM 바이러스, 리키 바이러스, 렌티바이러스, 레포리폭스바이러스, 백혈병 바이러스, 류코바이러스, 덩어리 피부병 바이러스, 림프절병증 연관 바이러스, 림포크립토바이러스, 림프구 맥락막염 바이러스, 림프증식성 바이러스 군, 마추포(Machupo) 바이러스, 광 소양증 바이러스, 포유동물 타입 B 온코바이러스 군, 포유동물 타입 B 레트로바이러스, 포유동물 타입 C 레트로바이러스 군, 포유동물 타입 D 레트로바이러스, 유선 종양 바이러스, 마푸에라 바이러스, 마버그(Marburg) 바이러스, 마버그 유사 바이러스, 마손 화이자 원숭이 바이러스, 마스트아데노바이러스, 마야로 바이러스, ME 바이러스, 홍역 바이러스, 멘앵글 바이러스, 멘고 바이러스, 멘고바이러스, 미들부르그 바이러스, 착유부결절 바이러스, 밍크 장염 바이러스, 마우스 미닛 바이러스, MLV 관련 바이러스, MM 바이러스, 모콜라 바이러스, 몰루스시폭스바이러스, 전염성 연속종 바이러스, 원숭이 B 바이러스, 원숭이 두창 바이러스, 모노네가비랄레스, 모르빌리바이러스, 마운트 엘곤 박쥐 바이러스, 마우스 사이토메갈로바이러스, 마우스 뇌척수염 바이러스, 마우스 간염 바이러스, 마우스 K 바이러스, 마우스 백혈병 바이러스, 마우스 유선 종양 바이러스, 마우스 미닛 바이러스, 마우스 폐렴 바이러스, 마우스 소아마비 바이러스, 마우스 폴리오마바이러스, 마우스 육종 바이러스, 마우스 두창 바이러스, 모잠비크 바이러스, 무캄보 바이러스, 점막 질환 바이러스, 볼거리 바이러스, 설치류 베타헤르페스바이러스 1, 설치류 사이토메갈로바이러스 2, 뮤린 사이토메갈로바이러스 군, 뮤린 뇌척수염 바이러스, 뮤린 간염 바이러스, 뮤린 백혈병 바이러스, 뮤린 결절 유도 바이러스, 뮤린 폴리오마바이러스, 뮤린 육종 바이러스, 뮤로메갈로바이러스, 뮤레이 발리 뇌염 바이러스, 점액종 바이러스, 믹소바이러스, 다형성 믹소바이러스, 볼거리 믹소바이러스, 나이로비 양 질환 바이러스, 나이로바이러스, 나니르나바이러스, 나리바바이러스, 엔듀모 바이러스, 니틀링 바이러스, 넬슨 베이 바이러스, 신경친화성 바이러스, 뉴 월드 아레나바이러스, 신생아 폐렴 바이러스, 뉴캐슬병 바이러스, 니파 바이러스, 비세포병원성 바이러스, 노르웍 바이러스, 핵 다면체형성 바이러스(NPV: nuclear polyhedrosis virus), 유두 목 바이러스, 오뇽뇽 바이러스, 옥켈보 바이러스, 종양발생성 바이러스, 종양발생성 바이러스 유사 입자, 온코르나바이러스, 오르비바이러스, Orf 바이러스, 오로포우치 바이러스, 오르토헤파드나바이러스, 오르토믹소바이러스, 오르토폭스바이러스, 오르토레오바이러스, 오룬고, 양과 유두종바이러스, 양과 카타르 열 바이러스, 올빼미 원숭이 헤르페스바이러스, 필리얌 바이러스, 유두종바이러스, 유두종바이러스 실빌라기, 파포바바이러스, 파라인플루엔자 바이러스, 파라인플루엔자 바이러스 타입 1, 파라인플루엔자 바이러스 타입 2, 파라인플루엔자 바이러스 타입 3, 파라인플루엔자 바이러스 타입 4, 파라믹소바이러스, 파라폭스바이러스, 파라백시니아 바이러스, 파보바이러스, 파보바이러스 B19, 파보바이러스 군, 페스티바이러스, 플레보바이러스, 포신 디스템버 바이러스, 피코드나바이러스, 피코나바이러스, 돼지 사이토메갈로바이러스-비둘기 두창 바이러스, 피리 바이러스, 픽수나 바이러스, 마우스 폐렴 바이러스, 뉴모바이러스, 소아마비 바이러스, 폴리오바이러스, 폴리드나바이러스, 다면체 바이러스, 폴리오마 바이러스, 폴리오마 바이러스, 폴리오마 바이러스 보비스, 폴리오마 바이러스 세르코피쎄시, 폴리오마 바이러스 호미니스 2, 폴리오마 바이러스 마카캐 1, 폴리오마 바이러스 뮤리스 1, 폴리오마 바이러스 뮤리스 2, 폴리오마 바이러스 파피오니스 1, 폴리오마 바이러스 파피오니스 2, 폴리오마 바이러스 실빌라기, 폰진 헤르페스바이러스 1, 돼지 유행성 설사 바이러스, 돼지 혈구응집 뇌척수염 바이러스, 돼지 파보바이러스, 돼지 전염성 위장염 바이러스, 돼지 타입 C 바이러스, 폭스 바이러스, 폭스바이러스, 두창 폭스바이러스, 프로스펙트 힐 바이러스, 프로바이러스, 가성우두 바이러스, 가성광견병 바이러스, 앵무새 두창 바이러스, 메추라기 두창 바이러스, 토끼 섬유종 바이러스, 토기 신장 공포형성 바이러스, 토끼 유두종바이러스, 광견병 바이러스, 미국 너구리 파보바이러스, 미국 너구리 두창 바이러스, 라닉헷 바이러스, 래트 사이토메갈로바이러스, 래트 파보바이러스, 래트 바이러스, 라우셔 바이러스, 재조합 백시니아 바이러스, 재조합 바이러스, 레오바이러스, 레오바이러스 1, 레오바이러스 2, 레오바이러스 3, 파충류 타입 C 바이러스, 호흡기 감염 바이러스, 호흡기 세포융합 바이러스, 호흡기 바이러스, 망상내피증 바이러스, 랍도바이러스, 랍도바이러스 카르피아, 라디노바이러스, 리노바이러스, 리지디오바이러스, 리프트 밸리 열 바이러스, 릴리 바이러스, 우역 바이러스, RNA 종양 바이러스, 로스 리버 바이러스, 로타바이러스, 로우게올 바이러스, 라우스 육종 바이러스, 풍진 바이러스, 루베올라 바이러스, 루비바이러스, 러시아 가을 뇌염 바이러스, SA 11 시미안 바이러스, SA2 바이러스, 사비아 바이러스, 사기야마 바이러스, 사이미린 헤르페스바이러스 1, 침샘 바이러스, 모래파리 열 바이러스 군, 샌드짐바 바이러스, SARS 바이러스, SDAV (시알로눈물샘염 바이러스), 물개 두창 바이러스, 셈리키 포레스트 바이러스, 서울 바이러스, 양 두창 바이러스, 숍 섬유종 바이러스, 숍 유두종바이러스, 시미안 기포형 바이러스, 시미안 A형 간염 바이러스, 시미안 인간 면역결핍 바이러스, 시미안 면역결핍 바이러스, 시미안 파라인플루엔자 바이러스, 시미안 T 세포 림프친화성 바이러스, 시미안 바이러스, 시미안 바이러스 40, 심플렉스바이러스, 신 놈브레 바이러스, 신드비스 바이러스, 천연두 바이러스, 남아메리카 출혈 열 바이러스, 참새 두창 바이러스, 스푸마바바이러스, 다람쥐 섬유종 바이러스, 다람쥐 원숭이 레트로바이러스, SSV 1 바이러스 군, STLV(시미안 T 림프친화성 바이러스: simian T lymphotropic virus) 타입 I, STLV(시미안 T 림프친화성 바이러스) 타입 II, STLV(시미안 T 림프친화성 바이러스) 타입 III, 구진성 구내염 바이러스, 상악하 바이러스, 돼지과 알파헤르페스바이러스 1, 돼지과 헤르페스바이러스 2, 수이폭스바이러스, 습지 열 바이러스, 돼지 두창 바이러스, 스위스 마우스 백혈병 바이러스, TAC 바이러스, 타카리브 콤플렉스 바이러스, 타카리브 바이러스, 타나폭스 바이러스, 타테라폭스 바이러스, 텐취 레오바이러스, 테일러 뇌척수염 바이러스, 테일러 바이러스, 토고토 바이러스, 토타팔라얌 바이러스, 진드기 매개 뇌염 바이러스, 티오만 바이러스, 토가바이러스, 토로바이러스, 종양 바이러스, 투파이아바이러스, 칠면조 비기관염 바이러스, 칠면조 두창 바이러스, 타입 C 레트로바이러스, 타입 D 온코바이러스, 타입 D 레트로바이러스 군, 궤양성 질환 랍도바이러스, 유나 바이러스, 유우쿠니에미 바이러스 군, 백시니아 바이러스, 공포형성 바이러스, 수두 대상포진 바이러스, 바리셀로바이러스, 바리콜라 바이러스, 대두창 바이러스, 두창 바이러스, 바신 기슈병 바이러스, VEE 바이러스, 베네수엘라 말 뇌염 바이러스, 베네수엘라 말 뇌척수염 바이러스, 베네수엘라 출혈 열 바이러스, 수포성 구내염 바이러스, 베지큘로바이러스, 빌리유이스크 바이러스, 살무사 레트로바이러스, 바이러스성 출혈성 패혈증 바이러스, 비스나 매디 바이러스, 비스나 바이러스, 들쥐 두창 바이러스, VSV(수포성 구내염 바이러스), 왈랄 바이러스, 와레고 바이러스, 사마귀 바이러스, WEE 바이러스, 웨스트 나일 바이러스, 서부 말 뇌염 바이러스, 서부 말 뇌척수염 바이러스, 와타로아 바이러스, 동계 구토증 바이러스, 우드척 B형 간염 바이러스, 털원숭이 육종 바이러스, 상처 종양 바이러스, WRSV 바이러스, 야바 원숭이 종양 바이러스, 야바 바이러스, 야타폭스바이러스, 황열 바이러스, 및 유그 보그다노박 바이러스를 포함한다.
일부 실시양태에서, 바이러스는 코로나 바이러스이다. 일부 실시양태에서, 코로나바이러스는 알파코로나바이러스, 베타코로나바이러스, 델타코로나바이러스, 및 감마코로나바이러스로 구성된 군으로부터 선택된다. 알파코로나바이러스의 예로는 박쥐 코로나바이러스 CDPHE15, 박쥐 코로나바이러스 HKU10, 인간 코로나바이러스 229E, 인간 코로나바이러스 NL63, 긴날개 박쥐 코로나바이러스 1, 긴날개 박쥐 코로나바이러스 HKU8, 밍크 코로나바이러스 1, 돼지 유행성 설사 바이러스, 관박쥐 코로나바이러스 HKU2, 및 노랑박쥐 코로나바이러스 512를 포함할 수 있지만, 이에 제한되지 않는다. 베타코로나바이러스의 예로는 베타코로나바이러스 1, 고슴도치 코로나바이러스 1, 인간 코로나바이러스 HKU1, 중동 호흡기 증후군 관련 코로나 바이러스, 뮤린 코로나 바이러스, 집박쥐 코로나바이러스 HKU5, 루세트박쥐 코로나바이러스 HKU9, 중증 급성 호흡기 증후군 관련 코로나 바이러스, 대나무박쥐 코로나바이러스 HKU4를 포함할 수 있지만, 이에 제한되지 않는다. 델타코로나바이러스의 예로는 제주직박구리 코로나바이러스 HKU11, 쇠물닭 코로나바이러스 HKU21, 코로나바이러스 HKU15, 킨바라 코로나바이러스 HKU13, 해오라기 코로나바이러스 HKU19, 개똥지빠귀 코로나바이러스 HKU12, 동박새 코로나바이러스 HKU16, 홍머리오리 코로나바이러스 HKU20을 포함할 수 있지만, 이에 제한되지 않는다. 감마코로나바이러스의 예로는 조류 코로나 바이러스, 흰돌고래 코로나바이러스 SW1을 포함할 수 있지만, 이에 제한되지 않는다. 코로나바이러스의 추가 예로는 MERS-CoV, SARS-CoV, 및 SARS-CoV-2를 포함할 수 있다. 일부 실시양태에서, 코로나바이러스는 SARS-CoV-2일 수 있다.
일부 실시양태에서, 병원체는 사람에서 사람으로 쉽게 전파되거나, 전염될 수 있고; 높은 사망률을 초래할 수 있고, 공중 보건에 중대한 영향을 미칠 가능성이 있고; 대중의 공황과 사회적 혼란을 야기할 수 있고; 공중 보건 대비를 위한 특별 조치를 필요로 할 수 있다. 이러한 병원체의 예로는 탄저균(Anthrax)(바실러스 안트라시스), 보툴리눔독소증(Botulism)(클로스트리디움 보툴리눔 독소), 역병(역병)(예르시니아 페스티스), 천연두(바리올라 마요르(variola major)), 야토병(Tularemia)(프란시셀라 툴라렌시스), 또는 바이러스성 출혈 열(필로바이러스(에볼라, 마버그) 및 아레나바이러스(라사, 마추포) 포함)를 포함할 수 있다.
일부 실시양태에서, 병원체는 중간 정도로 쉽게 전파될 수 있고; 중등도의 이환율과 낮은 사망률을 초래할 수 있고; 진단 능력의 특정 향상과 질병 감시의 강화가 필요할 수 있다. 이러한 병원체의 예로는 브루셀라병(브루셀라 종), 클로스트리디움 페르프린겐스의 엡실론 독소, 식품 안전 위협(예컨대, 살모넬라 종, 에스케리키아 콜라이 O157:H7, 또는 시겔라), 마비저(부르크홀데리아 말레이), 멜리오이도시스(부르크홀데리아 슈도말레이), 앵무병(클라미디아 시타시), Q 열(콕시엘라 번에티이), 리시누스 코무니스로부터의 리신 독소(피마자), 포도상구균 장독소 B, 발진티프스(리케차 프로와제키), 바이러스 뇌염(알파바이러스, 예컨대, 동부 말 뇌염, 베네수엘라 말 뇌염, 및 서부 말 뇌염), 또는 물 안전 위협(예컨대, 비브리오 콜레라에 및 크립토스포리디움 파르붐)을 포함할 수 있다.
일부 실시양태에서, 병원체는 아직 확인되지 않은 서열을 갖는 신흥 병원체이다. 일부 실시양태에서, 신흥 병원체는 높은 이환율 및 사망률 및 주요 건강 영향에 대한 잠재성을 갖는다. 이러한 병원체의 예로는 니파 바이러스 및 한타바이러스를 포함할 수 있다.
일부 실시양태에서, 병원체는 독소를 포함할 수 있다. 일부 실시양태에서, 독소는 본원에 기술된 병원체 중 어느 하나에 의해 분비될 수 있다.
일부 실시양태에서, 병원체는 박테리아를 포함한다. 일부 실시양태에서, 박테리아는 그람-양성 박테리아일 수 있다. 일부 실시양태에서, 박테리아는 그람-음성 박테리아이다. 일부 실시양태에서, 박테리아는 β-락타마제에 내성인 균주 일부 실시양태에서, 항원은 장독소생성 에스케리키아 콜라이(ETEC: Enterotoxigenic Escherichia coli), 시가 독소 생성 에스케리키아 콜라이(STEC: Shiga toxin-producing Escherichia coli), 캄필로박터 제주니(Campylobacter jejuni), 슈도모나스 아에루기노사(Pseudomonas aeruginosa), 아시네토박터 바우마니이(Acinetobacter baumannii), 스트렙토코쿠스 뮤탄스(Streptococcus mutans), 헬리코박터 파이로리(Helicobacter pylori), 또는 바실러스 안트라시스로부터 유래된 것이다.
본원에 기술된 제핵 세포, 조성물 또는 약학적 조성물로 치료될 수 있는 병원체 및 이들 병원체와 연관된 질환 또는 병태의 예시적인 목록은 표 3-6에서 살펴볼 수 있다.
Figure pct00001
Figure pct00002
Figure pct00003
Figure pct00004
A. 활성제
본 개시내용의 세포질체는 항바이러스 조성물(예컨대, 백신, 병원체에 대한 중화 항체)과 같은 활성제를 발현하거나 함유한다. 활성제는 치료 DNA 분자, 치료 RNA 분자, 치료 단백질(예컨대, 효소, 항체, 항원, 독소, 사이토카인, 단백질 호르몬, 성장 인자, 세포 표면 수용체, 또는 백신), 치료 펩티드(예컨대, 펩티드 호르몬 또는 항원), 소분자 활성제(예컨대, 스테로이드, 폴리케티드, 알칼로이드, 독소, 항생제, 항바이러스제, 콜히친, 탁솔, 미토마이신 또는 엠탄신), 및 치료 유전자 편집 인자 중 적어도 하나를 포함할 수 있다. 일부 실시양태에서, 세포질체는 치료 DNA 분자, 치료 RNA 분자, 치료 단백질, 치료 펩티드, 치료 소분자, 또는 치료 유전자 편집 성분 중 적어도 하나를 생산(예컨대, 발현, 및 일부 실시양태에서, 분비)하도록 조작될 수 있다. 대안적으로, 또는 추가로, 유핵 세포(본원에서 사용되는 바, "모"세포)는 세포질체로 제핵되기 전에 치료 DNA 분자, 치료 RNA 분자, 치료 단백질, 치료 펩티드, 소분자 활성제, 및 유전자 편집 인자 중 적어도 하나를 생산하도록 조작될 수 있다.
치료 DNA 분자, 치료 RNA 분자, 치료 단백질, 치료 펩티드, 소분자 활성제, 또는 치료 유전자 편집 인자는 표적화 모이어티를 포함할 수 있다. 세포질체에 의해 생산되거나, 또는 세포질체에 함유될 수 있는 비제한적인 예시적인 표적화 모이어티는 케모카인 수용체, 부착 분자, 및 항원을 포함한다.
본 개시내용의 세포질체는 피험체에게 투여될 수 있고, 치료 DNA 분자, 치료 RNA 분자, 치료 단백질(예컨대, 효소, 항체, 항원, 독소, 사이토카인, 단백질 호르몬, 성장 인자, 세포 표면 수용체 또는 백신, 또는 현재 이용 가능하거나, 개발 중인 임의의 치료 단백질), 치료 펩티드(예컨대, 펩티드 호르몬 또는 항원, 또는 현재 이용 가능하거나, 개발 중인 임의의 치료 펩티드), 소분자 활성제(예컨대, 스테로이드, 폴리케티드, 알칼로이드, 독소, 항생제, 항바이러스제, 진통제, 항응고제, 항우울제, 항암제, 항간질제, 항정신병제, 진정제, 콜히친, 탁솔, 미토마이신, 엠탄신, 또는 현재 이용 가능하거나 개발 중인 임의의 소분자 활성제, 치료 유전자 편집 인자, 치료 나노입자, 또는 또 다른 활성제(예컨대, 박테리아, 박테리아 포자, 박테리오파지, 박테리아 성분, 바이러스(예컨대, 종양용해성 바이러스), 엑소좀, 지질 또는 이온)를 함유할 수 있다. 종양용해성 바이러스의 비제한적 예는 탈리모젠 라헤르파렙벡(Talimogene laherparepvec), Onyx-015, GL-ONC1, CV706, 보이저(Voyager)-V1, 및 HSV-1716을 포함한다. 일부 야생형 바이러스는 또한 예컨대, 백시니아 바이러스, 수포성 구내염 바이러스, 폴리오바이러스, 레오바이러스, 세네카바이러스, ECHO-7, 및 셈리키 포레스트 바이러스와 같은 종양용해성 거동을 보인다.
일부 실시양태에서, DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자는 재조합적으로 발현된다. 일부 실시양태에서, 세포질체가 유래되거나, 또는 수득된 세포는 DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자 중 하나 이상의 것을 생산하도록 조작된다. 일부 실시양태에서, 세포질체가 유래되거나, 또는 수득된 세포는 DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자 중 하나 이상의 것을 안정적으로 (예컨대, 영구적으로) 발현하도록 조작된다. 일부 실시양태에서, 세포질체가 유래되거나, 또는 수득된 세포는 DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자 중 하나 이상의 것을 일시적으로 발현하도록 조작된다. 일부 실시양태에서, 세포질체가 유래되거나, 또는 수득된 세포는 제핵 전에 조작된다. 일부 실시양태에서, 세포질체는 DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자 중 하나 이상의 것을 일시적으로 발현하도록 조작된다(예컨대, 제핵 후 조작).
일부 실시양태에서, DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자는 세포질체가 유래되거나, 또는 수득된 세포에서 (예컨대, 조작 부재하에서는) 자연적으로 발현되지 않는다(예컨대, DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자는 세포질체에 대해 외인성이다). 일부 실시양태에서, DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자는 피험체에서 자연적으로 발현되지 않는다(예컨대, DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자는 피험체에게 외인성이다). 일부 실시양태에서, DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자는 피험체의 의도된 치료 부위(예컨대, 종양, 또는 예컨대, 뇌, 장, 폐, 심장, 간, 비장, 췌장, 근육, 눈 등과 같은 특정 조직)에서 자연적으로 발현되지 않는다(예컨대, DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자는 의도된 치료 부위에 대해 외인성이다).
일부 실시양태에서, DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자는 세포질체가 유래되거나, 또는 수득된 세포에서 (예컨대, 조작 부재하에서) 자연적으로 발현된다(예컨대, DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자는 선천적으로 내인성이다)(예컨대, 세포질체가 유래되거나, 또는 수득된 세포의 조작 부재하에서). 일부 실시양태에서, DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자 피험체에서 자연적으로 발현된다(예컨대, DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자는 피험체에게 내인성이다). 일부 실시양태에서, DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자는 피험체의 의도된 치료 부위(예컨대, 종양, 또는 예컨대, 뇌, 장, 폐, 심장, 간, 비장, 췌장, 근육, 눈 등과 같은 특정 조직)에서 자연적으로 발현된다(예컨대, 예컨대, DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자는 의도된 치료 부위에 대해 내인성이다).
일부 실시양태에서, 치료제, 예컨대, DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자는 합성 세포로부터 유래되고. 세포질체 내로 로딩된다.
일부 실시양태에서, 세포질체는 세포질체가 유래되거나, 또는 수득된 세포와 비교하여 DNA 분자, RNA 분자, 단백질, 펩티드, 소분자 활성제, 및/또는 유전자 편집 인자의 교정, 말단절단, 비돌연변이 버전 및/또는 카피를 발현한다. 일부 실시양태에서, 세포질체는 임의의 유핵 세포(예컨대, 진핵 세포, 포유동물 세포(예컨대, 인간 세포, 또는 본원에 기술된 임의의 포유동물 세포), 원생동물 세포(예컨대, 아메바 세포), 조류 세포, 식물 세포, 진균 세포, 무척추동물 세포, 어류 세포, 양서류 세포, 파충류 세포, 또는 조류 세포)로부터 수득된다.
일부 실시양태에서, 세포질체는 임의의 조합으로 적어도 2개의(예컨대, 적어도 2, 3, 4, 5 또는 그 초과의) 상이한 치료 DNA 분자, 치료 RNA 분자, 치료 단백질, 치료 펩티드, 소분자 활성제, 또는 치료 유전자 편집 인자를 생산하거나, 또는 함유한다. 예를 들어, 일부 실시양태에서, 세포질체는 치료 DNA 분자 및 소분자 활성제를 생산하거나, 또는 함유할 수 있다. 예를 들어, 일부 실시양태에서, 세포질체는 2개의 상이한 소분자 활성제를 생산하거나, 또는 함유할 수 있다. 예를 들어, 일부 실시양태에서, 세포질체는 (예컨대, 표적화를 위한) 케모카인 수용체 및 소분자 활성제를 생산하거나, 또는 함유할 수 있다.
일부 실시양태에서, 치료 RNA 분자는 메신저 RNA(mRNA: messenger RNA), 짧은 헤어핀 RNA(shRNA: short hairpin RNA), 작은 간섭 RNA(siRNA: small interfering RNA), 마이크로RNA, 긴 비코딩 RNA(lncRNA: long non-coding RNA) 또는 RNA 바이러스이다. 일부 실시양태에서, 치료 DNA 분자는 단일 가닥 DNA, 이중 가닥 DNA, 올리고뉴클레오티드, 플라스미드, 박테리아 DNA 분자 또는 DNA 바이러스이다. 일부 실시양태에서, 치료 단백질은 사이토카인, 성장 인자, 호르몬, 항체, 소형 펩티드 기반 약물, 또는 효소이다. 일부 실시양태에서, 세포질체는 치료 DNA 분자, 치료 RNA 분자, 치료 단백질, 치료 펩티드, 소분자 치료제, 및/또는 치료 유전자 편집 인자를 일시적으로 발현한다. 일부 실시양태에서, 치료 DNA 분자, 치료 RNA 분자, 치료 단백질, 치료 펩티드, 소분자 치료제, 및/또는 치료 유전자 편집 인자의 발현은 유도가능하다. 일부 실시양태에서, 유핵 세포는 치료 DNA 분자, 치료 RNA 분자, 치료 단백질, 치료 펩티드, 소분자 치료제, 및/또는 치료 유전자 편집 인자를 발현하도록 영구적으로 조작된다. 일부 실시양태에서, 치료 DNA 분자, 치료 RNA 분자, 치료 단백질, 치료 펩티드, 소분자 치료제, 및/또는 치료 유전자 편집 인자의 발현. 본원에 기술된 임의의 방법의 일부 실시양태에서, 세포질체는 활성제 또는 나노입자를 포함한다. 일부 실시양태에서, 활성제는 소분자 또는 박테리아 또는 엑소좀이다.
치료 세포의 전신 투여의 경우, 이환 조직으로의 성공적인 귀소에 대한 2가지 주요 문제가 있다. 첫째, 대부분의 세포가 폐 또는 다른 조직의 작은 모세혈관에 포획될 수 있고, 이는 또한 예컨대, 폐색전증과 같은 심각한 부작용을 일으킬 수 있다. 일부 실시양태에서, 세포질체는 그들의 모세포보다 훨씬 작고(예컨대, 모세포 직경의 약 60% 및 부피의 1/8), 강성 핵을 갖지 않으므로, 세포질체는 작은 모세혈관 및 혈관을 그들의 모세포보다 더욱 잘 통과할 수 있다. 둘째, 이환 조직으로의 세포의 특정 귀소는 케모카인 수용체 신호전달, 예컨대, SDF-1α/CXCR4, CCL2/CCR2, 및 부착 분자, 예컨대, PSGL-1에 따라 달라질 수 있다. 본원에 제시된 바와 같이, 세포질체는 조작된 세포질체의 특이적 귀소를 크게 촉진할 수 있는 글리코실화된 PSGL-1 뿐만 아니라, 기능적 CXCR4, CCR2를 특이적으로 발현하도록 조작될 수 있다.
일부 실시양태에서, 세포질체는 세포질체의 세포 표면 상에서 발현되는 표적화 모이어티, 예컨대, CXCR4, CCR2 또는 PSGL-1을 (예컨대, 조작에 의해 또는 이들이 수득된 세포로부터) 추가로 포함할 수 있다. 세포질체의 세포 표면 상에서 발현될 수 있는 세포 표면 단백질의 비제한적인 예로는 케모카인 예컨대, CXCR4, CCR2, CCR1, CCR5, CXCR7, CXCR2, 및 CXCR1을 포함한다. 귀소 수용체로서 세포질체의 세포 표면 상에서 발현될 수 있는 세포 표면 단백질의 다른 예로는 C-X-C 케모카인 수용체 타입 3, 류코시아린, CD44 항원, C-C 케모카인 수용체 타입 7, L-셀렉틴, 림프구 기능 연관 항원 1, 또는 초후기 항원-4, 또는 그의 조합을 포함할 수 있다. 일부 실시양태에서, 세포질체는 세포질체에 의해 분비되거나, 또는 세포외 기질에 테더링된 세포 표적화 모이어티, 예컨대, SDF1α 또는 CCL2를 (예컨대, 조작에 의해 또는 이들이 수득된 세포로부터) 추가로 포함할 수 있다. 세포 귀소를 위해 세포질체에 의해 분비될 수 있는 단백질의 비제한적인 예로는 SDF1α, CCL2, CCL3, CCL5, CCL8, CCL1, CXCL9, CXCL10, CCL11, 및 CXCL12를 포함한다. 표적화 모이어티는 세포질체를 표적 세포, 표적 조직, 또는 표적 환경으로 유도할 수 있다. 일부 실시양태에서, 표적화 모이어티는 케모카인/케모카인 수용체 감지에 기초하여 세포질체를 유도한다. 일부 실시양태에서, 표적화 모이어티는 직접 결합에 기초하여 세포질체를 유도한다. 예를 들어, 표적화 모이어티는 표적 세포에 의해 발현되는 항원에 결합할 수 있는 항체를 포함할 수 있다.
일부 실시양태에서, 세포질체는 4-1BBL, 아실화 자극 단백질, 아디포카인, 알빈터페론, APRIL, Arh, BAFF, Bcl-6, CCL1, CCL1/TCA3, CCL11, CCL12/MCP-5, CCL13/MCP-4, CCL14, CCL15, CCL16, CCL17/TARC, CCL18, CCL19, CCL2, CCL2/MCP-1, CCL20, CCL21, CCL22/MDC, CCL23, CCL24, CCL25, CCL26, CCL27, CCL28, CCL3, CCL3L3, CCL4, CCL4L1/LAG-1, CCL5, CCL6, CCL7, CCL8, CCL9, CCR10, CCR3, CCR4, CCR5, CCR6, CCR7, CCR8, CD153, CD154, CD178, CD40LG, CD70, CD95L/CD178, 서버루스(Cerberus)(단백질), 케모카인, CLCF1, CNTF, 콜로니 자극 인자, 공통 b 쇄 (CD131), 공통 g 쇄(CD132), CX3CL1, CX3CR1, CXCL1, CXCL10, CXCL11, CXCL12, CXCL13, CXCL14, CXCL15, CXCL16, CXCL17, CXCL2, CXCL2/MIP-2, CXCL3, CXCL4, CXCL5, CXCL6, CXCL7, CXCL9, CXCR3, CXCR4, CXCR5, EDA-A1, Epo, 에리트로포이에틴, FAM19A1, FAM19A2, FAM19A3, FAM19A4, FAM19A5, Flt-3L, FMS 유사 티로신 키나제 3 리간드, Foxp3, GATA-3, GcMAF, G-CSF, GITRL, GM-CSF, 과립구 콜로니 자극 인자, 과립구 대식세포 콜로니 자극 인자, 간세포 성장 인자, IFNA1, IFNA10, IFNA13, IFNA14, IFNA2, IFNA4, IFNA5/IFNaG, IFNA7, IFNA8, IFNB1, IFNE, IFNG, IFNZ, IFN-α, IFN-β, IFN-γ, IFNω/IFNW1, IL-1, IL-10, IL-10 패밀리, IL-10 유사, IL-11, IL-12, IL-13, IL-14, IL-15, IL-16, IL-17, IL-17 패밀리, IL-17A-F, IL-18, IL-18BP, IL-19, IL-1A, IL-1B, IL-1F10, IL-1F3/IL-1RA, IL-1F5, IL-1F6, IL-1F7, IL-1F8, IL-1F9, IL-1 유사, IL-1RA, IL-1RL2, IL-1α, IL-1β, IL-2, IL-20, IL-21, IL-22, IL-23, IL-24, IL-28A, IL-28B, IL-29, IL-3, IL-31, IL-33, IL-35, IL-4, IL-5, IL-6, IL-6 유사, IL-7, IL-8/CXCL8, IL-9, 인플라마좀, 인터페롬, 인터페론, 인터페론 베타-1a, 인터페론 베타-1b, 인터페론 감마, 인터페론 유형 I, 인터페론 유형 II, 인터페론 유형 III, 인터페론, 인터루킨, 인터 류킨 1 수용체 길항제, 인터류킨 8, IRF4, 렙틴, 백혈병 억제 인자(LIF: leukemia inhibitory factor), 백혈구 촉진 인자, LIGHT, LTA/TNFB, LT-β, 림포카인, 림프독소, 림프독소 알파, 림프독소 베타, 대식세포 콜로니 자극 인자, 대식세포 염증성 단백질, 대식세포 활성화 인자, M-CSF, MHC 클래스 III, 기타 헤마토포이에틴, 모노카인, MSP, 미오카인, 미오넥틴, 니코틴아미드 포스포리보실트랜스퍼라제, 온코스타틴 M(OSM), 오프렐베킨, OX40L, 혈소판 인자 4, 프로메가포이에틴, RANKL, SCF, STAT3, STAT4, STAT6, 간질 세포 유래 인자 1, TALL-1, TBX21, TGF-α, TGF-β, TGF-β1, TGF-β2, TGF-β3, TNF, TNFSF10, TNFSF11, TNFSF12, TNFSF13, TNFSF14, TNFSF15, TNFSF4, TNFSF8, TNF-α, TNF-β, Tpo, TRAIL, TRANCE, TWEAK, 혈관 내피 성장 억제제, XCL1, 또는 XCL2로 구성된 군으로부터 선택되는 사이토카인 중 적어도 하나를 발현하고/거나, 분비할 수 있다.
일부 실시양태에서, 세포질체는 골수 세포, T 세포, 예컨대, 알파 베타 세포독성 T 세포, 감마 델타 T 세포, 조절 T 세포, 자연 살해 T 세포, B 세포, 자연 살해 세포, 대식세포, 비만 세포, 내피 세포, 섬유아세포, 또는 다양한 간질 세포 중 어느 하나의 생물학적 활성을 조정하기 위한 적어도 하나의 사이토카인을 발현 및/또는 분비할 수 있다.
일부 실시양태에서, 세포질체는 피험체 면역계의 회피를 돕는 표면 마커를 (예컨대, 조작에 의해 또는 이들이 수득된 세포로부터) 추가로 포함할 수 있다. 예를 들어, 일부 실시양태에서, 세포질체는 CD47 마커를 포함할 수 있다. 임의의 특정 이론에 얽매이지 않고, CD47 마커는 세포질체가 대식세포에 의한 식세포화되는 것을 방지하는 데 도움이 된다고 간주된다. 세포-기질 수용체 및 세포-세포 부착 분자의 비제한적인 예는 인테그린, 카드헤린, 당단백질 및 헤파린 술페이트 프로테오글리칸을 포함한다. 치료 분자의 비제한적 예는 종양 항원 및 면역조정 펩티드, 폴리아민 및 ATP를 포함한다.
1.백신 조성물
일부 실시양태에서, 본원에서는 백신 조성물인 활성제를 발현하거나, 전달하도록 조작된 세포질체를 기술한다. 일부 실시양태에서, 백신 조성물을 코딩하는 핵산 분자는 본원에 기술된 방법을 사용하여 세포질체, 또는 그의 모세포 내로 도입된다. 일부 실시양태에서, 백신 조성물은 상응하는 모세포에 내인성인 세포 기계(예컨대, mRNA 번역 기계, 단백질 합성)를 사용하여 세포질체에서 발현된다. 일부 실시양태에서, 피험체에 일단 투여되면, 세포질체는 백신 조성물을 세포외 공간으로 분비하기 위해 상응하는 모세포의 내인성 단백질 분비 기구를 이용한다. 세포질체는 또한 백신 조성물이 분비되는 피험체(예컨대, 폐, 림프)의 표적 조직에 특이적인 귀소 수용체로 조작될 수 있다. 세포질체는 또한 과립구-대식세포 콜로니 자극 인자(GM-CSF) 또는 본원에 기술된 사이토카인 또는 사이토카인에 대한 수용체 중 어느 하나와 같은 면역계 활성화제를 발현하도록 조작될 수 있다.
일부 실시양태에서, 백신 조성물은 병원체의 항원에 대한 것이다. 항원의 비제한적인 예는 천연 서열을 포함하는 단백질, 천연 또는 비천연 아미노산을 포함하고/거나, 예컨대, 글리코실화, 팔미토일화, 미리스토일화 등과 같은 변형이 있는 폴리펩티드, 및 천연 또는 비천연 염기를 포함하는 핵산을 포함한다. 병원체는 포유동물에서 감염을 유발하는 임의의 박테리아, 바이러스 또는 진균일 수 있다. 일부 실시양태에서, 병원체는 바이러스일 수 있다. 일부 실시양태에서, 바이러스 항원은 바이러스 단백질, 바이러스 단백질의 단편, 또는 바이러스 단백질 또는 바이러스 단백질의 단편을 코딩하는 핵산으로부터 제조될 수 있다. 일부 실시양태에서, 백신은 본원에 기술된 바이러스의 불활성화된 버전을 포함한다. 일부 실시양태에서, 백신은 본원에 기술된 바이러스의 생 약독화 버전을 포함한다. 일부 실시양태에서, 생 약독화 바이러스는 살아 있지만, 복제가 결핍된 바이러스이다. 다른 경우에, 생 약독화 바이러스는 살아 있지만, 비감염성인 바이러스이다.
일부 실시양태에서, 본원에 기술된 세포질체를 포함하는 백신은 백신 조성물을 포함하는 세포질체를 피험체에게 투여한 후 피험체에서 적응 면역 반응을 유도한다. 일부 실시양태에서, 본원에 기술된 백신은 피험체를 바이러스 감염에 대해 면역화시키기에 충분한 적응 면역 반응을 유도하거나, 또는 바이러스 감염에 의해 유발되는 질환 또는 병태의 중증도를 감소시킨다.
일부 실시양태에서, 본원에서는 본원에 개시된 병원체의 바이러스 항원에 대한 백신 조성물을 발현하도록 조작된 세포질체를 제공한다. 바이러스는 DNA 바이러스 또는 RNA 바이러스일 수 있다. DNA 바이러스는 단일 가닥(ss) DNA 바이러스, 이중 가닥(ds) DNA 바이러스 또는 ss 및 ds DNA 영역을 모두 포함하는 DNA 바이러스일 수 있다. RNA 바이러스는 단일 가닥(ss) RNA 바이러스 또는 이중 가닥(ds) RNA 바이러스일 수 있다. ssRNA 바이러스는 + 센스 RNA 바이러스 또는 - 센스 RNA 바이러스로 추가로 분류될 수 있다.
일부 실시양태에서, 바이러스 항원은 인플루엔자의 임의의 속, 균주 또는 하위 유형에 의해 코딩되는 인플루엔자 단백질와 적어도 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일하다. 예시적인 인플루엔자 속은 인플루엔자 바이러스 A, 인플루엔자 바이러스 B, 인플루엔자 바이러스 C, 및 인플루엔자 바이러스 D를 포함할 수 있다. 일부 실시양태에서, 본원에 기술된 세포질체는 헤마글루티닌(HA) 및 뉴라미니다제(NA)의 인플루엔자 바이러스 단백질의 조합을 발현하도록 조작될 수 있다. 본원에 기술된 세포질체에 의해 발현될 수 있는 인플루엔자 헤마글루티닌(HA)는 HA 하위유형 H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15, H16, H17, 또는 H18을 포함할 수 있다. 본원에 기술된 세포질체에 의해 발현될 수 있는 인플루엔자 뉴라미니다제(NA)는 NA 하위유형 N1, N2, N3, N4, N5, N6, N7, N8, N9, N10, 또는 N11을 포함할 수 있다. 일부 실시양태에서, 본원에 기술된 세포질체는 본원에 기술된 HA 및 NA 하위유형 중 어느 하나의 조합을 발현할 수 있다. 단일 세포질체에 의해 발현될 수 있는 예시적인 조합은 H1N1, H2N2, H3N2, H5N1, H7N7, H1N2, H9N2, H7N2, H7N3, H10N7, H7N9, 또는 H6N1을 포함할 수 있다. 추가의 다른 예시적인 조합은 H1N1, H1N2, H1N3, H1N4, H1N5, H1NG, H1N7, H1N8, H1N9, H1N10, H1N11, H2N1, H2N2, H2N3, H2N4, H2N5, H2NG, H2N7, H2N8, H2NB, H2N1D, H2N11, H3N1, H3N2, H3N3, H3N4, H3N5, H3NB, H3N7, H3N8, H3NB, H3N1D, H3N11, H4N1, H4N2, H4N3, H4N4, H4N5, H4NB, H4N7, H4N8, H4N9, H4N10, H4N11, H5N1, H5N2, H5N3, H5N4, H5N5, H5NB, H5N7, H5N8, H5N3, H5N1D, H5N11, HBN1, HBN2, HBN3, HBN4, HBN5, HBNB, HBN7, HBN8, HBN9, HBN10, HBN11, H7N1, H7N2, H7N3, H7N4, H7N5, H7NB, H7N7, H7N8, H7N9, H7N10, H7N11, H8N1, H8N2, H8N3, H8N4, H8N5, H8NG, H8N7, H8N8,5 H8N9, H8N10, HBN11, HBN1, H9N2, HBN3, H9N4, H3N5, H3N7, H3N8, H3N3, H9N1D, HBN11, H1DN1, H10N2, H1DN3, H1DN4, H1DN5, H1DNG, H1DN7, H1DN8, H1DN3, H10N10, H1DN11, H11N1, H11N2, H11N3, H11N4, H11N5, HUNG, H11N7, HUNS, H11NS, H11N10, H11N11, H12N1, H12N2, H12N3, H12N4, H12N5, H12NB, H12N7, H12N8, H12N3, H12N1D, H12N11, H13N1, H13N2, H13N3, H13N4, H13N5, H13NB, H13N7, H13N8, H13N3, H13N1D, H13N11, H14N1, H14N2, H14N3, H14N4, H14N5, H14NB, H14N7, H14N8, H14N9, H14N10, H14N11, H15N1, H15N2, H15N3, H15N4, H15N5, H15NB, H15N7, H15N8, H15N3, H15N1D, H15N11, H1BN1, H1BN2, H1BN3, H1BN4, H1BN5, H1BNB, H1BN7, H1BN8, H1GN3, H1BN10, H1BN11, H17N1, H17N2, H17N3, H17N4, H17N5, H17NB, H17N7, H17N8, H17N3, H17N10, H17N11, H1BN1, H18N2, H18N3, H18N4, H18N5, H1BNB, H18N7, H18N8, H18N3, H1BN10, 또는 H1BN11을 포함할 수 있다.
일부 실시양태에서, 본원에서는 박테리아 항원에 대한 백신 조성물을 발현하도록 조작된 세포질체를 제공한다. 일부 실시양태에서, 박테리아 항원은 탄저균(바실러스 안트라시스), 보툴리눔독소증(클로스트리디움 보툴리눔 독소), 역병(예르시니아 페스티스), 야토병(프란시셀라 툴라렌시스), 브루셀라병(브루셀라 종), 클로스트리디움 페르프린겐스의 엡실론 독소, 살모넬라 종, 에스케리키아 콜라이 O157:H7, 시겔라, 마비저(부르크홀데리아 말레이), 멜리오이도시스(부르크홀데리아 슈도말레이), 앵무병(클라미디아 시타시), Q 열(콕시엘라 번에티이), 포도상구균 장독소 B, 발진티프스(리케차 프로와제키), 비브리오 콜레라에, 크립토스포리디움 파르붐으로부터 유래된 것이다. 일부 실시양태에서, 세포질체는 리시누스 코무니스로부터의 리신 독소(피마자)에 대한 백신 조성물을 발현하도록 조작된다.
일부 실시양태에서, 본원에서는 종양 항원에 대한 백신 조성물을 발현하도록 조작된 세포질체를 제공한다. 본원에서 사용되는 바, "종양 항원"은 암 세포에 의해 생산된 항원을 지칭한다. 본 개시내용에서 사용되는 바, 암 세포 또는 종양 세포의 비제한적 예로는 가시세포종, 액상 세포 암종, 음향 신경종, 첨점 흑색종 흑색종, 아크로스피로종, 급성 호산구성 백혈병, 급성 림프아구성 백혈병, 급성 거핵아구성 백혈병, 급성 단핵구 백혈병, 성숙한 급성 골수아구성 백혈병, 급성 골수성 수지상 세포 백혈병, 급성 골수 백혈병, 급성 전골수구성 백혈병, 아다만틴종, 선암종, 선양 낭포 암종, 선종, 선종성 치성 종양, 부신피질 암종, 성체 T 세포 백혈병, 공격성 NK 세포 백혈병, AIDS 관련 암, AIDS 관련 림프종, 폐포 연부 육종, 변색성 섬유종, 항문암, 역형성 대세포 림프종, 역형성 갑상선암, 혈관면역아세포 T 세포 림프종, 혈관근육종, 혈관육종, 충수암, 성상세포종, 비정형 기형 횡문근 종양, 기저 세포 암종, 기저 유사 암종, B 세포 백혈구, B 세포 림프종, 벨리니관 암종, 담도암, 방광암, 아세포종, 골암, 골 종양, 뇌간 신경교종, 뇌종양, 유방암, 브레너 종양, 기관지 종양, 세기관지폐포 암종, 갈색 종양, 버킷 림프종, 원발 부위 미상 암, 카르시노이드 종양, 암종, 상피내 암종, 음경 암종, 원발 부위 미상 암종, 암육종, 캐슬만병, 중추신경계 배아 종양, 소뇌성상세포종, 뇌성상세포종, 자궁경부암, 담관암종, 연골종, 연골육종, 척색종, 융모막암종, 맥락총 유두종, 만성 림프구성 백혈병, 만성 단핵구 백혈병, 만성 골수성 백혈병, 만성 골수증식성 장애, 만성 호중구 백혈병, 투명 세포 종양, 결장암, 결장직장암, 두개인두종, 피부 T 세포 림프종, 데고사르병, 융기성 피부섬유육종, 유피 포낭, 결합조직성 소원형 세포 종양, 미만성 거대 B 세포 림프종, 이형성 신경상피 종양, 배아 암종, 내배엽 부비동 종양, 자궁내막암, 자궁내막 자궁암, 자궁내막양 종양, 장병증 연관 T 세포 림프종, 뇌실상의아세포종, 뇌실막종, 유상피 육종, 적백혈병, 식도암, 감각신경아세포종, 유잉과 종양, 유잉과 육종, 유잉육종, 두개외 생식세포 종양, 성선외 생식세포 종양, 간외 담관암, 유선외 파제트병, 나팔관암, 태아의 태아, 섬유종, 여포성 림프종, 섬유육종, 여포성 림프종, 여포성 갑상선암, 담낭암, 담낭암, 신경교종, 신경절신경아교종, 신경절신경종, 위암, 위 림프종, 위장관암, 위장관 유암종, 위장관 기질 종양, 위장관 기질 종양, 생식 세포 종양, 생식세포종, 임신성 융모막세포종, 임신성 융모성 종양, 골 거대 세포 종양, 다형성 교아세포종, 신경교종, 뇌신경교종증, 사구체 종양, 글루카곤종, 생식선아세포종, 육아종 세포 종양, 모발 세포 백혈병, 모발 세포 백혈병, 두부경부암, 두부경부암, 심장암, 혈관아세포종, 혈관주위세포종, 혈관육종, 혈액암, 간세포 암종, 간비장 T 세포 림프종, 유전성 유방-난소암 증후군, 호지킨 림프종, 호지킨 림프종, 하인두암, 시상하부 신경교종, 염증성 유방암, 안내 흑색종, 췌도 세포 암종, 췌도 세포 종양, 소아 골수단구성 백혈병, 카포시 육종, 신장암, 담관 종양, 크루켄베르그 종양, 후두암, 후두암, 악성 흑색점 흑색종, 백혈병, 백혈병, 구순 및 구강암, 지방육종, 폐암, 황체종, 림프관종, 림프관 육종, 림프 상피종, 림프구종 백혈병, 림프종, 마크로글로불린혈증, 악성 섬유성 조직구종, 악성 섬유성 조직구종, 악성 골 섬유성 조직구종, 악성 신경교종, 악성 중피종, 악성 말초 신경초 종양, 악성 횡문근 종양, 악성 트리톤 종양, MALT 림프종, 외투 세포 림프종, 비만 세포 백혈병, 종격 생식 세포 종양, 종격 종양, 갑상선 수질암, 수아세포종, 수아세포종, 수질상피종, 흑색종, 흑색종, 수막종, 메르켈 세포 암종, 중피종, 중피종, 잠복 원발성 전이성 편평 경부암, 전이성 요로상피 암종, 혼합 뮬러 종양, 단핵구 백혈병, 구강암, 점액성 종양, 다발성 내분비 종양 증후군, 다발성 골수종, 다발성 골수종, 균상 식육종, 균상 식육종, 골수이형성 질환, 골수이형성 증후군, 골수 백혈병, 골수 육종, 골수증식성 질환, 점액종, 비강암, 비인두암, 비인두 암종, 신생물, 신경초종, 신경아세포종, 신경아세포종, 신경섬유종, 신경종, 결절 흑색종, 비호지킨 림프종, 비호지킨 림프종, 비흑색종 피부암, 비소세포폐암, 안구 종양, 핍지성상세포종, 희소돌기아교종, 종양세포종, 시신경초 수막종, 구강암, 구강암, 구인두암, 골육종, 골육종, 난소암, 난소암, 난소 상피암, 난소 생식 세포 종양, 난소 저악성 잠재성 종양, 유방의 파제트병, 판코스트 종양, 췌장암, 췌장암, 췌장암, 갑상선 유두암, 유두종증, 부신경절종, 부비동암, 부갑상선암, 음경암, 혈관주위 상피양 세포 종양, 인두암, 갈색세포종, 중간 분화의 송과체 실질 종양, 송과체종, 뇌하수체 종양, 뇌하수체 선종, 뇌하수체 종양, 형질 세포 신생물, 흉막 폐아세포종, 다배아종, 전구 T-림프아구성 림프종, 원발성 중추 신경계 림프종, 원발성 삼출성 림프종, 원발성 간세포 암, 원발성 간암, 원발성 복막암, 원발성 신경외배엽 종양, 전립선암, 가성 복막종, 직장암, 신장 세포 암종, 15번 염색체의 NUT 유전자 관련 호흡기 암종, 망막아세포종, 횡문근종, 횡문근육종, 리히터의 변형, 천미부 기형종, 침샘암, 육종, 신경초종증, 피지선 암종, 속발성 신생물, 정액종, 장액성 종양, 세르톨리 라이디히 세포 종양, 성대-기질 종양, 세자리 증후군, 반지 세포 암종, 피부암, 작은 청색 원형 세포 종양, 소세포 암종, 소세포 폐암, 소세포 림프종, 소장암, 연조직 육종, 체세포종, 매연성사마귀, 척수 종양, 척추 종양, 비장 변연부 림프종, 편평세포 암종, 위암, 표재 전이 흑색종, 천막상 원시 신경외배엽 종양, 표면 상피 기질 종양, 활막 육종, T 세포 급성 림프아구성 백혈병, T 세포 대과립 림프구 백혈병, T 세포 백혈병, T 세포 림프종, T 세포 전림프구성 백혈병, 기형종, 림프 말기암, 고환암, 포막종, 인후암, 흉선 암종, 흉선종, 갑상선암, 신우 및 요관의 이행 세포암, 이행 세포 암종, 요막관암, 요도암, 비뇨생식기 신생물, 자궁 육종, 포도막 흑색종, 질암, 베르너-모리슨 증후군, 사마귀모양 암종, 시각 경로 신경교종, 외음부암, 발텐스트롬 마크로글로불린혈증, 와르틴 종양, 빌름스 종양, 및 그의 조합을 비롯한 암의 세포를 포함할 수 있다. 일부 실시양태에서, 표적화된 암 세포는 암 줄기 세포와 같은 암 세포 집단 내의 하위집단을 나타낸다. 일부 실시양태에서, 암은 림프종과 같은 조혈 계통의 암이다. 일부 실시양태에서, 암은 비-소세포 폐암(NSCLC: non-small cell lung cancer), 소세포 폐암(SCLC: small cell lung cancer), 또는 임의의 다른 폐암 유형을 포함하는 폐암일 수 있다. 예를 들어, 폐암은 선암종, 편평상피 암종, 대세포(미분화) 암종, 대세포 신경내분비 암종, 선편평 암종, 유육종 암종, 폐 카르시노이드 종양 또는 선양낭성 암종을 포함할 수 있다. 다른 예시적인 폐암은 림프종, 육종, 양성 폐 종양, 또는 과오종을 포함할 수 있다.
a. 항원
일부 실시양태에서, 본원에서는 세포질체에 의해 발현되는 적어도 하나의 항원 또는 그의 일부를 포함하는 세포질체를 기술한다. 일부 실시양태에서, 적어도 하나의 항원은 암 세포에 의해 발현 또는 방출되는 항원일 수 있다. 일부 실시양태에서, 적어도 하나의 항원은 병원체에 의해 발현 또는 방출되는 항원일 수 있다. 일부 실시양태에서, 적어도 하나의 항원은 바이러스에 의해 발현 또는 방출되는 항원일 수 있다. 일부 실시양태에서, 적어도 하나의 항원은 박테리아에 의해 발현 또는 방출되는 항원일 수 있다. 일부 실시양태에서, 적어도 하나의 항원은 진균에 의해 발현 또는 방출되는 항원일 수 있다. 일부 실시양태에서, 적어도 하나의 항원은 적어도 하나의 이종성 폴리뉴클레오티드에 의해 코딩될 수 있고, 여기서, 적어도 하나의 이종성 폴리뉴클레오티드는 세포질체의 카르고일 수 있다. 일부 실시양태에서, 이종성 폴리뉴클레오티드는 바이러스 벡터 또는 플라스미드를 포함할 수 있다. 일부 실시양태에서, 세포질체는 이종성 폴리뉴클레오티드를 표적 조직으로 전달한다. 일부 실시양태에서, 적어도 하나의 항원을 포함하거나, 또는 적어도 하나의 항원을 코딩하는 이종성 폴리뉴클레오티드를 포함하는 세포질체는 본 명세서에 기술된 백신의 일부일 수 있다.
일부 실시양태에서, 적어도 하나의 항원, 또는 그의 일부는 암 세포와 발현되거나, 또는 그와 연관된 암 항원일 수 있다. 일부 실시양태에서, 세포질체는 세포질체의 표면 상에서 적어도 하나의 암 항원을 발현한다. 일부 실시양태에서, 세포질체는 적어도 하나의 암 항원을 방출하거나, 또는 분비한다. 일부 실시양태에서, 적어도 하나의 암 항원은 세포질체의 카르고일 수 있다. 일부 실시양태에서, 세포질체은 적어도 하나의 암 항원을 표적 세포 또는 조직으로 전달한다. 암 항원은 본원에 기술된 암 세포 중 어느 하나에 의해 발현될 수 있다. 일부 실시양태에서, 본원에 기술된 세포질체에 의해 발현 또는 방출된 암 항원은 세포질체가 피험체에게 투여될 때 면역 반응(예컨대, B 세포 활성화)을 유발하기에 충분할 수 있다.
일부 실시양태에서, 세포질체는 적어도 하나의 암 항원, 또는 그의 일부를 포함한다. 일부 실시양태에서, 세포질체는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 100, 200, 500, 1000, 2000, 5000, 10000개 이상의 암 항원을 포함한다. 일부 실시양태에서, 암 항원은 암 세포와 발현되거나, 또는 그와 연관된 항원의 펩티딜 서열과 50%, 60%, 70%, 80%, 90%, 95%, 또는 99% 이상 동일하다.
일부 실시양태에서, 세포질체는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 100, 200, 500, 1000, 2000, 5000, 10000개 이상의 항원을 포함한다. 일부 실시양태에서, 항원은 본원에 기술된 항원의 펩티딜 서열과 약 50%, 60%, 70%, 80%, 90%, 95%, 또는 99% 이상 동일하다. 일부 실시양태에서, 항원 또는 그의 일부는 약 5개의 아미노산 내지 약 5,000개의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 항원 또는 그의 일부는 약 5개의 아미노산 내지 약 10개의 아미노산, 약 5개의 아미노산 내지 약 15개의 아미노산, 약 5개의 아미노산 내지 약 20개의 아미노산, 약 5개의 아미노산 내지 약 25개의 아미노산, 약 5개의 아미노산 내지 약 50개의 아미노산, 약 5개의 아미노산 내지 약 100개의 아미노산, 약 5개의 아미노산 내지 약 200개의 아미노산, 약 5개의 아미노산 내지 약 500개의 아미노산, 약 5개의 아미노산 내지 약 1,000개의 아미노산, 약 5개의 아미노산 내지 약 2,000개의 아미노산, 약 5개의 아미노산 내지 약 5,000개의 아미노산, 약 10 아미노산 내지 약 15개의 아미노산, 약 10 아미노산 내지 약 20개의 아미노산, 약 10 아미노산 내지 약 25개의 아미노산, 약 10 아미노산 내지 약 50개의 아미노산, 약 10 아미노산 내지 약 100개의 아미노산, 약 10 아미노산 내지 약 200개의 아미노산, 약 10 아미노산 내지 약 500개의 아미노산, 약 10 아미노산 내지 약 1,000개의 아미노산, 약 10 아미노산 내지 약 2,000개의 아미노산, 약 10 아미노산 내지 약 5,000개의 아미노산, 약 15개의 아미노산 내지 약 20개의 아미노산, 약 15개의 아미노산 내지 약 25개의 아미노산, 약 15개의 아미노산 내지 약 50개의 아미노산, 약 15개의 아미노산 내지 약 100개의 아미노산, 약 15개의 아미노산 내지 약 200개의 아미노산, 약 15개의 아미노산 내지 약 500개의 아미노산, 약 15개의 아미노산 내지 약 1,000개의 아미노산, 약 15개의 아미노산 내지 약 2,000개의 아미노산, 약 15개의 아미노산 내지 약 5,000개의 아미노산, 약 20 아미노산 내지 약 25개의 아미노산, 약 20 아미노산 내지 약 50개의 아미노산, 약 20 아미노산 내지 약 100개의 아미노산, 약 20 아미노산 내지 약 200개의 아미노산, 약 20 아미노산 내지 약 500개의 아미노산, 약 20 아미노산 내지 약 1,000개의 아미노산, 약 20 아미노산 내지 약 2,000개의 아미노산, 약 20 아미노산 내지 약 5,000개의 아미노산, 약 25개의 아미노산 내지 약 50개의 아미노산, 약 25개의 아미노산 내지 약 100개의 아미노산, 약 25개의 아미노산 내지 약 200개의 아미노산, 약 25개의 아미노산 내지 약 500개의 아미노산, 약 25개의 아미노산 내지 약 1,000개의 아미노산, 약 25개의 아미노산 내지 약 2,000개의 아미노산, 약 25개의 아미노산 내지 약 5,000개의 아미노산, 약 50 아미노산 내지 약 100개의 아미노산, 약 50 아미노산 내지 약 200개의 아미노산, 약 50 아미노산 내지 약 500개의 아미노산, 약 50 아미노산 내지 약 1,000개의 아미노산, 약 50 아미노산 내지 약 2,000개의 아미노산, 약 50 아미노산 내지 약 5,000개의 아미노산, 약 100개의 아미노산 내지 약 200개의 아미노산, 약 100개의 아미노산 내지 약 500개의 아미노산, 약 100개의 아미노산 내지 약 1,000개의 아미노산, 약 100개의 아미노산 내지 약 2,000개의 아미노산, 약 100개의 아미노산 내지 약 5,000개의 아미노산, 약 200개의 아미노산 내지 약 500개의 아미노산, 약 200개의 아미노산 내지 약 1,000개의 아미노산, 약 200개의 아미노산 내지 약 2,000개의 아미노산, 약 200개의 아미노산 내지 약 5,000개의 아미노산, 약 500개의 아미노산 내지 약 1,000개의 아미노산, 약 500개의 아미노산 내지 약 2,000개의 아미노산, 약 500개의 아미노산 내지 약 5,000개의 아미노산, 약 1,000개의 아미노산 내지 약 2,000개의 아미노산, 약 1,000개의 아미노산 내지 약 5,000개의 아미노산, 또는 약 2,000개의 아미노산 내지 약 5,000개의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 암 항원은 약 5개의 아미노산, 약 10개의 아미노산, 약 15개의 아미노산, 약 20개의 아미노산, 약 25개의 아미노산, 약 50개의 아미노산, 약 100개의 아미노산, 약 200개의 아미노산, 약 500개의 아미노산, 약 1,000개의 아미노산, 약 2,000개의 아미노산, 또는 약 5,000개의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 암 항원은 적어도 약 5개의 아미노산, 약 10개의 아미노산, 약 15개의 아미노산, 약 20개의 아미노산, 약 25개의 아미노산, 약 50개의 아미노산, 약 100개의 아미노산, 약 200개의 아미노산, 약 500개의 아미노산, 약 1,000개의 아미노산, 또는 약 2,000개의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 암 항원은 최대 약 10개의 아미노산, 약 15개의 아미노산, 약 20개의 아미노산, 약 25개의 아미노산, 약 50개의 아미노산, 약 100개의 아미노산, 약 200개의 아미노산, 약 500개의 아미노산, 약 1,000개의 아미노산, 약 2,000개의 아미노산, 또는 약 5,000개의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 암 항원은 적어도 약 5개의 아미노산 내지 약 5,000개의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 암 항원은 적어도 약 5개의 아미노산 내지 약 10개의 아미노산, 약 5개의 아미노산 내지 약 15개의 아미노산, 약 5개의 아미노산 내지 약 20개의 아미노산, 약 5개의 아미노산 내지 약 25개의 아미노산, 약 5개의 아미노산 내지 약 50개의 아미노산, 약 5개의 아미노산 내지 약 100개의 아미노산, 약 5개의 아미노산 내지 약 200개의 아미노산, 약 5개의 아미노산 내지 약 500개의 아미노산, 약 5개의 아미노산 내지 약 1,000개의 아미노산, 약 5개의 아미노산 내지 약 2,000개의 아미노산, 약 5개의 아미노산 내지 약 5,000개의 아미노산, 약 10 아미노산 내지 약 15개의 아미노산, 약 10 아미노산 내지 약 20개의 아미노산, 약 10 아미노산 내지 약 25개의 아미노산, 약 10 아미노산 내지 약 50개의 아미노산, 약 10 아미노산 내지 약 100개의 아미노산, 약 10 아미노산 내지 약 200개의 아미노산, 약 10 아미노산 내지 약 500개의 아미노산, 약 10 아미노산 내지 약 1,000개의 아미노산, 약 10 아미노산 내지 약 2,000개의 아미노산, 약 10 아미노산 내지 약 5,000개의 아미노산, 약 15개의 아미노산 내지 약 20개의 아미노산, 약 15개의 아미노산 내지 약 25개의 아미노산, 약 15개의 아미노산 내지 약 50개의 아미노산, 약 15개의 아미노산 내지 약 100개의 아미노산, 약 15개의 아미노산 내지 약 200개의 아미노산, 약 15개의 아미노산 내지 약 500개의 아미노산, 약 15개의 아미노산 내지 약 1,000개의 아미노산, 약 15개의 아미노산 내지 약 2,000개의 아미노산, 약 15개의 아미노산 내지 약 5,000개의 아미노산, 약 20 아미노산 내지 약 25개의 아미노산, 약 20 아미노산 내지 약 50개의 아미노산, 약 20 아미노산 내지 약 100개의 아미노산, 약 20 아미노산 내지 약 200개의 아미노산, 약 20 아미노산 내지 약 500개의 아미노산, 약 20 아미노산 내지 약 1,000개의 아미노산, 약 20 아미노산 내지 약 2,000개의 아미노산, 약 20 아미노산 내지 약 5,000개의 아미노산, 약 25개의 아미노산 내지 약 50개의 아미노산, 약 25개의 아미노산 내지 약 100개의 아미노산, 약 25개의 아미노산 내지 약 200개의 아미노산, 약 25개의 아미노산 내지 약 500개의 아미노산, 약 25개의 아미노산 내지 약 1,000개의 아미노산, 약 25개의 아미노산 내지 약 2,000개의 아미노산, 약 25개의 아미노산 내지 약 5,000개의 아미노산, 약 50 아미노산 내지 약 100개의 아미노산, 약 50 아미노산 내지 약 200개의 아미노산, 약 50 아미노산 내지 약 500개의 아미노산, 약 50 아미노산 내지 약 1,000개의 아미노산, 약 50 아미노산 내지 약 2,000개의 아미노산, 약 50 아미노산 내지 약 5,000개의 아미노산, 약 100개의 아미노산 내지 약 200개의 아미노산, 약 100개의 아미노산 내지 약 500개의 아미노산, 약 100개의 아미노산 내지 약 1,000개의 아미노산, 약 100개의 아미노산 내지 약 2,000개의 아미노산, 약 100개의 아미노산 내지 약 5,000개의 아미노산, 약 200개의 아미노산 내지 약 500개의 아미노산, 약 200개의 아미노산 내지 약 1,000개의 아미노산, 약 200개의 아미노산 내지 약 2,000개의 아미노산, 약 200개의 아미노산 내지 약 5,000개의 아미노산, 약 500개의 아미노산 내지 약 1,000개의 아미노산, 약 500개의 아미노산 내지 약 2,000개의 아미노산, 약 500개의 아미노산 내지 약 5,000개의 아미노산, 약 1,000개의 아미노산 내지 약 2,000개의 아미노산, 약 1,000개의 아미노산 내지 약 5,000개의 아미노산, 또는 약 2,000개의 아미노산 내지 약 5,000개의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 항원 또는 그의 일부는 적어도 약 5개의 아미노산, 약 10개의 아미노산, 약 15개의 아미노산, 약 20개의 아미노산, 약 25개의 아미노산, 약 50개의 아미노산, 약 100개의 아미노산, 약 200개의 아미노산, 약 500개의 아미노산, 약 1,000개의 아미노산, 약 2,000개의 아미노산, 또는 약 5,000개의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 암 항원은 적어도 적어도 약 5개의 아미노산, 약 10개의 아미노산, 약 15개의 아미노산, 약 20개의 아미노산, 약 25개의 아미노산, 약 50개의 아미노산, 약 100개의 아미노산, 약 200개의 아미노산, 약 500개의 아미노산, 약 1,000개의 아미노산, 또는 약 2,000개의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 암 항원은 적어도 최대 약 10개의 아미노산, 약 15개의 아미노산, 약 20개의 아미노산, 약 25개의 아미노산, 약 50개의 아미노산, 약 100개의 아미노산, 약 200개의 아미노산, 약 500개의 아미노산, 약 1,000개의 아미노산, 약 2,000개의 아미노산, 또는 약 5,000개의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 항원 또는 그의 일부는 최대 약 5개의 아미노산 내지 약 5,000개의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 암 항원은 최대 약 5개의 아미노산 내지 약 10개의 아미노산, 약 5개의 아미노산 내지 약 15개의 아미노산, 약 5개의 아미노산 내지 약 20개의 아미노산, 약 5개의 아미노산 내지 약 25개의 아미노산, 약 5개의 아미노산 내지 약 50개의 아미노산, 약 5개의 아미노산 내지 약 100개의 아미노산, 약 5개의 아미노산 내지 약 200개의 아미노산, 약 5개의 아미노산 내지 약 500개의 아미노산, 약 5개의 아미노산 내지 약 1,000개의 아미노산, 약 5개의 아미노산 내지 약 2,000개의 아미노산, 약 5개의 아미노산 내지 약 5,000개의 아미노산, 약 10 아미노산 내지 약 15개의 아미노산, 약 10 아미노산 내지 약 20개의 아미노산, 약 10 아미노산 내지 약 25개의 아미노산, 약 10 아미노산 내지 약 50개의 아미노산, 약 10 아미노산 내지 약 100개의 아미노산, 약 10 아미노산 내지 약 200개의 아미노산, 약 10 아미노산 내지 약 500개의 아미노산, 약 10 아미노산 내지 약 1,000개의 아미노산, 약 10 아미노산 내지 약 2,000개의 아미노산, 약 10 아미노산 내지 약 5,000개의 아미노산, 약 15개의 아미노산 내지 약 20개의 아미노산, 약 15개의 아미노산 내지 약 25개의 아미노산, 약 15개의 아미노산 내지 약 50개의 아미노산, 약 15개의 아미노산 내지 약 100개의 아미노산, 약 15개의 아미노산 내지 약 200개의 아미노산, 약 15개의 아미노산 내지 약 500개의 아미노산, 약 15개의 아미노산 내지 약 1,000개의 아미노산, 약 15개의 아미노산 내지 약 2,000개의 아미노산, 약 15개의 아미노산 내지 약 5,000개의 아미노산, 약 20 아미노산 내지 약 25개의 아미노산, 약 20 아미노산 내지 약 50개의 아미노산, 약 20 아미노산 내지 약 100개의 아미노산, 약 20 아미노산 내지 약 200개의 아미노산, 약 20 아미노산 내지 약 500개의 아미노산, 약 20 아미노산 내지 약 1,000개의 아미노산, 약 20 아미노산 내지 약 2,000개의 아미노산, 약 20 아미노산 내지 약 5,000개의 아미노산, 약 25개의 아미노산 내지 약 50개의 아미노산, 약 25개의 아미노산 내지 약 100개의 아미노산, 약 25개의 아미노산 내지 약 200개의 아미노산, 약 25개의 아미노산 내지 약 500개의 아미노산, 약 25개의 아미노산 내지 약 1,000개의 아미노산, 약 25개의 아미노산 내지 약 2,000개의 아미노산, 약 25개의 아미노산 내지 약 5,000개의 아미노산, 약 50 아미노산 내지 약 100개의 아미노산, 약 50 아미노산 내지 약 200개의 아미노산, 약 50 아미노산 내지 약 500개의 아미노산, 약 50 아미노산 내지 약 1,000개의 아미노산, 약 50 아미노산 내지 약 2,000개의 아미노산, 약 50 아미노산 내지 약 5,000개의 아미노산, 약 100개의 아미노산 내지 약 200개의 아미노산, 약 100개의 아미노산 내지 약 500개의 아미노산, 약 100개의 아미노산 내지 약 1,000개의 아미노산, 약 100개의 아미노산 내지 약 2,000개의 아미노산, 약 100개의 아미노산 내지 약 5,000개의 아미노산, 약 200개의 아미노산 내지 약 500개의 아미노산, 약 200개의 아미노산 내지 약 1,000개의 아미노산, 약 200개의 아미노산 내지 약 2,000개의 아미노산, 약 200개의 아미노산 내지 약 5,000개의 아미노산, 약 500개의 아미노산 내지 약 1,000개의 아미노산, 약 500개의 아미노산 내지 약 2,000개의 아미노산, 약 500개의 아미노산 내지 약 5,000개의 아미노산, 약 1,000개의 아미노산 내지 약 2,000개의 아미노산, 약 1,000개의 아미노산 내지 약 5,000개의 아미노산, 또는 약 2,000개의 아미노산 내지 약 5,000개의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 암 항원은 최대 약 5개의 아미노산, 약 10개의 아미노산, 약 15개의 아미노산, 약 20개의 아미노산, 약 25개의 아미노산, 약 50개의 아미노산, 약 100개의 아미노산, 약 200개의 아미노산, 약 500개의 아미노산, 약 1,000개의 아미노산, 약 2,000개의 아미노산, 또는 약 5,000개의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 암 항원은 최대 적어도 약 5개의 아미노산, 약 10개의 아미노산, 약 15개의 아미노산, 약 20개의 아미노산, 약 25개의 아미노산, 약 50개의 아미노산, 약 100개의 아미노산, 약 200개의 아미노산, 약 500개의 아미노산, 약 1,000개의 아미노산, 또는 약 2,000개의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 암 항원은 최대 최대 약 10개의 아미노산, 약 15개의 아미노산, 약 20개의 아미노산, 약 25개의 아미노산, 약 50개의 아미노산, 약 100개의 아미노산, 약 200개의 아미노산, 약 500개의 아미노산, 약 1,000개의 아미노산, 약 2,000개의 아미노산, 또는 약 5,000개의 아미노산인 아미노산 길이를 포함한다.
일부 실시양태에서, 세포질체는 세포질체의 표면 상에서 항원을 발현한다. 일부 실시양태에서, 세포질체는 항원을 방출하거나 분비한다. 일부 실시양태에서, 항원은 세포질체의 카르고일 수 있다. 일부 실시양태에서, 세포질체는 항원을 표적 세포 또는 조직에 전달한다. 일부 실시양태에서, 본원에 기술된 세포질체에 의해 발현 또는 방출된 항원은 세포질체가 피험체에게 투여될 때 면역 반응(예컨대, B 세포 활성화)을 유발하기에 충분할 수 있다.
일부 실시양태에서, 항원 또는 그의 일부는 암 항원이다. 일부 실시양태에서, 암 항원은 암 세포 내로 도입되는 병원체 항원이다. 예를 들어, 세포질체는 SARS-CoV-2 바이러스의 스파이크 단백질을 암 세포에 도입하도록 조작될 수 있다. 상기 시나리오에서, SARS-CoV-2에 대해 백신 접종을 받은 피험체는 암 세포를 표적화하고, 그를 사멸시킬 수 있는 적응 면역계를 획득하였을 것이다. 일부 실시양태에서, 암 항원은 (세포질체 내로 로딩된) mRNA를 암 세포로 도입하기 위한 벡터로서 종양용해성 바이러스를 이용함으로써 암 세포 내로 도입될 수 있다.
일부 실시양태에서, 적어도 하나의 항원은 병원체 항원일 수 있다. 일부 실시양태에서, 병원체 항원은 바이러스 항원, 박테리아 항원, 진균 항원, 또는 독소 항원이다. 항원은 본원에 기술된 것 중 어느 하나(예컨대, 표 3-6의 병원체 중 어느 하나)에 의해 발현될 수 있다. 일부 실시양태에서, 적어도 하나의 항원은 바이러스 항원일 수 있다. 바이러스 항원은 본원에 기술된 바이러스(예컨대, SARS-CoV-2)의 항원일 수 있다. 일부 실시양태에서, 항원은 코로나바이러스로부터 유래된다. 일부 실시양태에서, 세포질체는 코로나 바이러스의 스파이크 단백질(S 단백질) 또는 스파이크 단백질의 단편인 적어도 하나의 바이러스 항원을 포함한다. 일부 실시양태에서, 스파이크 단백질 또는 그의 단편은 단량체 또는 삼량체일 수 있다. 일부 실시양태에서, 스파이크 단백질은 사전융합 안정화된 스파이크 단백질이다. 일부 실시양태에서, 코로나바이러스는 SARS-CoV-2이다.
일부 실시양태에서, 스파이크 단백질 또는 그의 단편의 바이러스 항원은 서열 번호 2 또는 8과 50%, 60%, 70%, 80%, 90%, 95%, 또는 99% 이상 동일하다. 일부 실시양태에서, 스파이크 단백질 또는 그의 단편을 포함하는 바이러스 항원은 문헌 [da Silva Filipe, A., Shepherd, J.G., Williams, T. et al. Genomic epidemiology reveals multiple introductions of SARS-CoV-2 from mainland Europe into Scotland. Nat Microbiol 6, 112-122 (2021)](본 문헌의 전문이 본원에서 참조로 포함된다)에 기술된 바와 같은 적어도 하나의 돌연변이 또는 변이체를 포함한다. 일부 실시양태에서, 스파이크 단백질 또는 그의 단편을 포함하는 바이러스 항원은 서열 번호 2 기준으로, Asp614Gly를 포함하는 적어도 하나의 돌연변이를 포함한다.
일부 실시양태에서, 스파이크 단백질 또는 그의 단편의 바이러스 항원은 적어도 5개의 아미노산, 10개의 아미노산, 20개의 아미노산, 25개의 아미노산, 50개의 아미노산, 100개의 아미노산, 200개 이상의 아미노산 또는 5개의 아미노산, 10개의 아미노산, 20개의 아미노산, 25개의 아미노산, 50개의 아미노산, 100개의 아미노산, 200개 이상의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 스파이크 단백질 또는 그의 단편은 세포질체의 표면 상에서 발현된다. 일부 실시양태에서, 스파이크 단백질 또는 그의 단편은 세포질체에 의해 분비된다. 일부 실시양태에서, 스파이크 단백질 또는 그의 단편은 세포질체의 카르고이다. 일부 실시양태에서, 스파이크 단백질 또는 그의 단편은 세포질체에 의해 표적 조직으로 전달된다. 일부 실시양태에서, 스파이크 단백질 또는 그의 단편을 포함하는 세포질체는 피험체에서 면역 반응을 유도할 수 있다. 일부 실시양태에서, 스파이크 단백질 또는 그의 단편을 포함하는 세포질체는 SARS-CoV-2 감염에 대한 적응 면역을 유도 및 부여할 수 있다. 일부 실시양태에서, 스파이크 단백질 또는 그의 단편을 포함하는 세포질체는 SARS-CoV-2 감염을 치료하거나, 또는 예방할 수 있다. 일부 실시양태에서, 세포질체는 세포질체의 표면 상에 스파이크 단백질을 발현한다. 일부 실시양태에서, 세포질체는 스파이크 단백질을 분비한다. 일부 실시양태에서, 세포질체는 스파이크 단백질을 표적 조직으로 전달한다. 일부 실시양태에서, 세포질체는 세포질체의 표면 상에 스파이크 단백질을 발현하고/거나, 스파이크 단백질을 분비하고/거나, 스파이크 단백질을 표적 조직으로 전달한다.
일부 실시양태에서, 세포질체는 뉴클레오캡시드 단백질(N 단백질) 또는 n 단백질의 단편의 적어도 하나의 바이러스 항원을 포함한다. 일부 실시양태에서, 뉴클레오캡시드 단백질 또는 그의 단편의 바이러스 항원은 서열 번호 9와 50%, 60%, 70%, 80%, 90%, 95%, 또는 99% 이상 동일하다. 일부 실시양태에서, 뉴클레오캡시드 단백질 또는 그의 단편의 바이러스 항원은 적어도 5개의 아미노산, 10개의 아미노산, 20개의 아미노산, 25개의 아미노산, 50개의 아미노산, 100개의 아미노산, 200개 이상의 아미노산 또는 5개의 아미노산, 10개의 아미노산, 20개의 아미노산, 25개의 아미노산, 50개의 아미노산, 100개의 아미노산, 200개 이상의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 뉴클레오캡시드 단백질 또는 그의 단편은 세포질체의 표면 상에서 발현된다. 일부 실시양태에서, 뉴클레오캡시드 단백질 또는 그의 단편은 세포질체에 의해 분비된다. 일부 실시양태에서, 뉴클레오캡시드 단백질 또는 그의 단편은 세포질체의 카르고이다. 일부 실시양태에서, 뉴클레오캡시드 단백질 또는 그의 단편은 세포질체에 의해 표적 조직으로 전달된다. 일부 실시양태에서, 뉴클레오캡시드 단백질 또는 그의 단편을 포함하는 세포질체는 피험체에서 면역 반응을 유도할 수 있다. 일부 실시양태에서, 뉴클레오캡시드 단백질 또는 그의 단편을 포함하는 세포질체는 SARS-CoV-2 감염에 대한 적응 면역을 유도 및 부여할 수 있다. 일부 실시양태에서, 뉴클레오캡시드 단백질 또는 그의 단편을 포함하는 세포질체는 SARS-CoV-2 감염을 치료하거나, 또는 예방할 수 있다. 일부 실시양태에서, 세포질체는 세포질체의 표면 상에 뉴클레오캡시드 단백질을 발현한다. 일부 실시양태에서, 세포질체는 뉴클레오캡시드 단백질을 분비한다. 일부 실시양태에서, 세포질체는 뉴클레오캡시드 단백질을 표적 조직으로 전달한다. 일부 실시양태에서, 세포질체는 세포질체의 표면 상에 뉴클레오캡시드 단백질을 발현하고/거나, 뉴클레오캡시드 단백질을 분비하고/거나, 뉴클레오캡시드 단백질을 표적 조직으로 전달한다.
일부 실시양태에서, 세포질체는 막 단백질(M 단백질) 또는 n 단백질의 단편인 적어도 하나의 바이러스 항원을 포함한다. 일부 실시양태에서, 막 단백질 또는 그의 단편의 바이러스 항원은 서열 번호 10과 50%, 60%, 70%, 80%, 90%, 95%, 또는 99% 이상 동일하다. 일부 실시양태에서, 막 단백질 또는 그의 단편의 바이러스 항원은 적어도 5개의 아미노산, 10개의 아미노산, 20개의 아미노산, 25개의 아미노산, 50개의 아미노산, 100개의 아미노산, 200개 이상의 아미노산 또는 5개의 아미노산, 10개의 아미노산, 20개의 아미노산, 25개의 아미노산, 50개의 아미노산, 100개의 아미노산, 200개 이상의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 막 단백질 또는 그의 단편은 세포질체의 표면 상에서 발현된다. 일부 실시양태에서, 막 단백질 또는 그의 단편은 세포질체에 의해 분비된다. 일부 실시양태에서, 막 단백질 또는 그의 단편은 세포질체의 카르고이다. 일부 실시양태에서, 막 단백질 또는 그의 단편은 세포질체에 의해 표적 조직으로 전달된다. 일부 실시양태에서, 막 단백질 또는 그의 단편을 포함하는 세포질체는 피험체에서 면역 반응을 유도할 수 있다. 일부 실시양태에서, 막 단백질 또는 그의 단편을 포함하는 세포질체는 SARS-CoV-2 감염에 대한 적응 면역을 유도 및 부여할 수 있다. 일부 실시양태에서, 막 단백질 또는 그의 단편을 포함하는 세포질체는 SARS-CoV-2 감염을 치료하거나, 또는 예방할 수 있다. 일부 실시양태에서, 세포질체는 세포질체의 표면 상에 막 단백질을 발현한다. 일부 실시양태에서, 세포질체는 막 단백질을 분비한다. 일부 실시양태에서, 세포질체는 막 단백질을 표적 조직으로 전달한다. 일부 실시양태에서, 세포질체는 세포질체의 표면 상에 막 단백질을 발현하고/거나, 막 단백질을 분비하고/거나, 막 단백질을 표적 조직으로 전달한다.
일부 실시양태에서, 세포질체는 외피 단백질(E 단백질) 또는 n 단백질의 단편인 적어도 하나의 바이러스 항원을 포함한다. 일부 실시양태에서, 외피 단백질 또는 그의 단편의 바이러스 항원은 서열 번호 11과 50%, 60%, 70%, 80%, 90%, 95%, 또는 99% 이상 동일하다. 일부 실시양태에서, 외피 단백질 또는 그의 단편의 바이러스 항원은 적어도 5개의 아미노산, 10개의 아미노산, 20개의 아미노산, 25개의 아미노산, 50개의 아미노산, 100개의 아미노산, 200개 이상의 아미노산 또는 5개의 아미노산, 10개의 아미노산, 20개의 아미노산, 25개의 아미노산, 50개의 아미노산, 100개의 아미노산, 200개 이상의 아미노산인 아미노산 길이를 포함한다. 일부 실시양태에서, 외피 단백질 또는 그의 단편은 세포질체의 표면 상에서 발현된다. 일부 실시양태에서, 외피 단백질 또는 그의 단편은 세포질체에 의해 분비된다. 일부 실시양태에서, 외피 단백질 또는 그의 단편은 세포질체의 카르고이다. 일부 실시양태에서, 외피 단백질 또는 그의 단편은 세포질체에 의해 표적 조직으로 전달된다. 일부 실시양태에서, 외피 단백질 또는 그의 단편을 포함하는 세포질체는 피험체에서 면역 반응을 유도할 수 있다. 일부 실시양태에서, 외피 단백질 또는 그의 단편을 포함하는 세포질체는 SARS-CoV-2 감염에 대한 적응 면역을 유도 및 부여할 수 있다. 일부 실시양태에서, 외피 단백질 또는 그의 단편을 포함하는 세포질체는 SARS-CoV-2 감염을 치료하거나, 또는 예방할 수 있다. 일부 실시양태에서, 세포질체는 세포질체의 표면 상에 외피 단백질을 발현한다. 일부 실시양태에서, 세포질체는 외피 단백질을 분비한다. 일부 실시양태에서, 세포질체는 외피 단백질을 표적 조직으로 전달한다. 일부 실시양태에서, 세포질체는 세포질체의 표면 상에 외피 단백질을 발현하고/거나, 외피 단백질을 분비하고/거나, 외피 단백질을 표적 조직으로 전달한다.
일부 실시양태에서, 바이러스 항원은 서열 번호 4-7 중 어느 하나의 단편과 50%, 60%, 70%, 80%, 90%, 95%, 또는 99% 이상 동일한 핵산 서열에 의해 코딩된다. 일부 실시양태에서, 세포질체는 서열 번호 4-7 중 어느 하나의 단편과 100% 동일한 핵산 서열에 의해 코딩된 적어도 하나의 바이러스 항원을 포함한다.
일부 실시양태에서, 바이러스 항원은 코로나바이러스 변이체로부터 유래된 것이다. 일부 실시양태에서, 일부 실시양태에서, 코로나바이러스 변이체 항원은 서열 번호 401-447 또는 551-562 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 코로나바이러스 변이체 항원은 서열 번호 301-347 또는 501-512 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 핵산 서열로부터 코딩된다. 일부 실시양태에서, 코로나바이러스 변이체로부터 유래된 항원을 발현하는 세포질체의 피험체에게로의 투여는 피험체에서 코로나바이러스 변이체에 의한 감염에 대해 면역을 부여하거나, 또는 코로나바이러스 변이체에 의해 유발된 질환의 중증도를 감소시키는 데 치료적으로 효과적이다.
일부 실시양태에서, 바이러스 항원은 조류 코로나 바이러스로부터 유래된 것이다. 일부 실시양태에서, 일부 실시양태에서, 조류 코로나바이러스 항원은 서열 번호 251-260 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 조류 코로나바이러스 항원은 서열 번호 201-209 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 핵산 서열로부터 코딩된다. 일부 실시양태에서, 조류 코로나바이러스로부터 유래된 항원을 발현하는 세포질체의 피험체에게로의 투여는 피험체에서 조류 코로나 바이러스에 의한 감염에 대해 면역을 부여하거나, 또는 조류 코로나 바이러스에 의해 유발된 질환의 중증도를 감소시키는 데 치료적으로 효과적이다.
일부 실시양태에서, 바이러스 항원은 에볼라바이러스로부터 유래된 것이다. 일부 실시양태에서, 항원은 에볼라바이러스 당단백질, 기질 단백질, 핵단백질, 뉴클레오캡시드 단백질(예컨대, VP30, VP35, 또는 VP24), 또는 폴리머라제 (L) 단백질과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일하다. 일부 실시양태에서, 항원은 서열 번호 851-859 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 항원은 서열 번호 801-809 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 핵산 서열로부터 코딩된다. 일부 실시양태에서, 에볼라바이러스로부터 유래된 항원을 발현하는 세포질체의 피험체에게로의 투여는 피험체에서 에볼라바이러스에 의한 감염에 대해 면역을 부여하거나, 또는 에볼라바이러스에 의해 유발된 질환의 중증도를 감소시키는 데 치료적으로 효과적이다.
일부 실시양태에서, 바이러스 항원은 한타바이러스로부터 유래된 것이다. 일부 실시양태에서, 일부 실시양태에서, 항원은 한타바이러스 폴리머라제와 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일하고, M 세그먼트는 두 바이러스 표면 당단백질(Gn 및 Gc)에 대한 전구체(GPC)를 코딩하고, S 세그먼트는 뉴클레오캡시드(N) 단백질을 코딩한다. 일부 실시양태에서, 항원은 서열 번호 151-154 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 항원은 서열 번호 101-104 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 핵산 서열로부터 코딩된다. 일부 실시양태에서, 한타바이러스로부터 유래된 항원을 발현하는 세포질체의 피험체에게로의 투여는 피험체에서 한타바이러스에 의한 감염에 대해 면역을 부여하거나, 또는 한타바이러스에 의해 유발된 질환의 중증도를 감소시키는 데 치료적으로 효과적이다.
일부 실시양태에서, 바이러스 항원은 인간 면역결핍 바이러스(HIV: human immunodeficiency virus)로부터 유래된 것이다. 일부 실시양태에서, 일부 실시양태에서, HIV 항원은 서열 번호 651-660 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, HIV 항원은 서열 번호 601-610 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 핵산 서열로부터 코딩된다. 일부 실시양태에서, HIV로부터 유래된 항원을 발현하는 세포질체의 피험체에게로의 투여는 피험체에서 HIV에 의한 감염에 대해 면역을 부여하거나, 또는 HIV에 의해 유발된 질환의 중증도를 감소시키는 데 치료적으로 효과적이다.
일부 실시양태에서, 바이러스 항원은 호흡기 세포융합 바이러스(RSV: respiratory syncytial virus), 예컨대, RSV 멤피스(Memphis) 37로부터 유래된 것이다. 일부 실시양태에서, 일부 실시양태에서, RSV 항원은 서열 번호 751-761 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, RSV 항원은 서열 번호 701-711 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 핵산 서열로부터 코딩된다. 일부 실시양태에서, RSV로부터 유래된 항원을 발현하는 세포질체의 피험체에게로의 투여는 피험체에서 RSV에 의한 감염에 대해 면역을 부여하거나, 또는 RSV에 의해 유발된 질환의 중증도를 감소시키는 데 치료적으로 효과적이다.
일부 실시양태에서, 세포질체는 복수의 바이러스 항원을 포함할 수 있고, 여기서, 바이러스 항원은 동일한 것이다(예컨대, 바이러스 항원으로서 스파이크 단백질만을 포함하는 세포질체). 일부 실시양태에서, 세포질체는 복수의 바이러스 항원을 포함할 수 있고, 여기서, 바이러스 항원은 상이한 것이다. 예를 들어, 세포질체는 스파이크 단백질, 뉴클레오캡시드 단백질, 막 단백질, 또는 외피 단백질의 조합을 포함하는 바이러스 항원을 포함할 수 있다. 일부 실시양태에서, 세포질체는 세포질체의 표면 상에 발현될 수 있고/거나, 세포질체에 의해 캡슐화될 수 있고/거나, 세포질체에 의해 분비될 수 있는 바이러스 항원의 조합을 포함할 수 있다.
일부 실시양태에서, 항원은 박테리아로부터 유래된 것이다. 박테리아는 그람-양성 박테리아일 수 있다. 일부 실시양태에서, 박테리아는 그람-음성 박테리아일 수 있다. 일부 실시양태에서, 박테리아는 β-락타마제에 내성인 균주이다. 일부 실시양태에서, 항원은 장독소생성 에스케리키아 콜라이(ETEC), 시가 독소 생성 에스케리키아 콜라이(STEC), 캄필로박터 제주니, 슈도모나스 아에루기노사, 아시네토박터 바우마니이, 스트렙토코쿠스 뮤탄스, 헬리코박터 파이로리, 또는 바실러스 안트라시스로부터 유래된 것이다.
일부 실시양태에서, 박테리아 항원은 바실러스 안트라시스(예컨대, 탄저균)로부터 유래된 것이다. 일부 실시양태에서, 박테리아 항원은 방어 항원(PA: protective antigen), 및 두 효소 성분, 부종 인자(EF: edema factor) 및 치사 인자(LF: lethal factor)와 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일하다. 일부 실시양태에서, 박테리아 항원은 서열 번호 1151-1153 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 박테리아 항원은 서열 번호 1101-1103 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 핵산 서열로부터 코딩된다. 일부 실시양태에서,바실러스 안트라시스로부터 유래된 박테리아 항원을 발현하는 세포질체의 피험체에게로의 투여는 피험체에서 바실러스 안트라시스에 의한 감염에 대해 면역을 부여하거나, 또는 바실러스 안트라시스에 의해 유발된 질환의 중증도를 감소시키는 데 치료적으로 효과적이다.
일부 실시양태에서, 박테리아 항원은 클로스트리디움으로부터 유래된 것이다. 일부 실시양태에서, 일부 실시양태에서, 클로스트리디움 항원은 서열 번호 951-984 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 클로스트리디움 항원은 서열 번호 901-934 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 핵산 서열로부터 코딩된다. 일부 실시양태에서, 클로스트리디움으로부터 유래된 항원을 발현하는 세포질체의 피험체에게로의 투여는 피험체에서 클로스트리디움에 의한 감염에 대해 면역을 부여하거나, 또는 클로스트리디움에 의해 유발된 질환의 중증도를 감소시키는 데 치료적으로 효과적이다.
일부 실시양태에서, 백신 항원은 리신으로부터 유래된 것이다. 일부 실시양태에서, 일부 실시양태에서, 리신 항원은 서열 번호 1051-1057 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 리신 항원은 서열 번호 1001-1007 중 하나 이상의 것과 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 핵산 서열로부터 코딩된다. 일부 실시양태에서, 리신으로부터 유래된 항원을 발현하는 세포질체의 피험체에게로의 투여는 피험체에서 리신에 의한 감염에 대해 면역을 부여하거나, 또는 리신에 의해 유발된 독성 효과를 감소시키는 데 치료적으로 효과적이다.
일부 실시양태에서, 항원은 융합 단백질일 수 있으며, 여기서, 본원에 기술된 단백질 중 어느 하나 또는 그의 단편은 또 다른 펩티드와 융합될 수 있다. 일부 실시양태에서, 본원에 기술된 항원은 세포막 단백질 또는 막횡단 단백질과 융합될 수 있다. 예시적인 세포막 단백질 또는 막횡단 단백질은 CD63, CD81, CD82, CD47, 이종삼량체 G 단백질, MHC 클래스 I, 인테그린, 트랜스페린 수용체(TFR2), LAMP1/2, 헤파란 술페이트 프로테오글리칸, EMMPRIN, ADAM10, GPI 고정 5'뉴클레오티다제, CD73, 보체 결합 단백질 CD55 및 CD59, 소닉 헤지호그(SHH: sonic hedgehog), TSPAN8, CD37, CD53, CD9, PECAM1, ERBB2, EPCAM, CD90, CD45, CD41, CD42a, 글리코포린 A, CD14, MHC 클래스 II, CD3, 아세틸콜린에스터라제/AChE-S, AChE-E, 아밀로이드 베타 A4/APP, 및 다중약물 내성 연관 단백질을 포함할 수 있다.
일부 실시양태에서, 항원은 글리코실-포스파티딜이노시톨(GPI) 또는 B7-1 항원(B7-1) 세포질 테일과 융합될 수 있다. 일부 실시양태에서, 항원은 알부민과 융합될 수 있다. 일부 실시양태에서, 항원은 분자 클램프를 포함하는 폴리펩티드와 함께 발현될 수 있다. 일부 실시양태에서, 분자 클램프는 동일한 세포질체에서 항원과 함께 발현될 때 항원을 사전융합 형태로 유지한다. 일부 실시양태에서, 분자 클램프는 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15개 이상의 아미노산 잔기마다 반복되는 패턴을 코딩하는 폴리펩티드를 포함한다. . 일부 실시양태에서, 분자 클램프를 코딩하는 폴리펩티드의 길이는 적어도 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개 이상의 아미노산 잔기 길이이다. 일부 실시양태에서, 분자 클램프는 한 가닥은 정방향으로 진행되고, 나머지 다른 한 가닥은 역방향으로 진행되는 트윈 나선으로 자가 조립된다. 일부 실시양태에서, 가닥에서 아미노산의 쌍 형성은 소수성 및 친수성 아미노산의 패턴에 의해 보장된다. 일부 실시양태에서, 패턴은 클램프 중 어느 것도 바이러스 항원에 결합하지 않도록 배열된다. 일부 실시양태에서, 분자 클램프는 강성 로드로 자가 조립된다. 일부 실시양태에서, 분자 클램프는 링커에 의해 바이러스 항원의 원하는 부분에 연결되며, 이는 분자 클램프를 발현하는 세포질체가 혼합물로부터 정제되도록 하는 것과 같은 다른 기능을 수행할 수 있다.
일부 실시양태에서, 항원은 종양 항원, 또는 그의 일부, 예컨대, 알파태아단백질(AFP: 알파fetoprotein), 암배아 항원(CEA: carcino배아 antigen), CA0125, MUC-1, 상피 종양 항원(ETA: epithelium tumor antigen)이다. 일부 실시양태에서, 항원은 일반적으로 알려진 임의의 암 에피토프와 적어도 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 일부 실시양태에서, 종양 항원 또는 그의 일부를 발현하는 세포질체의 피험체에게로의 투여는 피험체를 종양바이러스에 의한 감염에 대해 면역화하거나, 또는 종양바이러스에 의해 유발된 암의 중증도를 감소시키는 데 치료적으로 효과적이다.
b. 이종성 핵산
일부 실시양태에서, 본원에서는 적어도 하나의 이종성 폴리뉴클레오티드를 포함하는 백신을 기술한다. 이종성일 수 있는 폴리뉴클레오티드의 비제한적 예는 유전자 또는 유전자 단편의 코딩 또는 비코딩 영역, 연결 분석으로부터 정의된 유전자좌들(유전자좌), 엑손, 인트론, 메신저 RNA(mRNA), 자가 증폭 RNA, 우리딘 함유 RNA(uRNA: uridine containing RNA), 자가 증폭 mRNA, 전달 RNA(tRNA: transfer RNA), 리보솜 RNA(rRNA: ribosomal RNA), 짧은 간섭 RNA(siRNA: short interfering RNA), 짧은 헤어핀 RNA(shRNA), 마이크로RNA(miRNA), 리보자임, cDNA, 재조합 폴리뉴클레오티드, 분지형 폴리뉴클레오티드, 플라스미드, 벡터, 임의의 서열의 단리된 DNA, 임의의 서열의 단리된 RNA, 무세포 DNA(cfDNA: cell-free DNA) 및 무세포 RNA(cfRNA: cell-free RNA)를 비롯한 무세포 폴리뉴클레오티드, 핵산 프로브 및 프라이머를 포함한다. 뉴클레오티드의 서열은 뉴클레오티드가 아닌 성분에 의해 중단될 수 있다. 일부 실시양태에서, 이종성 폴리뉴클레오티드로부터 번역된 항원은 피험체에서 면역 반응을 유도할 수 있다. 일부 실시양태에서, 이종성 폴리뉴클레오티드로부터 번역된 항원은 피험체에서 본원에 기술된 병원체 중 어느 하나에 의해 유발된 감염에 대한 적응 면역을 부여할 수 있다. 일부 실시양태에서, 이종성 폴리뉴클레오티드로부터 번역된 항원은 피험체에서 본원에 기술된 병원체 중 어느 하나에 의해 유발된 병원성 감염을 치료하거나, 또는 예방할 수 있다.
일부 실시양태에서, 이종성 폴리뉴클레오티드는 본원에 기술된 면역조정제 중 하나 이상의 것을 코딩할 수 있다. 일부 실시양태에서, 면역조정제는 본원에 기술된 항원 중 어느 하나에 의해 유도된 면역 반응을 증강시킨다. 일부 실시양태에서, 면역조정제는 Ii-키(Ii-key)/MHC 클래스 II 에피토프 펩티드이다. 일부 실시양태에서, 면역조정제는 본원에 기술된 사이토카인 중 어느 하나이다. 일부 실시양태에서, 이종성 폴리뉴클레오티드는 본원에 기술된 귀소 단백질 중 하나 이상의 것 또는 귀소 수용체 중 하나 이상의 것을 코딩할 수 있다. 일부 실시양태에서, 귀소 단백질은 세포질체에 의해 분비될 수 있다. 일부 실시양태에서, 귀소 수용체는 세포질체의 표면 상에서 발현될 수 있다. 일부 실시양태에서, 하나 이상의 귀소 수용체는 림프 조직의 하나 이상의 세포에서 발현된 하나 이상의 리간드에 특이적일 수 있고, 림프 조직의 세포는 내피 세포, 림프구, 대식세포 또는 망상 세포, 또는 그의 조합을 포함할 수 있다.
일부 실시양태에서, 이종성 폴리뉴클레오티드는 본원에 기술된 표적화 모이어티 중 하나 이상의 것을 코딩할 수 있다. 일부 실시양태에서, 이종성 폴리뉴클레오티드는 본원에 기술된 면역조정제 중 하나 이상의 것을 코딩할 수 있다. 일부 실시양태에서, 이종성 폴리뉴클레오티드는 본원에 기술된 귀소 수용체 중 하나 이상의 것을 코딩할 수 있다. 일부 실시양태에서, 이종성 폴리뉴클레오티드는 본원에 기술된 귀소 단백질 중 하나 이상의 것을 코딩할 수 있다. 일부 실시양태에서, 이종성 폴리뉴클레오티드는 본원에 기술된 항바이러스 조성물 중 하나 이상의 것을 코딩할 수 있다.
일부 실시양태에서, 이종성 폴리뉴클레오티드는 바이러스 항원을 코딩하는 이종성 DNA 서열을 포함한다. 일부 실시양태에서, 이종성 DNA 서열은 orf1a, orf1ab, 스파이크 단백질(S 단백질), 3a, 3b, 외피 단백질(E 단백질), 막 단백질(M 단백질), p6, 7a, 7b, 8b, 9b, 뉴클레오캡시드 단백질(N 단백질), orf14, nsp1(리더 단백질), nsp2, nsp3, nsp4, nsp5(3C 유사 프로테이나제), nsp6, nsp7, nsp8, nsp9, nsp10(성장 인자 유사 단백질), nsp12(RNA 의존성 RNA 폴리머라제, 또는 RdRp), nsp13(RNA 5'-트리포스파타제), nsp14(3'에서 5'로의 엑소뉴클레아제), nsp15(엔도RNAse), 및 nsp16(2'-O-리보스 메틸트랜스퍼라제) 중 어느 하나를 코딩한다. 일부 실시양태에서, 세포질체는 스파이크 단백질 또는 그의 단편을 코딩하는 이종성 DNA 서열을 포함한다. 일부 실시양태에서, 세포질체는 뉴클레오캡시드 단백질 또는 그의 단편을 코딩하는 이종성 DNA 서열을 포함한다. 일부 실시양태에서, 세포질체는 막 단백질 또는 그의 단편을 코딩하는 이종성 DNA 서열을 포함한다. 일부 실시양태에서, 세포질체는 외피 단백질 또는 그의 단편을 코딩하는 이종성 DNA 서열을 포함한다. 일부 실시양태에서, 이종성 폴리뉴클레오티드는 하나 이상의 항원을 코딩하는 하나 이상의 이종성 DNA 서열을 포함할 수 있다. 예를 들어, 이종성 폴리뉴클레오티드는 S 단백질 항원 및 N 단백질 항원을 코딩할 수 있다. 일부 실시양태에서, 이종성 DNA 서열은 본원에 기술된 상이한 바이러스 항원 중 어느 하나를 코딩할 수 있다. 일부 실시양태에서, 세포질체는 이종성 DNA 서열을 바이러스 항원으로 전사 및 번역한다. 일부 실시양태에서, 세포질체는 이종성 DNA 서열을 표적 조직으로 전달하고, 여기서, 이종성 DNA 서열은 전사된 후, 이어서, 표적 조직에 의해 바이러스 항원으로 번역된다. 일부 실시양태에서, 이종성 폴리뉴클레오티드는 본원에 기술된 항원 중 어느 하나를 코딩하는 이종성 DNA 서열을 포함하는 플라스미드를 포함한다. 일부 실시양태에서, 세포질체는 SARS-CoV-2의 스파이크 단백질로부터 유래된 항원을 코딩하는 핵산을 포함하는 DNA 백신(GX-19)을 포함하는 SARS-CoV-2 백신을 포함한다.
일부 실시양태에서, 적어도 하나의 이종성 폴리뉴클레오티드는 서열 번호 4-7 중 어느 하나의 단편과 약 50%, 60%, 70%, 80%, 90%, 95%, 또는 99% 이상 동일하다. 일부 실시양태에서, 적어도 하나의 이종성 폴리뉴클레오티드는 서열 번호 4-7 중 어느 하나의 단편과 약 100% 동일하다. 일부 실시양태에서, 적어도 하나의 이종성 폴리뉴클레오티드는 서열 번호 8의 단편과 약 50%, 60%, 70%, 80%, 90%, 95%, 또는 99% 이상 동일한 바이러스 항원을 코딩한다. 일부 실시양태에서, 적어도 하나의 이종성 폴리뉴클레오티드는 서열 번호 8의 단편과 100% 동일한 바이러스 항원을 코딩한다. 일부 실시양태에서, 적어도 하나의 이종성 폴리뉴클레오티드는 서열 번호 9의 단편과 약 50%, 60%, 70%, 80%, 90%, 95%, 또는 99% 이상 동일한 바이러스 항원을 코딩한다. 일부 실시양태에서, 적어도 하나의 이종성 폴리뉴클레오티드는 서열 번호 9의 단편과 100% 동일한 바이러스 항원을 코딩한다. 일부 실시양태에서, 적어도 하나의 이종성 폴리뉴클레오티드는 서열 번호 10의 단편과 약 50%, 60%, 70%, 80%, 90%, 95%, 또는 99% 이상 동일한 바이러스 항원을 코딩한다. 일부 실시양태에서, 적어도 하나의 이종성 폴리뉴클레오티드는 서열 번호 10의 단편과 100% 동일한 바이러스 항원을 코딩한다. 일부 실시양태에서, 적어도 하나의 이종성 폴리뉴클레오티드는 서열 번호 11의 단편과 약 50%, 60%, 70%, 80%, 90%, 95%, 또는 99% 이상 동일한 바이러스 항원을 코딩한다. 일부 실시양태에서, 적어도 하나의 이종성 폴리뉴클레오티드는 서열 번호 11의 단편과 100% 동일한 바이러스 항원을 코딩한다.
일부 실시양태에서, 일부 실시양태에서, 이종성 폴리뉴클레오티드는 바이러스 항원을 코딩하는 이종성 RNA 서열을 포함한다. 일부 실시양태에서, 이종성 RNA 서열은 바이러스 항원을 코딩하는 mRNA 서열을 포함한다. 일부 실시양태에서, mRNA는 orf1a, orf1ab, 스파이크 단백질(S 단백질), 3a, 3b, 외피 단백질(E 단백질), 막 단백질(M 단백질), p6, 7a, 7b, 8b, 9b, 뉴클레오캡시드 단백질(N 단백질), orf14, nsp1(리더 단백질), nsp2, nsp3, nsp4, nsp5(3C 유사 프로테이나제), nsp6, nsp7, nsp8, nsp9, nsp10(성장 인자 유사 단백질), nsp12(RNA 의존성 RNA 폴리머라제, 또는 RdRp), nsp13(RNA 5'-트리포스파타제), nsp14(3'에서 5'로의 엑소뉴클레아제), nsp15 (endoRNAse), 및 nsp16(2'-O-리보스 메틸트랜스퍼라제) 중 어느 하나를 코딩한다. 일부 실시양태에서, 세포질체는 스파이크 단백질 또는 그의 단편을 코딩하는 mRNA를 포함한다. 일부 실시양태에서, 세포질체는 뉴클레오캡시드 단백질 또는 그의 단편을 코딩하는 mRNA를 포함한다. 일부 실시양태에서, 세포질체는 막 단백질 또는 그의 단편을 코딩하는 mRNA를 포함한다. 일부 실시양태에서, 세포질체는 외피 단백질 또는 그의 단편을 코딩하는 mRNA를 포함한다. 일부 실시양태에서, 이종성 폴리뉴클레오티드는 하나 이상의 mRNA를 포함할 수 있다. 일부 실시양태에서, mRNA 서열은 본원에 기술된 상이한 바이러스 항원 중 어느 하나를 코딩할 수 있다. 일부 실시양태에서, 세포질체는 mRNA를 바이러스 항원으로 번역한다. 일부 실시양태에서, 세포질체는 mRNA를 표적 조직으로 전달하고, 여기서, mRNA는 표적 조직에 의해 바이러스 항원으로 번역된다. 일부 실시양태에서, mRNA는 자가 증폭 mRNA(saRNA: self-amplifying mRNA)이다. 일부 실시양태에서, mRNA는 우리딘을 포함한다(uRNA). 일부 실시양태에서, 세포질체는 전장, 사전융합 안정화된 스파이크(S) 단백질을 코딩하는 mRNA(mRNA-1273)를 포함하는 SARS-CoV-2 백신을 포함한다. 일부 실시양태에서, 이종성 폴리뉴클레오티드는 본원에 기술된 항원 중 하나 이상의 것을 코딩하는 하나 이상의 이종성 RNA 서열을 포함한다. 일부 실시양태에서, 세포질체는 SARS-CoV-2의 단백질로부터 유래된 항원을 코딩하는 mRNA를 포함하는 SARS-CoV-2 백신(mRNA-LNP 백신)을 포함한다. mRNA는 캡슐화되어 지질 나노입자를 사용하여 전달된다.
일부 실시양태에서, 세포질체는 바이러스 항원을 코딩하는 적어도 하나의 이종성 폴리뉴클레오티드를 포함하는 DNA 또는 RNA 벡터를 포함한다. 일부 실시양태에서, DNA 또는 RNA 벡터는 플라스미드일 수 있다. 일부 실시양태에서, DNA 또는 RNA 벡터는 바이러스 벡터일 수 있다. 바이러스 벡터, 특히, 레트로바이러스 벡터는 본원에 기술된 바이러스 항원 중 어느 하나를 코딩하는 핵산 서열을 포함하도록 조작될 수 있고, 세포질체에 의해 표적 조직으로 전달될 수 있다. 일부 실시양태에서, 바이러스 벡터는 렌티바이러스, 폭스바이러스, 단순 헤르페스 바이러스 I, 아데노바이러스 및 아데노 관련 바이러스 등으로부터 유래될 수 있다. 예시적인 바이러스 벡터는 레트로바이러스 벡터, 아데노바이러스 벡터, 아데노 연관 바이러스 벡터(AAV), 복제 결핍 침팬지 아데노바이러스, ChAdOx1, 뉴캐슬병 바이러스 벡터, M2-결핍 단일 복제(M2SR: M2-deficient single replication) 인플루엔자 벡터, 폭스 벡터, 파보바이러스 벡터, 배큘로바이러스 벡터, 홍역 바이러스 벡터, 수포성 구내염 바이러스(VSV) 벡터 또는 단순 헤르페스 바이러스 벡터(HSV)를 포함한다. 일부 실시양태에서, 레트로바이러스 벡터는 감마 레트로바이러스 벡터, 예컨대, 몰로니 뮤린 백혈병 바이러스(MoMLV, MMLV, MuLV, 또는 MLV: Moloney Murine Leukemia Virus) 또는 뮤린 줄기 세포 바이러스(MSCV: Murine Steam cell Virus) 게놈으로부터 유래된 벡터를 포함한다. 일부 실시양태에서, 레트로바이러스 벡터는 또한 렌티바이러스 벡터, 예컨대, 인간 면역결핍 바이러스(HIV) 게놈으로부터 유래된 것을 포함한다. 일부 실시양태에서, AAV 벡터는 AAV1, AAV2, AAV4, AAV5, AAV6, AAV7, AAV8, 또는 AAV9 혈청형을 포함한다. 일부 실시양태에서, 바이러스 벡터는 2개 이상의 바이러스로부터의 바이러스 부분을 포함하는 키메라 바이러스 벡터이다. 추가 경우에, 바이러스 벡터는 재조합 바이러스 벡터이다. 일부 실시양태에서, 세포질체는 SARS-CoV-2의 S 단백질 또는 그의 단편을 코딩하는 핵산을 포함하는 SARS-CoV-2 백신(Gam-COVID-Vac 또는 Gam-COVID-Vac lyo) 비-복제 바이러스 벡터를 포함한다. 일부 실시양태에서, 세포질체는 SARS-CoV-2의 스파이크(S) 단백질 핵산 서열을 포함하는 아데노바이러스 벡터(Ad5-nCoV)를 포함하는 SARS-CoV-2 백신을 포함한다. 일부 실시양태에서, 세포질체는 SARS-CoV-2의 스파이크(S) 단백질을 발현하도록 조작된 복제 결핍 침팬지 아데노바이러스, ChAdOx1을 포함하는 SARS-CoV-2 백신을 포함한다. 일부 실시양태에서, 세포질체는 SARS-CoV-2의 단백질로부터 유래된 항원을 코딩하는 핵산을 포함하는 비복제성 아데노바이러스 벡터(AdVac)를 포함하는 SARS-CoV-2 백신을 포함한다. 일부 실시양태에서, AdVac 백신은 PER.C6 세포로 제조된다. 일부 실시양태에서, 세포질체는 인서트로서 스파이크(S) 단백질을 코딩하는 핵산과 함께 INO-4800 pGX DNA 플라스미드를 포함하는 SARS-CoV-2 백신을 포함한다. 일부 실시양태에서, 세포질체는 SARS-CoV-2(BNT162)의 스파이크(S) 단백질 또는 그의 단편을 발현하는 mRNA 또는 변형된 mRNA를 포함하는 SARS-CoV-2 백신을 포함한다. 일부 실시양태에서, 세포질체는 SARS-CoV-2의 스파이크 단백질 또는 그의 단편을 코딩하는 핵산을 포함하는 홍역 벡터를 포함하는 SARS-CoV-2 백신을 포함한다. 일부 실시양태에서, 세포질체는 주사 후 전기천공을 통해 피험체의 근육으로 전달된 스파이크 단백질을 코딩하는 DNA를 포함하는 SARS-CoV-2 백신을 포함한다.
c. 불활성화된 병원체 및 그의 일부
일부 실시양태에서, 세포질체는 불활성화된 병원체(예컨대, 바이러스, 박테리아, 기생충 또는 진균), 또는 그의 일부를 포함한다. 일부 실시양태에서, 불활성화된 병원체는 불활성화된 바이러스 또는 그의 일부이다. 일부 실시양태에서, 불활성화된 바이러스는 본원에 기술된 바이러스 중 어느 하나이다. 일부 실시양태에서, 불활성화된 바이러스는 코로나 바이러스, 한타바이러스, 에볼라바이러스, 인플루엔자 바이러스, 호흡기 세포융합 바이러스, 로타바이러스, 노로바이러스, 간염 바이러스, 또는 돼지 생식기 및 호흡기 증후군 바이러스로부터 유래된 것이다. 일부 실시양태에서, 불활성화된 바이러스는 코로나바이러스로부터 유래된 것이다. 일부 실시양태에서, 불활성화된 바이러스는 예컨대, SARS-CoV-2와 같은 베타코로나바이러스이다. 일부 실시양태에서, 불활성화된 바이러스는 불활성화된 SARS-CoV-2이다.
일부 실시양태에서, 세포질체는 불활성화된 SARS-CoV-2를 포함한다. 일부 실시양태에서, SARS-CoV-2는 Wuhan 균주에 대한 전장 아미노산 서열과 비교하여 Asp614Gly, Pro323Leu, Ile599Val, pro585Ser,Phe308Tyr, Thr141Ile, Asp248Glu, Thr85Ile, Ala18Val, Asn439Lys, Glu251Val, Pro10Ser, Ser194Leu, Ser197Leu, Gly196Val, Leu108Phe, Gln213Lys, Leu84Ser, Thr175Met, Ser563Leu, Val13Leu, Gln57His, 또는 Thr14Ile를 포함하는 돌연변이를 포함한다.
일부 실시양태에서, 불활성화된 SARS-CoV-2를 포함하는 세포질체는 불활성화된 SARS-CoV-2를 포함하는 세포질체가 피험체의 면역 세포에 의해 포식될 때, 피험체에서 SARS-CoV-2에 대한 면역 반응 및 적응 면역을 유도한다. 세포질체를 포식하면, 면역 세포는 불활성화된 SARS-CoV-2와 접촉한 후, SARS-CoV-2에 대한 적응 면역 반응을 발생시킨다. 일부 실시양태에서, 불활성화된 SARS-CoV-2 바이러스는 포르말린 불활성화된 SARS-CoV-2 바이러스이다. 일부 실시양태에서, 세포질체는 베로 세포 배양물로부터 수득된 포르말린 불활성화된 SARS-CoV-2 바이러스를 포함하는 SARS-CoV-2 백신(PiCoVacc)을 포함한다. 일부 실시양태에서, 세포질체는 바실리 칼메트 구에린(BCG: Bacille Calmette-Guerin)을 포함하는 SARS-CoV-2 백신을 포함한다. 일부 실시양태에서, 세포질체는 SARS0-CoV-2의 스파이크 단백질을 발현하도록 조작된 비피도박테리아를 포함하는 SARS-CoV-2 백신(bacTRL-스파이크)을 포함한다. 일부 실시양태에서, 세포질체는 미세바늘 어레이의 사용을 통해 SARS-CoV-2의 스파이크(S) 단백질 또는 그의 단편을 전달하는 것을 포함하는 SARS-CoV-2 백신(PittCoVacc)을 포함한다. 일부 실시양태에서, 세포질체는 SARS-CoV-2의 스파이크 단백질의 사전융합 형태를 포함하는 다중 재조합 나노입자 백신을 포함하는 SARS-CoV-2 백신(NVX-CoV2373)을 포함한다. 일부 실시양태에서, NVX-CoV2373을 포함하는 세포질체는 애주번트 또는 면역조정제를 포함한다. 일부 실시양태에서, 세포질체는 SARS-CoV-2의 바이러스 구조를 모방하는 바이러스 유사 입자(VLP: virus-like particle)를 포함하는 SARS-CoV-2 백신을 포함하며, 여기서, VLP는 식물 기반 제조산 방법으로부터 제조된다. 일부 실시양태에서, 세포질체는 SARS-CoV-2의 스파이크 단백질을 코딩하는 mRNA를 포함하는 SARS-CoV-2 백신(LUNAR-COV19)을 포함한다. mRNA는 캡슐화되고, 지질 매개 전달 시스템을 통해 전달된다. 일부 실시양태에서, 세포질체는 스파이크 단백질로부터 유래된 항원을 포함하는 SARS-CoV-2 백신을 포함하고, 상기 백신은 T 세포의 공동 자극제인 gp96 및 OX40L을 추가로 포함한다. 일부 실시양태에서, 세포질체는 SARS-CoV-2의 스파이크 단백질 또는 그의 단편을 코딩하는 핵산을 포함하는 복제 결핍 아데노바이러스 5(RD-Ad5) 벡터를 포함하는 SARS-CoV-2 백신(T-COVIDTM)을 포함하고, 여기서, T-COVIDTM 백신은 비강 전달용으로 제조된 것이다. 일부 실시양태에서, SARS-CoV-2 백신을 포함하는 세포질체는 임의의 적합한 경로, 예컨대, 피하, 정맥내, 동맥, 안구, 경구, 근육내, 비강내(예를 들어, 흡입), 복강내, 국소, 점막, 경막외, 설하, 경피, 양막외, 관절간, 진피내, 골내, 척추강내, 자궁내, 질내, 방광내, 유리체내, 혈관주위, 및/또는 직장 투여용으로, 또는 공지된 투여 방법의 임의 조합을 위해 제제화된다.
일부 실시양태에서, 불활성화된 바이러스는 필로바이러스(에볼라, 마버그) 및 아레나바이러스(라사, 마추포)를 비롯한, 바이러스성 출혈 열을 유발하는 바이러스로부터 유래된 것이다. 일부 실시양태에서, 불활성화 바이러스는 바이러스성 뇌염을 유발하는 바이러스(알파바이러스, 예컨대, 동부 말 뇌염, 베네수엘라 말 뇌염, 및 서부 말 뇌염)로부터 유래된 것이다. 일부 실시양태에서, 불활성화된 바이러스는 한타바이러스, 에볼라바이러스, 인플루엔자 바이러스, 호흡기 세포융합 바이러스, 로타바이러스, 노로바이러스, 간염 바이러스, 또는 돼지 생식기 및 호흡기 증후군 바이러스로부터 유래된 것이다.
일부 실시양태에서, 불활성화된 병원체는 불활성화된 박테리아, 또는 그의 일부이다. 일부 실시양태에서, 항원은 불활성화된 박테리아로부터 유래된 것이다.불활성화된 박테리아는 그람-양성 박테리아로부터 유래된 것일 수 있다. 일부 실시양태에서, 불활성화된 박테리아는 그람-음성 박테리아로부터 유래된 것일 수 있다. 일부 실시양태에서, 불활성화된 박테리아는 β-락타마제에 내성인 균주로부터 유래된 것일 수 있다. 일부 실시양태에서, 불활성화된 박테리아는 장독소생성 에스케리키아 콜라이(ETEC), 시가 독소 생성 에스케리키아 콜라이(STEC), 캄필로박터 제주니, 슈도모나스 아에루기노사, 아시네토박터 바우마니이, 스트렙토코쿠스 뮤탄스, 헬리코박터 파이로리, 또는 바실러스 안트라시스로부터 유래된 것일 수 있다. 일부 실시양태에서, 불활성화된 박테리아는 브루셀라병 박테리아(브루셀라 종), 클로스트리디움 페르프린겐스의 엡실론 독소로부터 유래된 것일 수 있다. 식품 안전 위협(살모넬라 종, 에스케리키아 콜라이 O157:H7, 시겔라), 마비저(Glander)(부르크홀데리아 말레이), 멜리오이도시스(Melioidosis)(부르크홀데리아 슈도말레이), 앵무병(Psittacosis)(클라미디아 시타시), Q 열(콕시엘라 번에티이), 리시누스 코무니스로부터의 리신 독소(피마자), 포도상구균 장독소 B, 발진티프스(Typhus fever)(리케차 프로와제키), 물 안전 위협(비브리오 콜레라에, 크립토스포리디움 파르붐), 탄저균(바실러스 안트라시스), 보툴리눔독소증(클로스트리디움 보툴리눔 독소), 역병(예르시니아 페스티스), 천연두(바리올라 마요르), 또는 야토병(프란시셀라 툴라렌시스)
2. 추가의 외인성 작용제
본 개시내용의 세포질체는 예컨대, 면역조정제와 같은 추가의 외인성 작용제를 발현하도록 조작될 수 있다. 일부 실시양태에서, 세포질체는 본원에 기술된 하나 이상의 면역조정제를 포함한다. 면역조정제는 피험체에서 면역 반응을 직접 또는 간접적으로 자극하는 분자일 수 있다. 일부 실시양태에서, 면역조정제는 피험체에서 적응 면역 반응을 유도하기 위한 면역 활성제일 수 있다. 일부 실시양태에서, 면역 활성제는 피험체, 예를 들어, 증식성 질환 또는 장애를 앓는 피험체에서 과민성 면역계를 억제하기 위한 면역 억제제일 수 있다. 일부 실시양태에서, 면역조정제는 세포질체의 표면 상에서 발현될 수 있다. 일부 실시양태에서, 면역조정제는 세포질체에 의해 방출될 수 있다. 일부 실시양태에서, 면역조정제는 세포질체에 의해 분비될 수 있다. 일부 실시양태에서, 면역조정제는 세포질체의 카르고일 수 있다. 일부 실시양태에서, 면역조정제는 본원에 기술된 항원과 융합된 펩티드 또는 단백질일 수 있다. 일부 실시양태에서, 면역조정제는 애주번트일 수 있다.
비제한적 예에서, 면역조정제는 면역 세포 표면 상의 동족 수용체에 결합함으로써 면역 반응을 직접 자극할 수 있으며, 이는 면역 세포가 사이토카인을 방출하도록 유발하여 면역 세포를 활성화시킨다. 일부 실시양태에서, 면역 세포의 활성화는 바이러스에 대한 적응 면역의 발생을 촉진시킨다. 또 다른 예로서, 면역조정제는 표적 세포에 의한 IL-10 생산 및 분비를 억제하고/거나, 조절 T 세포의 활성을 억제함으로써 면역 반응을 간접적으로 자극하여, 그 결과로, 예를 들어, 면역 세포에 의한 항종양 반응을 증가시킨다. 대조적으로, 면역 억제제로 작용하는 면역조정제는 피험체에서 면역 반응을 직접 또는 간접적으로 억제할 수 있다.
특정 실시양태에서, 면역조정제는 패턴 인식 수용체(PRR: pattern recognition receptor)를 표적화한다. 이들 수용체는 병원체와 같은 감염원에 대한 반응으로 면역계의 활성화를 프라이밍할 수 있는 막횡단 또는 엔도솜내 단백질일 수 있다. PRR은 병원체 연관 분자 패턴(PAMP: pathogen-associated molecular pattern) 분자 및 손상 관련 분자 패턴(DAMP: damage-associated molecular pattern) 분자를 인식할 수 있다. PRR은 막 결합 PRR일 수 있다. PRR은 세포질 PRR일 수 있다. 막 결합 PRR에는 톨 유사 수용체 및 만노스 수용체 및 아시알로당단백질 수용체와 같은 C형 렉틴 수용체를 포함한다. 세포질체 PRR은 NOD 유사 수용체 및 RIG-I 유사 수용체를 포함한다.
특정 실시양태에서, 면역조정제는 손상 관련 분자 패턴(DAMP) 분자 또는 병원체 연관 분자 패턴(PAMP) 분자, 예컨대, DAMP 효능제 또는 PAMP 효능제이다. DAMP 분자 및 PAMP 분자는 예컨대, 톨 유사 수용체(TLR: Toll-like receptor), Nod 유사 수용체, C형 렉틴 및 RIG-I 유사 수용체와 같은 선천성 면역계의 수용체에 의해 인식될 수 있다. 특정 실시양태에서, 면역조정제는 톨 유사 수용체 효능제, STING 효능제 또는 RIG-I 효능제이다. DAMP 분자의 예로는 예컨대, 염색질 관련 단백질 고이동성 그룹 박스 1(HMGB1: high-mobility 군 box 1)와 같은 단백질, 히알루로난 단편과 같은 단백질 및 글리칸의 칼슘 조절 패밀리의 S100 분자, 및 글리칸 접합체를 포함할 수 있다. DAMP 분자는 아폽토시스 또는 괴사 후 종양 세포에서 방출될 때 DNA와 같은 핵산일 수도 있다. 추가 DAMP 핵산의 예로는 핵 또는 미토콘드리아 외부에 존재하는 ATP, 아데노신 및 요산과 같은 RNA 및 퓨린 대사산물을 포함할 수 있다.
일부 실시양태에서, 면역조정제는 세포질 DNA 센서로 작용할 수 있는 인터페론 조절 인자(IRF: Interferon Regulatory Factor) 또는 인터페론 유전자의 자극제(STING: stimulator of interferon gene)에 의해 인식되는 사이클릭 디뉴클레오티드로 불리는 세포질 DNA 및 박테리아 핵산이다. 인터페론 조절 인자(IRF)에 의해 인식되는 화합물은 TLR 및 다른 패턴 인식 수용체에 의한 면역조정에 역할을 할 수 있다.
면역조정제는 톨 유사 수용체(TLR) 효능제일 수 있다. 면역조정제는 RIG-I 유사 수용체 리간드일 수 있다. 면역조정제는 C형 렉틴 수용체 리간드일 수 있다. 면역조정제는 NOD 유사 수용체 리간드일 수 있다.
일부 실시양태에서, 면역조정제는 TLR 효능제. 일부 실시양태에서, 면역조정제는 동물 종에 따라 TLR1, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9, TLR10, TLR11, TLR12 또는 TLR13 효능제로 구성된 군으로부터 선택된다.
일부 실시양태에서, 면역조정제 활성제는 (a) 열 사멸 박테리아 생성물, 바람직하게, HKAL, HKEB, HKHP, HKLM, HKLP, HKLR, HKMF, HKPA, HKPG, 또는 HKSA, HKSP, 및 (b) 세포벽 성분 생성물, 바람직하게, LAM, LM, LPS, LIA, LIA, PGN, FSL, Pam2CSK4, Pam3CSK4, 또는 지모산(Zymosan)을 포함하는 TLR2의 리간드이다.
일부 실시양태에서, 면역조정제는 린타톨리모드, 폴리-ICLC, RIBOXXON®, Apoxxim, RIBOXXIM®, IPH-33, MCT-465, MCT-475, 및 ND-1.1로 구성된 군으로부터 선택되는 TLR3의 리간드이다.
일부 실시양태에서, 면역조정제는 LPS, MPLA 또는 피리미도[5,4-b]인돌, 예컨대, WO 2014/052828에 기술된 것(캘리포니아 대학교(U of Cal))에 기술된 것, AZ126(N-(2-(사이클로펜틸아미노)-2-옥소-1-(피리딘-4-일)에틸)-N-(4-메톡시페닐)-3-메틸-5-페닐-1H-피롤-2-카복사미드) 또는 AZ368((E)-3-(4-(2-(사이클로펜틸아미노)-1-(N-(4-이소프로필페닐)-1,5-디페닐-1H-피라졸-3-카복사미도)-2-옥소에틸)페닐)아크릴산)로 구성된 군으로부터 선택되는 TLR4의 리간드이다.
일부 실시양태에서, 면역조정제는 FLA 및 플라젤린(Flagellin)으로 구성된 군으로부터 선택되는 TLR5의 리간드이다. 일부 실시양태에서, 면역조정제는 TLR6의 리간드이다. 특정 실시양태에서, 면역조정제는 TLR7 효능제 및/또는 TLR8 효능제이다. 특정 실시양태에서, 면역조정제는 TLR7 효능제이다. 특정 실시양태에서, 면역조정제는 TLR8 효능제이다. 일부 실시양태에서, 면역조정제는 TLR8이 아닌, TLR7에 대해 선택적으로 효능작용한다. 다른 실시양태에서, 면역자극제는 TLR7이 아닌, TLR8에 대해 효능작용한다.
특정 실시양태에서, 면역조정제는 TLR7 효능제이다. 특정 실시양태에서, TLR7 효능제는 이미다조퀴놀린, 이미다조퀴놀린 아민, 티아조퀴놀린, 아미노퀴놀린, 아미노퀴나졸린, 피리도 [3,2-d]피리미딘-2,4-디아민, 피리미딘-2,4-디아민, 2-아미노이미다졸, 1-알킬-1H-벤즈이미다졸-2-아민, 테트라하이드로피리도피리미딘, 헤테로아로티아디아지드-2,2-디옥시드, 벤조나프티리딘, 구아노신 유사체, 아데노신 유사체, 티미딘 동종중합체, ssRNA, CpG-A, 폴리G10, 및 폴리G3으로부터 선택된다. 특정 실시양태에서, TLR7 효능제는 이미다조퀴놀린, 이미다조퀴놀린 아민, 티아조퀴놀린, 아미노퀴놀린, 아미노퀴나졸린, 피리도 [3,2-d]피리미딘-2,4-디아민, 피리미딘-2,4-디아민, 2-아미노이미다졸, 1-알킬-1H-벤즈이미다졸-2-아민, 테트라하이드로피리도피리미딘, 헤테로아로티아디아지드-2,2-디옥시드 또는 벤조나프티리딘으로부터 선택되되, 구아노신 유사체, 아데노신 유사체, 티미딘 동종중합체, ssRNA, CpG-A, 폴리G10, 및 폴리G3 이외의 것이다. 일부 실시양태에서, TLR7 효능제는 비자연적으로 발생된 화합물이다. TLR7 조정제의 예로는 GS-9620, GSK-2245035, 이미퀴모드, 레시퀴모드, DSR-6434, DSP-3025, IMO-4200, MCT-465, MEDI-9197, 3M-051, SB-9922, 3M-052, Limtop, TMX-30X, TMX-202, RG-7863, RG-7795, 및 US20160168164(Janssen), US 20150299194(Roche), US20110098248(Gilead Sciences), US20100143301(Gilead Sciences), 및 US20090047249(Gilead Sciences)에 개시된 화합물을 포함한다. 일부 실시양태에서, TNF알파 또는 IFN알파 생산을 측정하는 PBMC 검정법에 의하면, TLR7 효능제의 EC50 값은 500 nM 이하이다. 일부 실시양태에서, TNF알파 또는 IFN알파 생산을 측정하는 PBMC 검정법에 의하면, TLR7 효능제의 EC50 값은 100 nM 이하이다. 일부 실시양태에서, TNF알파 또는 IFN알파 생산을 측정하는 PBMC 검정법에 의하면, TLR7 효능제의 EC50 값은 50 nM 이하이다. 일부 실시양태에서, TNF알파 또는 IFN알파 생산을 측정하는 PBMC 검정법에 의하면, TLR7 효능제의 EC50 값은 10 nM 이하이다.
특정 실시양태에서, 면역조정제는 TLR8 효능제이다. 특정 실시양태에서, TLR8 효능제는 벤자제핀, 이미다조퀴놀린, 티아졸로퀴놀린, 아미노퀴놀린, 아미노퀴나졸린, 피리도 [3,2-d]피리미딘-2,4-디아민, 피리미딘-2,4-디아민, 2-아미노이미다졸, 1-알킬-1H-벤즈이미다졸-2-아민, 테트라하이드로피리도피리미딘 또는 ssRNA로 구성된 군으로부터 선택된다. 특정 실시양태에서, TLR8 효능제는 벤자제핀, 이미다조퀴놀린, 티아졸로퀴놀린, 아미노퀴놀린, 아미노퀴나졸린, 피리도 [3,2-d]피리미딘-2,4-디아민, 피리미딘-2,4-디아민, 2-아미노이미다졸, 1-알킬-1H-벤즈이미다졸-2-아민, 테트라하이드로피리도피리미딘으로 구성된 군으로부터 선택되고, ssRNA 이외의 것이다. 일부 실시양태에서, 면역조정제는 자연적으로 발생된 TLR8 효능제 또는 벤자제핀 TLR8의 효능제 이외의 TLR8 효능제.
한 실시양태에서, 본원에 기술된 세포질체는 면역 세포의 완전한 활성화에 중요한 비항원 특이적 신호인 공동 자극성 리간드를 포함하는 적어도 하나의 면역조정제를 발현 및/또는 분비할 수 있다. 공동 자극성 리간드는 제한 없이, 종양 괴사 인자(TNF) 리간드, 사이토카인(예컨대, IL-2, IL-12, 1L-15 또는 IL21) 및 면역글로불린(Ig) 슈퍼패밀리 리간드를 포함한다. 종양 괴사 인자(TNF)는 전신 염증에 관여하는 사이토카인이며, 급성기 반응을 자극한다. 그의 주요 역할은 면역 세포의 조절이다. 종양 괴사 인자(TNF) 리간드는 여러 가지 공통된 특징을 공유한다. 리간드 대부분은 짧은 세포질 세그먼트 및 비교적 긴 세포외 영역을 포함하는 II형 막횡단 단백질로서 합성된다. TNF 리간드는 제한 없이, 신경 성장 인자(NGF: nerve growth factor), CD40L(CD40L)/CD154, CD137L/4-1BBL, 종양 괴사 인자 알파(TNFa), CD134L/OX4OL/CD252, CD27L/CD70, Fas 리간드(FasL), CD3OL/CD153, 종양 괴사 인자 f3(TNF(3)/림프독소-알파(LTa), 림프독소-베타(ur(3), CD257/B 세포 활성화 인자(BAFF)/Blys/THANK/Ta11-1, 글루코코르티코이드 유도 TNF 수용체 리간드(GITRL: glucocorticoid-induced TNF Receptor ligand), 및 TNF 관련 아폽토시스 유도 리간드(TRAIL: TNF related apoptosis-inducing ligand), LIGHT(TNFSF14)를 포함한다. 면역글로불린(Ig) 슈퍼패밀리는 세포의 인지, 결합, 또는 부착 프로세스에 관여하는 세포 표면 및 가용성 단백질의 큰 그룹이다. 이러한 단백질은 면역글로불린과 구조적 특징을 공유하며 면역글로불린 도메인(폴드)을 보유한다. 면역글로불린 슈퍼패밀리 리간드는 제한 없이, CD80 및 CD86, CD28에 대한 두 리간드 모두를 포함한다.
일부 실시양태에서, 면역조정제는 애주번트일 수 있다. 일부 실시양태에서, 애주번트는 진통제 애주번트를 포함할 수 있다. 일부 실시양태에서, 애주번트는 알룸, 수산화알루미늄, 인산알루미늄, 또는 수산화인산칼슘과 같은 무기 화합물을 포함할 수 있다. 일부 실시양태에서, 애주번트는 광유 또는 파라핀 오일을 포함할 수 있다. 일부 실시양태에서, 애주번트는 박테리아 생성물, 예컨대, 불활성화된 보르데텔라 페르투시스(Bordetella pertussis), 마이코박테리움 보비스(Mycobacterium bovis), 토르 옥시드를 포함할 수 있다. 일부 실시양태에서, 애주번트는 스쿠알렌과 같은 비박테리아 유기물을 포함할 수 있다. 일부 실시양태에서, 애주번트는 예컨대, 세제(Quil A)와 같은 전달 시스템의 사용을 포함할 수 있다. 일부 실시양태에서, 애주번트는 퀼라자(Quillaja), 대두, 또는 폴리갈라 세네가(Polygala senega)로부터 유래된 사포닌과 같은 식물 사포닌을 포함할 수 있다. 일부 실시양태에서, 애주번트는 프로인트 완전 애주번트 또는 프로인트 불완전 애주번트를 포함할 수 있다. 일부 실시양태에서, 애주번트는 땅콩유와 같은 식품 기반 오일을 포함할 수 있다.
일부 실시양태에서, 세포질체는 본원에 기술된 항바이러스 조성물과 같은 하나 이상의 추가 치료제를 포함한다. 일부 실시양태에서, 하나 이상의 추가 치료제는 치료 DNA 분자, 치료 RNA 분자, 치료 단백질(예컨대, 효소, 항체, 항원, 독소, 사이토카인, 단백질 호르몬, 성장 인자, 세포 표면 수용체 또는 백신), 치료 펩티드(예컨대, 펩티드 호르몬 또는 항원), 소분자 활성제(예컨대, 스테로이드, 폴리케티드, 알칼로이드, 독소, 항생제, 항바이러스제, 콜히친, 탁솔, 미토마이신 또는 엠탄신) 및 치료 유전자 편집 인자 중 어느 하나 또는 그의 임의의 조합일 수 있다.
D. 약학적 조성물, 제제, 투여량, 및 투여 경로
본원에서는 세포질체(예컨대, 본원에 기술된 임의의 세포로부터 수득된 세포질체)을 포함하는 약학적 조성물을 제공한다. 일부 실시양태에서, 조성물은 상이한 투여 경로(예컨대, 정맥내, 피하, 근육내, 안와후, 복강내, 림프절내)를 위해 제제화된다. 일부 실시양태에서, 조성물은 약학적으로 허용되는 담체(예컨대, 포스페이트 완충처리된 염수)를 포함할 수 있다. 용어 "약학적 조성물"은 희석제 또는 담체와 같은 다른 화학 성분과 본원에 개시된 세포질체의 혼합물을 지칭한다. 약학적 조성물은 유기체에의 화합물의 투여를 용이하게 할 수 있다.
일반적으로, 본원에 개시된 방법은 전신 투여에 의해 세포질체 조성물을 투여하는 것을 포함한다. 일부 실시양태에서, 방법은 경구 투여에 의해 세포질체 조성물을 투여하는 것을 포함한다. 일부 실시양태에서, 방법은 복강내 주사에 의해 세포질체 조성물을 투여하는 것을 포함한다. 일부 실시양태에서, 방법은 항문 좌제의 형태로 세포질체 조성물을 투여하는 것을 포함한다. 일부 실시양태에서, 방법은 정맥내("i.v.") 투여에 의해 세포질체 조성물을 투여하는 것을 포함한다. 피하 주사, 근육내 주사, 진피내 주사, 경피 주사, 경피 투여, 비내 투여, 림프내 주사, 직장 투여, 위내 투여, 안내 투여, 뇌실내 투여, 경막내로, 또는 임의의 다른 적합한 비경구 투여와 같은 다른 경로에 의해 본원에 개시된 세포질체 조성물을 투여할 수도 있다고 생각할 수 있다. 일부 실시양태에서, 손상 또는 염증 부위에 더 가까운 국소 전달을 위한 경로가 전신 경로보다 바람직하다. 치료제의 투여 경로, 투여량, 시점 및 기간이 조정될 수 있다. 일부 실시양태에서, 치료제의 투여는 병원체 연관된 질환 또는 병태의 급성 및 만성 증상 중 하나 또는 둘 모두의 발병 전 또는 후이다.
본원에 개시된 질환 또는 병태를 예방하거나, 또는 치료하기 위한 본원에 개시된 세포질체의 유효 용량 및 투여량은 질환 또는 병태, 또는 질환 또는 병태의 증상과 관련된 관찰된 유익한 반응에 의해 정의된다. 유익한 반응은 질환 또는 병태, 또는 질환 또는 병태의 증상을 예방, 완화, 정지 또는 치료하는 것을 포함한다. 일부 실시양태에서, 유익한 반응은 피험체에서 바이오마커, 전사체 위험 프로파일, 또는 장내 마이크로바이옴의 존재, 수준 또는 활성의 측정가능한 개선을 검출함으로써 측정될 수 있다. 본원에 사용된 "개선"은 상기 존재, 수준 또는 활성이 정상 개체(예컨대, 질환 또는 병태를 앓지 않는 개체)에서 관찰되는 존재, 수준 또는 활성으로 이동하는 것을 지칭한다. 세포질체 조성물이 치료적으로 효과적이지 않거나, 질환 또는 병태, 또는 질환 또는 병태의 증상의 충분한 완화를 제공하지 않는 경우, 투여량 및/또는 투여 경로가 변경될 수 있거나, 추가 작용제가 세포질체 조성물과 함께 피험체에게 투여될 수 있다. 일부 실시양태에서, 환자가 세포질체 조성물의 요법을 시작함에 따라, 환자는 또한 제2 치료 요법을 중단한다(예컨대, 용량의 단계적 감소).
일부 실시양태에서, 본원에서는 본원에 기술된 세포질체 조성물의 전달에 적합한 약학적으로 허용되는 부형제 및 담체 용액의 제제 뿐만 아니라, 다양한 치료 요법에서 본원에 기술된 특정 조성물을 사용하기 위한 적합한 투약 및 치료 요법을 개시한다. 일부 실시양태에서, 각각의 치료적으로 유용한 조성물에서 제조될 수 있는 치료 유전자 발현 생성물의 양은 화합물의 임의의 주어진 단위 용량에서 적합한 투여량이 수득되는 방식이다. 예컨대, 용해도, 생체이용성, 생물학적 반감기, 투여 경로, 제품 저장 수명 뿐만 아니라, 다른 약리학적 고려사항과 같은 인자는 이러한 약학적 제제를 제조하는 기술분야의 숙련가에 의해 고려될 것이며, 그 자체로 다양한 투여량 및 치료 요법이 바람직할 수 있다. 일부 실시양태에서, 세포질체 조성물은 안내, 유리체내, 비경구, 피하, 정맥내, 뇌실내, 근육내, 경막내, 경구, 복강내, 경구 또는 비강 흡입에 의해, 또는 하나 이상의 세포, 조직 또는 기관에 직접 주사에 의해 전달되는 본원에 개시된 약학적 조성물로 적합하게 제제화된다.
일부 실시양태에서, 주사가능한 용도에 적합한 세포질체 조성물의 약학적 형태는 멸균 수용액 또는 분산액, 및 멸균 주사 용액 또는 분산액의 즉석 제조를 위한 멸균 분말을 포함한다. 담체는 예를 들어, 물, 에탄올, 폴리올(예컨대, 글리세롤, 프로필렌 글리콜, 및 액체 폴리에틸렌 글리콜 등), 그의 적합한 혼합물, 및/또는 식물성 오일을 함유하는 용매 또는 분산 매질일 수 있다. 적절한 유동성은 예를 들어, 레시틴과 같은 코팅의 사용, 분산액인 경우, 필요한 입자 크기의 유지 및 계면활성제의 사용에 의해 유지될 수 있다. 미생물 작용의 방지는 다양한 항박테리아제 및 항진균제, 예를 들어, 파라벤, 클로로부탄올, 페놀, 소르브산, 티메로살 등에 의해 이루어질 수 있다. 많은 경우에, 등장제, 예를 들어, 당 또는 염화나트륨을 포함하는 것이 바람직할 것이다. 주사가능한 조성물의 연장된 흡수는 흡수를 지연시키는 작용제, 예를 들어, 알루미늄 모노스테아레이트 및 젤라틴의 조성물에서의 사용에 의해 야기될 수 있다.
일부 실시양태에서, 주사 가능한 수용액의 투여를 위해, 예를 들어, 용액은 필요하다면 적절하게 완충처리될 수 있고, 액체 희석제는 먼저 충분한 염수 또는 당과 등장성이 된다. 이러한 특정 수용액은 정맥내, 근육내, 피하 및 복강내 투여에 특히 적합하다. 투여량의 약간의 변화는 치료받는 피험체의 상태에 따라 필연적으로 이루어질 것이다. 투여 담당자는 어떤 경우에도 개별 피험체에 대한 적절한 용량을 결정할 것이다. 더욱이, 인간 투여의 경우, 제제는 FDA 생물의약품 표준 사무국에서 요구하는 무균, 발열성 및 일반 안전 및 순도 표준을 충족하여야 한다.
다른 약학적 조성물은 임의적으로 미생물 활성을 억제하기 위해 하나 이상의 보존제를 포함한다. 적합한 보존제로는 메르펜 및 티오메르살과 같은 수은 함유 물질; 안정화된 이산화염소; 염화벤즈알코늄, 브롬화세틸트리메틸암모늄, 염화세틸피리디늄 등의 4급 암모늄 화합물 등을 포함한다.
한 실시양태에서, 본원에 기술된 수성 현탁액 및 분산액은 적어도 4시간 동안 균질한 상태로 유지된다. 한 실시양태에서, 수성 현탁액은 1분 미만 동안 지속되는 물리적 교반에 의해 균질한 현탁액으로 재현탁된다. 또 다른 실시양태에서, 균질한 수성 분산액을 유지하기 위해 교반이 필요하지 않다.
비강 투여용 에어로졸 제제는 일반적으로 점적제 또는 스프레이로 비강에 투여되도록 디자인된 수성 액제이다. 비강용 액제는 일반적으로 등장성이고, 약 5.5 내지 약 6.5의 pH를 유지하기 위해 약간 완충처리된다는 점에서 비강 분비물과 유사할 수 있지만, 이 범위 밖의 pH 값이 추가로 사용될 수 있다. 항미생물제 또는 보존제 또한 제제에 포함될 수 있다.
흡입제 및 흡입제용 에어로졸 제제는 비강 또는 구강 호흡 경로에 의해 투여될 때 작용제 또는 작용제의 조합이 피험체의 호흡기계로 운반되도록 디자인될 수 있다. 흡입용 액제는 예를 들어, 분무기에 의해 투여될 수 있다. 미세 분말 또는 액체 약물을 포함하는 흡입 또는 취입은 예를 들어, 분배를 돕기 위해 추진제 내의 제제 또는 제제 조합의 용액 또는 현탁액의 약학적 에어로졸로서 호흡계에 전달될 수 있다. 추진제는 할로겐화탄소, 예를 들어, 플루오르화 염소화 탄화수소, 하이드로클로로플루오로카본 및 하이드로클로로카본과 같은 플루오로카본 뿐만 아니라, 탄화수소 및 탄화수소 에테르를 포함하는 액화 가스일 수 있다.
할로카본 추진제는 모든 수소가 불소로 대체된 플루오로카본 추진제, 모든 수소가 염소 및 적어도 하나의 불소로 대체된 클로로플루오로카본 추진제, 및 수소 함유 플루오로카본 추진제, 및 수소 함유 클로로플루오로카본 추진제를 포함할 수 있다. 유용한 탄화수소 추진제는 예를 들어, 프로판, 이소부탄, n-부탄, 펜탄, 이소펜탄 및 네오펜탄을 포함한다. 탄화수소 혼화물도 추진제로 사용할 수 있다. 에테르 추진제는 예를 들어, 디메틸 에테르 및 에테르를 포함한다. 에어로졸 제제는 또한 1 초과의 추진제를 포함할 수 있다. 예를 들어, 에어로졸 제제는 2개 이상의 플루오로카본과 같은 동일한 부류의 1개 초과의 추진제; 또는 1 초과, 2 초과, 3 초과의 상이한 부류의 추진제, 예컨대, 플루오로탄화수소 및 탄화수소를 포함할 수 있다. 본 개시내용의 약학적 조성물은 또한 압축 기체, 예컨대, 이산화탄소, 아산화질소 또는 질소와 같은 불활성 기체와 함께 분배될 수 있다.
에어로졸 제제는 또한 다른 성분, 예를 들어, 에탄올, 이소프로판올, 프로필렌 글리콜 뿐만 아니라, 계면활성제 또는 다른 성분, 예컨대, 오일 및 세제를 포함할 수 있다. 이러한 성분은 제제를 안정화하고/거나, 밸브 성분을 윤활하는 역할을 할 수 있다.
에어로졸 제제는 압력하에 포장될 수 있고, 액제, 현탁제, 에멀젼, 분말 및 반고체 제제를 사용하여 에어로졸로서 제제화될 수 있다. 예를 들어, 용액 에어로졸 제제는 (실질적으로) 순수한 추진제 또는 추진제와 용매의 혼합물로서 수송체, 담체 또는 이온 채널 억제제와 같은 제제의 용액을 포함할 수 있다. 용매는 작용제를 용해하고/거나, 추진제의 증발을 지연시키는 데 사용될 수 있다. 용매는 예를 들어, 물, 에탄올 및 글리콜을 포함할 수 있다. 적절한 용매의 임의의 조합이 사용될 수 있으며, 임의적으로, 보존제, 항산화제 및/또는 다른 에어로졸 성분과 조합될 수 있다.
에어로졸 제제는 분산제 또는 현탁제일 수 있다. 현탁 에어로졸 제제는 작용제 또는 작용제의 조합, 예를 들어, 수송체, 담체 또는 이온 채널 억제제, 및 분산화제의 현탁액을 포함할 수 있다. 분산화제는 예를 들어, 소르비탄 트리올레에이트, 올레일 알콜, 올레산, 레시틴 및 옥수수유를 포함할 수 있다. 현탁 에어로졸 제제는 또한 활택제, 보존제, 항산화제, 및/또는 다른 에어로졸 성분을 포함할 수 있다.
에어로졸 제제는 유사하게 에멀젼으로 제제화될 수 있다. 에멀젼 에어로졸 제제는 예를 들어, 에탄올과 같은 알콜, 계면활성제, 물 및 추진제 뿐만 아니라, 작용제 또는 작용제의 조합, 예를 들어, 수송체, 담체 또는 이온 채널을 포함할 수 있다. 사용된 계면활성제는 비이온성, 음이온성 또는 양이온성일 수 있다. 에멀젼 에어로졸 제제의 한 예는 예를 들어, 에탄올, 계면활성제, 물 및 추진제를 포함한다. 에멀젼 에어로졸 제제의 또 다른 예는 예를 들어, 식물성 오일, 글리세릴 모노스테아레이트 및 프로판을 포함한다.
본원에서는 세포질체 조성물을 포함하는 멸균 주사액으로서, 필요에 따라 상기 열거된 수개의 다른 성분과 함께 본원에 개시된 세포질체 조성물을 적절한 용매에 필요한 양으로 혼입한 후, 여과 멸균함으로써 제조된 멸균 주사액을 개시한다. 일반적으로, 분산제는 기본 분산 매질 및 상기 열거된 것들로부터 필요한 다른 성분을 함유하는 멸균 비히클에 다양한 멸균된 활성 성분을 혼입함으로써 제조된다. 멸균 주사액의 제조를 위한 멸균 분말의 경우, 바람직한 제조 방법은 사전 멸균 여과된 용액으로부터 활성 성분과 임의의 추가의 원하는 성분의 분말을 생성하는 진공 건조 및 동결 건조 기술이다.
일부 실시양태에서, 본원에 개시된 조성물은 또한 중성 또는 염 형태로 제제화될 수 있다. 약학적으로 허용되는 염에는 산 부가염(단백질의 유리 아미노 기로 형성)이 포함되며, 이는 예를 들어, 염산 또는 인산과 같은 무기산, 또는 아세트산, 옥살산, 타르타르산, 만델산 등과 같은 유기산으로 형성된다. 유리 카복실 기로 형성된 염은 또한 예를 들어, 수산화나트륨, 수산화칼륨, 수산화암모늄, 수산화칼슘 또는 수산화제2철과 같은 무기 염기, 및 이소프로필아민, 트리메틸아민, 히스티딘, 프로카인 등과 같은 유기 염기로부터 유도될 수 있다. 제제화시, 액제는 투여 제제와 양립가능한 방식으로 치료적으로 효과적인 양으로 투여될 것이다. 제제는 예컨대, 주사제, 약물 방출 캡슐 등과 같은 다양한 제형으로 용이하게 투여된다.
피험체에게 투여되는 적절한 용량 및 투여량은 특정 세포질체 조성, 질환 상태 및 그의 중증도, 치료를 필요로 하는 피험체의 아이덴티티(예컨대, 체중, 성별, 연령)를 포함하나, 이에 제한되지 않는 인자에 의해 결정되고, 예를 들어, 투여되는 특정 작용제, 투여 경로, 치료되는 병태, 및 치료되는 피험체 또는 숙주를 포함하는 사례를 둘러싼 특정 상황에 따라 결정될 수 있다.
세포질체 조성물의 양 및 이러한 조성물의 투여 시간은 본 교시의 이점을 갖는 숙련된 기술자의 범위 내에 있을 것이다. 그러나, 개시된 조성물의 치료적 유효량의 투여는 단일 투여, 예를 들어, 그러한 치료를 받는 환자에게 치료적 이점을 제공하기에 충분한 수의 세포질체의 단일 주사에 의해 달성될 수 있을 가능성이 있다.
대안적으로, 일부 상황에서, 세포질체 조성물의 투여를 감독하는 개업의에 의해 결정될 수 있는 바와 같이, 비교적 단기간 또는 비교적 장기간에 걸쳐 세포질체 조성물의 다중 또는 연속 투여를 제공하는 것이 바람직할 수 있다. 예를 들어, 포유동물에게 투여되는 세포질체의 수는 약 107, 108, 109, 1010, 1011, 1012, 1013개 이상일 수 있으며, 치료되는 특정 질환 또는 장애 요법을 달성하는 데 필요할 수 있는 바, 단일 용량으로 제공되거나, 2회 이상의 투여분으로 분할될 수 있다. 사실상, 특정 실시양태에서, 2개 이상의 상이한 세포질체 조성물을 단독으로 또는 하나 이상의 다른 치료 약물과 조합하여 투여하여 특정 치료 요법의 원하는 효과를 달성하는 것이 바람직할 수 있다. 다양한 실시양태에서, 1일 및 단위 투여량은 사용된 세포질체 조성물의 활성, 치료하고자 하는 질환 또는 병태, 투여 모드, 개별 피험체의 요건, 치료되는 질환 또는 병태의 중증도, 및 의사의 판단을 포함하나, 이에 제한되지 않는 다수의 변수에 따라 변경된다.
일부 실시양태에서, 세포질체 조성물 투여는 매시간, 매 2시간, 3시간, 4시간, 5시간, 6시간,7시간, 8시간, 9시간, 10시간, 11시간, 12시간, 13시간, 14시간, 15시간, 16시간, 17시간, 18시간, 19시간, 20시간, 21시간 22시간, 23시간, 1일, 2일, 3일, 4일, 5일, 6일, 7일, 8일, 9일, 10일, 11일, 12일, 13일, 14일, 15일, 1개월, 2개월, 3개월, 4개월, 5개월, 6개월, 7개월, 8개월, 9개월, 10개월, 11개월, 1년, 2년, 3년, 4년, 또는 5년, 또는 10년마다 1회 이루어진다. 유효 투여량 범위는 치료에 대한 피험체의 반응에 따라 조정될 수 있다. 일부 투여 경로는 다른 경로보다 더 높은 농도의 유효량의 치료제를 필요로 할 것이다.
본 개시내용의 이점을 고려할 때 예상되지는 않았지만, 환자의 병태가 개선되지 않는 특정 실시양태에서, 의사의 재량에 따라 세포질체 조성물의 투여는 환자의 질환 또는 병태의 증상을 호전시키거나, 또는 다르게는 제어 또는 제한하기 위해 만성적으로, 즉, 환자의 일생 동안, 그러한 시간을 비롯한 장기간 동안 투여된다. 환자의 병태가 개선되는 특정 실시양태에서, 투여되는 세포질체 조성물의 용량은 특정 기간(즉, "휴약기") 동안 일시적으로 감소되거나 일시적으로 중단될 수 있다. 구체적인 실시양태에서, 휴약기의 길이는 2일 내지 1년이며, 단지 예로서, 2일, 3일, 4일, 5일, 6일, 7일, 10일, 12일, 15일, 20일, 28일 또는 28일 초과를 포함한다. 휴약기 동안의 용량 감소는 단지 예로서, 오직 예로서만 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 및 100%를 비롯한, 10%-100%만큼 이루어진다. 특정 실시양태에서, 투여되는 약물의 용량은 특정 기간 동안 일시적으로 감소되거나, 일시적으로 중단될 수 있다(즉, "약물 전환"). 구체적인 실시양태에서, 약물 전환 기간은 2일 내지 1년으로, 단지 예로서, 2일, 3일, 4일, 5일, 6일, 7일, 10일, 12일, 15일, 20일, 228일 초과를 포함한다. 약물 전환 동안의 용량 감소는 단지 예로서, 오직 예로서만 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 및 100%를 비롯한, 10%-100%만큼 이루어진다. 적합한 시간이 경과한 후, 정상적인 투약 스케줄로 임의적으로 복귀하게 된다.
일부 실시양태에서, 환자의 병태가 개선되고 나면, 필요한 경우 유지 용량이 투여된다. 후속적으로, 구체적인 실시양태에서, 투여량 또는 투여 빈도, 또는 둘 모두는 증상의 함수로서 개선된 질환, 장애 또는 병태가 유지되는 수준으로 감소된다. 그러나, 특정 실시양태에서, 환자는 증상의 임의의 재발에 따라 장기간에 걸친 간헐적 치료를 필요로 한다.
상기 치료 요법의 독성 및 치료 효능은 LD50 및 ED50의 결정을 포함하나, 이에 제한되지 않는 세포 배양 또는 실험 동물에서의 표준 약학적 절차에 의해 결정된다. 독성 효과와 치료 효과 사이의 용량비는 치료 지수이며, LD50과 ED50 사이의 비로 표시된다. 특정 실시양태에서, 세포 배양 검정 및 동물 연구로부터 수득된 데이터는 인간을 비롯한 포유동물에서 사용하기 위한 치료 유효 1일 투여량 범위 및/또는 치료 유효 단위 투여량을 제제화하는 데 사용된다. 일부 실시양태에서, 본원에 기술된 세포질체 조성물의 투여량은 최소 독성을 갖는 ED50을 포함하는 순환 농도 범위 내에 있다. 특정 실시양태에서, 1일 투여량 범위 및/또는 단위 투여량은 사용된 투여 형태 및 사용된 투여 경로에 따라 이 범위 내에서 달라진다.
C. 병원체 포획 세포질체
일부 실시양태에서, 본원에서는 병원체가 세포질체를 감염시키고, 병원체가 세포질체 내에서 증식 또는 복제하는 것을 방지함으로써 병원체를 포획하도록 조작된 세포질체를 개시한다. 세포질체의 제어가능하고, 유한한 수명은 세포질체 사멸시 세포질체에 병원체가 포획된 상태에서 죽을 때 세포질체가 병원체를 사멸시키는 것을 가능하게 한다. 세포질체의 사멸은 아폽토시스 또는 자가포식과 같은 자연적인 프로세스일 수 있다. 병원체를 포획하도록 조작된 세포질체는 병원체에 의한 세포질체의 감염을 조장하는 숙주 수용체와 같은 병원체 인식 모이어티를 발현하도록 조작될 수 있다. 추가로, 또는 대안적으로, 세포질체는 피험체의 세포에서 병원체에 의한 감염을 치료하거나, 또는 예방하는 데 치료적으로 효과적인 본원에 기술된 활성제를 발현하거나 함유하도록 조작될 수 있다. 상기 활성제는 예를 들어, 세포질체로부터 분비될 때, 세포외 공간의 병원체와 숙주 세포 사이의 결합을 기능적으로 차단하는 중화 항체일 수 있다. SARS-CoV-2에 의한 감염을 예방하는 경우, 중화 항체는 SARS-CoV-2 스파이크 단백질과 숙주 세포에 발현되는 인간 안지오텐신 전환 효소 2(ACE2: angiotensin-converting enzyme 2) 간의 결합을 차단하여 감염을 예방한다.
병원체는 본 명세서에 개시된 것과 같이 복제 또는 증식하기 위해 핵 유전 정보를 적어도 부분적으로 필요로 하는, 본원에 기술된 세포를 감염시킬 수 있는 임의의 박테리아, 바이러스 또는 진균일 수 있다. 감염된 세포질체에는 숙주 세포의 핵에 복제 단계를 갖는 병원체의 복제 또는 증식에 필요한 핵 성분이 결여되어 있어 피험체에서 병원체에 의한 감염의 예방 또는 치료를 감소시킨다.
SARS-CoV-2에 의한 감염을 감소 또는 예방하기 위한 경우, 세포질체는 SARS-CoV-2(예컨대, ACE2)에 대한 병원체 인식 모이어티를 발현하도록 조작되며, 세포질체가 스파이크 단백질 및 ACE2 결합을 통해 SARS-CoV-2에 의해 감염될 때, 세포질체는 자연적으로 대식세포 식세포 작용을 위해 대식세포를 동원할 수 있거나, 또는 그와 같이 동원하도록 조작될 수 있다. 도 4에 제시된 바와 같이, 비제한적인 예로서, 감염된 세포질체의 식세포 작용은 헬퍼 T 세포 및 B 세포와 같은 면역 세포를 활성화하여 SARS-CoV-2에 대한 항체를 생성할 수 있다. 일부 실시양태에서, 감염된 세포질체의 식세포 작용은 바이러스 감염을 치료하기 위해 T 세포를 활성화할 수 있다.
일부 실시양태에서, 본원에 기술된 세포질체는 병원체 인식 모이어티를 발현하고, 일부 경우에는 이를 나타내도록 조작된다. 일부 실시양태에서, 병원체 인식 모이어티는 숙주 수용체(관심 병원체에 대한 동족 수용체), 또는 병원체와 숙주 세포 사이의 결합을 촉진하기에 충분한 그의 일부이다. 병원체 인식 모이어티는 세포질체 표면 상에 세포질체에 의해 발현될 수 있다. 일부 실시양태에서, 병원체 인식 모이어티는 세포외 환경에 적어도 부분적으로 노출된 단백질로부터 유래된다. 일부 실시양태에서, 병원체 인식 모이어티는 세포 표면 수용체 또는 막횡단 단백질을 코딩하는 폴리펩티드로부터 유래된다. 일부 실시양태에서, 병원체 인식 모이어티는 바이러스 감염 동안 바이러스 단백질에 의해 결합되는 단백질로부터 유래된다. 예를 들어, 병원체 인식 모이어티는 바이러스 감염 동안 SARS-CoV-2의 스파이크 단백질에 의해 결합되는 안지오텐신 I 전환 효소 2(ACE2)에서 유래 수 있다. 일부 실시양태에서, 병원체 인식 모이어티는 본원에 기술된 바이러스 중 어느 하나에 의해 인식 및 결합될 수 있는 세포 표면 수용체 또는 막횡단 단백질로부터 유래된다. 일부 실시양태에서, 병원체 인식 모이어티는 본원에 기술된 코로나바이러스 중 어느 하나에 의해 인식 및 결합될 수 있는 세포 표면 수용체 또는 막횡단 단백질로부터 유래된다. 일부 실시양태에서, 병원체 인식 모이어티는 당이다. 일부 실시양태에서, 병원체 인식 모이어티는 폴리펩티드이다. 코로나바이러스에 의해 인식되는 비제한적인 수용체에는 ACE2, 알라닌 아미노펩티다제(ANPEP), 암배아 항원 관련 세포 부착 분자(CEACAM1: Carcinoembryonic antigen-related cell adhesion molecule), 디펩티딜 펩티다제-4(DPP4: Dipeptidyl peptidase-4) 또는 당을 포함한다.
일부 실시양태에서, 세포질체는 인간 안지오텐신 전환 효소 2(ACE2)에 특이적인 코로나바이러스, 예를 들어, SARS-CoV, SARS-CoV-2 및 NL63에 의해 인식 및 결합될 수 있는 ACE2, 또는 그의 일부를 발현하도록 조작된다. 일부 실시양태에서, 세포질체는 세포질체의 표면 상에서 ACE2 또는 그의 일부를 발현하도록 조작된다. 일부 실시양태에서, 세포질체는 전장의 ACE2를 발현하도록 조작된다. 일부 실시양태에서, 세포질체는 ACE2의 단편을 발현하도록 조작된다. 일부 실시양태에서, ACE2의 부분은 ACE2 폴리펩티드의 아미노산 서열의 약 5개 아미노산 내지 약 805개 아미노산을 포함한다. 일부 실시양태에서, ACE2의 부분을 포함하는 병원체 인식 모이어티는 세포 외부에서 발현되는 ACE2의 세포외 도메인 또는 부분으로부터 유래된다. 일부 실시양태에서, ACE2의 부분은 ACE2의 아미노산 서열의 N-말단 부분을 포함한다. 일부 실시양태에서, ACE2의 부분은 ACE2의 아미노산 서열의 C-말단 부분을 포함한다. 일부 실시양태에서, ACE2의 부분은 약 5개의 아미노산 내지 약 10개의 아미노산, 약 5개의 아미노산 내지 약 15개의 아미노산, 약 5개의 아미노산 내지 약 20개의 아미노산, 약 5개의 아미노산 내지 약 25개의 아미노산, 약 5개의 아미노산 내지 약 50개의 아미노산, 약 5개의 아미노산 내지 약 100개의 아미노산, 약 5개의 아미노산 내지 약 200개의 아미노산, 약 5개의 아미노산 내지 약 400개의 아미노산, 약 5개의 아미노산 내지 약 500개의 아미노산, 약 5개의 아미노산 내지 약 600개의 아미노산, 약 5개의 아미노산 내지 약 805개의 아미노산, 약 10 아미노산 내지 약 15개의 아미노산, 약 10 아미노산 내지 약 20개의 아미노산, 약 10 아미노산 내지 약 25개의 아미노산, 약 10 아미노산 내지 약 50개의 아미노산, 약 10 아미노산 내지 약 100개의 아미노산, 약 10 아미노산 내지 약 200개의 아미노산, 약 10 아미노산 내지 약 400개의 아미노산, 약 10 아미노산 내지 약 500개의 아미노산, 약 10 아미노산 내지 약 600개의 아미노산, 약 10 아미노산 내지 약 805개의 아미노산, 약 15개의 아미노산 내지 약 20개의 아미노산, 약 15개의 아미노산 내지 약 25개의 아미노산, 약 15개의 아미노산 내지 약 50개의 아미노산, 약 15개의 아미노산 내지 약 100개의 아미노산, 약 15개의 아미노산 내지 약 200개의 아미노산, 약 15개의 아미노산 내지 약 400개의 아미노산, 약 15개의 아미노산 내지 약 500개의 아미노산, 약 15개의 아미노산 내지 약 600개의 아미노산, 약 15개의 아미노산 내지 약 805개의 아미노산, 약 20 아미노산 내지 약 25개의 아미노산, 약 20 아미노산 내지 약 50개의 아미노산, 약 20 아미노산 내지 약 100개의 아미노산, 약 20 아미노산 내지 약 200개의 아미노산, 약 20 아미노산 내지 약 400개의 아미노산, 약 20 아미노산 내지 약 500개의 아미노산, 약 20 아미노산 내지 약 600개의 아미노산, 약 20 아미노산 내지 약 805개의 아미노산, 약 25개의 아미노산 내지 약 50개의 아미노산, 약 25개의 아미노산 내지 약 100개의 아미노산, 약 25개의 아미노산 내지 약 200개의 아미노산, 약 25개의 아미노산 내지 약 400개의 아미노산, 약 25개의 아미노산 내지 약 500개의 아미노산, 약 25개의 아미노산 내지 약 600개의 아미노산, 약 25개의 아미노산 내지 약 805개의 아미노산, 약 50 아미노산 내지 약 100개의 아미노산, 약 50 아미노산 내지 약 200개의 아미노산, 약 50 아미노산 내지 약 400개의 아미노산, 약 50 아미노산 내지 약 500개의 아미노산, 약 50 아미노산 내지 약 600개의 아미노산, 약 50 아미노산 내지 약 805개의 아미노산, 약 100개의 아미노산 내지 약 200개의 아미노산, 약 100개의 아미노산 내지 약 400개의 아미노산, 약 100개의 아미노산 내지 약 500개의 아미노산, 약 100개의 아미노산 내지 약 600개의 아미노산, 약 100개의 아미노산 내지 약 805개의 아미노산, 약 200개의 아미노산 내지 약 400개의 아미노산, 약 200개의 아미노산 내지 약 500개의 아미노산, 약 200개의 아미노산 내지 약 600개의 아미노산, 약 200개의 아미노산 내지 약 805개의 아미노산, 약 400개의 아미노산 내지 약 500개의 아미노산, 약 400개의 아미노산 내지 약 600개의 아미노산, 약 400개의 아미노산 내지 약 805개의 아미노산, 약 500개의 아미노산 내지 약 600개의 아미노산, 약 500개의 아미노산 내지 약 805개의 아미노산, 또는 약 600개의 아미노산 내지 약 805개의 아미노산을 포함하는 ACE2 폴리펩티드의 아미노산 서열을 포함한다. 일부 실시양태에서, ACE2의 부분은 ACE2 폴리펩티드의 아미노산 서열 중 약 5개의 아미노산, 약 10개의 아미노산, 약 15개의 아미노산, 약 20개의 아미노산, 약 25개의 아미노산, 약 50개의 아미노산, 약 100개의 아미노산, 약 200개의 아미노산, 약 400개의 아미노산, 약 500개의 아미노산, 약 600개의 아미노산, 또는 약 805개의 아미노산을 포함한다. 일부 실시양태에서, ACE2의 부분은 ACE2 폴리펩티드의 아미노산 서열 중 적어도 약 5개의 아미노산, 약 10개의 아미노산, 약 15개의 아미노산, 약 20개의 아미노산, 약 25개의 아미노산, 약 50개의 아미노산, 약 100개의 아미노산, 약 200개의 아미노산, 약 400개의 아미노산, 약 500개의 아미노산, 또는 약 600개 이상의 아미노산을 포함한다. 일부 실시양태에서, ACE2의 부분은 ACE2 폴리펩티드의 아미노산 서열 중 최대 약 10개의 아미노산, 약 15개의 아미노산, 약 20개의 아미노산, 약 25개의 아미노산, 약 50개의 아미노산, 약 100개의 아미노산, 약 200개의 아미노산, 약 400개의 아미노산, 약 500개의 아미노산, 약 600개의 아미노산, 또는 약 805개의 아미노산을 포함한다. 일부 실시양태에서, ACE2는 인간 ACE2(huACE2)이다. 일부 실시양태에서, huACE2에 대한 아미노산 서열은 서열 번호 12에 제공되어 있다.
일부 실시양태에서, 세포질체는 서열 번호 12와 50%, 60%, 70%, 80%, 90%, 95%, 또는 99% 이상 동일한 이종성 폴리펩티드를 발현하도록 조작된다. 일부 실시양태에서, 세포질체는 서열 번호 12의 단편과 50%, 60%, 70%, 80%, 90%, 95%, 또는 99% 이상 동일한 이종성 폴리펩티드를 발현하도록 조작된다. 일부 실시양태에서, 세포질체는 서열 번호 12와 100% 동일한 이종성 폴리펩티드를 발현하도록 조작된다. 일부 실시양태에서, 세포질체는 서열 번호 12의 단편과 100% 동일한 이종성 폴리펩티드를 발현하도록 조작된다.
일부 실시양태에서, 세포질체는 내인성 수준으로 ACE2를 발현하고, SARS-CoV-2에 의해 감염될 수 있는 세포와 비교하여 더 많은 ACE2를 발현하도록 조작될 수 있다. 일부 실시양태에서, 세포질체는 내인성 수준으로 ACE2를 발현하는 세포와 비교하여 적어도 10%, 20%, 30% 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99% 또는 그 초과의 ACE2를 발현할 수 있다. 일부 실시양태에서, 세포질체는 내인성 수준으로 ACE2를 발현하고, SARS-CoV-2에 의해 감염될 수 있는 세포와 비교하여 ACE2를 적어도 2배, 5배, 10배, 50배, 100배, 500배, 1000배, 5000배, 10000배 또는 그 초과의 배수로 발현할 수 있다. 일부 실시양태에서, 세포질체는 세포의 표면 상에서 내인성 수준으로 ACE2를 발현하는 세포와 비교하여 세포질체의 표면 상에서 더 많은 ACE2를 발현하도록 조작될 수 있다. 일부 실시양태에서, 세포질체는 세포의 표면 상에서 내인성 수준으로 ACE2를 발현하는 세포와 비교하여 세포질체의 표면 상에서 적어도 10%, 20%, 30% 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99% 또는 그 초과의 ACE2를 발현할 수 있다. 일부 실시양태에서, 세포질체는 세포의 표면 상에서 내인성 수준으로 ACE2를 발현하는 세포와 비교하여 세포질체의 표면 상에서 ACE2를 적어도 2배, 5배, 10배, 50배, 100배, 500배, 1000배, 5000배, 10000배 또는 그 초과의 배수로 발현할 수 있다.
일부 실시양태에서, ACE2를 발현하는 세포질체는 기준 세포와 비교하여 더 높은 바이러스 감염성을 가질 수 있다. 이러한 맥락에서 "기준 세포"는 ((예컨대, ACE2를 자연적으로 발현하는) SARS-CoV-2에 감염될 수 있는 자연적으로 발생된 세포일 수 있다. 일부 실시양태에서, 기준 세포는 세포질체와 동일한 세포 유형이다. 일부 실시양태에서, 기준 세포는 ACE2를 발현하지 않는다는 점을 제외하고는 세포와 동일하다. 바이러스 감염성은 일반적으로 알려진 검정법으로 측정하고, 결정할 수 있다. 바이러스 감염성의 예시적인 측정은 바이러스 플라크 검정법, 형광 초점 검정법(FFA: fluorescent focus assay) 및 종점 희석 검정법(TCID50)을 포함할 수 있다. 이러한 검정법들은 각각 바이러스 감염성을 측정하기 위해 세포질체 및/또는 세포에 첨가된 연속 바이러스 희석액에 의존할 수 있다. 바이러스 감염성을 결정하기 위한 다른 예시적인 측정은 설정된 수의 세포질체 및/또는 세포를 감염시키는 데 필요한 바이러스 게놈 또는 입자의 양을 정량화하기 위한 qPCR 또는 ELISA를 포함할 수 있다. 일부 실시양태에서, ACE2를 발현하는 세포질체는 적어도 약 10%, 20%, 30% 40%, 50%, 60%, 70%, 80%, 90% 이상의 바이러스 감염성을 가질 수 있다. 일부 실시양태에서, ACE2를 발현하는 세포질체는 기준 세포보다 적어도 약 2배, 5배, 10배, 50배, 100배, 500배, 1000배, 5000배, 또는 10000배 이상 더 높은 바이러스 감염성을 가질 수 있다.
일부 실시양태에서, 본원에서는 적어도 하나의 표적화 모이어티, 예컨대, 귀소 단백질 또는 수용체를 발현하도록 조작된 세포질체를 기술한다. 일부 실시양태에서, 표적화 모이어티는 세포질체에 의해 분비된다. 일부 실시양태에서, 표적화 모이어티는 본원에 기술된 케모카인 수용체에 대한 리간드이다. 일부 실시양태에서, 표적화 모이어티는 본원에 기술된 사이토카인이다. 일부 실시양태에서, 표적화 모이어티는 귀소 수용체이다. 일부 실시양태에서, 표적화 모이어티는 세포질체의 표면 상에서 발현된다. 일부 실시양태에서, 표적화 모이어티는 본원에 기술된 케모카인 수용체이다. 일부 실시양태에서, 표적화 모이어티는 본원에 기술된 사이토카인 중 어느 하나에 대한 수용체이다.
일부 실시양태에서, 표적화 모이어티는 림프 조직의 하나 이상의 세포에서 발현된 하나 이상의 리간드에 특이적일 수 있고, 림프 조직의 세포는 내피 세포, 림프구, 대식세포, 또는 망상 세포, 또는 그의 조합을 포함할 수 있다. 분비된 표적화 모이어티의 비제한적인 예로는 SDF1α, CCL2, CCL3, CCL5, CCL8, CCL1, CXCL9, CXCL10, CCL11, CXCL12, 또는 그의 조합을 포함한다. 일부 실시양태에서, 표적화 모이어티는 세포질체의 표면 상에서 발현된다. 세포질체 표면에 발현되는 표적화 모이어티의 비제한적인 예는 CXCR4, CCR2 또는 PSGL-1을 포함한다. 세포 표면 상에서 발현될 수 있는 세포 표면 단백질의 비제한적 예는 CXCR4, CCR2, CCR1, CCR5, CXCR7, CXCR2, CXCR1, C-X-C 케모카인 수용체 타입 3, 류코시아린, CD44 항원, C-C 케모카인 수용체 타입 7, L-셀렉틴, 림프구 기능 연관 항원 1, 또는 초후기 항원-4, 또는 그의 조합을 포함한다.
일부 실시양태에서, 표적화 모이어티(예컨대, 귀소 단백질 또는 귀소 수용체)를 발현하는 세포질체는 또한 본원에 개시된 활성제를 발현한다. 일부 실시양태에서, 활성제는 본원에 기술된 추가의 외인성 작용제이다. 일부 실시양태에서, 활성제는 본원에 기술된 병원체 인식 모이어티이다. 일부 실시양태에서, 활성제는 병원체에 의해 발현되는 에피토프; 병원체와 연관된 미세환경과 연관된 에피토프; 또는 병원체에 의해 방출된 생체분자와 연관된 에피토프에 결합하는 항체 또는 단일 도메인 항체를 포함한다. 일부 실시양태에서, 에피토프에 대한 항체 또는 단일 도메인 항체의 결합은 병원체에 대한 치료 또는 백신접종 특성을 부여한다. 일부 실시양태에서, 에피토프에 대한 항체 또는 단일 도메인 항체의 결합은 면역 세포를 동원하여 면역 반응을 활성화하여 병원체에 대한 치료 특성을 부여한다.
II. 치료 및 예방 방법
본원에서는 본 개시내용의 세포질체, 또는 세포질체를 함유하는 약학적 조성물을 병원체 연관된 질환 또는 병태 치료 또는 예방을 필요로 하는 피험체에게 투여함으로써 병원체 연관된 질환 또는 병태를 치료 또는 예방하는 방법을 제공한다. 일부 실시양태에서, 세포질체 및 그의 약학적 조성물은 본원에 기술된 질환 또는 병태의 치료에 적합하다. 이러한 질환 또는 병태는 일부 경우에 본원에 기술된 병원체에 의한 감염에 의해 (적어도 부분적으로) 유발될 수 있다. 일부 실시양태에서, 질환 또는 병태는 예를 들어, 종양용해성 바이러스에 의한 감염에 의해 유발되는 암이다.
일부 실시양태에서, 방법은 세포질체, 또는 세포질체를 함유하는 약학적 조성물을 피험체에게 전신 투여하는 단계를 포함한다.
일부 실시양태에서, 본원에서는 암 치료를 필요로 하는 피험체에게 세포질체, 또는 세포질체를 함유하는 약학적 조성물을 피험체에게 투여함으로써 암을 치료하는 방법을 개시한다. 일부 실시양태에서, 세포질체는 항암 활성제를 코딩하는 외인성 핵산을 포함한다. 일부 실시양태에서, 항암 활성제는 종양용해성 바이러스에 대한 백신이다. 일부 실시양태에서, 세포질체는 암 세포에 특이적인 항체 또는 소분자를 발현하도록 조작된다. 일부 실시양태에서, 항체는 암 세포를 표적화하고, 이어서, 적응 면역계를 활성화하여 암 세포를 중화시킬 수 있는 중화 항체일 수 있다. 일부 실시양태에서, 항체는 단일 도메인 항체(예컨대, 나노바디)일 수 있다. 일부 실시양태에서, 항체는 세포독성 약물과 같은 약물에 접합되어 항체 약물 접합체(ADC: antibody drug conjugate)를 형성할 수 있다. 일부 실시양태에서, 세포질체는 암 세포와 직접 접촉함으로써 치료 특성을 부여한다. 일부 실시양태에서, 세포질체는 암 세포에 대한 면역 반응(예를 들어, 면역 세포)을 동원하고, 활성화함으로써 치료 특성을 부여한다.
본원에 기술된 병원체에 대해 피험체를 백신접종하는 방법 또한 개시한다. 일부 실시양태에서, 세포질체는 병원체 백신으로서 사용하기 위한 병원체 항원을 발현하도록 조작된다. 일부 실시양태에서, 병원체는 표 3-6으로부터 선택된 병원체 중 어느 하나일 수 있다. 일부 실시양태에서, 세포질체는 표 3-6으로부터 선택된 병원체 중 어느 하나의 항원을 발현하도록 조작된다. 일부 실시양태에서, 항원은 서열 번호 1, 3-7, 151-154, 251-260, 401-447, 551-562, 651-660, 751-761, 851-859, 951-984, 1051-1057, 또는 1151-1153 중 하나 이상의 것과 적어도 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 항원은 서열 번호 2, 8, 101-104, 201-209, 301-347, 501-512, 601-610, 701-711, 801-809, 901-934, 1001-1007, 또는 1101-1103 중 하나 이상의 것과 적어도 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상 동일한 핵산 서열로부터 코딩된다. 일부 실시양태에서, 세포질체는 바이러스 백신으로서 사용하기 위한 바이러스 항원을 발현하도록 조작된다. 일부 실시양태에서, 세포질체는 박테리아 백신으로서 사용하기 위한 박테리아 항원을 발현하도록 조작된다.
본원에서는 병원체 감염에 대해 피험체를 치료하는 방법 또한 기술한다. 일부 실시양태에서, 세포질체는 그를 필요로 하는 피험체에서 병원체를 감소시키는 데 효과적인 병원체에 특이적인 항체 또는 소분자를 발현하도록 조작된다. 일부 실시양태에서, 항체는 병원체를 표적화한 후, 이어서, 적응 면역계를 활성화하여 병원체를 중화시킬 수 있는 중화 항체일 수 있다. 일부 실시양태에서, 항체는 단일 도메인 항체(예컨대, 나노바디)일 수 있다. 일부 실시양태에서, 항체는 세포독성 약물과 같은 약물에 접합되어 항체 약물 접합체(ADC)를 형성할 수 있다. 일부 실시양태에서, 세포질체는 병원체와 직접 접촉함으로써 치료 특성을 부여한다. 일부 실시양태에서, 세포질체는 병원체에 대한 면역 반응(예컨대, 면역 세포)을 동원하고, 활성화함으로써 치료 특성을 부여한다.
일부 실시양태에서, 본원에서는 피험체에게 세포질체 또는 세포질체를 함유하는 약학적 조성물을 투여함으로써 피험체에서 병원체에 의한 감염을 치료하는 방법으로서, 여기서, 세포질체는 피험체의 임의의 조직(예컨대, 혈액, 근육, 림프)에서 병원체를 포획하도록, 피험체에서 병원체 증식을 방지하도록, 및 임의적으로, 예를 들어, 식세포 작용에 의해 피험체로부터 병원체를 제거하도록 조작된다. 일부 실시양태에서, 세포질체는 병원체 연관 질환 또는 병태를 치료하는 데 효과적인 치료제를 발현하도록 조작된다. 일부 실시양태에서, 세포질체는 암 치료에 효과적인 치료제를 발현하도록 조작된다. 일부 실시양태에서, 방법은 피험체에게 하나 이상의 추가 치료제를 투여하는 단계를 추가로 포함한다. 일부 실시양태에서, 하나 이상의 추가 치료제는 세포 기반 요법, 소분자, 면역 요법, 화학요법, 방사선 요법, 유전자 요법, 및 수술로 구성된 군으로부터 선택된다. 추가 요법은 본 개시내용의 세포질체와 동시에 피험체에게 투여될 수 있다. 추가 요법은 본 개시내용의 세포질체 이전 또는 이후에 투여될 수 있다.
A. 질환 또는 병태
본원에 개시된 병원체 연관된 질환 또는 병태는 바이러스 감염, 박테리아 감염, 진균 감염, 기생충 감염, 및 원생동물 감염, 및 본원에 개시된 감염과 연관된 질환 또는 병태를 포함한다. 일부 실시양태에서, 병원체는 표 3-6에 열거된 병원체 중 어느 하나로부터 선택될 수 있다. 본원에 기술된 조성물 및 방법에 의해 치료되거나, 또는 예방될 수 있는 감염의 비제한적 예로는 아시네토박터 감염, 방선균증, 아프리카 수면병(아프리카 트리파노소마증), AIDS(후천성 면역결핍 증후군: Acquired immunodeficiency syndrome), 아메바증, 아나플라즈마증, 혈관강력증, 아니사키증, 탄저병, 아르카노박테리움 헤몰리티쿰(Arcanobacterium haemolyticum) 감염, 아르헨티나 출혈 열, 아스카리아증, 아스페르길루스증, 아스트로바이러스 감염, 바베시오증, 바실러스 세레우스(Bacillus cereus) 감염, 박테리아성 폐렴, 박테리아성 질염, 박테로이데스(Bacteroides) 감염, 발란티디아증, 바르토넬라증, 바일리자스카리스(Baylisascaris) 감염, BK 바이러스 감염, 흑색 피에드라, 배반포증, 분파균증, 볼리비아 출혈 열, 보툴리눔독소증(및 유아 보툴리눔독소증), 브라질 출혈 열, 브루셀라병, 선페스트, 부르크홀데리아 감염, 부룰리 궤양, 칼리시바이러스 감염(노로바이러스 및 사포바이러스), 캄필로박테리아증, 칸디다증(모닐리아증, 아구창), 모세혈관염, 카리온병, 고양이 긁힘병, 봉와직염, 샤가스병(미국 트리파노소마증), 연성하감, 수두, 치쿤구니야, 클라미디아, 클라미도필라 뉴모니아에(Chlamydophila 폐렴 e) c 감염(대만 급성 호흡기 제제 또는 TWAR), 콜레라, 색소모세포진균증, 키트리디오균증, 간디스토마증, 클로스트리디움 디피실리(Clostridium difficile) 대장염, 콕시디오이데스진균증, 콜로라도 진드기열(CTF: Colorado tick fever), 감기(급성 바이러스성 비인두염; 급성 코감기), 코로나바이러스 감염, 크로이츠펠트-야콥병(CJD: Creutzfeldt-Jakob disease), 크림-콩고 출혈 열(CCHF: Crimean-Congo hemorrhagic fever), 크립토코쿠스증, 크립토스포리디움증, 피부 유충 이행증(CLM: Cutaneous larva migrans), 원포자충증, 낭충증, 사이토메갈로바이러스 감염, 뎅기열, 데스모데스무스 감염, 디엔타메바증, 디프테리아, 디필로보트리아증, 드라쿤쿨리아증, 에볼라 출혈 열, 포충증, 엘리히증, 요충증(요충 감염), 엔테로코쿠스(Enterococcus) 감염, 엔테로바이러스 감염, 유행성 발진티푸스, 전염성 홍반(제5병), 돌발성 발진(제6병), 간질증, 비대흡충증, 치명적 가족성 불면증(FFI: Fatal familial insomnia), 사상충증, 클로스트리디움 페르프린겐스에 의한 식중독, 자유 생활 아메바 감염, 푸소박테리움 감염, 가스 괴저(클로스트리듐 근괴사증), 지오트리쿰진균증, 게르스트만-스트라우슬러-슈나이커 증후군(GSS: Gerstmann-Straussler-Scheinker syndrome), 편모충증, 마비저, 악구충증, 임질, 서혜부 육아종 (Donovanosis), 임질, 사타구니 육아종(도노바노시스), A군 연쇄상구균 감염, B군 연쇄상구균 감염, 헤모필루스(Haemophilus) 감염, 수족구병(HFMD: Hand, foot and mouth disease), 한타바이러스 폐 증후군(HPS: Hantavirus Pulmonary Syndrome), 하트랜드 바이러스병, 헬리코박터 파이로리 감염, 용혈성 요독 증후군(HUS: Hemolytic-uremic syndrome), 신증후군 출혈열(HFRS: Hemorrhagic fever with renal syndrome), A형 간염, B형 간염, C형 간염, D형 간염, E형 간염, 단순 포진, 히스토플라스마증, 구충 감염, 인간 보카바이러스 감염, 인간 인간 에윙이 엘리히증, 인간 과립구 아나플라즈마증(HGA: Human granulocytic anaplasmosis), 인간 면역 결핍 바이러스(HIV) 감염, 인간 메타뉴모바이러스 감염, 인간 단핵구 엘리히증, 인간 유두종 바이러스(HPV: Human papillomavirus) 감염, 인간 파라인플루엔자 바이러스 감염, 선충증, 엡스타인-바 바이러스 감염성 단핵구증(모노), 인플루엔자(플루), 인플루엔자 바이러스 A, 인플루엔자 바이러스 B, 인플루엔자 바이러스 C, 인플루엔자 바이러스 D, 인플루엔자 바이러스 pr8, 이소스포리아증, 가와사키병, 각막염, 킹겔라 킹아에(Kingella kingae) 감염, 쿠루병, 라사 열, 레지오넬라증(레지오넬라병), 레지오넬라증(폰티악 열), 리슈만편모충증, 나병, 렙토스피라증, 리스테리아증, 라임병(라임 보렐리아증), 림프 사상충증(엘리판티아증), 림프구성 맥락막염, 말라리아, 마버그 출혈 열(MHF: Marburg hemorrhagic fever), 홍역, 중동 호흡기 증후군 (MERS: Middle East respiratory syndrome), 멜리오이도시스(휘트모어병), 수막염, 수막구균성 질환, 요코가와흡충증, 미포자충증, 전염성 연속종(MC: Molluscum contagiosum), 원숭이 두창, 볼거리, 뮤린 발진티푸스(풍토성 발진티푸스), 마이코플라스마 폐렴, 마이코플라스마 생식기 감염, 균종(동음이의), 구데기증, 신생아 결막염(신생아 안염), 노로바이러스(소아 및 영유아), (신종) 변종 크로이츠펠트-야콥병(vCJD, nvCJD), 노카르디아증, 온코세르카증(회선 사상충증), 간흡충증, 파라콕시디오이데스진균증(남아메리카 분아균증), 폐흡충증, 파스투렐라병, 두슬증(머릿니), 구슬증(이), 음모슬증(사면발이, 게 이), 골반내 염증 질환(PID: Pelvic inflammatory disease), 백일해(백일 기침), 역병, 폐렴구균 감염, 폐렴포자충 폐렴(PCP: Pneumocystis pneumonia), 폐렴, 소아마비, 프리보텔라(Prevotella) 감염, 원발성 아메바성 수막뇌염(PAM: Primary amoebic meningoencephalitis), 진행성 다초점 백색질뇌병증, 앵무병, Q 열, 광견병, 재발성 열, 호흡기 세포융합 바이러스 감염, 리노스포리디움증, 리노바이러스 감염, 리케차 감염, 리케차두창, 리프트 밸리 열(RVF: Rift Valley fever), 록키산 반점 열(RMSF: Rocky Mountain spotted fever), 로타바이러스 감염, 호흡기 세포융합 바이러스(RSV), 풍진, 살모넬라증, SARS(중증 급성 호흡기 증후군), 옴, 성홍열, 주혈흡충증, 패혈증, 이질균증(세균성 이질), 대상포진(띠 헤르페스), 천연두(바리올라), 스포로트리코시스, 포도상구균 식중독, 포도상구균 감염, 간충증, 아급성 경화성 범뇌염, 매독, 촌충증, 파상풍(파상풍(Lockjaw)), 수염 백선(이발소양진), 두부 백선(두피 링웜), 체부 백선(체부 링웜), 고부 백선(완선), 손 백선(손링웜), 흑색질 백선, 족부 백선(무좀), 조갑 백선(조갑진균증), 백선(전풍), 톡소카리아증(안구 유충 이행증(OLM: Ocular Larva Migrans)), 톡소카리아증(장기 유충 이행증(VLM: Visceral Larva Migrans)), 톡소플라스마증, 트라코마, 선모충증, 트리코모나스증, 선모충증(편충 감염), 결핵, 야토병, 장티푸스, 발진티프스, 우레아플라즈마 유레아라이티쿰(Ureaplasma urealyticum) 감염, 밸리 열, 베네수엘라 말 뇌염, 베네수엘라 출혈 열, 비브리오 불니피쿠스 감염, 비브리오 파라헤몰리티쿠스 장염, 바이러스 폐렴, 웨스트 나일 열, 백색 사모(백색 백선), 예르시니아 슈도투베르쿨로시스(Yersinia pseudotuberculosis) 감염, 예르시니아증, 황열, 지카열, 및 털곰팡이증을 포함할 수 있다.
코로나바이러스 감염은 알파 코로나바이러스 또는 베타 코로나바이러스에 의한 감염일 수 있다. 알파 코로나바이러스의 비제한적인 예는 229E 및 NL63을 포함한다. 베타 코로나바이러스의 비제한적인 예는 OC43, HKU1, 중증 급성 호흡기 증후군(SARS) 코로나바이러스 또는 중동 호흡기 증후군(MERS) 코로나바이러스를 포함한다. 일부 실시양태에서, SARS 코로나바이러스는 SARS-CoV, SARS-CoV-2, 또는 그의 변이체이다. 일부 실시양태에서, MERS 코로나바이러스는 MERS-CoV 또는 그의 변이체이다. 일부 실시양태에서, SARS 코로나바이러스는 질환 또는 병태, 예컨대, 코로나바이러스 질환 2019(COVID-19)를 유발한다.
일부 실시양태에서, 본원에 기술된 코로나바이러스는 서열 번호 1 및 3-7 중 어느 하나에 제공된 핵산 서열에 의해 코딩된다. 일부 실시양태에서, 코로나바이러스(또는 그의 변이체)는 서열 번호 13-7 중 어느 하나와 적어도 약 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 핵산 서열에 의해 코딩된다.
일부 실시양태에서, 코로나바이러스는 서열 번호 2 또는 8에 제공된 아미노산 서열에 의해 코딩된 스파이크 단백질을 포함한다. 일부 실시양태에서, S 단백질은 서열 번호 2 또는 8과 적어도 약 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 아미노산 서열에 의해 코딩된다.
일부 실시양태에서, 코로나바이러스는 서열 번호 9에 제공된 아미노산 서열에 의해 코딩된 뉴클레오캡시드(N) 단백질을 포함한다. 일부 실시양태에서, N 단백질은 서열 번호 9와 적어도 약 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 아미노산 서열에 의해 코딩된다.
일부 실시양태에서, 코로나바이러스는 서열 번호 10에 제공된 아미노산 서열에 의해 코딩된 막(M) 단백질을 포함한다. 일부 실시양태에서, M 단백질은 서열 번호 10과 적어도 약 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 아미노산 서열에 의해 코딩된다.
일부 실시양태에서, 코로나바이러스는 서열 번호 11에 제공된 아미노산 서열에 의해 코딩된 외피(E) 단백질을 포함한다. 일부 실시양태에서, E 단백질은 서열 번호 11과 적어도 약 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 아미노산 서열에 의해 코딩된다.
B. 피험체
일부 실시양태에서, 피험체는 치료를 필요로 하거나, 치료를 필요로 한 것으로 결정되었거나, 치료를 필요로 하는 것으로 의심된다. 본원에서 사용되는 바, 용어 "피험체"는 임의의 유기체를 지칭한다. 예를 들어, 피험체는 포유동물, 양서류, 어류, 파충류, 무척추동물, 조류, 식물, 고세균, 진균 또는 박테리아일 수 있다. 일부 실시양태에서, 피험체는 포유동물이다. 일부 실시양태에서, 피험체는 설치류(예컨대, 마우스, 래트, 햄스터, 기니피그), 개과(예컨대, 개), 고양이과(예컨대, 고양이), 말과(예컨대, 말), 양, 소, 돼지, 인간이 아닌 영장류, 예컨대, 유인원(예컨대, 원숭이), 유인원(예컨대, 고릴라, 침팬지, 오랑우탄, 긴팔원숭이), 또는 인간일 수 있다. 본원에 기술된 방법 중 임의의 것의 일부 실시양태에서, 피험체는 0 내지 120세(예컨대, 출생부터 1개월(예컨대, 신생아), 1개월 내지 2세(예컨대, 유아), 2세 내지 12세(예컨대, 소아), 12세 내지 16세(예컨대, 청소년), 1 내지 120세, 1 내지 115세, 1 내지 110세, 1 내지 105세, 1 내지 100세, 1 내지 95세, 1 내지 90세 1 내지 85세, 1 내지 80세, 1 내지 75세, 1 내지 70세, 1 내지 65세, 1 내지 60세, 1 내지 50세, 1 내지 40세, 1 내지 30세, 1 내지 25세, 1 내지 20세, 1 내지 15세, 1 내지 10세, 5 내지 120세, 5 내지 110세, 5 내지 100세, 5 내지 90세, 5 내지 60세, 5 내지 50세, 5 내지 40세, 5 내지 30세, 5 내지 20세, 5 내지 10세, 10 내지 120세, 10 내지 110세, 10 내지 100세, 10 내지 90세, 10 내지 80세 10 내지 60세, 10 내지 50세, 10 내지 40세, 10 내지 30세, 10 내지 20년, 20 내지 120세, 20 내지 110세, 20 내지 100세, 20 내지 90세, 20 내지 70세, 20 내지 60세, 20 내지 50세, 20 내지 40세, 20 내지 30세, 30 내지 120세, 30 내지 110세, 30 내지 100세, 30 내지 90세, 30 내지 70세, 30 내지 60년, 30 내지 50세, 40 내지 120세, 40 내지 110세, 40 내지 100세, 40 내지 90세, 40 내지 80세, 40 내지 60세, 40 내지 50세, 50 내지 120세, 50 내지 110세, 50 내지 100세, 50 내지 90세, 50 내지 80세, 50 내지 70세, 50 내지 60세, 60 내지 120세, 60 내지 110세, 60 내지 100세, 60 내지 90세, 60 내지 80세, 60 내지 70세, 70 내지 120세, 70 내지 110세, 70 내지 100세, 70 내지 90세, 70 내지 80세, 80 내지 120세, 80 내지 110세, 80 내지 100세, 80 내지 90세, 90 내지 120세, 90 내지 110세, 90 내지 100세, 100 내지 120세, 또는 110 내지 120세)이다. 본원에 기술된 방법 중 임의의 것의 일부 실시양태에서, 피험체는 아직 태어나지 않은, 예컨대, 자궁 내에 있는 것이다. 본원에 기술된 방법 중 임의의 것의 일부 실시양태에서, 피험체는 적어도 생후 1개월(예컨대, 적어도 2세, 적어도 12세, 적어도 16세, 또는 적어도 18세)이다. 본원에 기술된 방법 중 임의의 것은 피험체, 예컨대, 이환된 피험체(즉, 질환을 앓는 피험체, 예컨대, 질환 진단을 받은 피험체) 또는 무증상 피험체(즉, 임상적으로 건강한 것으로 나타난 피험체, 또는 질환 진단을 받지 않은 피험체)를 치료하는 데 사용될 수 있다. 본원에서 사용되는 바, 치료한다는 것은 질환의 위험이 있는 피험체에서 질환의 징후 또는 증상의 발병을 감소시키거나, 또는 그를 예방하는(또는 그 위험을 감소시키는) 것을 의미하는 "예방적 처치," 및 질환의 징후 또는 증상을 감소시키거나, 질환의 진행을 감소시키거나, 질환의 중증도를 감소시키거나, 질환 진단을 받은 피험체에서의 재발을 감소시키는 것을 의미하는 "치료적 처치"를 포함한다. 본원에서 사용되는 바, "치료하다"라는 용어는 질환의 적어도 하나의 임상 파라미터를 개선하고/거나, 이점(예컨대, 항노화, 흉터 방지, 상처 치유, 항우울제, 항염증제, 체중 감소)을 제공하는 것을 의미한다.
C. 투약 빈도 및 투여
본원에 제공된 방법 중 임의의 것의 일부 실시양태에서, 조성물은 일정 기간 동안 적어도 1회(예컨대, 2, 3, 4, 5, 6,7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 50, 60, 70, 80, 90, 100회) 투여된다(예컨대, 매일, 매 2일마다, 주 2회, 1주 1회, 매주, 월 3회, 월 2회, 월 1회, 매 2개월마다. 매 3개월마다. 매 4개월마다. 매 5개월마다. 매 6개월마다. 매 7개월마다. 매 8개월마다. 매 9개월마다. 매 10개월마다. 매 11개월마다, 연 1회). 또한 월간 치료, 예컨대, 적어도 1개월(예를 들어, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6개월 또는 그 초과, 예컨대, 12개월 또는 그 이상) 동안 적어도 월 1회 투여, 및 연간 치료(예컨대, 1년 이상의 기간 동안 연 1회 투여) 또한 고려된다. 투여 빈도는 특정 이벤트, 예컨대, 예를 들어, 병원체 연관된 질환 또는 장애의 첫 번째 증상, 백신 조성물의 제1 용량, 다른 주, 카운티, 국가 또는 대륙으로의 여행 등과 관련이 있을 수 있다.
투여는 임의의 적합한 경로, 예컨대, 피하, 정맥내, 동맥, 안구, 경구, 근육내, 비내(예컨대, 흡입), 복강내, 국소, 점막, 경막외, 설하, 경피, 양막외, 관절간, 진피내, 골내, 척추강내, 자궁내, 질내, 방광내, 유리체내, 혈관주위, 및/또는 직장 투여, 또는 공지된 투여 방법의 임의의 조합을 통해 이루어질 수 있다.
일부 실시양태에서, 세포질체의 사멸 프로세스는 피험체에 대해 치료 효과를 가질 수 있다. 예를 들어, 일부 실시양태에서, 세포질체의 사멸 프로세스는 면역자극성일 수 있다. 따라서, 본원에서는 세포질체를 피험체에 투여하는 방법을 제공하며, 여기서 세포질체의 사멸은 피험체에 치료 효과를 갖는다. 일부 실시양태에서, 피험체에게 투여된 세포질체는 사멸된 것이다. 일부 실시양태에서, 피험체에게 투여된 세포질체는 투여될 때 잔여 수명이 5일 미만(예를 들어, 4일 미만, 3일 미만, 2일 미만, 36시간 미만, 1일 미만, 18시간 미만, 12시간 미만, 6시간 미만, 2시간 미만 또는 1시간 미만)이다.
일부 실시양태에서, 세포는 피험체로부터 제거되고, 제핵될 수 있다. 일부 실시양태에서, 세포는 제핵 전에 (예컨대, 치료 DNA 분자, 치료 RNA 분자, 치료 단백질, 치료 펩티드, 소분자 치료제, 치료 유전자 편집 인자 치료 나노입자 및/또는 또 다른 치료제를 생산 또는 함유하도록) 조작된다. 일부 실시양태에서, 피험체로부터의 세포는 제핵 후, 이어서, (예컨대, 치료 DNA 분자, 치료 RNA 분자, 치료 단백질, 치료 펩티드, 소분자 치료제, 치료 유전자 편집 인자 치료 나노입자 및/또는 또 다른 치료제를 생산 또는 함유하도록) 조작된다. 일부 실시양태에서, (조작 여부와 상관없이) 세포질체는 세포 제거 기점이 된 피험체에게 투여된다.
일부 실시양태에서, 세포질체가 배양 및/또는 보관된 배지("조절 배지")는 치료 이점을 가질 수 있다. 일부 실시양태에서, 세포질체가 세포와 공동-배양 및/또는 보관된 (예를 들어, 제핵 후) 배지("조절 배지")는 치료 이점을 가질 수 있다. 일부 실시양태에서, 세포와 융합된 세포질체가 세포와 함께 배양 및/또는 보관되는 배지("조절 배지")는 치료 이점을 가질 수 있다.
따라서, 본원에서는 피험체에게 조절 배지를 투여하는 단계를 포함하는, 피험체의 건강을 치료, 예방 또는 예방적으로 처치하거나, 또는 증진시키는 방법을 제공한다. 임의의 특정 이론에 얽매이지 않고, 일부 실시양태에서, 배양 배지의 치료 이점은 세포질체에 의해 분비되는 엑소좀(예컨대, 치료 단백질 함유)의 배지에서의 존재로 인한 것일 수 있다고 간주된다.
본원에 제공된 방법 중 임의의 것의 일부 실시양태에서, 조성물은 하나 이상의 추가 요법(예컨대, 임의의 약물(예컨대, 항생제, 항바이러스제, 항염증 약물) 또는 화학요법(예컨대, 화학요법제(예컨대, 독소루비신, 파클리탁셀, 사이클로포스파미드), 또는 본원에 기술 임의의 소분자 치료제), 세포 기반 요법, 방사선 요법, 면역요법, 소분자, 억제 핵산(예컨대, 안티센스 RNA, 안티센스 DNA, miRNA, siRNA, lncRNA), 엑소좀 기반 요법, 유전자 요법 또는 수술)과 함께 투여된다. 일부 실시양태에서, 하나 이상의 추가 요법은 예컨대, PD-1/PDCD1/CD279, CTLA-4/CD152, TIM-3/HAVCR2, TIGIT, LAG3, VISTA/C10orf54, BTLA/CD272, A2AR, KIR, CD28, ICOS/CD278, CD40L/CD154, CD137/4-1BB, CD27, OX40/CD134/TNFRSF4, GITR, 또는 SIRPα와 같은 면역 체크포인트 단백질을 억제하는 조합 요법을 포함한다.
본원에 제공된 일부 실시양태에서, 조성물은 추가로 하나 이상의 추가 요법(예컨대, 임의의 약물(예컨대, 항생제, 항바이러스제) 또는 화학요법(예컨대, 화학요법제(예컨대, 독소루비신, 파클리탁셀, 사이클로포스파미드)), 세포 기반 요법, 방사선 요법, 면역 요법, 소분자, 억제성 핵산(예컨대, 안티센스 RNA, 안티센스 DNA, miRNA, siRNA, lncRNA) 또는 수술)을 포함한다.
III. 제조 방법
본 개시내용은 본원에 개시된 항바이러스 조성물 및 세포질체의 제조 방법을 제공한다. 일부 실시양태에서, 본 개시내용은 면여계로부터 유래된(수득된) 일반적으로 사용되는 치료 세포(예컨대, 자연 살해(NK) 세포, 호중구, 대식세포, 림프구, 비만 세포, 호염구, 호산구), 줄기 세포(예를 들어, iPSC(유도 만능 줄기 세포), 성인 줄기 세포(예컨대, 중간엽 줄기 세포), 및 배아 줄기 세포 포함), 및 섬유아세포를 포함하나, 이에 제한되지 않는, 정상 또는 암 세포주 또는 신체로부터 제거된 임의의 1차 세포로부터 유래된(예컨대, 수득된) 임의의 유핵 세포로부터 세포 핵을 제거하는 방법(또는 제핵으로 명명)을 제공한다. 세포 제핵은 제한된 시간, 예를 들어, 최대 5일 동안 생존가능한 치료용 세포질체를 생성할 수 있다. 따라서, 일부 측면에서, 본 개시내용은 하기 작용: 증식, 분화, 피험체에 영구적으로 생착, 암화 또는 피험체에게 핵 코딩된 DNA/유전자 전달(예컨대, 위험한 핵 코딩된 DNA/유전자를 피험체에게 전달) 중 하나 이상을 수행할 수 없는 안전한 치료 비히클로서의 세포질체에 대한 새로운 용도를 제공한다.
세포 기반 요법의 경우, 일부 경우에, FDA 승인은, 세포가 일단 피험체 내부에서는 변경되지 않거나, 위험해지지 않는다는 것을 의미하는 것으로 세포가 안정적이라는 증거에 기반을 두고 있다. 그러나, 1차 세포, 방사선 조사된 세포 또는 "사멸 스위치" 제어 세포를 포함한 현재의 세포 제품은 여전히 생체내 미세 환경에 반응하거나, 또는 변화할 가능성이 있다. 중요하게도, 현행 요법은 생체내에서 제어가능한 반응이 아닌 새로운 유전자를 전사할 가능성을 여전히 유지할 수 있다. 이 유전자 전사는 규제 요구 사항을 충족하는 능력을 방해한다. 그에 반해, 핵이 결여된 세포질체는 일반적으로 매우 다른 생체내 미세 환경에서도 새로운 유전자 전사의 가능성이 없으므로 더욱 제거되고, 더욱 안전한 세포 기반 요법이다.
현재까지, 세포 기반 치료제는 일반적으로 정상 또는 조작된 유핵 세포를 사용한다. 일부 세포 기반 요법은 세포 증식 및 유도된 치명적인 DNA 손상을 방지하기 위해 피험체 투여 전에 세포에 조사한다. 그러나, 이 접근법은 돌연변이를 유도하고, 세포 단백질과 DNA를 비가역적으로 손상시킬 수 있는 상당한 양의 활성 산소 종을 생성하여 많은 양의 손상/돌연변이 DNA를 피험체의 신체로 방출할 수 있다. 이러한 생성물은 다른 세포에 통합되거나 원치 않는 항DNA 면역 반응을 유도하는 경우 위험할 수 있다. 조사된 세포는 또한 세포-세포 융합에 의해 돌연변이된 DNA와 유전자를 숙주 세포로 전달할 수 있기 때문에 위험할 수 있다. 세포에서 전체 핵을 제거하는 것은 피험체에 핵 DNA가 도입되는 것을 막을 수 있는 세포 수명을 제한하기 위한 덜 손상되고 상당히 안전한 방법이다. 추가로, 중간엽 줄기 세포(MSC)와 같은 많은 줄기 세포는 방사선 유발 사멸에 대한 저항성이 높기 때문에 이 방법을 사용하여 안전하게 만들 수 없다. 다른 경우에, 치료 세포는 세포 수명을 제한하기 위해 약물 유도성 자살 스위치로 조작되었다. 그러나, 생체내에서 스위치의 활성화는 원치않는 부작용이 있는 강력하고, 잠재적으로 유해한 약물을 피험체에게 투여해야 할 수 있다. 이 방법은 배양 세포에서 자살을 유도할 수 있지만(예컨대, 95% 초과), 임상으로 번역될 때 비효율적일 것으로 예상된다. 임의의 특정 이론에 얽매이지 않고, 피험체의 모든 세포가 약물 유도성 사멸을 겪을 수는 없기 때문에, 약물 유도성 자살 스위치는 임상 실습을 위한 불충분한 안전 조치일 수 있다고 간주된다. 따라서, 광범위하게 조작된 세포 또는 줄기 세포 또는 암 세포의 경우, 약물 유도성 자살 스위치는 임상 실습에 위험하거나 불충분한 것으로 간주될 수 있다. 더욱이, 치료 세포의 사멸은 숙주 세포에 통합되거나, 위험한 전신 항DNA 면역 반응을 유도할 수 있는 다량의 DNA(정상 또는 유전적으로 변경된)를 방출할 수 있다. 세포가 돌연변이화되고/거나, 자살 스위치를 상실하거나, 불활성화시키면, 제어할 수 없는 돌연변이체 세포가 될 수 있다. 추가로, 이들 세포는 피험체의 숙주 세포와 융합할 수 있으므로, DNA(예컨대, 돌연변이체 DNA)를 전달할 수 있다. 이러한 융합된 세포는 모든 숙주 세포가 자살 유전자를 유전으로 이어받는 것은 아니지만, 염색체 재구성 및 세포 하이브리드화 동안 치료 세포의 유전자/DNA 중 일부를 유전으로 이어받을 수 있기 때문에 위험할 수 있다. 추가로, 같은 이유로, 자살 스위치가 있는 치료 세포는 시험관내에서 세포 융합 파트너로 사용하기에 이상적이지 않을 수 있다. 치료 세포 수명을 제한하는 또 다른 방법은 치료 용도(예컨대, 단백질 번역)에 유익한 생물학적 기능을 종료시키는 심각한 손상을 유발하는 열 유발 사멸이다. 세포질체와 달리 유핵 세포 요법 및 심지어는 상기 기술된 방법에 의해 불활성화된 일부 세포는 핵 및 유전 물질을 보유하기 때문에 여전히 피험체에게 DNA를 전달할 수 있다. 화학요법제 약물 및 미토마이신 C 등을 비롯한 수많은 화학물질이 치료 사용 전에 세포 증식을 억제하거나, 세포 사멸을 유발한다. 그러나, 이러한 약물은 세포를 현저하게 손상시키는 상당한 표적외 효과를 가질 수 있으며, 이는 높은 독성에 기인하여 임상 적용에 바람직하지 않다. 많은 항증식제 및 사멸 유도 약물은 내성으로 인해 세포를 100% 효과적으로 억제하지 못하며, 세포질체와 달리 많은 약물 효과가 가역적이다. 따라서, 이 접근법은 생체내에서 불멸화된 세포 또는 암 세포의 세포 성장을 방지하는 데 적합하지 않다.
본원에서는 본 개시내용의 세포질체를 제조하는 방법을 제공한다. 일부 실시양태에서, 유핵 세포(예컨대, 본원에서 "모세포"로 지칭됨)는 피질 액틴 세포골격을 연화시키기 위해 사이토칼라신 B로 처리된다. 일부 실시양태에서, 방법은 예컨대, 바이러스 펩티드 또는 단백질과 같은 활성제를 유핵 세포에 도입하는 단계; 및 모세포로부터 핵을 기계적으로 제거하여 세포질체를 생성하는 단계(핵제거)를 포함한다. 일부 실시양태에서, 모세포는 또한 제핵 전에 제2 활성제에 도입된다. 일부 실시양태에서, 모세포는 제핵 후에 제2 활성제에 도입된다. 제2 활성제는 세포질체에 의해 표적 세포로 전달되는 치료제일 수 있다. 예시적인 표적 세포는 근아세포 또는 성숙한 근육 세포와 같은 근육 세포이다.
활성제는 적절한 일시적 형질감염 방법(예컨대, 전기천공) 또는 형질도입(예컨대, 바이러스 매개)을 사용하여 모세포에 도입된다. 일부 실시양태에서, 활성제를 코딩하는 트랜스진을 포함하는 플라스미드는 모세포 내로 형질감염된다. 일부 실시양태에서, 활성제를 코딩하는 트랜스진을 포함하는 바이러스 벡터는 모세포 내로 형질도입된다. 플라스미드는 박테리아 플라스미드(예컨대, E. 콜라이(E. coli))일 수 있다. 일부 실시양태에서, 모세포는 또한 유사한 방법에 의해 제2 활성제에 도입된다. 일부 실시양태에서, 제2 활성제는 치료제이다.
활성제, 및 임의적으로, 제2 활성제를 발현하는 모세포의 핵은 기계적 제핵을 사용하여 제거된다. 일부 실시양태에서, 모세포 벽은 세포 투과성 진균독소를 사용하여 투과화된다. 기계적 제핵은 세포질체를 형성하기 위해 불연속적인 피콜 구배를 사용한 밀도 구배 원심분리, 고속 원심분리를 수행하는 것을 포함할 수 있다. 세포질체는 표준 정제 프로토콜을 사용하여 분리되고 정제된다. 세포질체는 외인성 핵산(예컨대, mRNA, DNA, 안티센스 올리고뉴클레오티드)으로 추가로 조작될 수 있다.
본 개시내용은 DNA/유전자(예컨대, 플라스미드) RNA(예컨대, mRNA, shRNA, siRNA, miRNA), 단백질, 펩티드, 소분자 치료제(예컨대, 소분자 약물), 유전자 편집 성분, 나노입자, 및 다른 치료제(예컨대, 박테리아, 박테리아 포자, 박테리오파지, 박테리아 성분, 바이러스(예컨대, 종양용해성 바이러스), 엑소좀, 지질 또는 이온)를 포함하나, 이에 제한되지 않는, 치료 기능을 갖는 생체분자의 자연적 또는 유도성 발현 및/또는 흡수를 갖는 세포질체의 제조 방법을 제공한다.
생체분자(예컨대, RNA 분자(예컨대, mRNA, miRNA, siRNA, shRNA, lncRNA), DNA 분자(예컨대, 플라스미드), 단백질, 유전자 편집 인자(예컨대, CRISPR/Cas9 유전자 편집 인자), 펩티드, 플라스미드)를 세포질체(예컨대, 본원에 기술된 임의의 세포로부터 유래된 세포질체) 내로 도입하는 데 사용될 수 있는 다양한 방법이 당업계에 공지되어 있다. 생체분자를 세포질체에 도입하는 데 사용될 수 있는 방법의 비제한적 예로는 전기천공, 미세주입, 리포펙션, 형질감염, 인산칼슘 형질감염, 덴드리머 기반 형질감염, 양이온성 중합체 형질감염, 세포 압착, 초음파천공, 광학 형질감염, 임팰렉션(impalection), 유체역학적 전달, 마그네토펙션 및 나노입자 형질감염을 포함한다. 유전자 편집 인자의 비제한적 예는 CRISPR/Cas9 유전자 편집, 전사 활성제 유사 이펙터 뉴클레아제(TALEN: transcription activator-like effector nuclease), 및 아연 핑거 뉴클레아제를 포함한다.
세포(예컨대, 본원에 기술된 임의의 세포)를 배양하는 방법은 당업계에 널리 공지되어 있다. 세포는 3차원 배양, 저산소 환경, 정의된 세포외 기질 성분, 화학 작용제, 사이토카인, 성장 인자로 처리, 또는 특정 바람직한 세포 반응을 유도하는 천연 또는 합성 외인성 작용제에 대한 노출에서의 배양을 포함하나, 이에 제한되지 않는, 치료 능력/이점을 가진 특정 생물학적 기능의 성장, 증식, 생존능, 분화 및/또는 유도에 바람직한 조건하에 시험관내에서 유지될 수 있다.
방법은 임의의 유핵 세포 유형(예컨대, 포유동물 세포, 인간 세포), 원생동물 세포(예컨대, 아메바 세포), 조류 세포, 식물 세포, 진균 세포, 무척추동물 세포, 어류 세포, 양서류 세포, 파충류 세포, 또는 조류 세포)로부터 유래된 (예컨대, 수득된) 세포질체의 대규모 시험관내 제조를 포함한다. 예를 들어, 세포는 자연적으로 또는 유전 공학에 의해 불멸화 및/또는 발암성 형질전환될 수 있다.
본원에서는 세포질체의 생물학적 활성이 느려지거나 완전히 정지되도록 본 개시내용의 정제 및 단리된 세포질체를 보관하는 방법을 제공한다. 일부 실시양태에서, 세포질체는 최대 10℃인 온도에서 가사 상태로 보관된다. 본원에서는 세포질체의 생물학적 활성이 저속화되거나, 또는 완전히 정지되도록 본 개시내용의 정제 및 단리된 세포질체를 보관하는 방법을 제공한다. 일부 실시양태에서, 세포질체는 최대 10℃인 온도에서 가사 상태로 보관된다. 일부 실시양태에서, 온도는 약 4℃이다. 일부 실시양태에서, 온도는 4℃이다. 일부 실시양태에서, 온도는 최대 4℃이다. 일부 실시양태에서, 세포질체는 최대 약 96시간 동안 보관된다. 일정 시간 후, 세포질체는 세포질체의 생물학적 활성을 회복시키기 위해 가사 상태에서 제거된다. 생성된 세포질체는 생존가능하고, 그를 필요로 하는 피험체에게 전달하기에 적합하다. 일부 실시양태에서, 4℃ 내지 10℃에서 보관된 세포질체는 4℃ 내지 10℃에서 보관되기 전의 세포질체와 비교하여 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상의 생존능을 나타낸다.
본원에 제공된 조성물 및 방법 중 임의의 것의 일부 실시양태에서, 세포질체는 추후 사용을 위해 냉각 또는 동결된다. 극저온에서 혈청(예컨대, 우태아 혈청) 및 디메틸 술폭시드(DMSO)를 사용(동결 동결보존)하거나 4℃에서 보관하기 위한 동면 배지를 사용하는 것(냉동동면)을 포함하나, 이에 제한되지 않는 세포를 보존하는 다양한 방법이 당업계에 알려져 있다. 본원에 제공된 임의의 조성물 및 방법의 일부 실시양태에서, 세포질체는 사용 전에 해동된다.
일부 실시양태에서, 세포질체는 약 -80℃ 내지 약 16℃(예컨대, 약 -80℃ 내지 약 12℃, -80℃ 내지 약 10℃, 약 -80℃ 내지 약 8℃, 약 -80℃ 내지 약 6℃, 약 -80℃ 내지 약 4℃, 약 -80℃ 내지 약 2℃, 약 -80℃ 내지 약 0℃, 약 -80℃ 내지 약 -4℃, 약 -80℃ 내지 약 -10℃, 약 -80℃ 내지 약 -16℃, 약 -80℃ 내지 약 -20℃, 약 -80℃ 내지 약 -25℃, 약 -80℃ 내지 약 -30℃, 약 -80℃ 내지 약 -35℃, 약 -80℃ 내지 약 -40℃, 약 -80℃ 내지 약 -45℃, 약 -80℃ 내지 약 -50℃, 약 -80℃ 내지 약 -55℃, 약 -80℃ 내지 약 -60℃, 약 -80℃ 내지 약 -65℃, 약 -80℃ 내지 약 -70℃, 약 -60℃ 내지 약 16℃, 약 -60℃ 내지 약 12℃, 약 -60℃ 내지 약 10℃, 약 -60℃ 내지 약 8℃, 약 -60℃ 내지 약 6℃, 약 -60℃ 내지 약 4℃, 약 -60℃ 내지 약 2℃, 약 -60℃ 내지 약 0℃, 약 -60℃ 내지 약 -4℃, 약 -60℃ 내지 약 -10℃, 약 - 60℃ 내지 약 -10℃, 약 -60℃ 내지 약 -16℃, 약 -60℃ 내지 약 -20℃, 약 -60℃ 내지 약 -25℃, 약 -60℃ 내지 약 -30℃, 약 -60℃ 내지 약 -35℃, 약 -60℃ 내지 약 -40℃, 약 -60℃ 내지 약 -50℃, 약 -50℃ 내지 약 16℃, 약 -50℃ 내지 약 12℃, 약 -50℃ 내지 약 10℃, 약 -50℃ 내지 약 8℃, 약 -50℃ 내지 약 6℃, 약 -50℃ 내지 약 4℃, 약 -50℃ 내지 약 2℃, 약 -50℃ 내지 약 0℃, 약 -50℃ 내지 약 -4℃, 약 -50℃ 내지 약 -10℃, 약 -50℃ 내지 약 -16℃, 약 -50℃ 내지 약 -20℃, 약 -50℃ 내지 약 -30℃, 약 -50℃ 내지 약 -40℃, 약 -20℃ 내지 약 16℃, 약 -20℃ 내지 약 12℃, 약 -20℃ 내지 약 10℃, 약 -20℃ 내지 약 8℃, 약 -20℃ 내지 약 6℃, 약 -20℃ 내지 약 4℃, 약 -20℃ 내지 약 2℃, -약 20℃ 내지 약 0℃, 약 -20℃ 내지 약 -4℃, 약 -20℃ 내지 약 -10℃, 약 - 20℃ 내지 약 -15℃, 약 -10℃ 내지 약 16℃, 약 -10℃ 내지 약 12℃, 약 -10℃ 내지 약 10℃, 약 -10℃ 내지 약 8℃, 약 -10℃ 내지 약 6℃, 약 -10℃ 내지 약 4℃, 약 -10℃ 내지 약 2℃, 약 -10℃ 내지 약 0℃, 약 -10℃ 내지 약 -4℃, 약 -10℃ 내지 약 -6℃, 약 -4℃ 내지 약 16℃, 약 -4℃ 내지 약 10℃, 약 -4℃ 내지 약 6℃, 약 -4℃ 내지 약 4℃, 약 -4℃ 내지 약 2℃, 약 -4℃ 내지 약 0℃, 약 -2℃ 내지 약 16℃, 약 -2℃ 내지 약 12℃, 약 -2℃ 내지 약 10℃, 약 -2℃ 내지 약 6℃, 약 -2℃ 내지 약 4℃, 약 -2℃ 내지 약 2℃, 약 -2℃ 내지 약 0℃, 약 0℃ 내지 약 16℃, 약 0℃ 내지 약 14℃, 약 0℃ 내지 약 12℃, 약 0℃ 내지 약 10℃, 약 0℃ 내지 약 8℃, 약 0℃ 내지 약 6℃, 약 0℃ 내지 약 4℃, 약 2℃ 내지 약 16℃, 약 2℃ 내지 약 12℃, 약 2℃ 내지 약 10℃, 약 2℃ 내지 약 8℃, 약 2℃ 내지 약 6℃, 약 2℃ 내지 약 4℃, 약 4℃ 내지 약 16℃, 약 4℃ 내지 약 12℃, 약 4℃ 내지 약 10℃, 약 4℃ 내지 약 8℃, 약 4℃ 내지 약 6℃, 약 6℃ 내지 약 16℃, 약 6℃ 내지 약 12℃, 약 6℃ 내지 약 10℃, 약 6℃ 내지 약 8℃, 약 8℃ 내지 약 16℃, 약 8℃ 내지 약 12℃, 약 8℃ 내지 약 10℃, 약 10℃ 내지 약 16℃, 약 10℃ 내지 약 12℃, 또는 약 12℃ 내지 약 16℃) 온도에서 약 1일 내지 약 7일(예컨대, 약 1일 내지 약 6일, 약 1일 내지 약 5일, 약 1일 내지 약 4일, 약 1일 내지 약 3일, 약 1일 내지 약 2일, 약 2일 내지 약 7일, 약 2일 내지 약 6일, 약 2일 내지 약 5일, 약 2일 내지 약 4일, 약 2일 내지 약 3일, 약 3일 내지 약 7일, 약 3일 내지 약 6일, 약 3일 내지 약 5일, 약 3일 내지 약 4일, 약 4일 내지 약 7일, 약 4일 내지 약 6일, 약 4일 내지 약 5일, 약 5일 내지 약 7일, 약 5일 내지 약 6일, 또는 약 6일 내지 약 7일) 동안 보관될 수 있다. 일부 실시양태에서, 본원에 기술된 온도 범위에서 보관된 세포질체는 동일한 온도 범위에서 보관되기 전의 세포질체와 비교하여 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상의 생존능을 나타낸다.
일부 실시양태에서, 세포질체는 동결건조된 것이다. 일부 실시양태에서, 세포질체는 보관을 위해 동결건조된 것이다. 일부 실시양태에서, 세포질체는 적어도 1시간, 2시간, 4시간, 6시간, 8시간, 12시간, 24시간, 2일, 3일, 4일, 5일, 6일, 7일, 8일, 9일, 10일, 12일, 14일, 16일, 18일, 20일, 22일, 24일, 26일, 28일, 30일, 2개월, 3개월, 4개월, 5개월, 6개월, 2개월, 3개월, 4개월, 5개월, 6개월, 7개월, 8개월, 9개월, 10개월, 11개월, 12개월, 18개월, 24개월, 30개월, 3년, 4년, 5년, 또는 10년 이상 동안 동결건조된 것이다. 일부 실시양태에서, 세포질체는 동결건조 이전의 세포질체와 비교하여 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 이상의 생존능을 나타낸다.
IV. 키트
일부 실시양태에서, 본원에서는 본원에 기술된 조성물, 약학적 조성물, 또는 세포질체를 사용하기 위한 키트를 개시한다. 일부 실시양태에서, 본원에 개시된 키트는 피험체에서 질환 또는 병태를 예방하거나, 또는 치료하는 데; 또는 본원에 개시된 질환 또는 병태에 대한 예방 또는 치료를 위한 피험체를 선별하는 데 사용될 수 있다. 일부 실시양태에서, 키트는 본원에 기술된 방법을 수행하는 데 사용될 수 있는 본원에 기술된 약학적 조성물, 조성물, 또는 세포질체를 포함한다. 키트는 물질 또는 성분의 집합을 포함한다. 따라서, 일부 실시양태에서, 키트는 본원에 기술된 질환 또는 장애의 치료를 위한 약학적 조성물 또는 세포질체를 포함하는 조성물을 함유한다.
일부 실시양태에서, 본원에 기술된 키트는 균질한 세포질체 집단을 선택하기 위한 성분을 포함한다. 일부 실시양태에서, 본원에 기술된 키트는 이종성 세포질체 집단을 선택하기 위한 성분을 포함한다. 일부 실시양태에서, 키트는 세포질체에 의해 합성되거나, 방출된 외인성 치료제의 단위수를 검정하기 위한 성분을 포함한다. 일부 실시양태에서, 키트는 세포질체의 표면 상에 발현된 외인성 치료제의 단위수를 검정하기 위한 성분을 포함한다. 일부 실시양태에서, 키트는 예컨대, 효소 결합 면역 흡착 검정법(ELISA: enzyme-linked immunosorbent assay), 단일 분자 어레이(Simoa: single-molecular array), PCR 및 qPCR과 같은 검정을 수행하기 위한 성분을 포함한다. 키트에 구성된 성분의 정확한 성질은 의도된 목적에 따라 달라진다. 예를 들어, 일부 실시양태는 피험체에서 본원에 개시된 질환 또는 병태(예컨대, 호흡기 질환)를 백신접종하거나, 또는 치료할 목적으로 구성된다. 일부 실시양태에서, 키트는 특히 포유동물 피험체를 백신접종하거나, 또는 치료할 목적으로 구성된다. 일부 실시양태에서, 키트는 특히 인간 피험체를 백신접종하거나, 또는 치료할 목적으로 구성된다.
사용 설명서가 키트에 포함될 수 있다. 예를 들어, 설명서는 의료 시설 또는 현장 진료 능력에서 키트의 성분으로 피험체에 백신접종하는 방법을 의료 제공자에게 지시할 수 있다. 임의적으로, 키트는 예컨대, 희석제, 완충제, 약학적으로 허용되는 담체, 주사기, 카테터, 도포기, 피펫팅 또는 측정 도구, 붕대 물질 또는 다른 유용한 도구와 같은 다른 유용한 성분도 함유한다. 조작성과 유용성을 보존하는 임의의 편리하고 적절한 방식으로 보관된 키트에 조립된 물질 또는 성분은 의사에게 제공될 수 있다. 예를 들어, 성분은 용해, 탈수 또는 동결건조된 형태일 수 있고; 그들은 실온, 냉장 또는 동결 온도에서 제공될 수 있다. 성분은 전형적으로 적합한 포장재(들)에 포함된다. 본원에서 사용되는 바, "포장재"라는 어구는 예컨대, 조성물 등과 같은 키트의 내용물을 수용하는 데 사용되는 하나 이상의 물리적 구조를 지칭한다. 포장재는 널리 공지된 방법으로 구성되며, 바람직하게는 멸균 상태의 오염 물질이 없는 환경을 제공한다. 키트에 사용된 포장재는 유전자 발현 검정법 및 치료제 투여에 관례적으로 사용되는 것이다. 본원에서 사용되는 바, 용어 "패키지"는 개별 키트 성분을 수용할 수 있는 적합한 고체 매트릭스 또는 물질, 예컨대, 유리, 플라스틱, 종이, 호일 등을 지칭한다. 따라서, 예를 들어, 패키지는 적절한 양의 약학적 조성물을 함유하는 데 사용되는 유리 바이알 또는 미리 충전된 시린지일 수 있다. 포장재에는 내용물 및/또는 키트 및 그의 성분의 목적을 나타내는 외부 라벨이 있다.
V. 정의
달리 정의되지 않는 한, 본원에 사용된 모든 기술 용어, 표기법 및 다른 기술 및 과학 용어 또는 용어들은 청구된 주제가 속하는 기술 분야의 통상의 기술자가 일반적으로 이해하는 것과 동일한 의미를 갖는 것으로 의도된다. 일부 실시양태에서, 일반적으로 이해되는 의미를 갖는 용어는 명료성을 위해 및/또는 용이한 참조를 위해 본원에 정의되며, 본원에 이러한 정의를 포함하는 것이 반드시 당업계에서 일반적으로 이해되는 것과 실질적인 차이를 나타내는 것으로 해석되어서는 안 된다.
본 출원 전역에 걸쳐, 다양한 실시양태가 범위 포맷으로 제시될 수 있다. 범위 포맷의 설명은 단지 편의와 간결함을 위한 것이며, 본 개시내용의 범주에 대한 융통성 없는 제한으로 해석되어서는 안된다는 것을 이해하여야 한다. 따라서, 범위에 대한 설명은 가능한 모든 하위범위와 해당 범위 내의 개별 수치를 구체적으로 개시한 것으로 간주되어야 한다. 예를 들어, 예컨대, 1 내지 6과 같은 범위의 설명은 예컨대, 1 내지 3, 1 내지 4, 1 내지 5, 2 내지 4, 2 내지 6, 3 내지 6 등과 같은 하위범위 뿐만 아니라, 해당 범위 내의 개별 수치, 예를 들어, 1, 2, 3, 4, 5, 및 6을 구체적으로 개시한 것으로 간주되어야 한다. 이는 범위의 폭에 관계없이 적용된다.
명세서 및 청구범위에 사용된 바와 같이, "하나"("a," "an") 및 "그"라는 단수 형태는 문맥에서 명백하게 달리 지시하지 않는 한, 복수의 지시 대상을 포함한다. 예를 들어, "한 샘플"이라는 용어는 그의 혼합물을 포함하는 복수의 샘플을 포함한다.
예를 들어 "~할 것이다," "~하지 않을 것이다," "~해야 한다," "~하지 말아야 한다," "~해야 한다," "~하면 안된다," "먼저," "처음에," "다음에," "이어서," "전," "후," "마지막으로" 및 "최종적으로"와 같은 절대적 또는 순차적 용어의 사용은 본원에 개시된 본 실시양태의 범주를 제한하려는 것이 아니라, 예시적인 것으로 의도된다.
본원에서 사용되는 바, "적어도 하나의," "하나 이상의", 및 "및/또는"이라는 어구는 사용시 접속 및 이접 모두인 개방형 표현이다. 예를 들어, "A, B 및 C 중 적어도 하나," "A, B 또는 C 중 적어도 하나," "A, B 및 C 중 하나 이상," "A, B 또는 C 중 하나 이상" 및 "A, B, 및/또는 C"라는 표현은 각각 A, B 또는 C" 및 "A, B 및/또는 C"는 A 단독, B 단독, C 단독, A 및 B 함께, A 및 C 함께, B 및 C 함께 또는 A, B 및 C 함께인 것을 의미한다.
"적어도," "초과" 또는 "이상"이라는 용어가 일련의 2개 이상의 숫자 값에서 첫 번째 숫자 값 앞에 위치할 때마다, "적어도," "초과" 또는 "이상"이라는 용어는 일련의 숫자 값에 있는 각 숫자 값에 적용된다. 예를 들어, 1, 2 또는 3 이상은 이상, 2 이상, 또는 3 이상과 같다.
"이하(no more than)," "미만," "이하" 또는 "이하(less than or equal to)"라는 용어가 일련의 2개 이상의 숫자 값에서 첫 번째 숫자 값 앞에 위치할 때마다, "이하," "미만," "이하" 또는 "이하"라는 용어는 일련의 숫자 값에 있는 각 숫자 값에 적용된다. 예를 들어, 3, 2 또는 1 이하는 3 이하, 2 이하, 또는 1 이하와 같다.
본원에 기술된 모든 시스템, 방법, 소프트웨어, 조성물 및 플랫폼은 모듈식이며, 순차적 단계로 제한되지 않는다. 따라서, "첫 번째" 및 "두 번째"와 같은 용어가 반드시 우선 순위, 중요도 또는 행위 순서를 의미하는 것은 아니다.
본원에서 사용되는 바, "증가된" 또는 "증가"라는 용어는 일반적으로 통계상 유의적인 양만큼의 증가를 의미한다. 일부 실시양태에서, "증가된" 또는 "증가"라는 용어는 기준 수준과 비교하여 적어도 10%의 증가, 예를 들어, 기준 수준, 표준, 또는 대조군과 비교하여 적어도 약 10%, 적어도 약 20%, 또는 적어도 약 30%, 또는 적어도 약 40%, 또는 적어도 약 50%, 또는 적어도 약 60%, 또는 적어도 약 70%, 또는 적어도 약 80%, 또는 적어도 약 90% 또는 최대 100% 증가(및 100% 증가 포함) 또는 10-100% 사이의 임의의 증가를 의미한다. "증가"의 다른 예로는 기준 수준과 비교하여 적어도 2배, 적어도 5배, 적어도 10배, 적어도 20배, 적어도 50배, 적어도 100배, 적어도 1000배 또는 그 초과의 증가를 포함한다.
본원에서 사용되는 바, "감소된" 또는 "감소"라는 용어는 일반적으로 통계상 유의적인 양만큼의 감소를 의미한다. 일부 실시양태에서, "감소된" 또는 "감소"라는 용어는 기준 수준과 비교하여 적어도 10%만큼의 감소, 예를 들어, 기준 수준과 비교하여 적어도 약 20%, 또는 적어도 약 30%, 또는 적어도 약 40%, 또는 적어도 약 50%, 또는 적어도 약 60%, 또는 적어도 약 70%, 또는 적어도 약 80%, 또는 적어도 약 90% 또는 최대 100%만큼의 감소(및 100% 감소 포함)(예컨대, 기준 수준과 비교하여 수준 부재 또는 검출불가능한 수준), 또는 10-100% 사이의 임의의 감소를 의미한다. 마커 또는 증상과 관련하여, 본 용어는 상기 수준의 통계상 유의적인 감소를 의미한다. 감소는 예를 들어, 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40% 또는 그 초과일 수 있고, 바람직하게는 주어진 질환을 앓는 개체에 대한 정상 범위 내에 포함되는 것으로 허용되는 수준까지 하락하는 것이다. "감소"의 다른 예는 기준 수준과 비교하여 적어도 2배, 적어도 5배, 적어도 10배, 적어도 20배, 적어도 50배, 적어도 100배, 적어도 1000배 또는 그 초과의 감소를 포함한다.
본원에서 사용되는 바, "세포"는 일반적으로 살아있는 유기체의 생물학적 단위를 지칭한다.
본원에서 사용되는 바, 용어 "진핵 세포"는 별개의 막 결합 핵을 갖는 세포를 지칭한다. 이러한 세포는 예를 들어, 포유동물(예컨대, 설치류, 인간이 아닌 영장류 또는 인간), 비포유동물(예컨대, 어류, 조류, 파충류 또는 양서류), 무척추동물, 곤충, 진균 또는 식물 세포를 포함할 수 있다. 일부 실시양태에서, 진핵 세포는 효모세포, 예컨대, 사카로마이세스 세레비지아에이다. 일부 실시양태에서, 진핵 세포는 포유동물, 조류, 식물 또는 곤충 세포와 같은 고등 진핵생물이다.
본원에서 사용되는 바, 용어 "세포질체," "핵이 없는 세포," 또는 "제핵 세포"는 이전의 유핵 세포(예컨대, 본원에 기술된 임의의 세포)로부터 수득된 핵이 없는 세포를 지칭하는 것으로 상호교환적으로 사용된다. 일부 실시양태에서, 유핵 세포는 세포 세포소기관을 포함하고, 유핵 세포로부터 유래된 세포질체는 이러한 세포소기관을 보유하고, 이는 일부 경우에 세포 운동성, 단백질 합성, 단백질 분비 등과 같은 세포 기능을 가능하게 한다. 일부 실시양태에서, "수득하는"이라는 것은 자연적 프로세스 또는 다른 방법을 사용하여 유핵 세포를 제핵 세포로 분화시키는 것을 포함하지 않는다.
본원에서 사용되는 바, 용어 "뉴클레오티드"는 일반적으로 염기-당-포스페이트 조합을 지칭한다. 뉴클레오티드는 합성 뉴클레오티드를 포함할 수 있다. 뉴클레오티드는 합성 뉴클레오티드 유사체를 포함할 수 있다. 뉴클레오티드는 핵산 서열의 단량체 단위일 수 있다(예컨대, 데옥시리보핵산(DNA: deoxyribonucleic acid) 및 리보핵산(RNA: ribonucleic acid)). 용어 뉴클레오티드는 리보뉴클레오시드 트리포스페이트 아데노신 트리포스페이트(ATP: adenosine triphosphate), 우리딘 트리포스페이트(UTP: uridine triphosphate), 시토신 트리포스페이트(CTP: cytosine triphosphate), 구아노신 트리포스페이트(GTP: guanosine triphosphate) 및 데옥시리보뉴클레오시드 트리포스페이트, 예컨대, dATP, dCTP, dITP, dUTP, dTTP, 또는 그의 유도체를 포함할 수 있다. 이러한 유도체는 예를 들어, [αS]dATP, 7-데아자-dGTP 및 7-데아자-dATP, 및 그를 함유하는 핵산 분자에 뉴클레아제 내성을 부여하는 뉴클레오티드 유도체를 포함할 수 있다. 본원에서 사용되는 바, 용어 뉴클레오티드는 디데옥시리보뉴클레오시드 트리포스페이트(ddNTP: dideoxyribonucleoside triphosphate) 및 그의 유도체를 지칭할 수 있다. 디데옥시리보뉴클레오시드 트리포스페이트의 예시적인 예는 ddATP, ddCTP, ddGTP, ddITP 및 ddTTP를 포함할 수 있지만, 이에 제한되지 않는다. 뉴클레오티드는 표지되지 않거나, 널리 공지된 기술에 의해 검출가능하게 표지될 수 있다. 표지화는 양자점으로도 수행할 수 있다. 검출가능한 표지는 예를 들어, 방사성 동위원소, 형광 표지, 화학발광 표지, 생물발광 표지 및 효소 표지를 포함할 수 있다. 뉴클레오티드의 형광 표지는 플루오레세인, 5-카복시플루오레세인(FAM), 2'7'-디메톡시-4'5-디클로로-6-카복시플루오레세인(JOE), 로다민, 6-카복시로다민(R6G), N,N,N',N'-테트라메틸-6-카복시로다민(TAMRA), 6-카복시-X-로다민(ROX), 4-(4'디메틸아미노페닐아조) 벤조산(DABCYL), 캐스케이드 블루, 오레곤 그린, 텍사스 레드, 시아닌 및 5-(2'-아미노에틸)아미노나프탈렌-1-술폰산(EDANS)을 포함할 수 있지만, 이에 제한되지 않는다. 표지된 뉴클레오티드의 특정 예는 퍼킨 엘머(Perkin Elmer: 미국 캘리포니아주 포스터 시티 소재)로부터 이용가능한, [R6G]dUTP, [TAMRA]dUTP, [R110]dCTP, [R6G]dCTP, [TAMRA]dCTP, [JOE]ddATP, [R6G]ddATP, [FAM]ddCTP, [R110]ddCTP, [TAMRA]ddGTP, [ROX]ddTTP, [dR6G]ddATP, [dR110]ddCTP, [dTAMRA]ddGTP, 및 [dROX]ddTTP; 아마샴(Amersham: 미국 일리노이주 알링턴 헤이츠 소재)으로부터 이용가능한 플루오로링크(FluoroLink) 데옥시뉴클레오티드, 플루오로링크 Cy3-dCTP, 플루오로링크 Cy5-dCTP, 플루오로링크 Fluor X-dCTP, 플루오로링크 Cy3-dUTP, 및 플루오로링크 Cy5-dUTP; 베링거 만하임(Boehringer Mannheim: 미국 인디애나주 인디애나폴리스 소재)으로부터 이용가능한 플루오레세인-15-dATP, 플루오레세인-12-dUTP, 테트라메틸-로다민-6-dUTP, IR770-9-dATP, 플루오레세인-12-ddUTP, 플루오레세인-12-UTP, 및 플루오레세인-15-2'-dATP; 및 몰레큘라 프로브즈(Molecular Probes: 미국 오레곤주 유진 소재)로부터 이용가능한 염색체 표지된 뉴클레오티드, BODIPY-FL-14-UTP, BODIPY-FL-4-UTP, BODIPY-TMR-14-UTP, BODIPY-TMR-14-dUTP, BODIPY-TR-14-UTP, BODIPY-TR-14-dUTP, 캐스케이드 블루-7-UTP, 캐스케이드 블루-7-dUTP, 플루오레세인-12-UTP, 플루오레세인-12-dUTP, 오레곤 그린 488-5-dUTP, 로다민 그린-5-UTP, 로다민 그린-5-dUTP, 테트라메틸로다민-6-UTP, 테트라메틸로다민-6-dUTP, 텍사스 레드-5-UTP, 텍사스 레드-5-dUTP, 및 텍사스 레드-12-dUTP를 포함할 수 있다. 뉴클레오티드는 또한 화학적 변형에 의해 표지화되거나, 또는 마킹될 수 있다. 화학적으로 변형된 단일 뉴클레오티드는 비오틴-dNTP일 수 있다. 비오티닐화된 dNTP의 일부 비제한적인 예로는 비오틴-dATP(예컨대, bio-N6-ddATP, 비오틴-14-dATP), 비오틴-dCTP(예컨대, 비오틴-11-dCTP, 비오틴-14-dCTP), 및 비오틴-dUTP(예컨대, 비오틴-11-dUTP, 비오틴-16-dUTP, 비오틴-20-dUTP)를 포함할 수 있다.
용어 "폴리뉴클레오티드," "올리고뉴클레오티드," 및 "핵산"은 단일-, 이중-, 또는 다중-가닥 형태의, 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 또는 그의 유사체인 임의의 길이의 뉴클레오티드의 중합체 형태를 지칭하는 것으로 상호교환적으로 사용된다. 폴리뉴클레오티드는 세포에 대해 외인성 또는 내인성일 수 있다. 폴리뉴클레오티드는 무세포 환경에 존재할 수 있다. 폴리뉴클레오티드는 유전자 또는 그의 단편일 수 있다. 폴리뉴클레오티드는 DNA일 수 있다. 폴리뉴클레오티드는 RNA일 수 있다. 폴리뉴클레오티드는 임의의 3차원 구조를 가질 수 있으며, 알려지거나, 또는 알려지지 않은 모든 기능을 수행할 수 있다. 폴리뉴클레오티드는 하나 이상의 유사체(예컨대, 변경된 백본, 당 또는 핵염기)를 포함할 수 있다. 존재하는 경우, 뉴클레오티드 구조에 대한 변형은 중합체의 조립 전 또는 후에 부여될 수 있다. 유사체의 일부 비제한적 예에는 5-브로모우라실, 펩티드 핵산, 제노 핵산, 모르폴리노, 잠긴 핵산, 글리콜 핵산, 트레오스 핵산, 디데옥시뉴클레오티드, 코디세핀, 7-데아자-GTP, 형광단(예컨대, 로다민 또는 당에 연결된 플루오레세인), 티올 함유 뉴클레오티드, 비오틴 연결된 뉴클레오티드, 형광 염기 유사체, CpG 섬, 메틸-7-구아노신, 메틸화된 뉴클레오티드, 이노신, 티오우리딘, 슈도우르딘, 디하이드로우리딘, 큐오신 및 와이오신을 포함한다. 폴리뉴클레오티드의 비제한적인 예는 유전자 또는 유전자 단편의 코딩 또는 비코딩 영역, 연결 분석으로부터 정의된 유전자좌들(유전자좌), 엑손, 인트론, 메신저 RNA(mRNA), 전달 RNA(tRNA), 리보솜 RNA(rRNA), 짧은 간섭 RNA(siRNA), 짧은 헤어핀 RNA(shRNA), 마이크로RNA(miRNA), 리보자임, cDNA, 재조합 폴리뉴클레오티드, 분지형 폴리뉴클레오티드, 플라스미드, 벡터, 임의의 서열의 단리된 DNA, 임의의 서열의 단리된 RNA, 무세포 DNA(cfDNA) 및 무세포 RNA(cfRNA)를 비롯한 무세포 폴리뉴클레오티드, 핵산 프로브 및 프라이머를 포함한다. 뉴클레오티드의 서열은 뉴클레오티드가 아닌 성분에 의해 중단될 수 있다.
용어 "형질감염" 또는 "형질감염된"은 일반적으로 비바이러스 또는 바이러스 기반 방법에 의한 세포 내로의 핵산의 도입을 지칭한다. 핵산 분자는 완전한 단백질 또는 그의 기능적 부분을 코딩하는 유전자 서열일 수 있다. 예컨대, 문헌 [Sambrook et al., 1989, Molecular Cloning: A Laboratory Manual, 18.1-18.88]을 참조한다.
본원에서 사용되는 바, 용어 "유전자"는 임의적으로, 코딩 서열의 상류 또는 하류에 위치할 수 있는, 예컨대, 프로모터, 오퍼레이터, 터미네이터 등과 같은 연관된 조절 영역과 함께 개별 단백질 또는 RNA("코딩 서열" 또는 "코딩 영역"으로도 지칭)를 코딩하는 핵산 세그먼트를 지칭한다. 용어 "유전자"는 광범위하게 해석되어야 하며, mRNA, cDNA, cRNA 및 게놈 DNA 형태의 유전자를 포함할 수 있다. 일부 사용에서, 용어 "유전자"는 5' 및 3' 비번역 영역(5'-UTR 및 3'-UTR), 엑손 및 인트론을 포함하는 전사된 서열을 포함한다. 일부 유전자에서, 전사된 영역은 폴리펩티드를 코딩하는 "오픈 리딩 프레임"을 포함한다. 용어의 일부 사용에서, "유전자"는 폴리펩티드를 코딩하는 데 필요한 코딩 서열(예컨대, "오픈 리딩 프레임" 또는 "코딩 영역")만을 포함한다. 일부 측면에서, 유전자는 폴리펩티드, 예를 들어, 리보솜 RNA 유전자(rRNA) 및 전달 RNA(tRNA) 유전자를 코딩하지 않는다. 일부 측면에서, 용어 "유전자"는 전사된 서열을 포함할 뿐만 아니라, 상류 및 하류 조절 영역, 인핸서 및 프로모터를 포함하는 전사되지 않은 영역도 포함한다. 용어 "유전자"는 mRNA, cDNA 및 게놈 형태의 유전자를 포함할 수 있다.
본원에서 사용되는 바, 용어 "돌연변이"는 서열, 예컨대, 핵산 또는 아미노산 서열 내의 잔기를 또 다른 잔기로 치환, 또는 서열 내의 하나 이상의 잔기의 결실 또는 삽입을 지칭할 수 있다. 하나 이상의 돌연변이는 원래 잔기를 확인하고, 서열내 잔기의 위치와 새로 치환된 잔기의 아이덴티티를 확인함으로써 설명할 수 있다. 돌연변이는 기준 서열 대비 서열(예컨대, 핵산 서열, 게놈 서열, DNA, RNA 또는 단백질 서열과 같은 유전자 서열)의 변화 또는 변경일 수 있다. 기준 서열은 야생형 서열, 건강한 또는 정상 세포의 서열, 또는 질환 또는 장애와 연관되지 않은 서열일 수 있다. 기준 서열은 암과 연관되지 않은 서열일 수 있다. 돌연변이의 비제한적인 예는 점 돌연변이, 하나 이상의 뉴클레오티드의 치환, 하나 이상의 뉴클레오티드의 결실, 하나 이상의 뉴클레오티드의 삽입, 하나 이상의 뉴클레오티드의 융합, 프레임 시프트 돌연변이, 이상, 대안적 스플라이싱, 비정상적인 메틸화, 미스센스 돌연변이, 보존적 돌연변이, 비보존적 돌연변이, 넌센스 돌연변이, 스플라이스 변이체, 대안적 스플라이스 변이, 전이, 전환, 드 노보 돌연변이, 유해 돌연변이, 질환유발 돌연변이, 후성 돌연변이, 창시자 돌연변이, 생식계열 돌연변이, 체세포 돌연변이, 소인 돌연변이, 스플라이스 부위 돌연변이 또는 감수성 유전자 돌연변이를 포함한다. 돌연변이는 특정 질환 또는 장애에 대한 개체의 감수성 또는 소인을 증가시키는 병원성 변이체 또는 돌연변이일 수 있다. 돌연변이는 드라이버 돌연변이일 수 있다(예컨대, 미세환경에서 세포에 적합성 이점을 부여하여 세포 계통을 암으로 유도할 수 있는 돌연변이). 드라이버 돌연변이는 기능 상실 돌연변이일 수 있다. 돌연변이는 기능 상실 돌연변이일 수 있다. 돌연변이는 패신저 돌연변이(예컨대, 드라이버 돌연변이가 있는 게놈에서 발생하고, 클론 확장과 연관될 수 있는 돌연변이)일 수 있다. 본원에서 사용되는 바, 용어 "유전자"는 천연 또는 재조합 방식으로 작동적으로 연결될 때 일부 생성물 또는 기능을 제공하는 폴리뉴클레오티드 요소의 조합을 지칭할 수 있다.
본원에서 사용되는 바, 용어 "폴리펩티드," "펩티드" 및 "단백질"은 아미노산 잔기의 중합체와 관련하여 본원에서 상호교환적으로 사용될 수 있다. 단백질은 코딩 오픈 리딩 프레임에서 번역되거나, 또는 그의 성숙한 형태로 프로세싱된 전장 폴리펩티드를 지칭할 수 있는 반면, 폴리펩티드 또는 펩티드는 그럼에도 불구하고 고유하거나, 또는 식별가능하게 특정 단백질로 맵핑되는 단백질의 분해 단편 또는 프로세싱 단편을 지칭할 수 있다. 폴리펩티드는 인접한 아미노산 잔기의 카복실 기와 아미노 기 사이의 펩티드 결합에 의해 함께 결합된 아미노산의 단일 선형 중합체 쇄일 수 있다. 폴리펩티드는 예를 들어 탄수화물 부가, 인산화 등에 의해 변형될 수 있다. 단백질은 하나 이상의 폴리펩티드를 포함할 수 있다.
본원에서 사용되는 바, 용어 "일부" 또는 "단편" 또는 등가 용어는 엔티티(예컨대, 단백질)의 일부를 나타낼 수 있다. 단백질 또는 폴리펩티드의 경우, 부분 또는 단편은 단백질 또는 폴리펩티드의 전장보다 작다. 일부 실시양태에서, 부분 또는 단편은 전장 단백질의 의도된 기능을 유지한다.
본원에서 사용되는 바, 용어 "상보체," "상보체들," "상보적" 및 "상보성"은 일반적으로 주어진 서열에 완전히 상보적이고, 하이브리드화 가능한 서열을 지칭한다. 일부 실시양태에서, 주어진 영역에 대한 염기의 서열이 그의 결합 파트너의 염기 서열에 상보적으로 결합할 수 있는 경우, 주어진 핵산과 하이브리드화된 서열은 주어진 분자의 "보체" 또는 "역-보체"로 지칭되며, 예를 들어 A-T, A-U, G-C 및 G-U 염기쌍이 형성되도록 한다. 일반적으로, 제2 서열에 하이브리드화할 수 있는 제1 서열은 제2 서열에 특이적으로 또는 선택적으로 하이브리드화 가능하며, 이로써, 하이브리드화 반응 동안 비표적 서열과의 하이브리드화보다 제2 서열 또는 제2 서열 세트에 대한 하이브리드화가 바람직하다(예컨대, 주어진 조건 세트, 예를 들어, 당업계에서 일반적으로 사용되는 엄격한 조건하에서 열역학적으로 더욱 안정적이다). 전형적으로, 일반적으로, 하이브리드화 가능한 서열은 적어도 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 및 100% 서열 상보성을 비롯한 25%-100% 상보성과 같은 각 길이의 전체 또는 일부에 걸쳐 상당한 정도의 서열 상보성을 공유한다. 예컨대, 상보성(%) 평가를 위한 서열 동일성은 니들만-운쉬(Needleman-Wunsch) 알고리즘 (예컨대, 임의적으로, 디폴트 세팅과 함께, www.ebi.ac.uk/Tools/psa/emboss_needle/nucleotide.html에서 이용가능한 EMBOSS Needle 얼라이너 참조), BLAST 알고리즘 (예컨대, 임의적으로, 디폴트 세팅과 함께, blast.ncbi.nlm.nih.gov/Blast.cgi에서 이용가능한 BLAST 정렬 도구 참조), 또는 스미스-워터만(Smith-Waterman) 알고리즘 (예컨대, 임의적으로, 디폴트 세팅과 함께, www.ebi.ac.uk/Tools/psa/emboss_water/nucleotide.html에서 이용가능한 EMBOSS Water 얼라이너 참조)을 포함하나, 이에 제한되지 않는, 임의의 적합한 정렬 알고리즘에 의해 측정될 수 있다. 디폴트 파라미터를 포함하여 선택한 알고리즘의 임의의 적합한 파라미터를 사용하여 최적의 정렬을 평가할 수 있다.
본원에서 사용되는 바, 용어 "동일성(%)"은 서열을 정렬하고, 필요할 경우, 최대 동일성(%)을 달성하도록 갭을 도입한 후, 기준 서열의 아미노산(또는 핵산) 잔기와 동일한 후보 서열의 아미노산(또는 핵산) 잔기의 백분율을 지칭한다(즉, 최정의 정렬을 위해 후보 및 기준 서열 중 하나 또는 둘 모두에 갭이 도입될 수 있고, 비상동성 서열은 비교 목적을 위해서는 무시될 수 있다). 동일성(%) 측정을 위한 정렬은 공개적으로 이용가능한 컴퓨터 소프트웨어, 예컨대, BLAST, ALIGN, 또는 Megalign(DNASTAR) 소프트웨어를 사용하여 당업계의 기술 범위 내의 다양한 방식으로 달성될 수 있다. 두 서열의 동일성(%)은 BLAST를 사용하여 시험 서열을 비교 서열과 정렬하고, 정렬된 시험 서열 중 비교 서열의 동일한 위치에 있는 아미노산 또는 뉴클레오티드와 동일한 아미노산 또는 뉴클레오티드의 수를 측정하고, 동일한 아미노산 또는 뉴클레오티드의 수를 비교 서열의 아미노산 또는 뉴클레오티드의 수로 나눔으로써 계산할 수 있다.
"결정하는," "측정하는," "평가하는(evaluating)," "평가하는(assessing)," "검정하는" 및 "분석하는"이라는 용어는 종종 측정 형태를 지칭하는 것으로 본원에서 상호교환적으로 사용된다. 본 용어는 요소의 존재 여부 결정(예컨대, 검출)을 포함한다. 본 용어는 정량적, 정성적 또는 정량적 및 정성적 결정을 포함할 수 있다. 평가는 상대적이거나, 또는 절대적일 수 있다. "~의 존재를 검출하는 것"은 컨텍스트에 따라 존재하는지 여부를 측정하는 것 외에도 존재하는 것의 양을 결정하는 것을 포함할 수 있다.
용어 "피험체" 및 "개체"는 발현된 유전 물질을 함유하는 생물학적 엔티티를 지칭하는 것으로 본원에서 종종 상호교환적으로 사용된다. 본원에서 사용되는 바, 용어 "피험체"는 임의의 유기체를 지칭한다. 예를 들어, 피험체는 포유동물, 양서류, 어류, 파충류, 무척추동물, 조류, 식물, 고세균, 진균 또는 박테리아일 수 있다. 일부 실시양태에서, 피험체는 포유동물이다. 일부 실시양태에서, 피험체는 설치류(예컨대, 마우스, 래트, 햄스터, 기니피그), 개과(예컨대, 개), 고양이과(예컨대, 고양이), 말과(예컨대, 말), 양, 소, 돼지, 인간이 아닌 영장류, 예컨대, 유인원(예컨대, 원숭이), 유인원(예컨대, 고릴라, 침팬지, 오랑우탄, 긴팔원숭이), 또는 인간일 수 있다. 피험체는 생체내에서 수득되거나, 또는 시험관내에서 배양된 생물학적 엔티티의 조직, 세포 및 이들의 자손일 수 있다. 피험체는 포유동물일 수 있다. 포유동물은 인간일 수 있다. 피험체는 "환자"일 수 있으며, 일부 실시양태에서, 이는 본원에 기술된 질환 또는 병태 진단을 받았거나, 또는 질환 또는 병태를 앓는 피험체를 지칭한다. 일부 실시양태에서, 피험체는 진단을 받지는 않았지만, 질환 또는 병태가 발병되거나, 또는 그를 앓을 위험이 높은 것으로 예측된다.
"생체내"라는 용어는 피험체의 신체에서 발생하는 이벤트를 기술하는 데 사용된다.
"생체외"라는 용어는 피험체의 신체 외부에서 발생하는 이벤트를 기술하는 데 사용된다. 생체외 분석은 피험체에 대해 수행되지 않는다. 오히려 피험체와 별개의 샘플에 대해 수행된다. 샘플에 대해 수행된 생체외 검정법의 예는 "시험관 내" 검정법이다.
"시험관내"라는 용어는 물질이 획득되는 생물학적 공급원으로부터 분리되도록 실험실 시약을 보관하기 위한 용기에 포함된 발생 이벤트를 설명하는 데 사용된다. 시험관내 검정법은 살아있는 세포 또는 죽은 세포가 사용되는 세포 기반 검정법을 포함할 수 있다. 시험관내 검정법은 또한 무손상 세포가 사용되지 않는 무세포 검정법을 포함할 수 있다.
본원에서 사용되는 바, 용어 "약"은 해당 수치 ± 해당 수치의 10%를 지칭한다. "약" 범위라는 용어는 해당 범위에서 가장 낮은 값의 10%를 뺀 값 내지 최대 값의 10%를 더한 값을 나타낸다.
본원에서 사용되는 바, 용어 "치료" 또는 "치료하는"은 수용자에게 유익하거나, 또는 원하는 결과를 얻기 위한 약학적 또는 다른 개입 요법과 관련하여 사용된다. 유익하거나, 또는 원하는 결과로는 치료적 이점 및/또는 예방적 이점을 포함하나, 이에 제한되지 않는다. 치료적 이점은 치료 중인 증상 또는 기저 장애의 근절 또는 개선을 지칭할 수 있다. 또한, 치료적 이점은 피험체가 여전히 기저 장애를 앓고 있을 수 있음에도 불구하고 기저 장애와 연관된 하나 이상의 생리학적 증상의 근절 또는 개선으로 달성될 수 있어 피험체에서 개선이 관찰될 수 있다. 예방 효과는 질환 또는 병태의 출현 지연, 예방 또는 제거, 질환 또는 병태의 증상 발병 지연 또는 제거, 질환 또는 병태의 진행 지연, 정지 또는 역전, 또는 그의 임의의 조합을 포함한다. 예방적 이점을 위해, 특정 질환이 발병할 위험이 있는 피험체 또는 질환의 생리학적 증상 중 하나 이상을 보고하는 피험체에게 이 질환에 대한 진단을 받지 않았더라도 치료를 받을 수 있다.
본원에서 사용되는 바, 용어 "적응 면역 반응"은 항원 제한된 방식으로 반응하는 면역 반응의 성분을 지칭하고, T 림프구에 기인하는 세포성 면역 반응 및 B 세포 및 형질 세포에 기인하는 체액성 또는 항체 반응을 포함한다 . "세포 면역 반응"은 하기: T 세포에 의한 사이토카인/케모카인 방출; 2차 림프 기관으로의 T 세포 귀소; T 세포 증식; 및 세포독성 T 세포 반응 중 임의의 하나 이상의 것으로 나타난다. 몇몇의 방법은 T 림프구의 생체외 항원 자극 검정법 및 T 림프구의 사량체 염색과 같은 생체내 검정법을 비롯한, 항원 특이적 세포 면역 반응을 확인하는 데 사용할 수 있다. "항체 반응"은 하기: B 세포 증식, B 세포 사이토카인/케모카인 방출, 2차 림프 기관으로의 B 세포 귀소, 항체 분비, IgG 유형 항체로의 이소타입 전환 또는 형질 세포 분화 중 임의의 하나 이상의 것으로 나타난다. 항체 반응은 여러 가지 방법으로 확인할 수 있지만, 백신접종 받은 개체의 혈청 또는 혈장 중 항원 특이적 항체를 검출하는 방법이 주된 방법이다.
본원에 기술된 바와 같이, "애주번트"는 항원과 조합하여 항원에 대한 적응 면역 반응을 촉진하는 물질을 지칭한다. "면역 자극 화합물"은 궁극적으로 면역 반응의 적응 성분(예컨대, B 세포, T 세포)의 발생을 유도하는 "위험 신호"를 개시하기 위해 선천성 면역계와 특이적으로 상호작용하는 물질을 지칭한다. 면역 자극 화합물로는 자연 발생 또는 합성의 dsRNA, 지질다당류 및 CpG DNA와 같은 병원체 연관 분자 패턴(PAMP)을 포함한다. 면역 자극 화합물은 톨 유사 수용체(TLR), NOD-유사 수용체, RIG-1 또는 MDA-5 수용체, C형 렉틴 수용체 또는 STING 경로를 비롯한 다양한 선천성 면역 수용체의 효능제이다.
용어 "약학적으로 허용되는 담체," "약학적으로 허용되는 부형제," "생리적으로 허용되는 담체," 또는 "생리적으로 허용되는 부형제"는 약학적으로 허용되는 물질, 조성물, 또는 비히클, 예컨대, 액체 또는 고체 충전제, 희석제, 부형제, 용매 또는 캡슐화 물질을 지칭한다. 성분은 약학적 제제의 다른 성분과 양립할 수 있다는 의미에서 "약학적으로 허용되는" 것일 수 있다. 또한 합리적인 이익/위험비에 비례하여, 과도한 독성, 자극, 알레르기 반응, 면역원성 또는 다른 문제나 합병증 없이, 인간 및 동물의 조직 또는 기관과 접촉하여 사용하기에 적합할 수 있다. 문헌 [Remington: The Science and Practice of Pharmacy, 21st Edition; Lippincott Williams & Wilkins: Philadelphia, PA, 2005]; [Handbook of Pharmaceutical Excipients, 5th Edition"; Rowe et al., Eds., The Pharmaceutical Press and the American Pharmaceutical Association: 2005]; 및 [Handbook of Pharmaceutical Additives, 3rd Edition; Ash and Ash Eds., Gower Publishing Company: 2007]; [Pharmaceutical Preformulation and Formulation, Gibson Ed., CRC Press LLC: Boca Raton, FL, 2004]를 참조한다.
용어 "약학적 조성물"은 희석제 또는 담체와 같은 다른 화학 성분과 본원에 개시된 화합물의 혼합물을 지칭한다. 약학적 조성물은 유기체에 대한 화합물의 투여를 용이하게 할 수 있다. 경구, 주사, 에어로졸, 비경구 및 국소 투여를 포함하나, 이에 제한되지 않는, 화합물을 투여하는 다수의 기술이 당업계에 존재한다. 본원에 사용된 섹션 표제는 단지 조직화 목적으로만 사용되며, 기술된 주제를 제한하는 것으로 해석되지 않아야 한다.
VI. 실시양태
조성물
본원에서는 하기 실시양태에 따른 조성물을 개시한다:
실시양태 1. 제핵되고, 항바이러스제를 포함하는 세포를 포함하는 조성물.
실시양태 2. 실시양태 1에 있어서, 항바이러스제가 약독화된 버전의 바이러스 항원, 바이러스, 또는 바이러스 항원에 특이적인 항체인 것인 조성물.
실시양태 3. 실시양태 2에 있어서, 바이러스 항원이 바이러스 단백질, 펩티드 단편, 핵산, 또는 당 모이어티이고, 여기서, 바이러스 항원에 특이적인 항체는 바이러스 단백질, 펩티드 단편, 핵산, 또는 당 모이어티에 특이적인 것인 조성물.
실시양태 4. 실시양태 2에 있어서, 세포가 항바이러스제의 생체내 단백질 합성 또는 단백질 분비를 위한 하나 이상의 세포내 세포소기관을 포함하는 것인 조성물.
실시양태 5. 실시양태 4에 있어서, 하나 이상의 세포내 세포소기관이 골지체, 리보솜, 소포체로부터 선택되는 것인 조성물.
실시양태 6. 상기 실시양태 중 임의의 것에 있어서, 세포 직경이 약 1 마이크로미터 내지 100 마이크로미터 길이인 것인 조성물.
실시양태 7. 상기 실시양태 중 임의의 것에 있어서, 세포가 줄기 세포인 것인 조성물.
실시양태 8. 실시양태 7에 있어서, 줄기 세포가 중간엽 줄기 세포 또는 유도 만능 줄기 세포인 것인 조성물.
실시양태 9. 실시양태 8에 있어서, 중간엽 줄기 세포가 지방 조직 또는 뼈로부터 유래된 것인 조성물.
실시양태 10. 실시양태 8에 있어서, 유도 만능 줄기 세포가 소변, 타액, 모발, 피부 또는 대변으로부터 유래된 것인 조성물
실시양태 11. 실시양태 2-10에 있어서, 바이러스 항원 또는 바이러스 항원에 특이적인 항체가 세포의 표면에서 발현되거나, 또는 분비되는 것인 조성물.
실시양태 12. 상기 실시양태 중 임의의 것에 있어서, 바이러스의 바이러스 항원이 화학적 링커, 펩티드 링커, 또는 중합체로부터 선택된 링커에 의해 세포의 표면에 테더링된 것인 조성물.
실시양태 13. 상기 실시양태 중 임의의 것에 있어서, 항바이러스제가
b) 이중 가닥(ds) DNA 바이러스(예컨대, 아데노바이러스, 헤르페스바이러스, 폭스바이러스);
c) 단일 가닥(ss) DNA 바이러스(+ 가닥 또는 "센스") DNA(예컨대, 파보바이러스);
d) dsRNA 바이러스(예컨대, 레오바이러스);
e) (+)ssRNA 바이러스(+ 가닥 또는 센스) RNA(예컨대, 피코나바이러스, 토가바이러스);
f) (-)ssRNA 바이러스(- 가닥 또는 안티센스) RNA(예컨대, 오르토믹소바이러스, 랍도바이러스);
g) 라이프 사이클에서 DNA 중간체를 갖는 ssRNA-RT 바이러스(+ 가닥 또는 센스) RNA(예컨대, 레트로바이러스); 또는
h) 라이프 사이클에서 RNA 중간체를 갖는 dsDNA-RT 바이러스 DNA(예컨대, 헤파드나바이러스)로부터 선택되는 바이러스에 특이적이거나, 또는 그로부터 유래된 것인 조성물.
실시양태 14. 상기 실시양태 중 임의의 것에 있어서, 항바이러스제가 호흡기 바이러스, 피부 바이러스, 식품매개 바이러스, 성 매개 바이러스, 또는 종양용해성 바이러스, 또는 그의 조합으로부터 유래된 것인 조성물
실시양태 15. 실시양태 14에 있어서, 호흡기 바이러스는 리노바이러스, 인플루엔자 바이러스, 호흡기 세포융합 바이러스, 및 코로나 바이러스로부터 선택되는 것인 조성물
실시양태 16. 실시양태 14에 있어서, 피부 바이러스가 전염성 연속종, 단순 헤르페스 바이러스-1, 및 수두 대상포진 바이러스로부터 선택되는 것인 조성물.
실시양태 17. 실시양태 14에 있어서, 식품매개 바이러스가 A형 간염, 노로바이러스, 및 로타바이러스로부터 선택되는 것인 조성물.
실시양태 18. 실시양태 14에 있어서, 성 매개 바이러스가 인간 유두종바이러스, B형 간염, 성기 헤르페스, 및 인간 면역결핍 바이러스로부터 선택되는 것인 조성물.
실시양태 19. 실시양태 14에 있어서, 종양용해성 바이러스가 인간 유두종바이러스 또는 B형 간염인 것인 조성물.
실시양태 20. 실시양태 12에 있어서, 링커가 글리코실-포스파티딜이노시톨(GPI) 또는 B7-1 항원(B7-1) 세포질 테일을 포함하는 것인 조성물.
실시양태 21. 실시양태 3에 있어서, 바이러스 항원이 세포에서 발현되는 막횡단 펩티드인 것인 조성물.
실시양태 22. 실시양태 3-21에 있어서, 바이러스 항원이 인간에 대해 면역원성인 것인 조성물.
실시양태 23. 실시양태 3-22에 있어서, 바이러스 항원이 코로나 바이러스로부터 유래된 펩티드인 것인 조성물.
실시양태 24. 실시양태 23에 있어서, 코로나 바이러스가 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2), 또는 그의 변이체인 것인 조성물.
실시양태 25. 실시양태 23 또는 24에 있어서, 펩티드가 코로나 바이러스로부터 유래된 스파이크 단백질, 막 단백질, 또는 핵단백질로부터 선택되는 것인 조성물.
실시양태 26. 실시양태 25에 있어서, 세포가 펩티드를 코딩하는 mRNA를 포함하는 것인 조성물.
실시양태 27. 실시양태 26에 있어서, mRNA가 서열 번호 1과 적어도 80% 동일한 mRNA 서열을 포함하는 것인 조성물.
실시양태 28. 실시양태 26에 있어서, mRNA가 서열 번호 1과 적어도 85% 동일한 mRNA 서열을 포함하는 것인 조성물.
실시양태 29. 실시양태 26에 있어서, mRNA가 서열 번호 1과 적어도 90% 동일한 mRNA 서열을 포함하는 것인 조성물.
실시양태 30. 실시양태 26에 있어서, mRNA가 서열 번호 1과 적어도 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 mRNA 서열을 포함하는 것인 조성물.
실시양태 31. 실시양태 26에 있어서, mRNA가 서열 번호 1과 적어도 100% 동일한 mRNA 서열을 포함하는 것인 조성물.
실시양태 32.실시양태 23-26에 있어서, 펩티드가 서열 번호 2 또는 8과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는 것인 조성물.
실시양태 33. 실시양태 26-32에 있어서, mRNA 반감기가 3-5일인 것인 조성물.
실시양태 34. 실시양태 26-32에 있어서, mRNA가 알부민 펩티드를 포함하는 융합 단백질을 코딩하는 것인 조성물.
실시양태 35. 실시양태 26-32에 있어서, mRNA가 면역조정제를 포함하는 융합 단백질을 코딩하는 것인 조성물.
실시양태 36. 실시양태 35에 있어서, 면역조정제가 피험체에서 면역 반응의 활성제인 것인 조성물.
실시양태 37. 실시양태 36에 있어서, 면역조정제가 과립구-대식세포 콜로니 자극 인자(GM-CSF) 또는 사이토카인, 또는 그의 조합인 것인 조성물.
실시양태 38. 상기 실시양태 중 임의의 것에 있어서, 세포가 하나 이상의 귀소 수용체를 추가로 포함하는 것인 조성물.
실시양태 39. 실시양태 38에 있어서, 하나 이상의 귀소 수용체가 화학적 링커, 펩티드 링커, 또는 중합체로부터 선택되는 링커에 의해 세포의 표면에 테더링된 것인 조성물.
실시양태 40. 실시양태 39에 있어서, 링커가 글리코실-포스파티딜이노시톨(GPI) 또는 B7-1 항원(B7-1) 세포질 테일을 포함하는 것인 조성물.
실시양태 41. 실시양태 38에 있어서, 하나 이상의 귀소 수용체가 세포의 표면 상에서 발현되는 것인 조성물.
실시양태 42. 실시양태 41에 있어서, 하나 이상의 귀소 수용체가 세포의 표면 상에서의 하나 이상의 귀소 수용체의 발현을 증가시키도록 유전적으로 변형된 것인 조성물.
실시양태 43. 실시양태 38-42에 있어서, 하나 이상의 귀소 수용체가 림프 조직 중 하나 이상의 세포 상에서 발현된 하나 이상의 리간드에 특이적인 것인 조성물.
실시양태 44. 실시양태 43에 있어서, 림프 조직 중 하나 이상의 세포가 내피 세포, 림프구, 대식세포, 또는 망상 세포, 또는 그의 조합을 포함하는 것인 조성물.
실시양태 45. 실시양태 38-44에 있어서, 하나 이상의 귀소 수용체가 동일하지 않은 2개 이상의 리간드에 특이적인 2개 이상의 귀소 수용체를 포함하는 것인 조성물.
실시양태 46. 실시양태 38-45에 있어서, 하나 이상의 귀소 수용체가 C-X-C 케모카인 수용체 타입 3(CXCR3), 류코시아린(CD43), CD44 항원(CD44), C-C 케모카인 수용체 타입 7(CCR7), L-셀렉틴(CD62L), 림프구 기능 연관 항원 1(LFA-1), 또는 초후기 항원-4(VLA4)로부터 선택되는 것인 조성물.
실시양태 47. 실시양태 38-46에 있어서, 하나 이상의 귀소 수용체가 L-셀렉틴(CD62L) 및 C-C 케모카인 수용체 타입 7(CCR7)을 포함하는 것인 조성물.
실시양태 48. 실시양태 38-46에 있어서, 하나 이상의 귀소 수용체가 림프 조직의 내피 세포에서 발현된 리간드에 특이적이고, 바이러스 항원은 조성물이 피험체에게 투여되었을 때, 피험체에서 코로나 바이러스에 대한 면역 반응을 활성화시키는 데 효과적인 것인 조성물.
실시양태 49. 상기 실시양태 중 임의의 것에 있어서, 세포가 하나 이상의 면역조정제를 추가로 포함하는 것인 조성물.
실시양태 50. 실시양태 49에 있어서, 하나 이상의 면역조정제가 세포의 표면에 테더링된 것인 조성물.
실시양태 51. 실시양태 50에 있어서, 하나 이상의 면역조정제가 글리코실-포스파티딜이노시톨(GPI) 또는 B7-1 항원(B7-1) 세포질 테일을 포함하는 링커를 사용하여 세포의 표면에 테더링된 것인 조성물.
실시양태 52. 실시양태 49-51에 있어서, 하나 이상의 면역조정제가 세포의 표면 상에서 발현되는 것인 조성물.
실시양태 53. 실시양태 49-52에 있어서, 하나 이상의 면역조정제가 과립구-대식세포 콜로니 자극 인자(GM-CSF), 종양 괴사 인자 알파(TNF-알파), 림프독소 알파(LTA), 림프독소 베타(LTB), TNF 슈퍼패밀리 구성원 4(TNFSF4), CD40 리간드(CD40LG), fas 리간드(FASLG), CD70 분자(CD70), TNF 슈퍼패밀리 구성원 8(TNFSF8), TNF 슈퍼패밀리 구성원 9(TNFSF9), TNF 슈퍼패밀리 구성원 10(TNFSF10), TNF 슈퍼패밀리 구성원 11(TNFSF11), TNF 슈퍼패밀리 구성원 12(TNFSF12), TNF 슈퍼패밀리 구성원 13(TNFSF13), TNF 슈퍼패밀리 구성원 13b(TNFSF13B), TNF 슈퍼패밀리 구성원 14(TNFSF14), TNF 슈퍼패밀리 구성원 15(TNFSF15), TNF 슈퍼패밀리 18(TNFSF18), 엑토디스플라신 A(EDA), 사이토카인, 및 바이러스 항원 단백질로 구성된 군으로부터 선택되는 것인 조성물.
실시양태 54. 실시양태 49-53에 있어서, 하나 이상의 면역조정제가 알부민 펩티드를 포함하는 융합 단백질인 것인 조성물.
실시양태 55. 실시양태 1-54에 있어서, 조성물이 단리된 것인 조성물.
실시양태 56. 실시양태 1-54에 있어서, 조성물이 정제된 것인 조성물.
실시양태 57. 실시양태 1-54에 있어서, 현탁액 중 또는 세포 배양물 중, 또는 그 둘 모두에 복수의 세포를 포함하는 조성물.
실시양태 58. 실시양태 1-57에 있어서, 조성물이 적어도 48시간 동안 동결보존되거나, 또는 미리 동결보존된 것인 조성물.
실시양태 59. 상기 실시양태 중 임의의 것의 조성물을 필요로 하는 피험체에게 상기 조성물을 전신 전달 또는 직접 전달에 의해 투여하는 단계를 포함하는, 상기 실시양태 중 임의의 것의 조성물을 전달하는 방법.
실시양태 60. 실시양태 59에 있어서, 전신 전달이 정맥내 전달 또는 흡입을 포함하고, 여기서, 직접 전달이 근육내, 복강내, 및 림프절내 전달을 포함하는 것인 방법.
실시양태 61. 실시양태 59-60에 있어서, 전달 후 조성물을 구성하는 생 바이러스에 의한 감염으로부터 피험체를 실질적으로 면역화시키는 단계를 추가로 포함하는 방법.
실시양태 62. 실시양태 1-58의 조성물을 피험체에게 투여하여 조성물을 구성하는 생 바이러스에 의한 감염으로부터 피험체를 실질적으로 면역화시키는 단계를 포함하는, 피험체에서 바이러스 감염을 예방하는 방법.
실시양태 63. 실시양태 1-58의 조성물을 피험체에게 투여하여 피험체에서 바이러스 로드를 감소시키는 단계를 포함하는, 피험체에서 급성 바이러스 감염을 치료하는 방법.
실시양태 64. 실시양태 1-58의 조성물을 피험체에게 투여하여 코로나바이러스에 의해 유발되는 질환을 예방하는 단계를 포함하는, 피험체에서 코로나바이러스에 의해 유발되는 질환을 예방하는 방법.
실시양태 65. 실시양태 1-58의 조성물을 피험체에게 투여하여 코로나바이러스에 의해 유발된 질환을 치료하는 단계를 포함하는, 피험체에서 코로나바이러스에 의해 유발된 질환을 치료하는 방법.
실시양태 66. 실시양태 64 및 65에 있어서, 질환이 코로나바이러스 질환 2019(COVID-19)인 것인 방법.
실시양태 67. 실시양태 59-66에 있어서, (a) 적어도 48시간 동안 4℃에서 현탁액에서 보관된 조성물을 받는 단계로서, 여기서, 조성물은 생물학적 활성이 저속화되거나, 정지된 것인 단계; 및 (b) 현탁액으로부터 조성물을 제거하여 조성물의 생물학적 활성을 회복시키는 단계를 추가로 포함하는 방법.
제조 방법
본원에서는 하기 실시양태에 따라 세포질체를 사용하여 조성물을 제조하는 방법을 개시한다:
실시양태 1.
(a) 제1 바이러스 항원 또는 항바이러스 항체를 코딩하는 제1 핵산을 모세포에 도입하는 단계로서, 모세포는
i) 핵; 및
ii) 단백질 합성 또는 단백질 분비를 위한 하나 이상의 세포내 세포소기관을 포함하는 것인 단계; 및
(b) 모 줄기 세포로부터 핵을 기계적으로 제거하여 제핵 줄기 세포를 생성하는 단계로서, 여기서, 제핵 줄기 세포는 하나 이상의 세포내 세포소기관을 포함하는 것인 단계를 포함하는, 조성물을 제조하는 방법.
실시양태 2.
(a) 제1 바이러스 항원 또는 항바이러스 항체를 코딩하는 제1 핵산을 제핵 줄기 세포에 도입하는 단계로서, 제핵 줄기 세포는 제1 바이러스 항원 또는 항바이러스 항체의 단백질 합성 또는 단백질 분비를 위한 하나 이상의 세포내 세포소기관을 포함하는 것인 단계; 및
(b) 제핵 줄기 세포에서 제1 바이러스 항원 또는 항바이러스 항체를 발현하는 단계를 포함하는, 조성물을 제조하는 방법.
실시양태 3. 실시양태 1 및 2에 있어서, 제1 바이러스 항원이 제핵 줄기 세포의 표면에서 발현되는 것인 방법.
실시양태 4. 상기 실시양태 중 임의의 것에 있어서, 제1 바이러스 항원 또는 항바이러스 항체가 분비성인 것인 방법.
실시양태 5. 상기 실시양태 중 임의의 것에 있어서, 제핵 줄기 세포를 현탁액의 동결 온도 미만의 온도에서 적어도 24시간, 48시간, 또는 96시간 동안 현탁액 중에 보관하는 단계를 추가로 포함하는 방법.
실시양태 6. 상기 실시양태 중 임의의 것에 있어서, 제2 바이러스 항원을 코딩하는 제2 핵산을 도입하는 단계를 추가로 포함하고, 여기서, 제1 및 제2 핵산은 동일하지 않고, 제1 및 제2 바이러스 항원은 동일하지 않은 것인 방법.
실시양태 7. 상기 실시양태 중 임의의 것에 있어서, 제1 바이러스 항원과 상이한 복수의 바이러스 항원을 코딩하는 복수의 핵산을 도입하는 단계를 추가로 포함하는 방법.
실시양태 8. 상기 실시양태 중 임의의 것에 있어서, 핵산이 메신저 RNA(mRNA)인 것인 방법.
실시양태 9. 상기 실시양태 중 임의의 것에 있어서, 핵산이 DNA인 것인 방법.
실시양태 10. 상기 실시양태 중 임의의 것에 있어서, 제1 바이러스 항원이 포유동물로부터 유래된 것인 방법.
실시양태 11. 상기 실시양태 중 임의의 것에 있어서, 항바이러스 항체가 코로나 바이러스에 특이적인 것인 방법.
실시양태 12. 상기 실시양태 중 임의의 것에 있어서, 제1 바이러스 항원이 로부터 유래된 약독화된 바이러스 입자인 것인 방법.
실시양태 13. 상기 실시양태 중 임의의 것에 있어서, 제1 바이러스 항원이 화학적 링커, 펩티드 링커, 또는 중합체로부터 선택된 링커에 의해 제핵 줄기 세포의 표면에 테더링된 것인 방법.
실시양태 14. 실시양태 13, 링커가 글리코실-포스파티딜이노시톨(GPI) 또는 B7-1 항원(B7-1) 세포질 테일을 포함하는 것인 방법.
실시양태 15. 상기 실시양태 중 임의의 것에 있어서, 제1 바이러스 항원이 제핵 줄기 세포에서 발현된 막횡단 펩티드인 것인 방법.
실시양태 16. 상기 실시양태 중 임의의 것에 있어서, 제1 바이러스 항원이 인간에 대해 면역원성인 것인 방법.
실시양태 17. 상기 실시양태 중 임의의 것에 있어서, 제1 바이러스 항원이 코로나 바이러스로부터 유래된 펩티드인 것인 방법.
실시양태 18. 실시양태 17에 있어서, 펩티드가 코로나 바이러스로부터 유래된 스파이크 단백질, 막 단백질, 또는 핵단백질로부터 선택되는 것인 방법.
실시양태 19. 실시양태 18에 있어서, 코로나 바이러스가 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2), 또는 그의 변이체인 것인 방법.
실시양태 20. 실시양태 17-19에 있어서, 제핵 줄기 세포가 펩티드를 코딩하는 mRNA를 포함하는 것인 방법.
실시양태 21. 실시양태 20에 있어서, mRNA가 서열 번호 1과 적어도 80% 동일한 mRNA 서열을 포함하는 것인 방법.
실시양태 22. 실시양태 20에 있어서, mRNA가 서열 번호 1과 적어도 85% 동일한 mRNA 서열을 포함하는 것인 방법.
실시양태 23. 실시양태 20에 있어서, mRNA가 서열 번호 1과 적어도 90% 동일한 mRNA 서열을 포함하는 것인 방법.
실시양태 24. 실시양태 20에 있어서, mRNA가 서열 번호 1과 적어도 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 mRNA 서열을 포함하는 것인 방법.
실시양태 25. 실시양태 20에 있어서, mRNA가 서열 번호 1과 적어도 100% 동일한 mRNA 서열을 포함하는 것인 방법.
실시양태 26. 실시양태 17-20에 있어서, 펩티드가 서열 번호 2와 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는 것인 방법.
실시양태 27. 실시양태 20-26에 있어서, mRNA 반감기가 3-5일인 것인 방법.
실시양태 28. 실시양태 20-26에 있어서, mRNA가 알부민 펩티드를 포함하는 융합 단백질을 코딩하는 것인 방법.
실시양태 29. 실시양태 20-26에 있어서, mRNA가 면역조정제를 포함하는 융합 단백질을 코딩하는 것인 방법.
실시양태 30. 실시양태 29에 있어서, 면역조정제가 피험체에서 면역 반응의 활성제인 것인 방법.
실시양태 31. 실시양태 30에 있어서, 면역조정제가 과립구-대식세포 콜로니 자극 인자(GM-CSF) 또는 사이토카인, 또는 그의 조합인 것인 방법.
실시양태 32. 상기 실시양태 중 임의의 것에 있어서, 제핵 줄기 세포가 하나 이상의 귀소 수용체를 추가로 포함하는 것인 방법.
실시양태 33. 실시양태 32에 있어서, 하나 이상의 귀소 수용체가 화학적 링커, 펩티드 링커, 또는 중합체로부터 선택되는 링커에 의해 제핵 줄기 세포의 표면에 테더링된 것인 방법.
실시양태 34. 실시양태 33에 있어서, 링커가 글리코실-포스파티딜이노시톨(GPI) 또는 B7-1 항원(B7-1) 세포질 테일을 포함하는 것인 방법.
실시양태 35. 실시양태 32에 있어서, 하나 이상의 귀소 수용체가 제핵 줄기 세포의 표면 상에서 발현되는 것인 방법.
실시양태 36. 실시양태 32-35에 있어서, 하나 이상의 귀소 수용체가 제핵 줄기 세포의 표면 상에서의 하나 이상의 귀소 수용체의 발현을 증가시키도록 유전적으로 변형된 것인 방법.
실시양태 37. 실시양태 32-36에 있어서, 하나 이상의 귀소 수용체가 림프 조직 중 하나 이상의 세포 상에서 발현된 하나 이상의 리간드에 특이적인 것인 방법.
실시양태 38. 실시양태 37에 있어서, 림프 조직 중 하나 이상의 세포가 내피 세포, 림프구, 대식세포, 또는 망상 세포, 또는 그의 조합으로부터 선택되는 것인 방법.
실시양태 39. 실시양태 32-38에 있어서, 하나 이상의 귀소 수용체가 동일하지 않은 2개 이상의 리간드에 특이적인 2개 이상의 귀소 수용체를 포함하는 것인 방법.
실시양태 40. 실시양태 32-39에 있어서, 하나 이상의 귀소 수용체가 C-X-C 케모카인 수용체 타입 3 (CXCR3), 류코시아린 (CD43), CD44 항원(CD44), C-C 케모카인 수용체 타입 7(CCR7), L-셀렉틴 (CD62L), 림프구 기능 연관 항원 1(LFA-1), 또는 초후기 항원-4(VLA4)로부터 선택되는 것인 방법.
실시양태 41. 실시양태 32-40에 있어서, 하나 이상의 귀소 수용체가 L-셀렉틴(CD62L) 및 C-C 케모카인 수용체 타입 7(CCR7)을 포함하는 것인 방법.
실시양태 42. 실시양태 32-41에 있어서, 하나 이상의 귀소 수용체가 림프 조직의 내피 세포에서 발현된 리간드에 특이적이고, 바이러스 항원은 조성물이 피험체에게 투여되었을 때, 피험체에서 코로나 바이러스에 대한 면역 반응을 활성화시키는 데 효과적인 것인 방법.
실시양태 43. 상기 실시양태 중 임의의 것에 있어서, 제핵 줄기 세포가 하나 이상의 면역조정제를 추가로 포함하는 것인 방법.
실시양태 44. 실시양태 43에 있어서, 하나 이상의 면역조정제가 제핵 줄기 세포의 표면에 테더링된 것인 방법.
실시양태 45. 실시양태 44에 있어서, 하나 이상의 면역조정제가 글리코실-포스파티딜이노시톨(GPI) 또는 B7-1 항원(B7-1) 세포질 테일을 포함하는 링커를 사용하여 제핵 줄기 세포의 표면에 테더링된 것인 방법.
실시양태 46. 실시양태 43-45에 있어서, 하나 이상의 면역조정제가 제핵 줄기 세포의 표면 상에서 발현되는 것인 방법.
실시양태 47. 실시양태 43-46에 있어서, 하나 이상의 면역조정제가 과립구-대식세포 콜로니 자극 인자(GM-CSF), 종양 괴사 인자 알파(TNF-알파), 림프독소 알파(LTA), 림프독소 베타(LTB), TNF 슈퍼패밀리 구성원 4(TNFSF4), CD40 리간드(CD40LG), fas 리간드(FASLG), CD70 분자(CD70), TNF 슈퍼패밀리 구성원 8(TNFSF8), TNF 슈퍼패밀리 구성원 9(TNFSF9), TNF 슈퍼패밀리 구성원 10(TNFSF10), TNF 슈퍼패밀리 구성원 11(TNFSF11), TNF 슈퍼패밀리 구성원 12(TNFSF12), TNF 슈퍼패밀리 구성원 13(TNFSF13), TNF 슈퍼패밀리 구성원 13b(TNFSF13B), TNF 슈퍼패밀리 구성원 14(TNFSF14), TNF 슈퍼패밀리 구성원 15(TNFSF15), TNF 슈퍼패밀리 18(TNFSF18), 엑토디스플라신 A(EDA), 사이토카인, 및 바이러스 항원 단백질로 구성된 군으로부터 선택되는 것인 방법.
실시양태 48. 실시양태 43-47에 있어서, 하나 이상의 면역조정제가 알부민 펩티드를 포함하는 융합 단백질인 것인 방법.
실시양태 49. 실시양태 1-48에 있어서, 방법이 제핵 줄기 세포를 단리시키는 단계를 추가로 포함하는 것인 방법.
실시양태 50. 실시양태 1-48에 있어서, 방법이 제핵 줄기 세포를 정제하는 단계를 추가로 포함하는 것인 방법.
실시양태 51. 실시양태 1-48에 있어서, 제핵 줄기 세포가 현탁액 중 또는 세포 배양물 중, 또는 그 둘 모두 중 복수의 제핵 줄기 세포인 것인 방법.
실시양태 52. 실시양태 1-48에 있어서, 방법이 적어도 48시간 동안 제핵 줄기 세포를 동결보존하는 단계를 추가로 포함하는 것인 방법.
실시양태 53. 실시양태 1-48의 조성물을 피험체에게 투여하여 코로나바이러스에 의해 유발되는 질환을 예방하는 단계를 포함하는, 피험체에서 코로나바이러스에 의해 유발되는 질환을 예방하는 방법.
실시양태 54. 실시양태 1-48의 조성물을 피험체에게 투여하여 코로나바이러스에 의해 유발된 질환을 치료하는 단계를 포함하는, 피험체에서 코로나바이러스에 의해 유발된 질환을 치료하는 방법.
실시양태 55. 실시양태 53 및 54에 있어서, 질환이 코로나바이러스 질환 2019(COVID-19)인 것인 방법.
실시양태 56. 실시양태 1-55에 있어서, (a) 적어도 48시간 동안 4℃에서 현탁액에서 보관된 제핵 줄기 세포를 받는 단계로서, 여기서, 제핵 줄기 세포는 생물학적 활성이 저속화되거나, 정지된 것인 단계; 및 (b) 현탁액으로부터 제핵 줄기 세포를 제거하여 제핵 줄기 세포의 생물학적 활성을 회복시키는 단계를 추가로 포함하는 방법.
바이러스 포획 방법
실시양태 1.
(a) 병원체 제거를 필요로 하는 피험체에게 실질적으로 핵이 없는 복수의 세포를 투여하는 단계;
(b) i. 병원체에 의한, (a)에서 피험체에게 투여된 복수의 세포의 생체내 감염을 허용하고;
ii. 일단 복수의 세포가 감염되고 나면, 병원체의 증식을 방해하고;
iii. 식세포 작용에 의해 복수의 세포를 피험체로부터 제거하여 병원체를 피험체로부터 제거함으로써 피험체의 조직에서 병원체를 격리시키는 단계를 포함하는, 피험체에서 병원체를 제거하는 방법.
실시양태 2. 실시양태 1에 있어서, 병원체의 수가 (a)에서의 복수의 세포의 투여에 대해 용량에 의존하는 방식으로 감소되는 것인 방법.
실시양태 3. 상기 실시양태 중 임의의 것에 있어서, 복수의 세포가 하나 이상의 면역조정제를 발현하고, 여기서, 하나 이상의 면역조정제가 복수의 세포 중 한 세포의 표면에서 발현되거나, 또는 복수의 세포 중 한 세포에 의해 분비되는 것인 방법.
실시양태 4. 실시양태 3에 있어서, 하나 이상의 면역조정제가 복수의 세포 중 한 세포의 표면에 테더링된 것인 방법.
실시양태 5. 실시양태 4에 있어서, 하나 이상의 면역조정제가 글리코실-포스파티딜이노시톨(GPI) 또는 B7-1 항원(B7-1) 세포질 테일을 포함하는 링커를 사용하여 세포의 표면에 테더링된 것인 방법.
실시양태 6. 하나 이상의 면역조정제가 과립구-대식세포 콜로니 자극 인자(GM-CSF), 종양 괴사 인자 알파(TNF-알파), 림프독소 알파(LTA), 림프독소 베타(LTB), TNF 슈퍼패밀리 구성원 4(TNFSF4), CD40 리간드(CD40LG), fas 리간드(FASLG), CD70 분자(CD70), TNF 슈퍼패밀리 구성원 8(TNFSF8), TNF 슈퍼패밀리 구성원 9(TNFSF9), TNF 슈퍼패밀리 구성원 10(TNFSF10), TNF 슈퍼패밀리 구성원 11(TNFSF11), TNF 슈퍼패밀리 구성원 12(TNFSF12), TNF 슈퍼패밀리 구성원 13(TNFSF13), TNF 슈퍼패밀리 구성원 13b(TNFSF13B), TNF 슈퍼패밀리 구성원 14(TNFSF14), TNF 슈퍼패밀리 구성원 15(TNFSF15), TNF 슈퍼패밀리 18(TNFSF18), 엑토디스플라신 A(EDA), 하나 이상의 사이토카인, 및 바이러스 항원 단백질로 구성된 군으로부터 선택되는 것.
실시양태 7. 실시양태 6에 있어서, 하나 이상의 사이토카인이 인터류킨 10 및 인터류킨 12로부터 선택되는 것인 방법.
실시양태 8. 상기 실시양태 중 임의의 것에 있어서, 복수의 세포가 표적 조직에 특이적인 하나 이상의 귀소 수용체를 발현하도록 조작되고, 여기서, 하나 이상의 귀소 수용체는 복수의 세포 중 한 세포의 표면에서 발현되거나, 또는 복수의 세포 중 한 세포에 의해 분비되는 것인 방법.
실시양태 9. 실시양태 8에 있어서, 표적 조직이 폐 또는 림프 조직인 것인 방법.
실시양태 10. 실시양태 9에 있어서, 하나 이상의 귀소 수용체가 림프 조직에서 내피 세포, 림프구, 대식세포, 또는 망상 세포, 또는 그의 조합을 표적화하는 것인 방법.
실시양태 11. 실시양태 8-10에 있어서, 하나 이상의 귀소 수용체가 화학적 링커, 펩티드 링커, 또는 중합체로부터 선택된 링커에 의해 복수의 세포 중 한 세포의 표면에 테더링된 것인 방법.
실시양태 12. 실시양태 11에 있어서, 링커가 글리코실-포스파티딜이노시톨(GPI) 또는 B7-1 항원(B7-1) 세포질 테일을 포함하는 것인 방법.
실시양태 13. 실시양태 8-12에 있어서, 하나 이상의 귀소 수용체가 복수의 세포 중 한 세포의 표면 상에서의 하나 이상의 귀소 수용체의 발현을 증가시키도록 유전적으로 변형된 것인 방법.
실시양태 14. 실시양태 8-13에 있어서, 하나 이상의 귀소 수용체가 동일하지 않은 2개 이상의 표적 조직에 특이적인 2개 이상의 귀소 수용체를 포함하는 것인 방법.
실시양태 15. 실시양태 8-14에 있어서, 하나 이상의 귀소 수용체가 C-X-C 케모카인 수용체 타입 3 (CXCR3), 류코시아린 (CD43), CD44 항원(CD44), C-C 케모카인 수용체 타입 7(CCR7), L-셀렉틴 (CD62L), 림프구 기능 연관 항원 1(LFA-1), 또는 초후기 항원-4(VLA4)로부터 선택되는 것인 방법.
실시양태 16. 실시양태 1에 있어서, 복수의 세포 중 한 세포가 바이러스 항원을 포함하는 것인 방법.
실시양태 17. 실시양태 16에 있어서, 바이러스 항원이 복수의 세포 중 한 세포의 표면 상에서 발현되는 것인 방법.
실시양태 18. 실시양태 16에 있어서, 바이러스 항원이 화학적 링커, 펩티드 링커, 또는 중합체로부터 선택된 링커에 의해 복수의 세포 중 한 세포의 표면에 테더링된 것인 방법.
실시양태 19. 실시양태 18에 있어서, 링커가 글리코실-포스파티딜이노시톨(GPI) 또는 B7-1 항원(B7-1) 세포질 테일을 포함하는 것인 방법.
실시양태 20. 실시양태 16-19에 있어서, 바이러스 항원이 복수의 세포 중 한 세포에서 발현된 막횡단 펩티드인 것인 방법.
실시양태 21. 실시양태 16-20에 있어서, 바이러스 항원이 인간에 대해 면역원성인 것인 방법.
실시양태 22. 실시양태 16-21에 있어서, 바이러스 항원이 코로나 바이러스로부터 유래된 펩티드인 것인 방법.
실시양태 23. 실시양태 22에 있어서, 펩티드가 코로나 바이러스로부터 유래된 스파이크 단백질, 막 단백질, 또는 핵단백질로부터 선택되는 것인 방법.
실시양태 24. 실시양태 23에 있어서, 코로나 바이러스가 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2), 또는 그의 변이체인 것인 방법.
실시양태 25. 실시양태 22-24에 있어서, 복수의 세포 중 세포가 펩티드를 코딩하는 mRNA를 포함하는 것인 방법.
실시양태 26. 실시양태 25에 있어서, mRNA가 서열 번호 1과 적어도 80% 동일한 mRNA 서열을 포함하는 것인 방법.
실시양태 27. 실시양태 25에 있어서, mRNA가 서열 번호 1과 적어도 85% 동일한 mRNA 서열을 포함하는 것인 방법.
실시양태 28. 실시양태 25에 있어서, mRNA가 서열 번호 1과 적어도 90% 동일한 mRNA 서열을 포함하는 것인 방법.
실시양태 29. 실시양태 25에 있어서, mRNA가 서열 번호 1과 적어도 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 mRNA 서열을 포함하는 것인 방법.
실시양태 30. 실시양태 25에 있어서, mRNA가 서열 번호 1과 적어도 100% 동일한 mRNA 서열을 포함하는 것인 방법.
실시양태 31. 실시양태 22-25에 있어서, 펩티드가 서열 번호 2와 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는 것인 방법.
실시양태 32. 실시양태 25-31에 있어서, mRNA 반감기가 3-5일인 것인 방법.
실시양태 33. 실시양태 25-31에 있어서, mRNA가 알부민 펩티드를 포함하는 융합 단백질을 코딩하는 것인 방법.
실시양태 34. 실시양태 25-31에 있어서, mRNA가 면역조정제를 포함하는 융합 단백질을 코딩하는 것인 방법.
실시양태 35. 실시양태 34에 있어서, 면역조정제가 피험체에서 면역 반응의 활성제인 것인 방법.
실시양태 36. 실시양태 34에 있어서, 면역조정제가 과립구-대식세포 콜로니 자극 인자(GM-CSF) 또는 사이토카인, 또는 그의 조합인 것인 방법.
실시양태 37. 상기 실시양태 중 임의의 것에 있어서, 병원체가 호흡기 바이러스, 피부 바이러스, 식품매개 바이러스, 성 매개 바이러스, 또는 종양용해성 바이러스, 또는 그의 조합으로부터 선택되는 생 바이러스인 것인 방법.
실시양태 38. 실시양태 37에 있어서, 호흡기 바이러스가 리노바이러스, 인플루엔자 바이러스, 호흡기 세포융합 바이러스, 및 코로나 바이러스로부터 선택되는 것인 방법.
실시양태 39. 실시양태 38에 있어서, 코로나 바이러스가 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2), 또는 그의 변이체인 것인 방법.
실시양태 40. 실시양태 37에 있어서, 피부 바이러스가 전염성 연속종, 단순 헤르페스 바이러스-1, 및 수두 대상포진 바이러스로부터 선택되는 것인 방법.
실시양태 41. 실시양태 37에 있어서, 식품매개 바이러스가 A형 간염, 노로바이러스, 및 로타바이러스로부터 선택되는 것인 방법.
실시양태 42. 실시양태 37에 있어서, 성 매개 바이러스는 인간 유두종바이러스, B형 간염, 성기 헤르페스, 및 인간 면역결핍 바이러스로부터 선택되는 것인 방법.
실시양태 43. 실시양태 37에 있어서, 종양용해성 바이러스가 인간 유두종바이러스 또는 B형 간염으로부터 선택되는 것인 방법.
실시양태 44. 상기 실시양태 중 임의의 것에 있어서, (a)에서의 투여가 복강내, 종양내, 정맥내, 림프내, 근육내, 또는 흡입인 것인 방법.
실시양태 45. 실시양태 1에 있어서, 병원체가
a) 이중 가닥(ds) DNA 바이러스(예컨대, 아데노바이러스, 헤르페스바이러스, 폭스바이러스);
b) 단일 가닥(ss) DNA 바이러스(+ 가닥 또는 "센스") DNA(예컨대, 파보바이러스);
c) dsRNA 바이러스(예컨대, 레오바이러스);
d) (+)ssRNA 바이러스(+ 가닥 또는 센스) RNA(예컨대, 피코나바이러스, 토가바이러스);
e) (-)ssRNA 바이러스(- 가닥 또는 안티센스) RNA(예컨대, 오르토믹소바이러스, 랍도바이러스);
f) 라이프 사이클에서 DNA 중간체를 갖는 ssRNA-RT 바이러스(+ 가닥 또는 센스) RNA(예컨대, 레트로바이러스); 또는
g) 라이프 사이클에서 RNA 중간체를 갖는 dsDNA-RT 바이러스 DNA(예컨대, 헤파드나바이러스)로부터 선택되는 생 바이러스인 것인 방법.
실시양태 46. 실시양태 1-36에 있어서, 병원체가 박테리아, 바이러스, 기생충, 진균, 자가항체, 항체, 유독 물질, 독성 물질, 또는 그의 조합인 것인 방법.
실시양태 47. 실시양태 1-46에 있어서, (a) 적어도 48시간 동안 4℃에서 현탁액에서 보관된 복수의 세포를 받는 단계로서, 여기서, 복수의 세포는 생물학적 활성이 저속화되거나, 정지된 것인 단계; 및 (b) 현탁액으로부터 복수의 세포를 제거하여 복수의 세포의 생물학적 활성을 회복시키는 단계를 추가로 포함하는 방법.
병원체를 포획 하기 위한 조성물
실시양태 1. 핵의 부재하에서 병원성 항원에 대한 수용체 또는 그의 병원체 항원 결합 단편의 합성을 위한 하나 이상의 세포내 세포소기관을 포함하는 핵이 없는 세포.
실시양태 2. 실시양태 1에 있어서, 하나 이상의 세포내 세포소기관이 소포체 또는 골지체인 것인 핵이 없는 세포.
실시양태 3에 있어서, 실시양태 1-2 중 어느 하나에 있어서, 병원성 항원에 대한 수용체 또는 그의 병원체 항원 결합 단편이 핵이 없는 세포의 표면에 커플링된 것인 핵이 없는 세포.
실시양태 4. 실시양태 1-3 중 어느 하나에 있어서, 병원성 항원에 대한 수용체 또는 그의 병원체 항원 결합 단편이 병원성 항원에 대한 수용체 또는 그의 병원체 항원 결합 단편을 핵이 없는 세포의 표면에 커플링시키는 막횡단 도메인을 포함하는 것인 핵이 없는 세포.
실시양태 5. 실시양태 1-4 중 어느 하나에 있어서, 핵이 없는 세포가 과립구-대식세포 콜로니 자극 인자를 포함하는 면역조정제를 추가로 포함하는 것인 핵이 없는 세포.
실시양태 6. 실시양태 1-5 중 어느 하나에 있어서, 핵이 없는 세포의 직경이 약 1 마이크로미터(㎛) 내지 100 ㎛인 것인 핵이 없는 세포.
실시양태 7. 실시양태 6에 있어서, 직경이 약 8 ㎛인 것인 핵이 없는 세포.
실시양태 8. 실시양태 1-7 중 어느 하나에 있어서, 핵이 없는 세포가 적어도 24시간 동안 냉동동면 후 생존가능한 것인 핵이 없는 세포.
실시양태 9. 실시양태 1-7 중 어느 하나에 있어서, 핵이 없는 세포가 적어도 24시간 동안 동결보존 후 생존가능한 것인 핵이 없는 세포.
실시양태 10. 실시양태 1-9 중 어느 하나에 있어서, 핵이 없는 세포가 동결보존, 냉동동면, 또는 동결건조된 것인 핵이 없는 세포.
실시양태 11. 실시양태 1-10 중 어느 하나에 있어서, 핵이 없는 세포가 단리 또는 정제된 것인 핵이 없는 세포.
실시양태 12. 실시양태 1-11 중 어느 하나에 있어서, 병원성 항원이 코로나 바이러스의 항원인 것인 핵이 없는 세포.
실시양태 13. 실시양태 12에 있어서, 코로나 바이러스가 SARS-CoV-2인 것인 핵이 없는 세포.
실시양태 14. 실시양태 1-13 중 어느 하나에 있어서, 병원체 항원과 숙주 세포에 의해 생산된 그의 천연 수용체 사이의 결합을 차단하는 중화 항체를 추가로 포함하는 핵이 없는 세포.
실시양태 15. 실시양태 1-14 중 어느 하나에 있어서, 하나 이상의 면역조정제를 추가로 포함하는 핵이 없는 세포.
실시양태 16. 실시양태 15에 있어서, 하나 이상의 면역조정제가 글리코실-포스파티딜이노시톨(GPI) 또는 B7-1 항원(B7-1) 세포질 테일을 포함하는 링커를 사용하여 핵이 없는 세포의 표면에 테더링된 것인 핵이 없는 세포.
실시양태 17. 실시양태 15에 있어서, 하나 이상의 면역조정제가 과립구-대식세포 콜로니 자극 인자(GM-CSF), 종양 괴사 인자 알파(TNF-알파), 림프독소 알파(LTA), 림프독소 베타(LTB), TNF 슈퍼패밀리 구성원 4(TNFSF4), CD40 리간드(CD40LG), fas 리간드(FASLG), CD70 분자(CD70), TNF 슈퍼패밀리 구성원 8(TNFSF8), TNF 슈퍼패밀리 구성원 9(TNFSF9), TNF 슈퍼패밀리 구성원 10(TNFSF10), TNF 슈퍼패밀리 구성원 11(TNFSF11), TNF 슈퍼패밀리 구성원 12(TNFSF12), TNF 슈퍼패밀리 구성원 13(TNFSF13), TNF 슈퍼패밀리 구성원 13b(TNFSF13B), TNF 슈퍼패밀리 구성원 14(TNFSF14), TNF 슈퍼패밀리 구성원 15(TNFSF15), TNF 슈퍼패밀리 18(TNFSF18), 엑토디스플라신 A(EDA), 하나 이상의 사이토카인, 및 바이러스 항원 단백질로 구성된 군으로부터 선택되는 것인 핵이 없는 세포.
실시양태 18. 실시양태 1-17 중 어느 하나에 있어서, 표적 조직에 특이적인 하나 이상의 귀소 수용체를 추가로 포함하는 핵이 없는 세포.
실시양태 19. 실시양태 18에 있어서, 하나 이상의 귀소 수용체가 림프 조직 중 내피 세포, 림프구, 대식세포, 또는 망상 세포, 또는 그의 조합을 표적화하는 것인 핵이 없는 세포.
실시양태 20. 실시양태 18에 있어서, 하나 이상의 귀소 수용체가 화학적 링커, 펩티드 링커, 또는 중합체로부터 선택되는 링커에 의해 복수의 세포 중 한 세포의 표면에 테더링된 것인 핵이 없는 세포.
실시양태 21. 실시양태 20에 있어서, 링커가 글리코실-포스파티딜이노시톨(GPI) 또는 B7-1 항원(B7-1) 세포질 테일을 포함하는 것인 핵이 없는 세포.
실시양태 22. 실시양태 18-21 중 어느 하나에 있어서, 하나 이상의 귀소 수용체가 C-X-C 케모카인 수용체 타입 3 (CXCR3), 류코시아린 (CD43), CD44 항원(CD44), C-C 케모카인 수용체 타입 7(CCR7), L-셀렉틴 (CD62L), 림프구 기능 연관 항원 1(LFA-1), 또는 초후기 항원-4(VLA4)로부터 선택되는 것인 핵이 없는 세포.
실시양태 23. 실시양태 1-23 중 어느 하나에 있어서, 바이러스 항원을 추가로 포함하는 핵이 없는 세포.
실시양태 24.
실시양태 1-23 중 어느 하나의 핵이 없는 세포 또는 복수의 실시양태 1-23 중 어느 하나의 핵이 없는 세포; 및
약학적으로 허용되는: 부형제, 희석제, 또는 담체를 포함하는 약학적 제제.
실시양태 25.
피험체에게 실시양태 1-23 중 어느 하나의 핵이 없는 세포, 또는 실시양태 24의 약학적 제제를 투여하여 병원체 항원을 갖는 병원체를 세포에 포획하고, 세포내에서 병원체가 증식하지 못하게 방해하는 단계를 포함하는, 피험체에서 병원체에 의한 감염을 감소시키는 방법.
실시양태 26. 실시양태 25에 있어서, 병원체가 투여 후 14일 이하의 기간 이내에 피험체로부터 제거되는 것인 방법.
실시양태 27. 실시양태 26-27 중 어느 하나에 있어서, 핵이 없는 세포가 중화 항체를 방출하여 병원체 항원과 숙주 세포에 의해 생산된 그의 천연 수용체 사이의 결합을 차단하는 것인 방법.
실시양태 28. 실시양태 26-28 중 어느 하나에 있어서, 핵이 없는 세포가 바이러스 항원을 제시하여 병원체에 의한 감염으로부터 피험체를 면역화시키는 것인 방법.
VII. 실시예
하기 실시예는 예시 목적으로만 포함되며, 본 발명의 범주를 제한하는 것으로 의도되지 않는다.
실시예 1. 코로나바이러스용 항바이러스 조성물의 제조 방법
약독화된 코로나바이러스 항원을 코딩하는 이종성 핵산으로 줄기 세포(예컨대, 중간엽 줄기 세포)의 렌티바이러스 매개 형질감염을 수행한다. 이어서, 실시예 7에 기술된 방법에 의해 줄기 세포의 제핵을 수행한다. 세포 표면에서 약독화된 코로나바이러스 항원을 발현하는 제핵 줄기 세포는 유세포 분석법을 사용하여 검증한다. 약독화된 코로나 바이러스 항원을 발현하는 성공적으로 제핵된 줄기 세포(본 실시예에서 "세포질체"로 지칭)는 공지된 방법에 따라 단리 및 정제된다. 임의적으로, 세포질체는 실시예 4에 제공된 방법을 사용하여 동결보존된다. 상기 기술된 세포질체는 코로나바이러스 감염 예방을 위한 백신으로서 유용하다.
상기와 유사한 방법을 사용하여 코로나바이러스에 대한 제2 항바이러스 조성물은 제조하되, 약독화된 코로나바이러스 항원 대신에, 코로나바이러스에 대한 항체가 줄기 세포에서 발현된다. 대안적으로 또는 추가로, 코로나바이러스에 대한 소분자는 전기천공법(또는 당업계에 공지된 유사한 방법)을 사용하여 제핵 줄기 세포에 로딩된다. 코로나바이러스에 대한 항바이러스 항체, 및/또는 코로나바이러스에 대한 소분자를 발현하는 성공적으로 제핵된 줄기 세포(본 실시예에서 "세포질체"로 지칭)는 공지된 방법에 따라 단리 및 정제된다. 임의적으로, 세포질체는 실시예 4에 제공된 방법을 사용하여 동결보존된다. 상기 기술된 세포질체는 급성 코로나바이러스 감염을 치료하는 데 유용하다.
실시예 2. 피험체에서 코로나바이러스 감염 예방
약독화된 코로나바이러스 또는 코로나바이러스 단백질의 펩티드 단편을 발현하는 실시예 1에 기술된 항바이러스 조성물은 정맥내 투여용으로 제제화된다. 약독화된 코로나바이러스 또는 코로나바이러스 단백질의 펩티드 단편은 본원에 기술된 세포질체에 캡슐화된 mRNA로부터 코딩될 수 있다. 일부 실시양태에서, 항바이러스 조성물은 근육내 투여용으로 제제화된다. 일부 실시양태에서, 피험체는 제1 및 제2 용량의 항바이러스 조성물을 투여받는다. 일부 실시양태에서, 제2 용량의 항바이러스 조성물은 제1 용량 투여 후 적어도 1일, 2일, 3일, 4일, 1주, 2주, 3주, 4주, 1개월, 2개월, 3개월, 또는 4개월 후에 투여된다. 제제는 피험체에게 정맥내로 투여된다. 예를 들어, 인간 피험체에 대한 투여는 피험체가 아동일 때 적어도 5회 수행될 것이다. 일부 실시양태에서, 제제는 피험체가 2개월, 4개월, 6개월, 15-18개월, 및 4-6세 연령일 때 피험체에게 투여된다. 본 실시예에서, 피험체는 코로나바이러스 감염으로부터 면역화된다.
실시예 3. 피험체에서 급성 코로나바이러스 감염 치료
항코로나바이러스 항체(예컨대, 중화 항체), 또는 코로나 바이러스에 대한 소분자를 발현하는, 실시예 1에 기술된 항바이러스 조성물은 정맥내 투여용으로 제제화된다. 제제는 코로나바이러스에 감염되었거나, 또는 감염된 것으로 의심되는 피험체에게 정맥내로 투여된다. 일부 실시양태에서, 투여는 1회 초과로 수행된다. 예를 들어, 투여는 일정 기간 동안(예컨대, 1년 동안) 매일, 이틀마다, 매주, 2주마다, 매월, 2개월마다 수행될 수 있다. 본 실시예에서는 피험체에서 코로나바이러스 감염이 감소된다.
대안적으로 또는 추가로, 페이로드가 없는 제핵 줄기 세포(예컨대, 중간엽 줄기 세포)는 정맥내 투여용으로 제제화된다. 제제는 코로나바이러스에 감염되었거나, 또는 감염된 것으로 의심되는 피험체에게 정맥내로 투여된다. 일부 실시양태에서, 투여는 1회 초과로 수행된다. 예를 들어, 투여는 일정 기간 동안(예컨대, 1년 동안) 매일, 이틀마다, 매주, 2주마다, 매월, 2개월마다 수행될 수 있다. 본 실시예에서, 세포질체는 생체내에서 코로나바이러스로 감염되고, 세포질체에 포획된다. 핵이 없는 세포질체는 코로나바이러스 복제 및 증식에 필요한 유전 물질이 결여되어 있는 바, 코로나바이러스가 추가 감염되는 것을 방지한다. 본 실시예에서는 코로나바이러스 감염이 감소된다.
실시예 4. 포유동물 세포로부터 세포질체 제조
세포질체는 동종이계 또는 자가 공여자 유래 세포로부터 생성될 수 있고, 질환 치료 및 진단에 사용될 수 있다. 개념 증명으로 다양한 유형의 포유동물 세포(예컨대, 중간엽 줄기 세포, 호중구, 섬유아세포, 및 자연 살해 세포)의 제핵 효율 및 회수율을 측정하였다. 세포 배양 플레이트로부터 포유동물 세포를 제거한 후, 불연속 피콜 구배를 사용하는 밀도 구배 원심분리, 고속 원심분리에 의해 포유동물 세포에서 제핵하였다. 표 1에는 부유 프로토콜을 사용한 제핵 결과가 요약되어 있다. 제핵 효율과 세포 생존능은 hTERT 형질전환된 세포와 1차 중간엽 줄기 세포(MSC) 둘 모두 뿐만 아니라, 섬유아세포 및 호중구에서 가장 높았다. 표 2에는 부착 프로토콜을 사용한 제핵 결과가 요약되어 있다. 제핵 효율은 중간엽 줄기 세포 및 대식세포, 둘 모두에서 70% 초과였다. 본 실험은 본원에 기술된 임의의 방법을 사용하여 다양한 유형의 포유동물 세포에서 제핵할 수 있다는 것을 보여주었다.
Figure pct00005
Figure pct00006
이어서, 세포질체의 생존을 96시간에 걸쳐 측정하였다. MSC는 시간이 지남에 따라 증식했지만, 세포질체는 증식하지 않았다. 대신, 생존가능한 세포질체의 상대적 변화 배수는 96시간째에 감소하기 전에 72시간 동안 상당히 일정하게 유지되었다. 따라서, 세포질체 생존은 3-4일에 걸쳐 있었다. 대부분의 세포 기반 요법은 즉시 사용되지 않기 때문에, 동결보존 후 세포질체의 생존능을 측정하였다. 놀랍게도, 동결보존 후 세포질체의 생존능은 동결보존 후 MSC의 생존능보다 더 컸다. 제핵 직후에 플레이팅된 세포질체 및 동결보존으로부터 회수된 세포질체는 24시간 후 유사한 상대적 세포 생존능을 보였다. 본 실험은 세포질체의 생존이 동결보존에 의해 영향을 받지 않았다는 것을 보여주었다. 추가로, 냉동동면 후 세포질체의 생존율은 냉동동면 후 MSC의 생존능과 유사하였다(도 6a). 다양한 기간 동안 냉동동면 후 회수된 세포질체는 보이덴 챔버 검정법에서 냉동동면 후 회수된 MSC와 유사한 유도성 이동이 이루어질 수 있었다(도 6b).
이어서, 생체외에서 세포의 대규모 생산을 셋업한 후, 대용량 밀도 구배 원심분리 및 제핵을 수행하여 치료용 세포질체를 생성한다. 한 실시양태에서, 치료용 세포질체에 질환 치료를 위한 치료 카르고(예컨대, mRNA, 약물, 펩티드 등...)를 로딩된다. 또 다른 실시양태에서, 치료용 세포질체는 진단용으로 즉각적인 사용을 위해 (예컨대, 정맥내 주사(IV), 복강내 주사(IP), 조직, 또는 시험관내 적용을 위해) 제조된다.
실시예 5. 세포질체는 세포소기관을 소유하고, 세포외 기질과 상호작용하고, 세포 생물학적 기능을 수행하고, 카르고를 전달한다.
세포질체가 동결보존 후 생존능을 유지할 수 있는지 여부를 측정한 후, MSC 유래 세포질체의 세포 표면 마커 프로파일이 골수 유래 MSC와 다른지 여부를 측정하기 위해 유세포 분석법에 의한 분석을 수행하였다. MSC 유래 세포질체 및 골수 유래 MSC, 둘 모두 CD45, CD90, CD44, CD146 및 CD166의 세포 표면 발현을 유지하였다. 세포질체는 부착되고, 세포골격을 재조직화하고, 2D 및 3D 배양 시스템에서 기질 단백질에 스프레딩하고, 터널링 나노튜브를 형성하여 기원이 동일하거나, 또는 상이한 세포 간에 생물생성물을 전달할 수 있다. 세포소기관 염색은 골지체, ER, F-액틴 세포골격, 리소좀, 엔도솜, 미세소관 및 미토콘드리아가 세포질체에서 무손상 상태 그대로 유지됨을 나타낸다. 추가로, 세포질체는 시험관내에서 귀소 잠재능을 보였다. 세포질체는 세포외 기질 단백질로 쉽게 이동하고, (화학 감지를 통해) 가용성 케모카인 구배를 향해 방향성을 가지고 이동하였다. 특히, 정제된 mRNA로 외인성으로 형질감염된 세포질체는 다양한 임상 용도 및 질환 상태를 위해 개발되고 있는 치료 mRNA 애플리케이션을 모방할 수 있는 기능성 세포내 단백질을 생성했다. 이는 또한 mRNA 번역 및 단백질 합성을 위한 기계가 핵이 없는 세포질체에서 정상적으로 작동하므로 치료적 가치가 있는 생체활성 분자를 생산하는 데 사용될 수 있다는 것을 보여주는 것이다.
공지된 분비 단백질을 코딩하는 정제된 mRNA로 외인성으로 형질감염된 세포질체는 조절 배양 배지에서 기능적 세포외 단백질을 생성하는 데, 이는 ER/골지체 및 분비 경로가 핵의 부재하에 세포질체에서 정상적으로 작동함을 나타낸다. 추가로, 분비 단백질을 함유하는 세포질체 조절 배지로 대식세포 및 내피 세포를 처리하면 이들 세포에서 주요 신호 전달 반응이 활성화되었다. 이는 세포질체를 치료 가치가 있는 분비된 단백질과 생체분자를 생산하고, 전달하는 신규한 비히클로서 사용할 수 있다는 개념 증명을 제공하였다. 세포질체에는 siRNA, shRNA, mRNA, DNA 플라스미드, 펩티드 및 화학요법제를 포함하나, 이에 제한되지 않는 다양한 카르고를 로딩할 수 있다.
실시예 6. 조작된 세포질체는 기능성 세포 표면 단백질을 발현할 수 있다
CXCR4를 발현하는 조작된 MSC 및 CXCR4를 발현하는 조작된 MSC 유래 세포질체는 유세포 분석법에 의해 측정된 바와 같이 유사한 수준의 CXCR4를 발현한다. 조작된 세포질체가 기능적 세포 표면 단백질을 발현할 수 있는지 여부를 측정하기 위해, CXCR4 수용체를 발현하는 MSC 및 MSC 유래 세포질체를 다양한 농도의 SDF-1α로 이동할 수 있도록 하였다. 기능성 CXCR4를 발현하도록 조작된 MSC 유래 세포질체는 SDF-1α로 이동할 수 있으며, 세포 이동은 SDF-1α 농도가 증가함에 따라 증가한다. 추가로, 이동하는 MSC 유래 세포질체의 수는 CXCR4를 발현하는 이동하는 MSC의 수보다 더 많았다.
MSC 유래 세포질체는 염증이 있는 혈관 구조에 대한 세포 부착을 매개하는 것으로 알려진 기능성 세포 부착 단백질을 발현하도록 조작될 수 있다. MSC 유래 세포질체는 치료 세포의 대식세포 상호작용과 식세포 작용을 조절하는 것으로 알려진 세포 단백질을 발현하도록 조작될 수 있다.
실시예 7 - 조작된 세포질체는 시험관내 생체내 , 둘 모두에서 작용할 수 있다
이론에 얽매이지 않고, 본 실시예는 "카르고", 예컨대, 외인성 mRNA 분자를 발현하도록 조작된 세포질체가 생성될 수 있음을 보여준다. 도 7b 도 7c는 MSC 유래 세포질체가 시험관내 및 정맥내 주사 후 임상전 마우스 모델에서 기능성 항염증성 사이토카인 인터루킨 10(IL-10)을 치료 수준으로 생성 및 분비하도록 조작될 수 있다는 것을 보여주는 것이다. 도 7b는 IL-10 mRNA로 형질감염된 세포질체가 높은 수준의 IL-10을 분비할 수 있다는 것을 보여준다. 분비된 IL-10이 활성인지 여부를 측정하기 위해, 혈청 고갈 대식세포를 비처리 MSC, IL-10을 발현하는 MSC, 비처리 세포질체 및 IL-10을 발현하는 세포질체의 조절 배지(CM)와 함께 인큐베이션시켰다. 인산화된 STAT3은 IL-10을 발현하는 MSC로부터의 CM과 함께 인큐베이션 후 대식세포에서 검출되었고, IL-10을 발현하는 세포질체로부터의 CM과 함께 인큐베이션한 후, 검출되었지만, 비처리 MSC 및 비처리 세포질체로부터의 CM과 함께 인큐베이션한 후 대식세포에서는 STAT3 활성이 검출되지 않았다(도 7c). 세포질체 분비 IL-10이 생체내에서 검출될 수 있는지 여부를 측정하기 위해, C57B1/6 마우스에 IL-10을 발현하는 MSC 또는 MSC 유래 세포질체를 안와후 주사하였다. 주사 2시간 후, 혈액을 수집하고, IL-10의 수준을 측정하였다. 비처리 MSC를 주사맞은 마우스의 혈액에서는 IL-10이 거의 또는 전혀 검출되지 않았다(도 7d). 도 7d에 제시된 바와 같이. 도 7d에 도시된 바와 같이, 비처리 MSC를 주사맞은 마우스의 수준과 비교하여 IL-10을 발현하는 MSC 유래 세포질체를 주사맞은 마우스에서 더 높은 수준의 IL-10이 검출되었다.
이들 데이터는 정상 조직 및 이환 조직을 치료하기 위해 임상적으로 관련된 치료 사이토카인을 생성 및 분비하기 위한 유전적으로 조작된 세포질체 기반 세포 요법의 잠재성을 설명한다.
MSC 유래 세포질체가 기저막을 통해 침법할 수 있는지 여부를 측정하기 위해, MSC 또는 MSC 유래 세포질체를 24시간 동안 10% FBS를 향해 기저막을 통해 침범하도록 하였다. 도 8a도 8a에 제시된 바와 같이, MSC 유래 세포질체는 10% FBS의 존재하에서 비처리 MSC와 같이 기저막을 침범하는 데 효율적이었다. 주목할만한 것은 비처리 MSC가 화학유인물질 부재하에서 기저막을 침범할 수 있는 반면, MSC 처리 세포질체는 화학유인물질 부재하에서 기저막을 훨씬 덜 침범할 수 있다. 본 데이터는 MSC 유래 세포질체가 소화되어 기저막을 통해 침범할 수 있음을 보여준다. 본 데이터는 조직내 그의 카르고(들)를 전달하기 위해 복잡한 세포외 기질 장벽을 통해 침투하고, 이동할 수 있는 세포질체 기반 세포 요법의 선천적인 잠재능을 보여주는 것이다.
도 9a도 9a에 제시된 바와 같이, MSC 유래 세포질체의 평균 직경은 12 ㎛이고, MSC의 평균 직경은 20 ㎛였다. MSC 유래 세포질체의 생체분포를 결정하기 위해, 마우스에 MSC 또는 MSC 유래 세포질체를 안와후 주사하였다. 도 9c도 9d에 제시된 바와 같이, 간에서 검출된 MSC의 수보다 더 많은 MSC 유래 세포질체가 간에서 검출되었다. 본 데이터는 광범위한 질환을 치료하기 위해 순환계에 직접 전달되는 세포질체 기반 세포 요법의 잠재능을 보여주는 것이다.
실시예 8. 세포질체를 생성하는 예시적인 방법
중간엽 줄기 세포(MSC) 제핵
본 프로토콜은 문헌 [Methods in Cell Biology Volume 14, 1976, Pages 87-93 Chapter 7 Enucleation of Mammalian Cells in Suspension (Michael H. Wigler, Alfred I. Neugut, I. Bernard Weinstein)]으로부터 수정되었다.
50% 피콜 용액 제조: 차광 유리 비이커에서, 실온에서 24시간 동안 연속하여 자기 교반함으로써 일정 그램의 피콜(PM400, GE Healthcare 17-0300-500)을 등가 수의 밀리리터 초순수(Invitrogen 10977-015)에 용해시켰다. 이어서, 혼합물을 30분 동안 오토클레이빙하였다. 일단 혼합물이 냉각되면, 균일한 농도를 보장하기 위해 다시 교반하였다. 굴절률은 굴절계(Reichert 13940000)에서 측정하였고, 1.4230-1.4290 범위였다. 분취량을 -20℃에서 보관하였다.
2X MEM 제조: 각 50 ml 양에 대해, 10 mL 10X MEM(Gibco, 11430-030), 2.94 mL 정확히 중탄산나트륨(7.5%, Gibco, 25080-094), 1 mL 100X Pen-Strep(Gibco 15140-122) 및 36 mL의 초순수(Invitrogen 10977-015)를 사용하였다. 이어서, 용액을 0.22 um 막 플라스크(Olympus 25-227)를 통해 여과하고, 4℃에서 보관하였다.
제핵 전날, MSC를 20 mL MSC 배지[MEM 1X(Gibco 12561-056); 16.5% 프리미엄 FBS(Atlanta Biologics S1150); 1% HEPES 1M(Gibco 15630-80); 1% 안티-안티 100X(Gibco 15240-062); 1% 글루타맥스 100X(Gibco 35050-061)] 중 15 cm 플레이트(Olympus 25-203)당 2.5 M으로 시딩하였다. 이어서, 사이토칼라신 B(Sigma Aldrich C6762)를 2X MEM(2 μM/mL 최종 농도)에 첨가하였다.
피콜 구배 제조: 2X CytoB를 50% 피콜 분취량에 1:1 희석률로 첨가하여 25% 피콜 스톡 농도를 만들었다. 이어서, 17%, 16%, 15% 및 12.5% 피콜은 25% 피콜을 적절한 부피의 1X MEM 완충액(1:1 희석률로 초순수에 첨가된 사이토칼라신 B를 포함하는 2X MEM)으로 희석하여 만들었다. 희석액은 마개를 느슨하게 덮은 상태에서 적어도 1시간 동안 CO2 인큐베이터에서 평형을 이루었다. 이어서, 피콜 구배를 13.2 mL 초투명 튜브(Beckman, 344059)에 붓고, CO2 인큐베이터에서 밤새도록(6-18시간) 인큐베이션시켰다.
제핵 당일, 12-25 M MSC(이상적으로는 20 M)를 제핵을 위해 각 튜브에 수집하였다. 배지를 흡인하고, 세포를 포스페이트 완충처리된 염수(PBS)(GIBCO 14190-144)로 1회 세척하였다. 5 mL의 TrypLE-Select(Gibco, 12563011)를 각 플레이트에 첨가하고, 최대 5분 동안 인큐베이션시켰다. 세포 중 90%가 탈착되었을 때, 5 mL의 완전 MSC 배지를 첨가하고 세포를 50 ml 튜브(3-4개 플레이트/튜브)에 수집하였다. 이어서, 튜브를 5분 동안 1,200 rpm으로 원심분리하였다. 펠릿을 10mL PBS에 재현탁시켰다. 세포를 계수하고, 펠릿화하고, 12.5% 피콜로 재현탁시켰다. 이어서, 세포-피콜 혼합물을 40 um 세포 여과기(Falcon 352340)를 통해 새로운 50 mL 튜브에 적가하였다. 시린지를 사용하여 3.2 mL의 세포 현탁액을 미리 만들어진 구배에 천천히 로딩하였다. 1X MEM 완충제 1 mL를 시린지로 마지막(상단) 층에 첨가하였다.이어서, 튜브를 로터 버킷에 로딩하고, 균형을 맞춘 후, 초원심분리기(Beckman, L8M)에서 60분, 26,000rpm, 31℃, Accel 7, Deccel 7에서 실행하였다. 원심분리 종료시, 3개의 층이 존재하는데: 하나는 12.5%의 상단 부근(세포질체 및 파편), 하나는 12.5/15% 경계면 부근(세포질체), 및 하나는 25% 하단의 펠릿(핵체). 15% 피콜 용액 위의 층을 15 ml 원뿔형 튜브에 수집하였다. 이어서, 수집된 층을 4 부피 초과의 가온 무혈청 MSC 배지로 희석한다(즉, 피콜 3 mL 및 최대 15 mL 배지로 충전). 부드럽게 혼합한 후, 혼합물을 1,200 rpm으로 10분 동안 펠릿화하였다. 가온 무혈청 MSC 배지로 3회 세척한 후, 세포를 실험 프로토콜, 예를 들어, 형질감염 배지 대 이동 배지 대 무혈청 배지 대 완전 배지에 따라 배지에 재현탁시켰다. 제핵 효율은 1:2000 희석 바이브란트® 다이사이클™ 그린(Molecular Probes V35004) 또는 1:5000 희석 훽스트 33342와 함께 완전 MSC 배지를 첨가하여 12웰 플레이트에서 측정하였다. 소량의 각 층을 각 웰에 첨가하고, 인큐베이터에서 10분 동안 부착/염색되도록 하였다. 집단당 음성 세포질체의 비율(%)은 표면형광 현미경법에 의해 측정하였다.
세포질체 mRNA 형질감염
1 M 세포질체를 가온 1 ml의 아미노산 무함유 α-MEM 완전 배지(ThermoFisher 12561056; 16.5% 프리미엄 우태아 혈청(FBS: fetal bovine serum), 1% 글루타맥스(Gibco 35050061), 31% Gibco0 8105)에 현탁시켰다. 1 ㎍ mRNA를 가온 opti-MEM으로 희석하고, 피펫으로 적어도 20회 혼합하였다. 4 ㎕ 리포펙타민-3000(ThermoFisher L300015)을 46 ㎕ 가온 opti-MEM(ThermoFisher 31985062)에 첨가하고, 적어도 20회 이상 피펫으로 혼합하였다. mRNA와 리포펙타민-3000의 비는 1:4(w/v)였다. mRNA 및 리포펙타민-3000 희석액을 적어도 20회 이상 피펫으로 혼합하고, 실온에서 15분 동안 인큐베이션시켰다. mRNA 및 리포펙타민-3000 혼합물을 세포질체 현탁액에 첨가하고, 잘 혼합하고, 37℃에서 30분 동안 인큐베이션시켰다. 세포 응집을 방지하기 위해 현탁액을 매 5분마다 진탕시켰다. 인큐베이션 후, 세포를 원심분리하고, 정상 α-MEM 완전 배지(16.5% 프리미엄 FBS, 1% 항생제-항진균제, 1% 글루타맥스, 1% HEPES) 또는 PBS에 재현탁시켰다.
세포질체 siRNA 형질감염
1 M 세포질체를 가온 1 ml의 A/A 무함유 α-MEM 완전 배지(16.5% 프리미엄 FBS, 1% 글루타맥스, 1% HEPES)에 현탁시켰다. 2 ㎕ siRNA를 가온 opti-MEM으로 희석하고, 피펫으로 적어도 20회 혼합하였다. 8 ㎕ 리포펙타민-3000을 92 ㎕ 가온 opti-MEM로 희석하고, 적어도 20회 이상 피펫으로 혼합하였다. siRNA와 리포펙타민-3000의 비는 1:4(w/v)였다. siRNA 및 리포펙타민-3000 희석액을 적어도 20회 이상 피펫으로 혼합하고, 실온에서 15분 동안 인큐베이션시켰다. siRNA 및 리포펙타민-3000 혼합물을 세포질체 현탁액에 첨가하고, 잘 혼합하고, 37℃에서 30분 동안 인큐베이션시켰다. 세포 응집을 방지하기 위해 현탁액을 매 5분마다 진탕시켰다. 20분 인큐베이션 후, 세포를 원심분리하고, 정상 α-MEM 완전 배지(16.5% 프리미엄 FBS, 1% 항생제-항진균제, 1% 글루타맥스, 1% HEPES)에 재현탁시켰다.
종양용해성 바이러스 감염된 세포질체 생성
제핵 하루 전(보통 제핵 18시간 전), 2.5*10^6 hTERT-MSC를 15 cm 디쉬에 시딩하였다. 시딩 후 대략 2시간째, 세포를 PBS로 1회 세척하였다. 이어서, 세포를 8 mL 무혈청 opti-MEM 존재하에 상이한 MOI(예를 들어, 0.05 또는 0.5)로 oHSV-GFP(Imanis OV3001)로 감염시켰다. 이어서, 때때로 진탕시키면서, 세포를 37℃에서 2시간 동안 인큐베이션시켰다. 이어서, 바이러스 접종물을 폐기하였다. 20 mL 사전 가온된 완전 배양 배지(α-MEM, 16.5% 프리미엄 FBS, 1% 항생제-항진균제, 1% 글루타맥스, 1% HEPES)를 각 웰에 첨가하였다. 제핵시까지 세포를 37℃에서 인큐베이션시켰다. 도 11은 폴리펩티드(VSV-GFP)를 모세포 또는 기준 세포(핵이 없는 세포) 및 본원에 기술된 제핵 세포 내로 직접 도입하는 형광 이미지를 도시한 것이다. 도 12는 GFP 항원을 코딩하는 단순 헤르페스 바이러스(oHSV)로 MSC를 감염시키는 것을 도시한 것이다. 도 12c는 제핵 MSC에 의한 표적 암 세포로의 카르고(예컨대, GFP 리포터) 전달 증가를 도시한 것이다. 도 12d는 본원에 기술된 제핵 MSC에 의해 접촉된 표적 암 세포에 대한 면역 세포(예컨대, CD8+ 이펙터 T 세포)의 동원 증가를 도시한 것이다.
세포질체에서 기능성 단백질을 과다발현하는 렌티바이러스
표적 세포를 1-2 Х 105개의 세포/웰의 밀도로 6-웰 플레이트의 1개 웰, 또는 0.5-1 M MSC가 있는 10 cm 플레이트에 플레이팅하였다. 다음날, 농축된 재조합 렌티바이러스를 37℃ 수조에서 해동시키고, 일단 해동되고 나면 즉시 수조에서 제거하였다. 이어서, 세포를 PBS로 3회 세척하였다. 200 ㎕ 무혈청 배지 또는 2 mL 무혈청 배지(1:1250 SureENTRY)를 첨가하였다. 표적 세포를 MOI 10:1로 6웰 플레이트에서 감염시켰다. 다음날, 바이러스 상청액을 제거하고, 적절한 완전 성장 배지를 세포에 첨가하였다. 72시간 인큐베이션 후, 세포를 2x100 mm 디쉬에 계대배양하였다. 안정적인 세포주 생성을 위해 적절한 양의 선별 약물(즉, 퓨로마이신)을 첨가하였다. 선별 10-15일 후, 클론을 확장을 위해 선별하고, 양성 클론에 대해 스크리닝하였다. 선별된 양성 클론은 제핵을 위해 확장시켰다. 조작된 세포질체는 상기에서 개략적으로 설명된 바와 같이 제조하였다. 세포질체 상의 표적 단백질 발현은 일반적인 생화학적 방법 또는 기능적 검정법, 예컨대, 형광 활성화 세포 분류(FACS: fluorescent activated cell sorting), 웨스턴 블롯 또는 보이덴 챔버 검정법에 의해 측정하였다.
세포질체 내로의 펩티드 로딩
웰당 1 x 105/ml를 완전 MSC 배지[MEM 1X(Gibco 12561-056); 16.5% 프리미엄 FBS(Atlanta Biologics S1150); 1% HEPES 1M(Gibco 15630-80); 1% 안티-안티 100X(Gibco 15240-062); 1% 글루타맥스 100X(Gibco 35050-061)] 중 4 챔버 유리 슬라이드(LabTek II 4-챔버 유리 슬라이드, 155383) 상에 플레이팅하였다. 세포를 적어도 1시간 또는 밤새도록 부착되도록 하였다. 이어서, 세포를 PBS(Gibco 14190-144)로 세정하였다. Arg9(FAM)(서열 번호 1154)(10 mM, Anaspec, AS-61207)를 완전 배지에서 1:100(100 uM)의 총 농도로 희석하였다. 이어서, 세포질체를 1 내지 2시간 동안 인큐베이션시키고, PBS로 3회 세정하였다. 훽스트 33342(Invitrogen)를 완전 배지 중 1:5000 희석률로 적어도 10분 동안 첨가하였다. 이어서, 세포를 PBS로 세정하고, 표면형광 현미경법에 의해 이미징하였다. 도 13은 Arg9와 공동 인큐베이션된 경우 관심 폴리펩티드의 로딩 또는 펩티드 흡수가 증가되었다는 것을 도시한 것이다.
실시예 9. 세포질체는 생체내에서 더 우수한 생체분포를 보여준다
MSC를 3D 현적(3D MSC)으로 배양한 후, 제핵하여 3D 세포질체를 생성하였다. 현적에 의한 MSC의 3D 배양 프로토콜은 문헌 [Curr Protoc Stem Cell Biol. 2014 Feb 6; 28: Unit-2B.6.(Thomas J. Bartosh1 and Joni H. Ylostalo)]로부터 수정된 것이다.
건강한 MSC를 트립신에 의해 2D 배양된 플레이트로부터 수확하고, 143만 개의 세포/ml로 신선한 α-MEM(ThermoFisher 12561056) 완전 배지(16.5% 프리미엄 FBS, 1% 항생제-항진균제, 1% 글루타맥스, 1% HEPES)에 재현탁시켰다. 15 cm 플레이트의 뚜껑을 완전히 열고, 20 ml PBS를 플레이트에 첨가하였다. 다채널 피펫을 사용하여 소적당 35 ㎕ (대략 50,000개 세포/소적)로 플레이트 뚜껑에 소적을 만들었다. 약 100-120개의 소적이 각 뚜껑에 배치되었다. 뚜껑을 닫고, 플레이트를 다시 인큐베이터에 넣었다. 소적을 2일 동안 배양한 후, 이어서, 세포 리프터로 수확하고, 15 ml 튜브에 수집하였다 (튜브당 대략 300개의 소적). 튜브를 1,200 rpm으로 5분 동안 원심분리하였다. 상청액을 제거하고, 튜브를 PBS로 2회 세척하였다. 이어서, 모든 PBS를 제거하고, 새로 해동된 0.25% 트립신-EDTA(ThermoFisher 25200114) 7.5 ml를 각 튜브에 첨가하였다. 튜브를 수조에서 4분 동안 인큐베이션시켰다. 소적을 저잔류 팁이 있는 1 ml 피펫으로 약 10-20회 부드럽게 피펫팅하고, 수조에서 추가로 4분 동안 인큐베이션시켰다. 대부분의 소적이 해리될 때까지, 소적을 저잔류 팁이 있는 1 ml 피펫으로 약 10-20회 부드럽게 피펫팅하였다. 7.5 ml의 완전 혈청 배지(GlutaMAX Supplement(Gibco 35050061); Fetal Bovine Serum- Premium Select(Atlanta Biologicals S11550), HEPES(1M)(Gibco 15630080), 항생제-항진균제(100X) (Gibco 15240062))를 각 튜브에 첨가하고, 튜브를 1,200 rpm으로 10분 동안 원심분리하였다. 해리된 세포를 10 ml의 완전 혈청 배지로 세척하고, 세포를 5 ml의 완전 혈청 배지로 재현탁시켰다. 세포를 70 ㎛ 세포 필터에 통과시킨 후, 필터를 5 ml 완전 혈청 배지로 세척하였다. 세포를 계수하고, 10 M/ml 초과로 전처리된 12.5% 피콜로 재현탁시켰다. 30-40 M 세포를 각 제핵 튜브에 사용하였다. 이어서, 상기 기술된 제핵 프로토콜에 따라 수행하였다.
DiD 표지된 정상 2D 배양된 MSC(2D MSC), 3D MSC 또는 3D 세포질체를 각각 BalB/C 마우스에 안와후 주사하였다. 명시된 조직을 주사 후 24시간째에 수거하고, FACS에 의해 DiD 표지된 세포를 분석하였다. 도 10a-10c는 3D 배양된 MSC로부터 3D 유래 세포질체의 성공적인 생성을 보여주고, 또한 3D 유래 세포질체는 순환으로의 주사 후 2D 배양된 세포보다 폐 포획이 적고, 말초 기관에 더 우수한 생체 분포를 가진다는 것을 보여주는 것이다. 이는 조직에 카르고를 국재화하고, 전달하는 그의 치료 능력을 크게 향상시킬 것으로 기대된다.
실시예 10. 감염에 의해 유발된 질환 치료 방법
SARS-CoV-2에 감염된 환자는 코로나바이러스 질환 2019(COVID-19)의 증상을 경험하기 시작한다. COVID-19의 호흡기 증상으로는 숨가쁨 및/또는 호흡 곤란을 포함한다.
피험체에서 COVID-19의 호흡기 증상을 치료하기에 충분한 인터류킨 10의 효능제 (IL-10), 또는 그의 일부를 발현하는 본원에 기술된 세포질체를 함유하는 약학적 제제를 환자에 투여한다. 본 실시예에서, 세포질체는 또한 림프계로의 세포질체의 효율적인 귀소를 가능하게 하기 위해 림프 조직을 표적화하는 귀소 수용체를 발현한다. 세포질체는 또한 예컨대, "날 먹지마" 신호 펩티드와 같은 면역 회피 모이어티를 발현하여 세포질체가 림프계에 도달하기 전에 피험체에서 제거되지 않도록 한다. 피험체의 호흡기 증상은 투여 후 감소되었다.
실시예 11. 종양용해성 바이러스 감염된 세포질체 생성
제핵 하루 전(보통 제핵 118 hr 전), 2.5*10^6 hTERT-MSC를 15 cm 디쉬에 시딩하였다. 시딩 후 대략 2시간째, 세포를 PBS로 1회 세척하였다. 이어서, 세포를 8 mL 무혈청 opti-MEM 존재하에 상이한 MOI(예를 들어, 0.05 또는 0.5)로 oHSV-GFP(Imanis OV3001)로 감염시켰다. 이어서, 때때로 진탕시키면서, 세포를 37℃에서 2시간 동안 인큐베이션시켰다. 이어서, 바이러스 접종물을 폐기하였다. 20 mL 사전 가온된 완전 배양 배지(α-MEM, 16.5% 프리미엄 FBS, 1% 항생제-항진균제, 1% 글루타맥스, 1% HEPES)를 각 웰에 첨가하였다. 제핵시까지 세포를 37℃에서 인큐베이션시켰다. 도 11a-b는 폴리펩티드(VSV-GFP)를 모세포 또는 기준 세포(핵이 없는 세포) 및 본원에 기술된 제핵 세포 내로 직접 도입하는 형광 이미지를 도시한 것이다. 감염 후 12 hr째에 MOI 0.05로 VSV-GFP(화살표)로 감염된 유핵 모 MSC(상단) 및 핵이 없는 MSC 유래 세포(하단)의 표면형광 현미경 이미지는 리포터 펩티드, GFP의 MSC 내로의 도입을 보여주었다. GFP 항원은 핵이 없는 MSC에 의해 명확하고, 강건하게 발현되었으며, 이는 제핵 세포에서의 바이러스 복제 및 항원 생산을 시사하는 것이다. 스케일 바 = 50 ㎛. 도 11b는 감염 후 12 hr째에 MOI 0.1로 VSV-GFP(화살촉)로 감염된 핵이 없는 MSC 유래 세포의 고배율 표면형광 이미지를 도시한 것이다. 제핵 세포를 또한 로다민 팔로이딘(화살표) 및 핵 결여를 나타내기 위해 핵 염색 DAPI를 이용하여 F-액틴 필라멘트에 대해 염색하였다. 도 11은 항원성 펩티드와 같은 외인성 펩티드를 발현하기 위해 세포질체를 조작하고 종양용해성 바이러스로 형질감염시킬 수 있다는 것을 도시한 것이다. 도 11은 또한 세포질체가 바이러스 포획 목적을 위해 바이러스에 의해 감염될 수 있음을 도시한 것이다.
실시예 12. 세포질체에 의해 접촉된 표적 세포에 대한 면역 반응의 동원 및 활성화
제핵 하루 전(보통 제핵 18 hr 전), 2.5*10^6 hTERT-MSC를 15 cm 디쉬에 시딩하였다. 시딩 후 대략 2시간째, 세포를 PBS로 1회 세척하였다. 이어서, 세포를 8 mL 무혈청 opti-MEM 존재하에 상이한 MOI(예를 들어, 0.05 또는 0.5)로 oHSV-GFP(Imanis OV3001)로 감염시켰다. 이어서, 때때로 진탕시키면서, 세포를 37℃에서 2시간 동안 인큐베이션시켰다. 이어서, 바이러스 접종물을 폐기하였다. 20 mL 사전 가온된 완전 배양 배지(α-MEM, 16.5% 프리미엄 FBS, 1% 항생제-항진균제, 1% 글루타맥스, 1% HEPES)를 각 웰에 첨가하였다. 제핵시까지 세포를 37℃에서 인큐베이션시켰다. 도 12a-12bd는 GFP 항원을 코딩하는 종양용해성 단순 헤르페스 바이러스(oHSV)로 MSC를 감염시키는 것을 도시한 것이다. MSC 및 핵이 없는 MSC의 표면형광 현미경 이미지는 감염 후 48 hr째 MOI 0.05로 GFP 항원을 코딩하는 oHSV로의 감염을 보여준다. 핵이 없는 MSC는 oHSV-GFP 접종 18 hr후 MSC로부터 생성되었다. 스케일 바 = 50 ㎛. 도 12b는 라이프액트-RFP를 발현하는 MSC 또는 핵이 없는 MSC를 GFP를 코딩하는 종양용해성 단순 헤르페스 바이러스(oHSV-GFP) 0.05 MOI로 감염시킨 후, 이어서, 누드 마우스에서 성장하는 확립된 U87 교아세포종 종양에 주사한 것을 도시한 것이다. 이미지는 주사 후 7일째에 촬영하였다. 강력한 GFP 신호로 나타난 바와 같이, MSC 및 핵이 없는 MSC는 oHSV를 종양 세포로 전달하였다. 7일 후 종양에서 핵이 없는 MSC는 거의 검출되지 않은 반면, 성장하는 종양의 중앙(주사 부위)과 바깥쪽 가장자리에는 다수의 MSC가 존재한다는 것이 주목할 만하였다. 도 12c는 oHSV-GFP 바이러스를 보유하는 MSC 또는 핵이 없는 MSC에 의해 감염된 종양 세포의 부분을 나타내는 GFP로 커버된 종양 면적의 비율(%)을 보여주는 막대 그래프이다. 도 12d는 PBS 주사 대조군과 비교하여 IL-12(애주번트) 조작된 핵이 없는 MSC 및 oHSV 조작된 핵이 없는 MSC의 조합으로 처리된 확립된 교아세포종 종양에 존재하는 CD8+ 이펙터 T 세포의 비가 증가된 것을 보여주는 그래프이다. 도 12는 본원에 기술된 세포질체가 조작된 세포질체의 부위에 면역 세포를 동원함으로써 충분한 면역 반응을 유도할 수 있다는 것을 도시한 것이다. 상기 시나리오에서, 세포질체 및 세포질체에 의해 캡슐화된 모든 임의의 카르고(예컨대, 세포질체 내부에 포획된 바이러스)은 동원된 면역 반응에 의해 파괴될 것이다.
실시예 13. 세포질체 내로의 펩티드 로딩
웰당 1 x 105/ml를 완전 MSC 배지[MEM 1X(Gibco 12561-056); 16.5% 프리미엄 FBS(Atlanta Biologics S1150); 1% HEPES 1M(Gibco 15630-80); 1% 안티-안티 100X(Gibco 15240-062); 1% 글루타맥스 100X(Gibco 35050-061)] 중 4 챔버 유리 슬라이드(LabTek II 4-챔버 유리 슬라이드, 155383) 상에 플레이팅하였다. 세포를 적어도 1시간 또는 밤새도록 부착되도록 하였다. 이어서, 세포를 PBS(Gibco 14190-144)로 세정하였다. Arg9(FAM)(서열 번호 1154)(10 mM, Anaspec, AS-61207)를 완전 배지에서 1:100(100 uM)의 총 농도로 희석하였다. 이어서, 세포질체를 1 내지 2시간 동안 인큐베이션시키고, PBS로 3회 세정하였다. 훽스트 33342(Invitrogen)를 완전 배지 중 1:5000 희석률로 적어도 10분 동안 첨가하였다. 이어서, 세포를 PBS로 세정하고, 표면형광 현미경법에 의해 이미징하였다. 도 13a-13b는 Arg9와 공동 인큐베이션된 경우 관심 폴리펩티드의 로딩 또는 펩티드 흡수가 증가되었다는 것을 도시한 것이다. 도 13a에 제시된 바와 같이, 100 μM의 세포 투과성 항원 펩티드(Arg)9-FAM(6-카복시플루오르세인, FAM-Arg-Arg-Arg-Arg-Arg-Arg-Arg-Arg-Arg-OH)과 함께 인큐베이션된 MSC(좌측) 및 제핵 MSC(세포질체)(우측)를 보여주는 것이다. 스케일 바 = 50 ㎛. 화살표는 훽스트 염색된 핵을 나타내고, 화살촉은 양성 (Arg)9-FAM을 나타낸다. 도 13b는 이미지J에서 측정된 상대 형광 강도를 나타내는 막대 그래프를 도시한 것이다. 보정된 총 세포 형광 = 적분된 밀도 - (선택한 세포 면적 X 배경 판독값의 평균 형광). 평균 ± SEM; n=10. 전반적으로, 도 13은 본원에 기술된 세포질체(예컨대, 핵이 없는 MSC)에 관심 폴리펩티드를 직접 로딩할 수 있다는 것을 도시한 것이다. 예를 들어, 항원은 세포질체와 함께 항원 및 Arg9(FAM)의 공동 인큐베이션에 의해 세포질체에 도입될 수 있다. 이어서, 이들 세포질체는 본원에 기술된 백신으로서 작용할 수 있다.
본 발명의 바람직한 실시양태가 본원에 제시되고, 기술되었지만, 그러한 실시양태는 단지 예로서 제공된다는 것이 당업자에게 명백할 것이다. 이제, 당업자는 본 발명에서 벗어남 없이 다수의 변형, 변경 및 치환에 대해 착안해 낼 수 있을 것이다. 본원에 기술된 본 발명의 실시양태에 대한 다양한 대안이 본 발명을 실시하는 데 이용될 수 있음을 이해하여야 한다. 하기 청구범위는 본 발명의 범주를 정의하고, 이러한 청구범위의 범주 내의 방법 및 구조 및 그의 등가물은 이에 의해 포함되는 것으로 의도된다.
SEQUENCE LISTING <110> CYTONUS THERAPEUTICS, INC. <120> RAPID VACCINE PLATFORM <130> 53712-706.601 <140> <141> <150> 63/014,002 <151> 2020-04-02 <150> 62/975,044 <151> 2020-02-11 <160> 1154 <170> PatentIn version 3.5 <210> 1 <211> 4968 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 1 ttgattggtg attgtgcaac tgtacataca gctaataaat gggatctcat tattagtgat 60 atgtacgacc ctaagactaa aaatgttaca aaagaaaatg actctaaaga gggttttttc 120 acttacattt gtgggtttat acaacaaaag ctagctcttg gaggttccgt ggctataaag 180 ataacagaac attcttggaa tgctgatctt tataagctca tgggacactt cgcatggtgg 240 acagcctttg ttactaatgt gaatgcgtca tcatctgaag catttttaat tggatgtaat 300 tatcttggca aaccacgcga acaaatagat ggttatgtca tgcatgcaaa ttacatattt 360 tggaggaata caaatccaat tcagttgtct tcctattctt tatttgacat gagtaaattt 420 ccccttaaat taaggggtac tgctgttatg tctttaaaag aaggtcaaat caatgatatg 480 attttatctc ttcttagtaa aggtagactt ataattagag aaaacaacag agttgttatt 540 tctagtgatg ttcttgttaa caactaaacg aacaatgttt gtttttcttg ttttattgcc 600 actagtctct agtcagtgtg ttaatcttac aaccagaact caattacccc ctgcatacac 660 taattctttc acacgtggtg tttattaccc tgacaaagtt ttcagatcct cagttttaca 720 ttcaactcag gacttgttct tacctttctt ttccaatgtt acttggttcc atgctataca 780 tgtctctggg accaatggta ctaagaggtt tgataaccct gtcctaccat ttaatgatgg 840 tgtttatttt gcttccactg agaagtctaa cataataaga ggctggattt ttggtactac 900 tttagattcg aagacccagt ccctacttat tgttaataac gctactaatg ttgttattaa 960 agtctgtgaa tttcaatttt gtaatgatcc atttttgggt gtttattacc acaaaaacaa 1020 caaaagttgg atggaaagtg agttcagagt ttattctagt gcgaataatt gcacttttga 1080 atatgtctct cagccttttc ttatggacct tgaaggaaaa cagggtaatt tcaaaaatct 1140 tagggaattt gtgtttaaga atattgatgg ttattttaaa atatattcta agcacacgcc 1200 tattaattta gtgcgtgatc tccctcaggg tttttcggct ttagaaccat tggtagattt 1260 gccaataggt attaacatca ctaggtttca aactttactt gctttacata gaagttattt 1320 gactcctggt gattcttctt caggttggac agctggtgct gcagcttatt atgtgggtta 1380 tcttcaacct aggacttttc tattaaaata taatgaaaat ggaaccatta cagatgctgt 1440 agactgtgca cttgaccctc tctcagaaac aaagtgtacg ttgaaatcct tcactgtaga 1500 aaaaggaatc tatcaaactt ctaactttag agtccaacca acagaatcta ttgttagatt 1560 tcctaatatt acaaacttgt gcccttttgg tgaagttttt aacgccacca gatttgcatc 1620 tgtttatgct tggaacagga agagaatcag caactgtgtt gctgattatt ctgtcctata 1680 taattccgca tcattttcca cttttaagtg ttatggagtg tctcctacta aattaaatga 1740 tctctgcttt actaatgtct atgcagattc atttgtaatt agaggtgatg aagtcagaca 1800 aatcgctcca gggcaaactg gaaagattgc tgattataat tataaattac cagatgattt 1860 tacaggctgc gttatagctt ggaattctaa caatcttgat tctaaggttg gtggtaatta 1920 taattacctg tatagattgt ttaggaagtc taatctcaaa ccttttgaga gagatatttc 1980 aactgaaatc tatcaggccg gtagcacacc ttgtaatggt gttgaaggtt ttaattgtta 2040 ctttccttta caatcatatg gtttccaacc cactaatggt gttggttacc aaccatacag 2100 agtagtagta ctttcttttg aacttctaca tgcaccagca actgtttgtg gacctaaaaa 2160 gtctactaat ttggttaaaa acaaatgtgt caatttcaac ttcaatggtt taacaggcac 2220 aggtgttctt actgagtcta acaaaaagtt tctgcctttc caacaatttg gcagagacat 2280 tgctgacact actgatgctg tccgtgatcc acagacactt gagattcttg acattacacc 2340 atgttctttt ggtggtgtca gtgttataac accaggaaca aatacttcta accaggttgc 2400 tgttctttat caggatgtta actgcacaga agtccctgtt gctattcatg cagatcaact 2460 tactcctact tggcgtgttt attctacagg ttctaatgtt tttcaaacac gtgcaggctg 2520 tttaataggg gctgaacatg tcaacaactc atatgagtgt gacataccca ttggtgcagg 2580 tatatgcgct agttatcaga ctcagactaa ttctcctcgg cgggcacgta gtgtagctag 2640 tcaatccatc attgcctaca ctatgtcact tggtgcagaa aattcagttg cttactctaa 2700 taactctatt gccataccca caaattttac tattagtgtt accacagaaa ttctaccagt 2760 gtctatgacc aagacatcag tagattgtac aatgtacatt tgtggtgatt caactgaatg 2820 cagcaatctt ttgttgcaat atggcagttt ttgtacacaa ttaaaccgtg ctttaactgg 2880 aatagctgtt gaacaagaca aaaacaccca agaagttttt gcacaagtca aacaaattta 2940 caaaacacca ccaattaaag attttggtgg ttttaatttt tcacaaatat taccagatcc 3000 atcaaaacca agcaagaggt catttattga agatctactt ttcaacaaag tgacacttgc 3060 agatgctggc ttcatcaaac aatatggtga ttgccttggt gatattgctg ctagagacct 3120 catttgtgca caaaagttta acggccttac tgttttgcca cctttgctca cagatgaaat 3180 gattgctcaa tacacttctg cactgttagc gggtacaatc acttctggtt ggacctttgg 3240 tgcaggtgct gcattacaaa taccatttgc tatgcaaatg gcttataggt ttaatggtat 3300 tggagttaca cagaatgttc tctatgagaa ccaaaaattg attgccaacc aatttaatag 3360 tgctattggc aaaattcaag actcactttc ttccacagca agtgcacttg gaaaacttca 3420 agatgtggtc aaccaaaatg cacaagcttt aaacacgctt gttaaacaac ttagctccaa 3480 ttttggtgca atttcaagtg ttttaaatga tatcctttca cgtcttgaca aagttgaggc 3540 tgaagtgcaa attgataggt tgatcacagg cagacttcaa agtttgcaga catatgtgac 3600 tcaacaatta attagagctg cagaaatcag agcttctgct aatcttgctg ctactaaaat 3660 gtcagagtgt gtacttggac aatcaaaaag agttgatttt tgtggaaagg gctatcatct 3720 tatgtccttc cctcagtcag cacctcatgg tgtagtcttc ttgcatgtga cttatgtccc 3780 tgcacaagaa aagaacttca caactgctcc tgccatttgt catgatggaa aagcacactt 3840 tcctcgtgaa ggtgtctttg tttcaaatgg cacacactgg tttgtaacac aaaggaattt 3900 ttatgaacca caaatcatta ctacagacaa cacatttgtg tctggtaact gtgatgttgt 3960 aataggaatt gtcaacaaca cagtttatga tcctttgcaa cctgaattag actcattcaa 4020 ggaggagtta gataaatatt ttaagaatca tacatcacca gatgttgatt taggtgacat 4080 ctctggcatt aatgcttcag ttgtaaacat tcaaaaagaa attgaccgcc tcaatgaggt 4140 tgccaagaat ttaaatgaat ctctcatcga tctccaagaa cttggaaagt atgagcagta 4200 tataaaatgg ccatggtaca tttggctagg ttttatagct ggcttgattg ccatagtaat 4260 ggtgacaatt atgctttgct gtatgaccag ttgctgtagt tgtctcaagg gctgttgttc 4320 ttgtggatcc tgctgcaaat ttgatgaaga cgactctgag ccagtgctca aaggagtcaa 4380 attacattac acataaacga acttatggat ttgtttatga gaatcttcac aattggaact 4440 gtaactttga agcaaggtga aatcaaggat gctactcctt cagattttgt tcgcgctact 4500 gcaacgatac cgatacaagc ctcactccct ttcggatggc ttattgttgg cgttgcactt 4560 cttgctgttt ttcagagcgc ttccaaaatc ataaccctca aaaagagatg gcaactagca 4620 ctctccaagg gtgttcactt tgtttgcaac ttgctgttgt tgtttgtaac agtttactca 4680 caccttttgc tcgttgctgc tggccttgaa gccccttttc tctatcttta tgctttagtc 4740 tacttcttgc agagtataaa ctttgtaaga ataataatga ggctttggct ttgctggaaa 4800 tgccgttcca aaaacccatt actttatgat gccaactatt ttctttgctg gcatactaat 4860 tgttacgact attgtatacc ttacaatagt gtaacttctt caattgtcat tacttcaggt 4920 gatggcacaa caagtcctat ttctgaacat gactaccaga ttggtggt 4968 <210> 2 <211> 1273 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 2 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile 885 890 895 Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn 1145 1150 1155 His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn 1160 1165 1170 Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu 1175 1180 1185 Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu 1190 1195 1200 Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu 1205 1210 1215 Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met 1220 1225 1230 Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys 1235 1240 1245 Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro 1250 1255 1260 Val Leu Lys Gly Val Lys Leu His Tyr Thr 1265 1270 <210> 3 <211> 3822 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 3 atgtttgttt ttcttgtttt attgccacta gtctctagtc agtgtgttaa tcttacaacc 60 agaactcaat taccccctgc atacactaat tctttcacac gtggtgttta ttaccctgac 120 aaagttttca gatcctcagt tttacattca actcaggact tgttcttacc tttcttttcc 180 aatgttactt ggttccatgc tatacatgtc tctgggacca atggtactaa gaggtttgat 240 aaccctgtcc taccatttaa tgatggtgtt tattttgctt ccactgagaa gtctaacata 300 ataagaggct ggatttttgg tactacttta gattcgaaga cccagtccct acttattgtt 360 aataacgcta ctaatgttgt tattaaagtc tgtgaatttc aattttgtaa tgatccattt 420 ttgggtgttt attaccacaa aaacaacaaa agttggatgg aaagtgagtt cagagtttat 480 tctagtgcga ataattgcac ttttgaatat gtctctcagc cttttcttat ggaccttgaa 540 ggaaaacagg gtaatttcaa aaatcttagg gaatttgtgt ttaagaatat tgatggttat 600 tttaaaatat attctaagca cacgcctatt aatttagtgc gtgatctccc tcagggtttt 660 tcggctttag aaccattggt agatttgcca ataggtatta acatcactag gtttcaaact 720 ttacttgctt tacatagaag ttatttgact cctggtgatt cttcttcagg ttggacagct 780 ggtgctgcag cttattatgt gggttatctt caacctagga cttttctatt aaaatataat 840 gaaaatggaa ccattacaga tgctgtagac tgtgcacttg accctctctc agaaacaaag 900 tgtacgttga aatccttcac tgtagaaaaa ggaatctatc aaacttctaa ctttagagtc 960 caaccaacag aatctattgt tagatttcct aatattacaa acttgtgccc ttttggtgaa 1020 gtttttaacg ccaccagatt tgcatctgtt tatgcttgga acaggaagag aatcagcaac 1080 tgtgttgctg attattctgt cctatataat tccgcatcat tttccacttt taagtgttat 1140 ggagtgtctc ctactaaatt aaatgatctc tgctttacta atgtctatgc agattcattt 1200 gtaattagag gtgatgaagt cagacaaatc gctccagggc aaactggaaa gattgctgat 1260 tataattata aattaccaga tgattttaca ggctgcgtta tagcttggaa ttctaacaat 1320 cttgattcta aggttggtgg taattataat tacctgtata gattgtttag gaagtctaat 1380 ctcaaacctt ttgagagaga tatttcaact gaaatctatc aggccggtag cacaccttgt 1440 aatggtgttg aaggttttaa ttgttacttt cctttacaat catatggttt ccaacccact 1500 aatggtgttg gttaccaacc atacagagta gtagtacttt cttttgaact tctacatgca 1560 ccagcaactg tttgtggacc taaaaagtct actaatttgg ttaaaaacaa atgtgtcaat 1620 ttcaacttca atggtttaac aggcacaggt gttcttactg agtctaacaa aaagtttctg 1680 cctttccaac aatttggcag agacattgct gacactactg atgctgtccg tgatccacag 1740 acacttgaga ttcttgacat tacaccatgt tcttttggtg gtgtcagtgt tataacacca 1800 ggaacaaata cttctaacca ggttgctgtt ctttatcagg atgttaactg cacagaagtc 1860 cctgttgcta ttcatgcaga tcaacttact cctacttggc gtgtttattc tacaggttct 1920 aatgtttttc aaacacgtgc aggctgttta ataggggctg aacatgtcaa caactcatat 1980 gagtgtgaca tacccattgg tgcaggtata tgcgctagtt atcagactca gactaattct 2040 cctcggcggg cacgtagtgt agctagtcaa tccatcattg cctacactat gtcacttggt 2100 gcagaaaatt cagttgctta ctctaataac tctattgcca tacccacaaa ttttactatt 2160 agtgttacca cagaaattct accagtgtct atgaccaaga catcagtaga ttgtacaatg 2220 tacatttgtg gtgattcaac tgaatgcagc aatcttttgt tgcaatatgg cagtttttgt 2280 acacaattaa accgtgcttt aactggaata gctgttgaac aagacaaaaa cacccaagaa 2340 gtttttgcac aagtcaaaca aatttacaaa acaccaccaa ttaaagattt tggtggtttt 2400 aatttttcac aaatattacc agatccatca aaaccaagca agaggtcatt tattgaagat 2460 ctacttttca acaaagtgac acttgcagat gctggcttca tcaaacaata tggtgattgc 2520 cttggtgata ttgctgctag agacctcatt tgtgcacaaa agtttaacgg ccttactgtt 2580 ttgccacctt tgctcacaga tgaaatgatt gctcaataca cttctgcact gttagcgggt 2640 acaatcactt ctggttggac ctttggtgca ggtgctgcat tacaaatacc atttgctatg 2700 caaatggctt ataggtttaa tggtattgga gttacacaga atgttctcta tgagaaccaa 2760 aaattgattg ccaaccaatt taatagtgct attggcaaaa ttcaagactc actttcttcc 2820 acagcaagtg cacttggaaa acttcaagat gtggtcaacc aaaatgcaca agctttaaac 2880 acgcttgtta aacaacttag ctccaatttt ggtgcaattt caagtgtttt aaatgatatc 2940 ctttcacgtc ttgacaaagt tgaggctgaa gtgcaaattg ataggttgat cacaggcaga 3000 cttcaaagtt tgcagacata tgtgactcaa caattaatta gagctgcaga aatcagagct 3060 tctgctaatc ttgctgctac taaaatgtca gagtgtgtac ttggacaatc aaaaagagtt 3120 gatttttgtg gaaagggcta tcatcttatg tccttccctc agtcagcacc tcatggtgta 3180 gtcttcttgc atgtgactta tgtccctgca caagaaaaga acttcacaac tgctcctgcc 3240 atttgtcatg atggaaaagc acactttcct cgtgaaggtg tctttgtttc aaatggcaca 3300 cactggtttg taacacaaag gaatttttat gaaccacaaa tcattactac agacaacaca 3360 tttgtgtctg gtaactgtga tgttgtaata ggaattgtca acaacacagt ttatgatcct 3420 ttgcaacctg aattagactc attcaaggag gagttagata aatattttaa gaatcataca 3480 tcaccagatg ttgatttagg tgacatctct ggcattaatg cttcagttgt aaacattcaa 3540 aaagaaattg accgcctcaa tgaggttgcc aagaatttaa atgaatctct catcgatctc 3600 caagaacttg gaaagtatga gcagtatata aaatggccat ggtacatttg gctaggtttt 3660 atagctggct tgattgccat agtaatggtg acaattatgc tttgctgtat gaccagttgc 3720 tgtagttgtc tcaagggctg ttgttcttgt ggatcctgct gcaaatttga tgaagacgac 3780 tctgagccag tgctcaaagg agtcaaatta cattacacat aa 3822 <210> 4 <211> 29902 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 4 attaaaggtt tataccttcc caggtaacaa accaaccaac tttcgatctc ttgtagatct 60 gttctctaaa cgaactttaa aatctgtgtg gctgtcactc ggctgcatgc ttagtgcact 120 cacgcagtat aattaataac taattactgt cgttgacagg acacgagtaa ctcgtctatc 180 ttctgcaggc tgcttacggt ttcgtccgtg ttgcagccga tcatcagcac atctaggttt 240 cgtccgggtg tgaccgaaag gtaagatgga gagccttgtc cctggtttca acgagaaaac 300 acacgtccaa ctcagtttgc ctgttttaca ggttcgcgac gtgctcgtac gtggctttgg 360 agactccgtg gaggaggtct tatcagaggc acgtcaacat cttaaagatg gcacttgtgg 420 cttagtagaa gttgaaaaag gcgttttgcc tcaacttgaa cagccctatg tgttcatcaa 480 acgttcggat gctcgaactg cacctcatgg tcatgttatg gttgagctgg tagcagaact 540 cgaaggcatt cagtacggtc gtagtggtga gacacttggt gtccttgtcc ctcatgtggg 600 cgaaatacca gtggcttacc gcaaggttct tcttcgtaag aacggtaata aaggagctgg 660 tggccatagt tacggcgccg atctaaagtc atttgactta ggcgacgagc ttggcactga 720 tccttatgaa gattttcaag aaaactggaa cactaaacat agcagtggtg ttacccgtga 780 actcatgcgt gagcttaacg gaggggcata cactcgctat gtcgataaca acttctgtgg 840 ccctgatggc taccctcttg agtgcattaa agaccttcta gcacgtgctg gtaaagcttc 900 atgcactttg tccgaacaac tggactttat tgacactaag aggggtgtat actgctgccg 960 tgaacatgag catgaaattg cttggtacac ggaacgttct gaaaagagct atgaattgca 1020 gacacctttt gaaattaaat tggcaaagaa atttgacacc ttcaatgggg aatgtccaaa 1080 ttttgtattt cccttaaatt ccataatcaa gactattcaa ccaagggttg aaaagaaaaa 1140 gcttgatggc tttatgggta gaattcgatc tgtctatcca gttgcgtcac caaatgaatg 1200 caaccaaatg tgcctttcaa ctctcatgaa gtgtgatcat tgtggtgaaa cttcatggca 1260 gacgggcgat tttgttaaag ccacttgcga attttgtggc actgagaatt tgactaaaga 1320 aggtgccact acttgtggtt acttacccca aaatgctgtt gttaaaattt attgtccagc 1380 atgtcacaat tcagaagtag gacctgagca tagtcttgcc gaataccata atgaatctgg 1440 cttgaaaacc attcttcgta agggtggtcg cactattgcc tttggaggct gtgtgttctc 1500 ttatgttggt tgccataaca agtgtgccta ttgggttcca cgtgctagcg ctaacatagg 1560 ttgtaaccat acaggtgttg ttggagaagg ttccgaaggt cttaatgaca accttcttga 1620 aatactccaa aaagagaaag tcaacatcaa tattgttggt gactttaaac ttaatgaaga 1680 gatcgccatt attttggcat ctttttctgc ttccacaagt gcttttgtgg aaactgtgaa 1740 aggtttggat tataaagcat tcaaacaaat tgttgaatcc tgtggtaatt ttaaagttac 1800 aaaaggaaaa gctaaaaaag gtgcctggaa tattggtgaa cagaaatcaa tactgagtcc 1860 tctttatgca tttgcatcag aggctgctcg tgttgtacga tcaattttct cccgcactct 1920 tgaaactgct caaaattctg tgcgtgtttt acagaaggcc gctataacaa tactagatgg 1980 aatttcacag tattcactga gactcattga tgctatgatg ttcacatctg atttggctac 2040 taacaatcta gttgtaatgg cctacattac aggtggtgtt gttcagttga cttcgcagtg 2100 gctaactaac atctttggca ctgtttatga aaaactcaaa cccgtccttg attggcttga 2160 agagaagttt aaggaaggtg tagagtttct tagagacggt tgggaaattg ttaaatttat 2220 ctcaacctgt gcttgtgaaa ttgtcggtgg acaaattgtc acctgtgcaa aggaaattaa 2280 ggagagtgtt cagacattct ttaagcttgt aaataaattt ttggctttgt gtgctgactc 2340 tatcattatt ggtggagcta aacttaaagc cttgaattta ggtgaaacat ttgtcacgca 2400 ctcaaaggga ttgtacagaa agtgtgttaa atccagagaa gaaactggcc tactcatgcc 2460 tctaaaagcc ccaaaagaaa ttatcttctt agagggagaa acacttccca cagaagtgtt 2520 aacagaggaa gttgtcttga aaactggtga tttacaacca ttagaacaac ctactagtga 2580 agctgttgaa gctccattgg ttggtacacc agtttgtatt aacgggctta tgttgctcga 2640 aatcaaagac acagaaaagt actgtgccct tgcacctaat atgatggtaa caaacaatac 2700 cttcacactc aaaggcggtg caccaacaaa ggttactttt ggtgatgaca ctgtgataga 2760 agtgcaaggt tacaagagtg tgaatatcac ttttgaactt gatgaaagga ttgataaagt 2820 acttaatgag aagtgctctg cctatacagt tgaactcggt acagaagtaa atgagttcgc 2880 ctgtgttgtg gcagatgctg tcataaaaac tttgcaacca gtatctgaat tacttacacc 2940 actgggcatt gatttagatg agtggagtat ggctacatac tacttatttg atgagtctgg 3000 tgagtttaaa ttggcttcac atatgtattg ttctttctac cctccagatg aggatgaaga 3060 agaaggtgat tgtgaagaag aagagtttga gccatcaact caatatgagt atggtactga 3120 agatgattac caaggtaaac ctttggaatt tggtgccact tctgctgctc ttcaacctga 3180 agaagagcaa gaagaagatt ggttagatga tgatagtcaa caaactgttg gtcaacaaga 3240 cggcagtgag gacaatcaga caactactat tcaaacaatt gttgaggttc aacctcaatt 3300 agagatggaa cttacaccag ttgttcagac tattgaagtg aatagtttta gtggttattt 3360 aaaacttact gacaatgtat acattaaaaa tgcagacatt gtggaagaag ctaaaaaggt 3420 aaaaccaaca gtggttgtta atgcagccaa tgtttacctt aaacatggag gaggtgttgc 3480 aggagcctta aataaggcta ctaacaatgc catgcaagtt gaatctgatg attacatagc 3540 tactaatgga ccacttaaag tgggtggtag ttgtgtttta agcggacaca atcttgctaa 3600 acactgtctt catgttgtcg gcccaaatgt taacaaaggt gaagacattc aacttcttaa 3660 gagtgcttat gaaaatttta atcagcacga agttctactt gcaccattat tatcagctgg 3720 tatttttggt gctgacccta tacattcttt aagagtttgt gtagatactg ttcgcacaaa 3780 tgtctactta gctgtctttg ataaaaatct ctatgacaaa cttgtttcaa gctttttgga 3840 aatgaagagt gaaaagcaag ttgaacaaaa gatcgctgag attcctaaag aggaagttaa 3900 gccatttata actgaaagta aaccttcagt tgaacagaga aaacaagatg ataagaaaat 3960 caaagcttgt gttgaagaag ttacaacaac tctggaagaa actaagttcc tcacagaaaa 4020 cttgttactt tatattgaca ttaatggcaa tcttcatcca gattctgcca ctcttgttag 4080 tgacattgac atcactttct taaagaaaga tgctccatat atagtgggtg atgttgttca 4140 agagggtgtt ttaactgctg tggttatacc tactaaaaag gctggtggca ctactgaaat 4200 gctagcgaaa gctttgagaa aagtgccaac agacaattat ataaccactt acccgggtca 4260 gggtttaaat ggttacactg tagaggaggc aaagacagtg cttaaaaagt gtaaaagtgc 4320 cttttacatt ctaccatcta ttatctctaa tgagaagcaa gaaattcttg gaactgtttc 4380 ttggaatttg cgagaaatgc ttgcacatgc agaagaaaca cgcaaattaa tgcctgtctg 4440 tgtggaaact aaagccatag tttcaactat acagcgtaaa tataagggta ttaaaataca 4500 agagggtgtg gttgattatg gtgctagatt ttacttttac accagtaaaa caactgtagc 4560 gtcacttatc aacacactta acgatctaaa tgaaactctt gttacaatgc cacttggcta 4620 tgtaacacat ggcttaaatt tggaagaagc tgctcggtat atgagatctc tcaaagtgcc 4680 agctacagtt tctgtttctt cacctgatgc tgttacagcg tataatggtt atcttacttc 4740 ttcttctaaa acacctgaag aacattttat tgaaaccatc tcacttgctg gttcctataa 4800 agattggtcc tattctggac aatctacaca actaggtata gaatttctta agagaggtga 4860 taaaagtgta tattacacta gtaatcctac cacattccac ctagatggtg aagttatcac 4920 ctttgacaat cttaagacac ttctttcttt gagagaagtg aggactatta aggtgtttac 4980 aacagtagac aacattaacc tccacacgca agttgtggac atgtcaatga catatggaca 5040 acagtttggt ccaacttatt tggatggagc tgatgttact aaaataaaac ctcataattc 5100 acatgaaggt aaaacatttt atgttttacc taatgatgac actctacgtg ttgaggcttt 5160 tgagtactac cacacaactg atcctagttt tctgggtagg tacatgtcag cattaaatca 5220 cactaaaaag tggaaatacc cacaagttaa tggtttaact tctattaaat gggcagataa 5280 caactgttat cttgccactg cattgttaac actccaacaa atagagttga agtttaatcc 5340 acctgctcta caagatgctt attacagagc aagggctggt gaagctgcta acttttgtgc 5400 acttatctta gcctactgta ataagacagt aggtgagtta ggtgatgtta gagaaacaat 5460 gagttacttg tttcaacatg ccaatttaga ttcttgcaaa agagtcttga acgtggtgtg 5520 taaaacttgt ggacaacagc agacaaccct taagggtgta gaagctgtta tgtacatggg 5580 cacactttct tatgaacaat ttaagaaagg tgttcagata ccttgtacgt gtggtaaaca 5640 agctacaaaa tatctagtac aacaggagtc accttttgtt atgatgtcag caccacctgc 5700 tcagtatgaa cttaagcatg gtacatttac ttgtgctagt gagtacactg gtaattacca 5760 gtgtggtcac tataaacata taacttctaa agaaactttg tattgcatag acggtgcttt 5820 acttacaaag tcctcagaat acaaaggtcc tattacggat gttttctaca aagaaaacag 5880 ttacacaaca accataaaac cagttactta taaattggat ggtgttgttt gtacagaaat 5940 tgaccctaag ttggacaatt attataagaa agacaattct tatttcacag agcaaccaat 6000 tgatcttgta ccaaaccaac catatccaaa cgcaagcttc gataatttta agtttgtatg 6060 tgataatatc aaatttgctg atgatttaaa ccagttaact ggttataaga aacctgcttc 6120 aagagagctt aaagttacat ttttccctga cttaaatggt gatgtggtgg ctattgatta 6180 taaacactac acaccctctt ttaagaaagg agctaaattg ttacataaac ctattgtttg 6240 gcatgttaac aatgcaacta ataaagccac gtataaacca aatacctggt gtatacgttg 6300 tctttggagc acaaaaccag ttgaaacatc aaattcgttt gatgtactga agtcagagga 6360 cgcgcaggga atggataatc ttgcctgcga agatctaaaa ccagtctctg aagaagtagt 6420 ggaaaatcct accatacaga aagacgttct tgagtgtaat gtgaaaacta ccgaagttgt 6480 aggagacatt atacttaaac cagcaaataa tagtttaaaa attacagaag aggttggcca 6540 cacagatcta atggctgctt atgtagacaa ttctagtctt actattaaga aacctaatga 6600 attatctaga gtattaggtt tgaaaaccct tgctactcat ggtttagctg ctgttaatag 6660 tgtcccttgg gatactatag ctaattatgc taagcctttt cttaacaaag ttgttagtac 6720 aactactaac atagttacac ggtgtttaaa ccgtgtttgt actaattata tgccttattt 6780 ctttacttta ttgctacaat tgtgtacttt tactagaagt acaaattcta gaattaaagc 6840 atctatgccg actactatag caaagaatac tgttaagagt gtcggtaaat tttgtctaga 6900 ggcttcattt aattatttga agtcacctaa tttttctaaa ctgataaata ttataatttg 6960 gtttttacta ttaagtgttt gcctaggttc tttaatctac tcaaccgctg ctttaggtgt 7020 tttaatgtct aatttaggca tgccttctta ctgtactggt tacagagaag gctatttgaa 7080 ctctactaat gtcactattg caacctactg tactggttct ataccttgta gtgtttgtct 7140 tagtggttta gattctttag acacctatcc ttctttagaa actatacaaa ttaccatttc 7200 atcttttaaa tgggatttaa ctgcttttgg cttagttgca gagtggtttt tggcatatat 7260 tcttttcact aggtttttct atgtacttgg attggctgca atcatgcaat tgtttttcag 7320 ctattttgca gtacatttta ttagtaattc ttggcttatg tggttaataa ttaatcttgt 7380 acaaatggcc ccgatttcag ctatggttag aatgtacatc ttctttgcat cattttatta 7440 tgtatggaaa agttatgtgc atgttgtaga cggttgtaat tcatcaactt gtatgatgtg 7500 ttacaaacgt aatagagcaa caagagtcga atgtacaact attgttaatg gtgttagaag 7560 gtccttttat gtctatgcta atggaggtaa aggcttttgc aaactacaca attggaattg 7620 tgttaattgt gatacattct gtgctggtag tacatttatt agtgatgaag ttgcgagaga 7680 cttgtcacta cagtttaaaa gaccaataaa tcctactgac cagtcttctt acatcgttga 7740 tagtgttaca gtgaagaatg gttccatcca tctttacttt gataaagctg gtcaaaagac 7800 ttatgaaaga cattctctct ctcattttgt taacttagac aacctgagag ctaataacac 7860 taaaggttca ttgcctatta atgttatagt ttttgatggt aaatcaaaat gtgaagaatc 7920 atctgcaaaa tcagcgtctg tttactacag tcagcttatg tgtcaaccta tactgttact 7980 agatcaggca ttagtgtctg atgttggtga tagtgcggaa gttgcagtta aaatgtttga 8040 tgcttacgtt aatacgtttt catcaacttt taacgtacca atggaaaaac tcaaaacact 8100 agttgcaact gcagaagctg aacttgcaaa gaatgtgtcc ttagacaatg tcttatctac 8160 ttttatttca gcagctcggc aagggtttgt tgattcagat gtagaaacta aagatgttgt 8220 tgaatgtctt aaattgtcac atcaatctga catagaagtt actggcgata gttgtaataa 8280 ctatatgctc acctataaca aagttgaaaa catgacaccc cgtgaccttg gtgcttgtat 8340 tgactgtagt gcgcgtcata ttaatgcgca ggtagcaaaa agtcacaaca ttgctttgat 8400 atggaacgtt aaagatttca tgtcattgtc tgaacaacta cgaaaacaaa tacgtagtgc 8460 tgctaaaaag aataacttac cttttaagtt gacatgtgca actactagac aagttgttaa 8520 tgttgtaaca acaaagatag cacttaaggg tggtaaaatt gttaataatt ggttgaagca 8580 gttaattaaa gttacacttg tgttcctttt tgttgctgct attttctatt taataacacc 8640 tgttcatgtc atgtctaaac atactgactt ttcaagtgaa atcataggat acaaggctat 8700 tgatggtggt gtcactcgtg acatagcatc tacagatact tgttttgcta acaaacatgc 8760 tgattttgac acatggttta gccagcgtgg tggtagttat actaatgaca aagcttgccc 8820 attgattgct gcagtcataa caagagaagt gggttttgtc gtgcctggtt tgcctggcac 8880 gatattacgc acaactaatg gtgacttttt gcatttctta cctagagttt ttagtgcagt 8940 tggtaacatc tgttacacac catcaaaact tatagagtac actgactttg caacatcagc 9000 ttgtgttttg gctgctgaat gtacaatttt taaagatgct tctggtaagc cagtaccata 9060 ttgttatgat accaatgtac tagaaggttc tgttgcttat gaaagtttac gccctgacac 9120 acgttatgtg ctcatggatg gctctattat tcaatttcct aacacctacc ttgaaggttc 9180 tgttagagtg gtaacaactt ttgattctga gtactgtagg cacggcactt gtgaaagatc 9240 agaagctggt gtttgtgtat ctactagtgg tagatgggta cttaacaatg attattacag 9300 atctttacca ggagttttct gtggtgtaga tgctgtaaat ttacttacta atatgtttac 9360 accactaatt caacctattg gtgctttgga catatcagca tctatagtag ctggtggtat 9420 tgtagctatc gtagtaacat gccttgccta ctattttatg aggtttagaa gagcttttgg 9480 tgaatacagt catgtagttg cctttaatac tttactattc cttatgtcat tcactgtact 9540 ctgtttaaca ccagtttact cattcttacc tggtgtttat tctgttattt acttgtactt 9600 gacattttat cttactaatg atgtttcttt tttagcacat attcagtgga tggttatgtt 9660 cacaccttta gtacctttct ggataacaat tgcttatatc atttgtattt ccacaaagca 9720 tttctattgg ttctttagta attacctaaa gagacgtgta gtctttaatg gtgtttcctt 9780 tagtactttt gaagaagctg cgctgtgcac ctttttgtta aataaagaaa tgtatctaaa 9840 gttgcgtagt gatgtgctat tacctcttac gcaatataat agatacttag ctctttataa 9900 taagtacaag tattttagtg gagcaatgga tacaactagc tacagagaag ctgcttgttg 9960 tcatctcgca aaggctctca atgacttcag taactcaggt tctgatgttc tttaccaacc 10020 accacaaacc tctatcacct cagctgtttt gcagagtggt tttagaaaaa tggcattccc 10080 atctggtaaa gttgagggtt gtatggtaca agtaacttgt ggtacaacta cacttaacgg 10140 tctttggctt gatgacgtag tttactgtcc aagacatgtg atctgcacct ctgaagacat 10200 gcttaaccct aattatgaag atttactcat tcgtaagtct aatcataatt tcttggtaca 10260 ggctggtaat gttcaactca gggttattgg acattctatg caaaattgtg tacttaagct 10320 taaggttgat acagccaatc ctaagacacc taagtataag tttgttcgca ttcaaccagg 10380 acagactttt tcagtgttag cttgttacaa tggttcacca tctggtgttt accaatgtgc 10440 tatgaggccc aatttcacta ttaagggttc attccttaat ggttcatgtg gtagtgttgg 10500 ttttaacata gattatgact gtgtctcttt ttgttacatg caccatatgg aattaccaac 10560 tggagttcat gctggcacag acttagaagg taacttttat ggaccttttg ttgacaggca 10620 aacagcacaa gcagctggta cggacacaac tattacagtt aatgttttag cttggttgta 10680 cgctgctgtt ataaatggag acaggtggtt tctcaatcga tttaccacaa ctcttaatga 10740 ctttaacctt gtggctatga agtacaatta tgaacctcta acacaagacc atgttgacat 10800 actaggacct ctttctgctc aaactggaat tgccgtttta gatatgtgtg cttcattaaa 10860 agaattactg caaaatggta tgaatggacg taccatattg ggtagtgctt tattagaaga 10920 tgaatttaca ccttttgatg ttgttagaca atgctcaggt gttactttcc aaagtgcagt 10980 gaaaagaaca atcaagggta cacaccactg gttgttactc acaattttga cttcactttt 11040 agttttagtc cagagtactc aatggtcttt gttctttttt ttgtatgaaa atgccttttt 11100 accttttgct atgggtatta ttgctatgtc tgcttttgca atgatgtttg tcaaacataa 11160 gcatgcattt ctctgtttgt ttttgttacc ttctcttgcc actgtagctt attttaatat 11220 ggtctatatg cctgctagtt gggtgatgcg tattatgaca tggttggata tggttgatac 11280 tagtttgtct ggttttaagc taaaagactg tgttatgtat gcatcagctg tagtgttact 11340 aatccttatg acagcaagaa ctgtgtatga tgatggtgct aggagagtgt ggacacttat 11400 gaatgtcttg acactcgttt ataaagttta ttatggtaat gctttagatc aagccatttc 11460 catgtgggct cttataatct ctgttacttc taactactca ggtgtagtta caactgtcat 11520 gtttttggcc agaggtattg tttttatgtg tgttgagtat tgccctattt tcttcataac 11580 tggtaataca cttcagtgta taatgctagt ttattgtttc ttaggctatt tttgtacttg 11640 ttactttggc ctcttttgtt tactcaaccg ctactttaga ctgactcttg gtgtttatga 11700 ttacttagtt tctacacagg agtttagata tatgaattca cagggactac tcccacccaa 11760 gaatagcata gatgccttca aactcaacat taaattgttg ggtgttggtg gcaaaccttg 11820 tatcaaagta gccactgtac agtctaaaat gtcagatgta aagtgcacat cagtagtctt 11880 actctcagtt ttgcaacaac tcagagtaga atcatcatct aaattgtggg ctcaatgtgt 11940 ccagttacac aatgacattc tcttagctaa agatactact gaagcctttg aaaaaatggt 12000 ttcactactt tctgttttgc tttccatgca gggtgctgta gacataaaca agctttgtga 12060 agaaatgctg gacaacaggg caaccttaca agctatagcc tcagagttta gttcccttcc 12120 atcatatgca gcttttgcta ctgctcaaga agcttatgag caggctgttg ctaatggtga 12180 ttctgaagtt gttcttaaaa agttgaagaa gtctttgaat gtggctaaat ctgaatttga 12240 ccgtgatgca gccatgcaac gtaagttgga aaagatggct gatcaagcta tgacccaaat 12300 gtataaacag gctagatctg aggacaagag ggcaaaagtt actagtgcta tgcagacaat 12360 gcttttcact atgcttagaa agttggataa tgatgcactc aacaacatta tcaacaatgc 12420 aagagatggt tgtgttccct tgaacataat acctcttaca acagcagcca aactaatggt 12480 tgtcatacca gactataaca catataaaaa tacgtgtgat ggtacaacat ttacttatgc 12540 atcagcattg tgggaaatcc aacaggttgt agatgcagat agtaaaattg ttcaacttag 12600 tgaaattagt atggacaatt cacctaattt agcatggcct cttattgtaa cagctttaag 12660 ggccaattct gctgtcaaat tacagaataa tgagcttagt cctgttgcac tacgacagat 12720 gtcttgtgct gccggtacta cacaaactgc ttgcactgat gacaatgcgt tagcttacta 12780 caacacaaca aagggaggta ggtttgtact tgcactgtta tccgatttac aggatttgaa 12840 atgggctaga ttccctaaga gtgatggaac tggtactatc tatacagaac tggaaccacc 12900 ttgtaggttt gttacagaca cacctaaagg tcctaaagtg aagtatttat actttattaa 12960 aggattaaac aacctaaata gaggtatggt acttggtagt ttagctgcca cagtacgtct 13020 acaagctggt aatgcaacag aagtgcctgc caattcaact gtattatctt tctgtgcttt 13080 tgctgtagat gctgctaaag cttacaaaga ttatctagct agtgggggac aaccaatcac 13140 taattgtgtt aagatgttgt gtacacacac tggtactggt caggcaataa cagttacacc 13200 ggaagccaat atggatcaag aatcctttgg tggtgcatcg tgttgtctgt actgccgttg 13260 ccacatagat catccaaatc ctaaaggatt ttgtgactta aaaggtaagt atgtacaaat 13320 acctacaact tgtgctaatg accctgtggg ttttacactt aaaaacacag tctgtaccgt 13380 ctgcggtatg tggaaaggtt atggctgtag ttgtgatcaa ctccgcgaac ccatgcttca 13440 gtcagctgat gcacaatcgt ttttaaacgg gtttgcggtg taagtgcagc ccgtcttaca 13500 ccgtgcggca caggcactag tactgatgtc gtatacaggg cttttgacat ctacaatgat 13560 aaagtagctg gttttgctaa attcctaaaa actaattgtt gtcgcttcca agaaaaggac 13620 gaagatgaca atttaattga ttcttacttt gtagttaaga gacacacttt ctctaactac 13680 caacatgaag aaacaattta taatttactt aaggattgtc cagctgttgc taaacatgac 13740 ttctttaagt ttagaataga cggtgacatg gtaccacata tatcacgtca acgtcttact 13800 aaatacacaa tggcagacct cgtctatgct ttaaggcatt ttgatgaagg taattgtgac 13860 acattaaaag aaatacttgt cacatacaat tgttgtgatg atgattattt caataaaaag 13920 gactggtatg attttgtaga aaacccagat atattacgcg tatacgccaa cttaggtgaa 13980 cgtgtacgcc aagctttgtt aaaaacagta caattctgtg atgccatgcg aaatgctggt 14040 attgttggtg tactgacatt agataatcaa gatctcaatg gtaactggta tgatttcggt 14100 gatttcatac aaaccacgcc aggtagtgga gttcctgttg tagattctta ttattcattg 14160 ttaatgccta tattaacctt gaccagggct ttaactgcag agtcacatgt tgacactgac 14220 ttaacaaagc cttacattaa gtgggatttg ttaaaatatg acttcacgga agagaggtta 14280 aaactctttg accgttattt taaatattgg gatcagacat accacccaaa ttgtgttaac 14340 tgtttggatg acagatgcat tctgcattgt gcaaacttta atgttttatt ctctacagtg 14400 ttcccaccta caagttttgg accactagtg agaaaaatat ttgttgatgg tgttccattt 14460 gtagtttcaa ctggatacca cttcagagag ctaggtgttg tacataatca ggatgtaaac 14520 ttacatagct ctagacttag ttttaaggaa ttacttgtgt atgctgctga ccctgctatg 14580 cacgctgctt ctggtaatct attactagat aaacgcacta cgtgcttttc agtagctgca 14640 cttactaaca atgttgcttt tcaaactgtc aaacccggta attttaacaa agacttctat 14700 gactttgctg tgtctaaggg tttctttaag gaaggaagtt ctgttgaatt aaaacacttc 14760 ttctttgctc aggatggtaa tgctgctatc agcgattatg actactatcg ttataatcta 14820 ccaacaatgt gtgatatcag acaactacta tttgtagttg aagttgttga taagtacttt 14880 gattgttacg atggtggctg tattaatgct aaccaagtca tcgtcaacaa cctagacaaa 14940 tcagctggtt ttccatttaa taaatggggt aaggctagac tttattatga ttcaatgagt 15000 tatgaggatc aagatgcact tttcgcatat acaaaacgta atgtcatccc tactataact 15060 caaatgaatc ttaagtatgc cattagtgca aagaatagag ctcgcaccgt agctggtgtc 15120 tctatctgta gtactatgac caatagacag tttcatcaaa aattattgaa atcaatagcc 15180 gccactagag gagctactgt agtaattgga acaagcaaat tctatggtgg ttggcacaac 15240 atgttaaaaa ctgtttatag tgatgtagaa aaccctcacc ttatgggttg ggattatcct 15300 aaatgtgata gagccatgcc taacatgctt agaattatgg cctcacttgt tcttgctcgc 15360 aaacatacaa cgtgttgtag cttgtcacac cgtttctata gattagctaa tgagtgtgct 15420 caagtattga gtgaaatggt catgtgtggc ggttcactat atgttaaacc aggtggaacc 15480 tcatcaggag atgccacaac tgcttatgct aatagtgttt ttaacatttg tcaagctgtc 15540 acggccaatg ttaatgcact tttatctact gatggtaaca aaattgccga taagtatgtc 15600 cgcaatttac aacacagact ttatgagtgt ctctatagaa atagagatgt tgacacagac 15660 tttgtgaatg agttttacgc atatttgcgt aaacatttct caatgatgat actctctgac 15720 gatgctgttg tgtgtttcaa tagcacttat gcatctcaag gtctagtggc tagcataaag 15780 aactttaagt cagttcttta ttatcaaaac aatgttttta tgtctgaagc aaaatgttgg 15840 actgagactg accttactaa aggacctcat gaattttgct ctcaacatac aatgctagtt 15900 aaacagggtg atgattatgt gtaccttcct tacccagatc catcaagaat cctaggggcc 15960 ggctgttttg tagatgatat cgtaaaaaca gatggtacac ttatgattga acggttcgtg 16020 tctttagcta tagatgctta cccacttact aaacatccta atcaggagta tgctgatgtc 16080 tttcatttgt acttacaata cataagaaag ctacatgatg agttaacagg acacatgtta 16140 gacatgtatt ctgttatgct tactaatgat aacacttcaa ggtattggga acctgagttt 16200 tatgaggcta tgtacacacc gcatacagtc ttacaggctg ttggggcttg tgttctttgc 16260 aattcacaga cttcattaag atgtggtgct tgcatacgta gaccattctt atgttgtaaa 16320 tgctgttacg accatgtcat atcaacatca cataaattag tcttgtctgt taatccgtat 16380 gtttgcaatg ctccaggttg tgatgtcaca gatgtgactc aactttactt aggaggtatg 16440 agctattatt gtaaatcaca taaaccaccc attagttttc cattgtgtgc taatggacaa 16500 gtttttggtt tatataaaaa tacatgtgtt ggtagcgata atgttactga ctttaatgca 16560 attgcaacat gtgactggac aaatgctggt gattacattt tagctaacac ctgtactgaa 16620 agactcaagc tttttgcagc agaaacgctc aaagctactg aggagacatt taaactgtct 16680 tatggtattg ctactgtacg tgaagtgctg tctgacagag aattacatct ttcatgggaa 16740 gttggtaaac ctagaccacc acttaaccga aattatgtct ttactggtta tcgtgtaact 16800 aaaaacagta aagtacaaat aggagagtac acctttgaaa aaggtgacta tggtgatgct 16860 gttgtttacc gaggtacaac aacttacaaa ttaaatgttg gtgattattt tgtgctgaca 16920 tcacatacag taatgccatt aagtgcacct acactagtgc cacaagagca ctatgttaga 16980 attactggct tatacccaac actcaatatc tcagatgagt tttctagcaa tgttgcaaat 17040 tatcaaaagg ttggtatgca aaagtattct acactccagg gaccacctgg tactggtaag 17100 agtcattttg ctattggcct agctctctac tacccttctg ctcgcatagt gtatacagct 17160 tgctctcatg ccgctgttga tgcactatgt gagaaggcat taaaatattt gcctatagat 17220 aaatgtagta gaattatacc tgcacgtgct cgtgtagagt gttttgataa attcaaagtg 17280 aattcaacat tagaacagta tgtcttttgt actgtaaatg cattgcctga gacgacagca 17340 gatatagttg tctttgatga aatttcaatg gccacaaatt atgatttgag tgttgtcaat 17400 gccagattac gtgctaagca ctatgtgtac attggcgacc ctgctcaatt acctgcacca 17460 cgcacattgc taactaaggg cacactagaa ccagaatatt tcaattcagt gtgtagactt 17520 atgaaaacta taggtccaga catgttcctc ggaacttgtc ggcgttgtcc tgctgaaatt 17580 gttgacactg tgagtgcttt ggtttatgat aataagctta aagcacataa agacaaatca 17640 gctcaatgct ttaaaatgtt ttataagggt gttatcacgc atgatgtttc atctgcaatt 17700 aacaggccac aaataggcgt ggtaagagaa ttccttacac gtaaccctgc ttggagaaaa 17760 gctgtcttta tttcacctta taattcacag aatgctgtag cctcaaagat tttgggacta 17820 ccaactcaaa ctgttgattc atcacagggc tcagaatatg actatgtcat attcactcaa 17880 accactgaaa cagctcactc ttgtaatgta aacagattta atgttgctat taccagagca 17940 aaagtaggca tactttgcat aatgtctgat agagaccttt atgacaagtt gcaatttaca 18000 agtcttgaaa ttccacgtag gaatgtggca actttacaag ctgaaaatgt aacaggactc 18060 tttaaagatt gtagtaaggt aatcactggg ttacatccta cacaggcacc tacacacctc 18120 agtgttgaca ctaaattcaa aactgaaggt ttatgtgttg acatacctgg catacctaag 18180 gacatgacct atagaagact catctctatg atgggtttta aaatgaatta tcaagttaat 18240 ggttacccta acatgtttat cacccgcgaa gaagctataa gacatgtacg tgcatggatt 18300 ggcttcgatg tcgaggggtg tcatgctact agagaagctg ttggtaccaa tttaccttta 18360 cagctaggtt tttctacagg tgttaaccta gttgctgtac ctacaggtta tgttgataca 18420 cctaataata cagatttttc cagagttagt gctaaaccac cgcctggaga tcaatttaaa 18480 cacctcatac cacttatgta caaaggactt ccttggaatg tagtgcgtat aaagattgta 18540 caaatgttaa gtgacacact taaaaatctc tctgacagag tcgtatttgt cttatgggca 18600 catggctttg agttgacatc tatgaagtat tttgtgaaaa taggacctga gcgcacctgt 18660 tgtctatgtg atagacgtgc cacatgcttt tccactgctt cagacactta tgcctgttgg 18720 catcattcta ttggatttga ttacgtctat aatccgttta tgattgatgt tcaacaatgg 18780 ggttttacag gtaacctaca aagcaaccat gatctgtatt gtcaagtcca tggtaatgca 18840 catgtagcta gttgtgatgc aatcatgact aggtgtctag ctgtccacga gtgctttgtt 18900 aagcgtgttg actggactat tgaatatcct ataattggtg atgaactgaa gattaatgcg 18960 gcttgtagaa aggttcaaca catggttgtt aaagctgcat tattagcaga caaattccca 19020 gttcttcacg acattggtaa ccctaaagct attaagtgtg tacctcaagc tgatgtagaa 19080 tggaagttct atgatgcaca gccttgtagt gacaaagctt ataaaataga agaattattc 19140 tattcttatg ccacacattc tgacaaattc acagatggtg tatgcctatt ttggaattgc 19200 aatgtcgata gatatcctgc taattccatt gtttgtagat ttgacactag agtgctatct 19260 aaccttaact tgcctggttg tgatggtggc agtttgtatg taaataaaca tgcattccac 19320 acaccagctt ttgataaaag tgcttttgtt aatttaaaac aattaccatt tttctattac 19380 tctgacagtc catgtgagtc tcatggaaaa caagtagtgt cagatataga ttatgtacca 19440 ctaaagtctg ctacgtgtat aacacgttgc aatttaggtg gtgctgtctg tagacatcat 19500 gctaatgagt acagattgta tctcgatgct tataacatga tgatctcagc tggctttagc 19560 ttgtgggttt acaaacaatt tgatacttat aacctctgga acacttttac aagacttcag 19620 agtttagaaa atgtggcttt taatgttgta aataagggac actttgatgg acaacagggt 19680 gaagtaccag tttctatcat taataacact gtttacacaa aagttgatgg tgttgatgta 19740 gaattgtttg aaaataaaac aacattacct gttaatgtag catttgagct ttgggctaag 19800 cgcaacatta aaccagtacc agaggtgaaa atactcaata atttgggtgt ggacattgct 19860 gctaatactg tgatctggga ctacaaaaga gatgctccag cacatatatc tactattggt 19920 gtttgttcta tgactgacat agccaagaaa ccaactgaaa cgatttgtgc accactcact 19980 gtcttttttg atggtagagt tgatggtcaa gtagacttat ttagaaatgc ccgtaatggt 20040 gttcttatta cagaaggtag tgttaaaggt ttacaaccat ctgtaggtcc caaacaagct 20100 agtcttaatg gagtcacatt aattggagaa gccgtaaaaa cacagttcaa ttattataag 20160 aaagttgatg gtgttgtcca acaattacct gaaacttact ttactcagag tagaaattta 20220 caagaattta aacccaggag tcaaatggaa attgatttct tagaattagc tatggatgaa 20280 ttcattgaac ggtataaatt agaaggctat gccttcgaac atatcgttta tggagatttt 20340 agtcatagtc agttaggtgg tttacatcta ctgattggac tagctaaacg ttttaaggaa 20400 tcaccttttg aattagaaga ttttattcct atggacagta cagttaaaaa ctatttcata 20460 acagatgcgc aaacaggttc atctaagtgt gtgtgttctg ttattgattt attacttgat 20520 gattttgttg aaataataaa atcccaagat ttatctgtag tttctaaggt tgtcaaagtg 20580 actattgact atacagaaat ttcatttatg ctttggtgta aagatggcca tgtagaaaca 20640 ttttacccaa aattacaatc tagtcaagcg tggcaaccgg gtgttgctat gcctaatctt 20700 tacaaaatgc aaagaatgct attagaaaag tgtgaccttc aaaattatgg tgatagtgca 20760 acattaccta aaggcataat gatgaatgtc gcaaaatata ctcaactgtg tcaatattta 20820 aacacattaa cattagctgt accctataat atgagagtta tacattttgg tgctggttct 20880 gataaaggag ttgcaccagg tacagctgtt ttaagacagt ggttgcctac gggtacgctg 20940 cttgtcgatt cagatcttaa tgactttgtc tctgatgcag attcaacttt gattggtgat 21000 tgtgcaactg tacatacagc taataaatgg gatctcatta ttagtgatat gtacgaccct 21060 aagactaaaa atgttacaaa agaaaatgac tctaaagagg gttttttcac ttacatttgt 21120 gggtttatac aacaaaagct agctcttgga ggttccgtgg ctataaagat aacagaacat 21180 tcttggaatg ctgatcttta taagctcatg ggacacttcg catggtggac agcctttgtt 21240 actaatgtga atgcgtcatc atctgaagca tttttaattg gatgtaatta tcttggcaaa 21300 ccacgcgaac aaatagatgg ttatgtcatg catgcaaatt acatattttg gaggaataca 21360 aatccaattc agttgtcttc ctattcttta tttgacatga gtaaatttcc ccttaaatta 21420 aggggtactg ctgttatgtc tttaaaagaa ggtcaaatca atgatatgat tttatctctt 21480 cttagtaaag gtagacttat aattagagaa aacaacagag ttgttatttc tagtgatgtt 21540 cttgttaaca actaaacgaa caatgtttgt ttttcttgtt ttattgccac tagtctctag 21600 tcagtgtgtt aatcttacaa ccagaactca attaccccct gcatacacta attctttcac 21660 acgtggtgtt tattaccctg acaaagtttt cagatcctca gttttacatt caactcagga 21720 cttgttctta cctttctttt ccaatgttac ttggttccat gctatacatg tctctgggac 21780 caatggtact aagaggtttg ataaccctgt cctaccattt aatgatggtg tttattttgc 21840 ttccactgag aagtctaaca taataagagg ctggattttt ggtactactt tagattcgaa 21900 gacccagtcc ctacttattg ttaataacgc tactaatgtt gttattaaag tctgtgaatt 21960 tcaattttgt aatgatccat ttttgggtgt ttattaccac aaaaacaaca aaagttggat 22020 ggaaagtgag ttcagagttt attctagtgc gaataattgc acttttgaat atgtctctca 22080 gccttttctt atggaccttg aaggaaaaca gggtaatttc aaaaatctta gggaatttgt 22140 gtttaagaat attgatggtt attttaaaat atattctaag cacacgccta ttaatttagt 22200 gcgtgatctc cctcagggtt tttcggcttt agaaccattg gtagatttgc caataggtat 22260 taacatcact aggtttcaaa ctttacttgc tttacataga agttatttga ctcctggtga 22320 ttcttcttca ggttggacag ctggtgctgc agcttattat gtgggttatc ttcaacctag 22380 gacttttcta ttaaaatata atgaaaatgg aaccattaca gatgctgtag actgtgcact 22440 tgaccctctc tcagaaacaa agtgtacgtt gaaatccttc actgtagaaa aaggaatcta 22500 tcaaacttct aactttagag tccaaccaac agaatctatt gttagatttc ctaatattac 22560 aaacttgtgc ccttttggtg aagtttttaa cgccaccaga tttgcatctg tttatgcttg 22620 gaacaggaag agaatcagca actgtgttgc tgattattct gtcctatata attccgcatc 22680 attttccact tttaagtgtt atggagtgtc tcctactaaa ttaaatgatc tctgctttac 22740 taatgtctat gcagattcat ttgtaattag aggtgatgaa gtcagacaaa tcgctccagg 22800 gcaaactgga aagattgctg attataatta taaattacca gatgatttta caggctgcgt 22860 tatagcttgg aattctaaca atcttgattc taaggttggt ggtaattata attacctgta 22920 tagattgttt aggaagtcta atctcaaacc ttttgagaga gatatttcaa ctgaaatcta 22980 tcaggccggt agcacacctt gtaatggtgt tgaaggtttt aattgttact ttcctttaca 23040 atcatatggt ttccaaccca ctaatggtgt tggttaccaa ccatacagag tagtagtact 23100 ttcttttgaa cttctacatg caccagcaac tgtttgtgga cctaaaaagt ctactaattt 23160 ggttaaaaac aaatgtgtca atttcaactt caatggttta acaggcacag gtgttcttac 23220 tgagtctaac aaaaagtttc tgcctttcca acaatttggc agagacattg ctgacactac 23280 tgatgctgtc cgtgatccac agacacttga gattcttgac attacaccat gttcttttgg 23340 tggtgtcagt gttataacac caggaacaaa tacttctaac caggttgctg ttctttatca 23400 ggatgttaac tgcacagaag tccctgttgc tattcatgca gatcaactta ctcctacttg 23460 gcgtgtttat tctacaggtt ctaatgtttt tcaaacacgt gcaggctgtt taataggggc 23520 tgaacatgtc aacaactcat atgagtgtga catacccatt ggtgcaggta tatgcgctag 23580 ttatcagact cagactaatt ctcctcggcg ggcacgtagt gtagctagtc aatccatcat 23640 tgcctacact atgtcacttg gtgcagaaaa ttcagttgct tactctaata actctattgc 23700 catacccaca aattttacta ttagtgttac cacagaaatt ctaccagtgt ctatgaccaa 23760 gacatcagta gattgtacaa tgtacatttg tggtgattca actgaatgca gcaatctttt 23820 gttgcaatat ggcagttttt gtacacaatt aaaccgtgct ttaactggaa tagctgttga 23880 acaagacaaa aacacccaag aagtttttgc acaagtcaaa caaatttaca aaacaccacc 23940 aattaaagat tttggtggtt ttaatttttc acaaatatta ccagatccat caaaaccaag 24000 caagaggtca tttattgaag atctactttt caacaaagtg acacttgcag atgctggctt 24060 catcaaacaa tatggtgatt gccttggtga tattgctgct agagacctca tttgtgcaca 24120 aaagtttaac ggccttactg ttttgccacc tttgctcaca gatgaaatga ttgctcaata 24180 cacttctgca ctgttagcgg gtacaatcac ttctggttgg acctttggtg caggtgctgc 24240 attacaaata ccatttgcta tgcaaatggc ttataggttt aatggtattg gagttacaca 24300 gaatgttctc tatgagaacc aaaaattgat tgccaaccaa tttaatagtg ctattggcaa 24360 aattcaagac tcactttctt ccacagcaag tgcacttgga aaacttcaag atgtggtcaa 24420 ccaaaatgca caagctttaa acacgcttgt taaacaactt agctccaatt ttggtgcaat 24480 ttcaagtgtt ttaaatgata tcctttcacg tcttgacaaa gttgaggctg aagtgcaaat 24540 tgataggttg atcacaggca gacttcaaag tttgcagaca tatgtgactc aacaattaat 24600 tagagctgca gaaatcagag cttctgctaa tcttgctgct actaaaatgt cagagtgtgt 24660 acttggacaa tcaaaaagag ttgatttttg tggaaagggc tatcatctta tgtccttccc 24720 tcagtcagca cctcatggtg tagtcttctt gcatgtgact tatgtccctg cacaagaaaa 24780 gaacttcaca actgctcctg ccatttgtca tgatggaaaa gcacactttc ctcgtgaagg 24840 tgtctttgtt tcaaatggca cacactggtt tgtaacacaa aggaattttt atgaaccaca 24900 aatcattact acagacaaca catttgtgtc tggtaactgt gatgttgtaa taggaattgt 24960 caacaacaca gtttatgatc ctttgcaacc tgaattagac tcattcaagg aggagttaga 25020 taaatatttt aagaatcata catcaccaga tgttgattta ggtgacatct ctggcattaa 25080 tgcttcagtt gtaaacattc aaaaagaaat tgaccgcctc aatgaggttg ccaagaattt 25140 aaatgaatct ctcatcgatc tccaagaact tggaaagtat gagcagtata taaaatggcc 25200 atggtacatt tggctaggtt ttatagctgg cttgattgcc atagtaatgg tgacaattat 25260 gctttgctgt atgaccagtt gctgtagttg tctcaagggc tgttgttctt gtggatcctg 25320 ctgcaaattt gatgaagacg actctgagcc agtgctcaaa ggagtcaaat tacattacac 25380 ataaacgaac ttatggattt gtttatgaga atcttcacaa ttggaactgt aactttgaag 25440 caaggtgaaa tcaaggatgc tactccttca gattttgttc gcgctactgc aacgataccg 25500 atacaagcct cactcccttt cggatggctt attgttggcg ttgcacttct tgctgttttt 25560 cagagcgctt ccaaaatcat aaccctcaaa aagagatggc aactagcact ctccaagggt 25620 gttcactttg tttgcaactt gctgttgttg tttgtaacag tttactcaca ccttttgctc 25680 gttgctgctg gccttgaagc cccttttctc tatctttatg ctttagtcta cttcttgcag 25740 agtataaact ttgtaagaat aataatgagg ctttggcttt gctggaaatg ccgttccaaa 25800 aacccattac tttatgatgc caactatttt ctttgctggc atactaattg ttacgactat 25860 tgtatacctt acaatagtgt aacttcttca attgtcatta cttcaggtga tggcacaaca 25920 agtcctattt ctgaacatga ctaccagatt ggtggttata ctgaaaaatg ggaatctgga 25980 gtaaaagact gtgttgtatt acacagttac ttcacttcag actattacca gctgtactca 26040 actcaattga gtacagacac tggtgttgaa catgttacct tcttcatcta caataaaatt 26100 ttgatgagcc tgaagaacat gtccaaattc acacaatcga cggttcatcc ggagttgtta 26160 atccagtaat ggaaccaatt tatgatgaac cgacgacgac tactagcgtg cctttgtaag 26220 cacaagctga tgagtacgaa cttatgtact cattcgtttc ggaagagaca ggtacgttaa 26280 tagttaatag cgtacttctt tttcttgctt tcgtggtatt cttgctagtt acactagcca 26340 tccttactgc gcttcgattg tgtgcgtact gctgcaatat tgttaacgtg agtcttgtaa 26400 aaccttcttt ttacgtttac tctcgtgtta aaaatctgaa ttcttctaga gttcctgatc 26460 ttctggtcta aacgaactaa atattatatt agtttttctg tttggaactt taattttagc 26520 catggcagat tccaacggta ctattaccgt tgaagagctt aaaaagctcc ttgaacaatg 26580 gaacctagta ataggtttcc tattccttac atggatttgt cttctacaat ttgcctatgc 26640 caacaggaat aggtttttgt atataattaa gttaattttc ctctggctgt tatggccagt 26700 aactttagct tgttttgtgc ttgctgctgt ttacagaata aattggatca ccggtggaat 26760 tgctatcgca atggcttgtc ttgtaggctt gatgtggctc agctacttca ttgcttcttt 26820 cagactgttt gcgcgtacgc gttccatgtg gtcattcaat ccagaaacta acattcttct 26880 caacgtgcca ctccatggca ctattctgac cagaccgctt ctagaaagtg aactcgtaat 26940 cggagctgtg atccttcgtg gacatcttcg tattgctgga caccatctag gacgctgtga 27000 catcaaggac ctgcctaaag aaatcactgt tgctacatca cgaacgcttt cttattacaa 27060 attgggagct tcgcagcgtg tagcaggtga ctcaggtttt gctgcataca gtcgctacag 27120 gattggcaac tataaattaa acacagacca ttccagtagc agtgacaata ttgctttgct 27180 tgtacagtaa gtgacaacag atgtttcatc tcgttgactt tcaggttact atagcagaga 27240 tattactaat tattatgagg acttttaaag tttccatttg gaatcttgat tacatcataa 27300 acctcataat taaaaattta tctaagtcac taactgagaa taaatattct caattagatg 27360 aagagcaacc aatggagatt gattaaacga acatgaaaat tattcttttc ttggcactga 27420 taacactcgc tacttgtgag ctttatcact accaagagtg tgttagaggt acaacagtac 27480 ttttaaaaga accttgctct tctggaacat acgagggcaa ttcaccattt catcctctag 27540 ctgataacaa atttgcactg acttgcttta gcactcaatt tgcttttgct tgtcctgacg 27600 gcgtaaaaca cgtctatcag ttacgtgcca gatcagtttc acctaaactg ttcatcagac 27660 aagaggaagt tcaagaactt tactctccaa tttttcttat tgttgcggca atagtgttta 27720 taacactttg cttcacactc aaaagaaaga cagaatgatt gaactttcat taattgactt 27780 ctatttgtgc tttttagcct ttctgctatt ccttgtttta attatgctta ttatcttttg 27840 gttctcactt gaactgcaag atcataatga aacttgtcac gcctaaacga acatgaaatt 27900 tcttgttttc ttaggaatca tcacaactgt agctgcattt caccaagaat gtagtttaca 27960 gtcatgtact caacatcaac catatgtagt tgatgacccg tgtcctattc acttctattc 28020 taaatggtat attagagtag gagctagaaa atcagcacct ttaattgaat tgtgcgtgga 28080 tgaggctggt tctaaatcac ccattcagta catcgatatc ggtaattata cagtttcctg 28140 tttacctttt acaattaatt gccaggaacc taaattgggt agtcttgtag tgcgttgttc 28200 gttctatgaa gactttttag agtatcatga cgttcgtgtt gttttagatt tcatctaaac 28260 gaacaaacta aaatgtctga taatggaccc caaaatcagc gaaatgcacc ccgcattacg 28320 tttggtggac cctcagattc aactggcagt aaccagaatg gagaacgcag tggggcgcga 28380 tcaaaacaac gtcggcccca aggtttaccc aataatactg cgtcttggtt caccgctctc 28440 actcaacatg gcaaggaaga ccttaaattc cctcgaggac aaggcgttcc aattaacacc 28500 aatagcagtc cagatgacca aattggctac taccgaagag ctaccagacg aattcgtggt 28560 ggtgacggta aaatgaaaga tctcagtcca agatggtatt tctactacct aggaactggg 28620 ccagaagctg gacttcccta tggtgctaac aaagacggca tcatatgggt tgcaactgag 28680 ggagccttga atacaccaaa agatcacatt ggcacccgca atcctgctaa caatgctgca 28740 atcgtgctac aacttcctca aggaacaaca ttgccaaaag gcttctacgc agaagggagc 28800 agaggcggca gtcaagcctc ttctcgttcc tcatcacgta gtcgcaacag ttcaagaaat 28860 tcaactccag gcagcagtag gggaacttct cctgctagaa tggctggcaa tggcggtgat 28920 gctgctcttg ctttgctgct gcttgacaga ttgaaccagc ttgagagcaa aatgtctggt 28980 aaaggccaac aacaacaagg ccaaactgtc actaagaaat ctgctgctga ggcttctaag 29040 aagcctcggc aaaaacgtac tgccactaaa gcatacaatg taacacaagc tttcggcaga 29100 cgtggtccag aacaaaccca aggaaatttt ggggaccagg aactaatcag acaaggaact 29160 gattacaaac attggccgca aattgcacaa tttgccccca gcgcttcagc gttcttcgga 29220 atgtcgcgca ttggcatgga agtcacacct tcgggaacgt ggttgaccta cacaggtgcc 29280 atcaaattgg atgacaaaga tccaaatttc aaagatcaag tcattttgct gaataagcat 29340 attgacgcat acaaaacatt cccaccaaca gagcctaaaa aggacaaaaa gaagaaggct 29400 gatgaaactc aagccttacc gcagagacag aagaaacagc aaactgtgac tcttcttcct 29460 gctgcagatt tggatgattt ctccaaacaa ttgcaacaat ccatgagcag tgctgactca 29520 actcaggcct aaactcatgc agaccacaca aggcagatgg gctatataaa cgttttcgct 29580 tttccgttta cgatatatag tctactcttg tgcagaatga attctcgtaa ctacatagca 29640 caagtagatg tagttaactt taatctcaca tagcaatctt taatcagtgt gtaacattag 29700 ggaggacttg aaagagccac cacattttca ccgaggccac gcggagtacg atcgagtgta 29760 cagtgaacaa tgctagggag agctgcctat atggaagagc cctaatgtgt aaaattaatt 29820 ttagtagtgc tatccccatg tgattttaat agcttcttag gagaatgaca aaaaaaaaaa 29880 aaaaaaaaaa aaaaaaaaaa aa 29902 <210> 5 <211> 29903 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 5 tttttttttt tttttttttt tttttttttt tttgtcattc tcctaagaag ctattaaaat 60 cacatgggga tagcactact aaaattaatt ttacacatta gggctcttcc atataggcag 120 ctctccctag cattgttcac tgtacactcg atcgtactcc gcgtggcctc ggtgaaaatg 180 tggtggctct ttcaagtcct ccctaatgtt acacactgat taaagattgc tatgtgagat 240 taaagttaac tacatctact tgtgctatgt agttacgaga attcattctg cacaagagta 300 gactatatat cgtaaacgga aaagcgaaaa cgtttatata gcccatctgc cttgtgtggt 360 ctgcatgagt ttaggcctga gttgagtcag cactgctcat ggattgttgc aattgtttgg 420 agaaatcatc caaatctgca gcaggaagaa gagtcacagt ttgctgtttc ttctgtctct 480 gcggtaaggc ttgagtttca tcagccttct tctttttgtc ctttttaggc tctgttggtg 540 ggaatgtttt gtatgcgtca atatgcttat tcagcaaaat gacttgatct ttgaaatttg 600 gatctttgtc atccaatttg atggcacctg tgtaggtcaa ccacgttccc gaaggtgtga 660 cttccatgcc aatgcgcgac attccgaaga acgctgaagc gctgggggca aattgtgcaa 720 tttgcggcca atgtttgtaa tcagttcctt gtctgattag ttcctggtcc ccaaaatttc 780 cttgggtttg ttctggacca cgtctgccga aagcttgtgt tacattgtat gctttagtgg 840 cagtacgttt ttgccgaggc ttcttagaag cctcagcagc agatttctta gtgacagttt 900 ggccttgttg ttgttggcct ttaccagaca ttttgctctc aagctggttc aatctgtcaa 960 gcagcagcaa agcaagagca gcatcaccgc cattgccagc cattctagca ggagaagttc 1020 ccctactgct gcctggagtt gaatttcttg aactgttgcg actacgtgat gaggaacgag 1080 aagaggcttg actgccgcct ctgctccctt ctgcgtagaa gccttttggc aatgttgttc 1140 cttgaggaag ttgtagcacg attgcagcat tgttagcagg attgcgggtg ccaatgtgat 1200 cttttggtgt attcaaggct ccctcagttg caacccatat gatgccgtct ttgttagcac 1260 catagggaag tccagcttct ggcccagttc ctaggtagta gaaataccat cttggactga 1320 gatctttcat tttaccgtca ccaccacgaa ttcgtctggt agctcttcgg tagtagccaa 1380 tttggtcatc tggactgcta ttggtgttaa ttggaacgcc ttgtcctcga gggaatttaa 1440 ggtcttcctt gccatgttga gtgagagcgg tgaaccaaga cgcagtatta ttgggtaaac 1500 cttggggccg acgttgtttt gatcgcgccc cactgcgttc tccattctgg ttactgccag 1560 ttgaatctga gggtccacca aacgtaatgc ggggtgcatt tcgctgattt tggggtccat 1620 tatcagacat tttagtttgt tcgtttagat gaaatctaaa acaacacgaa cgtcatgata 1680 ctctaaaaag tcttcataga acgaacaacg cactacaaga ctacccaatt taggttcctg 1740 gcaattaatt gtaaaaggta aacaggaaac tgtataatta ccgatatcga tgtactgaat 1800 gggtgattta gaaccagcct catccacgca caattcaatt aaaggtgctg attttctagc 1860 tcctactcta atataccatt tagaatagaa gtgaatagga cacgggtcat caactacata 1920 tggttgatgt tgagtacatg actgtaaact acattcttgg tgaaatgcag ctacagttgt 1980 gatgattcct aagaaaacaa gaaatttcat gttcgtttag gcgtgacaag tttcattatg 2040 atcttgcagt tcaagtgaga accaaaagat aataagcata attaaaacaa ggaatagcag 2100 aaaggctaaa aagcacaaat agaagtcaat taatgaaagt tcaatcattc tgtctttctt 2160 ttgagtgtga agcaaagtgt tataaacact attgccgcaa caataagaaa aattggagag 2220 taaagttctt gaacttcctc ttgtctgatg aacagtttag gtgaaactga tctggcacgt 2280 aactgataga cgtgttttac gccgtcagga caagcaaaag caaattgagt gctaaagcaa 2340 gtcagtgcaa atttgttatc agctagagga tgaaatggtg aattgccctc gtatgttcca 2400 gaagagcaag gttcttttaa aagtactgtt gtacctctaa cacactcttg gtagtgataa 2460 agctcacaag tagcgagtgt tatcagtgcc aagaaaagaa taattttcat gttcgtttaa 2520 tcaatctcca ttggttgctc ttcatctaat tgagaatatt tattctcagt tagtgactta 2580 gataaatttt taattatgag gtttatgatg taatcaagat tccaaatgga aactttaaaa 2640 gtcctcataa taattagtaa tatctctgct atagtaacct gaaagtcaac gagatgaaac 2700 atctgttgtc acttactgta caagcaaagc aatattgtca ctgctactgg aatggtctgt 2760 gtttaattta tagttgccaa tcctgtagcg actgtatgca gcaaaacctg agtcacctgc 2820 tacacgctgc gaagctccca atttgtaata agaaagcgtt cgtgatgtag caacagtgat 2880 ttctttaggc aggtccttga tgtcacagcg tcctagatgg tgtccagcaa tacgaagatg 2940 tccacgaagg atcacagctc cgattacgag ttcactttct agaagcggtc tggtcagaat 3000 agtgccatgg agtggcacgt tgagaagaat gttagtttct ggattgaatg accacatgga 3060 acgcgtacgc gcaaacagtc tgaaagaagc aatgaagtag ctgagccaca tcaagcctac 3120 aagacaagcc attgcgatag caattccacc ggtgatccaa tttattctgt aaacagcagc 3180 aagcacaaaa caagctaaag ttactggcca taacagccag aggaaaatta acttaattat 3240 atacaaaaac ctattcctgt tggcataggc aaattgtaga agacaaatcc atgtaaggaa 3300 taggaaacct attactaggt tccattgttc aaggagcttt ttaagctctt caacggtaat 3360 agtaccgttg gaatctgcca tggctaaaat taaagttcca aacagaaaaa ctaatataat 3420 atttagttcg tttagaccag aagatcagga actctagaag aattcagatt tttaacacga 3480 gagtaaacgt aaaaagaagg ttttacaaga ctcacgttaa caatattgca gcagtacgca 3540 cacaatcgaa gcgcagtaag gatggctagt gtaactagca agaataccac gaaagcaaga 3600 aaaagaagta cgctattaac tattaacgta cctgtctctt ccgaaacgaa tgagtacata 3660 agttcgtact catcagcttg tgcttacaaa ggcacgctag tagtcgtcgt cggttcatca 3720 taaattggtt ccattactgg attaacaact ccggatgaac cgtcgattgt gtgaatttgg 3780 acatgttctt caggctcatc aacaatttta ttgtagatga agaaggtaac atgttcaaca 3840 ccagtgtctg tactcaattg agttgagtac agctggtaat agtctgaagt gaagtaactg 3900 tgtaatacaa cacagtcttt tactccagat tcccattttt cagtataacc accaatctgg 3960 tagtcatgtt cagaaatagg acttgttgtg ccatcacctg aagtaatgac aattgaagaa 4020 gttacactat tgtaaggtat acaatagtcg taacaattag tatgccagca aagaaaatag 4080 ttggcatcat aaagtaatgg gtttttggaa cggcatttcc agcaaagcca aagcctcatt 4140 attattctta caaagtttat actctgcaag aagtagacta aagcataaag atagagaaaa 4200 ggggcttcaa ggccagcagc aacgagcaaa aggtgtgagt aaactgttac aaacaacaac 4260 agcaagttgc aaacaaagtg aacacccttg gagagtgcta gttgccatct ctttttgagg 4320 gttatgattt tggaagcgct ctgaaaaaca gcaagaagtg caacgccaac aataagccat 4380 ccgaaaggga gtgaggcttg tatcggtatc gttgcagtag cgcgaacaaa atctgaagga 4440 gtagcatcct tgatttcacc ttgcttcaaa gttacagttc caattgtgaa gattctcata 4500 aacaaatcca taagttcgtt tatgtgtaat gtaatttgac tcctttgagc actggctcag 4560 agtcgtcttc atcaaatttg cagcaggatc cacaagaaca acagcccttg agacaactac 4620 agcaactggt catacagcaa agcataattg tcaccattac tatggcaatc aagccagcta 4680 taaaacctag ccaaatgtac catggccatt ttatatactg ctcatacttt ccaagttctt 4740 ggagatcgat gagagattca tttaaattct tggcaacctc attgaggcgg tcaatttctt 4800 tttgaatgtt tacaactgaa gcattaatgc cagagatgtc acctaaatca acatctggtg 4860 atgtatgatt cttaaaatat ttatctaact cctccttgaa tgagtctaat tcaggttgca 4920 aaggatcata aactgtgttg ttgacaattc ctattacaac atcacagtta ccagacacaa 4980 atgtgttgtc tgtagtaatg atttgtggtt cataaaaatt cctttgtgtt acaaaccagt 5040 gtgtgccatt tgaaacaaag acaccttcac gaggaaagtg tgcttttcca tcatgacaaa 5100 tggcaggagc agttgtgaag ttcttttctt gtgcagggac ataagtcaca tgcaagaaga 5160 ctacaccatg aggtgctgac tgagggaagg acataagatg atagcccttt ccacaaaaat 5220 caactctttt tgattgtcca agtacacact ctgacatttt agtagcagca agattagcag 5280 aagctctgat ttctgcagct ctaattaatt gttgagtcac atatgtctgc aaactttgaa 5340 gtctgcctgt gatcaaccta tcaatttgca cttcagcctc aactttgtca agacgtgaaa 5400 ggatatcatt taaaacactt gaaattgcac caaaattgga gctaagttgt ttaacaagcg 5460 tgtttaaagc ttgtgcattt tggttgacca catcttgaag ttttccaagt gcacttgctg 5520 tggaagaaag tgagtcttga attttgccaa tagcactatt aaattggttg gcaatcaatt 5580 tttggttctc atagagaaca ttctgtgtaa ctccaatacc attaaaccta taagccattt 5640 gcatagcaaa tggtatttgt aatgcagcac ctgcaccaaa ggtccaacca gaagtgattg 5700 tacccgctaa cagtgcagaa gtgtattgag caatcatttc atctgtgagc aaaggtggca 5760 aaacagtaag gccgttaaac ttttgtgcac aaatgaggtc tctagcagca atatcaccaa 5820 ggcaatcacc atattgtttg atgaagccag catctgcaag tgtcactttg ttgaaaagta 5880 gatcttcaat aaatgacctc ttgcttggtt ttgatggatc tggtaatatt tgtgaaaaat 5940 taaaaccacc aaaatcttta attggtggtg ttttgtaaat ttgtttgact tgtgcaaaaa 6000 cttcttgggt gtttttgtct tgttcaacag ctattccagt taaagcacgg tttaattgtg 6060 tacaaaaact gccatattgc aacaaaagat tgctgcattc agttgaatca ccacaaatgt 6120 acattgtaca atctactgat gtcttggtca tagacactgg tagaatttct gtggtaacac 6180 taatagtaaa atttgtgggt atggcaatag agttattaga gtaagcaact gaattttctg 6240 caccaagtga catagtgtag gcaatgatgg attgactagc tacactacgt gcccgccgag 6300 gagaattagt ctgagtctga taactagcgc atatacctgc accaatgggt atgtcacact 6360 catatgagtt gttgacatgt tcagccccta ttaaacagcc tgcacgtgtt tgaaaaacat 6420 tagaacctgt agaataaaca cgccaagtag gagtaagttg atctgcatga atagcaacag 6480 ggacttctgt gcagttaaca tcctgataaa gaacagcaac ctggttagaa gtatttgttc 6540 ctggtgttat aacactgaca ccaccaaaag aacatggtgt aatgtcaaga atctcaagtg 6600 tctgtggatc acggacagca tcagtagtgt cagcaatgtc tctgccaaat tgttggaaag 6660 gcagaaactt tttgttagac tcagtaagaa cacctgtgcc tgttaaacca ttgaagttga 6720 aattgacaca tttgttttta accaaattag tagacttttt aggtccacaa acagttgctg 6780 gtgcatgtag aagttcaaaa gaaagtacta ctactctgta tggttggtaa ccaacaccat 6840 tagtgggttg gaaaccatat gattgtaaag gaaagtaaca attaaaacct tcaacaccat 6900 tacaaggtgt gctaccggcc tgatagattt cagttgaaat atctctctca aaaggtttga 6960 gattagactt cctaaacaat ctatacaggt aattataatt accaccaacc ttagaatcaa 7020 gattgttaga attccaagct ataacgcagc ctgtaaaatc atctggtaat ttataattat 7080 aatcagcaat ctttccagtt tgccctggag cgatttgtct gacttcatca cctctaatta 7140 caaatgaatc tgcatagaca ttagtaaagc agagatcatt taatttagta ggagacactc 7200 cataacactt aaaagtggaa aatgatgcgg aattatatag gacagaataa tcagcaacac 7260 agttgctgat tctcttcctg ttccaagcat aaacagatgc aaatctggtg gcgttaaaaa 7320 cttcaccaaa agggcacaag tttgtaatat taggaaatct aacaatagat tctgttggtt 7380 ggactctaaa gttagaagtt tgatagattc ctttttctac agtgaaggat ttcaacgtac 7440 actttgtttc tgagagaggg tcaagtgcac agtctacagc atctgtaatg gttccatttt 7500 cattatattt taatagaaaa gtcctaggtt gaagataacc cacataataa gctgcagcac 7560 cagctgtcca acctgaagaa gaatcaccag gagtcaaata acttctatgt aaagcaagta 7620 aagtttgaaa cctagtgatg ttaataccta ttggcaaatc taccaatggt tctaaagccg 7680 aaaaaccctg agggagatca cgcactaaat taataggcgt gtgcttagaa tatattttaa 7740 aataaccatc aatattctta aacacaaatt ccctaagatt tttgaaatta ccctgttttc 7800 cttcaaggtc cataagaaaa ggctgagaga catattcaaa agtgcaatta ttcgcactag 7860 aataaactct gaactcactt tccatccaac ttttgttgtt tttgtggtaa taaacaccca 7920 aaaatggatc attacaaaat tgaaattcac agactttaat aacaacatta gtagcgttat 7980 taacaataag tagggactgg gtcttcgaat ctaaagtagt accaaaaatc cagcctctta 8040 ttatgttaga cttctcagtg gaagcaaaat aaacaccatc attaaatggt aggacagggt 8100 tatcaaacct cttagtacca ttggtcccag agacatgtat agcatggaac caagtaacat 8160 tggaaaagaa aggtaagaac aagtcctgag ttgaatgtaa aactgaggat ctgaaaactt 8220 tgtcagggta ataaacacca cgtgtgaaag aattagtgta tgcagggggt aattgagttc 8280 tggttgtaag attaacacac tgactagaga ctagtggcaa taaaacaaga aaaacaaaca 8340 ttgttcgttt agttgttaac aagaacatca ctagaaataa caactctgtt gttttctcta 8400 attataagtc tacctttact aagaagagat aaaatcatat cattgatttg accttctttt 8460 aaagacataa cagcagtacc ccttaattta aggggaaatt tactcatgtc aaataaagaa 8520 taggaagaca actgaattgg atttgtattc ctccaaaata tgtaatttgc atgcatgaca 8580 taaccatcta tttgttcgcg tggtttgcca agataattac atccaattaa aaatgcttca 8640 gatgatgacg cattcacatt agtaacaaag gctgtccacc atgcgaagtg tcccatgagc 8700 ttataaagat cagcattcca agaatgttct gttatcttta tagccacgga acctccaaga 8760 gctagctttt gttgtataaa cccacaaatg taagtgaaaa aaccctcttt agagtcattt 8820 tcttttgtaa catttttagt cttagggtcg tacatatcac taataatgag atcccattta 8880 ttagctgtat gtacagttgc acaatcacca atcaaagttg aatctgcatc agagacaaag 8940 tcattaagat ctgaatcgac aagcagcgta cccgtaggca accactgtct taaaacagct 9000 gtacctggtg caactccttt atcagaacca gcaccaaaat gtataactct catattatag 9060 ggtacagcta atgttaatgt gtttaaatat tgacacagtt gagtatattt tgcgacattc 9120 atcattatgc ctttaggtaa tgttgcacta tcaccataat tttgaaggtc acacttttct 9180 aatagcattc tttgcatttt gtaaagatta ggcatagcaa cacccggttg ccacgcttga 9240 ctagattgta attttgggta aaatgtttct acatggccat ctttacacca aagcataaat 9300 gaaatttctg tatagtcaat agtcactttg acaaccttag aaactacaga taaatcttgg 9360 gattttatta tttcaacaaa atcatcaagt aataaatcaa taacagaaca cacacactta 9420 gatgaacctg tttgcgcatc tgttatgaaa tagtttttaa ctgtactgtc cataggaata 9480 aaatcttcta attcaaaagg tgattcctta aaacgtttag ctagtccaat cagtagatgt 9540 aaaccaccta actgactatg actaaaatct ccataaacga tatgttcgaa ggcatagcct 9600 tctaatttat accgttcaat gaattcatcc atagctaatt ctaagaaatc aatttccatt 9660 tgactcctgg gtttaaattc ttgtaaattt ctactctgag taaagtaagt ttcaggtaat 9720 tgttggacaa caccatcaac tttcttataa taattgaact gtgtttttac ggcttctcca 9780 attaatgtga ctccattaag actagcttgt ttgggaccta cagatggttg taaaccttta 9840 acactacctt ctgtaataag aacaccatta cgggcatttc taaataagtc tacttgacca 9900 tcaactctac catcaaaaaa gacagtgagt ggtgcacaaa tcgtttcagt tggtttcttg 9960 gctatgtcag tcatagaaca aacaccaata gtagatatat gtgctggagc atctcttttg 10020 tagtcccaga tcacagtatt agcagcaatg tccacaccca aattattgag tattttcacc 10080 tctggtactg gtttaatgtt gcgcttagcc caaagctcaa atgctacatt aacaggtaat 10140 gttgttttat tttcaaacaa ttctacatca acaccatcaa cttttgtgta aacagtgtta 10200 ttaatgatag aaactggtac ttcaccctgt tgtccatcaa agtgtccctt atttacaaca 10260 ttaaaagcca cattttctaa actctgaagt cttgtaaaag tgttccagag gttataagta 10320 tcaaattgtt tgtaaaccca caagctaaag ccagctgaga tcatcatgtt ataagcatcg 10380 agatacaatc tgtactcatt agcatgatgt ctacagacag caccacctaa attgcaacgt 10440 gttatacacg tagcagactt tagtggtaca taatctatat ctgacactac ttgttttcca 10500 tgagactcac atggactgtc agagtaatag aaaaatggta attgttttaa attaacaaaa 10560 gcacttttat caaaagctgg tgtgtggaat gcatgtttat ttacatacaa actgccacca 10620 tcacaaccag gcaagttaag gttagatagc actctagtgt caaatctaca aacaatggaa 10680 ttagcaggat atctatcgac attgcaattc caaaataggc atacaccatc tgtgaatttg 10740 tcagaatgtg tggcataaga atagaataat tcttctattt tataagcttt gtcactacaa 10800 ggctgtgcat catagaactt ccattctaca tcagcttgag gtacacactt aatagcttta 10860 gggttaccaa tgtcgtgaag aactgggaat ttgtctgcta ataatgcagc tttaacaacc 10920 atgtgttgaa cctttctaca agccgcatta atcttcagtt catcaccaat tataggatat 10980 tcaatagtcc agtcaacacg cttaacaaag cactcgtgga cagctagaca cctagtcatg 11040 attgcatcac aactagctac atgtgcatta ccatggactt gacaatacag atcatggttg 11100 ctttgtaggt tacctgtaaa accccattgt tgaacatcaa tcataaacgg attatagacg 11160 taatcaaatc caatagaatg atgccaacag gcataagtgt ctgaagcagt ggaaaagcat 11220 gtggcacgtc tatcacatag acaacaggtg cgctcaggtc ctattttcac aaaatacttc 11280 atagatgtca actcaaagcc atgtgcccat aagacaaata cgactctgtc agagagattt 11340 ttaagtgtgt cacttaacat ttgtacaatc tttatacgca ctacattcca aggaagtcct 11400 ttgtacataa gtggtatgag gtgtttaaat tgatctccag gcggtggttt agcactaact 11460 ctggaaaaat ctgtattatt aggtgtatca acataacctg taggtacagc aactaggtta 11520 acacctgtag aaaaacctag ctgtaaaggt aaattggtac caacagcttc tctagtagca 11580 tgacacccct cgacatcgaa gccaatccat gcacgtacat gtcttatagc ttcttcgcgg 11640 gtgataaaca tgttagggta accattaact tgataattca ttttaaaacc catcatagag 11700 atgagtcttc tataggtcat gtccttaggt atgccaggta tgtcaacaca taaaccttca 11760 gttttgaatt tagtgtcaac actgaggtgt gtaggtgcct gtgtaggatg taacccagtg 11820 attaccttac tacaatcttt aaagagtcct gttacatttt cagcttgtaa agttgccaca 11880 ttcctacgtg gaatttcaag acttgtaaat tgcaacttgt cataaaggtc tctatcagac 11940 attatgcaaa gtatgcctac ttttgctctg gtaatagcaa cattaaatct gtttacatta 12000 caagagtgag ctgtttcagt ggtttgagtg aatatgacat agtcatattc tgagccctgt 12060 gatgaatcaa cagtttgagt tggtagtccc aaaatctttg aggctacagc attctgtgaa 12120 ttataaggtg aaataaagac agcttttctc caagcagggt tacgtgtaag gaattctctt 12180 accacgccta tttgtggcct gttaattgca gatgaaacat catgcgtgat aacaccctta 12240 taaaacattt taaagcattg agctgatttg tctttatgtg ctttaagctt attatcataa 12300 accaaagcac tcacagtgtc aacaatttca gcaggacaac gccgacaagt tccgaggaac 12360 atgtctggac ctatagtttt cataagtcta cacactgaat tgaaatattc tggttctagt 12420 gtgcccttag ttagcaatgt gcgtggtgca ggtaattgag cagggtcgcc aatgtacaca 12480 tagtgcttag cacgtaatct ggcattgaca acactcaaat cataatttgt ggccattgaa 12540 atttcatcaa agacaactat atctgctgtc gtctcaggca atgcatttac agtacaaaag 12600 acatactgtt ctaatgttga attcactttg aatttatcaa aacactctac acgagcacgt 12660 gcaggtataa ttctactaca tttatctata ggcaaatatt ttaatgcctt ctcacatagt 12720 gcatcaacag cggcatgaga gcaagctgta tacactatgc gagcagaagg gtagtagaga 12780 gctaggccaa tagcaaaatg actcttacca gtaccaggtg gtccctggag tgtagaatac 12840 ttttgcatac caaccttttg ataatttgca acattgctag aaaactcatc tgagatattg 12900 agtgttgggt ataagccagt aattctaaca tagtgctctt gtggcactag tgtaggtgca 12960 cttaatggca ttactgtatg tgatgtcagc acaaaataat caccaacatt taatttgtaa 13020 gttgttgtac ctcggtaaac aacagcatca ccatagtcac ctttttcaaa ggtgtactct 13080 cctatttgta ctttactgtt tttagttaca cgataaccag taaagacata atttcggtta 13140 agtggtggtc taggtttacc aacttcccat gaaagatgta attctctgtc agacagcact 13200 tcacgtacag tagcaatacc ataagacagt ttaaatgtct cctcagtagc tttgagcgtt 13260 tctgctgcaa aaagcttgag tctttcagta caggtgttag ctaaaatgta atcaccagca 13320 tttgtccagt cacatgttgc aattgcatta aagtcagtaa cattatcgct accaacacat 13380 gtatttttat ataaaccaaa aacttgtcca ttagcacaca atggaaaact aatgggtggt 13440 ttatgtgatt tacaataata gctcatacct cctaagtaaa gttgagtcac atctgtgaca 13500 tcacaacctg gagcattgca aacatacgga ttaacagaca agactaattt atgtgatgtt 13560 gatatgacat ggtcgtaaca gcatttacaa cataagaatg gtctacgtat gcaagcacca 13620 catcttaatg aagtctgtga attgcaaaga acacaagccc caacagcctg taagactgta 13680 tgcggtgtgt acatagcctc ataaaactca ggttcccaat accttgaagt gttatcatta 13740 gtaagcataa cagaatacat gtctaacatg tgtcctgtta actcatcatg tagctttctt 13800 atgtattgta agtacaaatg aaagacatca gcatactcct gattaggatg tttagtaagt 13860 gggtaagcat ctatagctaa agacacgaac cgttcaatca taagtgtacc atctgttttt 13920 acgatatcat ctacaaaaca gccggcccct aggattcttg atggatctgg gtaaggaagg 13980 tacacataat catcaccctg tttaactagc attgtatgtt gagagcaaaa ttcatgaggt 14040 cctttagtaa ggtcagtctc agtccaacat tttgcttcag acataaaaac attgttttga 14100 taataaagaa ctgacttaaa gttctttatg ctagccacta gaccttgaga tgcataagtg 14160 ctattgaaac acacaacagc atcgtcagag agtatcatca ttgagaaatg tttacgcaaa 14220 tatgcgtaaa actcattcac aaagtctgtg tcaacatctc tatttctata gagacactca 14280 taaagtctgt gttgtaaatt gcggacatac ttatcggcaa ttttgttacc atcagtagat 14340 aaaagtgcat taacattggc cgtgacagct tgacaaatgt taaaaacact attagcataa 14400 gcagttgtgg catctcctga tgaggttcca cctggtttaa catatagtga accgccacac 14460 atgaccattt cactcaatac ttgagcacac tcattagcta atctatagaa acggtgtgac 14520 aagctacaac acgttgtatg tttgcgagca agaacaagtg aggccataat tctaagcatg 14580 ttaggcatgg ctctatcaca tttaggataa tcccaaccca taaggtgagg gttttctaca 14640 tcactataaa cagtttttaa catgttgtgc caaccaccat agaatttgct tgttccaatt 14700 actacagtag ctcctctagt ggcggctatt gatttcaata atttttgatg aaactgtcta 14760 ttggtcatag tactacagat agagacacca gctacggtgc gagctctatt ctttgcacta 14820 atggcatact taagattcat ttgagttata gtagggatga cattacgttt tgtatatgcg 14880 aaaagtgcat cttgatcctc ataactcatt gaatcataat aaagtctagc cttaccccat 14940 ttattaaatg gaaaaccagc tgatttgtct aggttgttga cgatgacttg gttagcatta 15000 atacagccac catcgtaaca atcaaagtac ttatcaacaa cttcaactac aaatagtagt 15060 tgtctgatat cacacattgt tggtagatta taacgatagt agtcataatc gctgatagca 15120 gcattaccat cctgagcaaa gaagaagtgt tttaattcaa cagaacttcc ttccttaaag 15180 aaacccttag acacagcaaa gtcatagaag tctttgttaa aattaccggg tttgacagtt 15240 tgaaaagcaa cattgttagt aagtgcagct actgaaaagc acgtagtgcg tttatctagt 15300 aatagattac cagaagcagc gtgcatagca gggtcagcag catacacaag taattcctta 15360 aaactaagtc tagagctatg taagtttaca tcctgattat gtacaacacc tagctctctg 15420 aagtggtatc cagttgaaac tacaaatgga acaccatcaa caaatatttt tctcactagt 15480 ggtccaaaac ttgtaggtgg gaacactgta gagaataaaa cattaaagtt tgcacaatgc 15540 agaatgcatc tgtcatccaa acagttaaca caatttgggt ggtatgtctg atcccaatat 15600 ttaaaataac ggtcaaagag ttttaacctc tcttccgtga agtcatattt taacaaatcc 15660 cacttaatgt aaggctttgt taagtcagtg tcaacatgtg actctgcagt taaagccctg 15720 gtcaaggtta atataggcat taacaatgaa taataagaat ctacaacagg aactccacta 15780 cctggcgtgg tttgtatgaa atcaccgaaa tcataccagt taccattgag atcttgatta 15840 tctaatgtca gtacaccaac aataccagca tttcgcatgg catcacagaa ttgtactgtt 15900 tttaacaaag cttggcgtac acgttcacct aagttggcgt atacgcgtaa tatatctggg 15960 ttttctacaa aatcatacca gtccttttta ttgaaataat catcatcaca acaattgtat 16020 gtgacaagta tttcttttaa tgtgtcacaa ttaccttcat caaaatgcct taaagcatag 16080 acgaggtctg ccattgtgta tttagtaaga cgttgacgtg atatatgtgg taccatgtca 16140 ccgtctattc taaacttaaa gaagtcatgt ttagcaacag ctggacaatc cttaagtaaa 16200 ttataaattg tttcttcatg ttggtagtta gagaaagtgt gtctcttaac tacaaagtaa 16260 gaatcaatta aattgtcatc ttcgtccttt tcttggaagc gacaacaatt agtttttagg 16320 aatttagcaa aaccagctac tttatcattg tagatgtcaa aagccctgta tacgacatca 16380 gtactagtgc ctgtgccgca cggtgtaaga cgggctgcac ttacaccgca aacccgttta 16440 aaaacgattg tgcatcagct gactgaagca tgggttcgcg gagttgatca caactacagc 16500 cataaccttt ccacataccg cagacggtac agactgtgtt tttaagtgta aaacccacag 16560 ggtcattagc acaagttgta ggtatttgta catacttacc ttttaagtca caaaatcctt 16620 taggatttgg atgatctatg tggcaacggc agtacagaca acacgatgca ccaccaaagg 16680 attcttgatc catattggct tccggtgtaa ctgttattgc ctgaccagta ccagtgtgtg 16740 tacacaacat cttaacacaa ttagtgattg gttgtccccc actagctaga taatctttgt 16800 aagctttagc agcatctaca gcaaaagcac agaaagataa tacagttgaa ttggcaggca 16860 cttctgttgc attaccagct tgtagacgta ctgtggcagc taaactacca agtaccatac 16920 ctctatttag gttgtttaat cctttaataa agtataaata cttcacttta ggacctttag 16980 gtgtgtctgt aacaaaccta caaggtggtt ccagttctgt atagatagta ccagttccat 17040 cactcttagg gaatctagcc catttcaaat cctgtaaatc ggataacagt gcaagtacaa 17100 acctacctcc ctttgttgtg ttgtagtaag ctaacgcatt gtcatcagtg caagcagttt 17160 gtgtagtacc ggcagcacaa gacatctgtc gtagtgcaac aggactaagc tcattattct 17220 gtaatttgac agcagaattg gcccttaaag ctgttacaat aagaggccat gctaaattag 17280 gtgaattgtc catactaatt tcactaagtt gaacaatttt actatctgca tctacaacct 17340 gttggatttc ccacaatgct gatgcataag taaatgttgt accatcacac gtatttttat 17400 atgtgttata gtctggtatg acaaccatta gtttggctgc tgttgtaaga ggtattatgt 17460 tcaagggaac acaaccatct cttgcattgt tgataatgtt gttgagtgca tcattatcca 17520 actttctaag catagtgaaa agcattgtct gcatagcact agtaactttt gccctcttgt 17580 cctcagatct agcctgttta tacatttggg tcatagcttg atcagccatc ttttccaact 17640 tacgttgcat ggctgcatca cggtcaaatt cagatttagc cacattcaaa gacttcttca 17700 actttttaag aacaacttca gaatcaccat tagcaacagc ctgctcataa gcttcttgag 17760 cagtagcaaa agctgcatat gatggaaggg aactaaactc tgaggctata gcttgtaagg 17820 ttgccctgtt gtccagcatt tcttcacaaa gcttgtttat gtctacagca ccctgcatgg 17880 aaagcaaaac agaaagtagt gaaaccattt tttcaaaggc ttcagtagta tctttagcta 17940 agagaatgtc attgtgtaac tggacacatt gagcccacaa tttagatgat gattctactc 18000 tgagttgttg caaaactgag agtaagacta ctgatgtgca ctttacatct gacattttag 18060 actgtacagt ggctactttg atacaaggtt tgccaccaac acccaacaat ttaatgttga 18120 gtttgaaggc atctatgcta ttcttgggtg ggagtagtcc ctgtgaattc atatatctaa 18180 actcctgtgt agaaactaag taatcataaa caccaagagt cagtctaaag tagcggttga 18240 gtaaacaaaa gaggccaaag taacaagtac aaaaatagcc taagaaacaa taaactagca 18300 ttatacactg aagtgtatta ccagttatga agaaaatagg gcaatactca acacacataa 18360 aaacaatacc tctggccaaa aacatgacag ttgtaactac acctgagtag ttagaagtaa 18420 cagagattat aagagcccac atggaaatgg cttgatctaa agcattacca taataaactt 18480 tataaacgag tgtcaagaca ttcataagtg tccacactct cctagcacca tcatcataca 18540 cagttcttgc tgtcataagg attagtaaca ctacagctga tgcatacata acacagtctt 18600 ttagcttaaa accagacaaa ctagtatcaa ccatatccaa ccatgtcata atacgcatca 18660 cccaactagc aggcatatag accatattaa aataagctac agtggcaaga gaaggtaaca 18720 aaaacaaaca gagaaatgca tgcttatgtt tgacaaacat cattgcaaaa gcagacatag 18780 caataatacc catagcaaaa ggtaaaaagg cattttcata caaaaaaaag aacaaagacc 18840 attgagtact ctggactaaa actaaaagtg aagtcaaaat tgtgagtaac aaccagtggt 18900 gtgtaccctt gattgttctt ttcactgcac tttggaaagt aacacctgag cattgtctaa 18960 caacatcaaa aggtgtaaat tcatcttcta ataaagcact acccaatatg gtacgtccat 19020 tcataccatt ttgcagtaat tcttttaatg aagcacacat atctaaaacg gcaattccag 19080 tttgagcaga aagaggtcct agtatgtcaa catggtcttg tgttagaggt tcataattgt 19140 acttcatagc cacaaggtta aagtcattaa gagttgtggt aaatcgattg agaaaccacc 19200 tgtctccatt tataacagca gcgtacaacc aagctaaaac attaactgta atagttgtgt 19260 ccgtaccagc tgcttgtgct gtttgcctgt caacaaaagg tccataaaag ttaccttcta 19320 agtctgtgcc agcatgaact ccagttggta attccatatg gtgcatgtaa caaaaagaga 19380 cacagtcata atctatgtta aaaccaacac taccacatga accattaagg aatgaaccct 19440 taatagtgaa attgggcctc atagcacatt ggtaaacacc agatggtgaa ccattgtaac 19500 aagctaacac tgaaaaagtc tgtcctggtt gaatgcgaac aaacttatac ttaggtgtct 19560 taggattggc tgtatcaacc ttaagcttaa gtacacaatt ttgcatagaa tgtccaataa 19620 ccctgagttg aacattacca gcctgtacca agaaattatg attagactta cgaatgagta 19680 aatcttcata attagggtta agcatgtctt cagaggtgca gatcacatgt cttggacagt 19740 aaactacgtc atcaagccaa agaccgttaa gtgtagttgt accacaagtt acttgtacca 19800 tacaaccctc aactttacca gatgggaatg ccatttttct aaaaccactc tgcaaaacag 19860 ctgaggtgat agaggtttgt ggtggttggt aaagaacatc agaacctgag ttactgaagt 19920 cattgagagc ctttgcgaga tgacaacaag cagcttctct gtagctagtt gtatccattg 19980 ctccactaaa atacttgtac ttattataaa gagctaagta tctattatat tgcgtaagag 20040 gtaatagcac atcactacgc aactttagat acatttcttt atttaacaaa aaggtgcaca 20100 gcgcagcttc ttcaaaagta ctaaaggaaa caccattaaa gactacacgt ctctttaggt 20160 aattactaaa gaaccaatag aaatgctttg tggaaataca aatgatataa gcaattgtta 20220 tccagaaagg tactaaaggt gtgaacataa ccatccactg aatatgtgct aaaaaagaaa 20280 catcattagt aagataaaat gtcaagtaca agtaaataac agaataaaca ccaggtaaga 20340 atgagtaaac tggtgttaaa cagagtacag tgaatgacat aaggaatagt aaagtattaa 20400 aggcaactac atgactgtat tcaccaaaag ctcttctaaa cctcataaaa tagtaggcaa 20460 ggcatgttac tacgatagct acaataccac cagctactat agatgctgat atgtccaaag 20520 caccaatagg ttgaattagt ggtgtaaaca tattagtaag taaatttaca gcatctacac 20580 cacagaaaac tcctggtaaa gatctgtaat aatcattgtt aagtacccat ctaccactag 20640 tagatacaca aacaccagct tctgatcttt cacaagtgcc gtgcctacag tactcagaat 20700 caaaagttgt taccactcta acagaacctt caaggtaggt gttaggaaat tgaataatag 20760 agccatccat gagcacataa cgtgtgtcag ggcgtaaact ttcataagca acagaacctt 20820 ctagtacatt ggtatcataa caatatggta ctggcttacc agaagcatct ttaaaaattg 20880 tacattcagc agccaaaaca caagctgatg ttgcaaagtc agtgtactct ataagttttg 20940 atggtgtgta acagatgtta ccaactgcac taaaaactct aggtaagaaa tgcaaaaagt 21000 caccattagt tgtgcgtaat atcgtgccag gcaaaccagg cacgacaaaa cccacttctc 21060 ttgttatgac tgcagcaatc aatgggcaag ctttgtcatt agtataacta ccaccacgct 21120 ggctaaacca tgtgtcaaaa tcagcatgtt tgttagcaaa acaagtatct gtagatgcta 21180 tgtcacgagt gacaccacca tcaatagcct tgtatcctat gatttcactt gaaaagtcag 21240 tatgtttaga catgacatga acaggtgtta ttaaatagaa aatagcagca acaaaaagga 21300 acacaagtgt aactttaatt aactgcttca accaattatt aacaatttta ccacccttaa 21360 gtgctatctt tgttgttaca acattaacaa cttgtctagt agttgcacat gtcaacttaa 21420 aaggtaagtt attcttttta gcagcactac gtatttgttt tcgtagttgt tcagacaatg 21480 acatgaaatc tttaacgttc catatcaaag caatgttgtg actttttgct acctgcgcat 21540 taatatgacg cgcactacag tcaatacaag caccaaggtc acggggtgtc atgttttcaa 21600 ctttgttata ggtgagcata tagttattac aactatcgcc agtaacttct atgtcagatt 21660 gatgtgacaa tttaagacat tcaacaacat ctttagtttc tacatctgaa tcaacaaacc 21720 cttgccgagc tgctgaaata aaagtagata agacattgtc taaggacaca ttctttgcaa 21780 gttcagcttc tgcagttgca actagtgttt tgagtttttc cattggtacg ttaaaagttg 21840 atgaaaacgt attaacgtaa gcatcaaaca ttttaactgc aacttccgca ctatcaccaa 21900 catcagacac taatgcctga tctagtaaca gtataggttg acacataagc tgactgtagt 21960 aaacagacgc tgattttgca gatgattctt cacattttga tttaccatca aaaactataa 22020 cattaatagg caatgaacct ttagtgttat tagctctcag gttgtctaag ttaacaaaat 22080 gagagagaga atgtctttca taagtctttt gaccagcttt atcaaagtaa agatggatgg 22140 aaccattctt cactgtaaca ctatcaacga tgtaagaaga ctggtcagta ggatttattg 22200 gtcttttaaa ctgtagtgac aagtctctcg caacttcatc actaataaat gtactaccag 22260 cacagaatgt atcacaatta acacaattcc aattgtgtag tttgcaaaag cctttacctc 22320 cattagcata gacataaaag gaccttctaa caccattaac aatagttgta cattcgactc 22380 ttgttgctct attacgtttg taacacatca tacaagttga tgaattacaa ccgtctacaa 22440 catgcacata acttttccat acataataaa atgatgcaaa gaagatgtac attctaacca 22500 tagctgaaat cggggccatt tgtacaagat taattattaa ccacataagc caagaattac 22560 taataaaatg tactgcaaaa tagctgaaaa acaattgcat gattgcagcc aatccaagta 22620 catagaaaaa cctagtgaaa agaatatatg ccaaaaacca ctctgcaact aagccaaaag 22680 cagttaaatc ccatttaaaa gatgaaatgg taatttgtat agtttctaaa gaaggatagg 22740 tgtctaaaga atctaaacca ctaagacaaa cactacaagg tatagaacca gtacagtagg 22800 ttgcaatagt gacattagta gagttcaaat agccttctct gtaaccagta cagtaagaag 22860 gcatgcctaa attagacatt aaaacaccta aagcagcggt tgagtagatt aaagaaccta 22920 ggcaaacact taatagtaaa aaccaaatta taatatttat cagtttagaa aaattaggtg 22980 acttcaaata attaaatgaa gcctctagac aaaatttacc gacactctta acagtattct 23040 ttgctatagt agtcggcata gatgctttaa ttctagaatt tgtacttcta gtaaaagtac 23100 acaattgtag caataaagta aagaaataag gcatataatt agtacaaaca cggtttaaac 23160 accgtgtaac tatgttagta gttgtactaa caactttgtt aagaaaaggc ttagcataat 23220 tagctatagt atcccaaggg acactattaa cagcagctaa accatgagta gcaagggttt 23280 tcaaacctaa tactctagat aattcattag gtttcttaat agtaagacta gaattgtcta 23340 cataagcagc cattagatct gtgtggccaa cctcttctgt aatttttaaa ctattatttg 23400 ctggtttaag tataatgtct cctacaactt cggtagtttt cacattacac tcaagaacgt 23460 ctttctgtat ggtaggattt tccactactt cttcagagac tggttttaga tcttcgcagg 23520 caagattatc cattccctgc gcgtcctctg acttcagtac atcaaacgaa tttgatgttt 23580 caactggttt tgtgctccaa agacaacgta tacaccaggt atttggttta tacgtggctt 23640 tattagttgc attgttaaca tgccaaacaa taggtttatg taacaattta gctcctttct 23700 taaaagaggg tgtgtagtgt ttataatcaa tagccaccac atcaccattt aagtcaggga 23760 aaaatgtaac tttaagctct cttgaagcag gtttcttata accagttaac tggtttaaat 23820 catcagcaaa tttgatatta tcacatacaa acttaaaatt atcgaagctt gcgtttggat 23880 atggttggtt tggtacaaga tcaattggtt gctctgtgaa ataagaattg tctttcttat 23940 aataattgtc caacttaggg tcaatttctg tacaaacaac accatccaat ttataagtaa 24000 ctggttttat ggttgttgtg taactgtttt ctttgtagaa aacatccgta ataggacctt 24060 tgtattctga ggactttgta agtaaagcac cgtctatgca atacaaagtt tctttagaag 24120 ttatatgttt atagtgacca cactggtaat taccagtgta ctcactagca caagtaaatg 24180 taccatgctt aagttcatac tgagcaggtg gtgctgacat cataacaaaa ggtgactcct 24240 gttgtactag atattttgta gcttgtttac cacacgtaca aggtatctga acacctttct 24300 taaattgttc ataagaaagt gtgcccatgt acataacagc ttctacaccc ttaagggttg 24360 tctgctgttg tccacaagtt ttacacacca cgttcaagac tcttttgcaa gaatctaaat 24420 tggcatgttg aaacaagtaa ctcattgttt ctctaacatc acctaactca cctactgtct 24480 tattacagta ggctaagata agtgcacaaa agttagcagc ttcaccagcc cttgctctgt 24540 aataagcatc ttgtagagca ggtggattaa acttcaactc tatttgttgg agtgttaaca 24600 atgcagtggc aagataacag ttgttatctg cccatttaat agaagttaaa ccattaactt 24660 gtgggtattt ccacttttta gtgtgattta atgctgacat gtacctaccc agaaaactag 24720 gatcagttgt gtggtagtac tcaaaagcct caacacgtag agtgtcatca ttaggtaaaa 24780 cataaaatgt tttaccttca tgtgaattat gaggttttat tttagtaaca tcagctccat 24840 ccaaataagt tggaccaaac tgttgtccat atgtcattga catgtccaca acttgcgtgt 24900 ggaggttaat gttgtctact gttgtaaaca ccttaatagt cctcacttct ctcaaagaaa 24960 gaagtgtctt aagattgtca aaggtgataa cttcaccatc taggtggaat gtggtaggat 25020 tactagtgta atatacactt ttatcacctc tcttaagaaa ttctatacct agttgtgtag 25080 attgtccaga ataggaccaa tctttatagg aaccagcaag tgagatggtt tcaataaaat 25140 gttcttcagg tgttttagaa gaagaagtaa gataaccatt atacgctgta acagcatcag 25200 gtgaagaaac agaaactgta gctggcactt tgagagatct catataccga gcagcttctt 25260 ccaaatttaa gccatgtgtt acatagccaa gtggcattgt aacaagagtt tcatttagat 25320 cgttaagtgt gttgataagt gacgctacag ttgttttact ggtgtaaaag taaaatctag 25380 caccataatc aaccacaccc tcttgtattt taataccctt atatttacgc tgtatagttg 25440 aaactatggc tttagtttcc acacagacag gcattaattt gcgtgtttct tctgcatgtg 25500 caagcatttc tcgcaaattc caagaaacag ttccaagaat ttcttgcttc tcattagaga 25560 taatagatgg tagaatgtaa aaggcacttt tacacttttt aagcactgtc tttgcctcct 25620 ctacagtgta accatttaaa ccctgacccg ggtaagtggt tatataattg tctgttggca 25680 cttttctcaa agctttcgct agcatttcag tagtgccacc agccttttta gtaggtataa 25740 ccacagcagt taaaacaccc tcttgaacaa catcacccac tatatatgga gcatctttct 25800 ttaagaaagt gatgtcaatg tcactaacaa gagtggcaga atctggatga agattgccat 25860 taatgtcaat ataaagtaac aagttttctg tgaggaactt agtttcttcc agagttgttg 25920 taacttcttc aacacaagct ttgattttct tatcatcttg ttttctctgt tcaactgaag 25980 gtttactttc agttataaat ggcttaactt cctctttagg aatctcagcg atcttttgtt 26040 caacttgctt ttcactcttc atttccaaaa agcttgaaac aagtttgtca tagagatttt 26100 tatcaaagac agctaagtag acatttgtgc gaacagtatc tacacaaact cttaaagaat 26160 gtatagggtc agcaccaaaa ataccagctg ataataatgg tgcaagtaga acttcgtgct 26220 gattaaaatt ttcataagca ctcttaagaa gttgaatgtc ttcacctttg ttaacatttg 26280 ggccgacaac atgaagacag tgtttagcaa gattgtgtcc gcttaaaaca caactaccac 26340 ccactttaag tggtccatta gtagctatgt aatcatcaga ttcaacttgc atggcattgt 26400 tagtagcctt atttaaggct cctgcaacac ctcctccatg tttaaggtaa acattggctg 26460 cattaacaac cactgttggt tttacctttt tagcttcttc cacaatgtct gcatttttaa 26520 tgtatacatt gtcagtaagt tttaaataac cactaaaact attcacttca atagtctgaa 26580 caactggtgt aagttccatc tctaattgag gttgaacctc aacaattgtt tgaatagtag 26640 ttgtctgatt gtcctcactg ccgtcttgtt gaccaacagt ttgttgacta tcatcatcta 26700 accaatcttc ttcttgctct tcttcaggtt gaagagcagc agaagtggca ccaaattcca 26760 aaggtttacc ttggtaatca tcttcagtac catactcata ttgagttgat ggctcaaact 26820 cttcttcttc acaatcacct tcttcttcat cctcatctgg agggtagaaa gaacaataca 26880 tatgtgaagc caatttaaac tcaccagact catcaaataa gtagtatgta gccatactcc 26940 actcatctaa atcaatgccc agtggtgtaa gtaattcaga tactggttgc aaagttttta 27000 tgacagcatc tgccacaaca caggcgaact catttacttc tgtaccgagt tcaactgtat 27060 aggcagagca cttctcatta agtactttat caatcctttc atcaagttca aaagtgatat 27120 tcacactctt gtaaccttgc acttctatca cagtgtcatc accaaaagta acctttgttg 27180 gtgcaccgcc tttgagtgtg aaggtattgt ttgttaccat catattaggt gcaagggcac 27240 agtacttttc tgtgtctttg atttcgagca acataagccc gttaatacaa actggtgtac 27300 caaccaatgg agcttcaaca gcttcactag taggttgttc taatggttgt aaatcaccag 27360 ttttcaagac aacttcctct gttaacactt ctgtgggaag tgtttctccc tctaagaaga 27420 taatttcttt tggggctttt agaggcatga gtaggccagt ttcttctctg gatttaacac 27480 actttctgta caatcccttt gagtgcgtga caaatgtttc acctaaattc aaggctttaa 27540 gtttagctcc accaataatg atagagtcag cacacaaagc caaaaattta tttacaagct 27600 taaagaatgt ctgaacactc tccttaattt cctttgcaca ggtgacaatt tgtccaccga 27660 caatttcaca agcacaggtt gagataaatt taacaatttc ccaaccgtct ctaagaaact 27720 ctacaccttc cttaaacttc tcttcaagcc aatcaaggac gggtttgagt ttttcataaa 27780 cagtgccaaa gatgttagtt agccactgcg aagtcaactg aacaacacca cctgtaatgt 27840 aggccattac aactagattg ttagtagcca aatcagatgt gaacatcata gcatcaatga 27900 gtctcagtga atactgtgaa attccatcta gtattgttat agcggccttc tgtaaaacac 27960 gcacagaatt ttgagcagtt tcaagagtgc gggagaaaat tgatcgtaca acacgagcag 28020 cctctgatgc aaatgcataa agaggactca gtattgattt ctgttcacca atattccagg 28080 cacctttttt agcttttcct tttgtaactt taaaattacc acaggattca acaatttgtt 28140 tgaatgcttt ataatccaaa cctttcacag tttccacaaa agcacttgtg gaagcagaaa 28200 aagatgccaa aataatggcg atctcttcat taagtttaaa gtcaccaaca atattgatgt 28260 tgactttctc tttttggagt atttcaagaa ggttgtcatt aagaccttcg gaaccttctc 28320 caacaacacc tgtatggtta caacctatgt tagcgctagc acgtggaacc caataggcac 28380 acttgttatg gcaaccaaca taagagaaca cacagcctcc aaaggcaata gtgcgaccac 28440 ccttacgaag aatggttttc aagccagatt cattatggta ttcggcaaga ctatgctcag 28500 gtcctacttc tgaattgtga catgctggac aataaatttt aacaacagca ttttggggta 28560 agtaaccaca agtagtggca ccttctttag tcaaattctc agtgccacaa aattcgcaag 28620 tggctttaac aaaatcgccc gtctgccatg aagtttcacc acaatgatca cacttcatga 28680 gagttgaaag gcacatttgg ttgcattcat ttggtgacgc aactggatag acagatcgaa 28740 ttctacccat aaagccatca agctttttct tttcaaccct tggttgaata gtcttgatta 28800 tggaatttaa gggaaataca aaatttggac attccccatt gaaggtgtca aatttctttg 28860 ccaatttaat ttcaaaaggt gtctgcaatt catagctctt ttcagaacgt tccgtgtacc 28920 aagcaatttc atgctcatgt tcacggcagc agtatacacc cctcttagtg tcaataaagt 28980 ccagttgttc ggacaaagtg catgaagctt taccagcacg tgctagaagg tctttaatgc 29040 actcaagagg gtagccatca gggccacaga agttgttatc gacatagcga gtgtatgccc 29100 ctccgttaag ctcacgcatg agttcacggg taacaccact gctatgttta gtgttccagt 29160 tttcttgaaa atcttcataa ggatcagtgc caagctcgtc gcctaagtca aatgacttta 29220 gatcggcgcc gtaactatgg ccaccagctc ctttattacc gttcttacga agaagaacct 29280 tgcggtaagc cactggtatt tcgcccacat gagggacaag gacaccaagt gtctcaccac 29340 tacgaccgta ctgaatgcct tcgagttctg ctaccagctc aaccataaca tgaccatgag 29400 gtgcagttcg agcatccgaa cgtttgatga acacataggg ctgttcaagt tgaggcaaaa 29460 cgcctttttc aacttctact aagccacaag tgccatcttt aagatgttga cgtgcctctg 29520 ataagacctc ctccacggag tctccaaagc cacgtacgag cacgtcgcga acctgtaaaa 29580 caggcaaact gagttggacg tgtgttttct cgttgaaacc agggacaagg ctctccatct 29640 tacctttcgg tcacacccgg acgaaaccta gatgtgctga tgatcggctg caacacggac 29700 gaaaccgtaa gcagcctgca gaagatagac gagttactcg tgtcctgtca acgacagtaa 29760 ttagttatta attatactgc gtgagtgcac taagcatgca gccgagtgac agccacacag 29820 attttaaagt tcgtttagag aacagatcta caagagatcg aaagttggtt ggtttgttac 29880 ctgggaaggt ataaaccttt aat 29903 <210> 6 <211> 29903 <212> RNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 6 auuaaagguu uauaccuucc cagguaacaa accaaccaac uuucgaucuc uuguagaucu 60 guucucuaaa cgaacuuuaa aaucugugug gcugucacuc ggcugcaugc uuagugcacu 120 cacgcaguau aauuaauaac uaauuacugu cguugacagg acacgaguaa cucgucuauc 180 uucugcaggc ugcuuacggu uucguccgug uugcagccga ucaucagcac aucuagguuu 240 cguccgggug ugaccgaaag guaagaugga gagccuuguc ccugguuuca acgagaaaac 300 acacguccaa cucaguuugc cuguuuuaca gguucgcgac gugcucguac guggcuuugg 360 agacuccgug gaggaggucu uaucagaggc acgucaacau cuuaaagaug gcacuugugg 420 cuuaguagaa guugaaaaag gcguuuugcc ucaacuugaa cagcccuaug uguucaucaa 480 acguucggau gcucgaacug caccucaugg ucauguuaug guugagcugg uagcagaacu 540 cgaaggcauu caguacgguc guagugguga gacacuuggu guccuugucc cucauguggg 600 cgaaauacca guggcuuacc gcaagguucu ucuucguaag aacgguaaua aaggagcugg 660 uggccauagu uacggcgccg aucuaaaguc auuugacuua ggcgacgagc uuggcacuga 720 uccuuaugaa gauuuucaag aaaacuggaa cacuaaacau agcaguggug uuacccguga 780 acucaugcgu gagcuuaacg gaggggcaua cacucgcuau gucgauaaca acuucugugg 840 cccugauggc uacccucuug agugcauuaa agaccuucua gcacgugcug guaaagcuuc 900 augcacuuug uccgaacaac uggacuuuau ugacacuaag agggguguau acugcugccg 960 ugaacaugag caugaaauug cuugguacac ggaacguucu gaaaagagcu augaauugca 1020 gacaccuuuu gaaauuaaau uggcaaagaa auuugacacc uucaaugggg aauguccaaa 1080 uuuuguauuu cccuuaaauu ccauaaucaa gacuauucaa ccaaggguug aaaagaaaaa 1140 gcuugauggc uuuaugggua gaauucgauc ugucuaucca guugcgucac caaaugaaug 1200 caaccaaaug ugccuuucaa cucucaugaa gugugaucau uguggugaaa cuucauggca 1260 gacgggcgau uuuguuaaag ccacuugcga auuuuguggc acugagaauu ugacuaaaga 1320 aggugccacu acuugugguu acuuacccca aaaugcuguu guuaaaauuu auuguccagc 1380 augucacaau ucagaaguag gaccugagca uagucuugcc gaauaccaua augaaucugg 1440 cuugaaaacc auucuucgua aggguggucg cacuauugcc uuuggaggcu guguguucuc 1500 uuauguuggu ugccauaaca agugugccua uuggguucca cgugcuagcg cuaacauagg 1560 uuguaaccau acagguguug uuggagaagg uuccgaaggu cuuaaugaca accuucuuga 1620 aauacuccaa aaagagaaag ucaacaucaa uauuguuggu gacuuuaaac uuaaugaaga 1680 gaucgccauu auuuuggcau cuuuuucugc uuccacaagu gcuuuugugg aaacugugaa 1740 agguuuggau uauaaagcau ucaaacaaau uguugaaucc ugugguaauu uuaaaguuac 1800 aaaaggaaaa gcuaaaaaag gugccuggaa uauuggugaa cagaaaucaa uacugagucc 1860 ucuuuaugca uuugcaucag aggcugcucg uguuguacga ucaauuuucu cccgcacucu 1920 ugaaacugcu caaaauucug ugcguguuuu acagaaggcc gcuauaacaa uacuagaugg 1980 aauuucacag uauucacuga gacucauuga ugcuaugaug uucacaucug auuuggcuac 2040 uaacaaucua guuguaaugg ccuacauuac aggugguguu guucaguuga cuucgcagug 2100 gcuaacuaac aucuuuggca cuguuuauga aaaacucaaa cccguccuug auuggcuuga 2160 agagaaguuu aaggaaggug uagaguuucu uagagacggu ugggaaauug uuaaauuuau 2220 cucaaccugu gcuugugaaa uugucggugg acaaauuguc accugugcaa aggaaauuaa 2280 ggagaguguu cagacauucu uuaagcuugu aaauaaauuu uuggcuuugu gugcugacuc 2340 uaucauuauu gguggagcua aacuuaaagc cuugaauuua ggugaaacau uugucacgca 2400 cucaaaggga uuguacagaa aguguguuaa auccagagaa gaaacuggcc uacucaugcc 2460 ucuaaaagcc ccaaaagaaa uuaucuucuu agagggagaa acacuuccca cagaaguguu 2520 aacagaggaa guugucuuga aaacugguga uuuacaacca uuagaacaac cuacuaguga 2580 agcuguugaa gcuccauugg uugguacacc aguuuguauu aacgggcuua uguugcucga 2640 aaucaaagac acagaaaagu acugugcccu ugcaccuaau augaugguaa caaacaauac 2700 cuucacacuc aaaggcggug caccaacaaa gguuacuuuu ggugaugaca cugugauaga 2760 agugcaaggu uacaagagug ugaauaucac uuuugaacuu gaugaaagga uugauaaagu 2820 acuuaaugag aagugcucug ccuauacagu ugaacucggu acagaaguaa augaguucgc 2880 cuguguugug gcagaugcug ucauaaaaac uuugcaacca guaucugaau uacuuacacc 2940 acugggcauu gauuuagaug aguggaguau ggcuacauac uacuuauuug augagucugg 3000 ugaguuuaaa uuggcuucac auauguauug uucuuucuac ccuccagaug aggaugaaga 3060 agaaggugau ugugaagaag aagaguuuga gccaucaacu caauaugagu augguacuga 3120 agaugauuac caagguaaac cuuuggaauu uggugccacu ucugcugcuc uucaaccuga 3180 agaagagcaa gaagaagauu gguuagauga ugauagucaa caaacuguug gucaacaaga 3240 cggcagugag gacaaucaga caacuacuau ucaaacaauu guugagguuc aaccucaauu 3300 agagauggaa cuuacaccag uuguucagac uauugaagug aauaguuuua gugguuauuu 3360 aaaacuuacu gacaauguau acauuaaaaa ugcagacauu guggaagaag cuaaaaaggu 3420 aaaaccaaca gugguuguua augcagccaa uguuuaccuu aaacauggag gagguguugc 3480 aggagccuua aauaaggcua cuaacaaugc caugcaaguu gaaucugaug auuacauagc 3540 uacuaaugga ccacuuaaag ugggugguag uuguguuuua agcggacaca aucuugcuaa 3600 acacugucuu cauguugucg gcccaaaugu uaacaaaggu gaagacauuc aacuucuuaa 3660 gagugcuuau gaaaauuuua aucagcacga aguucuacuu gcaccauuau uaucagcugg 3720 uauuuuuggu gcugacccua uacauucuuu aagaguuugu guagauacug uucgcacaaa 3780 ugucuacuua gcugucuuug auaaaaaucu cuaugacaaa cuuguuucaa gcuuuuugga 3840 aaugaagagu gaaaagcaag uugaacaaaa gaucgcugag auuccuaaag aggaaguuaa 3900 gccauuuaua acugaaagua aaccuucagu ugaacagaga aaacaagaug auaagaaaau 3960 caaagcuugu guugaagaag uuacaacaac ucuggaagaa acuaaguucc ucacagaaaa 4020 cuuguuacuu uauauugaca uuaauggcaa ucuucaucca gauucugcca cucuuguuag 4080 ugacauugac aucacuuucu uaaagaaaga ugcuccauau auagugggug auguuguuca 4140 agaggguguu uuaacugcug ugguuauacc uacuaaaaag gcugguggca cuacugaaau 4200 gcuagcgaaa gcuuugagaa aagugccaac agacaauuau auaaccacuu acccggguca 4260 ggguuuaaau gguuacacug uagaggaggc aaagacagug cuuaaaaagu guaaaagugc 4320 cuuuuacauu cuaccaucua uuaucucuaa ugagaagcaa gaaauucuug gaacuguuuc 4380 uuggaauuug cgagaaaugc uugcacaugc agaagaaaca cgcaaauuaa ugccugucug 4440 uguggaaacu aaagccauag uuucaacuau acagcguaaa uauaagggua uuaaaauaca 4500 agagggugug guugauuaug gugcuagauu uuacuuuuac accaguaaaa caacuguagc 4560 gucacuuauc aacacacuua acgaucuaaa ugaaacucuu guuacaaugc cacuuggcua 4620 uguaacacau ggcuuaaauu uggaagaagc ugcucgguau augagaucuc ucaaagugcc 4680 agcuacaguu ucuguuucuu caccugaugc uguuacagcg uauaaugguu aucuuacuuc 4740 uucuucuaaa acaccugaag aacauuuuau ugaaaccauc ucacuugcug guuccuauaa 4800 agauuggucc uauucuggac aaucuacaca acuagguaua gaauuucuua agagagguga 4860 uaaaagugua uauuacacua guaauccuac cacauuccac cuagauggug aaguuaucac 4920 cuuugacaau cuuaagacac uucuuucuuu gagagaagug aggacuauua agguguuuac 4980 aacaguagac aacauuaacc uccacacgca aguuguggac augucaauga cauauggaca 5040 acaguuuggu ccaacuuauu uggauggagc ugauguuacu aaaauaaaac cucauaauuc 5100 acaugaaggu aaaacauuuu auguuuuacc uaaugaugac acucuacgug uugaggcuuu 5160 ugaguacuac cacacaacug auccuaguuu ucuggguagg uacaugucag cauuaaauca 5220 cacuaaaaag uggaaauacc cacaaguuaa ugguuuaacu ucuauuaaau gggcagauaa 5280 caacuguuau cuugccacug cauuguuaac acuccaacaa auagaguuga aguuuaaucc 5340 accugcucua caagaugcuu auuacagagc aagggcuggu gaagcugcua acuuuugugc 5400 acuuaucuua gccuacugua auaagacagu aggugaguua ggugauguua gagaaacaau 5460 gaguuacuug uuucaacaug ccaauuuaga uucuugcaaa agagucuuga acguggugug 5520 uaaaacuugu ggacaacagc agacaacccu uaagggugua gaagcuguua uguacauggg 5580 cacacuuucu uaugaacaau uuaagaaagg uguucagaua ccuuguacgu gugguaaaca 5640 agcuacaaaa uaucuaguac aacaggaguc accuuuuguu augaugucag caccaccugc 5700 ucaguaugaa cuuaagcaug guacauuuac uugugcuagu gaguacacug guaauuacca 5760 guguggucac uauaaacaua uaacuucuaa agaaacuuug uauugcauag acggugcuuu 5820 acuuacaaag uccucagaau acaaaggucc uauuacggau guuuucuaca aagaaaacag 5880 uuacacaaca accauaaaac caguuacuua uaaauuggau gguguuguuu guacagaaau 5940 ugacccuaag uuggacaauu auuauaagaa agacaauucu uauuucacag agcaaccaau 6000 ugaucuugua ccaaaccaac cauauccaaa cgcaagcuuc gauaauuuua aguuuguaug 6060 ugauaauauc aaauuugcug augauuuaaa ccaguuaacu gguuauaaga aaccugcuuc 6120 aagagagcuu aaaguuacau uuuucccuga cuuaaauggu gauguggugg cuauugauua 6180 uaaacacuac acacccucuu uuaagaaagg agcuaaauug uuacauaaac cuauuguuug 6240 gcauguuaac aaugcaacua auaaagccac guauaaacca aauaccuggu guauacguug 6300 ucuuuggagc acaaaaccag uugaaacauc aaauucguuu gauguacuga agucagagga 6360 cgcgcaggga auggauaauc uugccugcga agaucuaaaa ccagucucug aagaaguagu 6420 ggaaaauccu accauacaga aagacguucu ugaguguaau gugaaaacua ccgaaguugu 6480 aggagacauu auacuuaaac cagcaaauaa uaguuuaaaa auuacagaag agguuggcca 6540 cacagaucua auggcugcuu auguagacaa uucuagucuu acuauuaaga aaccuaauga 6600 auuaucuaga guauuagguu ugaaaacccu ugcuacucau gguuuagcug cuguuaauag 6660 ugucccuugg gauacuauag cuaauuaugc uaagccuuuu cuuaacaaag uuguuaguac 6720 aacuacuaac auaguuacac gguguuuaaa ccguguuugu acuaauuaua ugccuuauuu 6780 cuuuacuuua uugcuacaau uguguacuuu uacuagaagu acaaauucua gaauuaaagc 6840 aucuaugccg acuacuauag caaagaauac uguuaagagu gucgguaaau uuugucuaga 6900 ggcuucauuu aauuauuuga agucaccuaa uuuuucuaaa cugauaaaua uuauaauuug 6960 guuuuuacua uuaaguguuu gccuagguuc uuuaaucuac ucaaccgcug cuuuaggugu 7020 uuuaaugucu aauuuaggca ugccuucuua cuguacuggu uacagagaag gcuauuugaa 7080 cucuacuaau gucacuauug caaccuacug uacugguucu auaccuugua guguuugucu 7140 uagugguuua gauucuuuag acaccuaucc uucuuuagaa acuauacaaa uuaccauuuc 7200 aucuuuuaaa ugggauuuaa cugcuuuugg cuuaguugca gagugguuuu uggcauauau 7260 ucuuuucacu agguuuuucu auguacuugg auuggcugca aucaugcaau uguuuuucag 7320 cuauuuugca guacauuuua uuaguaauuc uuggcuuaug ugguuaauaa uuaaucuugu 7380 acaaauggcc ccgauuucag cuaugguuag aauguacauc uucuuugcau cauuuuauua 7440 uguauggaaa aguuaugugc auguuguaga cgguuguaau ucaucaacuu guaugaugug 7500 uuacaaacgu aauagagcaa caagagucga auguacaacu auuguuaaug guguuagaag 7560 guccuuuuau gucuaugcua auggagguaa aggcuuuugc aaacuacaca auuggaauug 7620 uguuaauugu gauacauucu gugcugguag uacauuuauu agugaugaag uugcgagaga 7680 cuugucacua caguuuaaaa gaccaauaaa uccuacugac cagucuucuu acaucguuga 7740 uaguguuaca gugaagaaug guuccaucca ucuuuacuuu gauaaagcug gucaaaagac 7800 uuaugaaaga cauucucucu cucauuuugu uaacuuagac aaccugagag cuaauaacac 7860 uaaagguuca uugccuauua auguuauagu uuuugauggu aaaucaaaau gugaagaauc 7920 aucugcaaaa ucagcgucug uuuacuacag ucagcuuaug ugucaaccua uacuguuacu 7980 agaucaggca uuagugucug auguugguga uagugcggaa guugcaguua aaauguuuga 8040 ugcuuacguu aauacguuuu caucaacuuu uaacguacca auggaaaaac ucaaaacacu 8100 aguugcaacu gcagaagcug aacuugcaaa gaaugugucc uuagacaaug ucuuaucuac 8160 uuuuauuuca gcagcucggc aaggguuugu ugauucagau guagaaacua aagauguugu 8220 ugaaugucuu aaauugucac aucaaucuga cauagaaguu acuggcgaua guuguaauaa 8280 cuauaugcuc accuauaaca aaguugaaaa caugacaccc cgugaccuug gugcuuguau 8340 ugacuguagu gcgcgucaua uuaaugcgca gguagcaaaa agucacaaca uugcuuugau 8400 auggaacguu aaagauuuca ugucauuguc ugaacaacua cgaaaacaaa uacguagugc 8460 ugcuaaaaag aauaacuuac cuuuuaaguu gacaugugca acuacuagac aaguuguuaa 8520 uguuguaaca acaaagauag cacuuaaggg ugguaaaauu guuaauaauu gguugaagca 8580 guuaauuaaa guuacacuug uguuccuuuu uguugcugcu auuuucuauu uaauaacacc 8640 uguucauguc augucuaaac auacugacuu uucaagugaa aucauaggau acaaggcuau 8700 ugaugguggu gucacucgug acauagcauc uacagauacu uguuuugcua acaaacaugc 8760 ugauuuugac acaugguuua gccagcgugg ugguaguuau acuaaugaca aagcuugccc 8820 auugauugcu gcagucauaa caagagaagu ggguuuuguc gugccugguu ugccuggcac 8880 gauauuacgc acaacuaaug gugacuuuuu gcauuucuua ccuagaguuu uuagugcagu 8940 ugguaacauc uguuacacac caucaaaacu uauagaguac acugacuuug caacaucagc 9000 uuguguuuug gcugcugaau guacaauuuu uaaagaugcu ucugguaagc caguaccaua 9060 uuguuaugau accaauguac uagaagguuc uguugcuuau gaaaguuuac gcccugacac 9120 acguuaugug cucauggaug gcucuauuau ucaauuuccu aacaccuacc uugaagguuc 9180 uguuagagug guaacaacuu uugauucuga guacuguagg cacggcacuu gugaaagauc 9240 agaagcuggu guuuguguau cuacuagugg uagaugggua cuuaacaaug auuauuacag 9300 aucuuuacca ggaguuuucu gugguguaga ugcuguaaau uuacuuacua auauguuuac 9360 accacuaauu caaccuauug gugcuuugga cauaucagca ucuauaguag cuggugguau 9420 uguagcuauc guaguaacau gccuugccua cuauuuuaug agguuuagaa gagcuuuugg 9480 ugaauacagu cauguaguug ccuuuaauac uuuacuauuc cuuaugucau ucacuguacu 9540 cuguuuaaca ccaguuuacu cauucuuacc ugguguuuau ucuguuauuu acuuguacuu 9600 gacauuuuau cuuacuaaug auguuucuuu uuuagcacau auucagugga ugguuauguu 9660 cacaccuuua guaccuuucu ggauaacaau ugcuuauauc auuuguauuu ccacaaagca 9720 uuucuauugg uucuuuagua auuaccuaaa gagacgugua gucuuuaaug guguuuccuu 9780 uaguacuuuu gaagaagcug cgcugugcac cuuuuuguua aauaaagaaa uguaucuaaa 9840 guugcguagu gaugugcuau uaccucuuac gcaauauaau agauacuuag cucuuuauaa 9900 uaaguacaag uauuuuagug gagcaaugga uacaacuagc uacagagaag cugcuuguug 9960 ucaucucgca aaggcucuca augacuucag uaacucaggu ucugauguuc uuuaccaacc 10020 accacaaacc ucuaucaccu cagcuguuuu gcagaguggu uuuagaaaaa uggcauuccc 10080 aucugguaaa guugaggguu guaugguaca aguaacuugu gguacaacua cacuuaacgg 10140 ucuuuggcuu gaugacguag uuuacugucc aagacaugug aucugcaccu cugaagacau 10200 gcuuaacccu aauuaugaag auuuacucau ucguaagucu aaucauaauu ucuugguaca 10260 ggcugguaau guucaacuca ggguuauugg acauucuaug caaaauugug uacuuaagcu 10320 uaagguugau acagccaauc cuaagacacc uaaguauaag uuuguucgca uucaaccagg 10380 acagacuuuu ucaguguuag cuuguuacaa ugguucacca ucugguguuu accaaugugc 10440 uaugaggccc aauuucacua uuaaggguuc auuccuuaau gguucaugug guaguguugg 10500 uuuuaacaua gauuaugacu gugucucuuu uuguuacaug caccauaugg aauuaccaac 10560 uggaguucau gcuggcacag acuuagaagg uaacuuuuau ggaccuuuug uugacaggca 10620 aacagcacaa gcagcuggua cggacacaac uauuacaguu aauguuuuag cuugguugua 10680 cgcugcuguu auaaauggag acaggugguu ucucaaucga uuuaccacaa cucuuaauga 10740 cuuuaaccuu guggcuauga aguacaauua ugaaccucua acacaagacc auguugacau 10800 acuaggaccu cuuucugcuc aaacuggaau ugccguuuua gauaugugug cuucauuaaa 10860 agaauuacug caaaauggua ugaauggacg uaccauauug gguagugcuu uauuagaaga 10920 ugaauuuaca ccuuuugaug uuguuagaca augcucaggu guuacuuucc aaagugcagu 10980 gaaaagaaca aucaagggua cacaccacug guuguuacuc acaauuuuga cuucacuuuu 11040 aguuuuaguc cagaguacuc aauggucuuu guucuuuuuu uuguaugaaa augccuuuuu 11100 accuuuugcu auggguauua uugcuauguc ugcuuuugca augauguuug ucaaacauaa 11160 gcaugcauuu cucuguuugu uuuuguuacc uucucuugcc acuguagcuu auuuuaauau 11220 ggucuauaug ccugcuaguu gggugaugcg uauuaugaca ugguuggaua ugguugauac 11280 uaguuugucu gguuuuaagc uaaaagacug uguuauguau gcaucagcug uaguguuacu 11340 aauccuuaug acagcaagaa cuguguauga ugauggugcu aggagagugu ggacacuuau 11400 gaaugucuug acacucguuu auaaaguuua uuaugguaau gcuuuagauc aagccauuuc 11460 caugugggcu cuuauaaucu cuguuacuuc uaacuacuca gguguaguua caacugucau 11520 guuuuuggcc agagguauug uuuuuaugug uguugaguau ugcccuauuu ucuucauaac 11580 ugguaauaca cuucagugua uaaugcuagu uuauuguuuc uuaggcuauu uuuguacuug 11640 uuacuuuggc cucuuuuguu uacucaaccg cuacuuuaga cugacucuug guguuuauga 11700 uuacuuaguu ucuacacagg aguuuagaua uaugaauuca cagggacuac ucccacccaa 11760 gaauagcaua gaugccuuca aacucaacau uaaauuguug gguguuggug gcaaaccuug 11820 uaucaaagua gccacuguac agucuaaaau gucagaugua aagugcacau caguagucuu 11880 acucucaguu uugcaacaac ucagaguaga aucaucaucu aaauuguggg cucaaugugu 11940 ccaguuacac aaugacauuc ucuuagcuaa agauacuacu gaagccuuug aaaaaauggu 12000 uucacuacuu ucuguuuugc uuuccaugca gggugcugua gacauaaaca agcuuuguga 12060 agaaaugcug gacaacaggg caaccuuaca agcuauagcc ucagaguuua guucccuucc 12120 aucauaugca gcuuuugcua cugcucaaga agcuuaugag caggcuguug cuaaugguga 12180 uucugaaguu guucuuaaaa aguugaagaa gucuuugaau guggcuaaau cugaauuuga 12240 ccgugaugca gccaugcaac guaaguugga aaagauggcu gaucaagcua ugacccaaau 12300 guauaaacag gcuagaucug aggacaagag ggcaaaaguu acuagugcua ugcagacaau 12360 gcuuuucacu augcuuagaa aguuggauaa ugaugcacuc aacaacauua ucaacaaugc 12420 aagagauggu uguguucccu ugaacauaau accucuuaca acagcagcca aacuaauggu 12480 ugucauacca gacuauaaca cauauaaaaa uacgugugau gguacaacau uuacuuaugc 12540 aucagcauug ugggaaaucc aacagguugu agaugcagau aguaaaauug uucaacuuag 12600 ugaaauuagu auggacaauu caccuaauuu agcauggccu cuuauuguaa cagcuuuaag 12660 ggccaauucu gcugucaaau uacagaauaa ugagcuuagu ccuguugcac uacgacagau 12720 gucuugugcu gccgguacua cacaaacugc uugcacugau gacaaugcgu uagcuuacua 12780 caacacaaca aagggaggua gguuuguacu ugcacuguua uccgauuuac aggauuugaa 12840 augggcuaga uucccuaaga gugauggaac ugguacuauc uauacagaac uggaaccacc 12900 uuguagguuu guuacagaca caccuaaagg uccuaaagug aaguauuuau acuuuauuaa 12960 aggauuaaac aaccuaaaua gagguauggu acuugguagu uuagcugcca caguacgucu 13020 acaagcuggu aaugcaacag aagugccugc caauucaacu guauuaucuu ucugugcuuu 13080 ugcuguagau gcugcuaaag cuuacaaaga uuaucuagcu agugggggac aaccaaucac 13140 uaauuguguu aagauguugu guacacacac ugguacuggu caggcaauaa caguuacacc 13200 ggaagccaau auggaucaag aauccuuugg uggugcaucg uguugucugu acugccguug 13260 ccacauagau cauccaaauc cuaaaggauu uugugacuua aaagguaagu auguacaaau 13320 accuacaacu ugugcuaaug acccuguggg uuuuacacuu aaaaacacag ucuguaccgu 13380 cugcgguaug uggaaagguu auggcuguag uugugaucaa cuccgcgaac ccaugcuuca 13440 gucagcugau gcacaaucgu uuuuaaacgg guuugcggug uaagugcagc ccgucuuaca 13500 ccgugcggca caggcacuag uacugauguc guauacaggg cuuuugacau cuacaaugau 13560 aaaguagcug guuuugcuaa auuccuaaaa acuaauuguu gucgcuucca agaaaaggac 13620 gaagaugaca auuuaauuga uucuuacuuu guaguuaaga gacacacuuu cucuaacuac 13680 caacaugaag aaacaauuua uaauuuacuu aaggauuguc cagcuguugc uaaacaugac 13740 uucuuuaagu uuagaauaga cggugacaug guaccacaua uaucacguca acgucuuacu 13800 aaauacacaa uggcagaccu cgucuaugcu uuaaggcauu uugaugaagg uaauugugac 13860 acauuaaaag aaauacuugu cacauacaau uguugugaug augauuauuu caauaaaaag 13920 gacugguaug auuuuguaga aaacccagau auauuacgcg uauacgccaa cuuaggugaa 13980 cguguacgcc aagcuuuguu aaaaacagua caauucugug augccaugcg aaaugcuggu 14040 auuguuggug uacugacauu agauaaucaa gaucucaaug guaacuggua ugauuucggu 14100 gauuucauac aaaccacgcc agguagugga guuccuguug uagauucuua uuauucauug 14160 uuaaugccua uauuaaccuu gaccagggcu uuaacugcag agucacaugu ugacacugac 14220 uuaacaaagc cuuacauuaa gugggauuug uuaaaauaug acuucacgga agagagguua 14280 aaacucuuug accguuauuu uaaauauugg gaucagacau accacccaaa uuguguuaac 14340 uguuuggaug acagaugcau ucugcauugu gcaaacuuua auguuuuauu cucuacagug 14400 uucccaccua caaguuuugg accacuagug agaaaaauau uuguugaugg uguuccauuu 14460 guaguuucaa cuggauacca cuucagagag cuagguguug uacauaauca ggauguaaac 14520 uuacauagcu cuagacuuag uuuuaaggaa uuacuugugu augcugcuga cccugcuaug 14580 cacgcugcuu cugguaaucu auuacuagau aaacgcacua cgugcuuuuc aguagcugca 14640 cuuacuaaca auguugcuuu ucaaacuguc aaacccggua auuuuaacaa agacuucuau 14700 gacuuugcug ugucuaaggg uuucuuuaag gaaggaaguu cuguugaauu aaaacacuuc 14760 uucuuugcuc aggaugguaa ugcugcuauc agcgauuaug acuacuaucg uuauaaucua 14820 ccaacaaugu gugauaucag acaacuacua uuuguaguug aaguuguuga uaaguacuuu 14880 gauuguuacg augguggcug uauuaaugcu aaccaaguca ucgucaacaa ccuagacaaa 14940 ucagcugguu uuccauuuaa uaaauggggu aaggcuagac uuuauuauga uucaaugagu 15000 uaugaggauc aagaugcacu uuucgcauau acaaaacgua augucauccc uacuauaacu 15060 caaaugaauc uuaaguaugc cauuagugca aagaauagag cucgcaccgu agcugguguc 15120 ucuaucugua guacuaugac caauagacag uuucaucaaa aauuauugaa aucaauagcc 15180 gccacuagag gagcuacugu aguaauugga acaagcaaau ucuauggugg uuggcacaac 15240 auguuaaaaa cuguuuauag ugauguagaa aacccucacc uuauggguug ggauuauccu 15300 aaaugugaua gagccaugcc uaacaugcuu agaauuaugg ccucacuugu ucuugcucgc 15360 aaacauacaa cguguuguag cuugucacac cguuucuaua gauuagcuaa ugagugugcu 15420 caaguauuga gugaaauggu cauguguggc gguucacuau auguuaaacc agguggaacc 15480 ucaucaggag augccacaac ugcuuaugcu aauaguguuu uuaacauuug ucaagcuguc 15540 acggccaaug uuaaugcacu uuuaucuacu gaugguaaca aaauugccga uaaguauguc 15600 cgcaauuuac aacacagacu uuaugagugu cucuauagaa auagagaugu ugacacagac 15660 uuugugaaug aguuuuacgc auauuugcgu aaacauuucu caaugaugau acucucugac 15720 gaugcuguug uguguuucaa uagcacuuau gcaucucaag gucuaguggc uagcauaaag 15780 aacuuuaagu caguucuuua uuaucaaaac aauguuuuua ugucugaagc aaaauguugg 15840 acugagacug accuuacuaa aggaccucau gaauuuugcu cucaacauac aaugcuaguu 15900 aaacagggug augauuaugu guaccuuccu uacccagauc caucaagaau ccuaggggcc 15960 ggcuguuuug uagaugauau cguaaaaaca gaugguacac uuaugauuga acgguucgug 16020 ucuuuagcua uagaugcuua cccacuuacu aaacauccua aucaggagua ugcugauguc 16080 uuucauuugu acuuacaaua cauaagaaag cuacaugaug aguuaacagg acacauguua 16140 gacauguauu cuguuaugcu uacuaaugau aacacuucaa gguauuggga accugaguuu 16200 uaugaggcua uguacacacc gcauacaguc uuacaggcug uuggggcuug uguucuuugc 16260 aauucacaga cuucauuaag auguggugcu ugcauacgua gaccauucuu auguuguaaa 16320 ugcuguuacg accaugucau aucaacauca cauaaauuag ucuugucugu uaauccguau 16380 guuugcaaug cuccagguug ugaugucaca gaugugacuc aacuuuacuu aggagguaug 16440 agcuauuauu guaaaucaca uaaaccaccc auuaguuuuc cauugugugc uaauggacaa 16500 guuuuugguu uauauaaaaa uacauguguu gguagcgaua auguuacuga cuuuaaugca 16560 auugcaacau gugacuggac aaaugcuggu gauuacauuu uagcuaacac cuguacugaa 16620 agacucaagc uuuuugcagc agaaacgcuc aaagcuacug aggagacauu uaaacugucu 16680 uaugguauug cuacuguacg ugaagugcug ucugacagag aauuacaucu uucaugggaa 16740 guugguaaac cuagaccacc acuuaaccga aauuaugucu uuacugguua ucguguaacu 16800 aaaaacagua aaguacaaau aggagaguac accuuugaaa aaggugacua uggugaugcu 16860 guuguuuacc gagguacaac aacuuacaaa uuaaauguug gugauuauuu ugugcugaca 16920 ucacauacag uaaugccauu aagugcaccu acacuagugc cacaagagca cuauguuaga 16980 auuacuggcu uauacccaac acucaauauc ucagaugagu uuucuagcaa uguugcaaau 17040 uaucaaaagg uugguaugca aaaguauucu acacuccagg gaccaccugg uacugguaag 17100 agucauuuug cuauuggccu agcucucuac uacccuucug cucgcauagu guauacagcu 17160 ugcucucaug ccgcuguuga ugcacuaugu gagaaggcau uaaaauauuu gccuauagau 17220 aaauguagua gaauuauacc ugcacgugcu cguguagagu guuuugauaa auucaaagug 17280 aauucaacau uagaacagua ugucuuuugu acuguaaaug cauugccuga gacgacagca 17340 gauauaguug ucuuugauga aauuucaaug gccacaaauu augauuugag uguugucaau 17400 gccagauuac gugcuaagca cuauguguac auuggcgacc cugcucaauu accugcacca 17460 cgcacauugc uaacuaaggg cacacuagaa ccagaauauu ucaauucagu guguagacuu 17520 augaaaacua uagguccaga cauguuccuc ggaacuuguc ggcguugucc ugcugaaauu 17580 guugacacug ugagugcuuu gguuuaugau aauaagcuua aagcacauaa agacaaauca 17640 gcucaaugcu uuaaaauguu uuauaagggu guuaucacgc augauguuuc aucugcaauu 17700 aacaggccac aaauaggcgu gguaagagaa uuccuuacac guaacccugc uuggagaaaa 17760 gcugucuuua uuucaccuua uaauucacag aaugcuguag ccucaaagau uuugggacua 17820 ccaacucaaa cuguugauuc aucacagggc ucagaauaug acuaugucau auucacucaa 17880 accacugaaa cagcucacuc uuguaaugua aacagauuua auguugcuau uaccagagca 17940 aaaguaggca uacuuugcau aaugucugau agagaccuuu augacaaguu gcaauuuaca 18000 agucuugaaa uuccacguag gaauguggca acuuuacaag cugaaaaugu aacaggacuc 18060 uuuaaagauu guaguaaggu aaucacuggg uuacauccua cacaggcacc uacacaccuc 18120 aguguugaca cuaaauucaa aacugaaggu uuauguguug acauaccugg cauaccuaag 18180 gacaugaccu auagaagacu caucucuaug auggguuuua aaaugaauua ucaaguuaau 18240 gguuacccua acauguuuau cacccgcgaa gaagcuauaa gacauguacg ugcauggauu 18300 ggcuucgaug ucgaggggug ucaugcuacu agagaagcug uugguaccaa uuuaccuuua 18360 cagcuagguu uuucuacagg uguuaaccua guugcuguac cuacagguua uguugauaca 18420 ccuaauaaua cagauuuuuc cagaguuagu gcuaaaccac cgccuggaga ucaauuuaaa 18480 caccucauac cacuuaugua caaaggacuu ccuuggaaug uagugcguau aaagauugua 18540 caaauguuaa gugacacacu uaaaaaucuc ucugacagag ucguauuugu cuuaugggca 18600 cauggcuuug aguugacauc uaugaaguau uuugugaaaa uaggaccuga gcgcaccugu 18660 ugucuaugug auagacgugc cacaugcuuu uccacugcuu cagacacuua ugccuguugg 18720 caucauucua uuggauuuga uuacgucuau aauccguuua ugauugaugu ucaacaaugg 18780 gguuuuacag guaaccuaca aagcaaccau gaucuguauu gucaagucca ugguaaugca 18840 cauguagcua guugugaugc aaucaugacu aggugucuag cuguccacga gugcuuuguu 18900 aagcguguug acuggacuau ugaauauccu auaauuggug augaacugaa gauuaaugcg 18960 gcuuguagaa agguucaaca caugguuguu aaagcugcau uauuagcaga caaauuccca 19020 guucuucacg acauugguaa cccuaaagcu auuaagugug uaccucaagc ugauguagaa 19080 uggaaguucu augaugcaca gccuuguagu gacaaagcuu auaaaauaga agaauuauuc 19140 uauucuuaug ccacacauuc ugacaaauuc acagauggug uaugccuauu uuggaauugc 19200 aaugucgaua gauauccugc uaauuccauu guuuguagau uugacacuag agugcuaucu 19260 aaccuuaacu ugccugguug ugaugguggc aguuuguaug uaaauaaaca ugcauuccac 19320 acaccagcuu uugauaaaag ugcuuuuguu aauuuaaaac aauuaccauu uuucuauuac 19380 ucugacaguc caugugaguc ucauggaaaa caaguagugu cagauauaga uuauguacca 19440 cuaaagucug cuacguguau aacacguugc aauuuaggug gugcugucug uagacaucau 19500 gcuaaugagu acagauugua ucucgaugcu uauaacauga ugaucucagc uggcuuuagc 19560 uuguggguuu acaaacaauu ugauacuuau aaccucugga acacuuuuac aagacuucag 19620 aguuuagaaa auguggcuuu uaauguugua aauaagggac acuuugaugg acaacagggu 19680 gaaguaccag uuucuaucau uaauaacacu guuuacacaa aaguugaugg uguugaugua 19740 gaauuguuug aaaauaaaac aacauuaccu guuaauguag cauuugagcu uugggcuaag 19800 cgcaacauua aaccaguacc agaggugaaa auacucaaua auuugggugu ggacauugcu 19860 gcuaauacug ugaucuggga cuacaaaaga gaugcuccag cacauauauc uacuauuggu 19920 guuuguucua ugacugacau agccaagaaa ccaacugaaa cgauuugugc accacucacu 19980 gucuuuuuug augguagagu ugauggucaa guagacuuau uuagaaaugc ccguaauggu 20040 guucuuauua cagaagguag uguuaaaggu uuacaaccau cuguaggucc caaacaagcu 20100 agucuuaaug gagucacauu aauuggagaa gccguaaaaa cacaguucaa uuauuauaag 20160 aaaguugaug guguugucca acaauuaccu gaaacuuacu uuacucagag uagaaauuua 20220 caagaauuua aacccaggag ucaaauggaa auugauuucu uagaauuagc uauggaugaa 20280 uucauugaac gguauaaauu agaaggcuau gccuucgaac auaucguuua uggagauuuu 20340 agucauaguc aguuaggugg uuuacaucua cugauuggac uagcuaaacg uuuuaaggaa 20400 ucaccuuuug aauuagaaga uuuuauuccu auggacagua caguuaaaaa cuauuucaua 20460 acagaugcgc aaacagguuc aucuaagugu guguguucug uuauugauuu auuacuugau 20520 gauuuuguug aaauaauaaa aucccaagau uuaucuguag uuucuaaggu ugucaaagug 20580 acuauugacu auacagaaau uucauuuaug cuuuggugua aagauggcca uguagaaaca 20640 uuuuacccaa aauuacaauc uagucaagcg uggcaaccgg guguugcuau gccuaaucuu 20700 uacaaaaugc aaagaaugcu auuagaaaag ugugaccuuc aaaauuaugg ugauagugca 20760 acauuaccua aaggcauaau gaugaauguc gcaaaauaua cucaacugug ucaauauuua 20820 aacacauuaa cauuagcugu acccuauaau augagaguua uacauuuugg ugcugguucu 20880 gauaaaggag uugcaccagg uacagcuguu uuaagacagu gguugccuac ggguacgcug 20940 cuugucgauu cagaucuuaa ugacuuuguc ucugaugcag auucaacuuu gauuggugau 21000 ugugcaacug uacauacagc uaauaaaugg gaucucauua uuagugauau guacgacccu 21060 aagacuaaaa auguuacaaa agaaaaugac ucuaaagagg guuuuuucac uuacauuugu 21120 ggguuuauac aacaaaagcu agcucuugga gguuccgugg cuauaaagau aacagaacau 21180 ucuuggaaug cugaucuuua uaagcucaug ggacacuucg caugguggac agccuuuguu 21240 acuaauguga augcgucauc aucugaagca uuuuuaauug gauguaauua ucuuggcaaa 21300 ccacgcgaac aaauagaugg uuaugucaug caugcaaauu acauauuuug gaggaauaca 21360 aauccaauuc aguugucuuc cuauucuuua uuugacauga guaaauuucc ccuuaaauua 21420 agggguacug cuguuauguc uuuaaaagaa ggucaaauca augauaugau uuuaucucuu 21480 cuuaguaaag guagacuuau aauuagagaa aacaacagag uuguuauuuc uagugauguu 21540 cuuguuaaca acuaaacgaa caauguuugu uuuucuuguu uuauugccac uagucucuag 21600 ucaguguguu aaucuuacaa ccagaacuca auuacccccu gcauacacua auucuuucac 21660 acgugguguu uauuacccug acaaaguuuu cagauccuca guuuuacauu caacucagga 21720 cuuguucuua ccuuucuuuu ccaauguuac uugguuccau gcuauacaug ucucugggac 21780 caaugguacu aagagguuug auaacccugu ccuaccauuu aaugauggug uuuauuuugc 21840 uuccacugag aagucuaaca uaauaagagg cuggauuuuu gguacuacuu uagauucgaa 21900 gacccagucc cuacuuauug uuaauaacgc uacuaauguu guuauuaaag ucugugaauu 21960 ucaauuuugu aaugauccau uuuugggugu uuauuaccac aaaaacaaca aaaguuggau 22020 ggaaagugag uucagaguuu auucuagugc gaauaauugc acuuuugaau augucucuca 22080 gccuuuucuu auggaccuug aaggaaaaca ggguaauuuc aaaaaucuua gggaauuugu 22140 guuuaagaau auugaugguu auuuuaaaau auauucuaag cacacgccua uuaauuuagu 22200 gcgugaucuc ccucaggguu uuucggcuuu agaaccauug guagauuugc caauagguau 22260 uaacaucacu agguuucaaa cuuuacuugc uuuacauaga aguuauuuga cuccugguga 22320 uucuucuuca gguuggacag cuggugcugc agcuuauuau guggguuauc uucaaccuag 22380 gacuuuucua uuaaaauaua augaaaaugg aaccauuaca gaugcuguag acugugcacu 22440 ugacccucuc ucagaaacaa aguguacguu gaaauccuuc acuguagaaa aaggaaucua 22500 ucaaacuucu aacuuuagag uccaaccaac agaaucuauu guuagauuuc cuaauauuac 22560 aaacuugugc ccuuuuggug aaguuuuuaa cgccaccaga uuugcaucug uuuaugcuug 22620 gaacaggaag agaaucagca acuguguugc ugauuauucu guccuauaua auuccgcauc 22680 auuuuccacu uuuaaguguu auggaguguc uccuacuaaa uuaaaugauc ucugcuuuac 22740 uaaugucuau gcagauucau uuguaauuag aggugaugaa gucagacaaa ucgcuccagg 22800 gcaaacugga aagauugcug auuauaauua uaaauuacca gaugauuuua caggcugcgu 22860 uauagcuugg aauucuaaca aucuugauuc uaagguuggu gguaauuaua auuaccugua 22920 uagauuguuu aggaagucua aucucaaacc uuuugagaga gauauuucaa cugaaaucua 22980 ucaggccggu agcacaccuu guaauggugu ugaagguuuu aauuguuacu uuccuuuaca 23040 aucauauggu uuccaaccca cuaauggugu ugguuaccaa ccauacagag uaguaguacu 23100 uucuuuugaa cuucuacaug caccagcaac uguuugugga ccuaaaaagu cuacuaauuu 23160 gguuaaaaac aaauguguca auuucaacuu caaugguuua acaggcacag guguucuuac 23220 ugagucuaac aaaaaguuuc ugccuuucca acaauuuggc agagacauug cugacacuac 23280 ugaugcuguc cgugauccac agacacuuga gauucuugac auuacaccau guucuuuugg 23340 uggugucagu guuauaacac caggaacaaa uacuucuaac cagguugcug uucuuuauca 23400 ggauguuaac ugcacagaag ucccuguugc uauucaugca gaucaacuua cuccuacuug 23460 gcguguuuau ucuacagguu cuaauguuuu ucaaacacgu gcaggcuguu uaauaggggc 23520 ugaacauguc aacaacucau augaguguga cauacccauu ggugcaggua uaugcgcuag 23580 uuaucagacu cagacuaauu cuccucggcg ggcacguagu guagcuaguc aauccaucau 23640 ugccuacacu augucacuug gugcagaaaa uucaguugcu uacucuaaua acucuauugc 23700 cauacccaca aauuuuacua uuaguguuac cacagaaauu cuaccagugu cuaugaccaa 23760 gacaucagua gauuguacaa uguacauuug uggugauuca acugaaugca gcaaucuuuu 23820 guugcaauau ggcaguuuuu guacacaauu aaaccgugcu uuaacuggaa uagcuguuga 23880 acaagacaaa aacacccaag aaguuuuugc acaagucaaa caaauuuaca aaacaccacc 23940 aauuaaagau uuuggugguu uuaauuuuuc acaaauauua ccagauccau caaaaccaag 24000 caagagguca uuuauugaag aucuacuuuu caacaaagug acacuugcag augcuggcuu 24060 caucaaacaa uauggugauu gccuugguga uauugcugcu agagaccuca uuugugcaca 24120 aaaguuuaac ggccuuacug uuuugccacc uuugcucaca gaugaaauga uugcucaaua 24180 cacuucugca cuguuagcgg guacaaucac uucugguugg accuuuggug caggugcugc 24240 auuacaaaua ccauuugcua ugcaaauggc uuauagguuu aaugguauug gaguuacaca 24300 gaauguucuc uaugagaacc aaaaauugau ugccaaccaa uuuaauagug cuauuggcaa 24360 aauucaagac ucacuuucuu ccacagcaag ugcacuugga aaacuucaag auguggucaa 24420 ccaaaaugca caagcuuuaa acacgcuugu uaaacaacuu agcuccaauu uuggugcaau 24480 uucaaguguu uuaaaugaua uccuuucacg ucuugacaaa guugaggcug aagugcaaau 24540 ugauagguug aucacaggca gacuucaaag uuugcagaca uaugugacuc aacaauuaau 24600 uagagcugca gaaaucagag cuucugcuaa ucuugcugcu acuaaaaugu cagagugugu 24660 acuuggacaa ucaaaaagag uugauuuuug uggaaagggc uaucaucuua uguccuuccc 24720 ucagucagca ccucauggug uagucuucuu gcaugugacu uaugucccug cacaagaaaa 24780 gaacuucaca acugcuccug ccauuuguca ugauggaaaa gcacacuuuc cucgugaagg 24840 ugucuuuguu ucaaauggca cacacugguu uguaacacaa aggaauuuuu augaaccaca 24900 aaucauuacu acagacaaca cauuuguguc ugguaacugu gauguuguaa uaggaauugu 24960 caacaacaca guuuaugauc cuuugcaacc ugaauuagac ucauucaagg aggaguuaga 25020 uaaauauuuu aagaaucaua caucaccaga uguugauuua ggugacaucu cuggcauuaa 25080 ugcuucaguu guaaacauuc aaaaagaaau ugaccgccuc aaugagguug ccaagaauuu 25140 aaaugaaucu cucaucgauc uccaagaacu uggaaaguau gagcaguaua uaaaauggcc 25200 augguacauu uggcuagguu uuauagcugg cuugauugcc auaguaaugg ugacaauuau 25260 gcuuugcugu augaccaguu gcuguaguug ucucaagggc uguuguucuu guggauccug 25320 cugcaaauuu gaugaagacg acucugagcc agugcucaaa ggagucaaau uacauuacac 25380 auaaacgaac uuauggauuu guuuaugaga aucuucacaa uuggaacugu aacuuugaag 25440 caaggugaaa ucaaggaugc uacuccuuca gauuuuguuc gcgcuacugc aacgauaccg 25500 auacaagccu cacucccuuu cggauggcuu auuguuggcg uugcacuucu ugcuguuuuu 25560 cagagcgcuu ccaaaaucau aacccucaaa aagagauggc aacuagcacu cuccaagggu 25620 guucacuuug uuugcaacuu gcuguuguug uuuguaacag uuuacucaca ccuuuugcuc 25680 guugcugcug gccuugaagc cccuuuucuc uaucuuuaug cuuuagucua cuucuugcag 25740 aguauaaacu uuguaagaau aauaaugagg cuuuggcuuu gcuggaaaug ccguuccaaa 25800 aacccauuac uuuaugaugc caacuauuuu cuuugcuggc auacuaauug uuacgacuau 25860 uguauaccuu acaauagugu aacuucuuca auugucauua cuucagguga uggcacaaca 25920 aguccuauuu cugaacauga cuaccagauu ggugguuaua cugaaaaaug ggaaucugga 25980 guaaaagacu guguuguauu acacaguuac uucacuucag acuauuacca gcuguacuca 26040 acucaauuga guacagacac ugguguugaa cauguuaccu ucuucaucua caauaaaauu 26100 guugaugagc cugaagaaca uguccaaauu cacacaaucg acgguucauc cggaguuguu 26160 aauccaguaa uggaaccaau uuaugaugaa ccgacgacga cuacuagcgu gccuuuguaa 26220 gcacaagcug augaguacga acuuauguac ucauucguuu cggaagagac agguacguua 26280 auaguuaaua gcguacuucu uuuucuugcu uucgugguau ucuugcuagu uacacuagcc 26340 auccuuacug cgcuucgauu gugugcguac ugcugcaaua uuguuaacgu gagucuugua 26400 aaaccuucuu uuuacguuua cucucguguu aaaaaucuga auucuucuag aguuccugau 26460 cuucuggucu aaacgaacua aauauuauau uaguuuuucu guuuggaacu uuaauuuuag 26520 ccauggcaga uuccaacggu acuauuaccg uugaagagcu uaaaaagcuc cuugaacaau 26580 ggaaccuagu aauagguuuc cuauuccuua cauggauuug ucuucuacaa uuugccuaug 26640 ccaacaggaa uagguuuuug uauauaauua aguuaauuuu ccucuggcug uuauggccag 26700 uaacuuuagc uuguuuugug cuugcugcug uuuacagaau aaauuggauc accgguggaa 26760 uugcuaucgc aauggcuugu cuuguaggcu ugauguggcu cagcuacuuc auugcuucuu 26820 ucagacuguu ugcgcguacg cguuccaugu ggucauucaa uccagaaacu aacauucuuc 26880 ucaacgugcc acuccauggc acuauucuga ccagaccgcu ucuagaaagu gaacucguaa 26940 ucggagcugu gauccuucgu ggacaucuuc guauugcugg acaccaucua ggacgcugug 27000 acaucaagga ccugccuaaa gaaaucacug uugcuacauc acgaacgcuu ucuuauuaca 27060 aauugggagc uucgcagcgu guagcaggug acucagguuu ugcugcauac agucgcuaca 27120 ggauuggcaa cuauaaauua aacacagacc auuccaguag cagugacaau auugcuuugc 27180 uuguacagua agugacaaca gauguuucau cucguugacu uucagguuac uauagcagag 27240 auauuacuaa uuauuaugag gacuuuuaaa guuuccauuu ggaaucuuga uuacaucaua 27300 aaccucauaa uuaaaaauuu aucuaaguca cuaacugaga auaaauauuc ucaauuagau 27360 gaagagcaac caauggagau ugauuaaacg aacaugaaaa uuauucuuuu cuuggcacug 27420 auaacacucg cuacuuguga gcuuuaucac uaccaagagu guguuagagg uacaacagua 27480 cuuuuaaaag aaccuugcuc uucuggaaca uacgagggca auucaccauu ucauccucua 27540 gcugauaaca aauuugcacu gacuugcuuu agcacucaau uugcuuuugc uuguccugac 27600 ggcguaaaac acgucuauca guuacgugcc agaucaguuu caccuaaacu guucaucaga 27660 caagaggaag uucaagaacu uuacucucca auuuuucuua uuguugcggc aauaguguuu 27720 auaacacuuu gcuucacacu caaaagaaag acagaaugau ugaacuuuca uuaauugacu 27780 ucuauuugug cuuuuuagcc uuucugcuau uccuuguuuu aauuaugcuu auuaucuuuu 27840 gguucucacu ugaacugcaa gaucauaaug aaacuuguca cgccuaaacg aacaugaaau 27900 uucuuguuuu cuuaggaauc aucacaacug uagcugcauu ucaccaagaa uguaguuuac 27960 agucauguac ucaacaucaa ccauauguag uugaugaccc guguccuauu cacuucuauu 28020 cuaaauggua uauuagagua ggagcuagaa aaucagcacc uuuaauugaa uugugcgugg 28080 augaggcugg uucuaaauca cccauucagu acaucgauau cgguaauuau acaguuuccu 28140 guuuaccuuu uacaauuaau ugccaggaac cuaaauuggg uagucuugua gugcguuguu 28200 cguucuauga agacuuuuua gaguaucaug acguucgugu uguuuuagau uucaucuaaa 28260 cgaacaaacu aaaaugucug auaauggacc ccaaaaucag cgaaaugcac cccgcauuac 28320 guuuggugga cccucagauu caacuggcag uaaccagaau ggagaacgca guggggcgcg 28380 aucaaaacaa cgucggcccc aagguuuacc caauaauacu gcgucuuggu ucaccgcucu 28440 cacucaacau ggcaaggaag accuuaaauu cccucgagga caaggcguuc caauuaacac 28500 caauagcagu ccagaugacc aaauuggcua cuaccgaaga gcuaccagac gaauucgugg 28560 uggugacggu aaaaugaaag aucucagucc aagaugguau uucuacuacc uaggaacugg 28620 gccagaagcu ggacuucccu auggugcuaa caaagacggc aucauauggg uugcaacuga 28680 gggagccuug aauacaccaa aagaucacau uggcacccgc aauccugcua acaaugcugc 28740 aaucgugcua caacuuccuc aaggaacaac auugccaaaa ggcuucuacg cagaagggag 28800 cagaggcggc agucaagccu cuucucguuc cucaucacgu agucgcaaca guucaagaaa 28860 uucaacucca ggcagcagua ggggaacuuc uccugcuaga auggcuggca auggcgguga 28920 ugcugcucuu gcuuugcugc ugcuugacag auugaaccag cuugagagca aaaugucugg 28980 uaaaggccaa caacaacaag gccaaacugu cacuaagaaa ucugcugcug aggcuucuaa 29040 gaagccucgg caaaaacgua cugccacuaa agcauacaau guaacacaag cuuucggcag 29100 acguggucca gaacaaaccc aaggaaauuu uggggaccag gaacuaauca gacaaggaac 29160 ugauuacaaa cauuggccgc aaauugcaca auuugccccc agcgcuucag cguucuucgg 29220 aaugucgcgc auuggcaugg aagucacacc uucgggaacg ugguugaccu acacaggugc 29280 caucaaauug gaugacaaag auccaaauuu caaagaucaa gucauuuugc ugaauaagca 29340 uauugacgca uacaaaacau ucccaccaac agagccuaaa aaggacaaaa agaagaaggc 29400 ugaugaaacu caagccuuac cgcagagaca gaagaaacag caaacuguga cucuucuucc 29460 ugcugcagau uuggaugauu ucuccaaaca auugcaacaa uccaugagca gugcugacuc 29520 aacucaggcc uaaacucaug cagaccacac aaggcagaug ggcuauauaa acguuuucgc 29580 uuuuccguuu acgauauaua gucuacucuu gugcagaaug aauucucgua acuacauagc 29640 acaaguagau guaguuaacu uuaaucucac auagcaaucu uuaaucagug uguaacauua 29700 gggaggacuu gaaagagcca ccacauuuuc accgaggcca cgcggaguac gaucgagugu 29760 acagugaaca augcuaggga gagcugccua uauggaagag cccuaaugug uaaaauuaau 29820 uuuaguagug cuauccccau gugauuuuaa uagcuucuua ggagaaugac aaaaaaaaaa 29880 aaaaaaaaaa aaaaaaaaaa aaa 29903 <210> 7 <211> 29903 <212> RNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 7 uuuuuuuuuu uuuuuuuuuu uuuuuuuuuu uuugucauuc uccuaagaag cuauuaaaau 60 cacaugggga uagcacuacu aaaauuaauu uuacacauua gggcucuucc auauaggcag 120 cucucccuag cauuguucac uguacacucg aucguacucc gcguggccuc ggugaaaaug 180 ugguggcucu uucaaguccu cccuaauguu acacacugau uaaagauugc uaugugagau 240 uaaaguuaac uacaucuacu ugugcuaugu aguuacgaga auucauucug cacaagagua 300 gacuauauau cguaaacgga aaagcgaaaa cguuuauaua gcccaucugc cuuguguggu 360 cugcaugagu uuaggccuga guugagucag cacugcucau ggauuguugc aauuguuugg 420 agaaaucauc caaaucugca gcaggaagaa gagucacagu uugcuguuuc uucugucucu 480 gcgguaaggc uugaguuuca ucagccuucu ucuuuuuguc cuuuuuaggc ucuguuggug 540 ggaauguuuu guaugcguca auaugcuuau ucagcaaaau gacuugaucu uugaaauuug 600 gaucuuuguc auccaauuug auggcaccug uguaggucaa ccacguuccc gaagguguga 660 cuuccaugcc aaugcgcgac auuccgaaga acgcugaagc gcugggggca aauugugcaa 720 uuugcggcca auguuuguaa ucaguuccuu gucugauuag uuccuggucc ccaaaauuuc 780 cuuggguuug uucuggacca cgucugccga aagcuugugu uacauuguau gcuuuagugg 840 caguacguuu uugccgaggc uucuuagaag ccucagcagc agauuucuua gugacaguuu 900 ggccuuguug uuguuggccu uuaccagaca uuuugcucuc aagcugguuc aaucugucaa 960 gcagcagcaa agcaagagca gcaucaccgc cauugccagc cauucuagca ggagaaguuc 1020 cccuacugcu gccuggaguu gaauuucuug aacuguugcg acuacgugau gaggaacgag 1080 aagaggcuug acugccgccu cugcucccuu cugcguagaa gccuuuuggc aauguuguuc 1140 cuugaggaag uuguagcacg auugcagcau uguuagcagg auugcgggug ccaaugugau 1200 cuuuuggugu auucaaggcu cccucaguug caacccauau gaugccgucu uuguuagcac 1260 cauagggaag uccagcuucu ggcccaguuc cuagguagua gaaauaccau cuuggacuga 1320 gaucuuucau uuuaccguca ccaccacgaa uucgucuggu agcucuucgg uaguagccaa 1380 uuuggucauc uggacugcua uugguguuaa uuggaacgcc uuguccucga gggaauuuaa 1440 ggucuuccuu gccauguuga gugagagcgg ugaaccaaga cgcaguauua uuggguaaac 1500 cuuggggccg acguuguuuu gaucgcgccc cacugcguuc uccauucugg uuacugccag 1560 uugaaucuga ggguccacca aacguaaugc ggggugcauu ucgcugauuu ugggguccau 1620 uaucagacau uuuaguuugu ucguuuagau gaaaucuaaa acaacacgaa cgucaugaua 1680 cucuaaaaag ucuucauaga acgaacaacg cacuacaaga cuacccaauu uagguuccug 1740 gcaauuaauu guaaaaggua aacaggaaac uguauaauua ccgauaucga uguacugaau 1800 gggugauuua gaaccagccu cauccacgca caauucaauu aaaggugcug auuuucuagc 1860 uccuacucua auauaccauu uagaauagaa gugaauagga cacgggucau caacuacaua 1920 ugguugaugu ugaguacaug acuguaaacu acauucuugg ugaaaugcag cuacaguugu 1980 gaugauuccu aagaaaacaa gaaauuucau guucguuuag gcgugacaag uuucauuaug 2040 aucuugcagu ucaagugaga accaaaagau aauaagcaua auuaaaacaa ggaauagcag 2100 aaaggcuaaa aagcacaaau agaagucaau uaaugaaagu ucaaucauuc ugucuuucuu 2160 uugaguguga agcaaagugu uauaaacacu auugccgcaa caauaagaaa aauuggagag 2220 uaaaguucuu gaacuuccuc uugucugaug aacaguuuag gugaaacuga ucuggcacgu 2280 aacugauaga cguguuuuac gccgucagga caagcaaaag caaauugagu gcuaaagcaa 2340 gucagugcaa auuuguuauc agcuagagga ugaaauggug aauugcccuc guauguucca 2400 gaagagcaag guucuuuuaa aaguacuguu guaccucuaa cacacucuug guagugauaa 2460 agcucacaag uagcgagugu uaucagugcc aagaaaagaa uaauuuucau guucguuuaa 2520 ucaaucucca uugguugcuc uucaucuaau ugagaauauu uauucucagu uagugacuua 2580 gauaaauuuu uaauuaugag guuuaugaug uaaucaagau uccaaaugga aacuuuaaaa 2640 guccucauaa uaauuaguaa uaucucugcu auaguaaccu gaaagucaac gagaugaaac 2700 aucuguuguc acuuacugua caagcaaagc aauauuguca cugcuacugg aauggucugu 2760 guuuaauuua uaguugccaa uccuguagcg acuguaugca gcaaaaccug agucaccugc 2820 uacacgcugc gaagcuccca auuuguaaua agaaagcguu cgugauguag caacagugau 2880 uucuuuaggc agguccuuga ugucacagcg uccuagaugg uguccagcaa uacgaagaug 2940 uccacgaagg aucacagcuc cgauuacgag uucacuuucu agaagcgguc uggucagaau 3000 agugccaugg aguggcacgu ugagaagaau guuaguuucu ggauugaaug accacaugga 3060 acgcguacgc gcaaacaguc ugaaagaagc aaugaaguag cugagccaca ucaagccuac 3120 aagacaagcc auugcgauag caauuccacc ggugauccaa uuuauucugu aaacagcagc 3180 aagcacaaaa caagcuaaag uuacuggcca uaacagccag aggaaaauua acuuaauuau 3240 auacaaaaac cuauuccugu uggcauaggc aaauuguaga agacaaaucc auguaaggaa 3300 uaggaaaccu auuacuaggu uccauuguuc aaggagcuuu uuaagcucuu caacgguaau 3360 aguaccguug gaaucugcca uggcuaaaau uaaaguucca aacagaaaaa cuaauauaau 3420 auuuaguucg uuuagaccag aagaucagga acucuagaag aauucagauu uuuaacacga 3480 gaguaaacgu aaaaagaagg uuuuacaaga cucacguuaa caauauugca gcaguacgca 3540 cacaaucgaa gcgcaguaag gauggcuagu guaacuagca agaauaccac gaaagcaaga 3600 aaaagaagua cgcuauuaac uauuaacgua ccugucucuu ccgaaacgaa ugaguacaua 3660 aguucguacu caucagcuug ugcuuacaaa ggcacgcuag uagucgucgu cgguucauca 3720 uaaauugguu ccauuacugg auuaacaacu ccggaugaac cgucgauugu gugaauuugg 3780 acauguucuu caggcucauc aacaauuuua uuguagauga agaagguaac auguucaaca 3840 ccagugucug uacucaauug aguugaguac agcugguaau agucugaagu gaaguaacug 3900 uguaauacaa cacagucuuu uacuccagau ucccauuuuu caguauaacc accaaucugg 3960 uagucauguu cagaaauagg acuuguugug ccaucaccug aaguaaugac aauugaagaa 4020 guuacacuau uguaagguau acaauagucg uaacaauuag uaugccagca aagaaaauag 4080 uuggcaucau aaaguaaugg guuuuuggaa cggcauuucc agcaaagcca aagccucauu 4140 auuauucuua caaaguuuau acucugcaag aaguagacua aagcauaaag auagagaaaa 4200 ggggcuucaa ggccagcagc aacgagcaaa aggugugagu aaacuguuac aaacaacaac 4260 agcaaguugc aaacaaagug aacacccuug gagagugcua guugccaucu cuuuuugagg 4320 guuaugauuu uggaagcgcu cugaaaaaca gcaagaagug caacgccaac aauaagccau 4380 ccgaaaggga gugaggcuug uaucgguauc guugcaguag cgcgaacaaa aucugaagga 4440 guagcauccu ugauuucacc uugcuucaaa guuacaguuc caauugugaa gauucucaua 4500 aacaaaucca uaaguucguu uauguguaau guaauuugac uccuuugagc acuggcucag 4560 agucgucuuc aucaaauuug cagcaggauc cacaagaaca acagcccuug agacaacuac 4620 agcaacuggu cauacagcaa agcauaauug ucaccauuac uauggcaauc aagccagcua 4680 uaaaaccuag ccaaauguac cauggccauu uuauauacug cucauacuuu ccaaguucuu 4740 ggagaucgau gagagauuca uuuaaauucu uggcaaccuc auugaggcgg ucaauuucuu 4800 uuugaauguu uacaacugaa gcauuaaugc cagagauguc accuaaauca acaucuggug 4860 auguaugauu cuuaaaauau uuaucuaacu ccuccuugaa ugagucuaau ucagguugca 4920 aaggaucaua aacuguguug uugacaauuc cuauuacaac aucacaguua ccagacacaa 4980 auguguuguc uguaguaaug auuugugguu cauaaaaauu ccuuuguguu acaaaccagu 5040 gugugccauu ugaaacaaag acaccuucac gaggaaagug ugcuuuucca ucaugacaaa 5100 uggcaggagc aguugugaag uucuuuucuu gugcagggac auaagucaca ugcaagaaga 5160 cuacaccaug aggugcugac ugagggaagg acauaagaug auagcccuuu ccacaaaaau 5220 caacucuuuu ugauugucca aguacacacu cugacauuuu aguagcagca agauuagcag 5280 aagcucugau uucugcagcu cuaauuaauu guugagucac auaugucugc aaacuuugaa 5340 gucugccugu gaucaaccua ucaauuugca cuucagccuc aacuuuguca agacgugaaa 5400 ggauaucauu uaaaacacuu gaaauugcac caaaauugga gcuaaguugu uuaacaagcg 5460 uguuuaaagc uugugcauuu ugguugacca caucuugaag uuuuccaagu gcacuugcug 5520 uggaagaaag ugagucuuga auuuugccaa uagcacuauu aaauugguug gcaaucaauu 5580 uuugguucuc auagagaaca uucuguguaa cuccaauacc auuaaaccua uaagccauuu 5640 gcauagcaaa ugguauuugu aaugcagcac cugcaccaaa gguccaacca gaagugauug 5700 uacccgcuaa cagugcagaa guguauugag caaucauuuc aucugugagc aaagguggca 5760 aaacaguaag gccguuaaac uuuugugcac aaaugagguc ucuagcagca auaucaccaa 5820 ggcaaucacc auauuguuug augaagccag caucugcaag ugucacuuug uugaaaagua 5880 gaucuucaau aaaugaccuc uugcuugguu uugauggauc ugguaauauu ugugaaaaau 5940 uaaaaccacc aaaaucuuua auugguggug uuuuguaaau uuguuugacu ugugcaaaaa 6000 cuucuugggu guuuuugucu uguucaacag cuauuccagu uaaagcacgg uuuaauugug 6060 uacaaaaacu gccauauugc aacaaaagau ugcugcauuc aguugaauca ccacaaaugu 6120 acauuguaca aucuacugau gucuugguca uagacacugg uagaauuucu gugguaacac 6180 uaauaguaaa auuugugggu auggcaauag aguuauuaga guaagcaacu gaauuuucug 6240 caccaaguga cauaguguag gcaaugaugg auugacuagc uacacuacgu gcccgccgag 6300 gagaauuagu cugagucuga uaacuagcgc auauaccugc accaaugggu augucacacu 6360 cauaugaguu guugacaugu ucagccccua uuaaacagcc ugcacguguu ugaaaaacau 6420 uagaaccugu agaauaaaca cgccaaguag gaguaaguug aucugcauga auagcaacag 6480 ggacuucugu gcaguuaaca uccugauaaa gaacagcaac cugguuagaa guauuuguuc 6540 cugguguuau aacacugaca ccaccaaaag aacauggugu aaugucaaga aucucaagug 6600 ucuguggauc acggacagca ucaguagugu cagcaauguc ucugccaaau uguuggaaag 6660 gcagaaacuu uuuguuagac ucaguaagaa caccugugcc uguuaaacca uugaaguuga 6720 aauugacaca uuuguuuuua accaaauuag uagacuuuuu agguccacaa acaguugcug 6780 gugcauguag aaguucaaaa gaaaguacua cuacucugua ugguugguaa ccaacaccau 6840 uaguggguug gaaaccauau gauuguaaag gaaaguaaca auuaaaaccu ucaacaccau 6900 uacaaggugu gcuaccggcc ugauagauuu caguugaaau aucucucuca aaagguuuga 6960 gauuagacuu ccuaaacaau cuauacaggu aauuauaauu accaccaacc uuagaaucaa 7020 gauuguuaga auuccaagcu auaacgcagc cuguaaaauc aucugguaau uuauaauuau 7080 aaucagcaau cuuuccaguu ugcccuggag cgauuugucu gacuucauca ccucuaauua 7140 caaaugaauc ugcauagaca uuaguaaagc agagaucauu uaauuuagua ggagacacuc 7200 cauaacacuu aaaaguggaa aaugaugcgg aauuauauag gacagaauaa ucagcaacac 7260 aguugcugau ucucuuccug uuccaagcau aaacagaugc aaaucuggug gcguuaaaaa 7320 cuucaccaaa agggcacaag uuuguaauau uaggaaaucu aacaauagau ucuguugguu 7380 ggacucuaaa guuagaaguu ugauagauuc cuuuuucuac agugaaggau uucaacguac 7440 acuuuguuuc ugagagaggg ucaagugcac agucuacagc aucuguaaug guuccauuuu 7500 cauuauauuu uaauagaaaa guccuagguu gaagauaacc cacauaauaa gcugcagcac 7560 cagcugucca accugaagaa gaaucaccag gagucaaaua acuucuaugu aaagcaagua 7620 aaguuugaaa ccuagugaug uuaauaccua uuggcaaauc uaccaauggu ucuaaagccg 7680 aaaaacccug agggagauca cgcacuaaau uaauaggcgu gugcuuagaa uauauuuuaa 7740 aauaaccauc aauauucuua aacacaaauu cccuaagauu uuugaaauua cccuguuuuc 7800 cuucaagguc cauaagaaaa ggcugagaga cauauucaaa agugcaauua uucgcacuag 7860 aauaaacucu gaacucacuu uccauccaac uuuuguuguu uuugugguaa uaaacaccca 7920 aaaauggauc auuacaaaau ugaaauucac agacuuuaau aacaacauua guagcguuau 7980 uaacaauaag uagggacugg gucuucgaau cuaaaguagu accaaaaauc cagccucuua 8040 uuauguuaga cuucucagug gaagcaaaau aaacaccauc auuaaauggu aggacagggu 8100 uaucaaaccu cuuaguacca uuggucccag agacauguau agcauggaac caaguaacau 8160 uggaaaagaa agguaagaac aaguccugag uugaauguaa aacugaggau cugaaaacuu 8220 ugucagggua auaaacacca cgugugaaag aauuagugua ugcagggggu aauugaguuc 8280 ugguuguaag auuaacacac ugacuagaga cuaguggcaa uaaaacaaga aaaacaaaca 8340 uuguucguuu aguuguuaac aagaacauca cuagaaauaa caacucuguu guuuucucua 8400 auuauaaguc uaccuuuacu aagaagagau aaaaucauau cauugauuug accuucuuuu 8460 aaagacauaa cagcaguacc ccuuaauuua aggggaaauu uacucauguc aaauaaagaa 8520 uaggaagaca acugaauugg auuuguauuc cuccaaaaua uguaauuugc augcaugaca 8580 uaaccaucua uuuguucgcg ugguuugcca agauaauuac auccaauuaa aaaugcuuca 8640 gaugaugacg cauucacauu aguaacaaag gcuguccacc augcgaagug ucccaugagc 8700 uuauaaagau cagcauucca agaauguucu guuaucuuua uagccacgga accuccaaga 8760 gcuagcuuuu guuguauaaa cccacaaaug uaagugaaaa aacccucuuu agagucauuu 8820 ucuuuuguaa cauuuuuagu cuuagggucg uacauaucac uaauaaugag aucccauuua 8880 uuagcuguau guacaguugc acaaucacca aucaaaguug aaucugcauc agagacaaag 8940 ucauuaagau cugaaucgac aagcagcgua cccguaggca accacugucu uaaaacagcu 9000 guaccuggug caacuccuuu aucagaacca gcaccaaaau guauaacucu cauauuauag 9060 gguacagcua auguuaaugu guuuaaauau ugacacaguu gaguauauuu ugcgacauuc 9120 aucauuaugc cuuuagguaa uguugcacua ucaccauaau uuugaagguc acacuuuucu 9180 aauagcauuc uuugcauuuu guaaagauua ggcauagcaa cacccgguug ccacgcuuga 9240 cuagauugua auuuugggua aaauguuucu acauggccau cuuuacacca aagcauaaau 9300 gaaauuucug uauagucaau agucacuuug acaaccuuag aaacuacaga uaaaucuugg 9360 gauuuuauua uuucaacaaa aucaucaagu aauaaaucaa uaacagaaca cacacacuua 9420 gaugaaccug uuugcgcauc uguuaugaaa uaguuuuuaa cuguacuguc cauaggaaua 9480 aaaucuucua auucaaaagg ugauuccuua aaacguuuag cuaguccaau caguagaugu 9540 aaaccaccua acugacuaug acuaaaaucu ccauaaacga uauguucgaa ggcauagccu 9600 ucuaauuuau accguucaau gaauucaucc auagcuaauu cuaagaaauc aauuuccauu 9660 ugacuccugg guuuaaauuc uuguaaauuu cuacucugag uaaaguaagu uucagguaau 9720 uguuggacaa caccaucaac uuucuuauaa uaauugaacu guguuuuuac ggcuucucca 9780 auuaauguga cuccauuaag acuagcuugu uugggaccua cagaugguug uaaaccuuua 9840 acacuaccuu cuguaauaag aacaccauua cgggcauuuc uaaauaaguc uacuugacca 9900 ucaacucuac caucaaaaaa gacagugagu ggugcacaaa ucguuucagu ugguuucuug 9960 gcuaugucag ucauagaaca aacaccaaua guagauauau gugcuggagc aucucuuuug 10020 uagucccaga ucacaguauu agcagcaaug uccacaccca aauuauugag uauuuucacc 10080 ucugguacug guuuaauguu gcgcuuagcc caaagcucaa augcuacauu aacagguaau 10140 guuguuuuau uuucaaacaa uucuacauca acaccaucaa cuuuugugua aacaguguua 10200 uuaaugauag aaacugguac uucacccugu uguccaucaa agugucccuu auuuacaaca 10260 uuaaaagcca cauuuucuaa acucugaagu cuuguaaaag uguuccagag guuauaagua 10320 ucaaauuguu uguaaaccca caagcuaaag ccagcugaga ucaucauguu auaagcaucg 10380 agauacaauc uguacucauu agcaugaugu cuacagacag caccaccuaa auugcaacgu 10440 guuauacacg uagcagacuu uagugguaca uaaucuauau cugacacuac uuguuuucca 10500 ugagacucac auggacuguc agaguaauag aaaaauggua auuguuuuaa auuaacaaaa 10560 gcacuuuuau caaaagcugg uguguggaau gcauguuuau uuacauacaa acugccacca 10620 ucacaaccag gcaaguuaag guuagauagc acucuagugu caaaucuaca aacaauggaa 10680 uuagcaggau aucuaucgac auugcaauuc caaaauaggc auacaccauc ugugaauuug 10740 ucagaaugug uggcauaaga auagaauaau ucuucuauuu uauaagcuuu gucacuacaa 10800 ggcugugcau cauagaacuu ccauucuaca ucagcuugag guacacacuu aauagcuuua 10860 ggguuaccaa ugucgugaag aacugggaau uugucugcua auaaugcagc uuuaacaacc 10920 auguguugaa ccuuucuaca agccgcauua aucuucaguu caucaccaau uauaggauau 10980 ucaauagucc agucaacacg cuuaacaaag cacucgugga cagcuagaca ccuagucaug 11040 auugcaucac aacuagcuac augugcauua ccauggacuu gacaauacag aucaugguug 11100 cuuuguaggu uaccuguaaa accccauugu ugaacaucaa ucauaaacgg auuauagacg 11160 uaaucaaauc caauagaaug augccaacag gcauaagugu cugaagcagu ggaaaagcau 11220 guggcacguc uaucacauag acaacaggug cgcucagguc cuauuuucac aaaauacuuc 11280 auagauguca acucaaagcc augugcccau aagacaaaua cgacucuguc agagagauuu 11340 uuaagugugu cacuuaacau uuguacaauc uuuauacgca cuacauucca aggaaguccu 11400 uuguacauaa gugguaugag guguuuaaau ugaucuccag gcggugguuu agcacuaacu 11460 cuggaaaaau cuguauuauu agguguauca acauaaccug uagguacagc aacuagguua 11520 acaccuguag aaaaaccuag cuguaaaggu aaauugguac caacagcuuc ucuaguagca 11580 ugacaccccu cgacaucgaa gccaauccau gcacguacau gucuuauagc uucuucgcgg 11640 gugauaaaca uguuagggua accauuaacu ugauaauuca uuuuaaaacc caucauagag 11700 augagucuuc uauaggucau guccuuaggu augccaggua ugucaacaca uaaaccuuca 11760 guuuugaauu uagugucaac acugaggugu guaggugccu guguaggaug uaacccagug 11820 auuaccuuac uacaaucuuu aaagaguccu guuacauuuu cagcuuguaa aguugccaca 11880 uuccuacgug gaauuucaag acuuguaaau ugcaacuugu cauaaagguc ucuaucagac 11940 auuaugcaaa guaugccuac uuuugcucug guaauagcaa cauuaaaucu guuuacauua 12000 caagagugag cuguuucagu gguuugagug aauaugacau agucauauuc ugagcccugu 12060 gaugaaucaa caguuugagu ugguaguccc aaaaucuuug aggcuacagc auucugugaa 12120 uuauaaggug aaauaaagac agcuuuucuc caagcagggu uacguguaag gaauucucuu 12180 accacgccua uuuguggccu guuaauugca gaugaaacau caugcgugau aacacccuua 12240 uaaaacauuu uaaagcauug agcugauuug ucuuuaugug cuuuaagcuu auuaucauaa 12300 accaaagcac ucacaguguc aacaauuuca gcaggacaac gccgacaagu uccgaggaac 12360 augucuggac cuauaguuuu cauaagucua cacacugaau ugaaauauuc ugguucuagu 12420 gugcccuuag uuagcaaugu gcguggugca gguaauugag cagggucgcc aauguacaca 12480 uagugcuuag cacguaaucu ggcauugaca acacucaaau cauaauuugu ggccauugaa 12540 auuucaucaa agacaacuau aucugcuguc gucucaggca augcauuuac aguacaaaag 12600 acauacuguu cuaauguuga auucacuuug aauuuaucaa aacacucuac acgagcacgu 12660 gcagguauaa uucuacuaca uuuaucuaua ggcaaauauu uuaaugccuu cucacauagu 12720 gcaucaacag cggcaugaga gcaagcugua uacacuaugc gagcagaagg guaguagaga 12780 gcuaggccaa uagcaaaaug acucuuacca guaccaggug gucccuggag uguagaauac 12840 uuuugcauac caaccuuuug auaauuugca acauugcuag aaaacucauc ugagauauug 12900 aguguugggu auaagccagu aauucuaaca uagugcucuu guggcacuag uguaggugca 12960 cuuaauggca uuacuguaug ugaugucagc acaaaauaau caccaacauu uaauuuguaa 13020 guuguuguac cucgguaaac aacagcauca ccauagucac cuuuuucaaa gguguacucu 13080 ccuauuugua cuuuacuguu uuuaguuaca cgauaaccag uaaagacaua auuucgguua 13140 aguggugguc uagguuuacc aacuucccau gaaagaugua auucucuguc agacagcacu 13200 ucacguacag uagcaauacc auaagacagu uuaaaugucu ccucaguagc uuugagcguu 13260 ucugcugcaa aaagcuugag ucuuucagua cagguguuag cuaaaaugua aucaccagca 13320 uuuguccagu cacauguugc aauugcauua aagucaguaa cauuaucgcu accaacacau 13380 guauuuuuau auaaaccaaa aacuugucca uuagcacaca auggaaaacu aauggguggu 13440 uuaugugauu uacaauaaua gcucauaccu ccuaaguaaa guugagucac aucugugaca 13500 ucacaaccug gagcauugca aacauacgga uuaacagaca agacuaauuu augugauguu 13560 gauaugacau ggucguaaca gcauuuacaa cauaagaaug gucuacguau gcaagcacca 13620 caucuuaaug aagucuguga auugcaaaga acacaagccc caacagccug uaagacugua 13680 ugcggugugu acauagccuc auaaaacuca gguucccaau accuugaagu guuaucauua 13740 guaagcauaa cagaauacau gucuaacaug uguccuguua acucaucaug uagcuuucuu 13800 auguauugua aguacaaaug aaagacauca gcauacuccu gauuaggaug uuuaguaagu 13860 ggguaagcau cuauagcuaa agacacgaac cguucaauca uaaguguacc aucuguuuuu 13920 acgauaucau cuacaaaaca gccggccccu aggauucuug auggaucugg guaaggaagg 13980 uacacauaau caucacccug uuuaacuagc auuguauguu gagagcaaaa uucaugaggu 14040 ccuuuaguaa ggucagucuc aguccaacau uuugcuucag acauaaaaac auuguuuuga 14100 uaauaaagaa cugacuuaaa guucuuuaug cuagccacua gaccuugaga ugcauaagug 14160 cuauugaaac acacaacagc aucgucagag aguaucauca uugagaaaug uuuacgcaaa 14220 uaugcguaaa acucauucac aaagucugug ucaacaucuc uauuucuaua gagacacuca 14280 uaaagucugu guuguaaauu gcggacauac uuaucggcaa uuuuguuacc aucaguagau 14340 aaaagugcau uaacauuggc cgugacagcu ugacaaaugu uaaaaacacu auuagcauaa 14400 gcaguugugg caucuccuga ugagguucca ccugguuuaa cauauaguga accgccacac 14460 augaccauuu cacucaauac uugagcacac ucauuagcua aucuauagaa acggugugac 14520 aagcuacaac acguuguaug uuugcgagca agaacaagug aggccauaau ucuaagcaug 14580 uuaggcaugg cucuaucaca uuuaggauaa ucccaaccca uaaggugagg guuuucuaca 14640 ucacuauaaa caguuuuuaa cauguugugc caaccaccau agaauuugcu uguuccaauu 14700 acuacaguag cuccucuagu ggcggcuauu gauuucaaua auuuuugaug aaacugucua 14760 uuggucauag uacuacagau agagacacca gcuacggugc gagcucuauu cuuugcacua 14820 auggcauacu uaagauucau uugaguuaua guagggauga cauuacguuu uguauaugcg 14880 aaaagugcau cuugauccuc auaacucauu gaaucauaau aaagucuagc cuuaccccau 14940 uuauuaaaug gaaaaccagc ugauuugucu agguuguuga cgaugacuug guuagcauua 15000 auacagccac caucguaaca aucaaaguac uuaucaacaa cuucaacuac aaauaguagu 15060 ugucugauau cacacauugu ugguagauua uaacgauagu agucauaauc gcugauagca 15120 gcauuaccau ccugagcaaa gaagaagugu uuuaauucaa cagaacuucc uuccuuaaag 15180 aaacccuuag acacagcaaa gucauagaag ucuuuguuaa aauuaccggg uuugacaguu 15240 ugaaaagcaa cauuguuagu aagugcagcu acugaaaagc acguagugcg uuuaucuagu 15300 aauagauuac cagaagcagc gugcauagca gggucagcag cauacacaag uaauuccuua 15360 aaacuaaguc uagagcuaug uaaguuuaca uccugauuau guacaacacc uagcucucug 15420 aagugguauc caguugaaac uacaaaugga acaccaucaa caaauauuuu ucucacuagu 15480 gguccaaaac uuguaggugg gaacacugua gagaauaaaa cauuaaaguu ugcacaaugc 15540 agaaugcauc ugucauccaa acaguuaaca caauuugggu gguaugucug aucccaauau 15600 uuaaaauaac ggucaaagag uuuuaaccuc ucuuccguga agucauauuu uaacaaaucc 15660 cacuuaaugu aaggcuuugu uaagucagug ucaacaugug acucugcagu uaaagcccug 15720 gucaagguua auauaggcau uaacaaugaa uaauaagaau cuacaacagg aacuccacua 15780 ccuggcgugg uuuguaugaa aucaccgaaa ucauaccagu uaccauugag aucuugauua 15840 ucuaauguca guacaccaac aauaccagca uuucgcaugg caucacagaa uuguacuguu 15900 uuuaacaaag cuuggcguac acguucaccu aaguuggcgu auacgcguaa uauaucuggg 15960 uuuucuacaa aaucauacca guccuuuuua uugaaauaau caucaucaca acaauuguau 16020 gugacaagua uuucuuuuaa ugugucacaa uuaccuucau caaaaugccu uaaagcauag 16080 acgaggucug ccauugugua uuuaguaaga cguugacgug auauaugugg uaccauguca 16140 ccgucuauuc uaaacuuaaa gaagucaugu uuagcaacag cuggacaauc cuuaaguaaa 16200 uuauaaauug uuucuucaug uugguaguua gagaaagugu gucucuuaac uacaaaguaa 16260 gaaucaauua aauugucauc uucguccuuu ucuuggaagc gacaacaauu aguuuuuagg 16320 aauuuagcaa aaccagcuac uuuaucauug uagaugucaa aagcccugua uacgacauca 16380 guacuagugc cugugccgca cgguguaaga cgggcugcac uuacaccgca aacccguuua 16440 aaaacgauug ugcaucagcu gacugaagca uggguucgcg gaguugauca caacuacagc 16500 cauaaccuuu ccacauaccg cagacgguac agacuguguu uuuaagugua aaacccacag 16560 ggucauuagc acaaguugua gguauuugua cauacuuacc uuuuaaguca caaaauccuu 16620 uaggauuugg augaucuaug uggcaacggc aguacagaca acacgaugca ccaccaaagg 16680 auucuugauc cauauuggcu uccgguguaa cuguuauugc cugaccagua ccagugugug 16740 uacacaacau cuuaacacaa uuagugauug guuguccccc acuagcuaga uaaucuuugu 16800 aagcuuuagc agcaucuaca gcaaaagcac agaaagauaa uacaguugaa uuggcaggca 16860 cuucuguugc auuaccagcu uguagacgua cuguggcagc uaaacuacca aguaccauac 16920 cucuauuuag guuguuuaau ccuuuaauaa aguauaaaua cuucacuuua ggaccuuuag 16980 gugugucugu aacaaaccua caaggugguu ccaguucugu auagauagua ccaguuccau 17040 cacucuuagg gaaucuagcc cauuucaaau ccuguaaauc ggauaacagu gcaaguacaa 17100 accuaccucc cuuuguugug uuguaguaag cuaacgcauu gucaucagug caagcaguuu 17160 guguaguacc ggcagcacaa gacaucuguc guagugcaac aggacuaagc ucauuauucu 17220 guaauuugac agcagaauug gcccuuaaag cuguuacaau aagaggccau gcuaaauuag 17280 gugaauuguc cauacuaauu ucacuaaguu gaacaauuuu acuaucugca ucuacaaccu 17340 guuggauuuc ccacaaugcu gaugcauaag uaaauguugu accaucacac guauuuuuau 17400 auguguuaua gucugguaug acaaccauua guuuggcugc uguuguaaga gguauuaugu 17460 ucaagggaac acaaccaucu cuugcauugu ugauaauguu guugagugca ucauuaucca 17520 acuuucuaag cauagugaaa agcauugucu gcauagcacu aguaacuuuu gcccucuugu 17580 ccucagaucu agccuguuua uacauuuggg ucauagcuug aucagccauc uuuuccaacu 17640 uacguugcau ggcugcauca cggucaaauu cagauuuagc cacauucaaa gacuucuuca 17700 acuuuuuaag aacaacuuca gaaucaccau uagcaacagc cugcucauaa gcuucuugag 17760 caguagcaaa agcugcauau gauggaaggg aacuaaacuc ugaggcuaua gcuuguaagg 17820 uugcccuguu guccagcauu ucuucacaaa gcuuguuuau gucuacagca cccugcaugg 17880 aaagcaaaac agaaaguagu gaaaccauuu uuucaaaggc uucaguagua ucuuuagcua 17940 agagaauguc auuguguaac uggacacauu gagcccacaa uuuagaugau gauucuacuc 18000 ugaguuguug caaaacugag aguaagacua cugaugugca cuuuacaucu gacauuuuag 18060 acuguacagu ggcuacuuug auacaagguu ugccaccaac acccaacaau uuaauguuga 18120 guuugaaggc aucuaugcua uucuugggug ggaguagucc cugugaauuc auauaucuaa 18180 acuccugugu agaaacuaag uaaucauaaa caccaagagu cagucuaaag uagcgguuga 18240 guaaacaaaa gaggccaaag uaacaaguac aaaaauagcc uaagaaacaa uaaacuagca 18300 uuauacacug aaguguauua ccaguuauga agaaaauagg gcaauacuca acacacauaa 18360 aaacaauacc ucuggccaaa aacaugacag uuguaacuac accugaguag uuagaaguaa 18420 cagagauuau aagagcccac auggaaaugg cuugaucuaa agcauuacca uaauaaacuu 18480 uauaaacgag ugucaagaca uucauaagug uccacacucu ccuagcacca ucaucauaca 18540 caguucuugc ugucauaagg auuaguaaca cuacagcuga ugcauacaua acacagucuu 18600 uuagcuuaaa accagacaaa cuaguaucaa ccauauccaa ccaugucaua auacgcauca 18660 cccaacuagc aggcauauag accauauuaa aauaagcuac aguggcaaga gaagguaaca 18720 aaaacaaaca gagaaaugca ugcuuauguu ugacaaacau cauugcaaaa gcagacauag 18780 caauaauacc cauagcaaaa gguaaaaagg cauuuucaua caaaaaaaag aacaaagacc 18840 auugaguacu cuggacuaaa acuaaaagug aagucaaaau ugugaguaac aaccaguggu 18900 guguacccuu gauuguucuu uucacugcac uuuggaaagu aacaccugag cauugucuaa 18960 caacaucaaa agguguaaau ucaucuucua auaaagcacu acccaauaug guacguccau 19020 ucauaccauu uugcaguaau ucuuuuaaug aagcacacau aucuaaaacg gcaauuccag 19080 uuugagcaga aagagguccu aguaugucaa cauggucuug uguuagaggu ucauaauugu 19140 acuucauagc cacaagguua aagucauuaa gaguuguggu aaaucgauug agaaaccacc 19200 ugucuccauu uauaacagca gcguacaacc aagcuaaaac auuaacugua auaguugugu 19260 ccguaccagc ugcuugugcu guuugccugu caacaaaagg uccauaaaag uuaccuucua 19320 agucugugcc agcaugaacu ccaguuggua auuccauaug gugcauguaa caaaaagaga 19380 cacagucaua aucuauguua aaaccaacac uaccacauga accauuaagg aaugaacccu 19440 uaauagugaa auugggccuc auagcacauu gguaaacacc agauggugaa ccauuguaac 19500 aagcuaacac ugaaaaaguc uguccugguu gaaugcgaac aaacuuauac uuaggugucu 19560 uaggauuggc uguaucaacc uuaagcuuaa guacacaauu uugcauagaa uguccaauaa 19620 cccugaguug aacauuacca gccuguacca agaaauuaug auuagacuua cgaaugagua 19680 aaucuucaua auuaggguua agcaugucuu cagaggugca gaucacaugu cuuggacagu 19740 aaacuacguc aucaagccaa agaccguuaa guguaguugu accacaaguu acuuguacca 19800 uacaacccuc aacuuuacca gaugggaaug ccauuuuucu aaaaccacuc ugcaaaacag 19860 cugaggugau agagguuugu ggugguuggu aaagaacauc agaaccugag uuacugaagu 19920 cauugagagc cuuugcgaga ugacaacaag cagcuucucu guagcuaguu guauccauug 19980 cuccacuaaa auacuuguac uuauuauaaa gagcuaagua ucuauuauau ugcguaagag 20040 guaauagcac aucacuacgc aacuuuagau acauuucuuu auuuaacaaa aaggugcaca 20100 gcgcagcuuc uucaaaagua cuaaaggaaa caccauuaaa gacuacacgu cucuuuaggu 20160 aauuacuaaa gaaccaauag aaaugcuuug uggaaauaca aaugauauaa gcaauuguua 20220 uccagaaagg uacuaaaggu gugaacauaa ccauccacug aauaugugcu aaaaaagaaa 20280 caucauuagu aagauaaaau gucaaguaca aguaaauaac agaauaaaca ccagguaaga 20340 augaguaaac ugguguuaaa cagaguacag ugaaugacau aaggaauagu aaaguauuaa 20400 aggcaacuac augacuguau ucaccaaaag cucuucuaaa ccucauaaaa uaguaggcaa 20460 ggcauguuac uacgauagcu acaauaccac cagcuacuau agaugcugau auguccaaag 20520 caccaauagg uugaauuagu gguguaaaca uauuaguaag uaaauuuaca gcaucuacac 20580 cacagaaaac uccugguaaa gaucuguaau aaucauuguu aaguacccau cuaccacuag 20640 uagauacaca aacaccagcu ucugaucuuu cacaagugcc gugccuacag uacucagaau 20700 caaaaguugu uaccacucua acagaaccuu caagguaggu guuaggaaau ugaauaauag 20760 agccauccau gagcacauaa cgugugucag ggcguaaacu uucauaagca acagaaccuu 20820 cuaguacauu gguaucauaa caauauggua cuggcuuacc agaagcaucu uuaaaaauug 20880 uacauucagc agccaaaaca caagcugaug uugcaaaguc aguguacucu auaaguuuug 20940 auggugugua acagauguua ccaacugcac uaaaaacucu agguaagaaa ugcaaaaagu 21000 caccauuagu ugugcguaau aucgugccag gcaaaccagg cacgacaaaa cccacuucuc 21060 uuguuaugac ugcagcaauc aaugggcaag cuuugucauu aguauaacua ccaccacgcu 21120 ggcuaaacca ugugucaaaa ucagcauguu uguuagcaaa acaaguaucu guagaugcua 21180 ugucacgagu gacaccacca ucaauagccu uguauccuau gauuucacuu gaaaagucag 21240 uauguuuaga caugacauga acagguguua uuaaauagaa aauagcagca acaaaaagga 21300 acacaagugu aacuuuaauu aacugcuuca accaauuauu aacaauuuua ccacccuuaa 21360 gugcuaucuu uguuguuaca acauuaacaa cuugucuagu aguugcacau gucaacuuaa 21420 aagguaaguu auucuuuuua gcagcacuac guauuuguuu ucguaguugu ucagacaaug 21480 acaugaaauc uuuaacguuc cauaucaaag caauguugug acuuuuugcu accugcgcau 21540 uaauaugacg cgcacuacag ucaauacaag caccaagguc acgggguguc auguuuucaa 21600 cuuuguuaua ggugagcaua uaguuauuac aacuaucgcc aguaacuucu augucagauu 21660 gaugugacaa uuuaagacau ucaacaacau cuuuaguuuc uacaucugaa ucaacaaacc 21720 cuugccgagc ugcugaaaua aaaguagaua agacauuguc uaaggacaca uucuuugcaa 21780 guucagcuuc ugcaguugca acuaguguuu ugaguuuuuc cauugguacg uuaaaaguug 21840 augaaaacgu auuaacguaa gcaucaaaca uuuuaacugc aacuuccgca cuaucaccaa 21900 caucagacac uaaugccuga ucuaguaaca guauagguug acacauaagc ugacuguagu 21960 aaacagacgc ugauuuugca gaugauucuu cacauuuuga uuuaccauca aaaacuauaa 22020 cauuaauagg caaugaaccu uuaguguuau uagcucucag guugucuaag uuaacaaaau 22080 gagagagaga augucuuuca uaagucuuuu gaccagcuuu aucaaaguaa agauggaugg 22140 aaccauucuu cacuguaaca cuaucaacga uguaagaaga cuggucagua ggauuuauug 22200 gucuuuuaaa cuguagugac aagucucucg caacuucauc acuaauaaau guacuaccag 22260 cacagaaugu aucacaauua acacaauucc aauuguguag uuugcaaaag ccuuuaccuc 22320 cauuagcaua gacauaaaag gaccuucuaa caccauuaac aauaguugua cauucgacuc 22380 uuguugcucu auuacguuug uaacacauca uacaaguuga ugaauuacaa ccgucuacaa 22440 caugcacaua acuuuuccau acauaauaaa augaugcaaa gaagauguac auucuaacca 22500 uagcugaaau cggggccauu uguacaagau uaauuauuaa ccacauaagc caagaauuac 22560 uaauaaaaug uacugcaaaa uagcugaaaa acaauugcau gauugcagcc aauccaagua 22620 cauagaaaaa ccuagugaaa agaauauaug ccaaaaacca cucugcaacu aagccaaaag 22680 caguuaaauc ccauuuaaaa gaugaaaugg uaauuuguau aguuucuaaa gaaggauagg 22740 ugucuaaaga aucuaaacca cuaagacaaa cacuacaagg uauagaacca guacaguagg 22800 uugcaauagu gacauuagua gaguucaaau agccuucucu guaaccagua caguaagaag 22860 gcaugccuaa auuagacauu aaaacaccua aagcagcggu ugaguagauu aaagaaccua 22920 ggcaaacacu uaauaguaaa aaccaaauua uaauauuuau caguuuagaa aaauuaggug 22980 acuucaaaua auuaaaugaa gccucuagac aaaauuuacc gacacucuua acaguauucu 23040 uugcuauagu agucggcaua gaugcuuuaa uucuagaauu uguacuucua guaaaaguac 23100 acaauuguag caauaaagua aagaaauaag gcauauaauu aguacaaaca cgguuuaaac 23160 accguguaac uauguuagua guuguacuaa caacuuuguu aagaaaaggc uuagcauaau 23220 uagcuauagu aucccaaggg acacuauuaa cagcagcuaa accaugagua gcaaggguuu 23280 ucaaaccuaa uacucuagau aauucauuag guuucuuaau aguaagacua gaauugucua 23340 cauaagcagc cauuagaucu guguggccaa ccucuucugu aauuuuuaaa cuauuauuug 23400 cugguuuaag uauaaugucu ccuacaacuu cgguaguuuu cacauuacac ucaagaacgu 23460 cuuucuguau gguaggauuu uccacuacuu cuucagagac ugguuuuaga ucuucgcagg 23520 caagauuauc cauucccugc gcguccucug acuucaguac aucaaacgaa uuugauguuu 23580 caacugguuu ugugcuccaa agacaacgua uacaccaggu auuugguuua uacguggcuu 23640 uauuaguugc auuguuaaca ugccaaacaa uagguuuaug uaacaauuua gcuccuuucu 23700 uaaaagaggg uguguagugu uuauaaucaa uagccaccac aucaccauuu aagucaggga 23760 aaaauguaac uuuaagcucu cuugaagcag guuucuuaua accaguuaac ugguuuaaau 23820 caucagcaaa uuugauauua ucacauacaa acuuaaaauu aucgaagcuu gcguuuggau 23880 augguugguu ugguacaaga ucaauugguu gcucugugaa auaagaauug ucuuucuuau 23940 aauaauuguc caacuuaggg ucaauuucug uacaaacaac accauccaau uuauaaguaa 24000 cugguuuuau gguuguugug uaacuguuuu cuuuguagaa aacauccgua auaggaccuu 24060 uguauucuga ggacuuugua aguaaagcac cgucuaugca auacaaaguu ucuuuagaag 24120 uuauauguuu auagugacca cacugguaau uaccagugua cucacuagca caaguaaaug 24180 uaccaugcuu aaguucauac ugagcaggug gugcugacau cauaacaaaa ggugacuccu 24240 guuguacuag auauuuugua gcuuguuuac cacacguaca agguaucuga acaccuuucu 24300 uaaauuguuc auaagaaagu gugcccaugu acauaacagc uucuacaccc uuaaggguug 24360 ucugcuguug uccacaaguu uuacacacca cguucaagac ucuuuugcaa gaaucuaaau 24420 uggcauguug aaacaaguaa cucauuguuu cucuaacauc accuaacuca ccuacugucu 24480 uauuacagua ggcuaagaua agugcacaaa aguuagcagc uucaccagcc cuugcucugu 24540 aauaagcauc uuguagagca gguggauuaa acuucaacuc uauuuguugg aguguuaaca 24600 augcaguggc aagauaacag uuguuaucug cccauuuaau agaaguuaaa ccauuaacuu 24660 guggguauuu ccacuuuuua gugugauuua augcugacau guaccuaccc agaaaacuag 24720 gaucaguugu gugguaguac ucaaaagccu caacacguag agugucauca uuagguaaaa 24780 cauaaaaugu uuuaccuuca ugugaauuau gagguuuuau uuuaguaaca ucagcuccau 24840 ccaaauaagu uggaccaaac uguuguccau augucauuga cauguccaca acuugcgugu 24900 ggagguuaau guugucuacu guuguaaaca ccuuaauagu ccucacuucu cucaaagaaa 24960 gaagugucuu aagauuguca aaggugauaa cuucaccauc uagguggaau gugguaggau 25020 uacuagugua auauacacuu uuaucaccuc ucuuaagaaa uucuauaccu aguuguguag 25080 auuguccaga auaggaccaa ucuuuauagg aaccagcaag ugagaugguu ucaauaaaau 25140 guucuucagg uguuuuagaa gaagaaguaa gauaaccauu auacgcugua acagcaucag 25200 gugaagaaac agaaacugua gcuggcacuu ugagagaucu cauauaccga gcagcuucuu 25260 ccaaauuuaa gccauguguu acauagccaa guggcauugu aacaagaguu ucauuuagau 25320 cguuaagugu guugauaagu gacgcuacag uuguuuuacu gguguaaaag uaaaaucuag 25380 caccauaauc aaccacaccc ucuuguauuu uaauacccuu auauuuacgc uguauaguug 25440 aaacuauggc uuuaguuucc acacagacag gcauuaauuu gcguguuucu ucugcaugug 25500 caagcauuuc ucgcaaauuc caagaaacag uuccaagaau uucuugcuuc ucauuagaga 25560 uaauagaugg uagaauguaa aaggcacuuu uacacuuuuu aagcacuguc uuugccuccu 25620 cuacagugua accauuuaaa cccugacccg gguaaguggu uauauaauug ucuguuggca 25680 cuuuucucaa agcuuucgcu agcauuucag uagugccacc agccuuuuua guagguauaa 25740 ccacagcagu uaaaacaccc ucuugaacaa caucacccac uauauaugga gcaucuuucu 25800 uuaagaaagu gaugucaaug ucacuaacaa gaguggcaga aucuggauga agauugccau 25860 uaaugucaau auaaaguaac aaguuuucug ugaggaacuu aguuucuucc agaguuguug 25920 uaacuucuuc aacacaagcu uugauuuucu uaucaucuug uuuucucugu ucaacugaag 25980 guuuacuuuc aguuauaaau ggcuuaacuu ccucuuuagg aaucucagcg aucuuuuguu 26040 caacuugcuu uucacucuuc auuuccaaaa agcuugaaac aaguuuguca uagagauuuu 26100 uaucaaagac agcuaaguag acauuugugc gaacaguauc uacacaaacu cuuaaagaau 26160 guauaggguc agcaccaaaa auaccagcug auaauaaugg ugcaaguaga acuucgugcu 26220 gauuaaaauu uucauaagca cucuuaagaa guugaauguc uucaccuuug uuaacauuug 26280 ggccgacaac augaagacag uguuuagcaa gauugugucc gcuuaaaaca caacuaccac 26340 ccacuuuaag ugguccauua guagcuaugu aaucaucaga uucaacuugc auggcauugu 26400 uaguagccuu auuuaaggcu ccugcaacac cuccuccaug uuuaagguaa acauuggcug 26460 cauuaacaac cacuguuggu uuuaccuuuu uagcuucuuc cacaaugucu gcauuuuuaa 26520 uguauacauu gucaguaagu uuuaaauaac cacuaaaacu auucacuuca auagucugaa 26580 caacuggugu aaguuccauc ucuaauugag guugaaccuc aacaauuguu ugaauaguag 26640 uugucugauu guccucacug ccgucuuguu gaccaacagu uuguugacua ucaucaucua 26700 accaaucuuc uucuugcucu ucuucagguu gaagagcagc agaaguggca ccaaauucca 26760 aagguuuacc uugguaauca ucuucaguac cauacucaua uugaguugau ggcucaaacu 26820 cuucuucuuc acaaucaccu ucuucuucau ccucaucugg aggguagaaa gaacaauaca 26880 uaugugaagc caauuuaaac ucaccagacu caucaaauaa guaguaugua gccauacucc 26940 acucaucuaa aucaaugccc agugguguaa guaauucaga uacugguugc aaaguuuuua 27000 ugacagcauc ugccacaaca caggcgaacu cauuuacuuc uguaccgagu ucaacuguau 27060 aggcagagca cuucucauua aguacuuuau caauccuuuc aucaaguuca aaagugauau 27120 ucacacucuu guaaccuugc acuucuauca cagugucauc accaaaagua accuuuguug 27180 gugcaccgcc uuugagugug aagguauugu uuguuaccau cauauuaggu gcaagggcac 27240 aguacuuuuc ugugucuuug auuucgagca acauaagccc guuaauacaa acugguguac 27300 caaccaaugg agcuucaaca gcuucacuag uagguuguuc uaaugguugu aaaucaccag 27360 uuuucaagac aacuuccucu guuaacacuu cugugggaag uguuucuccc ucuaagaaga 27420 uaauuucuuu uggggcuuuu agaggcauga guaggccagu uucuucucug gauuuaacac 27480 acuuucugua caaucccuuu gagugcguga caaauguuuc accuaaauuc aaggcuuuaa 27540 guuuagcucc accaauaaug auagagucag cacacaaagc caaaaauuua uuuacaagcu 27600 uaaagaaugu cugaacacuc uccuuaauuu ccuuugcaca ggugacaauu uguccaccga 27660 caauuucaca agcacagguu gagauaaauu uaacaauuuc ccaaccgucu cuaagaaacu 27720 cuacaccuuc cuuaaacuuc ucuucaagcc aaucaaggac ggguuugagu uuuucauaaa 27780 cagugccaaa gauguuaguu agccacugcg aagucaacug aacaacacca ccuguaaugu 27840 aggccauuac aacuagauug uuaguagcca aaucagaugu gaacaucaua gcaucaauga 27900 gucucaguga auacugugaa auuccaucua guauuguuau agcggccuuc uguaaaacac 27960 gcacagaauu uugagcaguu ucaagagugc gggagaaaau ugaucguaca acacgagcag 28020 ccucugaugc aaaugcauaa agaggacuca guauugauuu cuguucacca auauuccagg 28080 caccuuuuuu agcuuuuccu uuuguaacuu uaaaauuacc acaggauuca acaauuuguu 28140 ugaaugcuuu auaauccaaa ccuuucacag uuuccacaaa agcacuugug gaagcagaaa 28200 aagaugccaa aauaauggcg aucucuucau uaaguuuaaa gucaccaaca auauugaugu 28260 ugacuuucuc uuuuuggagu auuucaagaa gguugucauu aagaccuucg gaaccuucuc 28320 caacaacacc uguaugguua caaccuaugu uagcgcuagc acguggaacc caauaggcac 28380 acuuguuaug gcaaccaaca uaagagaaca cacagccucc aaaggcaaua gugcgaccac 28440 ccuuacgaag aaugguuuuc aagccagauu cauuauggua uucggcaaga cuaugcucag 28500 guccuacuuc ugaauuguga caugcuggac aauaaauuuu aacaacagca uuuuggggua 28560 aguaaccaca aguaguggca ccuucuuuag ucaaauucuc agugccacaa aauucgcaag 28620 uggcuuuaac aaaaucgccc gucugccaug aaguuucacc acaaugauca cacuucauga 28680 gaguugaaag gcacauuugg uugcauucau uuggugacgc aacuggauag acagaucgaa 28740 uucuacccau aaagccauca agcuuuuucu uuucaacccu ugguugaaua gucuugauua 28800 uggaauuuaa gggaaauaca aaauuuggac auuccccauu gaagguguca aauuucuuug 28860 ccaauuuaau uucaaaaggu gucugcaauu cauagcucuu uucagaacgu uccguguacc 28920 aagcaauuuc augcucaugu ucacggcagc aguauacacc ccucuuagug ucaauaaagu 28980 ccaguuguuc ggacaaagug caugaagcuu uaccagcacg ugcuagaagg ucuuuaaugc 29040 acucaagagg guagccauca gggccacaga aguuguuauc gacauagcga guguaugccc 29100 cuccguuaag cucacgcaug aguucacggg uaacaccacu gcuauguuua guguuccagu 29160 uuucuugaaa aucuucauaa ggaucagugc caagcucguc gccuaaguca aaugacuuua 29220 gaucggcgcc guaacuaugg ccaccagcuc cuuuauuacc guucuuacga agaagaaccu 29280 ugcgguaagc cacugguauu ucgcccacau gagggacaag gacaccaagu gucucaccac 29340 uacgaccgua cugaaugccu ucgaguucug cuaccagcuc aaccauaaca ugaccaugag 29400 gugcaguucg agcauccgaa cguuugauga acacauaggg cuguucaagu ugaggcaaaa 29460 cgccuuuuuc aacuucuacu aagccacaag ugccaucuuu aagauguuga cgugccucug 29520 auaagaccuc cuccacggag ucuccaaagc cacguacgag cacgucgcga accuguaaaa 29580 caggcaaacu gaguuggacg uguguuuucu cguugaaacc agggacaagg cucuccaucu 29640 uaccuuucgg ucacacccgg acgaaaccua gaugugcuga ugaucggcug caacacggac 29700 gaaaccguaa gcagccugca gaagauagac gaguuacucg uguccuguca acgacaguaa 29760 uuaguuauua auuauacugc gugagugcac uaagcaugca gccgagugac agccacacag 29820 auuuuaaagu ucguuuagag aacagaucua caagagaucg aaaguugguu gguuuguuac 29880 cugggaaggu auaaaccuuu aau 29903 <210> 8 <211> 1255 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 8 Met Phe Ile Phe Leu Leu Phe Leu Thr Leu Thr Ser Gly Ser Asp Leu 1 5 10 15 Asp Arg Cys Thr Thr Phe Asp Asp Val Gln Ala Pro Asn Tyr Thr Gln 20 25 30 His Thr Ser Ser Met Arg Gly Val Tyr Tyr Pro Asp Glu Ile Phe Arg 35 40 45 Ser Asp Thr Leu Tyr Leu Thr Gln Asp Leu Phe Leu Pro Phe Tyr Ser 50 55 60 Asn Val Thr Gly Phe His Thr Ile Asn His Thr Phe Gly Asn Pro Val 65 70 75 80 Ile Pro Phe Lys Asp Gly Ile Tyr Phe Ala Ala Thr Glu Lys Ser Asn 85 90 95 Val Val Arg Gly Trp Val Phe Gly Ser Thr Met Asn Asn Lys Ser Gln 100 105 110 Ser Val Ile Ile Ile Asn Asn Ser Thr Asn Val Val Ile Arg Ala Cys 115 120 125 Asn Phe Glu Leu Cys Asp Asn Pro Phe Phe Ala Val Ser Lys Pro Met 130 135 140 Gly Thr Gln Thr His Thr Met Ile Phe Asp Asn Ala Phe Asn Cys Thr 145 150 155 160 Phe Glu Tyr Ile Ser Asp Ala Phe Ser Leu Asp Val Ser Glu Lys Ser 165 170 175 Gly Asn Phe Lys His Leu Arg Glu Phe Val Phe Lys Asn Lys Asp Gly 180 185 190 Phe Leu Tyr Val Tyr Lys Gly Tyr Gln Pro Ile Asp Val Val Arg Asp 195 200 205 Leu Pro Ser Gly Phe Asn Thr Leu Lys Pro Ile Phe Lys Leu Pro Leu 210 215 220 Gly Ile Asn Ile Thr Asn Phe Arg Ala Ile Leu Thr Ala Phe Ser Pro 225 230 235 240 Ala Gln Asp Ile Trp Gly Thr Ser Ala Ala Ala Tyr Phe Val Gly Tyr 245 250 255 Leu Lys Pro Thr Thr Phe Met Leu Lys Tyr Asp Glu Asn Gly Thr Ile 260 265 270 Thr Asp Ala Val Asp Cys Ser Gln Asn Pro Leu Ala Glu Leu Lys Cys 275 280 285 Ser Val Lys Ser Phe Glu Ile Asp Lys Gly Ile Tyr Gln Thr Ser Asn 290 295 300 Phe Arg Val Val Pro Ser Gly Asp Val Val Arg Phe Pro Asn Ile Thr 305 310 315 320 Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Lys Phe Pro Ser 325 330 335 Val Tyr Ala Trp Glu Arg Lys Lys Ile Ser Asn Cys Val Ala Asp Tyr 340 345 350 Ser Val Leu Tyr Asn Ser Thr Phe Phe Ser Thr Phe Lys Cys Tyr Gly 355 360 365 Val Ser Ala Thr Lys Leu Asn Asp Leu Cys Phe Ser Asn Val Tyr Ala 370 375 380 Asp Ser Phe Val Val Lys Gly Asp Asp Val Arg Gln Ile Ala Pro Gly 385 390 395 400 Gln Thr Gly Val Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe 405 410 415 Met Gly Cys Val Leu Ala Trp Asn Thr Arg Asn Ile Asp Ala Thr Ser 420 425 430 Thr Gly Asn Tyr Asn Tyr Lys Tyr Arg Tyr Leu Arg His Gly Lys Leu 435 440 445 Arg Pro Phe Glu Arg Asp Ile Ser Asn Val Pro Phe Ser Pro Asp Gly 450 455 460 Lys Pro Cys Thr Pro Pro Ala Leu Asn Cys Tyr Trp Pro Leu Asn Asp 465 470 475 480 Tyr Gly Phe Tyr Thr Thr Thr Gly Ile Gly Tyr Gln Pro Tyr Arg Val 485 490 495 Val Val Leu Ser Phe Glu Leu Leu Asn Ala Pro Ala Thr Val Cys Gly 500 505 510 Pro Lys Leu Ser Thr Asp Leu Ile Lys Asn Gln Cys Val Asn Phe Asn 515 520 525 Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Pro Ser Ser Lys Arg 530 535 540 Phe Gln Pro Phe Gln Gln Phe Gly Arg Asp Val Ser Asp Phe Thr Asp 545 550 555 560 Ser Val Arg Asp Pro Lys Thr Ser Glu Ile Leu Asp Ile Ser Pro Cys 565 570 575 Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Ala Ser Ser 580 585 590 Glu Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Asp Val Ser Thr 595 600 605 Ala Ile His Ala Asp Gln Leu Thr Pro Ala Trp Arg Ile Tyr Ser Thr 610 615 620 Gly Asn Asn Val Phe Gln Thr Gln Ala Gly Cys Leu Ile Gly Ala Glu 625 630 635 640 His Val Asp Thr Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile 645 650 655 Cys Ala Ser Tyr His Thr Val Ser Leu Leu Arg Ser Thr Ser Gln Lys 660 665 670 Ser Ile Val Ala Tyr Thr Met Ser Leu Gly Ala Asp Ser Ser Ile Ala 675 680 685 Tyr Ser Asn Asn Thr Ile Ala Ile Pro Thr Asn Phe Ser Ile Ser Ile 690 695 700 Thr Thr Glu Val Met Pro Val Ser Met Ala Lys Thr Ser Val Asp Cys 705 710 715 720 Asn Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ala Asn Leu Leu Leu 725 730 735 Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Ser Gly Ile 740 745 750 Ala Ala Glu Gln Asp Arg Asn Thr Arg Glu Val Phe Ala Gln Val Lys 755 760 765 Gln Met Tyr Lys Thr Pro Thr Leu Lys Tyr Phe Gly Gly Phe Asn Phe 770 775 780 Ser Gln Ile Leu Pro Asp Pro Leu Lys Pro Thr Lys Arg Ser Phe Ile 785 790 795 800 Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Met 805 810 815 Lys Gln Tyr Gly Glu Cys Leu Gly Asp Ile Asn Ala Arg Asp Leu Ile 820 825 830 Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr 835 840 845 Asp Asp Met Ile Ala Ala Tyr Thr Ala Ala Leu Val Ser Gly Thr Ala 850 855 860 Thr Ala Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe 865 870 875 880 Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn 885 890 895 Val Leu Tyr Glu Asn Gln Lys Gln Ile Ala Asn Gln Phe Asn Lys Ala 900 905 910 Ile Ser Gln Ile Gln Glu Ser Leu Thr Thr Thr Ser Thr Ala Leu Gly 915 920 925 Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu 930 935 940 Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn 945 950 955 960 Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp 965 970 975 Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln 980 985 990 Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala 995 1000 1005 Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp 1010 1015 1020 Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ala Ala 1025 1030 1035 Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ser Gln 1040 1045 1050 Glu Arg Asn Phe Thr Thr Ala Pro Ala Ile Cys His Glu Gly Lys 1055 1060 1065 Ala Tyr Phe Pro Arg Glu Gly Val Phe Val Phe Asn Gly Thr Ser 1070 1075 1080 Trp Phe Ile Thr Gln Arg Asn Phe Phe Ser Pro Gln Ile Ile Thr 1085 1090 1095 Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly 1100 1105 1110 Ile Ile Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp 1115 1120 1125 Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser 1130 1135 1140 Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val 1145 1150 1155 Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys 1160 1165 1170 Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr 1175 1180 1185 Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Val Trp Leu Gly Phe Ile 1190 1195 1200 Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Leu Leu Cys Cys 1205 1210 1215 Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Ala Cys Ser Cys Gly 1220 1225 1230 Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys 1235 1240 1245 Gly Val Lys Leu His Tyr Thr 1250 1255 <210> 9 <211> 422 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 9 Met Ser Asp Asn Gly Pro Gln Ser Asn Gln Arg Ser Ala Pro Arg Ile 1 5 10 15 Thr Phe Gly Gly Pro Thr Asp Ser Thr Asp Asn Asn Gln Asn Gly Gly 20 25 30 Arg Asn Gly Ala Arg Pro Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn 35 40 45 Asn Thr Ala Ser Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Glu 50 55 60 Leu Arg Phe Pro Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Gly 65 70 75 80 Pro Asp Asp Gln Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Val Arg 85 90 95 Gly Gly Asp Gly Lys Met Lys Glu Leu Ser Pro Arg Trp Tyr Phe Tyr 100 105 110 Tyr Leu Gly Thr Gly Pro Glu Ala Ser Leu Pro Tyr Gly Ala Asn Lys 115 120 125 Glu Gly Ile Val Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys 130 135 140 Asp His Ile Gly Thr Arg Asn Pro Asn Asn Asn Ala Ala Thr Val Leu 145 150 155 160 Gln Leu Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly 165 170 175 Ser Arg Gly Gly Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg 180 185 190 Gly Asn Ser Arg Asn Ser Thr Pro Gly Ser Ser Arg Gly Asn Ser Pro 195 200 205 Ala Arg Met Ala Ser Gly Gly Gly Glu Thr Ala Leu Ala Leu Leu Leu 210 215 220 Leu Asp Arg Leu Asn Gln Leu Glu Ser Lys Val Ser Gly Lys Gly Gln 225 230 235 240 Gln Gln Gln Gly Gln Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser 245 250 255 Lys Lys Pro Arg Gln Lys Arg Thr Ala Thr Lys Gln Tyr Asn Val Thr 260 265 270 Gln Ala Phe Gly Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly 275 280 285 Asp Gln Asp Leu Ile Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln 290 295 300 Ile Ala Gln Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg 305 310 315 320 Ile Gly Met Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr His Gly 325 330 335 Ala Ile Lys Leu Asp Asp Lys Asp Pro Gln Phe Lys Asp Asn Val Ile 340 345 350 Leu Leu Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu 355 360 365 Pro Lys Lys Asp Lys Lys Lys Lys Thr Asp Glu Ala Gln Pro Leu Pro 370 375 380 Gln Arg Gln Lys Lys Gln Pro Thr Val Thr Leu Leu Pro Ala Ala Asp 385 390 395 400 Met Asp Asp Phe Ser Arg Gln Leu Gln Asn Ser Met Ser Gly Ala Ser 405 410 415 Ala Asp Ser Thr Gln Ala 420 <210> 10 <211> 221 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 10 Met Ala Asp Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Gln Leu Leu 1 5 10 15 Glu Gln Trp Asn Leu Val Ile Gly Phe Leu Phe Leu Ala Trp Ile Met 20 25 30 Leu Leu Gln Phe Ala Tyr Ser Asn Arg Asn Arg Phe Leu Tyr Ile Ile 35 40 45 Lys Leu Val Phe Leu Trp Leu Leu Trp Pro Val Thr Leu Ala Cys Phe 50 55 60 Val Leu Ala Ala Val Tyr Arg Ile Asn Trp Val Thr Gly Gly Ile Ala 65 70 75 80 Ile Ala Met Ala Cys Ile Val Gly Leu Met Trp Leu Ser Tyr Phe Val 85 90 95 Ala Ser Phe Arg Leu Phe Ala Arg Thr Arg Ser Met Trp Ser Phe Asn 100 105 110 Pro Glu Thr Asn Ile Leu Leu Asn Val Pro Leu Arg Gly Thr Ile Val 115 120 125 Thr Arg Pro Leu Met Glu Ser Glu Leu Val Ile Gly Ala Val Ile Ile 130 135 140 Arg Gly His Leu Arg Met Ala Gly His Ser Leu Gly Arg Cys Asp Ile 145 150 155 160 Lys Asp Leu Pro Lys Glu Ile Thr Val Ala Thr Ser Arg Thr Leu Ser 165 170 175 Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Gly Thr Asp Ser Gly Phe 180 185 190 Ala Ala Tyr Asn Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr Asp 195 200 205 His Ala Gly Ser Asn Asp Asn Ile Ala Leu Leu Val Gln 210 215 220 <210> 11 <211> 76 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 11 Met Tyr Ser Phe Val Ser Glu Glu Thr Gly Thr Leu Ile Val Asn Ser 1 5 10 15 Val Leu Leu Phe Leu Ala Phe Val Val Phe Leu Leu Val Thr Leu Ala 20 25 30 Ile Leu Thr Ala Leu Arg Leu Cys Ala Tyr Cys Cys Asn Ile Val Asn 35 40 45 Val Ser Leu Val Lys Pro Thr Val Tyr Val Tyr Ser Arg Val Lys Asn 50 55 60 Leu Asn Ser Ser Glu Gly Val Pro Asp Leu Leu Val 65 70 75 <210> 12 <211> 805 <212> PRT <213> Homo sapiens <400> 12 Met Ser Ser Ser Ser Trp Leu Leu Leu Ser Leu Val Ala Val Thr Ala 1 5 10 15 Ala Gln Ser Thr Ile Glu Glu Gln Ala Lys Thr Phe Leu Asp Lys Phe 20 25 30 Asn His Glu Ala Glu Asp Leu Phe Tyr Gln Ser Ser Leu Ala Ser Trp 35 40 45 Asn Tyr Asn Thr Asn Ile Thr Glu Glu Asn Val Gln Asn Met Asn Asn 50 55 60 Ala Gly Asp Lys Trp Ser Ala Phe Leu Lys Glu Gln Ser Thr Leu Ala 65 70 75 80 Gln Met Tyr Pro Leu Gln Glu Ile Gln Asn Leu Thr Val Lys Leu Gln 85 90 95 Leu Gln Ala Leu Gln Gln Asn Gly Ser Ser Val Leu Ser Glu Asp Lys 100 105 110 Ser Lys Arg Leu Asn Thr Ile Leu Asn Thr Met Ser Thr Ile Tyr Ser 115 120 125 Thr Gly Lys Val Cys Asn Pro Asp Asn Pro Gln Glu Cys Leu Leu Leu 130 135 140 Glu Pro Gly Leu Asn Glu Ile Met Ala Asn Ser Leu Asp Tyr Asn Glu 145 150 155 160 Arg Leu Trp Ala Trp Glu Ser Trp Arg Ser Glu Val Gly Lys Gln Leu 165 170 175 Arg Pro Leu Tyr Glu Glu Tyr Val Val Leu Lys Asn Glu Met Ala Arg 180 185 190 Ala Asn His Tyr Glu Asp Tyr Gly Asp Tyr Trp Arg Gly Asp Tyr Glu 195 200 205 Val Asn Gly Val Asp Gly Tyr Asp Tyr Ser Arg Gly Gln Leu Ile Glu 210 215 220 Asp Val Glu His Thr Phe Glu Glu Ile Lys Pro Leu Tyr Glu His Leu 225 230 235 240 His Ala Tyr Val Arg Ala Lys Leu Met Asn Ala Tyr Pro Ser Tyr Ile 245 250 255 Ser Pro Ile Gly Cys Leu Pro Ala His Leu Leu Gly Asp Met Trp Gly 260 265 270 Arg Phe Trp Thr Asn Leu Tyr Ser Leu Thr Val Pro Phe Gly Gln Lys 275 280 285 Pro Asn Ile Asp Val Thr Asp Ala Met Val Asp Gln Ala Trp Asp Ala 290 295 300 Gln Arg Ile Phe Lys Glu Ala Glu Lys Phe Phe Val Ser Val Gly Leu 305 310 315 320 Pro Asn Met Thr Gln Gly Phe Trp Glu Asn Ser Met Leu Thr Asp Pro 325 330 335 Gly Asn Val Gln Lys Ala Val Cys His Pro Thr Ala Trp Asp Leu Gly 340 345 350 Lys Gly Asp Phe Arg Ile Leu Met Cys Thr Lys Val Thr Met Asp Asp 355 360 365 Phe Leu Thr Ala His His Glu Met Gly His Ile Gln Tyr Asp Met Ala 370 375 380 Tyr Ala Ala Gln Pro Phe Leu Leu Arg Asn Gly Ala Asn Glu Gly Phe 385 390 395 400 His Glu Ala Val Gly Glu Ile Met Ser Leu Ser Ala Ala Thr Pro Lys 405 410 415 His Leu Lys Ser Ile Gly Leu Leu Ser Pro Asp Phe Gln Glu Asp Asn 420 425 430 Glu Thr Glu Ile Asn Phe Leu Leu Lys Gln Ala Leu Thr Ile Val Gly 435 440 445 Thr Leu Pro Phe Thr Tyr Met Leu Glu Lys Trp Arg Trp Met Val Phe 450 455 460 Lys Gly Glu Ile Pro Lys Asp Gln Trp Met Lys Lys Trp Trp Glu Met 465 470 475 480 Lys Arg Glu Ile Val Gly Val Val Glu Pro Val Pro His Asp Glu Thr 485 490 495 Tyr Cys Asp Pro Ala Ser Leu Phe His Val Ser Asn Asp Tyr Ser Phe 500 505 510 Ile Arg Tyr Tyr Thr Arg Thr Leu Tyr Gln Phe Gln Phe Gln Glu Ala 515 520 525 Leu Cys Gln Ala Ala Lys His Glu Gly Pro Leu His Lys Cys Asp Ile 530 535 540 Ser Asn Ser Thr Glu Ala Gly Gln Lys Leu Phe Asn Met Leu Arg Leu 545 550 555 560 Gly Lys Ser Glu Pro Trp Thr Leu Ala Leu Glu Asn Val Val Gly Ala 565 570 575 Lys Asn Met Asn Val Arg Pro Leu Leu Asn Tyr Phe Glu Pro Leu Phe 580 585 590 Thr Trp Leu Lys Asp Gln Asn Lys Asn Ser Phe Val Gly Trp Ser Thr 595 600 605 Asp Trp Ser Pro Tyr Ala Asp Gln Ser Ile Lys Val Arg Ile Ser Leu 610 615 620 Lys Ser Ala Leu Gly Asp Lys Ala Tyr Glu Trp Asn Asp Asn Glu Met 625 630 635 640 Tyr Leu Phe Arg Ser Ser Val Ala Tyr Ala Met Arg Gln Tyr Phe Leu 645 650 655 Lys Val Lys Asn Gln Met Ile Leu Phe Gly Glu Glu Asp Val Arg Val 660 665 670 Ala Asn Leu Lys Pro Arg Ile Ser Phe Asn Phe Phe Val Thr Ala Pro 675 680 685 Lys Asn Val Ser Asp Ile Ile Pro Arg Thr Glu Val Glu Lys Ala Ile 690 695 700 Arg Met Ser Arg Ser Arg Ile Asn Asp Ala Phe Arg Leu Asn Asp Asn 705 710 715 720 Ser Leu Glu Phe Leu Gly Ile Gln Pro Thr Leu Gly Pro Pro Asn Gln 725 730 735 Pro Pro Val Ser Ile Trp Leu Ile Val Phe Gly Val Val Met Gly Val 740 745 750 Ile Val Val Gly Ile Val Ile Leu Ile Phe Thr Gly Ile Arg Asp Arg 755 760 765 Lys Lys Lys Asn Lys Ala Arg Ser Gly Glu Asn Pro Tyr Ala Ser Ile 770 775 780 Asp Ile Ser Lys Gly Glu Asn Asn Pro Gly Phe Gln Asn Thr Asp Asp 785 790 795 800 Val Gln Thr Ser Phe 805 <210> 13 <211> 178 <212> PRT <213> Unknown <220> <223> Description of Unknown: IL-10 sequence <400> 13 Met His Ser Ser Ala Leu Leu Cys Cys Leu Val Leu Leu Thr Gly Val 1 5 10 15 Arg Ala Ser Pro Gly Gln Gly Thr Gln Ser Glu Asn Ser Cys Thr His 20 25 30 Phe Pro Gly Asn Leu Pro Asn Met Leu Arg Asp Leu Arg Asp Ala Phe 35 40 45 Ser Arg Val Lys Thr Phe Phe Gln Met Lys Asp Gln Leu Asp Asn Leu 50 55 60 Leu Leu Lys Glu Ser Leu Leu Glu Asp Phe Lys Gly Tyr Leu Gly Cys 65 70 75 80 Gln Ala Leu Ser Glu Met Ile Gln Phe Tyr Leu Glu Glu Val Met Pro 85 90 95 Gln Ala Glu Asn Gln Asp Pro Asp Ile Lys Ala His Val Asn Ser Leu 100 105 110 Gly Glu Asn Leu Lys Thr Leu Arg Leu Arg Leu Arg Arg Cys His Arg 115 120 125 Phe Leu Pro Cys Glu Asn Lys Ser Lys Ala Val Glu Gln Val Lys Asn 130 135 140 Ala Phe Asn Lys Leu Gln Glu Lys Gly Ile Tyr Lys Ala Met Ser Glu 145 150 155 160 Phe Asp Ile Phe Ile Asn Tyr Ile Glu Ala Tyr Met Thr Met Lys Ile 165 170 175 Arg Asn <210> 14 <211> 212 <212> PRT <213> Unknown <220> <223> Description of Unknown: IL-6 sequence <400> 14 Met Asn Ser Phe Ser Thr Ser Ala Phe Gly Pro Val Ala Phe Ser Leu 1 5 10 15 Gly Leu Leu Leu Val Leu Pro Ala Ala Phe Pro Ala Pro Val Pro Pro 20 25 30 Gly Glu Asp Ser Lys Asp Val Ala Ala Pro His Arg Gln Pro Leu Thr 35 40 45 Ser Ser Glu Arg Ile Asp Lys Gln Ile Arg Tyr Ile Leu Asp Gly Ile 50 55 60 Ser Ala Leu Arg Lys Glu Thr Cys Asn Lys Ser Asn Met Cys Glu Ser 65 70 75 80 Ser Lys Glu Ala Leu Ala Glu Asn Asn Leu Asn Leu Pro Lys Met Ala 85 90 95 Glu Lys Asp Gly Cys Phe Gln Ser Gly Phe Asn Glu Glu Thr Cys Leu 100 105 110 Val Lys Ile Ile Thr Gly Leu Leu Glu Phe Glu Val Tyr Leu Glu Tyr 115 120 125 Leu Gln Asn Arg Phe Glu Ser Ser Glu Glu Gln Ala Arg Ala Val Gln 130 135 140 Met Ser Thr Lys Val Leu Ile Gln Phe Leu Gln Lys Lys Ala Lys Asn 145 150 155 160 Leu Asp Ala Ile Thr Thr Pro Asp Pro Thr Thr Asn Ala Ser Leu Leu 165 170 175 Thr Lys Leu Gln Ala Gln Asn Gln Trp Leu Gln Asp Met Thr Thr His 180 185 190 Leu Ile Leu Arg Ser Phe Lys Glu Phe Leu Gln Ser Ser Leu Arg Ala 195 200 205 Leu Arg Gln Met 210 <210> 15 <211> 233 <212> PRT <213> Unknown <220> <223> Description of Unknown: TNF-a sequence <400> 15 Met Ser Thr Glu Ser Met Ile Arg Asp Val Glu Leu Ala Glu Glu Ala 1 5 10 15 Leu Pro Lys Lys Thr Gly Gly Pro Gln Gly Ser Arg Arg Cys Leu Phe 20 25 30 Leu Ser Leu Phe Ser Phe Leu Ile Val Ala Gly Ala Thr Thr Leu Phe 35 40 45 Cys Leu Leu His Phe Gly Val Ile Gly Pro Gln Arg Glu Glu Phe Pro 50 55 60 Arg Asp Leu Ser Leu Ile Ser Pro Leu Ala Gln Ala Val Arg Ser Ser 65 70 75 80 Ser Arg Thr Pro Ser Asp Lys Pro Val Ala His Val Val Ala Asn Pro 85 90 95 Gln Ala Glu Gly Gln Leu Gln Trp Leu Asn Arg Arg Ala Asn Ala Leu 100 105 110 Leu Ala Asn Gly Val Glu Leu Arg Asp Asn Gln Leu Val Val Pro Ser 115 120 125 Glu Gly Leu Tyr Leu Ile Tyr Ser Gln Val Leu Phe Lys Gly Gln Gly 130 135 140 Cys Pro Ser Thr His Val Leu Leu Thr His Thr Ile Ser Arg Ile Ala 145 150 155 160 Val Ser Tyr Gln Thr Lys Val Asn Leu Leu Ser Ala Ile Lys Ser Pro 165 170 175 Cys Gln Arg Glu Thr Pro Glu Gly Ala Glu Ala Lys Pro Trp Tyr Glu 180 185 190 Pro Ile Tyr Leu Gly Gly Val Phe Gln Leu Glu Lys Gly Asp Arg Leu 195 200 205 Ser Ala Glu Ile Asn Arg Pro Asp Tyr Leu Asp Phe Ala Glu Ser Gly 210 215 220 Gln Val Tyr Phe Gly Ile Ile Ala Leu 225 230 <210> 16 <400> 16 000 <210> 17 <400> 17 000 <210> 18 <400> 18 000 <210> 19 <400> 19 000 <210> 20 <400> 20 000 <210> 21 <400> 21 000 <210> 22 <400> 22 000 <210> 23 <400> 23 000 <210> 24 <400> 24 000 <210> 25 <400> 25 000 <210> 26 <400> 26 000 <210> 27 <400> 27 000 <210> 28 <400> 28 000 <210> 29 <400> 29 000 <210> 30 <400> 30 000 <210> 31 <400> 31 000 <210> 32 <400> 32 000 <210> 33 <400> 33 000 <210> 34 <400> 34 000 <210> 35 <400> 35 000 <210> 36 <400> 36 000 <210> 37 <400> 37 000 <210> 38 <400> 38 000 <210> 39 <400> 39 000 <210> 40 <400> 40 000 <210> 41 <400> 41 000 <210> 42 <400> 42 000 <210> 43 <400> 43 000 <210> 44 <400> 44 000 <210> 45 <400> 45 000 <210> 46 <400> 46 000 <210> 47 <400> 47 000 <210> 48 <400> 48 000 <210> 49 <400> 49 000 <210> 50 <400> 50 000 <210> 51 <400> 51 000 <210> 52 <400> 52 000 <210> 53 <400> 53 000 <210> 54 <400> 54 000 <210> 55 <400> 55 000 <210> 56 <400> 56 000 <210> 57 <400> 57 000 <210> 58 <400> 58 000 <210> 59 <400> 59 000 <210> 60 <400> 60 000 <210> 61 <400> 61 000 <210> 62 <400> 62 000 <210> 63 <400> 63 000 <210> 64 <400> 64 000 <210> 65 <400> 65 000 <210> 66 <400> 66 000 <210> 67 <400> 67 000 <210> 68 <400> 68 000 <210> 69 <400> 69 000 <210> 70 <400> 70 000 <210> 71 <400> 71 000 <210> 72 <400> 72 000 <210> 73 <400> 73 000 <210> 74 <400> 74 000 <210> 75 <400> 75 000 <210> 76 <400> 76 000 <210> 77 <400> 77 000 <210> 78 <400> 78 000 <210> 79 <400> 79 000 <210> 80 <400> 80 000 <210> 81 <400> 81 000 <210> 82 <400> 82 000 <210> 83 <400> 83 000 <210> 84 <400> 84 000 <210> 85 <400> 85 000 <210> 86 <400> 86 000 <210> 87 <400> 87 000 <210> 88 <400> 88 000 <210> 89 <400> 89 000 <210> 90 <400> 90 000 <210> 91 <400> 91 000 <210> 92 <400> 92 000 <210> 93 <400> 93 000 <210> 94 <400> 94 000 <210> 95 <400> 95 000 <210> 96 <400> 96 000 <210> 97 <400> 97 000 <210> 98 <400> 98 000 <210> 99 <400> 99 000 <210> 100 <400> 100 000 <210> 101 <211> 6462 <212> DNA <213> Sin Nombre orthohantavirus <400> 101 atggaaaaat atagggagat tcatcaaaga gtcaaggaga ttcctcctgg gggggcttct 60 gcattagaat gtttagattt gcttgaccgt ctttatgcag tcagacatga tgtagttgat 120 cagatgatca agcatgattg gtctgacaat aaagatatgg aaagacctat aggtcaagtt 180 ctgttaatgg ctggtgtacc aaatgatgtg attcaaggta tggagaagaa agttatacct 240 acaagccctt caggacagat tttaaaaagc tttttccgca tgacacctga taattataaa 300 atcacaggtg ccttaattga gtttatcgag gtaacagtga ctgcagatgt tgctaaaggt 360 atccgtgaaa agaaattaaa gtatgagagt ggtcttcagt ttgtggagtc tttattaagt 420 caagaacaca aaaaaggtaa tataaatcaa gcttataaga tcacatttga tgttgtggct 480 gtaaagacgg atggttcaaa catatcaact caatggccta gtcggcgtaa tgatggtgtt 540 gttcaacata tgaggcttgt tcaggctgat attaattatg ttagagaaca tctcattaag 600 cctgatgaac gtgcatcatt agaagccatg tttaatctta agtttcatgt aggaggccct 660 aaactgaggt attttaatat accagattac aagcctcagt cattatgtca acctgagatt 720 acgaatttaa ttcaatattg caagcactgg ctcacagaag atcatgattt tgtttttaag 780 gaagtcacgg gtaataatgt tatgaactca tttgagaata atgaaagtgt atatatgtct 840 agatacaggg agtctcgtaa accacgtaat ttcttattaa ttcaaggttc tattcaaggt 900 ccttatttac catcaactat tagctctgac cagtgtgaca caagaattgg ctgtttggag 960 gtgttaaaag tacatccaga gacaccagta caagcaattg cagtggatat ggcatataag 1020 tatatggagt taaatagaga tgagatcatc aactactaca atcctagagt tcattttcaa 1080 gcaactcagt cagtgaagga accaggtaca ttcaaattag gactttctca actaaatccg 1140 atgtctaaat caatattgga ccaggttggg aaacacaagt cagaaaaggg cctttttggt 1200 gaaccattag agagtataaa catatcaagc cagattcaac agaatgagtg ttcacgtatt 1260 atagaatcaa tactttcaaa tctcgaaata aatgttggtg aggtaacaat gagtctagct 1320 aatcctcgta aaactacagg tgtagatgag ttgttaggta agttctatga gaatgaactg 1380 tctaagtatt tgatcagcat attacgaaaa actgcagcct ggcatattgg gcatttaata 1440 agagatataa cagaaagtct cattgctcat gcaggtttaa agcggtctaa atactggtca 1500 atccatgctt atgatcatgg tggggtaata ttgttcatcc ttccttcaaa gtctttagag 1560 gttgtcggat cttatattcg gtatttcaca gtattcaaag atggtatagg gcttatagat 1620 gaggaaaatt tagactcaaa ggtagacatc gacggtgtgc agtggtgttt ttcaaaagta 1680 atgagtattg acttaaacag gttgttagct ttaaatattg cctttgaaaa ggcacttctt 1740 gctactgcca cttggtttca atattacaca gaagaccaag ggcattttcc attacaacat 1800 gcattaaggt ctgtgttctc ttttcatttt ttattatgtg tttctcagaa aatgaagata 1860 tgtgcaattt ttgataattt acgctatttg atcccagctg tcacatcatt atattcaggt 1920 tatgagctct taatagaaaa attctttgag cggccgttta agagtgcctt agaagtatat 1980 ttatataata taataaaagc attgcttata agcctagcac aaaataataa ggtacgattc 2040 tactctaaag tgcgtcttct tggcctcact gtcgatcact caactgtagg tgcaagtgga 2100 gtttatcctt cattgatgtc tagagttgtt tataagcact atcgtagtct tatttctgaa 2160 gcaacaacat gtttctttct ttttgaaaag ggcctacacg gaaatctaaa tgaggaggct 2220 aaaatacatc ttgagactgt agagtgggca agaaaatttg aggcaaaaga gagaaaatat 2280 ggagacatat taatgaggga aggttacacg attgatgcta tacgtgttgg tgatgtgcag 2340 gtagaacaac aattattttg tcaagaggtt gtggagttaa gtgcagaaga actcaacaag 2400 tatttacaag caaaaagtca ggtcttatca tccaatatca tgaataaaca ttgggataag 2460 ccgtatttta gtcagacaag gaatataagt ttaaagggta tgtctggagc attgcaagaa 2520 gatggacatc ttgcagcaag tgttacgtta attgaggcaa ttagattttt aaatagatca 2580 cagactaatc caaacgttat tgacatgtat gaacagacaa agcagcacaa agctcaagca 2640 cgtattgtga ggaaatatca gcggaccgaa gctgatagag gttttttcat cactactctc 2700 ccgacaagag tcaggttaga aattatagaa gattattatg atgcaatagc tagagttgtc 2760 ccagaggaat atatatcata cggaggagac aagaaaattc taaatataca gactgcatta 2820 gagaaggcat tacgatgggc ttcaggatca tcagaggtca taacaagcac aggaaatgta 2880 attaaattca agaggaggct gatgtatgtg agtgctgatg ccacgaaatg gtcaccagga 2940 gataattcgg caaagtttaa gagattcaca caggcattat atgatggctt gtcagatgag 3000 aagttaaaat gttgcgttgt tgatgccctt agacatgttt atgaaacaga gttctttatg 3060 tccagaaaac ttcatcgcta tatagattct atggatgagc attctgaggc tgtccaagat 3120 ttcctcgatt tttttaaggg tggagtgtct gctacagtca aaggtaattg gctccaaggt 3180 aacttgaaca aatgttcttc attgtttggg gctgcagtgt cactgctgtt taggcgtatt 3240 tgggcagagt tatttccaga attagaatgc ttttttgagt ttgcacatca ctcagatgat 3300 gccctcttta tttatggtta tttagagcca gaagatgatg gaactgattg gtttttatat 3360 gtatctcaac agatacaggc tggtaattat cactggcatg ctgttaacca agagatgtgg 3420 aagagcatgt ttaatttgca tgagcattta ctgctgatgg gctccataaa ggtatcccca 3480 aaaaagacaa cagtttctcc tacaaatgca gaatttcttt ccacattttt tgaaggttgt 3540 gcggtgtcaa tcccttttat aaaaatactg cttggatcgt tatcagattt accaggatta 3600 ggattctttg atgatctggc tgctgcacaa agtagatgtg tcaaagcaat ggacttaggg 3660 gcatccccac agttggcaca attagctgtt gttatttgca ctagtaaagt tgagagatta 3720 tacggcactg cagatgggat ggttaatagt ccagtggcat ttttaaaggt aacgaaggcc 3780 catgtaccca tacctttagg aggtgatggc tcaatgtcta ttatggagct tgccacagca 3840 ggtataggta tggctgataa aaatattctc aagcaagcat tttattctta caagcataca 3900 agacgtgatg gggataggta tgttttgggt cttttcaagt tcttaatgtc tcttagtgaa 3960 gatgtttttc agcatgatag actaggtgag tttagttttg ttggtaaagt tcagtggaag 4020 gtattcacac ctaaaaatga gtttgaattc tttgatcaat tttcacagtc ctacttaaag 4080 agttggacaa atcaacaccc agtatatgat tatattatac ctagaggtag ggataatctt 4140 ttagtctatt tagtcagaaa attaaatgac cctagtattg tcacagctat gacaatgcaa 4200 tctccattac aacttagatt caggatgcag gcaaagcagc acatgaaagt gtgtaagctt 4260 gaaggggaat gggtgacatt cagagaagtt ttagctgcag cagacagttt tgcaactaag 4320 tacaatccca cagaaaagga cttagatctg tttaatacat tagttagttg tacattttct 4380 aaagagtatg catggaaaga tttcttgaac gaagttaggt gtgaagtggt acctacaaaa 4440 catgtccatc ggtcaaaaat cgcaagaact tttacagtgc gtgagaagga tcaagctatt 4500 cagaatccaa ttactgctgt tatagggtat aaatatgctt caactgtaga tgaaatcagt 4560 gatgttttag atagttcctt ttttcctgat tcattatctg ctgaccttca agtcatgaag 4620 gaaggtgtgt atagagagct gggtttagat ataggtcttc ctgaggtgtt gaagcgaata 4680 gcaccacttt tgtacaaagc tgggagatct agagttgtta tagtggaagg caacgtagag 4740 ggcacagcag aatcaatttg tagctattgg cttcgtagca tgtcattggt caaaacaatc 4800 aaagtacgtc caaaaaaaga agtgctcaga gcagtttcac tatatagcac aaaggaaaat 4860 attgggttac aagatgatgt tgcagctaca cgattgtgta tagaagtctg gagatggtgc 4920 aaagctaatg atcagaatgt aaatgactgg ttaaatgcac tgtactttga aaagcaaact 4980 ctcatggatt gggtagaaag gttccgtaga aaaggagtgg ttcctattga ccctgaaatt 5040 cagtgtattg ccttactact ttatgatgtg ttaggttata agagtgtatt gcagatgcag 5100 gcaaataggc gagcatattc agggaaacag tatgatgcat attgtgttca aacgtataat 5160 gaagaaacaa gactctatga gggagattta agggtcacat ttaattttgg ccttgattgt 5220 gcaaggttgg aaatcttttg ggataagaaa gaatatattc ttgaaacatc aattacgcaa 5280 cgtcatgttt taaagttgat gatggaggaa gtcacacaag aattgttaag gtgtgggatg 5340 agatttaaga cagagcaagt aagtcatacg aggagtttgg ttttattcaa aacggaatca 5400 gggtttgagt ggggtaaacc aaatgtgccg tgtatagtct tcaagcattg tgctttgcgt 5460 acaggtttaa ggactaagca agctattaat aaagagttca tgataaatgt ccaagcagat 5520 gggtttagag ctatagcaca gatggatatg gaaagtccga gatttctatt agcacatgct 5580 tatcatacat tacgtgatgt gcgttaccaa gctgtgcagg ctgtaggcaa tgtgtggttt 5640 caaactgctc aacataaatt attcataaat ccaataatat catccgggtt gttagaaaac 5700 tttatgaaag gcttgccagc agcaattcct cctgcagctt attctttaat tatgaataag 5760 gctaagatat ctgtagattt atttatgttc aatgagttgc tggctttagt taacccaaga 5820 aatgttctca atttggacgg aatagaagag acttcagaag gatatagtac agtaacctct 5880 atatctagcc gacaatggtc tgaagaggta agtcttatgg ctgatgatga cattgatgat 5940 gaagaagaat ttacaatagc tcttgatgat atagactttg agcagatcaa tcttgatgag 6000 gacatccaac attttttgca agatgaatca gcttatactg gtgatttaac aatacaaaca 6060 gaggaagttg aggtaaaaag gataaggggt gtaacgcgcg tgcttgaacc agttaagcta 6120 attaagagct gggtttcgaa agggcttgct atcgataaag tgtataaccc tatagggata 6180 gtgctgatgg caaggtacat gtcaaagaat tatgatttta gcaaaattcc cctagcttta 6240 ttaaacccat atgatttaac tgagtttgaa agtgttgtca aaggctgggg tgaaactgtt 6300 aatgacagat ttctagaggt tgacaatgat gcacaacggt tggtccgaga gaaaaacata 6360 ttgcccgaag acatattacc agattcatta ttttctttta ggcacgttga tgtgttgtta 6420 aagagactat tccctcatga ccctgtgtct tcattctatt aa 6462 <210> 102 <211> 1287 <212> DNA <213> Sin Nombre orthohantavirus <400> 102 atgagcaccc tcaaagaagt gcaagacaac atcactctcc acgaacaaca actcgtgact 60 gccaggcaga agctcaaaga tgcagaaaga gcggtggaat tggaccccga tgatgttaac 120 aaaagcacat tacagagcag acgggcagct gtgtctgcat tggagaccaa actcggagaa 180 cttaagcggg aactggctga tcttattgca gctcagaaat tggcttcaaa acctgttgat 240 ccaacaggga ttgaacctga tgaccatcta aaggaaaagt catcattgag atatggaaat 300 gtccttgatg taaattccat tgacttagaa gagccaagtg ggcaaacagc tgattggaaa 360 tccatcggac tctacattct aagtttcgca ttaccgatta ttcttaaagc cttgtacatg 420 ttatctacta ggggccgtca aacaatcaaa gaaaacaagg gaacaagaat tcgattcaag 480 gatgattcat cttatgaaga agtcaatggg atacgtaagc caagacatct gtatgtttct 540 atgccaactg cccagtctac aatgaaagca gatgagatta ctcccgggag gttccgtaca 600 attgcttgtg gattattccc agcccaagtc aaagcaagga atattatcag tcctgtcatg 660 ggtgtgattg gctttagttt ttttgtgaaa gattggatgg aaaggattga tgacttcctg 720 gctgcacgtt gcccatttct gcctgagcag aaagacccta gagatgctgc attggcaact 780 aatagagcct attttataac acgtcaatta caggttgatg agtcaaaggt tagtgatatt 840 gaggacctga ttgctgatgc aagggctgag tctgccacta tattcgcaga tattgctact 900 cctcattcag tttgggtctt tgcatgtgct ccagatcgtt gtccacctac agcattatat 960 gtggccggga tgccggaact gggtgcattt tttgctattc tccaggatat gaggaacacc 1020 ataatggcat ccaaatctgt ggggacatct gaagagaaat tgaagaagaa atcagcattc 1080 taccagtcat acttaagacg tactcagtca atgggaattc aactggacca gaagataatc 1140 atcttataca tgagccattg gggaagagag gccgtgaatc acttccatct tggagatgat 1200 atggatcctg agcttaggga acttgcccag acccttgtag atatcaaggt cagggaaatc 1260 tctaaccaag aaccacttaa actttaa 1287 <210> 103 <211> 192 <212> DNA <213> Sin Nombre orthohantavirus <400> 103 atgcagaaag agcggtggaa ttggaccccg atgatgttaa caaaagcaca ttacagagca 60 gacgggcagc tgtgtctgca ttggagacca aactcggaga acttaagcgg gaactggctg 120 atcttattgc agctcagaaa ttggcttcaa aacctgttga tccaacaggg attgaacctg 180 atgaccatct aa 192 <210> 104 <211> 3423 <212> DNA <213> Sin Nombre orthohantavirus <400> 104 atggtagggt gggtttgcat cttcctcgtg gtccttacta ctgcaactgc tgggctaaca 60 cggaatcttt atgagttgaa gatagaatgt ccacatactg tgggtttagg tcagggttac 120 gtgacaggtt cagtggaaat tacacctatt ctcttaacgc aggtagctga tctgaagatt 180 gagagttctt gtaatttcga tttgcatgtc ccggctacca ctacccaaaa atacaatcag 240 gttgactgga ccaaaaaaag ttcaactaca gaaagcacaa atgcaggtgc aactacattt 300 gaggctaaaa caaaagagat aaatttgaaa ggcacatgta atattcctcc aactacattt 360 gaagctgcat ataaatcaag gaagacagta atttgttatg atttagcctg taatcaaaca 420 cattgtcttc ctacggtcca tttgattgct cctgttcaaa cgtgcatgtc tgtgcggagc 480 tgtatgatag gtttgctgtc aagcaggatt caagtgatat atgagaagac atactgcgtt 540 acaggtcaat taatagaggg gctatgtttc atcccaacac atacaattgc actcacacaa 600 cctggtcata cctatgatac tatgacattg ccagtgactt gttttttagt agctaaaaag 660 ttgggaacac agcttaagct ggctgttgag ttagagaaac tgattactgg tgtaagttgc 720 acagaaaaca gctttcaagg ttactacatc tgttttatcg ggaaacattc agagccctta 780 tttgtgccaa caatggagga ttataggtca gctgagttat ttacccgtat ggttttaaat 840 ccgagaggtg aagatcatga ccctgatcaa aatggacaag gtttaatgag aatagctggg 900 cctgttacag ctaaggtgcc atctacagaa acaactgaaa caatgcaagg aattgcattt 960 gctggagcac caatgtatag ctctttctca accctcgtga ggaaggctga tcctgagtat 1020 gtcttctcac caggtataat tgcagaatca aatcatagtg tttgtgataa aaaaacagta 1080 ccccttacat ggacagggtt tttggcagtt tctggagaga tagagaaaat aacaggctgt 1140 acagtcttct gtacattggc tggacctggt gctagttgtg aagcatactc agaaacagga 1200 atctttaata taagttctcc tacttgtcta gtgaataaag ttcaaaaatt cagaggctca 1260 gaacagagga ttaacttcat gtgccaaaga gttgatcaag atgtagttgt ctattgtaat 1320 ggacaaaaga aagtcattct taccaaaact ctggtcatag gccaatgcat ttatacattc 1380 actagtttat tctcactaat cccaggagtt gcccattctc ttgctgtaga gctatgtgtt 1440 ccaggccttc atggctgggc tacaacggca ttactgatta ctttttgctt tggctggctc 1500 cttataccgg cagtcacctt aattatactg aagatcctga ggttgctcac tttctcatgc 1560 tcacattatt ccacagaatc aaaattcaaa gttatcttag aaagggttaa ggttgaatat 1620 cagaaaacaa tgggctctat ggtgtgtgat atttgccacc acgaatgcga aacagcaaaa 1680 gaacttgaaa cacataagaa aagctgtcca gaaggtcaat gcccgtattg tatgacaata 1740 actgaatcca ctgagagtgc tctccaagcc cattttgcaa tctgtaagct aacaaacagg 1800 tttcaggaaa acttaaaaaa gtcattgaaa cgcccagaag tacggaaagg ttgttacagg 1860 acactgggag tttttagata caagagcaga tgttatgttg gtttagtatg gggaattctt 1920 ttaacaactg aactgatcat atgggcagcc agtgcagaca cccctttaat ggagtctggt 1980 tggtctgaca cagcacatgg tgtgggcata attcctatga agacagattt ggagcttgat 2040 tttgcattgg cctcatcatc ttcttacagt tataggcgaa agcttgttaa tcctgctaat 2100 caagaagaaa cactcccttt tcatttccag ttagataaac aagtagtgca tgcagagatc 2160 cagaacctag gacattggat ggatggcaca ttcaacataa aaactgcttt tcactgttat 2220 ggggagtgta aaaaatatgc ctatccttgg caaacagcca agtgtttctt tgaaaaggat 2280 tatcaatatg aaacaagttg gggctgtaat ccaccagact gtccaggggt aggtacaggt 2340 tgtacagctt gtggggtgta ccttgataag ctccgttcgg ttgggaaagc gtacaagata 2400 gtatcactca aatatacacg gaaggtgtgt attcaattag gaacagaaca aacttgtaaa 2460 catatagatg taaatgattg cctggttacc ccttctgtca aagtttgtat gattggtact 2520 atatcaaagc tccagccagg tgataccttg ttgttcttag gtcctttaga gcagggtggg 2580 atcattctta agcaatggtg tacaacatca tgtgtgtttg gagatcccgg tgatattatg 2640 tcaacaacaa gtgggatgcg gtgcccagaa catactggat cttttagaaa gatctgtggg 2700 tttgctacga caccaacatg tgagtatcaa ggcaacacag tgtctggatt ccaacgcatg 2760 atggcaactc gagattcttt ccagtcattc aatgtgacag aaccacatat cactagcaac 2820 cgacttgagt ggattgatcc agatagcagt atcaaagatc acattaatat ggttttaaat 2880 cgagatgttt cctttcagga tctaagtgat aacccatgca aggttgacct gcatacacaa 2940 tcaattgacg gggcctgggg ttcaggagta ggttttacgt tggtatgtac tgtggggctt 3000 acagagtgtg caaattttat aacttcaatt aaagcatgtg attctgccat gtgttatgga 3060 gccacagtga caaatctgct tagagggtct aacacagtta aagttgttgg taaaggtggg 3120 cattctggat ctttgtttaa atgctgccat gatactgact gtaccgaaga agggttagca 3180 gcatctccac cacatttaga cagggttaca ggctataatc aaatagattc tgataaagtt 3240 tatgatgacg gtgcaccgcc ctgtacaatc aagtgctggt tcaccaagtc aggtgaatgg 3300 ctgttgggaa tccttaatgg caattgggtg gtagttgctg ttctgattgt aattttgata 3360 ttatcgatac tcctttttag ctttttttgt cctgtcagaa gtagaaagaa taaagctaat 3420 tag 3423 <210> 105 <400> 105 000 <210> 106 <400> 106 000 <210> 107 <400> 107 000 <210> 108 <400> 108 000 <210> 109 <400> 109 000 <210> 110 <400> 110 000 <210> 111 <400> 111 000 <210> 112 <400> 112 000 <210> 113 <400> 113 000 <210> 114 <400> 114 000 <210> 115 <400> 115 000 <210> 116 <400> 116 000 <210> 117 <400> 117 000 <210> 118 <400> 118 000 <210> 119 <400> 119 000 <210> 120 <400> 120 000 <210> 121 <400> 121 000 <210> 122 <400> 122 000 <210> 123 <400> 123 000 <210> 124 <400> 124 000 <210> 125 <400> 125 000 <210> 126 <400> 126 000 <210> 127 <400> 127 000 <210> 128 <400> 128 000 <210> 129 <400> 129 000 <210> 130 <400> 130 000 <210> 131 <400> 131 000 <210> 132 <400> 132 000 <210> 133 <400> 133 000 <210> 134 <400> 134 000 <210> 135 <400> 135 000 <210> 136 <400> 136 000 <210> 137 <400> 137 000 <210> 138 <400> 138 000 <210> 139 <400> 139 000 <210> 140 <400> 140 000 <210> 141 <400> 141 000 <210> 142 <400> 142 000 <210> 143 <400> 143 000 <210> 144 <400> 144 000 <210> 145 <400> 145 000 <210> 146 <400> 146 000 <210> 147 <400> 147 000 <210> 148 <400> 148 000 <210> 149 <400> 149 000 <210> 150 <400> 150 000 <210> 151 <211> 2153 <212> PRT <213> Sin Nombre orthohantavirus <400> 151 Met Glu Lys Tyr Arg Glu Ile His Gln Arg Val Lys Glu Ile Pro Pro 1 5 10 15 Gly Gly Ala Ser Ala Leu Glu Cys Leu Asp Leu Leu Asp Arg Leu Tyr 20 25 30 Ala Val Arg His Asp Val Val Asp Gln Met Ile Lys His Asp Trp Ser 35 40 45 Asp Asn Lys Asp Met Glu Arg Pro Ile Gly Gln Val Leu Leu Met Ala 50 55 60 Gly Val Pro Asn Asp Val Ile Gln Gly Met Glu Lys Lys Val Ile Pro 65 70 75 80 Thr Ser Pro Ser Gly Gln Ile Leu Lys Ser Phe Phe Arg Met Thr Pro 85 90 95 Asp Asn Tyr Lys Ile Thr Gly Ala Leu Ile Glu Phe Ile Glu Val Thr 100 105 110 Val Thr Ala Asp Val Ala Lys Gly Ile Arg Glu Lys Lys Leu Lys Tyr 115 120 125 Glu Ser Gly Leu Gln Phe Val Glu Ser Leu Leu Ser Gln Glu His Lys 130 135 140 Lys Gly Asn Ile Asn Gln Ala Tyr Lys Ile Thr Phe Asp Val Val Ala 145 150 155 160 Val Lys Thr Asp Gly Ser Asn Ile Ser Thr Gln Trp Pro Ser Arg Arg 165 170 175 Asn Asp Gly Val Val Gln His Met Arg Leu Val Gln Ala Asp Ile Asn 180 185 190 Tyr Val Arg Glu His Leu Ile Lys Pro Asp Glu Arg Ala Ser Leu Glu 195 200 205 Ala Met Phe Asn Leu Lys Phe His Val Gly Gly Pro Lys Leu Arg Tyr 210 215 220 Phe Asn Ile Pro Asp Tyr Lys Pro Gln Ser Leu Cys Gln Pro Glu Ile 225 230 235 240 Thr Asn Leu Ile Gln Tyr Cys Lys His Trp Leu Thr Glu Asp His Asp 245 250 255 Phe Val Phe Lys Glu Val Thr Gly Asn Asn Val Met Asn Ser Phe Glu 260 265 270 Asn Asn Glu Ser Val Tyr Met Ser Arg Tyr Arg Glu Ser Arg Lys Pro 275 280 285 Arg Asn Phe Leu Leu Ile Gln Gly Ser Ile Gln Gly Pro Tyr Leu Pro 290 295 300 Ser Thr Ile Ser Ser Asp Gln Cys Asp Thr Arg Ile Gly Cys Leu Glu 305 310 315 320 Val Leu Lys Val His Pro Glu Thr Pro Val Gln Ala Ile Ala Val Asp 325 330 335 Met Ala Tyr Lys Tyr Met Glu Leu Asn Arg Asp Glu Ile Ile Asn Tyr 340 345 350 Tyr Asn Pro Arg Val His Phe Gln Ala Thr Gln Ser Val Lys Glu Pro 355 360 365 Gly Thr Phe Lys Leu Gly Leu Ser Gln Leu Asn Pro Met Ser Lys Ser 370 375 380 Ile Leu Asp Gln Val Gly Lys His Lys Ser Glu Lys Gly Leu Phe Gly 385 390 395 400 Glu Pro Leu Glu Ser Ile Asn Ile Ser Ser Gln Ile Gln Gln Asn Glu 405 410 415 Cys Ser Arg Ile Ile Glu Ser Ile Leu Ser Asn Leu Glu Ile Asn Val 420 425 430 Gly Glu Val Thr Met Ser Leu Ala Asn Pro Arg Lys Thr Thr Gly Val 435 440 445 Asp Glu Leu Leu Gly Lys Phe Tyr Glu Asn Glu Leu Ser Lys Tyr Leu 450 455 460 Ile Ser Ile Leu Arg Lys Thr Ala Ala Trp His Ile Gly His Leu Ile 465 470 475 480 Arg Asp Ile Thr Glu Ser Leu Ile Ala His Ala Gly Leu Lys Arg Ser 485 490 495 Lys Tyr Trp Ser Ile His Ala Tyr Asp His Gly Gly Val Ile Leu Phe 500 505 510 Ile Leu Pro Ser Lys Ser Leu Glu Val Val Gly Ser Tyr Ile Arg Tyr 515 520 525 Phe Thr Val Phe Lys Asp Gly Ile Gly Leu Ile Asp Glu Glu Asn Leu 530 535 540 Asp Ser Lys Val Asp Ile Asp Gly Val Gln Trp Cys Phe Ser Lys Val 545 550 555 560 Met Ser Ile Asp Leu Asn Arg Leu Leu Ala Leu Asn Ile Ala Phe Glu 565 570 575 Lys Ala Leu Leu Ala Thr Ala Thr Trp Phe Gln Tyr Tyr Thr Glu Asp 580 585 590 Gln Gly His Phe Pro Leu Gln His Ala Leu Arg Ser Val Phe Ser Phe 595 600 605 His Phe Leu Leu Cys Val Ser Gln Lys Met Lys Ile Cys Ala Ile Phe 610 615 620 Asp Asn Leu Arg Tyr Leu Ile Pro Ala Val Thr Ser Leu Tyr Ser Gly 625 630 635 640 Tyr Glu Leu Leu Ile Glu Lys Phe Phe Glu Arg Pro Phe Lys Ser Ala 645 650 655 Leu Glu Val Tyr Leu Tyr Asn Ile Ile Lys Ala Leu Leu Ile Ser Leu 660 665 670 Ala Gln Asn Asn Lys Val Arg Phe Tyr Ser Lys Val Arg Leu Leu Gly 675 680 685 Leu Thr Val Asp His Ser Thr Val Gly Ala Ser Gly Val Tyr Pro Ser 690 695 700 Leu Met Ser Arg Val Val Tyr Lys His Tyr Arg Ser Leu Ile Ser Glu 705 710 715 720 Ala Thr Thr Cys Phe Phe Leu Phe Glu Lys Gly Leu His Gly Asn Leu 725 730 735 Asn Glu Glu Ala Lys Ile His Leu Glu Thr Val Glu Trp Ala Arg Lys 740 745 750 Phe Glu Ala Lys Glu Arg Lys Tyr Gly Asp Ile Leu Met Arg Glu Gly 755 760 765 Tyr Thr Ile Asp Ala Ile Arg Val Gly Asp Val Gln Val Glu Gln Gln 770 775 780 Leu Phe Cys Gln Glu Val Val Glu Leu Ser Ala Glu Glu Leu Asn Lys 785 790 795 800 Tyr Leu Gln Ala Lys Ser Gln Val Leu Ser Ser Asn Ile Met Asn Lys 805 810 815 His Trp Asp Lys Pro Tyr Phe Ser Gln Thr Arg Asn Ile Ser Leu Lys 820 825 830 Gly Met Ser Gly Ala Leu Gln Glu Asp Gly His Leu Ala Ala Ser Val 835 840 845 Thr Leu Ile Glu Ala Ile Arg Phe Leu Asn Arg Ser Gln Thr Asn Pro 850 855 860 Asn Val Ile Asp Met Tyr Glu Gln Thr Lys Gln His Lys Ala Gln Ala 865 870 875 880 Arg Ile Val Arg Lys Tyr Gln Arg Thr Glu Ala Asp Arg Gly Phe Phe 885 890 895 Ile Thr Thr Leu Pro Thr Arg Val Arg Leu Glu Ile Ile Glu Asp Tyr 900 905 910 Tyr Asp Ala Ile Ala Arg Val Val Pro Glu Glu Tyr Ile Ser Tyr Gly 915 920 925 Gly Asp Lys Lys Ile Leu Asn Ile Gln Thr Ala Leu Glu Lys Ala Leu 930 935 940 Arg Trp Ala Ser Gly Ser Ser Glu Val Ile Thr Ser Thr Gly Asn Val 945 950 955 960 Ile Lys Phe Lys Arg Arg Leu Met Tyr Val Ser Ala Asp Ala Thr Lys 965 970 975 Trp Ser Pro Gly Asp Asn Ser Ala Lys Phe Lys Arg Phe Thr Gln Ala 980 985 990 Leu Tyr Asp Gly Leu Ser Asp Glu Lys Leu Lys Cys Cys Val Val Asp 995 1000 1005 Ala Leu Arg His Val Tyr Glu Thr Glu Phe Phe Met Ser Arg Lys 1010 1015 1020 Leu His Arg Tyr Ile Asp Ser Met Asp Glu His Ser Glu Ala Val 1025 1030 1035 Gln Asp Phe Leu Asp Phe Phe Lys Gly Gly Val Ser Ala Thr Val 1040 1045 1050 Lys Gly Asn Trp Leu Gln Gly Asn Leu Asn Lys Cys Ser Ser Leu 1055 1060 1065 Phe Gly Ala Ala Val Ser Leu Leu Phe Arg Arg Ile Trp Ala Glu 1070 1075 1080 Leu Phe Pro Glu Leu Glu Cys Phe Phe Glu Phe Ala His His Ser 1085 1090 1095 Asp Asp Ala Leu Phe Ile Tyr Gly Tyr Leu Glu Pro Glu Asp Asp 1100 1105 1110 Gly Thr Asp Trp Phe Leu Tyr Val Ser Gln Gln Ile Gln Ala Gly 1115 1120 1125 Asn Tyr His Trp His Ala Val Asn Gln Glu Met Trp Lys Ser Met 1130 1135 1140 Phe Asn Leu His Glu His Leu Leu Leu Met Gly Ser Ile Lys Val 1145 1150 1155 Ser Pro Lys Lys Thr Thr Val Ser Pro Thr Asn Ala Glu Phe Leu 1160 1165 1170 Ser Thr Phe Phe Glu Gly Cys Ala Val Ser Ile Pro Phe Ile Lys 1175 1180 1185 Ile Leu Leu Gly Ser Leu Ser Asp Leu Pro Gly Leu Gly Phe Phe 1190 1195 1200 Asp Asp Leu Ala Ala Ala Gln Ser Arg Cys Val Lys Ala Met Asp 1205 1210 1215 Leu Gly Ala Ser Pro Gln Leu Ala Gln Leu Ala Val Val Ile Cys 1220 1225 1230 Thr Ser Lys Val Glu Arg Leu Tyr Gly Thr Ala Asp Gly Met Val 1235 1240 1245 Asn Ser Pro Val Ala Phe Leu Lys Val Thr Lys Ala His Val Pro 1250 1255 1260 Ile Pro Leu Gly Gly Asp Gly Ser Met Ser Ile Met Glu Leu Ala 1265 1270 1275 Thr Ala Gly Ile Gly Met Ala Asp Lys Asn Ile Leu Lys Gln Ala 1280 1285 1290 Phe Tyr Ser Tyr Lys His Thr Arg Arg Asp Gly Asp Arg Tyr Val 1295 1300 1305 Leu Gly Leu Phe Lys Phe Leu Met Ser Leu Ser Glu Asp Val Phe 1310 1315 1320 Gln His Asp Arg Leu Gly Glu Phe Ser Phe Val Gly Lys Val Gln 1325 1330 1335 Trp Lys Val Phe Thr Pro Lys Asn Glu Phe Glu Phe Phe Asp Gln 1340 1345 1350 Phe Ser Gln Ser Tyr Leu Lys Ser Trp Thr Asn Gln His Pro Val 1355 1360 1365 Tyr Asp Tyr Ile Ile Pro Arg Gly Arg Asp Asn Leu Leu Val Tyr 1370 1375 1380 Leu Val Arg Lys Leu Asn Asp Pro Ser Ile Val Thr Ala Met Thr 1385 1390 1395 Met Gln Ser Pro Leu Gln Leu Arg Phe Arg Met Gln Ala Lys Gln 1400 1405 1410 His Met Lys Val Cys Lys Leu Glu Gly Glu Trp Val Thr Phe Arg 1415 1420 1425 Glu Val Leu Ala Ala Ala Asp Ser Phe Ala Thr Lys Tyr Asn Pro 1430 1435 1440 Thr Glu Lys Asp Leu Asp Leu Phe Asn Thr Leu Val Ser Cys Thr 1445 1450 1455 Phe Ser Lys Glu Tyr Ala Trp Lys Asp Phe Leu Asn Glu Val Arg 1460 1465 1470 Cys Glu Val Val Pro Thr Lys His Val His Arg Ser Lys Ile Ala 1475 1480 1485 Arg Thr Phe Thr Val Arg Glu Lys Asp Gln Ala Ile Gln Asn Pro 1490 1495 1500 Ile Thr Ala Val Ile Gly Tyr Lys Tyr Ala Ser Thr Val Asp Glu 1505 1510 1515 Ile Ser Asp Val Leu Asp Ser Ser Phe Phe Pro Asp Ser Leu Ser 1520 1525 1530 Ala Asp Leu Gln Val Met Lys Glu Gly Val Tyr Arg Glu Leu Gly 1535 1540 1545 Leu Asp Ile Gly Leu Pro Glu Val Leu Lys Arg Ile Ala Pro Leu 1550 1555 1560 Leu Tyr Lys Ala Gly Arg Ser Arg Val Val Ile Val Glu Gly Asn 1565 1570 1575 Val Glu Gly Thr Ala Glu Ser Ile Cys Ser Tyr Trp Leu Arg Ser 1580 1585 1590 Met Ser Leu Val Lys Thr Ile Lys Val Arg Pro Lys Lys Glu Val 1595 1600 1605 Leu Arg Ala Val Ser Leu Tyr Ser Thr Lys Glu Asn Ile Gly Leu 1610 1615 1620 Gln Asp Asp Val Ala Ala Thr Arg Leu Cys Ile Glu Val Trp Arg 1625 1630 1635 Trp Cys Lys Ala Asn Asp Gln Asn Val Asn Asp Trp Leu Asn Ala 1640 1645 1650 Leu Tyr Phe Glu Lys Gln Thr Leu Met Asp Trp Val Glu Arg Phe 1655 1660 1665 Arg Arg Lys Gly Val Val Pro Ile Asp Pro Glu Ile Gln Cys Ile 1670 1675 1680 Ala Leu Leu Leu Tyr Asp Val Leu Gly Tyr Lys Ser Val Leu Gln 1685 1690 1695 Met Gln Ala Asn Arg Arg Ala Tyr Ser Gly Lys Gln Tyr Asp Ala 1700 1705 1710 Tyr Cys Val Gln Thr Tyr Asn Glu Glu Thr Arg Leu Tyr Glu Gly 1715 1720 1725 Asp Leu Arg Val Thr Phe Asn Phe Gly Leu Asp Cys Ala Arg Leu 1730 1735 1740 Glu Ile Phe Trp Asp Lys Lys Glu Tyr Ile Leu Glu Thr Ser Ile 1745 1750 1755 Thr Gln Arg His Val Leu Lys Leu Met Met Glu Glu Val Thr Gln 1760 1765 1770 Glu Leu Leu Arg Cys Gly Met Arg Phe Lys Thr Glu Gln Val Ser 1775 1780 1785 His Thr Arg Ser Leu Val Leu Phe Lys Thr Glu Ser Gly Phe Glu 1790 1795 1800 Trp Gly Lys Pro Asn Val Pro Cys Ile Val Phe Lys His Cys Ala 1805 1810 1815 Leu Arg Thr Gly Leu Arg Thr Lys Gln Ala Ile Asn Lys Glu Phe 1820 1825 1830 Met Ile Asn Val Gln Ala Asp Gly Phe Arg Ala Ile Ala Gln Met 1835 1840 1845 Asp Met Glu Ser Pro Arg Phe Leu Leu Ala His Ala Tyr His Thr 1850 1855 1860 Leu Arg Asp Val Arg Tyr Gln Ala Val Gln Ala Val Gly Asn Val 1865 1870 1875 Trp Phe Gln Thr Ala Gln His Lys Leu Phe Ile Asn Pro Ile Ile 1880 1885 1890 Ser Ser Gly Leu Leu Glu Asn Phe Met Lys Gly Leu Pro Ala Ala 1895 1900 1905 Ile Pro Pro Ala Ala Tyr Ser Leu Ile Met Asn Lys Ala Lys Ile 1910 1915 1920 Ser Val Asp Leu Phe Met Phe Asn Glu Leu Leu Ala Leu Val Asn 1925 1930 1935 Pro Arg Asn Val Leu Asn Leu Asp Gly Ile Glu Glu Thr Ser Glu 1940 1945 1950 Gly Tyr Ser Thr Val Thr Ser Ile Ser Ser Arg Gln Trp Ser Glu 1955 1960 1965 Glu Val Ser Leu Met Ala Asp Asp Asp Ile Asp Asp Glu Glu Glu 1970 1975 1980 Phe Thr Ile Ala Leu Asp Asp Ile Asp Phe Glu Gln Ile Asn Leu 1985 1990 1995 Asp Glu Asp Ile Gln His Phe Leu Gln Asp Glu Ser Ala Tyr Thr 2000 2005 2010 Gly Asp Leu Thr Ile Gln Thr Glu Glu Val Glu Val Lys Arg Ile 2015 2020 2025 Arg Gly Val Thr Arg Val Leu Glu Pro Val Lys Leu Ile Lys Ser 2030 2035 2040 Trp Val Ser Lys Gly Leu Ala Ile Asp Lys Val Tyr Asn Pro Ile 2045 2050 2055 Gly Ile Val Leu Met Ala Arg Tyr Met Ser Lys Asn Tyr Asp Phe 2060 2065 2070 Ser Lys Ile Pro Leu Ala Leu Leu Asn Pro Tyr Asp Leu Thr Glu 2075 2080 2085 Phe Glu Ser Val Val Lys Gly Trp Gly Glu Thr Val Asn Asp Arg 2090 2095 2100 Phe Leu Glu Val Asp Asn Asp Ala Gln Arg Leu Val Arg Glu Lys 2105 2110 2115 Asn Ile Leu Pro Glu Asp Ile Leu Pro Asp Ser Leu Phe Ser Phe 2120 2125 2130 Arg His Val Asp Val Leu Leu Lys Arg Leu Phe Pro His Asp Pro 2135 2140 2145 Val Ser Ser Phe Tyr 2150 <210> 152 <211> 428 <212> PRT <213> Sin Nombre orthohantavirus <400> 152 Met Ser Thr Leu Lys Glu Val Gln Asp Asn Ile Thr Leu His Glu Gln 1 5 10 15 Gln Leu Val Thr Ala Arg Gln Lys Leu Lys Asp Ala Glu Arg Ala Val 20 25 30 Glu Leu Asp Pro Asp Asp Val Asn Lys Ser Thr Leu Gln Ser Arg Arg 35 40 45 Ala Ala Val Ser Ala Leu Glu Thr Lys Leu Gly Glu Leu Lys Arg Glu 50 55 60 Leu Ala Asp Leu Ile Ala Ala Gln Lys Leu Ala Ser Lys Pro Val Asp 65 70 75 80 Pro Thr Gly Ile Glu Pro Asp Asp His Leu Lys Glu Lys Ser Ser Leu 85 90 95 Arg Tyr Gly Asn Val Leu Asp Val Asn Ser Ile Asp Leu Glu Glu Pro 100 105 110 Ser Gly Gln Thr Ala Asp Trp Lys Ser Ile Gly Leu Tyr Ile Leu Ser 115 120 125 Phe Ala Leu Pro Ile Ile Leu Lys Ala Leu Tyr Met Leu Ser Thr Arg 130 135 140 Gly Arg Gln Thr Ile Lys Glu Asn Lys Gly Thr Arg Ile Arg Phe Lys 145 150 155 160 Asp Asp Ser Ser Tyr Glu Glu Val Asn Gly Ile Arg Lys Pro Arg His 165 170 175 Leu Tyr Val Ser Met Pro Thr Ala Gln Ser Thr Met Lys Ala Asp Glu 180 185 190 Ile Thr Pro Gly Arg Phe Arg Thr Ile Ala Cys Gly Leu Phe Pro Ala 195 200 205 Gln Val Lys Ala Arg Asn Ile Ile Ser Pro Val Met Gly Val Ile Gly 210 215 220 Phe Ser Phe Phe Val Lys Asp Trp Met Glu Arg Ile Asp Asp Phe Leu 225 230 235 240 Ala Ala Arg Cys Pro Phe Leu Pro Glu Gln Lys Asp Pro Arg Asp Ala 245 250 255 Ala Leu Ala Thr Asn Arg Ala Tyr Phe Ile Thr Arg Gln Leu Gln Val 260 265 270 Asp Glu Ser Lys Val Ser Asp Ile Glu Asp Leu Ile Ala Asp Ala Arg 275 280 285 Ala Glu Ser Ala Thr Ile Phe Ala Asp Ile Ala Thr Pro His Ser Val 290 295 300 Trp Val Phe Ala Cys Ala Pro Asp Arg Cys Pro Pro Thr Ala Leu Tyr 305 310 315 320 Val Ala Gly Met Pro Glu Leu Gly Ala Phe Phe Ala Ile Leu Gln Asp 325 330 335 Met Arg Asn Thr Ile Met Ala Ser Lys Ser Val Gly Thr Ser Glu Glu 340 345 350 Lys Leu Lys Lys Lys Ser Ala Phe Tyr Gln Ser Tyr Leu Arg Arg Thr 355 360 365 Gln Ser Met Gly Ile Gln Leu Asp Gln Lys Ile Ile Ile Leu Tyr Met 370 375 380 Ser His Trp Gly Arg Glu Ala Val Asn His Phe His Leu Gly Asp Asp 385 390 395 400 Met Asp Pro Glu Leu Arg Glu Leu Ala Gln Thr Leu Val Asp Ile Lys 405 410 415 Val Arg Glu Ile Ser Asn Gln Glu Pro Leu Lys Leu 420 425 <210> 153 <211> 63 <212> PRT <213> Sin Nombre orthohantavirus <400> 153 Met Gln Lys Glu Arg Trp Asn Trp Thr Pro Met Met Leu Thr Lys Ala 1 5 10 15 His Tyr Arg Ala Asp Gly Gln Leu Cys Leu His Trp Arg Pro Asn Ser 20 25 30 Glu Asn Leu Ser Gly Asn Trp Leu Ile Leu Leu Gln Leu Arg Asn Trp 35 40 45 Leu Gln Asn Leu Leu Ile Gln Gln Gly Leu Asn Leu Met Thr Ile 50 55 60 <210> 154 <211> 1140 <212> PRT <213> Sin Nombre orthohantavirus <400> 154 Met Val Gly Trp Val Cys Ile Phe Leu Val Val Leu Thr Thr Ala Thr 1 5 10 15 Ala Gly Leu Thr Arg Asn Leu Tyr Glu Leu Lys Ile Glu Cys Pro His 20 25 30 Thr Val Gly Leu Gly Gln Gly Tyr Val Thr Gly Ser Val Glu Ile Thr 35 40 45 Pro Ile Leu Leu Thr Gln Val Ala Asp Leu Lys Ile Glu Ser Ser Cys 50 55 60 Asn Phe Asp Leu His Val Pro Ala Thr Thr Thr Gln Lys Tyr Asn Gln 65 70 75 80 Val Asp Trp Thr Lys Lys Ser Ser Thr Thr Glu Ser Thr Asn Ala Gly 85 90 95 Ala Thr Thr Phe Glu Ala Lys Thr Lys Glu Ile Asn Leu Lys Gly Thr 100 105 110 Cys Asn Ile Pro Pro Thr Thr Phe Glu Ala Ala Tyr Lys Ser Arg Lys 115 120 125 Thr Val Ile Cys Tyr Asp Leu Ala Cys Asn Gln Thr His Cys Leu Pro 130 135 140 Thr Val His Leu Ile Ala Pro Val Gln Thr Cys Met Ser Val Arg Ser 145 150 155 160 Cys Met Ile Gly Leu Leu Ser Ser Arg Ile Gln Val Ile Tyr Glu Lys 165 170 175 Thr Tyr Cys Val Thr Gly Gln Leu Ile Glu Gly Leu Cys Phe Ile Pro 180 185 190 Thr His Thr Ile Ala Leu Thr Gln Pro Gly His Thr Tyr Asp Thr Met 195 200 205 Thr Leu Pro Val Thr Cys Phe Leu Val Ala Lys Lys Leu Gly Thr Gln 210 215 220 Leu Lys Leu Ala Val Glu Leu Glu Lys Leu Ile Thr Gly Val Ser Cys 225 230 235 240 Thr Glu Asn Ser Phe Gln Gly Tyr Tyr Ile Cys Phe Ile Gly Lys His 245 250 255 Ser Glu Pro Leu Phe Val Pro Thr Met Glu Asp Tyr Arg Ser Ala Glu 260 265 270 Leu Phe Thr Arg Met Val Leu Asn Pro Arg Gly Glu Asp His Asp Pro 275 280 285 Asp Gln Asn Gly Gln Gly Leu Met Arg Ile Ala Gly Pro Val Thr Ala 290 295 300 Lys Val Pro Ser Thr Glu Thr Thr Glu Thr Met Gln Gly Ile Ala Phe 305 310 315 320 Ala Gly Ala Pro Met Tyr Ser Ser Phe Ser Thr Leu Val Arg Lys Ala 325 330 335 Asp Pro Glu Tyr Val Phe Ser Pro Gly Ile Ile Ala Glu Ser Asn His 340 345 350 Ser Val Cys Asp Lys Lys Thr Val Pro Leu Thr Trp Thr Gly Phe Leu 355 360 365 Ala Val Ser Gly Glu Ile Glu Lys Ile Thr Gly Cys Thr Val Phe Cys 370 375 380 Thr Leu Ala Gly Pro Gly Ala Ser Cys Glu Ala Tyr Ser Glu Thr Gly 385 390 395 400 Ile Phe Asn Ile Ser Ser Pro Thr Cys Leu Val Asn Lys Val Gln Lys 405 410 415 Phe Arg Gly Ser Glu Gln Arg Ile Asn Phe Met Cys Gln Arg Val Asp 420 425 430 Gln Asp Val Val Val Tyr Cys Asn Gly Gln Lys Lys Val Ile Leu Thr 435 440 445 Lys Thr Leu Val Ile Gly Gln Cys Ile Tyr Thr Phe Thr Ser Leu Phe 450 455 460 Ser Leu Ile Pro Gly Val Ala His Ser Leu Ala Val Glu Leu Cys Val 465 470 475 480 Pro Gly Leu His Gly Trp Ala Thr Thr Ala Leu Leu Ile Thr Phe Cys 485 490 495 Phe Gly Trp Leu Leu Ile Pro Ala Val Thr Leu Ile Ile Leu Lys Ile 500 505 510 Leu Arg Leu Leu Thr Phe Ser Cys Ser His Tyr Ser Thr Glu Ser Lys 515 520 525 Phe Lys Val Ile Leu Glu Arg Val Lys Val Glu Tyr Gln Lys Thr Met 530 535 540 Gly Ser Met Val Cys Asp Ile Cys His His Glu Cys Glu Thr Ala Lys 545 550 555 560 Glu Leu Glu Thr His Lys Lys Ser Cys Pro Glu Gly Gln Cys Pro Tyr 565 570 575 Cys Met Thr Ile Thr Glu Ser Thr Glu Ser Ala Leu Gln Ala His Phe 580 585 590 Ala Ile Cys Lys Leu Thr Asn Arg Phe Gln Glu Asn Leu Lys Lys Ser 595 600 605 Leu Lys Arg Pro Glu Val Arg Lys Gly Cys Tyr Arg Thr Leu Gly Val 610 615 620 Phe Arg Tyr Lys Ser Arg Cys Tyr Val Gly Leu Val Trp Gly Ile Leu 625 630 635 640 Leu Thr Thr Glu Leu Ile Ile Trp Ala Ala Ser Ala Asp Thr Pro Leu 645 650 655 Met Glu Ser Gly Trp Ser Asp Thr Ala His Gly Val Gly Ile Ile Pro 660 665 670 Met Lys Thr Asp Leu Glu Leu Asp Phe Ala Leu Ala Ser Ser Ser Ser 675 680 685 Tyr Ser Tyr Arg Arg Lys Leu Val Asn Pro Ala Asn Gln Glu Glu Thr 690 695 700 Leu Pro Phe His Phe Gln Leu Asp Lys Gln Val Val His Ala Glu Ile 705 710 715 720 Gln Asn Leu Gly His Trp Met Asp Gly Thr Phe Asn Ile Lys Thr Ala 725 730 735 Phe His Cys Tyr Gly Glu Cys Lys Lys Tyr Ala Tyr Pro Trp Gln Thr 740 745 750 Ala Lys Cys Phe Phe Glu Lys Asp Tyr Gln Tyr Glu Thr Ser Trp Gly 755 760 765 Cys Asn Pro Pro Asp Cys Pro Gly Val Gly Thr Gly Cys Thr Ala Cys 770 775 780 Gly Val Tyr Leu Asp Lys Leu Arg Ser Val Gly Lys Ala Tyr Lys Ile 785 790 795 800 Val Ser Leu Lys Tyr Thr Arg Lys Val Cys Ile Gln Leu Gly Thr Glu 805 810 815 Gln Thr Cys Lys His Ile Asp Val Asn Asp Cys Leu Val Thr Pro Ser 820 825 830 Val Lys Val Cys Met Ile Gly Thr Ile Ser Lys Leu Gln Pro Gly Asp 835 840 845 Thr Leu Leu Phe Leu Gly Pro Leu Glu Gln Gly Gly Ile Ile Leu Lys 850 855 860 Gln Trp Cys Thr Thr Ser Cys Val Phe Gly Asp Pro Gly Asp Ile Met 865 870 875 880 Ser Thr Thr Ser Gly Met Arg Cys Pro Glu His Thr Gly Ser Phe Arg 885 890 895 Lys Ile Cys Gly Phe Ala Thr Thr Pro Thr Cys Glu Tyr Gln Gly Asn 900 905 910 Thr Val Ser Gly Phe Gln Arg Met Met Ala Thr Arg Asp Ser Phe Gln 915 920 925 Ser Phe Asn Val Thr Glu Pro His Ile Thr Ser Asn Arg Leu Glu Trp 930 935 940 Ile Asp Pro Asp Ser Ser Ile Lys Asp His Ile Asn Met Val Leu Asn 945 950 955 960 Arg Asp Val Ser Phe Gln Asp Leu Ser Asp Asn Pro Cys Lys Val Asp 965 970 975 Leu His Thr Gln Ser Ile Asp Gly Ala Trp Gly Ser Gly Val Gly Phe 980 985 990 Thr Leu Val Cys Thr Val Gly Leu Thr Glu Cys Ala Asn Phe Ile Thr 995 1000 1005 Ser Ile Lys Ala Cys Asp Ser Ala Met Cys Tyr Gly Ala Thr Val 1010 1015 1020 Thr Asn Leu Leu Arg Gly Ser Asn Thr Val Lys Val Val Gly Lys 1025 1030 1035 Gly Gly His Ser Gly Ser Leu Phe Lys Cys Cys His Asp Thr Asp 1040 1045 1050 Cys Thr Glu Glu Gly Leu Ala Ala Ser Pro Pro His Leu Asp Arg 1055 1060 1065 Val Thr Gly Tyr Asn Gln Ile Asp Ser Asp Lys Val Tyr Asp Asp 1070 1075 1080 Gly Ala Pro Pro Cys Thr Ile Lys Cys Trp Phe Thr Lys Ser Gly 1085 1090 1095 Glu Trp Leu Leu Gly Ile Leu Asn Gly Asn Trp Val Val Val Ala 1100 1105 1110 Val Leu Ile Val Ile Leu Ile Leu Ser Ile Leu Leu Phe Ser Phe 1115 1120 1125 Phe Cys Pro Val Arg Ser Arg Lys Asn Lys Ala Asn 1130 1135 1140 <210> 155 <400> 155 000 <210> 156 <400> 156 000 <210> 157 <400> 157 000 <210> 158 <400> 158 000 <210> 159 <400> 159 000 <210> 160 <400> 160 000 <210> 161 <400> 161 000 <210> 162 <400> 162 000 <210> 163 <400> 163 000 <210> 164 <400> 164 000 <210> 165 <400> 165 000 <210> 166 <400> 166 000 <210> 167 <400> 167 000 <210> 168 <400> 168 000 <210> 169 <400> 169 000 <210> 170 <400> 170 000 <210> 171 <400> 171 000 <210> 172 <400> 172 000 <210> 173 <400> 173 000 <210> 174 <400> 174 000 <210> 175 <400> 175 000 <210> 176 <400> 176 000 <210> 177 <400> 177 000 <210> 178 <400> 178 000 <210> 179 <400> 179 000 <210> 180 <400> 180 000 <210> 181 <400> 181 000 <210> 182 <400> 182 000 <210> 183 <400> 183 000 <210> 184 <400> 184 000 <210> 185 <400> 185 000 <210> 186 <400> 186 000 <210> 187 <400> 187 000 <210> 188 <400> 188 000 <210> 189 <400> 189 000 <210> 190 <400> 190 000 <210> 191 <400> 191 000 <210> 192 <400> 192 000 <210> 193 <400> 193 000 <210> 194 <400> 194 000 <210> 195 <400> 195 000 <210> 196 <400> 196 000 <210> 197 <400> 197 000 <210> 198 <400> 198 000 <210> 199 <400> 199 000 <210> 200 <400> 200 000 <210> 201 <211> 20019 <212> DNA <213> Avian coronavirus <400> 201 atggccccag gccttagcaa gggagtatct cccaataaaa agaatgtcat ttttgttttg 60 aaggacattc aacctgcatt gtgtgatgct ttgttctttt atacatcaca cactcctcgc 120 gactttgctg atgctcatgc cgttcgtgaa cggtttgatc gcaatttaca gagtggtcgc 180 gtttttaaat ttgaaactgt gtgtggccct gtttatttac agggtgtacc ctcagtcccg 240 ccgggtgtga aagctttggg ttctgaatcc aagcttgcag atttggaaag cctttttggt 300 gtgtctcctc tgtctaggcg ttatagagat ttgttgaaga cggcacccca gtggtcgcta 360 aatgttgaat ctcttgatgc tcaggcagaa aaattggaca ctctttttaa ttcttcagag 420 attttgtggc ttcaggtcgc cgctaaggtc caagtgtctg ctatggcact acgccttatg 480 gctaatgatg ttgttaacct tgtaattgaa gcattgggcc aagaatttgc ttctatgttt 540 gctattgttc gcaagcaagt tagagcagtt ttggacaaat gtcttatggt ttttgaaaat 600 gtcaaggagc tcccacagcg cattgcagca cttaaagctg cattcgctgc ttgtgtgaag 660 cgcatgactg ttgtggttgt tgacaagtgt ctcatgattc gtgagtttgc aggtacctgc 720 ctagccagtg tgaatgcgac aatggcagca tggtgtcgtg aattgccaac tggttttatg 780 gggtctaaag tttttgacaa actcgccttc tttaaggagg ctgttgttaa aactgtaaaa 840 aatgttgccc atgcaccgga tggtgttact ggttatagtg tcattggcaa tgcccgcggt 900 acgcaggttg tcattcgtgg tatgcgtaat gacctcactc tgcttgaaca acgtgcagat 960 gtctctgttg aaaaagaagg ttggtctgct gtctttgacg gtagattaac ctatgttttt 1020 aagagtggtg agtgttatta tgcagcacca cttgcaggaa attttgttct taatgatgtc 1080 tattgttgtg agcgtgtagt cctccttagc gatggctaca ctcctgaaat taatgatggt 1140 ttgcttttgg cagcgctcta cacgtcatct aatgtggctg atgtgttggc tgcgctgaag 1200 aaaggtgaac catttaagtt tttgggacac tcatttgtct atgttaagga cgctgccgtg 1260 tcttttactt tggcaaaggg tgcatctata gcagatgttt ttaaactttt tgttaaagaa 1320 gctgttgatg tatggtctgt ttttaacgaa aagtctcatg aattttggac taaagctcac 1380 aataaatgtc gtaatcttaa agatcttgtg gcgacacatt gttgtaaggc gcaagtgact 1440 tttgttgtgc ttgctatagc ccttggtgtg acagtttggg aaattgtcaa acaggttttg 1500 tttaaagttg ctggtctttt tacagccgtt gtggactttt gtagtaaggc ttggaatgga 1560 ttttgtgacc aactaatcca tgctaaactt tttgtgaatg aattgggctg tgttttggtt 1620 ggtgttaaaa atcactgttt tcaacttttg cttatagcag tccatgcctt ttataaaacc 1680 ttggagaagt gtgccatagg tcgtatctgg aatggtgatt tgcttttttg ggctggtgga 1740 gcccataaag taagtgaaga caatggtgaa gtttggtttg atgctgtaga cacaatgcaa 1800 gttgacgaac agggcactgt tgttgaagac aatgtgcctg attttgttgt ttgtcatgat 1860 gtgtctatac cagagcgtca aaaaggttat atagtgcaaa ttgctgctga tggtaaaaac 1920 tatatgtttt ttaggtatga acagggtgtt aatacctatt atgccccaat gtcacaggtt 1980 ggtgcagtta atgtggtttg cagggctggt ggtaagactg tgacctttgg tgatgaccag 2040 gttaaagagc taccaccccc agatgttaag tgtatctata ttgatattga gtgttgtggt 2100 gaaccttgga ctagtgtctt taagcgtgtc tataaagacc cagttgaagt tgagacatct 2160 ttgactgtag aggagttgag agcagttgtc tatgagatga tgtgtgacag tttaaaactg 2220 tttcctggtg cccctcaacc tccaccatat gataatgtag ctttggttga caaccaaggt 2280 cgtgatttgc aaaacattga ttcttgtcat ttggtttatg tggattatga cagtgacggt 2340 gcagtttctg atgaagaaga agaagatgtg tctgacactg aagatgttaa tgaagaggat 2400 gaacgtttgg catgtctctt gaagaattca gctaatttta aatatccact tccttatgat 2460 gatgagtata gtgtcttttg tggtcgtttg gtacacaagg atgctataga cacccttcat 2520 tacccatctg gtgatgacat gtatgttatt aataacgcct ttgagggtgc tgttaaggct 2580 ttacctcaga gtgttgttga tgttttggga gattggggtg tcgctgttga taatcaggag 2640 cgcgctatga acaaggaaat tcctgttgag attcctaagg aagaaactca gaaacctcaa 2700 aaggtggaag aacagaagcc tagagaaact cttgttgaga tttctaagga agaaactcag 2760 aaacctcaaa aggtggaaga gcagaagcct aaggaaaccc ttgttgagat tcctaaggaa 2820 gaaactcaga aacctcaaaa ggtggaagag cagaagccta aggaaactcc tgttgagaty 2880 cctaaggaag aaactcagaa acctcaaaag gtggaagagc agaagcctag ggaaactcct 2940 gttgagactc ctaaggaaga aactcagaaa cctcaaaagg tggaagagca gaarcctaag 3000 gagactcttt taaataaaca attcttttct gatagttctt cggatgaaga gccaaagaaa 3060 aagttgttta ggtttaaatt gaagcctact aagtgtaaag tacctagtaa tgttgagtat 3120 tctacatgtg taggcgactt gtctgtagtt gttgccaaag ctatggactc ttttgaagac 3180 tttgtcttgg ttaacgccgc caatgaacat atgtgtcatg caggtggtgt tgccaaggct 3240 attgcagatt tttgtggtaa caagtttgta gactattgtg acacttttgt tggtaaaaat 3300 ggtcctcaac aacagttgtt ggccccctct ggtgttgcta gaatgcaagc tgttaataat 3360 gtagtcggac ccagacacgg gcaacctgac ttgtttgaca agttggttgc tgcctataaa 3420 aaggttgttg ttgttggtgc tgttaattat gttgtccctg tcctttctgc aggaatcttt 3480 ggtgttgatt ataaaatgtc tattgacgct atgcgcaagg cattttgtga tatgaaaatt 3540 cgtgtgttgt tgttttctct taatcaagaa cacattgatt attttaatgc cacttgtaaa 3600 cagaagactg tttaccttac tgaagatggc acttctttta aaactctggt cttgaggccg 3660 ggtgacacat tgggccacct tggaggtgtt tttgcgcgta acaagactgt ttttactgct 3720 gacgatgtta gtgataaaga ggttttgttt ttgcctacaa cagacaagaa tgtgctggag 3780 cattatgatt tagatgccca gaaatatgtc ttgtttttga ctacactttc gcaaaagtgg 3840 gaagtgtttt ttaaaggtgg tgttttgcaa cttgtttggc gtgatggtaa ctgctgggtt 3900 aatgcagtta ttacactgtt gcaagctgca aaaataaaat ttaaaggtta tttggcaaca 3960 gcatgggcac aacttttggg tggtgaccct actgagtttg tagcatggtg ttatgctagc 4020 actaatacta aggtgggtga ctttggtgat tccaatgttc tcttgttgac cttggcgcac 4080 cattttagtg tagattacac taaagccctt atagttaggc gtgttgtgtg taaatgtggt 4140 gttaatacgc aacaagtcta tggcattaat gcttgtgtgc agcatgtttg tgccactaat 4200 atgttaaatt ttatgaaaca gtatggtgac tgttctgtct gtggtgaaaa gtatgttgat 4260 gaagtcgtca acataaatgt accatatttg atgttgcttg caggtggtgg accgcagaat 4320 gtggaccgcg atgagacagt ggttgctaat atagtttttg ttgggactat tgatagtggc 4380 cactgttata ctcagactgc gaataatgtt tttgacaatc ttgttcaaaa tagacagttc 4440 tctaagaggg ctccctatat aactgctttc taccctcaat tttctcttaa gagtaaaaat 4500 tctctgtctg ttgctaaaaa gagtaagagc aagagtgatg tagtaaaaga agatgtttct 4560 aatctcgcta caggttccga cgttgaggtt gaagatattt ctaattttga acgttggtat 4620 tctgacaatt attatgattg tttgactgtg caggaagact ctagccttcc tgttgacaat 4680 actaattttg actttgttgt agattctaaa ttgcctctta cactcactgt tcgtggtgtg 4740 tctagagatg tgaattttaa atctgcagaa ggttttacgt acattttgac gccagagcgc 4800 ggtcaaacat gtaattcacc tgtttattac tcttctcttg atttggttag ccttagagct 4860 atctgggtca atggggatag taattatgta gttggtaatc ccaattatta tagtaggctt 4920 ttgcgcattc caactttgta tgagaatgct gaaaagtttg ttaatattgg tgaacgtgtg 4980 gggaatgtta cttatggcgt ttggcgtgcc aaaagtttga ataaacccca gttgtctact 5040 gtaatggctt ctgttaaagc aattataggc gttgcaaacc cagtttctaa tgttgtagga 5100 aataccgtca agaaggttgt tgctgttagt gacggcttag gtgatggtgt ttttggcaac 5160 atgtggggtg gagtatgtgg ccttataggt ggcacttgta agtttgtcta tgataaagtt 5220 tcattgcact ttataagaac catgttgttg tttttgtttt acttttgtaa agcaggtttt 5280 aaaaaatttt cttctaatta ccgtagtgta attactaagg tagttatgac tgctttgttg 5340 ttgtgttggt ttgtgtatac ttatgaagct attcactttg tgggtatacg catattagat 5400 tttttgtttg agggatcttt ttgtggtaat tatactggtt atggtaaaga ttcctttgac 5460 atgttgcggt attgcggaga cgatgctgtc tgtcgtgttt gtttgcactc tgtagactcg 5520 ttgcatcttt ataaacatgc gtatagtgta gagcaggttt ataaagatgc tgttgcagag 5580 tttaagttta cttggaattg gctttatcta gtgtttttgg tactatttgt aaagccagtt 5640 gcactatttg ttatagtttg ttattgtctc aagtaccttg tattaggcgc tgaggtgttg 5700 caaactggta ttacaattgt ggactggtgt gttgctacat tttttagtca ctttaatttt 5760 atgggtgcta gtttttatgt gtggattttg tggaaagttt atacatatgt ccatcatata 5820 atgtattgta aagacataac atgtgacatt tgtagacgcg tggctcgcaa tagtcgacat 5880 gaagttagtg ttattgttaa tgggcgtaag cagtcagtgt atgtttatac taattctggt 5940 tttacttttt gtaagaaaca taattggtat tgtaaaggtt gtgacacttt tgggcatcag 6000 aacactttta tttcacctga agttgcaggt gagttgtctg ataaacttaa gcgtcatgtt 6060 aagcctactt ctagtgcata ttttcttgtt gatactgcac aattagttgg tgactttgtt 6120 aatcttaact atagttctaa ggctcctggt ttagaatcta caaagcagca agttaagtgt 6180 tttacagttt cagattttct taagaatgct gtttttctta aggatgctgt aaaatgtgaa 6240 cgtatggcta atgatagctt tattgtttgt aatacacaga gtttgcatga tttggaggct 6300 gctaagaatg ccgcggttta ttatgcacac tacctgtgta agcccattct tattttggac 6360 caagttctct atgatacatt ggcttgcgag cctgtttcta agagtcttgt agacaaagtg 6420 tgtggtgtat tggcaaatat tgttgaagtt gattttgcca atcttaatta taaggcaggt 6480 tctttgcgtg acgctctttt gtctgtcaca tcagatgaag aagctgttga tatggctata 6540 ttttgtcata attatgacct taattatact agtgatggtt ttactaatgt tgtaccttct 6600 tatgggtttg accttggtaa attgtcacca cgtgataagg gttttcttat aaatgctgat 6660 gcatgtatag ccaatcttaa ggttagaaat gccccagctg ttgtttggaa ttattatgac 6720 cttataaaat tgtctgataa ctgtcttaaa tttttggtgt ctggtgttat aaagtcaggc 6780 gctaaatttt atgtaacacg ttctggtgct aaacaagtta ttacttgtca tacacagaag 6840 ctgttgttgg ataaaaaggc tggtggtatt cttaaggata ctatgtcttg gttttggttt 6900 atggttaagt ttgtggttgt ttgttatctt atttttacag caggttgttt gtatgtgtat 6960 catacggatt attatggtgc aaagatgcac ccgatgtatg atataaatgc aacttttcct 7020 gttgaaaatt ttaaggttat tgaaaatggt gttcttagag acctagtttc tgaggacagt 7080 tgtttttcaa ataagttttt aggttttgat gacttttggg ctaaaaccta cactaatagt 7140 agggattgtc caatagttac agctcttata gatggtactg gttttgttgc tgcaggtgtc 7200 cctggtcatg ttcactgggt tatggacaat actatgtttg tacatacagc acaggctgaa 7260 gcaaaaccat ggtatgcacc tagttggttc cctcaagatg atgttgtcgg ctatacaata 7320 gactctgttg ttacacaggg tgaattttat agttcaattg cgacttttcc agcacgttgt 7380 atgtatttgg caactagtgc aagtccgcaa ttgtattgtt atggtggtga aaatgatgca 7440 cctggtgcaa tgtcatatga tagtgtgcaa ccgcatcgtg tctattttca accaaataat 7500 gtaaggtttt ctattccaca acagattatg tacacacctt atatagttaa attggcttct 7560 gacaattatt gtagaggtag tgtttgtgaa aagacaaaac ttggttattg ttattcatgg 7620 aatcctcgat gggtccttta taatgatgac tatgttagtt tgcctggtgt ttattgtggg 7680 tctactatta gagaacttgt gttttctatg ttaggttcat tttttacagg tgttagtcct 7740 aatttgtata tacacttgac aactatgttt ttggtgttgt tgggtgttat gattatcttc 7800 gcattggtta ttaggtttca aggtgttttt aaagcctata caccagttgt ctttgcagtc 7860 attatggttt ggggcctaaa tgtttttatg ttgtgtgttt atagctataa cccttttgtg 7920 gctgttatgc tattagcact gtattgttac atgtcactca tggttgggcg tactgtttca 7980 acagttatgc acttgtgggt tgtatttaca tttataatgg ttgtgccgtg gtggttggcc 8040 tgtgtttata tagcctttgt tgcttatatg tataccccgt ttgctatgtg gtgttatggt 8100 actgctaaac aaactcgtaa actttatgaa ggtaatgagt ttgttggtaa ttatgattta 8160 gcagctcaga gtacatttgt tatacgtaat gtagagtttg ttaaactttg taatgaagtt 8220 ggcgacaagc ttgacattta tttgtcggct tacgctagac taaagtatta ttcaggtact 8280 ggtggtgagc aagattactt gcatgcttgc cgggcttggt tggcctatgc tttggatcaa 8340 ttccgtgcta atggtgttga agtactttat acaccaccta aattttcaat gggtgttact 8400 agattacaag caggctttaa gaagtttgtt tcacctagta gtgctgttga aaaatgtgtt 8460 gttatggtac gttataaagg tacagtcctt aatgggctgt ggcttaatga ttgtgtgtat 8520 tgtccacgtc atgttatggg caagtttagt ggagatgaat ggcaagatgt gttaagcttg 8580 gctagtaacc atgaatttga agttactgga ccagacggat catctttgca agttgttagt 8640 aggaaattgc agggtgctgt tttgatactt caaactgctg tggttaatgt taatactcct 8700 aagtataaat ttgttcaggc acagtgtgga gacactttca caatagcttg ttcatataat 8760 ggtaatgtgg ttggccttta tcctgttact atgagagcta atggtactat tagagcttca 8820 ttcgcttgtg gctcgtgtgg ttccgttggt tttaatatgg acggtggtgt tgtagcattt 8880 tgttatatgc atcacttaga attacctaac gctatacata ctggcactga tttggctggt 8940 aatttttatg gtggttttat agatgaggag tgtgcacaac gtgttgagcc agaccctcgt 9000 attactaata atgtggttgc atggttttat gccgctatta ttagtattaa ggaaagtagt 9060 tttagcctgc caaagtgggt tgaaagtaca cctattagtg ttgatgatta taataagtgg 9120 gctgcagata gtggcttcac tccttatgtt gatagtattg cagttaataa acttgctgct 9180 ataacgtctg ttgatgttgg tagggttttg cgtactatta ttgtaaaaaa tacacactgg 9240 ggtacagacc ccataatggg tgtttttaat tttgatgatg aattgacacc tgagtctatt 9300 tttaatcaaa taggcggtgt taagttacaa tcttctatta ttaagcgcac gatttcttgg 9360 ttttggtcta gactcgtgtt ggctatgttt ctgtttgttt tgtgtgcaat ggttttgttt 9420 actgttgtgc cttataaata ttttatatac gctgctatta ttttgtttgt tgctgttttt 9480 atagccgcgt ttactattaa gcatgtgttg gcatatttgg atactttcct tttgcctact 9540 ctttgtactg ttatgatagg ggtgtgtatg gaagttcctt tcatatacaa cacttatatt 9600 tatgactttt tgaaaggtct ttttagtcct tggtacaatg ttgaggttgt tgacactgtt 9660 gtgccctgga tgtttatgcc aattatagtg tataccactt ttaggtgtat acagggttgt 9720 tatgctattg actctttttc tgcagcgcta acaggtgcct accaagtagt aaaattgggt 9780 tttacaattt atacgtcttg gaatactggg catgcttata gtgctggtga ctgggatttg 9840 ttttttgagc ttttgcatac gactatgttg gccaatatta gtagtaattc tttggttggc 9900 ataattgttt ttaatgttgc taagtggtgt ttgcgttatt gcaatctcac ttatgtgaac 9960 tcttatgttt taatggctat atttgttaat gttatgggtt ggatgtttac ttgttatttt 10020 ggagtctatt ggtggcttaa taaagtcttt gggctcactt gtggcaagta tacgtataaa 10080 gttagtgttg agcagtataa gtatatgtgt gtacatcgta tccccagtcc gaagagtgct 10140 tgggatatat ttgttactaa tatgcttata caaggtatag gtggtgagcg taaacttcct 10200 attgctactg tgcagtcgaa acttactgat gttaagtgta ctgctgttgt gttgatgcaa 10260 ttgttgacaa agcttaatgt tgaagctaac tcaaaaatgc ataaacatct tgtagaattg 10320 cataataaga ttcttgcctc agaagatctt gttgagtgta tggataactt acttggtatg 10380 ttggttacct tgttgtgtgt agattcaact gtggatctta gtgagtattg tgaagatgtt 10440 ttgggtaaag ttactgtttt acagtctgtg gcccaagagt tttcacatat tccatcttat 10500 gctgagtatg agcgtgctaa ggatttgtat gagcgcgttt tggcagattc gaagagtggc 10560 aatgtcacac aacaagaggt ggctgcatat agaaaggctg ctaatatagc gaagtctgtt 10620 tttgatagag atctttctgt acaaaagaag ttggatgcca tggctgagcg tgccatgaca 10680 actatgtaca aggaagctcg tgttacggac aggcgtgcta agttggtctc ttcacttcat 10740 gctttgttgt tttctatgct taagaagata gattctgaca agcttacatc tctttttgaa 10800 caagcgcgtg atggtgttgt acctctcgcg acagttccta ttgtttgtag taataaactc 10860 accttggtaa tacctgatgc aggtacttgg acaaagtgtg ttgaaggtac atttgttact 10920 tattccactg ttgtgtggaa tattgatact gtctttgacg ctgatggcgt ggaaattcaa 10980 cctagttcta atggtcagag tcttgtttac cacattggag gtgacaggat tgcatggcca 11040 cttaaagtta atcttacgcg taatgttcat aataaagtag aggcttctct ccaaaacaat 11100 gaacttatgc ctcaaggtat aaaaactaag gcttgtgttg cagggactga tcaagcccac 11160 tgtaatgttg agtctaagtg ttactatact aatattaatg gtagctcggt tgtagctgcc 11220 attacttcac ataatccaaa tttgaaagtg gcatcatttt tgagtgatgc tggtaatcaa 11280 atttttgtag accttgaccc accatgtaag tttggtatga aggttggtgg caaggttgaa 11340 gttgtttacc tttattttct taaaaataca aggtctatta ttagaggtat ggttcttgga 11400 gccatttcca atgttgttgt attgcaatct aaaggacacg aaactgaaga gcttgagtct 11460 gttggtatct tgtcactttg tgcttttgct gtggaccctg ctgaaacata tttgaaatat 11520 gtgtcggcag gaaatcagcc acttggaaat tgtgttaaaa tgttgactgt gcataatggt 11580 aatggttttg ccataactac taagccaagt ccaacaccgg aacaagactc ctatggtggt 11640 gcatctgtgt gtttatattg tagggcacac atagcacacc ctggagcttc tggtactttg 11700 gatggtcgtt gtccgttcaa aggttctttt gttcaaatac ctacttctga aaaagacccc 11760 gttggttttt gtctcagaaa taaggtttgt aaagtctgtc agtgttgggt tggttttggt 11820 tgtcagtgtg attttttgcg ccagccagtt gctaacatgc aaagcactta tgttgctcct 11880 gttgttagta ctaactctga taagaattat ttaaacgggt tcggggtagc agtgaggctc 11940 gacctgatac ccctatctga tggaaaccaa cctcatattg taaaacgagc ctttgatgtt 12000 tgcaataagg agtctgcagg tatgtttcag aatatgaagc ataactgtgc caggtttcaa 12060 gaagtggtag aaggcgaaga cagctggaaa cacggtcttg aatacaaaga ctcttatttt 12120 gttgtgaaac agacgactcc ctctaattat gtccatgaac aggcgtgtta tgaggatttg 12180 aagtcggatg ttgttgcagt tcatgatttc tttgtcttta ataagactat ttataatgtt 12240 agtaggcagc gtcttactaa atatactatg atggaccttt gctatgcttt gcgtcatttt 12300 gaccctaagg attgtgaggt tcttaaagaa atacttgtcc tcaatgattg cattgaggat 12360 tggtactgga tgcagggtgg acaaggccaa gccccaggta attggtttga ccacaaccct 12420 acttggtacg acccaattga aaacccttca tattatgcta ttttagctaa tttaggccac 12480 attgtacgtc gtgccttatt gaatgctgtt aagtttggtg atctcatggt cgaaaaaggc 12540 tatgtgggtg ttgtcactct tgacaaccag gatcttaacg gcaagtttta tgactttggt 12600 gactttcaaa agacaacgcc tggtgcaggt gttcctattt ttgatagtta ttattcttat 12660 cttatgccta ttataaccat gactgacgca ctggcaacag agcgttttta tgagttcgat 12720 aggcacaagg gttttaaatc ttatgatctc cttaagtatg attatactga ggagaagtta 12780 gaattgtttt ctaagtactt taagtactgg gaccaagagt accaccctaa ttgtagcgaa 12840 tgtgctgacg ataggtgttt gatacattgt gctaacttta atatactctt ttcaacactc 12900 atacctcaaa cttcttttgg taatctgtgt agaaaagtgt atgttgatgg tgtccctttt 12960 atagctactt gtggttatca ttctaaagaa cttggtgtta taatgaatca agataatacc 13020 ttgtcatttt ctaagatggg cttgggtcaa cttatgaagt ttgttggtga cccggcattg 13080 cttgtcggaa cttctaacaa cttggttgac ctacgcacct cttgttttag tatctgtgct 13140 ttagcatctg gtataactca ccagacagtc aagccaggac attttaataa agatttctat 13200 gactttgcag agaaagcagg gatgtttaaa gagggatctt ctatacctct taaacacttc 13260 ttttttccac aaactggtag tgctgctata gacgattatg attactatcg ctataacagg 13320 cctactatgt ttgatatacg tcagctcctg ttctgtctag aggtgacttc taaatacttt 13380 gagtgctatg agggtggttg catatctgct agtcaggttg ttgtaactaa cctggataag 13440 agtgcaggct atccttttaa taaatttggt aaagcccgcc tttattatga aatgagtttt 13500 gaagaacaag accagctctt tgaatcaaca aagaaaaatg tcttgcctac tataactcag 13560 atgaatttga agtatgccat ttcagccaag aatagggctc gtactgtggc aggtgtttct 13620 attctttcta ctatgactaa tagacagtat caccagaagg tgcttaagtc tatagttaat 13680 actagaaatg ctcctgtggt tattggcaca accaagtttt acggtggttg ggacaatatg 13740 ttgagaaatc ttattaaagg tgttgatgac ccaattctta tgggttggga ttatcctaaa 13800 tgtgacagag caatgcctaa tttgttgcgt attgcagcat ctttggtcct tgctcgtaag 13860 cacactaatt gttgtacttg gtctgaccgc gtttataggc tttataatga gtgtgcccaa 13920 gtactttctg agtctgttct tgctacaggt ggtatttatg ttaaacctgg tggcactagc 13980 agtggtgatg ccacaactgc ttatgctaac agtgttttta acataattca ggctacgtct 14040 gccaatgttg cacgtctggt tagtaccatt acgcgcgaca ttgtgtatga tgatgttaga 14100 gctatgcagc acgaactgta tcagcaggtt tataggcgtg tcaatcctga cgctgccttt 14160 gttgagaagt tttattctta tttgaataag cacttttctt tgatgattct gtctgacgac 14220 ggtgttgttt gttataacaa cacgtatgcc aagcagggtc ttgttgcaga catttctgct 14280 tttagagaag tcctctatta tcagaataat gtttatatgg ctgattccaa atgttgggtt 14340 gaacccgacc ttgaaaaagg ccctcatgaa ttttgttcac aacacactat gcttgtagac 14400 gtggatggcg agcctaaata cttgccatat ccagatcctt cacgcatctt gggtgcttgt 14460 gtttttgttg atgatgttga caagactgag cctgtggctg ttatggagcg ttatgtagct 14520 cttgccattg atgcttatcc gcttgtctat cacgaaaatg aagagtataa gaaggttttt 14580 tatgttcttc tttcttatat taggaagctc tatcaagaac tttctaagaa catgttgact 14640 gactattcct ttgttcttga tatagacaag ggtagtaagt tttgggagga ggagttttat 14700 tctaatatgt atagagctcc taccactttg cagtcctgtg gcgtttgtgt tgtttgccag 14760 agtcaaacca ttttgcgctg tgggaattgt gttcgtaaac catttttgtg ctgtaagtgt 14820 tgttatgacc atgtcatgaa cacaaatcac aaaaatgttc tttctataaa tccttacatc 14880 tgcacacacc ctggttgtgg tgaagcagat gtaactaaac tctatctcgg tggtatgtcc 14940 tatttttgtg ttaatcacaa acctaggctt tctatacctt tggtttcaaa tggtactgtg 15000 tttggtattt acagagccaa ctgtgcaggt agtgagaatg ttgatgattt caaccagctt 15060 gccaccacta attggtctac tgtagaacct tatattttgg caaatagttg tagtgatact 15120 cttaggcgtt tcgctgctga aacggtgaaa gccactgaag agttgcacaa acagcaatat 15180 gccagtgctg aagtgaaaga agttctttct gataaagagc ttattctctc gtgggaacca 15240 aataaggctc gcccaccatt gaataggaat tatgttttca caggttttca cttcactaga 15300 aatagtaagg tgcagcttgg tgattttact tttgaaaaag gtgatggcaa agacgttgtc 15360 ttttataaag ccacatctac tgcaaaattg tccgttggcg acatttttgt tttaacttca 15420 cacaatgtgg tatcgcttac agcgcctaca ttgtgtcctc agcaaacttt ttctaggttt 15480 gttaatttgc accccaatgt gatggtacca gagtgttttg ttaataacat accattgtat 15540 catctagtgg gtaaacaaaa gcgtactaca gtacaggggc ctcctggtag tggtaagtct 15600 cactttgcca taggtcttgc tgcttacttt agtaacgctc gtgttgtgtt tacagcttgt 15660 tcacatgctg ctgttgatgc gctgtgtgaa aaagctttta aattcttgaa gattgatgat 15720 tgcactcgca tagttccgca gagagctact gtagagtgct tttctaaatt taaacctaat 15780 gacacaggca aaaagtacat ttttagtact ataaatgcct tgccagaggt tagttgtgat 15840 atcttgttgg ttgacgagat tagtatgtta accaattatg atttgtcttt tgttaatggt 15900 aagattaatt accagtatgt tgtatacgtg ggtgatcctg ctcaattgcc agccccccgt 15960 actcttttga atggatcact ttcacccaag gattataacg ttgtcaccaa ccttatggtt 16020 tgtgtcaaac cagatatatt ccttgcaaag tgttaccgtt gtcctaaaga aattgttgat 16080 acagtttctt ctcttgttta tgatggtaaa tttattgcta acaaccctga atcgcgtcag 16140 tgtttcaagg ttgtcgtcaa taaaggtaat tccgatgttg gtcatgaaag tggttcagct 16200 tataacatga cacaactcga gtttgttaaa gattttattt ctcgtaataa ggagtggaag 16260 ggtgctacct ttatttctcc ttataatgct atgaaccaga gagcgtaccg catgttggga 16320 cttagtgttc agactgtcga ttcatctcaa ggttcagaat atgattatgt tatattttgt 16380 gtgacagcag attctgctca tgcactcaat attaacaggt ttaatgttgc tcttacacga 16440 gcaaagattg gaatactcgt tgtcatgaga caacgggacg aattgtataa tgcactccgg 16500 tttgtagagc ttgacagtaa tgtcgcacta cagtctactg gtttgtttaa aatttgcaat 16560 aaagaattta gtggtgtttc acccgcttat gcagttacca ctaaagctct ttctgcaact 16620 tataaggtta atgatgaact agctgcactt gttaatgttg aagctggctc acagattcct 16680 tataaacact tgatttccct tttgggtttc aaaatgagtg tcaatgttga gggttgtcac 16740 aacatgttta taacacgtga tgcggcaatt cgcaatgtta gaggttgggt tgggttcgat 16800 gttgaggcca cacatgcttg tggacccaat attggtacta acctaccctt tcaagtgggc 16860 ttttctactg gtgctgactt tgttgtcacg ccagaaggcc ttattgacac acctactggt 16920 aataattttg agccagttaa ttctaaagct cctcctggtg aacaatttaa ccatttgagg 16980 acgctattta gaagtgctaa gccctggact gtcataagac caaggattgt gcaaatgctt 17040 gcagacaatt tgaataatgt ttcagattgt gttgtttttg taacctggtg ccacggttta 17100 gaacttacta ctctgcgcta ttttgttaag ataggtgcag aagaagtatg ttcttgtggt 17160 gctagagcta ctaccttcaa ttcttccacg ctggcctacg cctgttggaa gcattgttta 17220 ggttttgatt ttgtctataa tccatttatt atagacatac agcaatgggg ttattctgga 17280 aatctccagt ctaaccatga tttgtattgt gatgtgcatg gacgtgctca tgttgcgtcg 17340 gctgatgcta ttatgacgcg ttgtcttgca atcaacaatg ctttttgtca agatgtcaac 17400 tgggatatta cttatcctca tattgctaat gaggatgaag tgaattctag ttgtagattt 17460 ttgcagcgca tgtattttaa tgcatgtgtt gatgctctta aagttaaggt tgtttatgat 17520 ataggcaacc ctaaaggtat taaatgtgtt aggcgtgggg atgttacttt taagttcttt 17580 gataagaacc caatcgtccc caatgtcaaa caattttgtt atgattatga ccaacacaaa 17640 gacaggtttg ttgatggtct ttgtatgttt tggaattgta atgtggattg ttatcctgac 17700 aattctcttg tttgtaggta tgacactaga aatcttagtg tctttaacct gcctggttgt 17760 aatggtggta gtttgtatgt gaataaacat gccttccaca cacctaaatt tgatcgcatt 17820 agcttccgca atttgaaagc tatgccgttt ttcttttatg atgcatcgcc ttgtgacacc 17880 gttcaagttg atggtgtagc gcaagacctt gtgtcattgt ctactaaaga ctgtattaca 17940 aagtgtaaca tcggcggtgc tgtttgtaaa aagcatgcac aaatgtacgc cgaatttgtt 18000 acttcttata atgcagctgt tactgctggt tttacttttt gggttactaa tcagtttaac 18060 ccttataatt tgtggaaatt gttttcttca cttcagtcta ttgacaacat tgcttataat 18120 atgtataagc gtggtcatta tgatgcagtt gttggtgaaa taccaacagt tgtgactgga 18180 gataaagttt ttgttattga caagggtgtt gagaaggcag tgtttgtgaa tcagtctaca 18240 ttgcctactt cagtggcttt tgagttgttt gcgaagagaa acattcgcac actacccaat 18300 aatcgtattt tgagtggtct tggtgttgat atagcctata agtttgtcat atgggattat 18360 accaaccaaa cgccattgta tcgtaacacc gttaatgtgt gtccttatac tgacattgaa 18420 cctaaggggc ttgttgtttt gtatgatgac cgtaatggtg attatcaatc ttttcttgct 18480 gctgatgatg ctgttcttgt ttcaacacag tgttataagc ggtatcctta tgctgagatt 18540 ccatcacact tgcttgcgca gaatgggctc ccacttaaag atggtgcgaa cttgtatgtt 18600 tataagcgta gtaagggtat gtttgttacc cttcctgaaa cgcttaacac acaagggcgc 18660 agttacgaaa ctttcgaacc acgcagtgat gttgaaagag agtttttgtc attgtctgaa 18720 caagactttg ttgtaaagta tggtaaagac cttggtcttg aacacatact gtatggtgaa 18780 gtagacaaac cacaattagg tggtttacac actgttatag gtatgtacag gcttttgcgc 18840 gacaataagt tgtctgccaa atctgtaaca gactcagatt gtgaagtcat gcaaaactat 18900 tttgttcttg cagacaatgg ttcctacaaa caagtttgca ctgttgtaga cttgttgttg 18960 gatgactttt tagacttact taggaacata ctccaagagt atggttcagg taagtctaag 19020 gtagttacag tacccattga ctaccacaac atatctttta tgacgtggtt tgaaaatggt 19080 tctattaaaa catgctatcc acagcttcag tcagcttgga agtgtggtta taatttgcct 19140 gaactttata aagttcagac ttgtgttatg gaaccttgta acattccaaa ctatggtgtt 19200 ggaataatgt tgcctgatgg tattatgatg aatgtggcga agtatactca actttgtcag 19260 tatttgtcta aaaccaccat gtgtgtgccg cataatatgc gtgtcatgca ttttggtgca 19320 ggaagtgaca agggtgttgc tccgggaacc actgttctta aacaatggct tcctgaaggc 19380 acacttcttg tagataatga cattgacagt tacgtttcag atgcacacgt gtctgtcatt 19440 gatgattgta ataaatttag aacggaacac aagttcgatc ttgtgatatc cgatatgtac 19500 acagataatg attcaaagaa gaaacatgaa ggcaaggtgg ccaataatgg aaacactgat 19560 gtgttcatgt atcttactaa tttccttcgt aacaacttag cgcttggtgg cagctttgct 19620 gtaaaaataa ctgagacgag ctggtatgaa ggtctttatg aaatagcaca agattgttcc 19680 tggtggactc ttttttgtac tgcagtaaat gcatcatcat cagaagcatt cttggttggt 19740 gttaattact taggtgagag cgaaaaacac aaaataagtg gaaggacgct tcacgccaat 19800 tatatatttt ggcggaatgt tagttattta caaacatccg cgtttactat atttgacgtt 19860 gcgaaatttg gattaaaaac aaaagcaacg ccagttgtaa atttgaaaaa agaattacaa 19920 accgacttag ttcttaattt aattaggaac ggtaaattgg ttgttaggga tgttggcaac 19980 gttggttttg ttgacgacag ttttgtttgt gcccattaa 20019 <210> 202 <211> 3543 <212> DNA <213> Avian coronavirus <400> 202 ttgttaggga tgttggcaac gttggttttg ttgacgacag ttttgtttgt gcccattaat 60 tctctttcag gagacaattg ggtttattac tacccatcag cttttaggcc ttctaatggc 120 tggcataagc aagaaggtgc ctattctgtt gttggtattc agtctactaa tgtcactggc 180 aattcagcag gttgtcctta tatgttcaac actacatctc aacttattgc cagtgatgct 240 gttgctatta tgtctaaatt tcctactact tggacaaaca ataacggtca gatttatgtt 300 catatgattg gttgtactat ggccaatcat actttttatg tatggggccc tttgaaaagt 360 ggtaactcac gacctggtgt tcctaatggc ctcttgtttc aagtctactc ttccaacttc 420 actcttcttt ataataagac ttggttgggt tggaaagaac atactcgttt tgaatcactt 480 cagtgtgttt ctttatttgg tagtgtctat tttaatggcg atcttattta tcagctaggt 540 tataatgccc aagtacagaa tgtgtcattt gtttattgtg gcactgtaac agggtattat 600 tatttttcaa aacagttcca atcattggtt tatttccaaa atggcactgc tttggacctt 660 atattgtgtg atgacactcc ccgtggtatt ttagcctgtc aatatggaac aggtaatttt 720 actgatggat tgtacccttt tactcattcc agtgttgtta ataaaacttt ggaggtgtat 780 ctcaccaata gtgttgttaa taacactgtg tatggccaac ttgttaacgt aactttttat 840 aatcagacta atgttcaagt tggcaattta agtggctcgc aactgggtaa ccttaatcaa 900 ttaaggcttt atcaagacaa agtttttgat gctccttatt ataatcttaa tttttctttt 960 ttggattcgc ctgactttga gtttcgacca caaggtggtg gctggacacc agaggcagac 1020 tcccaattta cacaatgtcc ttttactatt aatagtatta ataatggtca ttgttttaat 1080 tctttacgcg tagccattac ttacgtcccc ggttatagag ggtgttatta tgctatgcgt 1140 cactttggag cccagtgttg ttatatgtat tatatgaaca accaacctct ttgtgctggt 1200 atagaccctg ttgagtataa ccgcacttgg cgttgtgcgt tagctgtgct tgtttttatg 1260 caatctggtt cccgcatttg tacatctgaa acggttccaa ttaatactgt ttctactgtt 1320 ttaaacaaca cttttgtcct ggacacttgt gttaattata ctatttatag tagatatggt 1380 gttggtctag ttactaatgt cactgaccaa gttacaccag gtaccttttt aaatgatggt 1440 ggtcttgttg tgttggattc tagtggtgcc atagacatct ttgctgttaa tgaagttgtt 1500 ggtaggcact actttaaagt caatccttgt agtgatgtga accaacagta tgttgtctct 1560 ggtggcaaca tagttgggcg tcttacatct gttaatgaat ctggttctca atttttagac 1620 aatcagtatt atgttccact tattaatagc actcgttcta aacgttctgt tcagaacagt 1680 actgttacta gttgtgctta tgtttcatac ggccagtatt gtatcaagcc tgatgccagt 1740 gttgtacaaa tacagcctga tacttttgat ggttttgtaa cacctctttt aaatgctact 1800 gagtatgttc tcataccaga tagttttaac ttgactgtta cagatgagta tatccaaact 1860 cgcatggagc agattcaaat taactgtatt caatatgtct gcggtagttc agtgcagtgc 1920 agacaattgt ttcaacagta tggttctgtt tgtgacaata ttttgtctat tgttaatggt 1980 ctggctcagc aggataatgc agaacttatc tctctttatt cttctactca acctggtcag 2040 aattacccac ccgtattcaa taatcttgat acaggtggtt ttaatatttc tttgctctta 2100 cctcaaaata agagtggtgt ccaatcaagg tcttttatag aagacctttt gtttactaaa 2160 atcgaatctg ttggactacc tactgatgct gagtaccaga agtgtacttc aggtctttta 2220 ggttgggtta aagatttggt ttgtgcgcaa tactataatg gtattatggt tttgccacct 2280 gttataacaa atgaaatgca gtttatgtac actagctcac ttgttgcatc tatggcgttt 2340 ggtggtttaa catcagcagg ggctattcct tttgcaacac aagttcaggc tagaattaat 2400 catttgggaa ttacgcagac actccttctt aagaatcagg agttgcttgc taattctttt 2460 aataatgcac ttcaatatat gcagcagggt tttgaagcca cttcccaggc tcttcagcag 2520 attcaggatg tggtaaatca acaggctgct gttcttacag aagtaatgag ctcacttaat 2580 aaaaactttg gtgccatttc ttctgttatt caagacattt acaaacagct agatgagctg 2640 tctgctaatg ctcaagttga taggcttatt acaggccggc tttcctcctt atctgtccta 2700 gcttcatcta aacaagctga gtaccttaga gtagctcagc agagacagtt ggcacaggat 2760 aaaattaatg agtgtgtacg ctcacaatcc actaggaatt ctttctgtgg taatggcatg 2820 catgtcttgt ccataccaca gtcagctcct aatggaatag cgttcataca ctttacatac 2880 acaccgcaaa catataaaaa tgtcactgcg gttgttggtt tttgtgttac taccaatggt 2940 agtggatatg gcttggtgcc tgttaatggt agaggcatct ttatttatgt tgacgatgca 3000 tattatatca cgtcacgtga tatgtatatg ccccgcaaca taacttcagg tgatgtggtt 3060 gtcttaacgt cttgtcaggc caattatgtc actgtcaata ggacagtcgt tacaaccttt 3120 gttgatgatg actttgattt tgatgatgag tttgagaagt ggtggaatca gactgaccat 3180 gtcattccag acctggacga gtttaattac accattccta ttcttgatat taataatgaa 3240 attgaccgta tccagcaggc aatacaaggg ttgaatcaat cctatgtaga cctggagtca 3300 ctgtcaattc tcacaactta tattaagtgg ccttggtatg tgtggttagc catagccttt 3360 gccactatca tatttatcct cattttgtgt tggattttct ttatgactgg ctgctgtggc 3420 tgttgctgcg gttgttttgg tcttatccct ctaatgtcta agtgtagaaa gaaatcttct 3480 tactacacca catttgatga tgatattgtt ggtgaacaaa tcagacctaa aaagtctgtt 3540 taa 3543 <210> 203 <211> 306 <212> DNA <213> Avian coronavirus <400> 203 atggcaccaa agaaattctt tgtgcgctgt tacaagcgaa ttcgctcctt atttcgttca 60 cgaaacagca gctcaagaat agaggactac cttttgggca gttctctgac tgttagttgt 120 ttcaatgaag tttgcttttg catgcaacca gaatgttctg tttgcaatgt tacttgtgat 180 tgttgtggag gttgtggtga ctggttgtgt aaaacctgta attacattcc acttaataat 240 tttgatgctg atgcttatat cttaaagcac cagcagtcaa tgattaactt agttctgcaa 300 ttgtaa 306 <210> 204 <211> 306 <212> DNA <213> Avian coronavirus <400> 204 atgcttgcca taattgaaaa cggttttaaa accgtttgtt tggcaggtgt agtttttgtc 60 acaattgatg ctttactatc cacttcttta agtggtttac aatttcaaca cgtcatgcta 120 gagagaggtg aagatgcaat gtgtgatgca agtcgcatag cgcacctcat ctcattacta 180 gctgactgtc gtgtttatga tccttttgct gaagcatttt attgtaacgg cagcttttgg 240 gaagtagatt ctatggaaga ggacggaagc attttgactt cagactcgga catagatttg 300 tattag 306 <210> 205 <211> 303 <212> DNA <213> Avian coronavirus <400> 205 atggacatac tcagtaaatc tgttgaagac aatggtgcct tcctcactgc tgtttatgtc 60 tttgttggtt ttattgctct ctacttatta ggtagagctt tacaagcatt cactcaagca 120 gcagatgcat gtttcttgtt ttggtacacc tggtttgcac ttccaacagg gcgtggcata 180 gcctttgtgt accgaaatac atatggtaga aaaattaaca atccggaatt agaagcggtt 240 attgttaatc agtttccaaa gaacggtcct aataacaagt tgcctgcaaa tttcgcatca 300 tga 303 <210> 206 <211> 681 <212> DNA <213> Avian coronavirus <400> 206 atgagtaatg atagtgcgaa ttgcacactt ggttatgaag aggcggtttg ggtttttaaa 60 gagtataacc tctttctcac tgcctttttg ctttttatgt ccatgattct gcagtatggc 120 tatgccacac gtagcagatt catgtatgtc ataaaaatga tagtgctgtg gctgttttgg 180 cctctgaaca ttgctgtggg tgttatatcc tgtatatatc ctgtaggaac tggcggtctt 240 gtagcagcta ttgtcctgac aatttttgca tgcctgtcat ttgttggtta ttgggtccag 300 agtattagac tctttaagcg ctgtaaatct ttttgggctt ttaaccctga gagtgatgca 360 gtgggatcca tttccctaac aactggccaa acatgtactt tctctataga gagtgtccct 420 atggtactct cacccattat taaggctgga gtgctgtatt gtgagggtca atggcttgct 480 aagtgcacac cctcggaagt gccgcagcac atttacgttt gcacacctga tagacgtaac 540 gtctacaaaa gagtagcagc gtactcaggt gataacaaag caaacaaaaa atcatttgct 600 acttttgtct tcactaagga gtctgttgac tcaggtgatc tggacagtgt ggcaacatct 660 ggtggtagcc tctactctta a 681 <210> 207 <211> 198 <212> DNA <213> Avian coronavirus <400> 207 atgagttttt gctctaggtt tactaaggcg actatctctt tttataaatc actcctactc 60 tttgaactta gagttttgga taaatttatt ttaaattacg gacccacttg cttccttctt 120 agttgcaaga ggttcctatt gtttcaagtt aatattttgt atagattggt atttacacca 180 aaaaattcgc tggtatga 198 <210> 208 <211> 270 <212> DNA <213> Avian coronavirus <400> 208 atgaacaacc ctttttccac tgcgacagca cgtaaagcgc gtgtttttat tagaggtgga 60 ttaaatagtg tgtttttcct taacgaaaag ggacaaccag aagtttgtcc tttttgcact 120 gccttagtag cccgtgggca actttgtcag gagcatttgt ttaataacaa cattttatca 180 tggcatcgcg tgacgcgtct aagtcaaaaa ataagaccga tgcgccagca ccagtgctca 240 agttgggagg tccagcacca cctaaaatag 270 <210> 209 <211> 1257 <212> DNA <213> Avian coronavirus <400> 209 atggcatcgc gtgacgcgtc taagtcaaaa aataagaccg atgcgccagc accagtgctc 60 aagttgggag gtccagcacc acctaaaata ggttcttctg gcaccgcatc atggtttcag 120 ccaataaagg agaagaagat gactcacaat cctcccacct ttactggaag tggtgttcca 180 gagaatgaca atgtcaagaa accagcgcgt catggttact ggaagcgcca acgcaggtac 240 aaacctggta aaggcaagag aactccagtc actgatgcct ggtatttcta ttacactggc 300 acaggcccgt ttgctgacct taaatggggt cagcctcatg acgatattgt ctgggttgct 360 gttgacggtg ctgatgttga tgcaaaatct ggtcaaggaa ctagagaccc tgataagttc 420 gaccaattcc ctcttcgctt tgctgaaggt ggtcctgacg ataatttccg ctgggacttt 480 atacctgtag gcgggcgcgg taggagtggg agatcttcag ttgcaacatc cagagagtct 540 agtagacctg ggtctcgcga aggttcaaga gggcgcaggc agatgggtcc taatgaggat 600 ctaattgctc gtgctgcaag gattattgag gagcagcaga agcgtggcgg tcgcatcact 660 aaggctaagg ctaatgagat ggcggaacgt cgctactgca aaagaactct tgctcctgga 720 aagactgtag accaggtttt tggtacacgt cagaagggcc gtgagcgcaa cttcggtgat 780 gatagaatgg tagaggaagg cattagggat gggcgtacta cagcaatgct caacctgatt 840 ccgtcttcgc atgcaatgct ctttggcagt catgtccagg caaaattgca gccagaaggg 900 ctcctcgtca ctttcagttt tacaactgta gtgccgcgtg atgaccctca gtttgaaaat 960 tatagacaaa tttgtgatga gtgtgttgac ggtgttggaa cacgtcctaa gaatgaaccc 1020 aaacccagat cacgctcttc ttcaaaacct gcttctcgtg cggcttcccc ggcgccaaaa 1080 caacagcgcc ctaagaagga gaagaagccg aagaatcagg ataaagataa aactgatggt 1140 gcaatgtctc aagaagagaa ggcagtgaat gatcagctgg aatttgatga tgcagaccaa 1200 ggtatgcctg ataaaataga ttggggatcc tctgctcttg gtgatactga gatttag 1257 <210> 210 <400> 210 000 <210> 211 <400> 211 000 <210> 212 <400> 212 000 <210> 213 <400> 213 000 <210> 214 <400> 214 000 <210> 215 <400> 215 000 <210> 216 <400> 216 000 <210> 217 <400> 217 000 <210> 218 <400> 218 000 <210> 219 <400> 219 000 <210> 220 <400> 220 000 <210> 221 <400> 221 000 <210> 222 <400> 222 000 <210> 223 <400> 223 000 <210> 224 <400> 224 000 <210> 225 <400> 225 000 <210> 226 <400> 226 000 <210> 227 <400> 227 000 <210> 228 <400> 228 000 <210> 229 <400> 229 000 <210> 230 <400> 230 000 <210> 231 <400> 231 000 <210> 232 <400> 232 000 <210> 233 <400> 233 000 <210> 234 <400> 234 000 <210> 235 <400> 235 000 <210> 236 <400> 236 000 <210> 237 <400> 237 000 <210> 238 <400> 238 000 <210> 239 <400> 239 000 <210> 240 <400> 240 000 <210> 241 <400> 241 000 <210> 242 <400> 242 000 <210> 243 <400> 243 000 <210> 244 <400> 244 000 <210> 245 <400> 245 000 <210> 246 <400> 246 000 <210> 247 <400> 247 000 <210> 248 <400> 248 000 <210> 249 <400> 249 000 <210> 250 <400> 250 000 <210> 251 <211> 6672 <212> PRT <213> Avian coronavirus <400> 251 Met Ala Pro Gly Leu Ser Lys Gly Val Ser Pro Asn Lys Lys Asn Val 1 5 10 15 Ile Phe Val Leu Lys Asp Ile Gln Pro Ala Leu Cys Asp Ala Leu Phe 20 25 30 Phe Tyr Thr Ser His Thr Pro Arg Asp Phe Ala Asp Ala His Ala Val 35 40 45 Arg Glu Arg Phe Asp Arg Asn Leu Gln Ser Gly Arg Val Phe Lys Phe 50 55 60 Glu Thr Val Cys Gly Pro Val Tyr Leu Gln Gly Val Pro Ser Val Pro 65 70 75 80 Pro Gly Val Lys Ala Leu Gly Ser Glu Ser Lys Leu Ala Asp Leu Glu 85 90 95 Ser Leu Phe Gly Val Ser Pro Leu Ser Arg Arg Tyr Arg Asp Leu Leu 100 105 110 Lys Thr Ala Pro Gln Trp Ser Leu Asn Val Glu Ser Leu Asp Ala Gln 115 120 125 Ala Glu Lys Leu Asp Thr Leu Phe Asn Ser Ser Glu Ile Leu Trp Leu 130 135 140 Gln Val Ala Ala Lys Val Gln Val Ser Ala Met Ala Leu Arg Leu Met 145 150 155 160 Ala Asn Asp Val Val Asn Leu Val Ile Glu Ala Leu Gly Gln Glu Phe 165 170 175 Ala Ser Met Phe Ala Ile Val Arg Lys Gln Val Arg Ala Val Leu Asp 180 185 190 Lys Cys Leu Met Val Phe Glu Asn Val Lys Glu Leu Pro Gln Arg Ile 195 200 205 Ala Ala Leu Lys Ala Ala Phe Ala Ala Cys Val Lys Arg Met Thr Val 210 215 220 Val Val Val Asp Lys Cys Leu Met Ile Arg Glu Phe Ala Gly Thr Cys 225 230 235 240 Leu Ala Ser Val Asn Ala Thr Met Ala Ala Trp Cys Arg Glu Leu Pro 245 250 255 Thr Gly Phe Met Gly Ser Lys Val Phe Asp Lys Leu Ala Phe Phe Lys 260 265 270 Glu Ala Val Val Lys Thr Val Lys Asn Val Ala His Ala Pro Asp Gly 275 280 285 Val Thr Gly Tyr Ser Val Ile Gly Asn Ala Arg Gly Thr Gln Val Val 290 295 300 Ile Arg Gly Met Arg Asn Asp Leu Thr Leu Leu Glu Gln Arg Ala Asp 305 310 315 320 Val Ser Val Glu Lys Glu Gly Trp Ser Ala Val Phe Asp Gly Arg Leu 325 330 335 Thr Tyr Val Phe Lys Ser Gly Glu Cys Tyr Tyr Ala Ala Pro Leu Ala 340 345 350 Gly Asn Phe Val Leu Asn Asp Val Tyr Cys Cys Glu Arg Val Val Leu 355 360 365 Leu Ser Asp Gly Tyr Thr Pro Glu Ile Asn Asp Gly Leu Leu Leu Ala 370 375 380 Ala Leu Tyr Thr Ser Ser Asn Val Ala Asp Val Leu Ala Ala Leu Lys 385 390 395 400 Lys Gly Glu Pro Phe Lys Phe Leu Gly His Ser Phe Val Tyr Val Lys 405 410 415 Asp Ala Ala Val Ser Phe Thr Leu Ala Lys Gly Ala Ser Ile Ala Asp 420 425 430 Val Phe Lys Leu Phe Val Lys Glu Ala Val Asp Val Trp Ser Val Phe 435 440 445 Asn Glu Lys Ser His Glu Phe Trp Thr Lys Ala His Asn Lys Cys Arg 450 455 460 Asn Leu Lys Asp Leu Val Ala Thr His Cys Cys Lys Ala Gln Val Thr 465 470 475 480 Phe Val Val Leu Ala Ile Ala Leu Gly Val Thr Val Trp Glu Ile Val 485 490 495 Lys Gln Val Leu Phe Lys Val Ala Gly Leu Phe Thr Ala Val Val Asp 500 505 510 Phe Cys Ser Lys Ala Trp Asn Gly Phe Cys Asp Gln Leu Ile His Ala 515 520 525 Lys Leu Phe Val Asn Glu Leu Gly Cys Val Leu Val Gly Val Lys Asn 530 535 540 His Cys Phe Gln Leu Leu Leu Ile Ala Val His Ala Phe Tyr Lys Thr 545 550 555 560 Leu Glu Lys Cys Ala Ile Gly Arg Ile Trp Asn Gly Asp Leu Leu Phe 565 570 575 Trp Ala Gly Gly Ala His Lys Val Ser Glu Asp Asn Gly Glu Val Trp 580 585 590 Phe Asp Ala Val Asp Thr Met Gln Val Asp Glu Gln Gly Thr Val Val 595 600 605 Glu Asp Asn Val Pro Asp Phe Val Val Cys His Asp Val Ser Ile Pro 610 615 620 Glu Arg Gln Lys Gly Tyr Ile Val Gln Ile Ala Ala Asp Gly Lys Asn 625 630 635 640 Tyr Met Phe Phe Arg Tyr Glu Gln Gly Val Asn Thr Tyr Tyr Ala Pro 645 650 655 Met Ser Gln Val Gly Ala Val Asn Val Val Cys Arg Ala Gly Gly Lys 660 665 670 Thr Val Thr Phe Gly Asp Asp Gln Val Lys Glu Leu Pro Pro Pro Asp 675 680 685 Val Lys Cys Ile Tyr Ile Asp Ile Glu Cys Cys Gly Glu Pro Trp Thr 690 695 700 Ser Val Phe Lys Arg Val Tyr Lys Asp Pro Val Glu Val Glu Thr Ser 705 710 715 720 Leu Thr Val Glu Glu Leu Arg Ala Val Val Tyr Glu Met Met Cys Asp 725 730 735 Ser Leu Lys Leu Phe Pro Gly Ala Pro Gln Pro Pro Pro Tyr Asp Asn 740 745 750 Val Ala Leu Val Asp Asn Gln Gly Arg Asp Leu Gln Asn Ile Asp Ser 755 760 765 Cys His Leu Val Tyr Val Asp Tyr Asp Ser Asp Gly Ala Val Ser Asp 770 775 780 Glu Glu Glu Glu Asp Val Ser Asp Thr Glu Asp Val Asn Glu Glu Asp 785 790 795 800 Glu Arg Leu Ala Cys Leu Leu Lys Asn Ser Ala Asn Phe Lys Tyr Pro 805 810 815 Leu Pro Tyr Asp Asp Glu Tyr Ser Val Phe Cys Gly Arg Leu Val His 820 825 830 Lys Asp Ala Ile Asp Thr Leu His Tyr Pro Ser Gly Asp Asp Met Tyr 835 840 845 Val Ile Asn Asn Ala Phe Glu Gly Ala Val Lys Ala Leu Pro Gln Ser 850 855 860 Val Val Asp Val Leu Gly Asp Trp Gly Val Ala Val Asp Asn Gln Glu 865 870 875 880 Arg Ala Met Asn Lys Glu Ile Pro Val Glu Ile Pro Lys Glu Glu Thr 885 890 895 Gln Lys Pro Gln Lys Val Glu Glu Gln Lys Pro Arg Glu Thr Leu Val 900 905 910 Glu Ile Ser Lys Glu Glu Thr Gln Lys Pro Gln Lys Val Glu Glu Gln 915 920 925 Lys Pro Lys Glu Thr Leu Val Glu Ile Pro Lys Glu Glu Thr Gln Lys 930 935 940 Pro Gln Lys Val Glu Glu Gln Lys Pro Lys Glu Thr Pro Val Glu Ile 945 950 955 960 Pro Lys Glu Glu Thr Gln Lys Pro Gln Lys Val Glu Glu Gln Lys Pro 965 970 975 Arg Glu Thr Pro Val Glu Thr Pro Lys Glu Glu Thr Gln Lys Pro Gln 980 985 990 Lys Val Glu Glu Gln Lys Pro Lys Glu Thr Leu Leu Asn Lys Gln Phe 995 1000 1005 Phe Ser Asp Ser Ser Ser Asp Glu Glu Pro Lys Lys Lys Leu Phe 1010 1015 1020 Arg Phe Lys Leu Lys Pro Thr Lys Cys Lys Val Pro Ser Asn Val 1025 1030 1035 Glu Tyr Ser Thr Cys Val Gly Asp Leu Ser Val Val Val Ala Lys 1040 1045 1050 Ala Met Asp Ser Phe Glu Asp Phe Val Leu Val Asn Ala Ala Asn 1055 1060 1065 Glu His Met Cys His Ala Gly Gly Val Ala Lys Ala Ile Ala Asp 1070 1075 1080 Phe Cys Gly Asn Lys Phe Val Asp Tyr Cys Asp Thr Phe Val Gly 1085 1090 1095 Lys Asn Gly Pro Gln Gln Gln Leu Leu Ala Pro Ser Gly Val Ala 1100 1105 1110 Arg Met Gln Ala Val Asn Asn Val Val Gly Pro Arg His Gly Gln 1115 1120 1125 Pro Asp Leu Phe Asp Lys Leu Val Ala Ala Tyr Lys Lys Val Val 1130 1135 1140 Val Val Gly Ala Val Asn Tyr Val Val Pro Val Leu Ser Ala Gly 1145 1150 1155 Ile Phe Gly Val Asp Tyr Lys Met Ser Ile Asp Ala Met Arg Lys 1160 1165 1170 Ala Phe Cys Asp Met Lys Ile Arg Val Leu Leu Phe Ser Leu Asn 1175 1180 1185 Gln Glu His Ile Asp Tyr Phe Asn Ala Thr Cys Lys Gln Lys Thr 1190 1195 1200 Val Tyr Leu Thr Glu Asp Gly Thr Ser Phe Lys Thr Leu Val Leu 1205 1210 1215 Arg Pro Gly Asp Thr Leu Gly His Leu Gly Gly Val Phe Ala Arg 1220 1225 1230 Asn Lys Thr Val Phe Thr Ala Asp Asp Val Ser Asp Lys Glu Val 1235 1240 1245 Leu Phe Leu Pro Thr Thr Asp Lys Asn Val Leu Glu His Tyr Asp 1250 1255 1260 Leu Asp Ala Gln Lys Tyr Val Leu Phe Leu Thr Thr Leu Ser Gln 1265 1270 1275 Lys Trp Glu Val Phe Phe Lys Gly Gly Val Leu Gln Leu Val Trp 1280 1285 1290 Arg Asp Gly Asn Cys Trp Val Asn Ala Val Ile Thr Leu Leu Gln 1295 1300 1305 Ala Ala Lys Ile Lys Phe Lys Gly Tyr Leu Ala Thr Ala Trp Ala 1310 1315 1320 Gln Leu Leu Gly Gly Asp Pro Thr Glu Phe Val Ala Trp Cys Tyr 1325 1330 1335 Ala Ser Thr Asn Thr Lys Val Gly Asp Phe Gly Asp Ser Asn Val 1340 1345 1350 Leu Leu Leu Thr Leu Ala His His Phe Ser Val Asp Tyr Thr Lys 1355 1360 1365 Ala Leu Ile Val Arg Arg Val Val Cys Lys Cys Gly Val Asn Thr 1370 1375 1380 Gln Gln Val Tyr Gly Ile Asn Ala Cys Val Gln His Val Cys Ala 1385 1390 1395 Thr Asn Met Leu Asn Phe Met Lys Gln Tyr Gly Asp Cys Ser Val 1400 1405 1410 Cys Gly Glu Lys Tyr Val Asp Glu Val Val Asn Ile Asn Val Pro 1415 1420 1425 Tyr Leu Met Leu Leu Ala Gly Gly Gly Pro Gln Asn Val Asp Arg 1430 1435 1440 Asp Glu Thr Val Val Ala Asn Ile Val Phe Val Gly Thr Ile Asp 1445 1450 1455 Ser Gly His Cys Tyr Thr Gln Thr Ala Asn Asn Val Phe Asp Asn 1460 1465 1470 Leu Val Gln Asn Arg Gln Phe Ser Lys Arg Ala Pro Tyr Ile Thr 1475 1480 1485 Ala Phe Tyr Pro Gln Phe Ser Leu Lys Ser Lys Asn Ser Leu Ser 1490 1495 1500 Val Ala Lys Lys Ser Lys Ser Lys Ser Asp Val Val Lys Glu Asp 1505 1510 1515 Val Ser Asn Leu Ala Thr Gly Ser Asp Val Glu Val Glu Asp Ile 1520 1525 1530 Ser Asn Phe Glu Arg Trp Tyr Ser Asp Asn Tyr Tyr Asp Cys Leu 1535 1540 1545 Thr Val Gln Glu Asp Ser Ser Leu Pro Val Asp Asn Thr Asn Phe 1550 1555 1560 Asp Phe Val Val Asp Ser Lys Leu Pro Leu Thr Leu Thr Val Arg 1565 1570 1575 Gly Val Ser Arg Asp Val Asn Phe Lys Ser Ala Glu Gly Phe Thr 1580 1585 1590 Tyr Ile Leu Thr Pro Glu Arg Gly Gln Thr Cys Asn Ser Pro Val 1595 1600 1605 Tyr Tyr Ser Ser Leu Asp Leu Val Ser Leu Arg Ala Ile Trp Val 1610 1615 1620 Asn Gly Asp Ser Asn Tyr Val Val Gly Asn Pro Asn Tyr Tyr Ser 1625 1630 1635 Arg Leu Leu Arg Ile Pro Thr Leu Tyr Glu Asn Ala Glu Lys Phe 1640 1645 1650 Val Asn Ile Gly Glu Arg Val Gly Asn Val Thr Tyr Gly Val Trp 1655 1660 1665 Arg Ala Lys Ser Leu Asn Lys Pro Gln Leu Ser Thr Val Met Ala 1670 1675 1680 Ser Val Lys Ala Ile Ile Gly Val Ala Asn Pro Val Ser Asn Val 1685 1690 1695 Val Gly Asn Thr Val Lys Lys Val Val Ala Val Ser Asp Gly Leu 1700 1705 1710 Gly Asp Gly Val Phe Gly Asn Met Trp Gly Gly Val Cys Gly Leu 1715 1720 1725 Ile Gly Gly Thr Cys Lys Phe Val Tyr Asp Lys Val Ser Leu His 1730 1735 1740 Phe Ile Arg Thr Met Leu Leu Phe Leu Phe Tyr Phe Cys Lys Ala 1745 1750 1755 Gly Phe Lys Lys Phe Ser Ser Asn Tyr Arg Ser Val Ile Thr Lys 1760 1765 1770 Val Val Met Thr Ala Leu Leu Leu Cys Trp Phe Val Tyr Thr Tyr 1775 1780 1785 Glu Ala Ile His Phe Val Gly Ile Arg Ile Leu Asp Phe Leu Phe 1790 1795 1800 Glu Gly Ser Phe Cys Gly Asn Tyr Thr Gly Tyr Gly Lys Asp Ser 1805 1810 1815 Phe Asp Met Leu Arg Tyr Cys Gly Asp Asp Ala Val Cys Arg Val 1820 1825 1830 Cys Leu His Ser Val Asp Ser Leu His Leu Tyr Lys His Ala Tyr 1835 1840 1845 Ser Val Glu Gln Val Tyr Lys Asp Ala Val Ala Glu Phe Lys Phe 1850 1855 1860 Thr Trp Asn Trp Leu Tyr Leu Val Phe Leu Val Leu Phe Val Lys 1865 1870 1875 Pro Val Ala Leu Phe Val Ile Val Cys Tyr Cys Leu Lys Tyr Leu 1880 1885 1890 Val Leu Gly Ala Glu Val Leu Gln Thr Gly Ile Thr Ile Val Asp 1895 1900 1905 Trp Cys Val Ala Thr Phe Phe Ser His Phe Asn Phe Met Gly Ala 1910 1915 1920 Ser Phe Tyr Val Trp Ile Leu Trp Lys Val Tyr Thr Tyr Val His 1925 1930 1935 His Ile Met Tyr Cys Lys Asp Ile Thr Cys Asp Ile Cys Arg Arg 1940 1945 1950 Val Ala Arg Asn Ser Arg His Glu Val Ser Val Ile Val Asn Gly 1955 1960 1965 Arg Lys Gln Ser Val Tyr Val Tyr Thr Asn Ser Gly Phe Thr Phe 1970 1975 1980 Cys Lys Lys His Asn Trp Tyr Cys Lys Gly Cys Asp Thr Phe Gly 1985 1990 1995 His Gln Asn Thr Phe Ile Ser Pro Glu Val Ala Gly Glu Leu Ser 2000 2005 2010 Asp Lys Leu Lys Arg His Val Lys Pro Thr Ser Ser Ala Tyr Phe 2015 2020 2025 Leu Val Asp Thr Ala Gln Leu Val Gly Asp Phe Val Asn Leu Asn 2030 2035 2040 Tyr Ser Ser Lys Ala Pro Gly Leu Glu Ser Thr Lys Gln Gln Val 2045 2050 2055 Lys Cys Phe Thr Val Ser Asp Phe Leu Lys Asn Ala Val Phe Leu 2060 2065 2070 Lys Asp Ala Val Lys Cys Glu Arg Met Ala Asn Asp Ser Phe Ile 2075 2080 2085 Val Cys Asn Thr Gln Ser Leu His Asp Leu Glu Ala Ala Lys Asn 2090 2095 2100 Ala Ala Val Tyr Tyr Ala His Tyr Leu Cys Lys Pro Ile Leu Ile 2105 2110 2115 Leu Asp Gln Val Leu Tyr Asp Thr Leu Ala Cys Glu Pro Val Ser 2120 2125 2130 Lys Ser Leu Val Asp Lys Val Cys Gly Val Leu Ala Asn Ile Val 2135 2140 2145 Glu Val Asp Phe Ala Asn Leu Asn Tyr Lys Ala Gly Ser Leu Arg 2150 2155 2160 Asp Ala Leu Leu Ser Val Thr Ser Asp Glu Glu Ala Val Asp Met 2165 2170 2175 Ala Ile Phe Cys His Asn Tyr Asp Leu Asn Tyr Thr Ser Asp Gly 2180 2185 2190 Phe Thr Asn Val Val Pro Ser Tyr Gly Phe Asp Leu Gly Lys Leu 2195 2200 2205 Ser Pro Arg Asp Lys Gly Phe Leu Ile Asn Ala Asp Ala Cys Ile 2210 2215 2220 Ala Asn Leu Lys Val Arg Asn Ala Pro Ala Val Val Trp Asn Tyr 2225 2230 2235 Tyr Asp Leu Ile Lys Leu Ser Asp Asn Cys Leu Lys Phe Leu Val 2240 2245 2250 Ser Gly Val Ile Lys Ser Gly Ala Lys Phe Tyr Val Thr Arg Ser 2255 2260 2265 Gly Ala Lys Gln Val Ile Thr Cys His Thr Gln Lys Leu Leu Leu 2270 2275 2280 Asp Lys Lys Ala Gly Gly Ile Leu Lys Asp Thr Met Ser Trp Phe 2285 2290 2295 Trp Phe Met Val Lys Phe Val Val Val Cys Tyr Leu Ile Phe Thr 2300 2305 2310 Ala Gly Cys Leu Tyr Val Tyr His Thr Asp Tyr Tyr Gly Ala Lys 2315 2320 2325 Met His Pro Met Tyr Asp Ile Asn Ala Thr Phe Pro Val Glu Asn 2330 2335 2340 Phe Lys Val Ile Glu Asn Gly Val Leu Arg Asp Leu Val Ser Glu 2345 2350 2355 Asp Ser Cys Phe Ser Asn Lys Phe Leu Gly Phe Asp Asp Phe Trp 2360 2365 2370 Ala Lys Thr Tyr Thr Asn Ser Arg Asp Cys Pro Ile Val Thr Ala 2375 2380 2385 Leu Ile Asp Gly Thr Gly Phe Val Ala Ala Gly Val Pro Gly His 2390 2395 2400 Val His Trp Val Met Asp Asn Thr Met Phe Val His Thr Ala Gln 2405 2410 2415 Ala Glu Ala Lys Pro Trp Tyr Ala Pro Ser Trp Phe Pro Gln Asp 2420 2425 2430 Asp Val Val Gly Tyr Thr Ile Asp Ser Val Val Thr Gln Gly Glu 2435 2440 2445 Phe Tyr Ser Ser Ile Ala Thr Phe Pro Ala Arg Cys Met Tyr Leu 2450 2455 2460 Ala Thr Ser Ala Ser Pro Gln Leu Tyr Cys Tyr Gly Gly Glu Asn 2465 2470 2475 Asp Ala Pro Gly Ala Met Ser Tyr Asp Ser Val Gln Pro His Arg 2480 2485 2490 Val Tyr Phe Gln Pro Asn Asn Val Arg Phe Ser Ile Pro Gln Gln 2495 2500 2505 Ile Met Tyr Thr Pro Tyr Ile Val Lys Leu Ala Ser Asp Asn Tyr 2510 2515 2520 Cys Arg Gly Ser Val Cys Glu Lys Thr Lys Leu Gly Tyr Cys Tyr 2525 2530 2535 Ser Trp Asn Pro Arg Trp Val Leu Tyr Asn Asp Asp Tyr Val Ser 2540 2545 2550 Leu Pro Gly Val Tyr Cys Gly Ser Thr Ile Arg Glu Leu Val Phe 2555 2560 2565 Ser Met Leu Gly Ser Phe Phe Thr Gly Val Ser Pro Asn Leu Tyr 2570 2575 2580 Ile His Leu Thr Thr Met Phe Leu Val Leu Leu Gly Val Met Ile 2585 2590 2595 Ile Phe Ala Leu Val Ile Arg Phe Gln Gly Val Phe Lys Ala Tyr 2600 2605 2610 Thr Pro Val Val Phe Ala Val Ile Met Val Trp Gly Leu Asn Val 2615 2620 2625 Phe Met Leu Cys Val Tyr Ser Tyr Asn Pro Phe Val Ala Val Met 2630 2635 2640 Leu Leu Ala Leu Tyr Cys Tyr Met Ser Leu Met Val Gly Arg Thr 2645 2650 2655 Val Ser Thr Val Met His Leu Trp Val Val Phe Thr Phe Ile Met 2660 2665 2670 Val Val Pro Trp Trp Leu Ala Cys Val Tyr Ile Ala Phe Val Ala 2675 2680 2685 Tyr Met Tyr Thr Pro Phe Ala Met Trp Cys Tyr Gly Thr Ala Lys 2690 2695 2700 Gln Thr Arg Lys Leu Tyr Glu Gly Asn Glu Phe Val Gly Asn Tyr 2705 2710 2715 Asp Leu Ala Ala Gln Ser Thr Phe Val Ile Arg Asn Val Glu Phe 2720 2725 2730 Val Lys Leu Cys Asn Glu Val Gly Asp Lys Leu Asp Ile Tyr Leu 2735 2740 2745 Ser Ala Tyr Ala Arg Leu Lys Tyr Tyr Ser Gly Thr Gly Gly Glu 2750 2755 2760 Gln Asp Tyr Leu His Ala Cys Arg Ala Trp Leu Ala Tyr Ala Leu 2765 2770 2775 Asp Gln Phe Arg Ala Asn Gly Val Glu Val Leu Tyr Thr Pro Pro 2780 2785 2790 Lys Phe Ser Met Gly Val Thr Arg Leu Gln Ala Gly Phe Lys Lys 2795 2800 2805 Phe Val Ser Pro Ser Ser Ala Val Glu Lys Cys Val Val Met Val 2810 2815 2820 Arg Tyr Lys Gly Thr Val Leu Asn Gly Leu Trp Leu Asn Asp Cys 2825 2830 2835 Val Tyr Cys Pro Arg His Val Met Gly Lys Phe Ser Gly Asp Glu 2840 2845 2850 Trp Gln Asp Val Leu Ser Leu Ala Ser Asn His Glu Phe Glu Val 2855 2860 2865 Thr Gly Pro Asp Gly Ser Ser Leu Gln Val Val Ser Arg Lys Leu 2870 2875 2880 Gln Gly Ala Val Leu Ile Leu Gln Thr Ala Val Val Asn Val Asn 2885 2890 2895 Thr Pro Lys Tyr Lys Phe Val Gln Ala Gln Cys Gly Asp Thr Phe 2900 2905 2910 Thr Ile Ala Cys Ser Tyr Asn Gly Asn Val Val Gly Leu Tyr Pro 2915 2920 2925 Val Thr Met Arg Ala Asn Gly Thr Ile Arg Ala Ser Phe Ala Cys 2930 2935 2940 Gly Ser Cys Gly Ser Val Gly Phe Asn Met Asp Gly Gly Val Val 2945 2950 2955 Ala Phe Cys Tyr Met His His Leu Glu Leu Pro Asn Ala Ile His 2960 2965 2970 Thr Gly Thr Asp Leu Ala Gly Asn Phe Tyr Gly Gly Phe Ile Asp 2975 2980 2985 Glu Glu Cys Ala Gln Arg Val Glu Pro Asp Pro Arg Ile Thr Asn 2990 2995 3000 Asn Val Val Ala Trp Phe Tyr Ala Ala Ile Ile Ser Ile Lys Glu 3005 3010 3015 Ser Ser Phe Ser Leu Pro Lys Trp Val Glu Ser Thr Pro Ile Ser 3020 3025 3030 Val Asp Asp Tyr Asn Lys Trp Ala Ala Asp Ser Gly Phe Thr Pro 3035 3040 3045 Tyr Val Asp Ser Ile Ala Val Asn Lys Leu Ala Ala Ile Thr Ser 3050 3055 3060 Val Asp Val Gly Arg Val Leu Arg Thr Ile Ile Val Lys Asn Thr 3065 3070 3075 His Trp Gly Thr Asp Pro Ile Met Gly Val Phe Asn Phe Asp Asp 3080 3085 3090 Glu Leu Thr Pro Glu Ser Ile Phe Asn Gln Ile Gly Gly Val Lys 3095 3100 3105 Leu Gln Ser Ser Ile Ile Lys Arg Thr Ile Ser Trp Phe Trp Ser 3110 3115 3120 Arg Leu Val Leu Ala Met Phe Leu Phe Val Leu Cys Ala Met Val 3125 3130 3135 Leu Phe Thr Val Val Pro Tyr Lys Tyr Phe Ile Tyr Ala Ala Ile 3140 3145 3150 Ile Leu Phe Val Ala Val Phe Ile Ala Ala Phe Thr Ile Lys His 3155 3160 3165 Val Leu Ala Tyr Leu Asp Thr Phe Leu Leu Pro Thr Leu Cys Thr 3170 3175 3180 Val Met Ile Gly Val Cys Met Glu Val Pro Phe Ile Tyr Asn Thr 3185 3190 3195 Tyr Ile Tyr Asp Phe Leu Lys Gly Leu Phe Ser Pro Trp Tyr Asn 3200 3205 3210 Val Glu Val Val Asp Thr Val Val Pro Trp Met Phe Met Pro Ile 3215 3220 3225 Ile Val Tyr Thr Thr Phe Arg Cys Ile Gln Gly Cys Tyr Ala Ile 3230 3235 3240 Asp Ser Phe Ser Ala Ala Leu Thr Gly Ala Tyr Gln Val Val Lys 3245 3250 3255 Leu Gly Phe Thr Ile Tyr Thr Ser Trp Asn Thr Gly His Ala Tyr 3260 3265 3270 Ser Ala Gly Asp Trp Asp Leu Phe Phe Glu Leu Leu His Thr Thr 3275 3280 3285 Met Leu Ala Asn Ile Ser Ser Asn Ser Leu Val Gly Ile Ile Val 3290 3295 3300 Phe Asn Val Ala Lys Trp Cys Leu Arg Tyr Cys Asn Leu Thr Tyr 3305 3310 3315 Val Asn Ser Tyr Val Leu Met Ala Ile Phe Val Asn Val Met Gly 3320 3325 3330 Trp Met Phe Thr Cys Tyr Phe Gly Val Tyr Trp Trp Leu Asn Lys 3335 3340 3345 Val Phe Gly Leu Thr Cys Gly Lys Tyr Thr Tyr Lys Val Ser Val 3350 3355 3360 Glu Gln Tyr Lys Tyr Met Cys Val His Arg Ile Pro Ser Pro Lys 3365 3370 3375 Ser Ala Trp Asp Ile Phe Val Thr Asn Met Leu Ile Gln Gly Ile 3380 3385 3390 Gly Gly Glu Arg Lys Leu Pro Ile Ala Thr Val Gln Ser Lys Leu 3395 3400 3405 Thr Asp Val Lys Cys Thr Ala Val Val Leu Met Gln Leu Leu Thr 3410 3415 3420 Lys Leu Asn Val Glu Ala Asn Ser Lys Met His Lys His Leu Val 3425 3430 3435 Glu Leu His Asn Lys Ile Leu Ala Ser Glu Asp Leu Val Glu Cys 3440 3445 3450 Met Asp Asn Leu Leu Gly Met Leu Val Thr Leu Leu Cys Val Asp 3455 3460 3465 Ser Thr Val Asp Leu Ser Glu Tyr Cys Glu Asp Val Leu Gly Lys 3470 3475 3480 Val Thr Val Leu Gln Ser Val Ala Gln Glu Phe Ser His Ile Pro 3485 3490 3495 Ser Tyr Ala Glu Tyr Glu Arg Ala Lys Asp Leu Tyr Glu Arg Val 3500 3505 3510 Leu Ala Asp Ser Lys Ser Gly Asn Val Thr Gln Gln Glu Val Ala 3515 3520 3525 Ala Tyr Arg Lys Ala Ala Asn Ile Ala Lys Ser Val Phe Asp Arg 3530 3535 3540 Asp Leu Ser Val Gln Lys Lys Leu Asp Ala Met Ala Glu Arg Ala 3545 3550 3555 Met Thr Thr Met Tyr Lys Glu Ala Arg Val Thr Asp Arg Arg Ala 3560 3565 3570 Lys Leu Val Ser Ser Leu His Ala Leu Leu Phe Ser Met Leu Lys 3575 3580 3585 Lys Ile Asp Ser Asp Lys Leu Thr Ser Leu Phe Glu Gln Ala Arg 3590 3595 3600 Asp Gly Val Val Pro Leu Ala Thr Val Pro Ile Val Cys Ser Asn 3605 3610 3615 Lys Leu Thr Leu Val Ile Pro Asp Ala Gly Thr Trp Thr Lys Cys 3620 3625 3630 Val Glu Gly Thr Phe Val Thr Tyr Ser Thr Val Val Trp Asn Ile 3635 3640 3645 Asp Thr Val Phe Asp Ala Asp Gly Val Glu Ile Gln Pro Ser Ser 3650 3655 3660 Asn Gly Gln Ser Leu Val Tyr His Ile Gly Gly Asp Arg Ile Ala 3665 3670 3675 Trp Pro Leu Lys Val Asn Leu Thr Arg Asn Val His Asn Lys Val 3680 3685 3690 Glu Ala Ser Leu Gln Asn Asn Glu Leu Met Pro Gln Gly Ile Lys 3695 3700 3705 Thr Lys Ala Cys Val Ala Gly Thr Asp Gln Ala His Cys Asn Val 3710 3715 3720 Glu Ser Lys Cys Tyr Tyr Thr Asn Ile Asn Gly Ser Ser Val Val 3725 3730 3735 Ala Ala Ile Thr Ser His Asn Pro Asn Leu Lys Val Ala Ser Phe 3740 3745 3750 Leu Ser Asp Ala Gly Asn Gln Ile Phe Val Asp Leu Asp Pro Pro 3755 3760 3765 Cys Lys Phe Gly Met Lys Val Gly Gly Lys Val Glu Val Val Tyr 3770 3775 3780 Leu Tyr Phe Leu Lys Asn Thr Arg Ser Ile Ile Arg Gly Met Val 3785 3790 3795 Leu Gly Ala Ile Ser Asn Val Val Val Leu Gln Ser Lys Gly His 3800 3805 3810 Glu Thr Glu Glu Leu Glu Ser Val Gly Ile Leu Ser Leu Cys Ala 3815 3820 3825 Phe Ala Val Asp Pro Ala Glu Thr Tyr Leu Lys Tyr Val Ser Ala 3830 3835 3840 Gly Asn Gln Pro Leu Gly Asn Cys Val Lys Met Leu Thr Val His 3845 3850 3855 Asn Gly Asn Gly Phe Ala Ile Thr Thr Lys Pro Ser Pro Thr Pro 3860 3865 3870 Glu Gln Asp Ser Tyr Gly Gly Ala Ser Val Cys Leu Tyr Cys Arg 3875 3880 3885 Ala His Ile Ala His Pro Gly Ala Ser Gly Thr Leu Asp Gly Arg 3890 3895 3900 Cys Pro Phe Lys Gly Ser Phe Val Gln Ile Pro Thr Ser Glu Lys 3905 3910 3915 Asp Pro Val Gly Phe Cys Leu Arg Asn Lys Val Cys Lys Val Cys 3920 3925 3930 Gln Cys Trp Val Gly Phe Gly Cys Gln Cys Asp Phe Leu Arg Gln 3935 3940 3945 Pro Val Ala Asn Met Gln Ser Thr Tyr Val Ala Pro Val Val Ser 3950 3955 3960 Thr Asn Ser Asp Lys Asn Tyr Leu Asn Gly Phe Gly Val Ala Val 3965 3970 3975 Arg Leu Asp Leu Ile Pro Leu Ser Asp Gly Asn Gln Pro His Ile 3980 3985 3990 Val Lys Arg Ala Phe Asp Val Cys Asn Lys Glu Ser Ala Gly Met 3995 4000 4005 Phe Gln Asn Met Lys His Asn Cys Ala Arg Phe Gln Glu Val Val 4010 4015 4020 Glu Gly Glu Asp Ser Trp Lys His Gly Leu Glu Tyr Lys Asp Ser 4025 4030 4035 Tyr Phe Val Val Lys Gln Thr Thr Pro Ser Asn Tyr Val His Glu 4040 4045 4050 Gln Ala Cys Tyr Glu Asp Leu Lys Ser Asp Val Val Ala Val His 4055 4060 4065 Asp Phe Phe Val Phe Asn Lys Thr Ile Tyr Asn Val Ser Arg Gln 4070 4075 4080 Arg Leu Thr Lys Tyr Thr Met Met Asp Leu Cys Tyr Ala Leu Arg 4085 4090 4095 His Phe Asp Pro Lys Asp Cys Glu Val Leu Lys Glu Ile Leu Val 4100 4105 4110 Leu Asn Asp Cys Ile Glu Asp Trp Tyr Trp Met Gln Gly Gly Gln 4115 4120 4125 Gly Gln Ala Pro Gly Asn Trp Phe Asp His Asn Pro Thr Trp Tyr 4130 4135 4140 Asp Pro Ile Glu Asn Pro Ser Tyr Tyr Ala Ile Leu Ala Asn Leu 4145 4150 4155 Gly His Ile Val Arg Arg Ala Leu Leu Asn Ala Val Lys Phe Gly 4160 4165 4170 Asp Leu Met Val Glu Lys Gly Tyr Val Gly Val Val Thr Leu Asp 4175 4180 4185 Asn Gln Asp Leu Asn Gly Lys Phe Tyr Asp Phe Gly Asp Phe Gln 4190 4195 4200 Lys Thr Thr Pro Gly Ala Gly Val Pro Ile Phe Asp Ser Tyr Tyr 4205 4210 4215 Ser Tyr Leu Met Pro Ile Ile Thr Met Thr Asp Ala Leu Ala Thr 4220 4225 4230 Glu Arg Phe Tyr Glu Phe Asp Arg His Lys Gly Phe Lys Ser Tyr 4235 4240 4245 Asp Leu Leu Lys Tyr Asp Tyr Thr Glu Glu Lys Leu Glu Leu Phe 4250 4255 4260 Ser Lys Tyr Phe Lys Tyr Trp Asp Gln Glu Tyr His Pro Asn Cys 4265 4270 4275 Ser Glu Cys Ala Asp Asp Arg Cys Leu Ile His Cys Ala Asn Phe 4280 4285 4290 Asn Ile Leu Phe Ser Thr Leu Ile Pro Gln Thr Ser Phe Gly Asn 4295 4300 4305 Leu Cys Arg Lys Val Tyr Val Asp Gly Val Pro Phe Ile Ala Thr 4310 4315 4320 Cys Gly Tyr His Ser Lys Glu Leu Gly Val Ile Met Asn Gln Asp 4325 4330 4335 Asn Thr Leu Ser Phe Ser Lys Met Gly Leu Gly Gln Leu Met Lys 4340 4345 4350 Phe Val Gly Asp Pro Ala Leu Leu Val Gly Thr Ser Asn Asn Leu 4355 4360 4365 Val Asp Leu Arg Thr Ser Cys Phe Ser Ile Cys Ala Leu Ala Ser 4370 4375 4380 Gly Ile Thr His Gln Thr Val Lys Pro Gly His Phe Asn Lys Asp 4385 4390 4395 Phe Tyr Asp Phe Ala Glu Lys Ala Gly Met Phe Lys Glu Gly Ser 4400 4405 4410 Ser Ile Pro Leu Lys His Phe Phe Phe Pro Gln Thr Gly Ser Ala 4415 4420 4425 Ala Ile Asp Asp Tyr Asp Tyr Tyr Arg Tyr Asn Arg Pro Thr Met 4430 4435 4440 Phe Asp Ile Arg Gln Leu Leu Phe Cys Leu Glu Val Thr Ser Lys 4445 4450 4455 Tyr Phe Glu Cys Tyr Glu Gly Gly Cys Ile Ser Ala Ser Gln Val 4460 4465 4470 Val Val Thr Asn Leu Asp Lys Ser Ala Gly Tyr Pro Phe Asn Lys 4475 4480 4485 Phe Gly Lys Ala Arg Leu Tyr Tyr Glu Met Ser Phe Glu Glu Gln 4490 4495 4500 Asp Gln Leu Phe Glu Ser Thr Lys Lys Asn Val Leu Pro Thr Ile 4505 4510 4515 Thr Gln Met Asn Leu Lys Tyr Ala Ile Ser Ala Lys Asn Arg Ala 4520 4525 4530 Arg Thr Val Ala Gly Val Ser Ile Leu Ser Thr Met Thr Asn Arg 4535 4540 4545 Gln Tyr His Gln Lys Val Leu Lys Ser Ile Val Asn Thr Arg Asn 4550 4555 4560 Ala Pro Val Val Ile Gly Thr Thr Lys Phe Tyr Gly Gly Trp Asp 4565 4570 4575 Asn Met Leu Arg Asn Leu Ile Lys Gly Val Asp Asp Pro Ile Leu 4580 4585 4590 Met Gly Trp Asp Tyr Pro Lys Cys Asp Arg Ala Met Pro Asn Leu 4595 4600 4605 Leu Arg Ile Ala Ala Ser Leu Val Leu Ala Arg Lys His Thr Asn 4610 4615 4620 Cys Cys Thr Trp Ser Asp Arg Val Tyr Arg Leu Tyr Asn Glu Cys 4625 4630 4635 Ala Gln Val Leu Ser Glu Ser Val Leu Ala Thr Gly Gly Ile Tyr 4640 4645 4650 Val Lys Pro Gly Gly Thr Ser Ser Gly Asp Ala Thr Thr Ala Tyr 4655 4660 4665 Ala Asn Ser Val Phe Asn Ile Ile Gln Ala Thr Ser Ala Asn Val 4670 4675 4680 Ala Arg Leu Val Ser Thr Ile Thr Arg Asp Ile Val Tyr Asp Asp 4685 4690 4695 Val Arg Ala Met Gln His Glu Leu Tyr Gln Gln Val Tyr Arg Arg 4700 4705 4710 Val Asn Pro Asp Ala Ala Phe Val Glu Lys Phe Tyr Ser Tyr Leu 4715 4720 4725 Asn Lys His Phe Ser Leu Met Ile Leu Ser Asp Asp Gly Val Val 4730 4735 4740 Cys Tyr Asn Asn Thr Tyr Ala Lys Gln Gly Leu Val Ala Asp Ile 4745 4750 4755 Ser Ala Phe Arg Glu Val Leu Tyr Tyr Gln Asn Asn Val Tyr Met 4760 4765 4770 Ala Asp Ser Lys Cys Trp Val Glu Pro Asp Leu Glu Lys Gly Pro 4775 4780 4785 His Glu Phe Cys Ser Gln His Thr Met Leu Val Asp Val Asp Gly 4790 4795 4800 Glu Pro Lys Tyr Leu Pro Tyr Pro Asp Pro Ser Arg Ile Leu Gly 4805 4810 4815 Ala Cys Val Phe Val Asp Asp Val Asp Lys Thr Glu Pro Val Ala 4820 4825 4830 Val Met Glu Arg Tyr Val Ala Leu Ala Ile Asp Ala Tyr Pro Leu 4835 4840 4845 Val Tyr His Glu Asn Glu Glu Tyr Lys Lys Val Phe Tyr Val Leu 4850 4855 4860 Leu Ser Tyr Ile Arg Lys Leu Tyr Gln Glu Leu Ser Lys Asn Met 4865 4870 4875 Leu Thr Asp Tyr Ser Phe Val Leu Asp Ile Asp Lys Gly Ser Lys 4880 4885 4890 Phe Trp Glu Glu Glu Phe Tyr Ser Asn Met Tyr Arg Ala Pro Thr 4895 4900 4905 Thr Leu Gln Ser Cys Gly Val Cys Val Val Cys Gln Ser Gln Thr 4910 4915 4920 Ile Leu Arg Cys Gly Asn Cys Val Arg Lys Pro Phe Leu Cys Cys 4925 4930 4935 Lys Cys Cys Tyr Asp His Val Met Asn Thr Asn His Lys Asn Val 4940 4945 4950 Leu Ser Ile Asn Pro Tyr Ile Cys Thr His Pro Gly Cys Gly Glu 4955 4960 4965 Ala Asp Val Thr Lys Leu Tyr Leu Gly Gly Met Ser Tyr Phe Cys 4970 4975 4980 Val Asn His Lys Pro Arg Leu Ser Ile Pro Leu Val Ser Asn Gly 4985 4990 4995 Thr Val Phe Gly Ile Tyr Arg Ala Asn Cys Ala Gly Ser Glu Asn 5000 5005 5010 Val Asp Asp Phe Asn Gln Leu Ala Thr Thr Asn Trp Ser Thr Val 5015 5020 5025 Glu Pro Tyr Ile Leu Ala Asn Ser Cys Ser Asp Thr Leu Arg Arg 5030 5035 5040 Phe Ala Ala Glu Thr Val Lys Ala Thr Glu Glu Leu His Lys Gln 5045 5050 5055 Gln Tyr Ala Ser Ala Glu Val Lys Glu Val Leu Ser Asp Lys Glu 5060 5065 5070 Leu Ile Leu Ser Trp Glu Pro Asn Lys Ala Arg Pro Pro Leu Asn 5075 5080 5085 Arg Asn Tyr Val Phe Thr Gly Phe His Phe Thr Arg Asn Ser Lys 5090 5095 5100 Val Gln Leu Gly Asp Phe Thr Phe Glu Lys Gly Asp Gly Lys Asp 5105 5110 5115 Val Val Phe Tyr Lys Ala Thr Ser Thr Ala Lys Leu Ser Val Gly 5120 5125 5130 Asp Ile Phe Val Leu Thr Ser His Asn Val Val Ser Leu Thr Ala 5135 5140 5145 Pro Thr Leu Cys Pro Gln Gln Thr Phe Ser Arg Phe Val Asn Leu 5150 5155 5160 His Pro Asn Val Met Val Pro Glu Cys Phe Val Asn Asn Ile Pro 5165 5170 5175 Leu Tyr His Leu Val Gly Lys Gln Lys Arg Thr Thr Val Gln Gly 5180 5185 5190 Pro Pro Gly Ser Gly Lys Ser His Phe Ala Ile Gly Leu Ala Ala 5195 5200 5205 Tyr Phe Ser Asn Ala Arg Val Val Phe Thr Ala Cys Ser His Ala 5210 5215 5220 Ala Val Asp Ala Leu Cys Glu Lys Ala Phe Lys Phe Leu Lys Ile 5225 5230 5235 Asp Asp Cys Thr Arg Ile Val Pro Gln Arg Ala Thr Val Glu Cys 5240 5245 5250 Phe Ser Lys Phe Lys Pro Asn Asp Thr Gly Lys Lys Tyr Ile Phe 5255 5260 5265 Ser Thr Ile Asn Ala Leu Pro Glu Val Ser Cys Asp Ile Leu Leu 5270 5275 5280 Val Asp Glu Ile Ser Met Leu Thr Asn Tyr Asp Leu Ser Phe Val 5285 5290 5295 Asn Gly Lys Ile Asn Tyr Gln Tyr Val Val Tyr Val Gly Asp Pro 5300 5305 5310 Ala Gln Leu Pro Ala Pro Arg Thr Leu Leu Asn Gly Ser Leu Ser 5315 5320 5325 Pro Lys Asp Tyr Asn Val Val Thr Asn Leu Met Val Cys Val Lys 5330 5335 5340 Pro Asp Ile Phe Leu Ala Lys Cys Tyr Arg Cys Pro Lys Glu Ile 5345 5350 5355 Val Asp Thr Val Ser Ser Leu Val Tyr Asp Gly Lys Phe Ile Ala 5360 5365 5370 Asn Asn Pro Glu Ser Arg Gln Cys Phe Lys Val Val Val Asn Lys 5375 5380 5385 Gly Asn Ser Asp Val Gly His Glu Ser Gly Ser Ala Tyr Asn Met 5390 5395 5400 Thr Gln Leu Glu Phe Val Lys Asp Phe Ile Ser Arg Asn Lys Glu 5405 5410 5415 Trp Lys Gly Ala Thr Phe Ile Ser Pro Tyr Asn Ala Met Asn Gln 5420 5425 5430 Arg Ala Tyr Arg Met Leu Gly Leu Ser Val Gln Thr Val Asp Ser 5435 5440 5445 Ser Gln Gly Ser Glu Tyr Asp Tyr Val Ile Phe Cys Val Thr Ala 5450 5455 5460 Asp Ser Ala His Ala Leu Asn Ile Asn Arg Phe Asn Val Ala Leu 5465 5470 5475 Thr Arg Ala Lys Ile Gly Ile Leu Val Val Met Arg Gln Arg Asp 5480 5485 5490 Glu Leu Tyr Asn Ala Leu Arg Phe Val Glu Leu Asp Ser Asn Val 5495 5500 5505 Ala Leu Gln Ser Thr Gly Leu Phe Lys Ile Cys Asn Lys Glu Phe 5510 5515 5520 Ser Gly Val Ser Pro Ala Tyr Ala Val Thr Thr Lys Ala Leu Ser 5525 5530 5535 Ala Thr Tyr Lys Val Asn Asp Glu Leu Ala Ala Leu Val Asn Val 5540 5545 5550 Glu Ala Gly Ser Gln Ile Pro Tyr Lys His Leu Ile Ser Leu Leu 5555 5560 5565 Gly Phe Lys Met Ser Val Asn Val Glu Gly Cys His Asn Met Phe 5570 5575 5580 Ile Thr Arg Asp Ala Ala Ile Arg Asn Val Arg Gly Trp Val Gly 5585 5590 5595 Phe Asp Val Glu Ala Thr His Ala Cys Gly Pro Asn Ile Gly Thr 5600 5605 5610 Asn Leu Pro Phe Gln Val Gly Phe Ser Thr Gly Ala Asp Phe Val 5615 5620 5625 Val Thr Pro Glu Gly Leu Ile Asp Thr Pro Thr Gly Asn Asn Phe 5630 5635 5640 Glu Pro Val Asn Ser Lys Ala Pro Pro Gly Glu Gln Phe Asn His 5645 5650 5655 Leu Arg Thr Leu Phe Arg Ser Ala Lys Pro Trp Thr Val Ile Arg 5660 5665 5670 Pro Arg Ile Val Gln Met Leu Ala Asp Asn Leu Asn Asn Val Ser 5675 5680 5685 Asp Cys Val Val Phe Val Thr Trp Cys His Gly Leu Glu Leu Thr 5690 5695 5700 Thr Leu Arg Tyr Phe Val Lys Ile Gly Ala Glu Glu Val Cys Ser 5705 5710 5715 Cys Gly Ala Arg Ala Thr Thr Phe Asn Ser Ser Thr Leu Ala Tyr 5720 5725 5730 Ala Cys Trp Lys His Cys Leu Gly Phe Asp Phe Val Tyr Asn Pro 5735 5740 5745 Phe Ile Ile Asp Ile Gln Gln Trp Gly Tyr Ser Gly Asn Leu Gln 5750 5755 5760 Ser Asn His Asp Leu Tyr Cys Asp Val His Gly Arg Ala His Val 5765 5770 5775 Ala Ser Ala Asp Ala Ile Met Thr Arg Cys Leu Ala Ile Asn Asn 5780 5785 5790 Ala Phe Cys Gln Asp Val Asn Trp Asp Ile Thr Tyr Pro His Ile 5795 5800 5805 Ala Asn Glu Asp Glu Val Asn Ser Ser Cys Arg Phe Leu Gln Arg 5810 5815 5820 Met Tyr Phe Asn Ala Cys Val Asp Ala Leu Lys Val Lys Val Val 5825 5830 5835 Tyr Asp Ile Gly Asn Pro Lys Gly Ile Lys Cys Val Arg Arg Gly 5840 5845 5850 Asp Val Thr Phe Lys Phe Phe Asp Lys Asn Pro Ile Val Pro Asn 5855 5860 5865 Val Lys Gln Phe Cys Tyr Asp Tyr Asp Gln His Lys Asp Arg Phe 5870 5875 5880 Val Asp Gly Leu Cys Met Phe Trp Asn Cys Asn Val Asp Cys Tyr 5885 5890 5895 Pro Asp Asn Ser Leu Val Cys Arg Tyr Asp Thr Arg Asn Leu Ser 5900 5905 5910 Val Phe Asn Leu Pro Gly Cys Asn Gly Gly Ser Leu Tyr Val Asn 5915 5920 5925 Lys His Ala Phe His Thr Pro Lys Phe Asp Arg Ile Ser Phe Arg 5930 5935 5940 Asn Leu Lys Ala Met Pro Phe Phe Phe Tyr Asp Ala Ser Pro Cys 5945 5950 5955 Asp Thr Val Gln Val Asp Gly Val Ala Gln Asp Leu Val Ser Leu 5960 5965 5970 Ser Thr Lys Asp Cys Ile Thr Lys Cys Asn Ile Gly Gly Ala Val 5975 5980 5985 Cys Lys Lys His Ala Gln Met Tyr Ala Glu Phe Val Thr Ser Tyr 5990 5995 6000 Asn Ala Ala Val Thr Ala Gly Phe Thr Phe Trp Val Thr Asn Gln 6005 6010 6015 Phe Asn Pro Tyr Asn Leu Trp Lys Leu Phe Ser Ser Leu Gln Ser 6020 6025 6030 Ile Asp Asn Ile Ala Tyr Asn Met Tyr Lys Arg Gly His Tyr Asp 6035 6040 6045 Ala Val Val Gly Glu Ile Pro Thr Val Val Thr Gly Asp Lys Val 6050 6055 6060 Phe Val Ile Asp Lys Gly Val Glu Lys Ala Val Phe Val Asn Gln 6065 6070 6075 Ser Thr Leu Pro Thr Ser Val Ala Phe Glu Leu Phe Ala Lys Arg 6080 6085 6090 Asn Ile Arg Thr Leu Pro Asn Asn Arg Ile Leu Ser Gly Leu Gly 6095 6100 6105 Val Asp Ile Ala Tyr Lys Phe Val Ile Trp Asp Tyr Thr Asn Gln 6110 6115 6120 Thr Pro Leu Tyr Arg Asn Thr Val Asn Val Cys Pro Tyr Thr Asp 6125 6130 6135 Ile Glu Pro Lys Gly Leu Val Val Leu Tyr Asp Asp Arg Asn Gly 6140 6145 6150 Asp Tyr Gln Ser Phe Leu Ala Ala Asp Asp Ala Val Leu Val Ser 6155 6160 6165 Thr Gln Cys Tyr Lys Arg Tyr Pro Tyr Ala Glu Ile Pro Ser His 6170 6175 6180 Leu Leu Ala Gln Asn Gly Leu Pro Leu Lys Asp Gly Ala Asn Leu 6185 6190 6195 Tyr Val Tyr Lys Arg Ser Lys Gly Met Phe Val Thr Leu Pro Glu 6200 6205 6210 Thr Leu Asn Thr Gln Gly Arg Ser Tyr Glu Thr Phe Glu Pro Arg 6215 6220 6225 Ser Asp Val Glu Arg Glu Phe Leu Ser Leu Ser Glu Gln Asp Phe 6230 6235 6240 Val Val Lys Tyr Gly Lys Asp Leu Gly Leu Glu His Ile Leu Tyr 6245 6250 6255 Gly Glu Val Asp Lys Pro Gln Leu Gly Gly Leu His Thr Val Ile 6260 6265 6270 Gly Met Tyr Arg Leu Leu Arg Asp Asn Lys Leu Ser Ala Lys Ser 6275 6280 6285 Val Thr Asp Ser Asp Cys Glu Val Met Gln Asn Tyr Phe Val Leu 6290 6295 6300 Ala Asp Asn Gly Ser Tyr Lys Gln Val Cys Thr Val Val Asp Leu 6305 6310 6315 Leu Leu Asp Asp Phe Leu Asp Leu Leu Arg Asn Ile Leu Gln Glu 6320 6325 6330 Tyr Gly Ser Gly Lys Ser Lys Val Val Thr Val Pro Ile Asp Tyr 6335 6340 6345 His Asn Ile Ser Phe Met Thr Trp Phe Glu Asn Gly Ser Ile Lys 6350 6355 6360 Thr Cys Tyr Pro Gln Leu Gln Ser Ala Trp Lys Cys Gly Tyr Asn 6365 6370 6375 Leu Pro Glu Leu Tyr Lys Val Gln Thr Cys Val Met Glu Pro Cys 6380 6385 6390 Asn Ile Pro Asn Tyr Gly Val Gly Ile Met Leu Pro Asp Gly Ile 6395 6400 6405 Met Met Asn Val Ala Lys Tyr Thr Gln Leu Cys Gln Tyr Leu Ser 6410 6415 6420 Lys Thr Thr Met Cys Val Pro His Asn Met Arg Val Met His Phe 6425 6430 6435 Gly Ala Gly Ser Asp Lys Gly Val Ala Pro Gly Thr Thr Val Leu 6440 6445 6450 Lys Gln Trp Leu Pro Glu Gly Thr Leu Leu Val Asp Asn Asp Ile 6455 6460 6465 Asp Ser Tyr Val Ser Asp Ala His Val Ser Val Ile Asp Asp Cys 6470 6475 6480 Asn Lys Phe Arg Thr Glu His Lys Phe Asp Leu Val Ile Ser Asp 6485 6490 6495 Met Tyr Thr Asp Asn Asp Ser Lys Lys Lys His Glu Gly Lys Val 6500 6505 6510 Ala Asn Asn Gly Asn Thr Asp Val Phe Met Tyr Leu Thr Asn Phe 6515 6520 6525 Leu Arg Asn Asn Leu Ala Leu Gly Gly Ser Phe Ala Val Lys Ile 6530 6535 6540 Thr Glu Thr Ser Trp Tyr Glu Gly Leu Tyr Glu Ile Ala Gln Asp 6545 6550 6555 Cys Ser Trp Trp Thr Leu Phe Cys Thr Ala Val Asn Ala Ser Ser 6560 6565 6570 Ser Glu Ala Phe Leu Val Gly Val Asn Tyr Leu Gly Glu Ser Glu 6575 6580 6585 Lys His Lys Ile Ser Gly Arg Thr Leu His Ala Asn Tyr Ile Phe 6590 6595 6600 Trp Arg Asn Val Ser Tyr Leu Gln Thr Ser Ala Phe Thr Ile Phe 6605 6610 6615 Asp Val Ala Lys Phe Gly Leu Lys Thr Lys Ala Thr Pro Val Val 6620 6625 6630 Asn Leu Lys Lys Glu Leu Gln Thr Asp Leu Val Leu Asn Leu Ile 6635 6640 6645 Arg Asn Gly Lys Leu Val Val Arg Asp Val Gly Asn Val Gly Phe 6650 6655 6660 Val Asp Asp Ser Phe Val Cys Ala His 6665 6670 <210> 252 <211> 1180 <212> PRT <213> Avian coronavirus <400> 252 Met Leu Gly Met Leu Ala Thr Leu Val Leu Leu Thr Thr Val Leu Phe 1 5 10 15 Val Pro Ile Asn Ser Leu Ser Gly Asp Asn Trp Val Tyr Tyr Tyr Pro 20 25 30 Ser Ala Phe Arg Pro Ser Asn Gly Trp His Lys Gln Glu Gly Ala Tyr 35 40 45 Ser Val Val Gly Ile Gln Ser Thr Asn Val Thr Gly Asn Ser Ala Gly 50 55 60 Cys Pro Tyr Met Phe Asn Thr Thr Ser Gln Leu Ile Ala Ser Asp Ala 65 70 75 80 Val Ala Ile Met Ser Lys Phe Pro Thr Thr Trp Thr Asn Asn Asn Gly 85 90 95 Gln Ile Tyr Val His Met Ile Gly Cys Thr Met Ala Asn His Thr Phe 100 105 110 Tyr Val Trp Gly Pro Leu Lys Ser Gly Asn Ser Arg Pro Gly Val Pro 115 120 125 Asn Gly Leu Leu Phe Gln Val Tyr Ser Ser Asn Phe Thr Leu Leu Tyr 130 135 140 Asn Lys Thr Trp Leu Gly Trp Lys Glu His Thr Arg Phe Glu Ser Leu 145 150 155 160 Gln Cys Val Ser Leu Phe Gly Ser Val Tyr Phe Asn Gly Asp Leu Ile 165 170 175 Tyr Gln Leu Gly Tyr Asn Ala Gln Val Gln Asn Val Ser Phe Val Tyr 180 185 190 Cys Gly Thr Val Thr Gly Tyr Tyr Tyr Phe Ser Lys Gln Phe Gln Ser 195 200 205 Leu Val Tyr Phe Gln Asn Gly Thr Ala Leu Asp Leu Ile Leu Cys Asp 210 215 220 Asp Thr Pro Arg Gly Ile Leu Ala Cys Gln Tyr Gly Thr Gly Asn Phe 225 230 235 240 Thr Asp Gly Leu Tyr Pro Phe Thr His Ser Ser Val Val Asn Lys Thr 245 250 255 Leu Glu Val Tyr Leu Thr Asn Ser Val Val Asn Asn Thr Val Tyr Gly 260 265 270 Gln Leu Val Asn Val Thr Phe Tyr Asn Gln Thr Asn Val Gln Val Gly 275 280 285 Asn Leu Ser Gly Ser Gln Leu Gly Asn Leu Asn Gln Leu Arg Leu Tyr 290 295 300 Gln Asp Lys Val Phe Asp Ala Pro Tyr Tyr Asn Leu Asn Phe Ser Phe 305 310 315 320 Leu Asp Ser Pro Asp Phe Glu Phe Arg Pro Gln Gly Gly Gly Trp Thr 325 330 335 Pro Glu Ala Asp Ser Gln Phe Thr Gln Cys Pro Phe Thr Ile Asn Ser 340 345 350 Ile Asn Asn Gly His Cys Phe Asn Ser Leu Arg Val Ala Ile Thr Tyr 355 360 365 Val Pro Gly Tyr Arg Gly Cys Tyr Tyr Ala Met Arg His Phe Gly Ala 370 375 380 Gln Cys Cys Tyr Met Tyr Tyr Met Asn Asn Gln Pro Leu Cys Ala Gly 385 390 395 400 Ile Asp Pro Val Glu Tyr Asn Arg Thr Trp Arg Cys Ala Leu Ala Val 405 410 415 Leu Val Phe Met Gln Ser Gly Ser Arg Ile Cys Thr Ser Glu Thr Val 420 425 430 Pro Ile Asn Thr Val Ser Thr Val Leu Asn Asn Thr Phe Val Leu Asp 435 440 445 Thr Cys Val Asn Tyr Thr Ile Tyr Ser Arg Tyr Gly Val Gly Leu Val 450 455 460 Thr Asn Val Thr Asp Gln Val Thr Pro Gly Thr Phe Leu Asn Asp Gly 465 470 475 480 Gly Leu Val Val Leu Asp Ser Ser Gly Ala Ile Asp Ile Phe Ala Val 485 490 495 Asn Glu Val Val Gly Arg His Tyr Phe Lys Val Asn Pro Cys Ser Asp 500 505 510 Val Asn Gln Gln Tyr Val Val Ser Gly Gly Asn Ile Val Gly Arg Leu 515 520 525 Thr Ser Val Asn Glu Ser Gly Ser Gln Phe Leu Asp Asn Gln Tyr Tyr 530 535 540 Val Pro Leu Ile Asn Ser Thr Arg Ser Lys Arg Ser Val Gln Asn Ser 545 550 555 560 Thr Val Thr Ser Cys Ala Tyr Val Ser Tyr Gly Gln Tyr Cys Ile Lys 565 570 575 Pro Asp Ala Ser Val Val Gln Ile Gln Pro Asp Thr Phe Asp Gly Phe 580 585 590 Val Thr Pro Leu Leu Asn Ala Thr Glu Tyr Val Leu Ile Pro Asp Ser 595 600 605 Phe Asn Leu Thr Val Thr Asp Glu Tyr Ile Gln Thr Arg Met Glu Gln 610 615 620 Ile Gln Ile Asn Cys Ile Gln Tyr Val Cys Gly Ser Ser Val Gln Cys 625 630 635 640 Arg Gln Leu Phe Gln Gln Tyr Gly Ser Val Cys Asp Asn Ile Leu Ser 645 650 655 Ile Val Asn Gly Leu Ala Gln Gln Asp Asn Ala Glu Leu Ile Ser Leu 660 665 670 Tyr Ser Ser Thr Gln Pro Gly Gln Asn Tyr Pro Pro Val Phe Asn Asn 675 680 685 Leu Asp Thr Gly Gly Phe Asn Ile Ser Leu Leu Leu Pro Gln Asn Lys 690 695 700 Ser Gly Val Gln Ser Arg Ser Phe Ile Glu Asp Leu Leu Phe Thr Lys 705 710 715 720 Ile Glu Ser Val Gly Leu Pro Thr Asp Ala Glu Tyr Gln Lys Cys Thr 725 730 735 Ser Gly Leu Leu Gly Trp Val Lys Asp Leu Val Cys Ala Gln Tyr Tyr 740 745 750 Asn Gly Ile Met Val Leu Pro Pro Val Ile Thr Asn Glu Met Gln Phe 755 760 765 Met Tyr Thr Ser Ser Leu Val Ala Ser Met Ala Phe Gly Gly Leu Thr 770 775 780 Ser Ala Gly Ala Ile Pro Phe Ala Thr Gln Val Gln Ala Arg Ile Asn 785 790 795 800 His Leu Gly Ile Thr Gln Thr Leu Leu Leu Lys Asn Gln Glu Leu Leu 805 810 815 Ala Asn Ser Phe Asn Asn Ala Leu Gln Tyr Met Gln Gln Gly Phe Glu 820 825 830 Ala Thr Ser Gln Ala Leu Gln Gln Ile Gln Asp Val Val Asn Gln Gln 835 840 845 Ala Ala Val Leu Thr Glu Val Met Ser Ser Leu Asn Lys Asn Phe Gly 850 855 860 Ala Ile Ser Ser Val Ile Gln Asp Ile Tyr Lys Gln Leu Asp Glu Leu 865 870 875 880 Ser Ala Asn Ala Gln Val Asp Arg Leu Ile Thr Gly Arg Leu Ser Ser 885 890 895 Leu Ser Val Leu Ala Ser Ser Lys Gln Ala Glu Tyr Leu Arg Val Ala 900 905 910 Gln Gln Arg Gln Leu Ala Gln Asp Lys Ile Asn Glu Cys Val Arg Ser 915 920 925 Gln Ser Thr Arg Asn Ser Phe Cys Gly Asn Gly Met His Val Leu Ser 930 935 940 Ile Pro Gln Ser Ala Pro Asn Gly Ile Ala Phe Ile His Phe Thr Tyr 945 950 955 960 Thr Pro Gln Thr Tyr Lys Asn Val Thr Ala Val Val Gly Phe Cys Val 965 970 975 Thr Thr Asn Gly Ser Gly Tyr Gly Leu Val Pro Val Asn Gly Arg Gly 980 985 990 Ile Phe Ile Tyr Val Asp Asp Ala Tyr Tyr Ile Thr Ser Arg Asp Met 995 1000 1005 Tyr Met Pro Arg Asn Ile Thr Ser Gly Asp Val Val Val Leu Thr 1010 1015 1020 Ser Cys Gln Ala Asn Tyr Val Thr Val Asn Arg Thr Val Val Thr 1025 1030 1035 Thr Phe Val Asp Asp Asp Phe Asp Phe Asp Asp Glu Phe Glu Lys 1040 1045 1050 Trp Trp Asn Gln Thr Asp His Val Ile Pro Asp Leu Asp Glu Phe 1055 1060 1065 Asn Tyr Thr Ile Pro Ile Leu Asp Ile Asn Asn Glu Ile Asp Arg 1070 1075 1080 Ile Gln Gln Ala Ile Gln Gly Leu Asn Gln Ser Tyr Val Asp Leu 1085 1090 1095 Glu Ser Leu Ser Ile Leu Thr Thr Tyr Ile Lys Trp Pro Trp Tyr 1100 1105 1110 Val Trp Leu Ala Ile Ala Phe Ala Thr Ile Ile Phe Ile Leu Ile 1115 1120 1125 Leu Cys Trp Ile Phe Phe Met Thr Gly Cys Cys Gly Cys Cys Cys 1130 1135 1140 Gly Cys Phe Gly Leu Ile Pro Leu Met Ser Lys Cys Arg Lys Lys 1145 1150 1155 Ser Ser Tyr Tyr Thr Thr Phe Asp Asp Asp Ile Val Gly Glu Gln 1160 1165 1170 Ile Arg Pro Lys Lys Ser Val 1175 1180 <210> 253 <211> 101 <212> PRT <213> Avian coronavirus <400> 253 Met Ala Pro Lys Lys Phe Phe Val Arg Cys Tyr Lys Arg Ile Arg Ser 1 5 10 15 Leu Phe Arg Ser Arg Asn Ser Ser Ser Arg Ile Glu Asp Tyr Leu Leu 20 25 30 Gly Ser Ser Leu Thr Val Ser Cys Phe Asn Glu Val Cys Phe Cys Met 35 40 45 Gln Pro Glu Cys Ser Val Cys Asn Val Thr Cys Asp Cys Cys Gly Gly 50 55 60 Cys Gly Asp Trp Leu Cys Lys Thr Cys Asn Tyr Ile Pro Leu Asn Asn 65 70 75 80 Phe Asp Ala Asp Ala Tyr Ile Leu Lys His Gln Gln Ser Met Ile Asn 85 90 95 Leu Val Leu Gln Leu 100 <210> 254 <211> 101 <212> PRT <213> Avian coronavirus <400> 254 Met Leu Ala Ile Ile Glu Asn Gly Phe Lys Thr Val Cys Leu Ala Gly 1 5 10 15 Val Val Phe Val Thr Ile Asp Ala Leu Leu Ser Thr Ser Leu Ser Gly 20 25 30 Leu Gln Phe Gln His Val Met Leu Glu Arg Gly Glu Asp Ala Met Cys 35 40 45 Asp Ala Ser Arg Ile Ala His Leu Ile Ser Leu Leu Ala Asp Cys Arg 50 55 60 Val Tyr Asp Pro Phe Ala Glu Ala Phe Tyr Cys Asn Gly Ser Phe Trp 65 70 75 80 Glu Val Asp Ser Met Glu Glu Asp Gly Ser Ile Leu Thr Ser Asp Ser 85 90 95 Asp Ile Asp Leu Tyr 100 <210> 255 <211> 100 <212> PRT <213> Avian coronavirus <400> 255 Met Asp Ile Leu Ser Lys Ser Val Glu Asp Asn Gly Ala Phe Leu Thr 1 5 10 15 Ala Val Tyr Val Phe Val Gly Phe Ile Ala Leu Tyr Leu Leu Gly Arg 20 25 30 Ala Leu Gln Ala Phe Thr Gln Ala Ala Asp Ala Cys Phe Leu Phe Trp 35 40 45 Tyr Thr Trp Phe Ala Leu Pro Thr Gly Arg Gly Ile Ala Phe Val Tyr 50 55 60 Arg Asn Thr Tyr Gly Arg Lys Ile Asn Asn Pro Glu Leu Glu Ala Val 65 70 75 80 Ile Val Asn Gln Phe Pro Lys Asn Gly Pro Asn Asn Lys Leu Pro Ala 85 90 95 Asn Phe Ala Ser 100 <210> 256 <211> 226 <212> PRT <213> Avian coronavirus <400> 256 Met Ser Asn Asp Ser Ala Asn Cys Thr Leu Gly Tyr Glu Glu Ala Val 1 5 10 15 Trp Val Phe Lys Glu Tyr Asn Leu Phe Leu Thr Ala Phe Leu Leu Phe 20 25 30 Met Ser Met Ile Leu Gln Tyr Gly Tyr Ala Thr Arg Ser Arg Phe Met 35 40 45 Tyr Val Ile Lys Met Ile Val Leu Trp Leu Phe Trp Pro Leu Asn Ile 50 55 60 Ala Val Gly Val Ile Ser Cys Ile Tyr Pro Val Gly Thr Gly Gly Leu 65 70 75 80 Val Ala Ala Ile Val Leu Thr Ile Phe Ala Cys Leu Ser Phe Val Gly 85 90 95 Tyr Trp Val Gln Ser Ile Arg Leu Phe Lys Arg Cys Lys Ser Phe Trp 100 105 110 Ala Phe Asn Pro Glu Ser Asp Ala Val Gly Ser Ile Ser Leu Thr Thr 115 120 125 Gly Gln Thr Cys Thr Phe Ser Ile Glu Ser Val Pro Met Val Leu Ser 130 135 140 Pro Ile Ile Lys Ala Gly Val Leu Tyr Cys Glu Gly Gln Trp Leu Ala 145 150 155 160 Lys Cys Thr Pro Ser Glu Val Pro Gln His Ile Tyr Val Cys Thr Pro 165 170 175 Asp Arg Arg Asn Val Tyr Lys Arg Val Ala Ala Tyr Ser Gly Asp Asn 180 185 190 Lys Ala Asn Lys Lys Ser Phe Ala Thr Phe Val Phe Thr Lys Glu Ser 195 200 205 Val Asp Ser Gly Asp Leu Asp Ser Val Ala Thr Ser Gly Gly Ser Leu 210 215 220 Tyr Ser 225 <210> 257 <211> 65 <212> PRT <213> Avian coronavirus <400> 257 Met Ser Phe Cys Ser Arg Phe Thr Lys Ala Thr Ile Ser Phe Tyr Lys 1 5 10 15 Ser Leu Leu Leu Phe Glu Leu Arg Val Leu Asp Lys Phe Ile Leu Asn 20 25 30 Tyr Gly Pro Thr Cys Phe Leu Leu Ser Cys Lys Arg Phe Leu Leu Phe 35 40 45 Gln Val Asn Ile Leu Tyr Arg Leu Val Phe Thr Pro Lys Asn Ser Leu 50 55 60 Val 65 <210> 258 <211> 89 <212> PRT <213> Avian coronavirus <400> 258 Met Asn Asn Pro Phe Ser Thr Ala Thr Ala Arg Lys Ala Arg Val Phe 1 5 10 15 Ile Arg Gly Gly Leu Asn Ser Val Phe Phe Leu Asn Glu Lys Gly Gln 20 25 30 Pro Glu Val Cys Pro Phe Cys Thr Ala Leu Val Ala Arg Gly Gln Leu 35 40 45 Cys Gln Glu His Leu Phe Asn Asn Asn Ile Leu Ser Trp His Arg Val 50 55 60 Thr Arg Leu Ser Gln Lys Ile Arg Pro Met Arg Gln His Gln Cys Ser 65 70 75 80 Ser Trp Glu Val Gln His His Leu Lys 85 <210> 259 <211> 418 <212> PRT <213> Avian coronavirus <400> 259 Met Ala Ser Arg Asp Ala Ser Lys Ser Lys Asn Lys Thr Asp Ala Pro 1 5 10 15 Ala Pro Val Leu Lys Leu Gly Gly Pro Ala Pro Pro Lys Ile Gly Ser 20 25 30 Ser Gly Thr Ala Ser Trp Phe Gln Pro Ile Lys Glu Lys Lys Met Thr 35 40 45 His Asn Pro Pro Thr Phe Thr Gly Ser Gly Val Pro Glu Asn Asp Asn 50 55 60 Val Lys Lys Pro Ala Arg His Gly Tyr Trp Lys Arg Gln Arg Arg Tyr 65 70 75 80 Lys Pro Gly Lys Gly Lys Arg Thr Pro Val Thr Asp Ala Trp Tyr Phe 85 90 95 Tyr Tyr Thr Gly Thr Gly Pro Phe Ala Asp Leu Lys Trp Gly Gln Pro 100 105 110 His Asp Asp Ile Val Trp Val Ala Val Asp Gly Ala Asp Val Asp Ala 115 120 125 Lys Ser Gly Gln Gly Thr Arg Asp Pro Asp Lys Phe Asp Gln Phe Pro 130 135 140 Leu Arg Phe Ala Glu Gly Gly Pro Asp Asp Asn Phe Arg Trp Asp Phe 145 150 155 160 Ile Pro Val Gly Gly Arg Gly Arg Ser Gly Arg Ser Ser Val Ala Thr 165 170 175 Ser Arg Glu Ser Ser Arg Pro Gly Ser Arg Glu Gly Ser Arg Gly Arg 180 185 190 Arg Gln Met Gly Pro Asn Glu Asp Leu Ile Ala Arg Ala Ala Arg Ile 195 200 205 Ile Glu Glu Gln Gln Lys Arg Gly Gly Arg Ile Thr Lys Ala Lys Ala 210 215 220 Asn Glu Met Ala Glu Arg Arg Tyr Cys Lys Arg Thr Leu Ala Pro Gly 225 230 235 240 Lys Thr Val Asp Gln Val Phe Gly Thr Arg Gln Lys Gly Arg Glu Arg 245 250 255 Asn Phe Gly Asp Asp Arg Met Val Glu Glu Gly Ile Arg Asp Gly Arg 260 265 270 Thr Thr Ala Met Leu Asn Leu Ile Pro Ser Ser His Ala Met Leu Phe 275 280 285 Gly Ser His Val Gln Ala Lys Leu Gln Pro Glu Gly Leu Leu Val Thr 290 295 300 Phe Ser Phe Thr Thr Val Val Pro Arg Asp Asp Pro Gln Phe Glu Asn 305 310 315 320 Tyr Arg Gln Ile Cys Asp Glu Cys Val Asp Gly Val Gly Thr Arg Pro 325 330 335 Lys Asn Glu Pro Lys Pro Arg Ser Arg Ser Ser Ser Lys Pro Ala Ser 340 345 350 Arg Ala Ala Ser Pro Ala Pro Lys Gln Gln Arg Pro Lys Lys Glu Lys 355 360 365 Lys Pro Lys Asn Gln Asp Lys Asp Lys Thr Asp Gly Ala Met Ser Gln 370 375 380 Glu Glu Lys Ala Val Asn Asp Gln Leu Glu Phe Asp Asp Ala Asp Gln 385 390 395 400 Gly Met Pro Asp Lys Ile Asp Trp Gly Ser Ser Ala Leu Gly Asp Thr 405 410 415 Glu Ile <210> 260 <211> 7096 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <220> <221> MOD_RES <222> (6969)..(6972) <223> Any amino acid <220> <221> MOD_RES <222> (6980)..(6980) <223> Any amino acid <220> <221> MOD_RES <222> (6984)..(6995) <223> Any amino acid <220> <221> MOD_RES <222> (7002)..(7006) <223> Any amino acid <220> <221> MOD_RES <222> (7008)..(7010) <223> Any amino acid <220> <221> MOD_RES <222> (7018)..(7031) <223> Any amino acid <400> 260 Met Glu Ser Leu Val Pro Gly Phe Asn Glu Lys Thr His Val Gln Leu 1 5 10 15 Ser Leu Pro Val Leu Gln Val Arg Asp Val Leu Val Arg Gly Phe Gly 20 25 30 Asp Ser Val Glu Glu Val Leu Ser Glu Ala Arg Gln His Leu Lys Asp 35 40 45 Gly Thr Cys Gly Leu Val Glu Val Glu Lys Gly Val Leu Pro Gln Leu 50 55 60 Glu Gln Pro Tyr Val Phe Ile Lys Arg Ser Asp Ala Arg Thr Ala Pro 65 70 75 80 His Gly His Val Met Val Glu Leu Val Ala Glu Leu Glu Gly Ile Gln 85 90 95 Tyr Gly Arg Ser Gly Glu Thr Leu Gly Val Leu Val Pro His Val Gly 100 105 110 Glu Ile Pro Val Ala Tyr Arg Lys Val Leu Leu Arg Lys Asn Gly Asn 115 120 125 Lys Gly Ala Gly Gly His Ser Tyr Gly Ala Asp Leu Lys Ser Phe Asp 130 135 140 Leu Gly Asp Glu Leu Gly Thr Asp Pro Tyr Glu Asp Phe Gln Glu Asn 145 150 155 160 Trp Asn Thr Lys His Ser Ser Gly Val Thr Arg Glu Leu Met Arg Glu 165 170 175 Leu Asn Gly Gly Ala Tyr Thr Arg Tyr Val Asp Asn Asn Phe Cys Gly 180 185 190 Pro Asp Gly Tyr Pro Leu Glu Cys Ile Lys Asp Leu Leu Ala Arg Ala 195 200 205 Gly Lys Ala Ser Cys Thr Leu Ser Glu Gln Leu Asp Phe Ile Asp Thr 210 215 220 Lys Arg Gly Val Tyr Cys Cys Arg Glu His Glu His Glu Ile Ala Trp 225 230 235 240 Tyr Thr Glu Arg Ser Glu Lys Ser Tyr Glu Leu Gln Thr Pro Phe Glu 245 250 255 Ile Lys Leu Ala Lys Lys Phe Asp Ile Phe Asn Gly Glu Cys Pro Asn 260 265 270 Phe Val Phe Pro Leu Asn Ser Ile Ile Lys Thr Ile Gln Pro Arg Val 275 280 285 Glu Lys Lys Lys Leu Asp Gly Phe Met Gly Arg Ile Arg Ser Val Tyr 290 295 300 Pro Val Ala Ser Pro Asn Glu Cys Asn Gln Met Cys Leu Ser Thr Leu 305 310 315 320 Met Lys Cys Asp His Cys Gly Glu Thr Ser Trp Gln Thr Gly Asp Phe 325 330 335 Val Lys Ala Thr Cys Glu Phe Cys Gly Thr Glu Asn Leu Thr Lys Glu 340 345 350 Gly Ala Thr Thr Cys Gly Tyr Leu Thr Gln Asn Ala Val Val Lys Ile 355 360 365 Tyr Cys Pro Ala Cys His Asn Ser Glu Val Gly Pro Glu His Ser Leu 370 375 380 Ala Glu Tyr His Asn Glu Ser Gly Leu Lys Thr Ile Leu Arg Lys Gly 385 390 395 400 Gly Arg Thr Ile Ala Phe Gly Gly Cys Val Phe Ser Tyr Val Gly Cys 405 410 415 His Asn Lys Cys Ala Tyr Trp Val Pro Arg Ala Ser Ala Asn Ile Gly 420 425 430 Cys Asn His Thr Gly Val Val Gly Glu Gly Ser Glu Gly Leu Asn Asp 435 440 445 Asn Leu Leu Glu Ile Leu Gln Lys Glu Lys Val Asn Ile Asn Ile Val 450 455 460 Gly Asp Phe Lys Leu Asn Glu Glu Ile Ala Ile Ile Leu Ala Ser Phe 465 470 475 480 Ser Ala Ser Thr Ser Ala Phe Val Glu Thr Val Lys Gly Leu Asp Tyr 485 490 495 Lys Ala Phe Lys Gln Ile Val Glu Ser Cys Gly Asn Phe Lys Val Thr 500 505 510 Lys Gly Lys Ala Lys Lys Gly Ala Trp Asn Ile Gly Glu Gln Lys Ser 515 520 525 Ile Leu Ser Pro Leu Tyr Ala Phe Ala Ser Glu Ala Ala Arg Val Val 530 535 540 Arg Ser Ile Phe Ser Arg Thr Leu Glu Thr Ala Gln Asn Ser Val Arg 545 550 555 560 Val Leu Gln Lys Ala Ala Ile Thr Ile Leu Asp Gly Ile Ser Gln Tyr 565 570 575 Ser Leu Arg Leu Ile Asp Ala Met Met Phe Thr Ser Asp Leu Ala Thr 580 585 590 Asn Asn Leu Val Val Met Ala Tyr Ile Thr Gly Gly Val Val Gln Leu 595 600 605 Thr Ser Gln Trp Leu Thr Asn Ile Phe Gly Thr Val Tyr Glu Lys Leu 610 615 620 Lys Pro Val Leu Asp Trp Leu Glu Glu Lys Phe Lys Glu Gly Val Glu 625 630 635 640 Phe Leu Arg Asp Gly Trp Glu Ile Val Lys Phe Ile Ser Thr Cys Ala 645 650 655 Cys Glu Ile Val Gly Gly Gln Ile Val Thr Cys Ala Lys Glu Ile Lys 660 665 670 Glu Ser Val Gln Thr Phe Phe Lys Leu Val Asn Lys Phe Leu Ala Leu 675 680 685 Cys Ala Asp Ser Ile Ile Ile Gly Gly Ala Lys Leu Lys Ala Leu Asn 690 695 700 Leu Gly Glu Thr Phe Val Thr His Ser Lys Gly Leu Tyr Arg Lys Cys 705 710 715 720 Val Lys Ser Arg Glu Glu Thr Gly Leu Leu Met Pro Leu Lys Ala Pro 725 730 735 Lys Glu Ile Ile Phe Leu Glu Gly Glu Thr Leu Pro Thr Glu Val Leu 740 745 750 Thr Glu Glu Val Val Leu Lys Thr Gly Asp Leu Gln Pro Leu Glu Gln 755 760 765 Pro Thr Ser Glu Ala Val Glu Ala Pro Leu Val Gly Thr Pro Val Cys 770 775 780 Ile Asn Gly Leu Met Leu Leu Glu Ile Lys Asp Thr Glu Lys Tyr Cys 785 790 795 800 Ala Leu Ala Pro Asn Met Met Val Thr Asn Asn Thr Phe Thr Leu Lys 805 810 815 Gly Gly Ala Pro Thr Lys Val Thr Phe Gly Asp Asp Thr Val Ile Glu 820 825 830 Val Gln Gly Tyr Lys Ser Val Asn Ile Thr Phe Glu Leu Asp Glu Arg 835 840 845 Ile Asp Lys Val Leu Asn Glu Lys Cys Ser Ala Tyr Thr Val Glu Leu 850 855 860 Gly Thr Glu Val Asn Glu Phe Ala Cys Val Val Ala Asp Ala Val Ile 865 870 875 880 Lys Thr Leu Gln Pro Val Ser Glu Leu Leu Thr Pro Leu Gly Ile Asp 885 890 895 Leu Asp Glu Trp Ser Met Ala Thr Tyr Tyr Leu Phe Asp Glu Ser Gly 900 905 910 Glu Phe Lys Leu Ala Ser His Met Tyr Cys Ser Phe Tyr Pro Pro Asp 915 920 925 Glu Asp Glu Glu Glu Gly Asp Cys Glu Glu Glu Glu Phe Glu Pro Ser 930 935 940 Thr Gln Tyr Glu Tyr Gly Thr Glu Asp Asp Tyr Gln Gly Lys Pro Leu 945 950 955 960 Glu Phe Gly Ala Thr Ser Ala Ala Leu Gln Pro Glu Glu Glu Gln Glu 965 970 975 Glu Asp Trp Leu Asp Asp Asp Ser Gln Gln Thr Val Gly Gln Gln Asp 980 985 990 Gly Ser Glu Asp Asn Gln Thr Thr Thr Ile Gln Thr Ile Val Glu Val 995 1000 1005 Gln Pro Gln Leu Glu Met Glu Leu Thr Pro Val Val Gln Thr Ile 1010 1015 1020 Glu Val Asn Ser Phe Ser Gly Tyr Leu Lys Leu Thr Asp Asn Val 1025 1030 1035 Tyr Ile Lys Asn Ala Asp Ile Val Glu Glu Ala Lys Lys Val Lys 1040 1045 1050 Pro Thr Val Val Val Asn Ala Ala Asn Val Tyr Leu Lys His Gly 1055 1060 1065 Gly Gly Val Ala Gly Ala Leu Asn Lys Ala Thr Asn Asn Ala Met 1070 1075 1080 Gln Val Glu Ser Asp Asp Tyr Ile Ala Thr Asn Gly Pro Leu Lys 1085 1090 1095 Val Gly Gly Ser Cys Val Leu Ser Gly His Asn Leu Ala Lys His 1100 1105 1110 Cys Leu His Val Val Gly Pro Asn Val Asn Lys Gly Glu Asp Ile 1115 1120 1125 Gln Leu Leu Lys Ser Ala Tyr Glu Asn Phe Asn Gln His Glu Val 1130 1135 1140 Leu Leu Ala Pro Leu Leu Ser Ala Gly Ile Phe Gly Ala Asp Pro 1145 1150 1155 Ile His Ser Leu Arg Val Cys Val Asp Thr Val Arg Thr Asn Val 1160 1165 1170 Tyr Leu Ala Val Phe Asp Lys Asn Leu Tyr Asp Lys Leu Val Ser 1175 1180 1185 Ser Phe Leu Glu Met Lys Ser Glu Lys Gln Val Glu Gln Lys Ile 1190 1195 1200 Ala Glu Ile Pro Lys Glu Glu Val Lys Pro Phe Ile Thr Glu Ser 1205 1210 1215 Lys Pro Ser Val Glu Gln Arg Lys Gln Asp Asp Lys Lys Ile Lys 1220 1225 1230 Ala Cys Val Glu Glu Val Thr Thr Thr Leu Glu Glu Thr Lys Phe 1235 1240 1245 Leu Thr Glu Asn Leu Leu Leu Tyr Ile Asp Ile Asn Gly Asn Leu 1250 1255 1260 His Pro Asp Ser Ala Thr Leu Val Ser Asp Ile Asp Ile Thr Phe 1265 1270 1275 Leu Lys Lys Asp Ala Pro Tyr Ile Val Gly Asp Val Val Gln Glu 1280 1285 1290 Gly Val Leu Thr Ala Val Val Ile Pro Thr Lys Lys Ala Gly Gly 1295 1300 1305 Thr Thr Glu Met Leu Ala Lys Ala Leu Arg Lys Val Pro Thr Asp 1310 1315 1320 Asn Tyr Ile Thr Thr Tyr Pro Gly Gln Gly Leu Asn Gly Tyr Thr 1325 1330 1335 Val Glu Glu Ala Lys Thr Val Leu Lys Lys Cys Lys Ser Ala Phe 1340 1345 1350 Tyr Ile Leu Pro Ser Ile Ile Ser Asn Glu Lys Gln Glu Ile Leu 1355 1360 1365 Gly Thr Val Ser Trp Asn Leu Arg Glu Met Leu Ala His Ala Glu 1370 1375 1380 Glu Thr Arg Lys Leu Met Pro Val Cys Val Glu Thr Lys Ala Ile 1385 1390 1395 Val Ser Thr Ile Gln Arg Lys Tyr Lys Gly Ile Lys Ile Gln Glu 1400 1405 1410 Gly Val Val Asp Tyr Gly Ala Arg Phe Tyr Phe Tyr Thr Ser Lys 1415 1420 1425 Thr Thr Val Ala Ser Leu Ile Asn Thr Leu Asn Asp Leu Asn Glu 1430 1435 1440 Thr Leu Val Thr Met Pro Leu Gly Tyr Val Thr His Gly Leu Asn 1445 1450 1455 Leu Glu Glu Ala Ala Arg Tyr Met Arg Ser Leu Lys Val Pro Ala 1460 1465 1470 Thr Val Ser Val Ser Ser Pro Asp Ala Val Thr Ala Tyr Asn Gly 1475 1480 1485 Tyr Leu Thr Ser Ser Ser Lys Thr Pro Glu Glu His Phe Ile Glu 1490 1495 1500 Thr Ile Ser Leu Ala Gly Ser Tyr Lys Asp Trp Ser Tyr Ser Gly 1505 1510 1515 Gln Ser Thr Gln Leu Gly Ile Glu Phe Leu Lys Arg Gly Asp Lys 1520 1525 1530 Ser Val Tyr Tyr Thr Ser Asn Pro Thr Thr Phe His Leu Asp Gly 1535 1540 1545 Glu Val Ile Thr Phe Asp Asn Leu Lys Thr Leu Leu Ser Leu Arg 1550 1555 1560 Glu Val Arg Thr Ile Lys Val Phe Thr Thr Val Asp Asn Ile Asn 1565 1570 1575 Leu His Thr Gln Val Val Asp Met Ser Met Thr Tyr Gly Gln Gln 1580 1585 1590 Phe Gly Pro Thr Tyr Leu Asp Gly Ala Asp Val Thr Lys Ile Lys 1595 1600 1605 Pro His Asn Ser His Glu Gly Lys Thr Phe Tyr Val Leu Pro Asn 1610 1615 1620 Asp Asp Thr Leu Arg Val Glu Ala Phe Glu Tyr Tyr His Thr Thr 1625 1630 1635 Asp Pro Ser Phe Leu Gly Arg Tyr Met Ser Ala Leu Asn His Thr 1640 1645 1650 Lys Lys Trp Lys Tyr Pro Gln Val Asn Gly Leu Thr Ser Ile Lys 1655 1660 1665 Trp Ala Asp Asn Asn Cys Tyr Leu Ala Thr Ala Leu Leu Thr Leu 1670 1675 1680 Gln Gln Ile Glu Leu Lys Phe Asn Pro Pro Ala Leu Gln Asp Ala 1685 1690 1695 Tyr Tyr Arg Ala Arg Ala Gly Glu Ala Ala Asn Phe Cys Ala Leu 1700 1705 1710 Ile Leu Ala Tyr Cys Asn Lys Thr Val Gly Glu Leu Gly Asp Val 1715 1720 1725 Arg Glu Thr Met Ser Tyr Leu Phe Gln His Ala Asn Leu Asp Ser 1730 1735 1740 Cys Lys Arg Val Leu Asn Val Val Cys Lys Thr Cys Gly Gln Gln 1745 1750 1755 Gln Thr Thr Leu Lys Gly Val Glu Ala Val Met Tyr Met Gly Thr 1760 1765 1770 Leu Ser Tyr Glu Gln Phe Lys Lys Gly Val Gln Ile Pro Cys Thr 1775 1780 1785 Cys Gly Lys Gln Ala Thr Lys Tyr Leu Val Gln Gln Glu Ser Pro 1790 1795 1800 Phe Val Met Met Ser Ala Pro Pro Ala Gln Tyr Glu Leu Lys His 1805 1810 1815 Gly Thr Phe Thr Cys Ala Ser Glu Tyr Ala Gly Asn Tyr Gln Cys 1820 1825 1830 Gly His Tyr Lys His Ile Thr Ser Lys Glu Thr Leu Tyr Cys Ile 1835 1840 1845 Asp Gly Ala Leu Leu Thr Lys Ser Ser Glu Tyr Lys Gly Pro Ile 1850 1855 1860 Thr Asp Val Phe Tyr Lys Glu Asn Ser Tyr Thr Thr Thr Ile Lys 1865 1870 1875 Pro Val Thr Tyr Lys Leu Asp Gly Val Val Cys Thr Glu Ile Asp 1880 1885 1890 Pro Lys Leu Asp Asn Tyr Tyr Lys Lys Asp Asn Ser Tyr Phe Thr 1895 1900 1905 Glu Gln Pro Ile Asp Leu Val Pro Asn Gln Pro Tyr Pro Asn Ala 1910 1915 1920 Ser Phe Asp Asn Phe Lys Phe Val Cys Asp Asn Ile Lys Phe Ala 1925 1930 1935 Asp Asp Leu Asn Gln Leu Thr Gly Tyr Lys Lys Pro Ala Ser Arg 1940 1945 1950 Glu Leu Lys Val Thr Phe Phe Pro Asp Leu Asn Gly Asp Val Val 1955 1960 1965 Ala Ile Asp Tyr Lys His Tyr Thr Pro Ser Phe Lys Lys Gly Ala 1970 1975 1980 Lys Leu Leu His Lys Pro Ile Val Trp His Val Asn Asn Ala Thr 1985 1990 1995 Asn Lys Ala Thr Tyr Lys Pro Asn Thr Trp Cys Ile Arg Cys Leu 2000 2005 2010 Trp Ser Thr Lys Pro Val Glu Thr Ser Asn Ser Phe Asp Val Leu 2015 2020 2025 Lys Ser Glu Asp Ala Gln Gly Met Asp Asn Leu Ala Cys Glu Asp 2030 2035 2040 Leu Lys Pro Val Ser Glu Glu Val Val Glu Asn Pro Thr Ile Gln 2045 2050 2055 Lys Asp Val Leu Glu Cys Asn Val Lys Thr Thr Glu Val Val Gly 2060 2065 2070 Asp Ile Ile Leu Lys Pro Ala Asn Asn Ser Leu Lys Ile Thr Glu 2075 2080 2085 Glu Val Gly His Thr Asp Leu Met Ala Ala Tyr Val Asp Asn Ser 2090 2095 2100 Ser Leu Thr Ile Lys Lys Pro Asn Glu Leu Ser Arg Val Leu Gly 2105 2110 2115 Leu Lys Thr Leu Ala Thr His Gly Leu Ala Ala Val Asn Ser Val 2120 2125 2130 Pro Trp Asp Thr Ile Ala Asn Tyr Ala Lys Pro Phe Leu Asn Lys 2135 2140 2145 Val Val Ser Thr Thr Thr Asn Ile Val Thr Arg Cys Leu Asn Arg 2150 2155 2160 Val Cys Thr Asn Tyr Met Pro Tyr Phe Phe Thr Leu Leu Leu Gln 2165 2170 2175 Leu Cys Thr Phe Thr Arg Ser Thr Asn Ser Arg Ile Lys Ala Ser 2180 2185 2190 Met Pro Thr Thr Ile Ala Lys Asn Thr Val Lys Ser Val Gly Lys 2195 2200 2205 Phe Cys Leu Glu Ala Ser Phe Asn Tyr Leu Lys Ser Pro Asn Phe 2210 2215 2220 Ser Lys Leu Ile Asn Ile Ile Ile Trp Phe Leu Leu Leu Ser Val 2225 2230 2235 Cys Leu Gly Ser Leu Ile Tyr Ser Thr Ala Ala Leu Gly Val Leu 2240 2245 2250 Met Ser Asn Leu Gly Met Pro Ser Tyr Cys Thr Gly Tyr Arg Glu 2255 2260 2265 Gly Tyr Leu Asn Ser Thr Asn Val Thr Ile Ala Thr Tyr Cys Thr 2270 2275 2280 Gly Ser Ile Pro Cys Ser Val Cys Leu Ser Gly Leu Asp Ser Leu 2285 2290 2295 Asp Thr Tyr Pro Ser Leu Glu Thr Ile Gln Ile Thr Ile Ser Ser 2300 2305 2310 Phe Lys Trp Asp Leu Thr Ala Phe Gly Leu Val Ala Glu Trp Phe 2315 2320 2325 Leu Ala Tyr Ile Leu Phe Thr Arg Phe Phe Tyr Val Leu Gly Leu 2330 2335 2340 Ala Ala Ile Met Gln Leu Phe Phe Ser Tyr Phe Ala Val His Phe 2345 2350 2355 Ile Ser Asn Ser Trp Leu Met Trp Leu Ile Ile Asn Leu Val Gln 2360 2365 2370 Met Ala Pro Ile Ser Ala Met Val Arg Met Tyr Ile Phe Phe Ala 2375 2380 2385 Ser Phe Tyr Tyr Val Trp Lys Ser Tyr Val His Val Val Asp Gly 2390 2395 2400 Cys Asn Ser Ser Thr Cys Met Met Cys Tyr Lys Arg Asn Arg Ala 2405 2410 2415 Thr Arg Val Glu Cys Thr Thr Ile Val Asn Gly Val Arg Arg Ser 2420 2425 2430 Phe Tyr Val Tyr Ala Asn Gly Gly Lys Gly Phe Cys Lys Leu His 2435 2440 2445 Asn Trp Asn Cys Val Asn Cys Asp Thr Phe Cys Ala Gly Ser Thr 2450 2455 2460 Phe Ile Ser Asp Glu Val Ala Arg Asp Leu Ser Leu Gln Phe Lys 2465 2470 2475 Arg Pro Ile Asn Pro Thr Asp Gln Ser Ser Tyr Ile Val Asp Ser 2480 2485 2490 Val Thr Val Lys Asn Gly Ser Ile His Leu Tyr Phe Asp Lys Ala 2495 2500 2505 Gly Gln Lys Thr Tyr Glu Arg His Ser Leu Ser His Phe Val Asn 2510 2515 2520 Leu Asp Asn Leu Arg Ala Asn Asn Thr Lys Gly Ser Leu Pro Ile 2525 2530 2535 Asn Val Ile Val Phe Asp Gly Lys Ser Lys Cys Glu Glu Ser Ser 2540 2545 2550 Ala Lys Ser Ala Ser Val Tyr Tyr Ser Gln Leu Met Cys Gln Pro 2555 2560 2565 Ile Leu Leu Leu Asp Gln Ala Leu Val Ser Asp Val Gly Asp Ser 2570 2575 2580 Ala Glu Val Ala Val Lys Met Phe Asp Ala Tyr Val Asn Thr Phe 2585 2590 2595 Ser Ser Thr Phe Asn Val Pro Met Glu Lys Leu Lys Thr Leu Val 2600 2605 2610 Ala Thr Ala Glu Ala Glu Leu Ala Lys Asn Val Ser Leu Asp Asn 2615 2620 2625 Val Leu Ser Thr Phe Ile Ser Ala Ala Arg Gln Gly Phe Val Asp 2630 2635 2640 Ser Asp Val Glu Thr Lys Asp Val Val Glu Cys Leu Lys Leu Ser 2645 2650 2655 His Gln Ser Asp Ile Glu Val Thr Gly Asp Ser Cys Asn Asn Tyr 2660 2665 2670 Met Leu Thr Tyr Asn Lys Val Glu Asn Met Thr Pro Arg Asp Leu 2675 2680 2685 Gly Ala Cys Ile Asp Cys Ser Ala Arg His Ile Asn Ala Gln Val 2690 2695 2700 Ala Lys Ser His Asn Ile Ala Leu Ile Trp Asn Val Lys Asp Phe 2705 2710 2715 Met Ser Leu Ser Glu Gln Leu Arg Lys Gln Ile Arg Ser Ala Ala 2720 2725 2730 Lys Lys Asn Asn Leu Pro Phe Lys Leu Thr Cys Ala Thr Thr Arg 2735 2740 2745 Gln Val Val Asn Val Val Thr Thr Lys Ile Ala Leu Lys Gly Gly 2750 2755 2760 Lys Ile Val Asn Asn Trp Leu Lys Gln Leu Ile Lys Val Thr Leu 2765 2770 2775 Val Phe Leu Phe Val Ala Ala Ile Phe Tyr Leu Ile Thr Pro Val 2780 2785 2790 His Val Met Ser Lys His Thr Asp Phe Ser Ser Glu Ile Ile Gly 2795 2800 2805 Tyr Lys Ala Ile Asp Gly Gly Val Thr Arg Asp Ile Ala Ser Thr 2810 2815 2820 Asp Thr Cys Phe Ala Asn Lys His Ala Asp Phe Asp Thr Trp Phe 2825 2830 2835 Ser Gln Arg Gly Gly Ser Tyr Thr Asn Asp Lys Ala Cys Pro Leu 2840 2845 2850 Ile Ala Ala Val Ile Thr Arg Glu Val Gly Phe Val Val Pro Gly 2855 2860 2865 Leu Pro Gly Thr Ile Leu Arg Thr Thr Asn Gly Asp Phe Leu His 2870 2875 2880 Phe Leu Pro Arg Val Phe Ser Ala Val Gly Asn Ile Cys Tyr Thr 2885 2890 2895 Pro Ser Lys Leu Ile Glu Tyr Thr Asp Phe Ala Thr Ser Ala Cys 2900 2905 2910 Val Leu Ala Ala Glu Cys Thr Ile Phe Lys Asp Ala Ser Gly Lys 2915 2920 2925 Pro Val Pro Tyr Cys Tyr Asp Thr Asn Val Leu Glu Gly Ser Val 2930 2935 2940 Ala Tyr Glu Ser Leu Arg Pro Asp Thr Arg Tyr Val Leu Met Asp 2945 2950 2955 Gly Ser Ile Ile Gln Phe Pro Asn Thr Tyr Leu Glu Gly Ser Val 2960 2965 2970 Arg Val Val Thr Thr Phe Asp Ser Glu Tyr Cys Arg His Gly Thr 2975 2980 2985 Cys Glu Arg Ser Glu Ala Gly Val Cys Val Ser Thr Ser Gly Arg 2990 2995 3000 Trp Val Leu Asn Asn Asp Tyr Tyr Arg Ser Leu Pro Gly Val Phe 3005 3010 3015 Cys Gly Val Asp Ala Val Asn Leu Leu Thr Asn Met Phe Thr Pro 3020 3025 3030 Leu Ile Gln Pro Ile Gly Ala Leu Asp Ile Ser Ala Ser Ile Val 3035 3040 3045 Ala Gly Gly Ile Val Ala Ile Val Val Thr Cys Leu Ala Tyr Tyr 3050 3055 3060 Phe Met Arg Phe Arg Arg Ala Phe Gly Glu Tyr Ser His Val Val 3065 3070 3075 Ala Phe Asn Thr Leu Leu Phe Leu Met Ser Phe Thr Val Leu Cys 3080 3085 3090 Leu Thr Pro Val Tyr Ser Phe Leu Pro Gly Val Tyr Ser Val Ile 3095 3100 3105 Tyr Leu Tyr Leu Thr Phe Tyr Leu Thr Asn Asp Val Ser Phe Leu 3110 3115 3120 Ala His Ile Gln Trp Met Val Met Phe Thr Pro Leu Val Pro Phe 3125 3130 3135 Trp Ile Thr Ile Ala Tyr Ile Ile Cys Ile Ser Thr Lys His Phe 3140 3145 3150 Tyr Trp Phe Phe Ser Asn Tyr Leu Lys Arg Arg Val Val Phe Asn 3155 3160 3165 Gly Val Ser Phe Ser Thr Phe Glu Glu Ala Ala Leu Cys Thr Phe 3170 3175 3180 Leu Leu Asn Lys Glu Met Tyr Leu Lys Leu Arg Ser Asp Val Leu 3185 3190 3195 Leu Pro Leu Thr Gln Tyr Asn Arg Tyr Leu Ala Leu Tyr Asn Lys 3200 3205 3210 Tyr Lys Tyr Phe Ser Gly Ala Met Asp Thr Thr Ser Tyr Arg Glu 3215 3220 3225 Ala Ala Cys Cys His Leu Ala Lys Ala Leu Asn Asp Phe Ser Asn 3230 3235 3240 Ser Gly Ser Asp Val Leu Tyr Gln Pro Pro Gln Thr Ser Ile Thr 3245 3250 3255 Ser Ala Val Leu Gln Ser Gly Phe Arg Lys Met Ala Phe Pro Ser 3260 3265 3270 Gly Lys Val Glu Gly Cys Met Val Gln Val Thr Cys Gly Thr Thr 3275 3280 3285 Thr Leu Asn Gly Leu Trp Leu Asp Asp Val Val Tyr Cys Pro Arg 3290 3295 3300 His Val Ile Cys Thr Ser Glu Asp Met Leu Asn Pro Asn Tyr Glu 3305 3310 3315 Asp Leu Leu Ile Arg Lys Ser Asn His Asn Phe Leu Val Gln Ala 3320 3325 3330 Gly Asn Val Gln Leu Arg Val Ile Gly His Ser Met Gln Asn Cys 3335 3340 3345 Val Leu Lys Leu Lys Val Asp Thr Ala Asn Pro Lys Thr Pro Lys 3350 3355 3360 Tyr Lys Phe Val Arg Ile Gln Pro Gly Gln Thr Phe Ser Val Leu 3365 3370 3375 Ala Cys Tyr Asn Gly Ser Pro Ser Gly Val Tyr Gln Cys Ala Met 3380 3385 3390 Arg Pro Asn Phe Thr Ile Lys Gly Ser Phe Leu Asn Gly Ser Cys 3395 3400 3405 Gly Ser Val Gly Phe Asn Ile Asp Tyr Asp Cys Val Ser Phe Cys 3410 3415 3420 Tyr Met His His Met Glu Leu Pro Thr Gly Val His Ala Gly Thr 3425 3430 3435 Asp Leu Glu Gly Asn Phe Tyr Gly Pro Phe Val Asp Arg Gln Thr 3440 3445 3450 Ala Gln Ala Ala Gly Thr Asp Thr Thr Ile Thr Val Asn Val Leu 3455 3460 3465 Ala Trp Leu Tyr Ala Ala Val Ile Asn Gly Asp Arg Trp Phe Leu 3470 3475 3480 Asn Arg Phe Thr Thr Thr Leu Asn Asp Phe Asn Leu Val Ala Met 3485 3490 3495 Lys Tyr Asn Tyr Glu Pro Leu Thr Gln Asp His Val Asp Ile Leu 3500 3505 3510 Gly Pro Leu Ser Ala Gln Thr Gly Ile Ala Val Leu Asp Met Cys 3515 3520 3525 Ala Ser Leu Lys Glu Leu Leu Gln Asn Gly Met Asn Gly Arg Thr 3530 3535 3540 Ile Leu Gly Ser Ala Leu Leu Glu Asp Glu Phe Thr Pro Phe Asp 3545 3550 3555 Val Val Arg Gln Cys Ser Gly Val Thr Phe Gln Ser Ala Val Lys 3560 3565 3570 Arg Thr Ile Lys Gly Thr His His Trp Leu Leu Leu Thr Ile Leu 3575 3580 3585 Thr Ser Leu Leu Val Leu Val Gln Ser Thr Gln Trp Ser Leu Phe 3590 3595 3600 Phe Phe Leu Tyr Glu Asn Ala Phe Leu Pro Phe Ala Met Gly Ile 3605 3610 3615 Ile Ala Met Ser Ala Phe Ala Met Met Phe Val Lys His Lys His 3620 3625 3630 Ala Phe Leu Cys Leu Phe Leu Leu Pro Ser Leu Ala Thr Val Ala 3635 3640 3645 Tyr Phe Asn Met Val Tyr Met Pro Ala Ser Trp Val Met Arg Ile 3650 3655 3660 Met Thr Trp Leu Asp Met Val Asp Thr Ser Leu Ser Gly Phe Lys 3665 3670 3675 Leu Lys Asp Cys Val Met Tyr Ala Ser Ala Val Val Leu Leu Ile 3680 3685 3690 Leu Met Thr Ala Arg Thr Val Tyr Asp Asp Gly Ala Arg Arg Val 3695 3700 3705 Trp Thr Leu Met Asn Val Leu Thr Leu Val Tyr Lys Val Tyr Tyr 3710 3715 3720 Gly Asn Ala Leu Asp Gln Ala Ile Ser Met Trp Ala Leu Ile Ile 3725 3730 3735 Ser Val Thr Ser Asn Tyr Ser Gly Val Val Thr Thr Val Met Phe 3740 3745 3750 Leu Ala Arg Gly Ile Val Phe Met Cys Val Glu Tyr Cys Pro Ile 3755 3760 3765 Phe Phe Ile Thr Gly Asn Thr Leu Gln Cys Ile Met Leu Val Tyr 3770 3775 3780 Cys Phe Leu Gly Tyr Phe Cys Thr Cys Tyr Phe Gly Leu Phe Cys 3785 3790 3795 Leu Leu Asn Arg Tyr Phe Arg Leu Thr Leu Gly Val Tyr Asp Tyr 3800 3805 3810 Leu Val Ser Thr Gln Glu Phe Arg Tyr Met Asn Ser Gln Gly Leu 3815 3820 3825 Leu Pro Pro Lys Asn Ser Ile Asp Ala Phe Lys Leu Asn Ile Lys 3830 3835 3840 Leu Leu Gly Val Gly Gly Lys Pro Cys Ile Lys Val Ala Thr Val 3845 3850 3855 Gln Ser Lys Met Ser Asp Val Lys Cys Thr Ser Val Val Leu Leu 3860 3865 3870 Ser Val Leu Gln Gln Leu Arg Val Glu Ser Ser Ser Lys Leu Trp 3875 3880 3885 Ala Gln Cys Val Gln Leu His Asn Asp Ile Leu Leu Ala Lys Asp 3890 3895 3900 Thr Thr Glu Ala Phe Glu Lys Met Val Ser Leu Leu Ser Val Leu 3905 3910 3915 Leu Ser Met Gln Gly Ala Val Asp Ile Asn Lys Leu Cys Glu Glu 3920 3925 3930 Met Leu Asp Asn Arg Ala Thr Leu Gln Ala Ile Ala Ser Glu Phe 3935 3940 3945 Ser Ser Leu Pro Ser Tyr Ala Ala Phe Ala Thr Ala Gln Glu Ala 3950 3955 3960 Tyr Glu Gln Ala Val Ala Asn Gly Asp Ser Glu Val Val Leu Lys 3965 3970 3975 Lys Leu Lys Lys Ser Leu Asn Val Ala Lys Ser Glu Phe Asp Arg 3980 3985 3990 Asp Ala Ala Met Gln Arg Lys Leu Glu Lys Met Ala Asp Gln Ala 3995 4000 4005 Met Thr Gln Met Tyr Lys Gln Ala Arg Ser Glu Asp Lys Arg Ala 4010 4015 4020 Lys Val Thr Ser Ala Met Gln Thr Met Leu Phe Thr Met Leu Arg 4025 4030 4035 Lys Leu Asp Asn Asp Ala Leu Asn Asn Ile Ile Asn Asn Ala Arg 4040 4045 4050 Asp Gly Cys Val Pro Leu Asn Ile Ile Pro Leu Thr Thr Ala Ala 4055 4060 4065 Lys Leu Met Val Val Ile Pro Asp Tyr Asn Thr Tyr Lys Asn Thr 4070 4075 4080 Cys Asp Gly Thr Thr Phe Thr Tyr Ala Ser Ala Leu Trp Glu Ile 4085 4090 4095 Gln Gln Val Val Asp Ala Asp Ser Lys Ile Val Gln Leu Ser Glu 4100 4105 4110 Ile Ser Met Asp Asn Ser Pro Asn Leu Ala Trp Pro Leu Ile Val 4115 4120 4125 Thr Ala Leu Arg Ala Asn Ser Ala Val Lys Leu Gln Asn Asn Glu 4130 4135 4140 Leu Ser Pro Val Ala Leu Arg Gln Met Ser Cys Ala Ala Gly Thr 4145 4150 4155 Thr Gln Thr Ala Cys Thr Asp Asp Asn Ala Leu Ala Tyr Tyr Asn 4160 4165 4170 Thr Thr Lys Gly Gly Arg Phe Val Leu Ala Leu Leu Ser Asp Leu 4175 4180 4185 Gln Asp Leu Lys Trp Ala Arg Phe Pro Lys Ser Asp Gly Thr Gly 4190 4195 4200 Thr Ile Tyr Thr Glu Leu Glu Pro Pro Cys Arg Phe Val Thr Asp 4205 4210 4215 Thr Pro Lys Gly Pro Lys Val Lys Tyr Leu Tyr Phe Ile Lys Gly 4220 4225 4230 Leu Asn Asn Leu Asn Arg Gly Met Val Leu Gly Ser Leu Ala Ala 4235 4240 4245 Thr Val Arg Leu Gln Ala Gly Asn Ala Thr Glu Val Pro Ala Asn 4250 4255 4260 Ser Thr Val Leu Ser Phe Cys Ala Phe Ala Val Asp Ala Ala Lys 4265 4270 4275 Ala Tyr Lys Asp Tyr Leu Ala Ser Gly Gly Gln Pro Ile Thr Asn 4280 4285 4290 Cys Val Lys Met Leu Cys Thr His Thr Gly Thr Gly Gln Ala Ile 4295 4300 4305 Thr Val Thr Pro Glu Ala Asn Met Asp Gln Glu Ser Phe Gly Gly 4310 4315 4320 Ala Ser Cys Cys Leu Tyr Cys Arg Cys His Ile Asp His Pro Asn 4325 4330 4335 Pro Lys Gly Phe Cys Asp Leu Lys Gly Lys Tyr Val Gln Ile Pro 4340 4345 4350 Thr Thr Cys Val Asn Asp Pro Val Gly Phe Thr Leu Lys Asn Thr 4355 4360 4365 Val Cys Thr Val Cys Gly Met Trp Lys Gly Tyr Gly Cys Ser Cys 4370 4375 4380 Asp Gln Leu Arg Glu Pro Met Leu Gln Ser Ala Asp Ala Gln Ser 4385 4390 4395 Phe Leu Asn Arg Val Cys Gly Val Ser Ala Ala Arg Leu Thr Pro 4400 4405 4410 Cys Gly Thr Gly Thr Ser Thr Asp Val Val Tyr Arg Ala Phe Asp 4415 4420 4425 Ile Tyr Asn Asp Lys Val Ala Gly Phe Ala Lys Phe Leu Lys Thr 4430 4435 4440 Asn Cys Cys Arg Phe Gln Glu Lys Asp Glu Asp Asp Asn Leu Ile 4445 4450 4455 Asp Ser Tyr Phe Val Val Lys Arg His Thr Phe Ser Asn Tyr Gln 4460 4465 4470 His Glu Glu Thr Ile Tyr Asn Leu Leu Lys Asp Cys Pro Ala Val 4475 4480 4485 Ala Lys His Asp Phe Phe Lys Phe Arg Ile Asp Gly Asp Met Val 4490 4495 4500 Pro His Ile Ser Arg Gln Arg Leu Thr Lys Tyr Thr Met Ala Asp 4505 4510 4515 Leu Val Tyr Ala Leu Arg His Phe Asp Glu Gly Asn Cys Asp Thr 4520 4525 4530 Leu Lys Glu Ile Leu Val Thr Tyr Asn Cys Cys Asp Asp Asp Tyr 4535 4540 4545 Phe Asn Lys Lys Asp Trp Tyr Asp Phe Val Glu Asn Pro Asp Ile 4550 4555 4560 Leu Arg Val Tyr Ala Asn Leu Gly Glu Arg Val Arg Gln Ala Leu 4565 4570 4575 Leu Lys Thr Val Gln Phe Cys Asp Ala Met Arg Asn Ala Gly Ile 4580 4585 4590 Val Gly Val Leu Thr Leu Asp Asn Gln Asp Leu Asn Gly Asn Trp 4595 4600 4605 Tyr Asp Phe Gly Asp Phe Ile Gln Thr Thr Pro Gly Ser Gly Val 4610 4615 4620 Pro Val Val Asp Ser Tyr Tyr Ser Leu Leu Met Pro Ile Leu Thr 4625 4630 4635 Leu Thr Arg Ala Leu Thr Ala Glu Ser His Val Asp Thr Asp Leu 4640 4645 4650 Thr Lys Pro Tyr Ile Lys Trp Asp Leu Leu Lys Tyr Asp Phe Thr 4655 4660 4665 Glu Glu Arg Leu Lys Leu Phe Asp Arg Tyr Phe Lys Tyr Trp Asp 4670 4675 4680 Gln Thr Tyr His Pro Asn Cys Val Asn Cys Leu Asp Asp Arg Cys 4685 4690 4695 Ile Leu His Cys Ala Asn Phe Asn Val Leu Phe Ser Thr Val Phe 4700 4705 4710 Pro Leu Thr Ser Phe Gly Pro Leu Val Arg Lys Ile Phe Val Asp 4715 4720 4725 Gly Val Pro Phe Val Val Ser Thr Gly Tyr His Phe Arg Glu Leu 4730 4735 4740 Gly Val Val His Asn Gln Asp Val Asn Leu His Ser Ser Arg Leu 4745 4750 4755 Ser Phe Lys Glu Leu Leu Val Tyr Ala Ala Asp Pro Ala Met His 4760 4765 4770 Ala Ala Ser Gly Asn Leu Leu Leu Asp Lys Arg Thr Thr Cys Phe 4775 4780 4785 Ser Val Ala Ala Leu Thr Asn Asn Val Ala Phe Gln Thr Val Lys 4790 4795 4800 Pro Gly Asn Phe Asn Lys Asp Phe Tyr Asp Phe Ala Val Ser Lys 4805 4810 4815 Gly Phe Phe Lys Glu Gly Ser Ser Val Glu Leu Lys His Phe Phe 4820 4825 4830 Phe Ala Gln Asp Gly Asn Ala Ala Ile Ser Asp Tyr Asp Tyr Tyr 4835 4840 4845 Arg Tyr Asn Leu Pro Thr Met Cys Asp Ile Arg Gln Leu Leu Phe 4850 4855 4860 Val Val Glu Val Val Asp Lys Tyr Phe Asp Cys Tyr Asp Gly Gly 4865 4870 4875 Cys Ile Asn Ala Asn Gln Val Ile Val Asn Asn Leu Asp Lys Ser 4880 4885 4890 Ala Gly Phe Pro Phe Asn Lys Trp Gly Lys Ala Arg Leu Tyr Tyr 4895 4900 4905 Asp Ser Met Ser Tyr Glu Asp Gln Asp Ala Leu Phe Ala Tyr Thr 4910 4915 4920 Lys Arg Asn Val Ile Pro Thr Ile Thr Gln Met Asn Leu Lys Tyr 4925 4930 4935 Ala Ile Ser Ala Lys Asn Arg Ala Arg Thr Val Ala Gly Val Ser 4940 4945 4950 Ile Cys Ser Thr Met Thr Asn Arg Gln Phe His Gln Lys Leu Leu 4955 4960 4965 Lys Ser Ile Ala Ala Thr Arg Gly Ala Thr Val Val Ile Gly Thr 4970 4975 4980 Ser Lys Phe Tyr Gly Gly Trp His Asn Met Leu Lys Thr Val Tyr 4985 4990 4995 Ser Asp Val Glu Asn Pro His Leu Met Gly Trp Asp Tyr Pro Lys 5000 5005 5010 Cys Asp Arg Ala Met Pro Asn Met Leu Arg Ile Met Ala Ser Leu 5015 5020 5025 Val Leu Ala Arg Lys His Thr Thr Cys Cys Ser Leu Ser His Arg 5030 5035 5040 Phe Tyr Arg Leu Ala Asn Glu Cys Ala Gln Val Leu Ser Glu Met 5045 5050 5055 Val Met Cys Gly Gly Ser Leu Tyr Val Lys Pro Gly Gly Thr Ser 5060 5065 5070 Ser Gly Asp Ala Thr Thr Ala Tyr Ala Asn Ser Val Phe Asn Ile 5075 5080 5085 Cys Gln Ala Val Thr Ala Asn Val Asn Ala Leu Leu Ser Thr Asp 5090 5095 5100 Gly Asn Lys Ile Ala Asp Lys Tyr Val Arg Asn Leu Gln His Arg 5105 5110 5115 Leu Tyr Glu Cys Leu Tyr Arg Asn Arg Asp Val Asp Thr Asp Phe 5120 5125 5130 Val Asn Glu Phe Tyr Ala Tyr Leu Arg Lys His Phe Ser Met Met 5135 5140 5145 Ile Leu Ser Asp Asp Ala Val Val Cys Phe Asn Ser Thr Tyr Ala 5150 5155 5160 Ser Gln Gly Leu Val Ala Ser Ile Lys Asn Phe Lys Ser Val Leu 5165 5170 5175 Tyr Tyr Gln Asn Asn Val Phe Met Ser Glu Ala Lys Cys Trp Thr 5180 5185 5190 Glu Thr Asp Leu Thr Lys Gly Pro His Glu Phe Cys Ser Gln His 5195 5200 5205 Thr Met Leu Val Lys Gln Gly Asp Asp Tyr Val Tyr Leu Pro Tyr 5210 5215 5220 Pro Asp Pro Ser Arg Ile Leu Gly Ala Gly Cys Phe Val Asp Asp 5225 5230 5235 Ile Val Lys Thr Asp Gly Thr Leu Met Ile Glu Arg Phe Val Ser 5240 5245 5250 Leu Ala Ile Asp Ala Tyr Pro Leu Thr Lys His Pro Asn Gln Glu 5255 5260 5265 Tyr Ala Asp Val Phe His Leu Tyr Leu Gln Tyr Ile Arg Lys Leu 5270 5275 5280 His Asp Glu Leu Thr Gly His Met Leu Asp Met Tyr Ser Val Met 5285 5290 5295 Leu Thr Asn Asp Asn Thr Ser Arg Tyr Trp Glu Pro Glu Phe Tyr 5300 5305 5310 Glu Ala Met Tyr Thr Pro His Thr Val Leu Gln Ala Val Gly Ala 5315 5320 5325 Cys Val Leu Cys Asn Ser Gln Thr Ser Leu Arg Cys Gly Ala Cys 5330 5335 5340 Ile Arg Arg Pro Phe Leu Cys Cys Lys Cys Cys Tyr Asp His Val 5345 5350 5355 Ile Ser Thr Ser His Lys Leu Val Leu Ser Val Asn Pro Tyr Val 5360 5365 5370 Cys Asn Ala Pro Gly Cys Asp Val Thr Asp Val Thr Gln Leu Tyr 5375 5380 5385 Leu Gly Gly Met Ser Tyr Tyr Cys Lys Ser His Lys Pro Pro Ile 5390 5395 5400 Ser Phe Pro Leu Cys Ala Asn Gly Gln Val Phe Gly Leu Tyr Lys 5405 5410 5415 Asn Thr Cys Val Gly Ser Asp Asn Val Thr Asp Phe Asn Ala Ile 5420 5425 5430 Ala Thr Cys Asp Trp Thr Asn Ala Gly Asp Tyr Ile Leu Ala Asn 5435 5440 5445 Thr Cys Thr Glu Arg Leu Lys Leu Phe Ala Ala Glu Thr Leu Lys 5450 5455 5460 Ala Thr Glu Glu Thr Phe Lys Leu Ser Tyr Gly Ile Ala Thr Val 5465 5470 5475 Arg Glu Val Leu Ser Asp Arg Glu Leu His Leu Ser Trp Glu Val 5480 5485 5490 Gly Lys Pro Arg Pro Pro Leu Asn Arg Asn Tyr Val Phe Thr Gly 5495 5500 5505 Tyr Arg Val Thr Lys Asn Ser Lys Val Gln Ile Gly Glu Tyr Thr 5510 5515 5520 Phe Glu Lys Gly Asp Tyr Gly Asp Ala Val Val Tyr Arg Gly Thr 5525 5530 5535 Thr Thr Tyr Lys Leu Asn Val Gly Asp Tyr Phe Val Leu Thr Ser 5540 5545 5550 His Thr Val Met Pro Leu Ser Ala Pro Thr Leu Val Pro Gln Glu 5555 5560 5565 His Tyr Val Arg Ile Thr Gly Leu Tyr Pro Thr Leu Asn Ile Ser 5570 5575 5580 Asp Glu Phe Ser Ser Asn Val Ala Asn Tyr Gln Lys Val Gly Met 5585 5590 5595 Gln Lys Tyr Ser Thr Leu Gln Gly Pro Pro Gly Thr Gly Lys Ser 5600 5605 5610 His Phe Ala Ile Gly Leu Ala Leu Tyr Tyr Pro Ser Ala Arg Ile 5615 5620 5625 Val Tyr Thr Ala Cys Ser His Ala Ala Val Asp Ala Leu Cys Glu 5630 5635 5640 Lys Ala Leu Lys Tyr Leu Pro Ile Asp Lys Cys Ser Arg Ile Ile 5645 5650 5655 Pro Ala Arg Ala Arg Val Asp Cys Phe Asp Lys Phe Lys Val Asn 5660 5665 5670 Ser Thr Leu Glu Gln Tyr Val Phe Cys Thr Val Asn Ala Leu Pro 5675 5680 5685 Glu Thr Thr Ala Asp Ile Val Val Phe Asp Glu Ile Ser Met Ala 5690 5695 5700 Thr Asn Tyr Asp Leu Ser Val Val Asn Ala Arg Leu Arg Ala Lys 5705 5710 5715 His Tyr Val Tyr Ile Gly Asp Pro Ala Gln Leu Pro Ala Pro Arg 5720 5725 5730 Thr Leu Leu Thr Lys Gly Thr Leu Glu Pro Glu Tyr Phe Asn Ser 5735 5740 5745 Val Cys Arg Leu Met Lys Thr Ile Gly Pro Asp Met Phe Leu Gly 5750 5755 5760 Thr Cys Arg Arg Cys Pro Ala Glu Ile Val Asp Thr Val Ser Ala 5765 5770 5775 Leu Val Tyr Asp Asn Lys Leu Lys Ala His Lys Asp Lys Ser Ala 5780 5785 5790 Gln Cys Phe Lys Met Phe Tyr Lys Gly Val Ile Thr His Asp Val 5795 5800 5805 Ser Ser Ala Ile Asn Arg Pro Gln Ile Gly Val Val Arg Glu Phe 5810 5815 5820 Leu Thr Arg Asn Pro Ala Trp Arg Lys Ala Val Phe Ile Ser Pro 5825 5830 5835 Tyr Asn Ser Gln Asn Ala Val Ala Ser Lys Ile Leu Gly Leu Pro 5840 5845 5850 Thr Gln Thr Val Asp Ser Ser Gln Gly Ser Glu Tyr Asp Tyr Val 5855 5860 5865 Ile Phe Thr Gln Thr Thr Glu Thr Ala His Ser Cys Asn Val Asn 5870 5875 5880 Arg Phe Asn Val Ala Ile Thr Arg Ala Lys Val Gly Ile Leu Cys 5885 5890 5895 Ile Met Ser Asp Arg Asp Leu Tyr Asp Lys Leu Gln Phe Thr Ser 5900 5905 5910 Leu Glu Ile Pro Arg Arg Asn Val Ala Thr Leu Gln Ala Glu Asn 5915 5920 5925 Val Thr Gly Leu Phe Lys Asp Cys Ser Lys Val Ile Thr Gly Leu 5930 5935 5940 His Pro Thr Gln Ala Pro Thr His Leu Ser Val Asp Thr Lys Phe 5945 5950 5955 Lys Thr Glu Gly Leu Cys Val Asp Ile Pro Gly Ile Pro Lys Asp 5960 5965 5970 Met Thr Tyr Arg Arg Leu Ile Ser Met Met Gly Phe Lys Met Asn 5975 5980 5985 Tyr Gln Val Asn Gly Tyr Pro Asn Met Phe Ile Thr Arg Glu Glu 5990 5995 6000 Ala Ile Arg His Val Arg Ala Trp Ile Gly Phe Asp Val Glu Gly 6005 6010 6015 Cys His Ala Thr Arg Glu Ala Val Gly Thr Asn Leu Pro Leu Gln 6020 6025 6030 Leu Gly Phe Ser Thr Gly Val Asn Leu Val Ala Val Pro Thr Gly 6035 6040 6045 Tyr Val Asp Thr Pro Asn Asn Thr Asp Phe Ser Arg Val Ser Ala 6050 6055 6060 Lys Pro Pro Pro Gly Asp Gln Phe Lys His Leu Ile Pro Leu Met 6065 6070 6075 Tyr Lys Gly Leu Pro Trp Asn Val Val Arg Ile Lys Ile Val Gln 6080 6085 6090 Met Leu Ser Asp Thr Leu Arg Asn Leu Ser Asp Arg Val Val Phe 6095 6100 6105 Val Leu Trp Ala His Gly Phe Glu Leu Thr Ser Met Lys Tyr Phe 6110 6115 6120 Val Lys Ile Gly Pro Glu Arg Thr Cys Cys Leu Cys Asp Arg Arg 6125 6130 6135 Ala Thr Cys Phe Ser Thr Ala Ser Asp Thr Tyr Ala Cys Trp His 6140 6145 6150 His Ser Ile Gly Phe Asp Tyr Val Tyr Asn Pro Phe Met Ile Asp 6155 6160 6165 Val Gln Gln Trp Gly Phe Thr Gly Asn Leu Gln Ser Asn His Asp 6170 6175 6180 Leu Tyr Cys Gln Val His Gly Asn Ala His Val Ala Ser Cys Asp 6185 6190 6195 Ala Ile Met Thr Arg Cys Leu Ala Val His Glu Cys Phe Val Lys 6200 6205 6210 Arg Val Asp Trp Thr Ile Glu Tyr Pro Ile Ile Gly Asp Glu Leu 6215 6220 6225 Lys Ile Asn Ala Ala Cys Arg Lys Val Gln His Met Val Val Lys 6230 6235 6240 Ala Ala Leu Leu Ala Asp Lys Phe Pro Val Leu His Asp Ile Gly 6245 6250 6255 Asn Pro Lys Ala Ile Lys Cys Val Pro Gln Ala Asp Val Glu Trp 6260 6265 6270 Lys Phe Tyr Asp Ala Gln Pro Cys Ser Asp Lys Ala Tyr Lys Ile 6275 6280 6285 Glu Glu Leu Phe Tyr Ser Tyr Ala Thr His Ser Asp Lys Phe Thr 6290 6295 6300 Asp Gly Val Cys Leu Phe Trp Asn Cys Asn Val Asp Arg Tyr Pro 6305 6310 6315 Ala Asn Ser Ile Val Cys Arg Phe Asp Thr Arg Val Leu Ser Asn 6320 6325 6330 Leu Asn Leu Pro Gly Cys Asp Gly Gly Ser Leu Tyr Val Asn Lys 6335 6340 6345 His Ala Phe His Thr Pro Ala Phe Asp Lys Ser Ala Phe Val Asn 6350 6355 6360 Leu Lys Gln Leu Pro Phe Phe Tyr Tyr Ser Asp Ser Pro Cys Glu 6365 6370 6375 Ser His Gly Lys Gln Val Val Ser Asp Ile Asp Tyr Val Pro Leu 6380 6385 6390 Lys Ser Ala Thr Cys Ile Thr Arg Cys Asn Leu Gly Gly Ala Val 6395 6400 6405 Cys Arg His His Ala Asn Glu Tyr Arg Leu Tyr Leu Asp Ala Tyr 6410 6415 6420 Asn Met Met Ile Ser Ala Gly Phe Ser Leu Trp Val Tyr Lys Gln 6425 6430 6435 Phe Asp Thr Tyr Asn Leu Trp Asn Thr Phe Thr Arg Leu Gln Ser 6440 6445 6450 Leu Glu Asn Val Ala Phe Asn Val Val Asn Lys Gly His Phe Asp 6455 6460 6465 Gly Gln Gln Gly Glu Val Pro Val Ser Ile Ile Asn Asn Thr Val 6470 6475 6480 Tyr Thr Lys Val Asp Gly Val Asp Val Glu Leu Phe Glu Asn Lys 6485 6490 6495 Thr Thr Leu Pro Val Asn Val Ala Phe Glu Leu Trp Ala Lys Arg 6500 6505 6510 Asn Ile Lys Pro Val Pro Glu Val Lys Ile Leu Asn Asn Leu Gly 6515 6520 6525 Val Asp Ile Ala Ala Asn Thr Val Ile Trp Asp Tyr Lys Arg Asp 6530 6535 6540 Ala Pro Ala His Ile Ser Thr Ile Gly Val Cys Ser Met Thr Asp 6545 6550 6555 Ile Ala Lys Lys Pro Thr Glu Thr Ile Cys Ala Pro Leu Thr Val 6560 6565 6570 Phe Phe Asp Gly Arg Val Asp Gly Gln Val Asp Leu Phe Arg Asn 6575 6580 6585 Ala Arg Asn Gly Val Leu Ile Thr Glu Gly Ser Val Lys Gly Leu 6590 6595 6600 Gln Pro Ser Val Gly Pro Lys Gln Ala Ser Leu Asn Gly Val Thr 6605 6610 6615 Leu Ile Gly Glu Ala Val Lys Thr Gln Phe Asn Tyr Tyr Lys Lys 6620 6625 6630 Val Asp Gly Val Val Gln Gln Leu Pro Glu Thr Tyr Phe Thr Gln 6635 6640 6645 Ser Arg Asn Leu Gln Glu Phe Lys Pro Arg Ser Gln Met Glu Ile 6650 6655 6660 Asp Phe Leu Glu Leu Ala Met Asp Glu Phe Ile Glu Arg Tyr Lys 6665 6670 6675 Leu Glu Gly Tyr Ala Phe Glu His Ile Val Tyr Gly Asp Phe Ser 6680 6685 6690 His Ser Gln Leu Gly Gly Leu His Leu Leu Ile Gly Leu Ala Lys 6695 6700 6705 Arg Phe Lys Glu Ser Pro Phe Glu Leu Glu Asp Phe Ile Pro Met 6710 6715 6720 Asp Ser Thr Val Lys Asn Tyr Phe Ile Thr Asp Ala Gln Thr Gly 6725 6730 6735 Ser Ser Lys Cys Val Cys Ser Val Ile Asp Leu Leu Leu Asp Asp 6740 6745 6750 Phe Val Glu Ile Ile Lys Ser Gln Asp Leu Ser Val Val Ser Lys 6755 6760 6765 Val Val Lys Val Thr Ile Asp Tyr Thr Glu Ile Ser Phe Met Leu 6770 6775 6780 Trp Cys Lys Asp Gly His Val Glu Thr Phe Tyr Pro Lys Leu Gln 6785 6790 6795 Ser Ser Gln Ala Trp Gln Pro Gly Val Ala Met Pro Asn Leu Tyr 6800 6805 6810 Lys Met Gln Arg Met Leu Leu Glu Lys Cys Asp Leu Gln Asn Tyr 6815 6820 6825 Gly Asp Ser Ala Thr Leu Pro Lys Gly Ile Met Met Asn Val Ala 6830 6835 6840 Lys Tyr Thr Gln Leu Cys Gln Tyr Leu Asn Thr Leu Thr Leu Ala 6845 6850 6855 Val Pro Tyr Asn Met Arg Val Ile His Phe Gly Ala Gly Ser Asp 6860 6865 6870 Lys Gly Val Ala Pro Gly Thr Ala Val Leu Arg Gln Trp Leu Pro 6875 6880 6885 Thr Gly Thr Leu Leu Val Asp Ser Asp Leu Asn Asp Phe Val Ser 6890 6895 6900 Asp Ala Asp Ser Thr Leu Ile Gly Asp Cys Ala Thr Val His Thr 6905 6910 6915 Ala Asn Lys Trp Asp Leu Ile Ile Ser Asp Met Tyr Asp Pro Lys 6920 6925 6930 Thr Lys Asn Val Thr Lys Glu Asn Asp Ser Lys Glu Gly Phe Phe 6935 6940 6945 Thr Tyr Ile Cys Gly Phe Ile Gln Gln Lys Leu Ala Leu Gly Gly 6950 6955 6960 Ser Val Ala Ile Lys Xaa Xaa Xaa Xaa Ser Trp Asn Ala Asp Leu 6965 6970 6975 Tyr Xaa Leu Met Gly Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 6980 6985 6990 Xaa Xaa Asn Ala Ser Ser Ser Glu Xaa Xaa Xaa Xaa Xaa Cys Xaa 6995 7000 7005 Xaa Xaa Gly Lys Pro Arg Glu Gln Ile Xaa Xaa Xaa Xaa Xaa Xaa 7010 7015 7020 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Thr Asn Pro Ile Gln Leu Ser 7025 7030 7035 Ser Tyr Ser Leu Phe Asp Met Ser Lys Phe Pro Leu Lys Leu Arg 7040 7045 7050 Gly Thr Val Val Met Ser Leu Lys Glu Gly Gln Ile Asn Asp Met 7055 7060 7065 Ile Leu Ser Leu Leu Ser Lys Gly Arg Leu Ile Ile Arg Glu Asn 7070 7075 7080 Asn Arg Val Val Ile Ser Ser Asp Val Leu Val Asn Asn 7085 7090 7095 <210> 261 <400> 261 000 <210> 262 <400> 262 000 <210> 263 <400> 263 000 <210> 264 <400> 264 000 <210> 265 <400> 265 000 <210> 266 <400> 266 000 <210> 267 <400> 267 000 <210> 268 <400> 268 000 <210> 269 <400> 269 000 <210> 270 <400> 270 000 <210> 271 <400> 271 000 <210> 272 <400> 272 000 <210> 273 <400> 273 000 <210> 274 <400> 274 000 <210> 275 <400> 275 000 <210> 276 <400> 276 000 <210> 277 <400> 277 000 <210> 278 <400> 278 000 <210> 279 <400> 279 000 <210> 280 <400> 280 000 <210> 281 <400> 281 000 <210> 282 <400> 282 000 <210> 283 <400> 283 000 <210> 284 <400> 284 000 <210> 285 <400> 285 000 <210> 286 <400> 286 000 <210> 287 <400> 287 000 <210> 288 <400> 288 000 <210> 289 <400> 289 000 <210> 290 <400> 290 000 <210> 291 <400> 291 000 <210> 292 <400> 292 000 <210> 293 <400> 293 000 <210> 294 <400> 294 000 <210> 295 <400> 295 000 <210> 296 <400> 296 000 <210> 297 <400> 297 000 <210> 298 <400> 298 000 <210> 299 <400> 299 000 <210> 300 <400> 300 000 <210> 301 <211> 21282 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 301 atggagagcc ttgtccctgg tttcaacgag aaaacacacg tccaactcag tttgcctgtt 60 ttacaggttc gcgacgtgct cgtacgtggc tttggagact ccgtggagga ggtcttatca 120 gaggcacgtc aacatcttaa agatggcact tgtggcttag tagaagttga aaaaggcgtt 180 ttgcctcaac ttgaacagcc ctatgtgttc atcaaacgtt cggatgctcg aactgcacct 240 catggtcatg ttatggttga gctggtagca gaactcgaag gcattcagta cggtcgtagt 300 ggtgagacac ttggtgtcct tgtccctcat gtgggcgaaa taccagtggc ttaccgcaag 360 gttcttcttc gtaagaacgg taataaagga gctggtggcc atagttacgg cgccgatcta 420 aagtcatttg acttaggcga cgagcttggc actgatcctt atgaagattt tcaagaaaac 480 tggaacacta aacatagcag tggtgttacc cgtgaactca tgcgtgagct taacggaggg 540 gcatacactc gctatgtcga taacaacttc tgtggccctg atggctaccc tcttgagtgc 600 attaaagacc ttctagcacg tgctggtaaa gcttcatgca ctttgtctga acaactggac 660 tttattgaca ctaagagggg tgtatactgc tgccgtgaac atgagcatga aattgcttgg 720 tacacggaac gttctgaaaa gagctatgaa ttgcagacac cttttgaaat taaattggca 780 aagaaatttg acaccttcaa tggggaatgt ccaaattttg tatttccctt aaattccata 840 atcaagacta ttcaaccaag ggttgaaaag aaaaagcttg atggctttat gggtagaatt 900 cgatctgtct atccagttgc gtcaccaaat gaatgcaacc aaatgtgcct ttcaactctc 960 atgaagtgtg atcattgtgg tgaaacttca tggcagacgg gcgattttgt taaagccact 1020 tgcgaatttt gtggcactga gaatttgact aaagaaggtg ccactacttg tggttactta 1080 ccccaaaatg ctgttgttaa aatttattgt ccagcatgtc acaattcaga agtaggacct 1140 gagcatagtc ttgccgaata ccataatgaa tctggcttga aaaccattct tcgtaagggt 1200 ggtcgcacta ttgcctttgg aggctgtgtg ttctcttatg ttggttgcca taacaagtgt 1260 gcctattggg ttccacgtgc tagcgctaac ataggttgta accatacagg tgttgttgga 1320 gaaggttccg aaggtcttaa tgacaacctt cttgaaatac tccaaaaaga gaaagtcaac 1380 atcaatattg ttggtgactt taaacttaat gaagagatcg ccattatttt ggcatctttt 1440 tctgcttcca caagtgcttt tgtggaaact gtgaaaggtt tggattataa agcattcaaa 1500 caaattgttg aatcctgtgg taattttaaa gttacaaaag gaaaagctaa aaaaggtgcc 1560 tggaatattg gtgaacagaa atcaatactg agtcctcttt atgcatttgc atcagaggct 1620 gctcgtgttg tacgatcaat tttctcccgc actcttgaaa ctgctcaaaa ttctgtgcgt 1680 gttttacaga aggccgctat aacaatacta gatggaattt cacagtattc actgagactc 1740 attgatgcta tgatgttcac atctgatttg gctactaaca atctagttgt aatggcctac 1800 attacaggtg gtgttgttca gttgacttcg cagtggctaa ctaacatctt tggcactgtt 1860 tatgaaaaac tcaaacccgt ccttgattgg cttgaagaga agtttaagga aggtgtagag 1920 tttcttagag acggttggga aattgttaaa tttatctcaa cctgtgcttg tgaaattgtc 1980 ggtggacaaa ttgtcacctg tgcaaaggaa attaaggaga gtgttcagac attctttaag 2040 cttgtaaata aatttttggc tttgtgtgct gactctatca ttattggtgg agctaaactt 2100 aaagccttga atttaggtga aacatttgtc acgcactcaa agggattgta cagaaagtgt 2160 gttaaatcca gagaagaaac tggcctactc atgcctctaa aagccccaaa agaaattatc 2220 ttcttagagg gagaaacact tcccacagaa gtgttaacag aggaagttgt cttgaaaact 2280 ggtgatttac aaccattaga acaacctact agtgaagctg ttgaagctcc attggttggt 2340 acaccagttt gtattaacgg gcttatgttg ctcgaaatca aagacacaga aaagtactgt 2400 gcccttgcac ctaatatgat ggtaacaaac aataccttca cactcaaagg cggtgcacca 2460 acaaaggtta cttttggtga tgacactgtg atagaagtgc aaggttacaa gagtgtgaat 2520 atcacttttg aacttgatga aaggattgat aaagtactta atgagaagtg ctctgcctat 2580 acagttgaac tcggtacaga agtaaatgag ttcgcctgtg ttgtggcaga tgctgtcata 2640 aaaactttgc aaccagtatc tgaattactt acaccactgg gcattgattt agatgagtgg 2700 agtatggcta catactactt atttgatgag tctggtgagt ttaaattggc ttcacatatg 2760 tattgttctt tttaccctcc agatgaggat gaagaagaag gtgattgtga agaagaagag 2820 tttgagccat caactcaata tgagtatggt actgaagatg attaccaagg taaacctttg 2880 gaatttggtg ccacttctgc tgctcttcaa cctgaagaag agcaagaaga agattggtta 2940 gatgatgata gtcaacaaac tgttggtcaa caagacggca gtgaggacaa tcagacaact 3000 attattcaaa caattgttga ggttcaacct caattagaga tggaacttac accagttgtt 3060 cagactattg aagtgaatag ttttagtggt tatttaaaac ttactgacaa tgtatacatt 3120 aaaaatgcag acattgtgga agaagctaaa aaggtaaaac caacagtggt tgttaatgca 3180 gccaatgttt accttaaaca tggaggaggt gttgcaggag ccttaaataa ggctactaac 3240 aatgccatgc aagttgaatc tgatgattac atagctacta atggaccact taaagtgggt 3300 ggtagttgtg ttttaagcgg acacaatctt gctaaacact gtcttcatgt tgtcggccca 3360 aatgttaaca aaggtgaaga cattcaactt cttaagagtg cttatgaaaa ttttaatcag 3420 cacgaagttc tacttgcacc attattatca gctggtattt ttggtgctga ccctatacat 3480 tctttaagag tttgtgtaga tactgttcgc acaaatgtct acttagctgt ctttgataaa 3540 aatctctatg acaaacttgt ttcaagcttt ttggaaatga agagtgaaaa gcaagttgaa 3600 caaaagatcg ctgagattcc taaagaggaa gttaagccat ttataactga aagtaaacct 3660 tcagttgaac agagaaaaca agatgataag aaaatcaaag cttgtgttga agaagttaca 3720 acaactctgg aagaaactaa gttcctcaca gaaaacttgt tactttatat tgacattaat 3780 ggcaatcttc atccagattc tgccactctt gttagtgaca ttgacatcac tttcttaaag 3840 aaagatgctc catatatagt gggtgatgtt gttcaagagg gtgttttaac tgctgtggtt 3900 atacctacta aaaaggctgg tggcactact gaaatgctag cgaaagcttt gagaaaagtg 3960 ccaacagaca attatataac cacttacccg ggtcagggtt taaatggtta cactgtagag 4020 gaggcaaaga cagtgcttaa aaagtgtaaa agtgcctttt acattctacc atctattatc 4080 tctaatgaga agcaagaaat tcttggaact gtttcttgga atttgcgaga aatgcttgca 4140 catgcagaag aaacacgcaa attaatgcct gtctgtgtgg aaactaaagc catagtttca 4200 actatacagc gtaaatataa gggtattaaa atacaagagg gtgtggttga ttatggtgct 4260 agattttact tttacaccag taaaacaact gtagcgtcac ttatcaacac acttaacgat 4320 ctaaatgaaa ctcttgttac aatgccactt ggctatgtaa cacatggctt aaatttggaa 4380 gaagctgctc ggtatatgag atctctcaaa gtgccagcta cagtttctgt ttcttcacct 4440 gatgctgtta cagcgtataa tggttatctt acttcttctt ctaaaacacc tgaagaacat 4500 tttattgaaa ccatctcact tgctggttcc tataaagatt ggtcctattc tggacaatct 4560 acacaactag gtatagaatt tcttaagaga ggtgataaaa gtgtatatta cactagtaat 4620 cctaccacat tccacctaga tggtgaagtt atcacctttg acaatcttaa gacacttctt 4680 tctttgagag aagtgaggac tattaaggtg tttacaacag tagacaacat taacctccac 4740 acgcaagttg tggacatgtc aatgacatat ggacaacagt ttggtccaac ttatttggat 4800 ggagctgatg ttactaaaat aaaacctcat aattcacatg aaggtaaaac attttatgtt 4860 ttacctaatg atgacactct acgtgttgag gcttttgagt actaccacac aactgatcct 4920 agttttctgg gtaggtacat gtcagcatta aatcacacta aaaagtggaa atacccacaa 4980 gttaatggtt taacttctat aaaatgggca gataacaact gttatcttgc cactgcattg 5040 ttaacactcc aacaaataga gttgaagttt aatccacctg ctctacaaga tgcttattac 5100 agagcaaggg ctggtgaagc tgataacttt tgtgcactta tcttagccta ctgtaataag 5160 acagtaggtg agttaggtga tgttagagaa acaatgagtt acttgtttca acatgccaat 5220 ttagattctt gcaaaagagt cttgaacgtg gtgtgtaaaa cttgtggaca acagcagaca 5280 acccttaagg gtgtagaagc tgttatgtac atgggcacac tttcttatga acaatttaag 5340 aaaggtgttc agataccttg tacgtgtggt aaacaagcta caaaatatct agtacaacag 5400 gagtcacctt ttgttatgat gtcagcacca cctgctcagt atgaacttaa gcatggtaca 5460 tttacttgtg ctagtgagta cactggtaat taccagtgtg gtcactataa acatataact 5520 tctaaagaaa ctttgtattg catagacggt gctttactta caaagtcctc agaatacaaa 5580 ggtcctatta cggatgtttt ctacaaagaa aacagttaca caacaaccat aaaaccagtt 5640 acttataaat tggatggtgt tgtttgtaca gaaattgacc ctaagttgga caattattat 5700 aagaaagaca attcttattt tacagagcaa ccaattgatc ttgtaccaaa ccaaccatat 5760 ccaaacgcaa gcttcgataa ttttaagttt gtatgtgata atatcaaatt tgctgatgat 5820 ttaaaccagt taactggtta taagaaacct gcttcaagag agcttaaagt tacatttttc 5880 cctgacttaa atggtgatgt ggtggctatt gattataaac actacacacc ctcttttaag 5940 aaaggagcta aattgttaca taaacctatt gtttggcatg ttaacaatgc aactaataaa 6000 gccacgtata aaccaaatac ctggtgtata cgttgtcttt ggagcacaaa accagttgaa 6060 acatcaaatt cgtttgatgt actgaagtca gaggacgcgc agggaatgga taatcttgcc 6120 tgcgaagatc taaaaccagt ctctgaagaa gtagtggaaa atcctaccat acagaaagac 6180 gttcttgagt gtaatgtgaa aactaccgaa gttgtaggag acattatact taaaccagca 6240 aataatagtt taaaaattac agaagaggtt ggccacacag atctaatggc tgcttatgta 6300 gacaattcta gtcttactat taagaaacct aatgaattat ctagagtatt aggtttgaaa 6360 acccttgcta ctcatggttt agctgctgtt aatagtgtcc cttgggatac tatagctaat 6420 tatgctaagc cttttcttaa caaagttgtt agtacaacta ctaacatagt tacacggtgt 6480 ttaaaccgtg tttgtactaa ttatatgcct tatttcttta ctttattgct acaattgtgt 6540 acttttacta gaagtacaaa ttctagaatt aaagcatcta tgccgactac tatagcaaag 6600 aatactgtta agagtgtcgg taaattttgt ctagaggctt catttaatta tttgaagtca 6660 cctaattttt ctaaactgat aaatattaca atttggtttt tactattaag tgtttgccta 6720 ggttctttaa tctactcaac cgctgcttta ggtgttttaa tgtctaattt aggcatgcct 6780 tcttactgta ctggttacag agaaggctat ttgaactcta ctaatgtcac tattgcaacc 6840 tactgtactg gttctatacc ttgtagtgtt tgtcttagtg gtttagattc tttagacacc 6900 tatccttctt tagaaactat acaaattacc atttcatctt ttaaatggga tttaactgct 6960 tttggcttag ttgcagagtg gtttttggca tatattcttt tcactaggtt tttctatgta 7020 cttggattgg ctgcaatcat gcaattgttt ttcagctatt ttgcagtaca ttttattagt 7080 aattcttggc ttatgtggtt aataattaat cttgtacaaa tggccccgat ttcagctatg 7140 gttagaatgt acatcttctt tgcatcattt tattatgtat ggaaaagtta tgtgcatgtt 7200 gtagacggtt gtaattcatc aacttgtatg atgtgttaca aacgtaatag agcaacaaga 7260 gtcgaatgta caactattgt taatggtgtt agaaggtcct tttatgtcta tgctaatgga 7320 ggtaaaggct tttgcaaact acacaattgg aattgtgtta attgtgatac attctgtgct 7380 ggtagtacat ttattagtga tgaagttgcg agagacttgt cactacagtt taaaagacca 7440 ataaatccta ctgaccagtc ttcttacatc gttgatagtg ttacagtgaa gaatggttcc 7500 atccatcttt actttgataa agctggtcaa aagacttatg aaagacattc tctctctcat 7560 tttgttaact tagacaacct gagagctaat aacactaaag gttcattgcc tattaatgtt 7620 atagtttttg atggtaaatc aaaatgtgaa gaatcatctg caaaatcagc gtctgtttac 7680 tacagtcagc ttatgtgtca acctatactg ttactagatc aggcattagt gtctgatgtt 7740 ggtgatagtg cggaagttgc agttaaaatg tttgatgctt acgttaatac gttttcatca 7800 acttttaacg taccaatgga aaaactcaaa acactagttg caactgcaga agctgaactt 7860 gcaaagaatg tgtccttaga caatgtctta tctactttta tttcagcagc tcggcaaggg 7920 tttgttgatt cagatgtaga aactaaagat gttgttgaat gtcttaaatt gtcacatcaa 7980 tctgacatag aagttactgg cgatagttgt aataactata tgctcaccta taacaaagtt 8040 gaaaacatga caccccgtga ccttggtgct tgtattgact gtagtgcgcg tcatattaat 8100 gcgcaggtag caaaaagtca caacattgct ttgatatgga acgttaaaga tttcatgtca 8160 ttgtctgaac aactacgaaa acaaatacgt agtgctgcta aaaagaataa cttacctttt 8220 aagttgacat gtgcaactac tagacaagtt gttaatgttg taacaacaaa gatagcactt 8280 aagggtggta aaattgttaa taattggttg aagcagttaa ttaaagttac acttgtgttc 8340 ctttttgttg ctgctatttt ctatttaata acacctgttc atgtcatgtc taaacatact 8400 gacttttcaa gtgaaatcat aggatacaag gctattgatg gtggtgtcac tcgtgacata 8460 gcatctacag atacttgttt tgctaacaaa catgctgatt ttgacacatg gtttagccag 8520 cgtggtggta gttatactaa tgacaaagct tgcccattga ttgctgcagt cataacaaga 8580 gaagtgggtt ttgtcgtgcc tggtttgcct ggcacgatat tacgcacaac taatggtgac 8640 tttttgcatt tcttacctag agtttttagt gcagttggta acatctgtta cacaccatca 8700 aaacttatag agtacactga ctttgcaaca tcagcttgtg ttttggctgc tgaatgtaca 8760 atttttaaag atgcttctgg taagccagta ccatattgtt atgataccaa tgtactagaa 8820 ggttctgttg cttatgaaag tttacgccct gacacacgtt atgtgctcat ggatggctct 8880 attattcaat ttcctaacac ctaccttgaa ggttctgtta gagtggtaac aacttttgat 8940 tctgagtact gtaggcacgg cacttgtgaa agatcagaag ctggtgtttg tgtatctact 9000 agtggtagat gggtacttaa caatgattat tacagatctt taccaggagt tttctgtggt 9060 gtagatgctg taaatttact tactaatatg tttacaccac taattcaacc tattggtgct 9120 ttggacatat cagcatctat agtagctggt ggtattgtag ctatcgtagt aacatgcctt 9180 gcctactatt ttatgaggtt tagaagagct tttggtgaat acagtcatgt agttgccttt 9240 aatactttac tattccttat gtcattcact gtactctgtt taacaccagt ttactcattc 9300 ttacctggtg tttattctgt tatttacttg tacttgacat tttatcttac taatgatgtt 9360 tcttttttag cacatattca gtggatggtt atgttcacac ctttagtacc tttctggata 9420 acaattgctt atatcatttg tatttccaca aagcatttct attggttctt tagtaattac 9480 ctaaagagac gtgtagtctt taatggtgtt tcctttagta cttttgaaga agctgcgctg 9540 tgcacctttt tgttaaataa agaaatgtat ctaaagttgc gtagtgatgt gctattacct 9600 cttacgcaat ataatagata cttagctctt tataataagt acaagtattt tagtggagca 9660 atggatacaa ctagctacag agaagctgct tgttgtcatc tcgcaaaggc tctcaatgac 9720 ttcagtaact caggttctga tgttctttac caaccaccac aaacctctat cacctcagct 9780 gttttgcaga gtggttttag aaaaatggca ttcccatctg gtaaagttga gggttgtatg 9840 gtacaagtaa cttgtggtac aactacactt aacggtcttt ggcttgatga cgtagtttac 9900 tgtccaagac atgtgatctg cacctctgaa gacatgctta accctaatta tgaagattta 9960 ctcattcgta agtctaatca taatttcttg gtacaggctg gtaatgttca actcagggtt 10020 attggacatt ctatgcaaaa ttgtgtactt aagcttaagg ttgatacagc caatcctaag 10080 acacctaagt ataagtttgt tcgcattcaa ccaggacaga ctttttcagt gttagcttgt 10140 tacaatggtt caccatctgg tgtttaccaa tgtgctatga ggcccaattt cactattaag 10200 ggttcattcc ttaatggttc atgtggtagt gttggtttta acatagatta tgactgtgtc 10260 tctttttgtt acatgcacca tatggaatta ccaactggag ttcatgctgg cacagactta 10320 gaaggtaact tttatggacc ttttgttgac aggcaaacag cacaagcagc tggtacggac 10380 acaactatta cagttaatgt tttagcttgg ttgtacgctg ctgttataaa tggagacagg 10440 tggtttctca atcgatttac cacaactctt aatgacttta accttgtggc tatgaagtac 10500 aattatgaac ctctaacaca agaccatgtt gacatactag gacctctttc tgctcaaact 10560 ggaattgccg ttttagatat gtgtgcttca ttaaaagaat tactgcaaaa tggtatgaat 10620 ggacgtacca tattgggtag tgctttatta gaagatgaat ttacaccttt tgatgttgtt 10680 agacaatgct caggtgttac tttccaaagt gcagtgaaaa gaacaatcaa gggtacacac 10740 cactggttgt tactcacaat tttgacttca cttttagttt tagtccagag tactcaatgg 10800 tctttgttct tttttttgta tgaaaatgcc tttttacctt ttgctatggg tattattgct 10860 atgtctgctt ttgcaatgat gtttgtcaaa cataagcatg catttctctg tttgtttttg 10920 ttaccttctc ttgccactgt agcttatttt aatatggtct atatgcctgc tagttgggtg 10980 atgcgtatta tgacatggtt ggatatggtt gatactagtt tgaagctaaa agactgtgtt 11040 atgtatgcat cagctgtagt gttactaatc cttatgacag caagaactgt gtatgatgat 11100 ggtgctagga gagtgtggac acttatgaat gtcttgacac tcgtttataa agtttattat 11160 ggtaatgctt tagatcaagc catttccatg tgggctctta taatctctgt tacttctaac 11220 tactcaggtg tagttacaac tgtcatgttt ttggccagag gtattgtttt tatgtgtgtt 11280 gagtattgcc ctattttctt cataactggt aatacacttc agtgtataat gctagtttat 11340 tgtttcttag gctatttttg tacttgttac tttggcctct tttgtttact caaccgctac 11400 tttagactga ctcttggtgt ttatgattac ttagtttcta cacaggagtt tagatatatg 11460 aattcacagg gactactccc acccaagaat agcatagatg ccttcaaact caacattaaa 11520 ttgttgggtg ttggtggcaa accttgtatc aaagtagcca ctgtacagtc taaaatgtca 11580 gatgtaaagt gcacatcagt agtcttactc tcagttttgc aacaactcag agtagaatca 11640 tcatctaaat tgtgggctca atgtgtccag ttacacaatg acattctctt agctaaagat 11700 actactgaag cctttgaaaa aatggtttca ctactttctg ttttgctttc catgcagggt 11760 gctgtagaca taaacaagct ttgtgaagaa atgctggaca acagggcaac cttacaagct 11820 atagcctcag agtttagttc ccttccatca tatgcagctt ttgctactgc tcaagaagct 11880 tatgagcagg ctgttgctaa tggtgattct gaagttgttc ttaaaaagtt gaagaagtct 11940 ttgaatgtgg ctaaatctga atttgaccgt gatgcagcca tgcaacgtaa gttggaaaag 12000 atggctgatc aagctatgac ccaaatgtat aaacaggcta gatctgagga caagagggca 12060 aaagttacta gtgctatgca gacaatgctt ttcactatgc ttagaaagtt ggataatgat 12120 gcactcaaca acattatcaa caatgcaaga gatggttgtg ttcccttgaa cataatacct 12180 cttacaacag cagccaaact aatggttgtc ataccagact ataacacata taaaaatacg 12240 tgtgatggta caacatttac ttatgcatca gcattgtggg aaatccaaca ggttgtagat 12300 gcagatagta aaattgttca acttagtgaa attagtatgg acaattcacc taatttagca 12360 tggcctctta ttgtaacagc tttaagggcc aattctgctg tcaaattaca gaataatgag 12420 cttagtcctg ttgcactacg acagatgtct tgtgctgccg gtactacaca aactgcttgc 12480 actgatgaca atgcgttagc ttactacaac acaacaaagg gaggtaggtt tgtacttgca 12540 ctgttatccg atttacagga tttgaaatgg gctagattcc ctaagagtga tggaactggt 12600 actatctata cagaactgga accaccttgt aggtttgtta cagacacacc taaaggtcct 12660 aaagtgaagt atttatactt tattaaagga ttaaacaacc taaatagagg tatggtactt 12720 ggtagtttag ctgccacagt acgtctacaa gctggtaatg caacagaagt gcctgccaat 12780 tcaactgtat tatctttctg tgcttttgct gtagatgctg ctaaagctta caaagattat 12840 ctagctagtg ggggacaacc aatcactaat tgtgttaaga tgttgtgtac acacactggt 12900 actggtcagg caataacagt tacaccggaa gccaatatgg atcaagaatc ctttggtggt 12960 gcatcgtgtt gtctgtactg ccgttgccac atagatcatc caaatcctaa aggattttgt 13020 gacttaaaag gtaagtatgt acaaatacct acaacttgtg ctaatgaccc tgtgggtttt 13080 acacttaaaa acacagtctg taccgtctgc ggtatgtgga aaggttatgg ctgtagttgt 13140 gatcaactcc gcgaacccat gcttcagtca gctgatgcac aatcgttttt aaaccgggtt 13200 tgcggtgtaa gtgcagcccg tcttacaccg tgcggcacag gcactagtac tgatgtcgta 13260 tacagggctt ttgacatcta caatgataaa gtagctggtt ttgctaaatt cctaaaaact 13320 aattgttgtc gcttccaaga aaaggacgaa gatgacaatt taattgattc ttactttgta 13380 gttaagagac acactttctc taactaccaa catgaagaaa caatttataa tttacttaag 13440 gattgtccag ctgttgctaa acatgacttc tttaagttta gaatagacgg tgacatggta 13500 ccacatatat cacgtcaacg tcttactaaa tacacaatgg cagacctcgt ctatgcttta 13560 aggcattttg atgaaggtaa ttgtgacaca ttaaaagaaa tacttgtcac atacaattgt 13620 tgtgatgatg attatttcaa taaaaaggac tggtatgatt ttgtagaaaa cccagatata 13680 ttacgcgtat acgccaactt aggtgaacgt gtacgccaag ctttgttaaa aacagtacaa 13740 ttctgtgatg ccatgcgaaa tgctggtatt gttggtgtac tgacattaga taatcaagat 13800 ctcaatggta actggtatga tttcggtgat ttcatacaaa ccacgccagg tagtggagtt 13860 cctgttgtag attcttatta ttcattgtta atgcctatat taaccttgac cagggcttta 13920 actgcagagt cacatgttga cactgactta acaaagcctt acattaagtg ggatttgtta 13980 aaatatgact tcacggaaga gaggttaaaa ctctttgacc gttattttaa atattgggat 14040 cagacatacc acccaaattg tgttaactgt ttggatgaca gatgcattct gcattgtgca 14100 aactttaatg ttttattctc tacagtgttc ccacttacaa gttttggacc actagtgaga 14160 aaaatatttg ttgatggtgt tccatttgta gtttcaactg gataccactt cagagagcta 14220 ggtgttgtac ataatcagga tgtaaactta catagctcta gacttagttt taaggaatta 14280 cttgtgtatg ctgctgaccc tgctatgcac gctgcttctg gtaatctatt actagataaa 14340 cgcactacgt gcttttcagt agctgcactt actaacaatg ttgcttttca aactgtcaaa 14400 cctggtaatt ttaacaaaga cttctatgac tttgctgtgt ctaagggttt ctttaaggaa 14460 ggaagttctg ttgaattaaa acacttcttc tttgctcagg atggtaatgc tgctatcagc 14520 gattatgact actatcgtta taatctacca acaatgtgtg atatcagaca actactattt 14580 gtagttgaag ttgttgataa gtactttgat tgttacgatg gtggctgtat taatgctaac 14640 caagtcatcg tcaacaacct agacaaatca gctggttttc catttaataa atggggtaag 14700 gctagacttt attatgattc aatgagttat gaggatcaag atgcactttt cgcatataca 14760 aaacgtaatg tcatccctac tataactcaa atgaatctta agtatgccat tagtgcaaag 14820 aatagagctc gcaccgtagc tggtgtctct atctgtagta ctatgaccaa tagacagttt 14880 catcaaaaat tattgaaatc aatagccgcc actagaggag ctactgtagt aattggaaca 14940 agcaaattct atggtggttg gcacaacatg ttaaaaactg tttatagtga tgtagaaaac 15000 cctcatctta tgggttggga ttatcctaaa tgtgatagag ccatgcctaa catgcttaga 15060 attatggcct cacttgttct tgctcgcaaa catacaacgt gttgtagctt gtcacaccgt 15120 ttctatagat tagctaatga gtgtgctcaa gtattgagtg aaatggtcat gtgtggcggt 15180 tcactatatg ttaaaccagg tggaacctca tcaggagatg ccacaactgc ttatgctaat 15240 agtgttttta acatttgtca agctgtcacg gccaatgtta atgcactttt atctactgat 15300 ggtaacaaaa ttgccgataa gtatgtccgc aatttacaac acagacttta tgagtgtctc 15360 tatagaaata gagatgttga cacagacttt gtgaatgagt tttacgcata tttgcgtaaa 15420 catttctcaa tgatgatact ctctgacgat gctgttgtgt gtttcaatag cacttatgca 15480 tctcaaggtc tagtggctag cataaagaac tttaagtcag ttctttatta tcaaaacaat 15540 gtttttatgt ctgaagcaaa atgttggact gagactgacc ttactaaagg acctcatgaa 15600 ttttgctctc aacatacaat gctagttaaa cagggtgatg attatgtgta ccttccttac 15660 ccagatccat caagaatcct aggggccggc tgttttgtag atgatatcgt aaaaacagat 15720 ggtacactta tgattgaacg gttcgtgtct ttagctatag atgcttaccc acttactaaa 15780 catcctaatc aggagtatgc tgatgtcttt catttgtact tacaatacat aagaaagcta 15840 catgatgagt taacaggaca catgttagac atgtattctg ttatgcttac taatgataac 15900 acctcaaggt attgggaacc tgagttttat gaggctatgt acacaccgca tacagtctta 15960 caggctgttg gggcttgtgt tctttgcaat tcacagactt cattaagatg tggtgcttgc 16020 atacgtagac cattcttatg ttgtaaatgc tgttacgacc atgtcatatc aacatcacat 16080 aaattagtct tgtctgttaa tccgtatgtt tgcaatgctc caggttgtga tgtcacagat 16140 gtgactcaac tttacttagg aggtatgagc tattattgta aatcacataa accatccatt 16200 agttttccat tgtgtgctaa tggacaagtt tttggtttat ataaaaatac atgtgttggt 16260 agcgataatg ttactgactt taatgcaatt gcaacatgtg actggacaaa tgctggtgat 16320 tacattttag ctaacacctg tactgaaaga ctcaagcttt ttgcagcaga aacgctcaaa 16380 gctactgagg agacatttaa actgtcttat ggtattgcta ctgtacgtga agtgctgtct 16440 gacagagaat tacatctttc atgggaagtt ggtaaaccta gaccaccact taaccgaaat 16500 tatgtcttta ctggttatcg tgtaactaaa aacagtaaag tacaaatagg agagtacacc 16560 tttgaaaaag gtgactatgg tgatgctgtt gtttaccgag gtacaacaac ttacaaatta 16620 aatgttggtg attattttgt gctgacatca catacagtaa tgccattaag tgcacctaca 16680 ctagtgccac aagagcacta tgttagaatt actggcttat acccaacact caatatctca 16740 gatgagtttt ctagcaatgt tgcaaattat caaaaggttg gtatgcaaaa gtattctaca 16800 ctccagggac cacctggtac tggtaagagt cattttgcta ttggcctagc tctctactac 16860 ccttctgctc gcatagtgta tacagcttgc tctcatgccg ctgttgatgc actatgtgag 16920 aaggcattaa aatatttgcc tatagataaa tgtagtagaa ttatacctgc acgtgctcgt 16980 gtagagtgtt ttgataaatt caaagtgaat tcaacattag aacagtatgt cttttgtact 17040 gtaaatgcat tgcctgagac gacagcagat atagttgtct ttgatgaaat ttcaatggcc 17100 acaaattatg atttgagtgt tgtcaatgcc agattacgtg ctaagcacta tgtgtacatt 17160 ggcgaccctg ctcaattacc tgcaccacgc acattgctaa ctaagggcac actagaacca 17220 gaatatttca attcagtgtg tagacttatg aaaactatag gtccagacat gttcctcgga 17280 acttgtcggc gttgtcctgc tgaaattgtt gacactgtga gtgctttggt ttatgataat 17340 aggcttaaag cacataaaga caaatcagct caatgcttta aaatgtttta taagggtgtt 17400 atcacgcatg atgtttcatc tgcaattaac aggccacaaa taggcgtggt aagagaattc 17460 cttacacgta accctgcttg gagaaaagct gtctttattt caccttataa ttcacagaat 17520 gctgtagcct caaagatttt gggactacca actcaaactg ttgattcatc acagggctca 17580 gaatatgact atgtcatatt cactcaaacc actgaaacag ctcactcttg taatgtaaac 17640 agatttaatg ttgctattac cagagcaaaa gtaggcatac tttgcataat gtctgataga 17700 gacctttatg acaagttgca atttacaagt cttgaaattc cacgtaggaa tgtggcaact 17760 ttacaagctg aaaatgtaac aggactcttt aaagattgta gtaaggtaat cactgggtta 17820 catcctacac aggcacctac acacctcagt gttgacacta aattcaaaac tgaaggttta 17880 tgtgttgaca tacctggcat acctaaggac atgacctata gaagactcat ctctatgatg 17940 ggttttaaaa tgaattatca agttaatggt taccctaaca tgtttatcac ccgcgaagaa 18000 gctataagac atgtacgtgc atggattggc ttcgatgtcg aggggtgtca tgctactaga 18060 gaagctgttg gtaccaattt acctttacag ctaggttttt ctacaggtgt taacctagtt 18120 gctgtaccta caggttatgt tgatacacct aataatacag atttttccag agttagtgct 18180 aaaccaccgc ctggagatca atttaaacac ctcataccac ttatgtacaa aggacttcct 18240 tggaatgtag tgcgtataaa gattgtacaa atgttaagtg acacacttaa aaatctctct 18300 gacagagtcg tatttgtctt atgggcacat ggctttgagt tgacatctat gaagtatttt 18360 gtgaaaatag gacctgagcg cacctgttgt ctatgtgata gacgtgccac atgcttttcc 18420 actgcttcag acacttatgc ctgttggcat cattctattg gatttgatta cgtctataat 18480 ccgtttatga ttgatgttca acaatggggt tttacaggta acctacaaag caaccatgat 18540 ctgtattgtc aagtccatgg taatgcacat gtagctagtt gtgatgcaat catgactagg 18600 tgtctagctg tccacgagtg ctttgttaag cgtgttgact ggactattga atatcctata 18660 attggtgatg aactgaagat taatgcggct tgtagaaagg ttcaacacat ggttgttaaa 18720 gctgcattat tagcagacaa attcccagtt cttcacgaca ttggtaaccc taaagctatt 18780 aagtgtgtac ctcaagctga tgtagaatgg aagttctatg atgcacagcc ttgtagtgac 18840 aaagcttata aaatagaaga attattctat tcttatgcca cacattctga caaattcaca 18900 gatggtgtat gcctattttg gaattgcaat gtcgatagat atcctgctaa ttccattgtt 18960 tgtagatttg acactagagt gctatctaac cttaacttgc ctggttgtga tggtggcagt 19020 ttgtatgtaa ataaacatgc attccacaca ccagcttttg ataaaagtgc ttttgttaat 19080 ttaaaacaat taccattttt ctattactct gacagtccat gtgagtctca tggaaaacaa 19140 gtagtgtcag atatagatta tgtaccacta aagtctgcta cgtgtataac acgttgcaat 19200 ttaggtggtg ctgtctgtag acatcatgct aatgagtaca gattgtatct cgatgcttat 19260 aacatgatga tctcagctgg ctttagcttg tgggtttaca aacaatttga tacttataac 19320 ctctggaaca cttttacaag acttcagagt ttagaaaatg tggcttttaa tgttgtaaat 19380 aagggacact ttgatggaca acagggtgaa gtaccagttt ctatcattaa taacactgtt 19440 tacacaaaag ttgatggtgt tgatgtagaa ttgtttgaaa ataaaacaac attacctgtt 19500 aatgtagcat ttgagctttg ggctaagcgc aacattaaac cagtaccaga ggtgaaaata 19560 ctcaataatt tgggtgtgga cattgctgct aatactgtga tctgggacta caaaagagat 19620 gctccagcac atatatctac tattggtgtt tgttctatga ctgacatagc caagaaacca 19680 actgaaacga tttgtgcacc actcactgtc ttttttgatg gtagagttga tggtcaagta 19740 gacttattta gaaatgcccg taatggtgtt cttattacag aaggtagtgt taaaggttta 19800 caaccatctg taggtcccaa acaagctagt cttaatggag tcacattaat tggagaagcc 19860 gtaaaaacac agttcaatta ttataagaaa gttgatggtg ttgtccaaca attacctgaa 19920 acttacttta ctcagagtag aaatttacaa gaatttaaac ccaggagtca aatggaaatt 19980 gatttcttag aattagctat ggatgaattc attgaacggt ataaattaga aggctatgcc 20040 ttcgaacata tcgtttatgg agattttagt catagtcagt taggtggttt acatctactg 20100 attggactag ctaaacgttt taaggaatca ccttttgaat tagaagattt tattcctatg 20160 gacagtacag ttaaaaacta tttcataaca gatgcgcaaa caggttcatc taagtgtgtg 20220 tgttctgtta ttgatttatt acttgatgat tttgttgaaa taataaaatc ccaagattta 20280 tctgtagttt ctaaggttgt caaagtgact attgactata cagaaatttc atttatgctt 20340 tggtgtaaag atggccatgt agaaacattt tacccaaaat tacaatctag tcaagcgtgg 20400 caaccgggtg ttgctatgcc taatctttac aaaatgcaaa gaatgctatt agaaaagtgt 20460 gaccttcaaa attatggtga tagtgcaaca ttacctaaag gcataatgat gaatgtcgca 20520 aaatatactc aactgtgtca atatttaaac acattaacat tagctgtacc ctataatatg 20580 agagttatac attttggtgc tggttctgat aaaggagttg caccaggtac agctgtttta 20640 agacagtggt tgcctacggg tacgctgctt gtcgattcag atcttaatga ctttgtctct 20700 gatgcagatt caactttgat tggtgattgt gcaactgtac atacagctaa taaatgggat 20760 ctcattatta gtgatatgta cgaccctaag actaaaaatg ttacaaaaga aaatgactct 20820 aaagagggtt ttttcactta catttgtggg tttatacaac aaaagctagc tcttggaggt 20880 tccgtggcta taaagataac agaacattct tggaatgctg atctttataa gctcatggga 20940 cacttcgcat ggtggacagc ctttgttact aatgtgaatg cgtcatcatc tgaagcattt 21000 ttaattggat gtaattatct tggcaaacca cgcgaacaaa tagatggtta tgtcatgcat 21060 gcaaattaca tattttggag gaatacaaat ccaattcagt tgtcttccta ttctttattt 21120 gacatgagta aatttcccct taaattaagg ggtactgctg ttatgtcttt aaaagaaggt 21180 caaatcaatg atatgatttt atctcttctt agtaaaggta gacttataat tagagaaaac 21240 aacagagttg ttatttctag tgatgttctt gttaacaact aa 21282 <210> 302 <211> 13209 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 302 atggagagcc ttgtccctgg tttcaacgag aaaacacacg tccaactcag tttgcctgtt 60 ttacaggttc gcgacgtgct cgtacgtggc tttggagact ccgtggagga ggtcttatca 120 gaggcacgtc aacatcttaa agatggcact tgtggcttag tagaagttga aaaaggcgtt 180 ttgcctcaac ttgaacagcc ctatgtgttc atcaaacgtt cggatgctcg aactgcacct 240 catggtcatg ttatggttga gctggtagca gaactcgaag gcattcagta cggtcgtagt 300 ggtgagacac ttggtgtcct tgtccctcat gtgggcgaaa taccagtggc ttaccgcaag 360 gttcttcttc gtaagaacgg taataaagga gctggtggcc atagttacgg cgccgatcta 420 aagtcatttg acttaggcga cgagcttggc actgatcctt atgaagattt tcaagaaaac 480 tggaacacta aacatagcag tggtgttacc cgtgaactca tgcgtgagct taacggaggg 540 gcatacactc gctatgtcga taacaacttc tgtggccctg atggctaccc tcttgagtgc 600 attaaagacc ttctagcacg tgctggtaaa gcttcatgca ctttgtctga acaactggac 660 tttattgaca ctaagagggg tgtatactgc tgccgtgaac atgagcatga aattgcttgg 720 tacacggaac gttctgaaaa gagctatgaa ttgcagacac cttttgaaat taaattggca 780 aagaaatttg acaccttcaa tggggaatgt ccaaattttg tatttccctt aaattccata 840 atcaagacta ttcaaccaag ggttgaaaag aaaaagcttg atggctttat gggtagaatt 900 cgatctgtct atccagttgc gtcaccaaat gaatgcaacc aaatgtgcct ttcaactctc 960 atgaagtgtg atcattgtgg tgaaacttca tggcagacgg gcgattttgt taaagccact 1020 tgcgaatttt gtggcactga gaatttgact aaagaaggtg ccactacttg tggttactta 1080 ccccaaaatg ctgttgttaa aatttattgt ccagcatgtc acaattcaga agtaggacct 1140 gagcatagtc ttgccgaata ccataatgaa tctggcttga aaaccattct tcgtaagggt 1200 ggtcgcacta ttgcctttgg aggctgtgtg ttctcttatg ttggttgcca taacaagtgt 1260 gcctattggg ttccacgtgc tagcgctaac ataggttgta accatacagg tgttgttgga 1320 gaaggttccg aaggtcttaa tgacaacctt cttgaaatac tccaaaaaga gaaagtcaac 1380 atcaatattg ttggtgactt taaacttaat gaagagatcg ccattatttt ggcatctttt 1440 tctgcttcca caagtgcttt tgtggaaact gtgaaaggtt tggattataa agcattcaaa 1500 caaattgttg aatcctgtgg taattttaaa gttacaaaag gaaaagctaa aaaaggtgcc 1560 tggaatattg gtgaacagaa atcaatactg agtcctcttt atgcatttgc atcagaggct 1620 gctcgtgttg tacgatcaat tttctcccgc actcttgaaa ctgctcaaaa ttctgtgcgt 1680 gttttacaga aggccgctat aacaatacta gatggaattt cacagtattc actgagactc 1740 attgatgcta tgatgttcac atctgatttg gctactaaca atctagttgt aatggcctac 1800 attacaggtg gtgttgttca gttgacttcg cagtggctaa ctaacatctt tggcactgtt 1860 tatgaaaaac tcaaacccgt ccttgattgg cttgaagaga agtttaagga aggtgtagag 1920 tttcttagag acggttggga aattgttaaa tttatctcaa cctgtgcttg tgaaattgtc 1980 ggtggacaaa ttgtcacctg tgcaaaggaa attaaggaga gtgttcagac attctttaag 2040 cttgtaaata aatttttggc tttgtgtgct gactctatca ttattggtgg agctaaactt 2100 aaagccttga atttaggtga aacatttgtc acgcactcaa agggattgta cagaaagtgt 2160 gttaaatcca gagaagaaac tggcctactc atgcctctaa aagccccaaa agaaattatc 2220 ttcttagagg gagaaacact tcccacagaa gtgttaacag aggaagttgt cttgaaaact 2280 ggtgatttac aaccattaga acaacctact agtgaagctg ttgaagctcc attggttggt 2340 acaccagttt gtattaacgg gcttatgttg ctcgaaatca aagacacaga aaagtactgt 2400 gcccttgcac ctaatatgat ggtaacaaac aataccttca cactcaaagg cggtgcacca 2460 acaaaggtta cttttggtga tgacactgtg atagaagtgc aaggttacaa gagtgtgaat 2520 atcacttttg aacttgatga aaggattgat aaagtactta atgagaagtg ctctgcctat 2580 acagttgaac tcggtacaga agtaaatgag ttcgcctgtg ttgtggcaga tgctgtcata 2640 aaaactttgc aaccagtatc tgaattactt acaccactgg gcattgattt agatgagtgg 2700 agtatggcta catactactt atttgatgag tctggtgagt ttaaattggc ttcacatatg 2760 tattgttctt tttaccctcc agatgaggat gaagaagaag gtgattgtga agaagaagag 2820 tttgagccat caactcaata tgagtatggt actgaagatg attaccaagg taaacctttg 2880 gaatttggtg ccacttctgc tgctcttcaa cctgaagaag agcaagaaga agattggtta 2940 gatgatgata gtcaacaaac tgttggtcaa caagacggca gtgaggacaa tcagacaact 3000 attattcaaa caattgttga ggttcaacct caattagaga tggaacttac accagttgtt 3060 cagactattg aagtgaatag ttttagtggt tatttaaaac ttactgacaa tgtatacatt 3120 aaaaatgcag acattgtgga agaagctaaa aaggtaaaac caacagtggt tgttaatgca 3180 gccaatgttt accttaaaca tggaggaggt gttgcaggag ccttaaataa ggctactaac 3240 aatgccatgc aagttgaatc tgatgattac atagctacta atggaccact taaagtgggt 3300 ggtagttgtg ttttaagcgg acacaatctt gctaaacact gtcttcatgt tgtcggccca 3360 aatgttaaca aaggtgaaga cattcaactt cttaagagtg cttatgaaaa ttttaatcag 3420 cacgaagttc tacttgcacc attattatca gctggtattt ttggtgctga ccctatacat 3480 tctttaagag tttgtgtaga tactgttcgc acaaatgtct acttagctgt ctttgataaa 3540 aatctctatg acaaacttgt ttcaagcttt ttggaaatga agagtgaaaa gcaagttgaa 3600 caaaagatcg ctgagattcc taaagaggaa gttaagccat ttataactga aagtaaacct 3660 tcagttgaac agagaaaaca agatgataag aaaatcaaag cttgtgttga agaagttaca 3720 acaactctgg aagaaactaa gttcctcaca gaaaacttgt tactttatat tgacattaat 3780 ggcaatcttc atccagattc tgccactctt gttagtgaca ttgacatcac tttcttaaag 3840 aaagatgctc catatatagt gggtgatgtt gttcaagagg gtgttttaac tgctgtggtt 3900 atacctacta aaaaggctgg tggcactact gaaatgctag cgaaagcttt gagaaaagtg 3960 ccaacagaca attatataac cacttacccg ggtcagggtt taaatggtta cactgtagag 4020 gaggcaaaga cagtgcttaa aaagtgtaaa agtgcctttt acattctacc atctattatc 4080 tctaatgaga agcaagaaat tcttggaact gtttcttgga atttgcgaga aatgcttgca 4140 catgcagaag aaacacgcaa attaatgcct gtctgtgtgg aaactaaagc catagtttca 4200 actatacagc gtaaatataa gggtattaaa atacaagagg gtgtggttga ttatggtgct 4260 agattttact tttacaccag taaaacaact gtagcgtcac ttatcaacac acttaacgat 4320 ctaaatgaaa ctcttgttac aatgccactt ggctatgtaa cacatggctt aaatttggaa 4380 gaagctgctc ggtatatgag atctctcaaa gtgccagcta cagtttctgt ttcttcacct 4440 gatgctgtta cagcgtataa tggttatctt acttcttctt ctaaaacacc tgaagaacat 4500 tttattgaaa ccatctcact tgctggttcc tataaagatt ggtcctattc tggacaatct 4560 acacaactag gtatagaatt tcttaagaga ggtgataaaa gtgtatatta cactagtaat 4620 cctaccacat tccacctaga tggtgaagtt atcacctttg acaatcttaa gacacttctt 4680 tctttgagag aagtgaggac tattaaggtg tttacaacag tagacaacat taacctccac 4740 acgcaagttg tggacatgtc aatgacatat ggacaacagt ttggtccaac ttatttggat 4800 ggagctgatg ttactaaaat aaaacctcat aattcacatg aaggtaaaac attttatgtt 4860 ttacctaatg atgacactct acgtgttgag gcttttgagt actaccacac aactgatcct 4920 agttttctgg gtaggtacat gtcagcatta aatcacacta aaaagtggaa atacccacaa 4980 gttaatggtt taacttctat aaaatgggca gataacaact gttatcttgc cactgcattg 5040 ttaacactcc aacaaataga gttgaagttt aatccacctg ctctacaaga tgcttattac 5100 agagcaaggg ctggtgaagc tgataacttt tgtgcactta tcttagccta ctgtaataag 5160 acagtaggtg agttaggtga tgttagagaa acaatgagtt acttgtttca acatgccaat 5220 ttagattctt gcaaaagagt cttgaacgtg gtgtgtaaaa cttgtggaca acagcagaca 5280 acccttaagg gtgtagaagc tgttatgtac atgggcacac tttcttatga acaatttaag 5340 aaaggtgttc agataccttg tacgtgtggt aaacaagcta caaaatatct agtacaacag 5400 gagtcacctt ttgttatgat gtcagcacca cctgctcagt atgaacttaa gcatggtaca 5460 tttacttgtg ctagtgagta cactggtaat taccagtgtg gtcactataa acatataact 5520 tctaaagaaa ctttgtattg catagacggt gctttactta caaagtcctc agaatacaaa 5580 ggtcctatta cggatgtttt ctacaaagaa aacagttaca caacaaccat aaaaccagtt 5640 acttataaat tggatggtgt tgtttgtaca gaaattgacc ctaagttgga caattattat 5700 aagaaagaca attcttattt tacagagcaa ccaattgatc ttgtaccaaa ccaaccatat 5760 ccaaacgcaa gcttcgataa ttttaagttt gtatgtgata atatcaaatt tgctgatgat 5820 ttaaaccagt taactggtta taagaaacct gcttcaagag agcttaaagt tacatttttc 5880 cctgacttaa atggtgatgt ggtggctatt gattataaac actacacacc ctcttttaag 5940 aaaggagcta aattgttaca taaacctatt gtttggcatg ttaacaatgc aactaataaa 6000 gccacgtata aaccaaatac ctggtgtata cgttgtcttt ggagcacaaa accagttgaa 6060 acatcaaatt cgtttgatgt actgaagtca gaggacgcgc agggaatgga taatcttgcc 6120 tgcgaagatc taaaaccagt ctctgaagaa gtagtggaaa atcctaccat acagaaagac 6180 gttcttgagt gtaatgtgaa aactaccgaa gttgtaggag acattatact taaaccagca 6240 aataatagtt taaaaattac agaagaggtt ggccacacag atctaatggc tgcttatgta 6300 gacaattcta gtcttactat taagaaacct aatgaattat ctagagtatt aggtttgaaa 6360 acccttgcta ctcatggttt agctgctgtt aatagtgtcc cttgggatac tatagctaat 6420 tatgctaagc cttttcttaa caaagttgtt agtacaacta ctaacatagt tacacggtgt 6480 ttaaaccgtg tttgtactaa ttatatgcct tatttcttta ctttattgct acaattgtgt 6540 acttttacta gaagtacaaa ttctagaatt aaagcatcta tgccgactac tatagcaaag 6600 aatactgtta agagtgtcgg taaattttgt ctagaggctt catttaatta tttgaagtca 6660 cctaattttt ctaaactgat aaatattaca atttggtttt tactattaag tgtttgccta 6720 ggttctttaa tctactcaac cgctgcttta ggtgttttaa tgtctaattt aggcatgcct 6780 tcttactgta ctggttacag agaaggctat ttgaactcta ctaatgtcac tattgcaacc 6840 tactgtactg gttctatacc ttgtagtgtt tgtcttagtg gtttagattc tttagacacc 6900 tatccttctt tagaaactat acaaattacc atttcatctt ttaaatggga tttaactgct 6960 tttggcttag ttgcagagtg gtttttggca tatattcttt tcactaggtt tttctatgta 7020 cttggattgg ctgcaatcat gcaattgttt ttcagctatt ttgcagtaca ttttattagt 7080 aattcttggc ttatgtggtt aataattaat cttgtacaaa tggccccgat ttcagctatg 7140 gttagaatgt acatcttctt tgcatcattt tattatgtat ggaaaagtta tgtgcatgtt 7200 gtagacggtt gtaattcatc aacttgtatg atgtgttaca aacgtaatag agcaacaaga 7260 gtcgaatgta caactattgt taatggtgtt agaaggtcct tttatgtcta tgctaatgga 7320 ggtaaaggct tttgcaaact acacaattgg aattgtgtta attgtgatac attctgtgct 7380 ggtagtacat ttattagtga tgaagttgcg agagacttgt cactacagtt taaaagacca 7440 ataaatccta ctgaccagtc ttcttacatc gttgatagtg ttacagtgaa gaatggttcc 7500 atccatcttt actttgataa agctggtcaa aagacttatg aaagacattc tctctctcat 7560 tttgttaact tagacaacct gagagctaat aacactaaag gttcattgcc tattaatgtt 7620 atagtttttg atggtaaatc aaaatgtgaa gaatcatctg caaaatcagc gtctgtttac 7680 tacagtcagc ttatgtgtca acctatactg ttactagatc aggcattagt gtctgatgtt 7740 ggtgatagtg cggaagttgc agttaaaatg tttgatgctt acgttaatac gttttcatca 7800 acttttaacg taccaatgga aaaactcaaa acactagttg caactgcaga agctgaactt 7860 gcaaagaatg tgtccttaga caatgtctta tctactttta tttcagcagc tcggcaaggg 7920 tttgttgatt cagatgtaga aactaaagat gttgttgaat gtcttaaatt gtcacatcaa 7980 tctgacatag aagttactgg cgatagttgt aataactata tgctcaccta taacaaagtt 8040 gaaaacatga caccccgtga ccttggtgct tgtattgact gtagtgcgcg tcatattaat 8100 gcgcaggtag caaaaagtca caacattgct ttgatatgga acgttaaaga tttcatgtca 8160 ttgtctgaac aactacgaaa acaaatacgt agtgctgcta aaaagaataa cttacctttt 8220 aagttgacat gtgcaactac tagacaagtt gttaatgttg taacaacaaa gatagcactt 8280 aagggtggta aaattgttaa taattggttg aagcagttaa ttaaagttac acttgtgttc 8340 ctttttgttg ctgctatttt ctatttaata acacctgttc atgtcatgtc taaacatact 8400 gacttttcaa gtgaaatcat aggatacaag gctattgatg gtggtgtcac tcgtgacata 8460 gcatctacag atacttgttt tgctaacaaa catgctgatt ttgacacatg gtttagccag 8520 cgtggtggta gttatactaa tgacaaagct tgcccattga ttgctgcagt cataacaaga 8580 gaagtgggtt ttgtcgtgcc tggtttgcct ggcacgatat tacgcacaac taatggtgac 8640 tttttgcatt tcttacctag agtttttagt gcagttggta acatctgtta cacaccatca 8700 aaacttatag agtacactga ctttgcaaca tcagcttgtg ttttggctgc tgaatgtaca 8760 atttttaaag atgcttctgg taagccagta ccatattgtt atgataccaa tgtactagaa 8820 ggttctgttg cttatgaaag tttacgccct gacacacgtt atgtgctcat ggatggctct 8880 attattcaat ttcctaacac ctaccttgaa ggttctgtta gagtggtaac aacttttgat 8940 tctgagtact gtaggcacgg cacttgtgaa agatcagaag ctggtgtttg tgtatctact 9000 agtggtagat gggtacttaa caatgattat tacagatctt taccaggagt tttctgtggt 9060 gtagatgctg taaatttact tactaatatg tttacaccac taattcaacc tattggtgct 9120 ttggacatat cagcatctat agtagctggt ggtattgtag ctatcgtagt aacatgcctt 9180 gcctactatt ttatgaggtt tagaagagct tttggtgaat acagtcatgt agttgccttt 9240 aatactttac tattccttat gtcattcact gtactctgtt taacaccagt ttactcattc 9300 ttacctggtg tttattctgt tatttacttg tacttgacat tttatcttac taatgatgtt 9360 tcttttttag cacatattca gtggatggtt atgttcacac ctttagtacc tttctggata 9420 acaattgctt atatcatttg tatttccaca aagcatttct attggttctt tagtaattac 9480 ctaaagagac gtgtagtctt taatggtgtt tcctttagta cttttgaaga agctgcgctg 9540 tgcacctttt tgttaaataa agaaatgtat ctaaagttgc gtagtgatgt gctattacct 9600 cttacgcaat ataatagata cttagctctt tataataagt acaagtattt tagtggagca 9660 atggatacaa ctagctacag agaagctgct tgttgtcatc tcgcaaaggc tctcaatgac 9720 ttcagtaact caggttctga tgttctttac caaccaccac aaacctctat cacctcagct 9780 gttttgcaga gtggttttag aaaaatggca ttcccatctg gtaaagttga gggttgtatg 9840 gtacaagtaa cttgtggtac aactacactt aacggtcttt ggcttgatga cgtagtttac 9900 tgtccaagac atgtgatctg cacctctgaa gacatgctta accctaatta tgaagattta 9960 ctcattcgta agtctaatca taatttcttg gtacaggctg gtaatgttca actcagggtt 10020 attggacatt ctatgcaaaa ttgtgtactt aagcttaagg ttgatacagc caatcctaag 10080 acacctaagt ataagtttgt tcgcattcaa ccaggacaga ctttttcagt gttagcttgt 10140 tacaatggtt caccatctgg tgtttaccaa tgtgctatga ggcccaattt cactattaag 10200 ggttcattcc ttaatggttc atgtggtagt gttggtttta acatagatta tgactgtgtc 10260 tctttttgtt acatgcacca tatggaatta ccaactggag ttcatgctgg cacagactta 10320 gaaggtaact tttatggacc ttttgttgac aggcaaacag cacaagcagc tggtacggac 10380 acaactatta cagttaatgt tttagcttgg ttgtacgctg ctgttataaa tggagacagg 10440 tggtttctca atcgatttac cacaactctt aatgacttta accttgtggc tatgaagtac 10500 aattatgaac ctctaacaca agaccatgtt gacatactag gacctctttc tgctcaaact 10560 ggaattgccg ttttagatat gtgtgcttca ttaaaagaat tactgcaaaa tggtatgaat 10620 ggacgtacca tattgggtag tgctttatta gaagatgaat ttacaccttt tgatgttgtt 10680 agacaatgct caggtgttac tttccaaagt gcagtgaaaa gaacaatcaa gggtacacac 10740 cactggttgt tactcacaat tttgacttca cttttagttt tagtccagag tactcaatgg 10800 tctttgttct tttttttgta tgaaaatgcc tttttacctt ttgctatggg tattattgct 10860 atgtctgctt ttgcaatgat gtttgtcaaa cataagcatg catttctctg tttgtttttg 10920 ttaccttctc ttgccactgt agcttatttt aatatggtct atatgcctgc tagttgggtg 10980 atgcgtatta tgacatggtt ggatatggtt gatactagtt tgaagctaaa agactgtgtt 11040 atgtatgcat cagctgtagt gttactaatc cttatgacag caagaactgt gtatgatgat 11100 ggtgctagga gagtgtggac acttatgaat gtcttgacac tcgtttataa agtttattat 11160 ggtaatgctt tagatcaagc catttccatg tgggctctta taatctctgt tacttctaac 11220 tactcaggtg tagttacaac tgtcatgttt ttggccagag gtattgtttt tatgtgtgtt 11280 gagtattgcc ctattttctt cataactggt aatacacttc agtgtataat gctagtttat 11340 tgtttcttag gctatttttg tacttgttac tttggcctct tttgtttact caaccgctac 11400 tttagactga ctcttggtgt ttatgattac ttagtttcta cacaggagtt tagatatatg 11460 aattcacagg gactactccc acccaagaat agcatagatg ccttcaaact caacattaaa 11520 ttgttgggtg ttggtggcaa accttgtatc aaagtagcca ctgtacagtc taaaatgtca 11580 gatgtaaagt gcacatcagt agtcttactc tcagttttgc aacaactcag agtagaatca 11640 tcatctaaat tgtgggctca atgtgtccag ttacacaatg acattctctt agctaaagat 11700 actactgaag cctttgaaaa aatggtttca ctactttctg ttttgctttc catgcagggt 11760 gctgtagaca taaacaagct ttgtgaagaa atgctggaca acagggcaac cttacaagct 11820 atagcctcag agtttagttc ccttccatca tatgcagctt ttgctactgc tcaagaagct 11880 tatgagcagg ctgttgctaa tggtgattct gaagttgttc ttaaaaagtt gaagaagtct 11940 ttgaatgtgg ctaaatctga atttgaccgt gatgcagcca tgcaacgtaa gttggaaaag 12000 atggctgatc aagctatgac ccaaatgtat aaacaggcta gatctgagga caagagggca 12060 aaagttacta gtgctatgca gacaatgctt ttcactatgc ttagaaagtt ggataatgat 12120 gcactcaaca acattatcaa caatgcaaga gatggttgtg ttcccttgaa cataatacct 12180 cttacaacag cagccaaact aatggttgtc ataccagact ataacacata taaaaatacg 12240 tgtgatggta caacatttac ttatgcatca gcattgtggg aaatccaaca ggttgtagat 12300 gcagatagta aaattgttca acttagtgaa attagtatgg acaattcacc taatttagca 12360 tggcctctta ttgtaacagc tttaagggcc aattctgctg tcaaattaca gaataatgag 12420 cttagtcctg ttgcactacg acagatgtct tgtgctgccg gtactacaca aactgcttgc 12480 actgatgaca atgcgttagc ttactacaac acaacaaagg gaggtaggtt tgtacttgca 12540 ctgttatccg atttacagga tttgaaatgg gctagattcc ctaagagtga tggaactggt 12600 actatctata cagaactgga accaccttgt aggtttgtta cagacacacc taaaggtcct 12660 aaagtgaagt atttatactt tattaaagga ttaaacaacc taaatagagg tatggtactt 12720 ggtagtttag ctgccacagt acgtctacaa gctggtaatg caacagaagt gcctgccaat 12780 tcaactgtat tatctttctg tgcttttgct gtagatgctg ctaaagctta caaagattat 12840 ctagctagtg ggggacaacc aatcactaat tgtgttaaga tgttgtgtac acacactggt 12900 actggtcagg caataacagt tacaccggaa gccaatatgg atcaagaatc ctttggtggt 12960 gcatcgtgtt gtctgtactg ccgttgccac atagatcatc caaatcctaa aggattttgt 13020 gacttaaaag gtaagtatgt acaaatacct acaacttgtg ctaatgaccc tgtgggtttt 13080 acacttaaaa acacagtctg taccgtctgc ggtatgtgga aaggttatgg ctgtagttgt 13140 gatcaactcc gcgaacccat gcttcagtca gctgatgcac aatcgttttt aaacgggttt 13200 gcggtgtaa 13209 <210> 303 <211> 3813 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 303 atgtttgttt ttcttgtttt attgccacta gtctctagtc agtgtgttaa tcttacaacc 60 agaactcaat taccccctgc atacactaat tctttcacac gtggtgttta ttaccctgac 120 aaagttttca gatcctcagt tttacattca actcaggact tgttcttacc tttcttttcc 180 aatgttactt ggttccatgc tatctctggg accaatggta ctaagaggtt tgataaccct 240 gtcctaccat ttaatgatgg tgtttatttt gcttccactg agaagtctaa cataataaga 300 ggctggattt ttggtactac tttagattcg aagacccagt ccctacttat tgttaataac 360 gctactaatg ttgttattaa agtctgtgaa tttcaatttt gtaatgatcc atttttgggt 420 gtttaccaca aaaacaacaa aagttggatg gaaagtgagt tcagagttta ttctagtgcg 480 aataattgca cttttgaata tgtctctcag ccttttctta tggaccttga aggaaaacag 540 ggtaatttca aaaatcttag ggaatttgtg tttaagaata ttgatggtta ttttaaaata 600 tattctaagc acacgcctat taatttagtg cgtgatctcc ctcagggttt ttcggcttta 660 gaaccattgg tagatttgcc aataggtatt aacatcacta ggtttcaaac tttacttgct 720 ttacatagaa gttatttgac tcctggtgat tcttcttcag gttggacagc tggtgctgca 780 gcttattatg tgggttatct tcaacctagg acttttctat taaaatataa tgaaaatgga 840 accattacag atgctgtaga ctgtgcactt gaccctctct cagaaacaaa gtgtacgttg 900 aaatccttca ctgtagaaaa aggaatctat caaacttcta actttagagt ccaaccaaca 960 gaatctattg ttagatttcc taatattaca aacttgtgcc cttttggtga agtttttaac 1020 gccaccagat ttgcatctgt ttatgcttgg aacaggaaga gaatcagcaa ctgtgttgct 1080 gattattctg tcctatataa ttccgcatca ttttccactt ttaagtgtta tggagtgtct 1140 cctactaaat taaatgatct ctgctttact aatgtctatg cagattcatt tgtaattaga 1200 ggtgatgaag tcagacaaat cgctccaggg caaactggaa agattgctga ttataattat 1260 aaattaccag atgattttac aggctgcgtt atagcttgga attctaacaa tcttgattct 1320 aaggttggtg gtaattataa ttacctgtat agattgttta ggaagtctaa tctcaaacct 1380 tttgagagag atatttcaac tgaaatctat caggccggta gcacaccttg taatggtgtt 1440 gaaggtttta attgttactt tcctttacaa tcatatggtt tccaacccac ttatggtgtt 1500 ggttaccaac catacagagt agtagtactt tcttttgaac ttctacatgc accagcaact 1560 gtttgtggac ctaaaaagtc tactaatttg gttaaaaaca aatgtgtcaa tttcaacttc 1620 aatggtttaa caggcacagg tgttcttact gagtctaaca aaaagtttct gcctttccaa 1680 caatttggca gagacattga tgacactact gatgctgtcc gtgatccaca gacacttgag 1740 attcttgaca ttacaccatg ttcttttggt ggtgtcagtg ttataacacc aggaacaaat 1800 acttctaacc aggttgctgt tctttatcag ggtgttaact gcacagaagt ccctgttgct 1860 attcatgcag atcaacttac tcctacttgg cgtgtttatt ctacaggttc taatgttttt 1920 caaacacgtg caggctgttt aataggggct gaacatgtca acaactcata tgagtgtgac 1980 atacccattg gtgcaggtat atgcgctagt tatcagactc agactaattc tcatcggcgg 2040 gcacgtagtg tagctagtca atccatcatt gcctacacta tgtcacttgg tgcagaaaat 2100 tcagttgctt actctaataa ctctattgcc atacccataa attttactat tagtgttacc 2160 acagaaattc taccagtgtc tatgaccaag acatcagtag attgtacaat gtacatttgt 2220 ggtgattcaa ctgaatgcag caatcttttg ttgcaatatg gcagtttttg tacacaatta 2280 aaccgtgctt taactggaat agctgttgaa caagacaaaa acacccaaga agtttttgca 2340 caagtcaaac aaatttacaa aacaccacca attaaagatt ttggtggttt taatttttca 2400 caaatattac cagatccatc aaaaccaagc aagaggtcat ttattgaaga tctacttttc 2460 aacaaagtga cacttgcaga tgctggcttc atcaaacaat atggtgattg ccttggtgat 2520 attgctgcta gagacctcat ttgtgcacaa aagtttaacg gccttactgt tttgccacct 2580 ttgctcacag atgaaatgat tgctcaatac acttctgcac tgttagcggg tacaatcact 2640 tctggttgga cctttggtgc aggtgctgca ttacaaatac catttgctat gcaaatggct 2700 tataggttta atggtattgg agttacacag aatgttctct atgagaacca aaaattgatt 2760 gccaaccaat ttaatagtgc tattggcaaa attcaagact cactttcttc cacagcaagt 2820 gcacttggaa aacttcaaga tgtggtcaac caaaatgcac aagctttaaa cacgcttgtt 2880 aaacaactta gctccaattt tggtgcaatt tcaagtgttt taaatgatat ccttgcacgt 2940 cttgacaaag ttgaggctga agtgcaaatt gataggttga tcacaggcag acttcaaagt 3000 ttgcagacat atgtgactca acaattaatt agagctgcag aaatcagagc ttctgctaat 3060 cttgctgcta ctaaaatgtc agagtgtgta cttggacaat caaaaagagt tgatttttgt 3120 ggaaagggct atcatcttat gtccttccct cagtcagcac ctcatggtgt agtcttcttg 3180 catgtgactt atgtccctgc acaagaaaag aacttcacaa ctgctcctgc catttgtcat 3240 gatggaaaag cacactttcc tcgtgaaggt gtctttgttt caaatggcac acactggttt 3300 gtaacacaaa ggaattttta tgaaccacaa atcattacta cacacaacac atttgtgtct 3360 ggtaactgtg atgttgtaat aggaattgtc aacaacacag tttatgatcc tttgcaacct 3420 gaattagact cattcaagga ggagttagat aaatatttta agaatcatac atcaccagat 3480 gttgatttag gtgacatctc tggcattaat gcttcagttg taaacattca aaaagaaatt 3540 gaccgcctca atgaggttgc caagaattta aatgaatctc tcatcgatct ccaagaactt 3600 ggaaagtatg agcagtatat aaaatggcca tggtacattt ggctaggttt tatagctggc 3660 ttgattgcca tagtaatggt gacaattatg ctttgctgta tgaccagttg ctgtagttgt 3720 ctcaagggct gttgttcttg tggatcctgc tgcaaatttg atgaagacga ctctgagcca 3780 gtgctcaaag gagtcaaatt acattacaca taa 3813 <210> 304 <211> 828 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 304 atggatttgt ttatgagaat cttcacaatt ggaactgtaa ctttgaagca aggtgaaatc 60 aaggatgcta ctccttcaga ttttgttcgc gctactgcaa cgataccgat acaagcctca 120 ctccctttcg gatggcttat tgttggcgtt gcacttcttg ctgtttttca gagcgcttcc 180 aaaatcataa ccctcaaaaa gagatggcaa ctagcactct ccaagggtgt tcactttgtt 240 tgcaacttgc tgttgttgtt tgtaacagtt tactcacacc ttttgctcgt tgctgctggc 300 cttgaagccc cttttctcta tctttatgct ttagtctact tcttgcagag tataaacttt 360 gtaagaataa taatgaggct ttggctttgc tggaaatgcc gttccaaaaa cccattactt 420 tatgatgcca actattttct ttgctggcat actaattgtt acgactattg tataccttac 480 aatagtgtaa cttcttcaat tgtcattact tcaggtgatg gcacaacaag tcctatttct 540 gaacatgact accagattgg tggttatact gaaaaatggg aatctggagt aaaagactgt 600 gttgtattac acagttactt cacttcagac tattaccagc tgtactcaac tcaattgagt 660 acagacactg gtgttgaaca tgttaccttc ttcatctaca ataaaattgt tgatgagcct 720 gaagaacatg tccaaattca cacaatcgac ggttcatccg gagttgttaa tccagtaatg 780 gaaccaattt atgatgaacc gacgacgact actagcgtgc ctttgtaa 828 <210> 305 <211> 228 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 305 atgtactcat tcgtttcgga agagacaggt acgttaatag ttaatagcgt acttcttttt 60 cttgctttcg tggtattctt gctagttaca ctagccatcc ttactgcgct tcgattgtgt 120 gcgtactgct gcaatattgt taacgtgagt cttgtaaaac cttcttttta cgtttactct 180 cgtgttaaaa atctgaattc ttctagagtt cctgatcttc tggtctaa 228 <210> 306 <211> 669 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 306 atggcagatt ccaacggtac tattaccgtt gaagagctta aaaagctcct tgaacaatgg 60 aacctagtaa taggtttcct attccttaca tggatttgtc ttctacaatt tgcctatgcc 120 aacaggaata ggtttttgta tataattaag ttaattttcc tctggctgtt atggccagta 180 actttagctt gttttgtgct tgctgctgtt tacagaataa attggatcac cggtggaatt 240 gctatcgcaa tggcttgtct tgtaggcttg atgtggctca gctacttcat tgcttctttc 300 agactgtttg cgcgtacgcg ttccatgtgg tcattcaatc cagaaactaa cattcttctc 360 aacgtgccac tccatggcac tattctgacc agaccgcttc tagaaagtga actcgtaatc 420 ggagctgtga tccttcgtgg acatcttcgt attgctggac accatctagg acgctgtgac 480 atcaaggacc tgcctaaaga aatcactgtt gctacatcac gaacgctttc ttattacaaa 540 ttgggagctt cgcagcgtgt agcaggtgac tcaggttttg ctgcatacag tcgctacagg 600 attggcaact ataaattaaa cacagaccat tccagtagca gtgacaatat tgctttgctt 660 gtacagtaa 669 <210> 307 <211> 186 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 307 atgtttcatc tcgttgactt tcaggttact atagcagaga tattactaat tattatgagg 60 acttttaaag tttccatttg gaatcttgat tacatcataa acctcataat taaaaattta 120 tctaagtcac taactgagaa taaatattct caattagatg aagagcaacc aatggagatt 180 gattaa 186 <210> 308 <211> 366 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 308 atgaaaatta ttcttttctt ggcactgata acactcgcta cttgtgagct ttatcactac 60 caagagtgtg ttagaggtac aacagtactt ttaaaagaac cttgctcttc tggaacatac 120 gagggcaatt caccatttca tcctctagct gataacaaat ttgcactgac ttgctttagc 180 actcaatttg cttttgcttg tcctgacggc gtaaaacacg tctatcagtt acgtgccaga 240 tcagtttcac ctaaactgtt catcagacaa gaggaagttc aagaacttta ctctccaatt 300 tttcttattg ttgcggcaat agtgtttata acactttgct tcacactcaa aagaaagaca 360 gaatga 366 <210> 309 <211> 132 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 309 atgattgaac tttcattaat tgacttctat ttgtgctttt tagcctttct gctattcctt 60 gttttaatta tgcttattat cttttggttc tcacttgaac tgcaagatca taatgaaact 120 tgtcacgcct aa 132 <210> 310 <211> 81 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 310 atgaaatttc ttgttttctt aggaatcatc acaactgtag ctgcatttca ccaagaatgt 60 agtttacagt catgtactta a 81 <210> 311 <211> 1260 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 311 atgtctctaa atggacccca aaatcagcga aatgcacccc gcattacgtt tggtggaccc 60 tcagattcaa ctggcagtaa ccagaatgga gaacgcagtg gggcgcgatc aaaacaacgt 120 cggccccaag gtttacccaa taatactgcg tcttggttca ccgctctcac tcaacatggc 180 aaggaagacc ttaaattccc tcgaggacaa ggcgttccaa ttaacaccaa tagcagtcca 240 gatgaccaaa ttggctacta ccgaagagct accagacgaa ttcgtggtgg tgacggtaaa 300 atgaaagatc tcagtccaag atggtatttc tactacctag gaactgggcc agaagctgga 360 cttccctatg gtgctaacaa agacggcatc atatgggttg caactgaggg agccttgaat 420 acaccaaaag atcacattgg cacccgcaat cctgctaaca atgctgcaat cgtgctacaa 480 cttcctcaag gaacaacatt gccaaaaggc ttctacgcag aagggagcag aggcggcagt 540 caagcctctt ctcgttcctc atcacgtagt cgcaacagtt caagaaattc aactccaggc 600 agcagtaaac gaacttctcc tgctagaatg gctggcaatg gcggtgatgc ggctcttgct 660 ttgctgctgc ttgacagatt gaaccagctt gagagcaaaa tgtttggtaa aggccaacaa 720 caacaaggcc aaactgtcac taagaaatct gctgctgagg cttctaagaa gcctcggcaa 780 aaacgtactg ccactaaagc atacaatgta acacaagctt tcggcagacg tggtccagaa 840 caaacccaag gaaattttgg ggaccaggaa ctaatcagac aaggaactga ttacaaacat 900 tggccgcaaa ttgcacaatt tgcccccagc gcttcagcgt tcttcggaat gtcgcgcatt 960 ggcatggaag tcacaccttc gggaacgtgg ttgacctaca caggtgccat caaattggat 1020 gacaaagatc caaatttcaa agatcaagtc attttgctga ataagcatat tgacgcatac 1080 aaaacattcc caccaacaga gcctaaaaag gacaaaaaga agaaggctga tgaaactcaa 1140 gccttaccgc agagacagaa gaaacagcaa actgtgactc ttcttcctgc tgcagatttg 1200 gatgatttct ccaaacaatt gcaacaatcc atgagcagtg ctgactcaac tcaggcctaa 1260 <210> 312 <211> 117 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 312 atgggctata taaacgtttt cgcttttccg tttacgatat atagtctact cttgtgcaga 60 atgaattctc gtaactacat agcacaagta gatgtagtta actttaatct cacatag 117 <210> 313 <211> 21291 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 313 atggagagcc ttgtccctgg tttcaacgag aaaacacacg tccaactcag tttgcctgtt 60 ttacaggttc gcgacgtgct cgtacgtggc tttggagact ccgtggagga ggtcttatca 120 gaggcacgtc aacatcttaa agatggcact tgtggcttag tagaagttga aaaaggcgtt 180 ttgcctcaac ttgaacagcc ctatgtgttc atcaaacgtt cggatgctcg aactgcacct 240 catggtcatg ttatggttga gctggtagca gaactcgaag gcattcagta cggtcgtagt 300 ggtgagacac ttggtgtcct tgtccctcat gtgggcgaaa taccagtggc ttaccgcaag 360 gttcttcttc gtaagaacgg taataaagga gctggtggcc atagttacgg cgccgatcta 420 aagtcatttg acttaggcga cgagcttggc actgatcctt atgaagattt tcaagaaaac 480 tggaacacta aacatagcag tggtgttacc cgtgaactca tgcgtgagct taacggaggg 540 gcatacactc gctatgtcga taacaacttc tgtggccctg atggctaccc tcttgagtgc 600 attaaagacc ttctagcacg tgctggtaaa gcttcatgca ctttgtccga acaactggac 660 tttattgaca ctaagagggg tgtatactgc tgccgtgaac atgagcatga aattgcttgg 720 tacacggaac gttctgaaaa gagctatgaa ttgcagacac cttttgaaat taaattggca 780 aagaaatttg acaccttcaa tggggaatgt ccaaattttg tatttccctt aaattccata 840 atcaagacta ttcaaccaag ggttgaaaag aaaaagcttg atggctttat gggtagaatt 900 cgatctgtct atccagttgc gtcaccaaat gaatgcaacc aaatgtgcct ttcaactctc 960 atgaagtgtg atcattgtgg tgaaacttca tggcagacgg gcgattttgt taaagccact 1020 tgcgaatttt gtggcactga gaatttgact aaagaaggtg ccactacttg tggttactta 1080 ccccaaaatg ctgttgttaa aatttattgt ccagcatgtc acaattcaga agtaggacct 1140 gagcatagtc ttgccgaata ccataatgaa tctggcttga aaaccattct tcgtaagggt 1200 ggtcgcacta ttgcctttgg aggctgtgtg ttctcttatg ttggttgcca taacaagtgt 1260 gcctattggg ttccacgtgc tagcgctaac ataggttgta accatacagg tgttgttgga 1320 gaaggttccg aaggtcttaa tgacaacctt cttgaaatac tccaaaaaga gaaagtcaac 1380 atcaatattg ttggtgactt taaacttaat gaagagatcg ccattatttt ggcatctttt 1440 tctgcttcca caagtgcttt tgtggaaact gtgaaaggtt tggattataa agcattcaaa 1500 caaattgttg aatcctgtgg taattttaaa gttacaaaag gaaaagctaa aaaaggtgcc 1560 tggaatattg gtgaacagaa atcaatactg agtcctcttt atgcatttgc atcagaggct 1620 gctcgtgttg tacgatcaat tttctcccgc actcttgaaa ctgctcaaaa ttctgtgcgt 1680 gttttacaga aggccgctat aacaatacta gatggaattt cacagtattc actgagactc 1740 attgatgcta tgatgttcac atctgatttg gctactaaca atctagttgt aatggcctac 1800 attacaggtg gtgttgttca gttgacttcg cagtggctaa ctaacatctt tggcactgtt 1860 tatgaaaaac tcaaacccgt ccttgattgg cttgaagaga agtttaagga aggtgtagag 1920 tttcttagag acggttggga aattgttaaa tttatctcaa cctgtgcttg tgaaattgtc 1980 ggtggacaaa ttgtcacctg tgcaaaggaa attaaggaga gtgttcagac attctttaag 2040 cttgtaaata aatttttggc tttgtgtgct gactctatca ttattggtgg agctaaactt 2100 aaagccttga atttaggtga aacatttgtc acgcactcaa agggattgta cagaaagtgt 2160 gttaaatcca gagaagaaac tggcctactc atgcctctaa aagccccaaa agaaattatc 2220 ttcttagagg gagaaacact tcccacagaa gtgttaacag aggaagttgt cttgaaaact 2280 ggtgatttac aaccattaga acaacctact agtgaagctg ttgaagctcc attggttggt 2340 acaccagttt gtattaacgg gcttatgttg ctcgaaatca aagacacaga aaagtactgt 2400 gcccttgcac ctaatatgat ggtaacaaac aataccttca cactcaaagg cggtgcacca 2460 acaaaggtta cttttggtga tgacactgtg atagaagtgc aaggttacaa gagtgtgaat 2520 atcacttttg aacttgatga aaggattgat aaagtactta atgagaagtg ctctgcctat 2580 acagttgaac tcggtacaga agtaaatgag ttcgcctgtg ttgtggcaga tgctgtcata 2640 aaaactttgc aaccagtatc tgaattactt acaccactgg gcattgattt agatgagtgg 2700 agtatggcta catactactt atttgatgag tctggtgagt ttaaattggc ttcacatatg 2760 tattgttctt tttaccctcc agatgaggat gaagaagaag gtgattgtga agaagaagag 2820 tttgagccat caactcaata tgagtatggt actgaagatg attaccaagg taaacctttg 2880 gaatttggtg ccacttctgc tgctcttcaa cctgaagaag agcaagaaga agattggtta 2940 gatgatgata gtcaacaaac tgttggtcaa caagacggca gtgaggacaa tcagacaact 3000 actattcaaa caattgttga ggttcaacct caattagaga tggaacttac accagttgtt 3060 cagactattg aagtgaatag ttttagtggt tatttaaaac ttactgacaa tgtatacatt 3120 aaaaatgcag acattgtgga agaagctaaa aaggtaaaac caacagtggt tgttaatgca 3180 gccaatgttt accttaaaca tggaggaggt gttgcaggag ccttaaataa ggctactaac 3240 aatgccatgc aagttgaatc tgatgattac atagctacta atggaccact taaagtgggt 3300 ggtagttgtg ttttaagcgg acacaatctt gctaaacact gtcttcatgt tgtcggccca 3360 aatgttaaca aaggtgaaga cattcaactt cttaagagtg cttatgaaaa ttttaatcag 3420 cacgaagttc tacttgcacc attattatca gctggtattt ttggtgctga ccctatacat 3480 tctttaagag tttgtgtaga tactgttcgc acaaatgtct acttagctgt ctttgataaa 3540 aatctctatg acaaacttgt ttcaagcttt ttggaaatga agagtgaaaa gcaagttgaa 3600 caaaagatcg ctgagattcc taaagaggaa gttaagccat ttataactga aagtaaacct 3660 tcagttgaac agagaaaaca agatgataag aaaatcaaag cttgtgttga agaagttaca 3720 acaactctgg aagaaactaa gttcctcaca gaaaacttgt tactttatat tgacattaat 3780 ggcaatcttc atccagattc tgccactctt gttagtgaca ttgacatcac tttcttaaag 3840 aaagatgctc catatatagt gggtgatgtt gttcaagagg gtgttttaac tgctgtggtt 3900 atacctacta aaaaggctgg tggcactact gaaatgctag cgaaagcttt gagaaaagtg 3960 ccaacagaca attatataac cacttacccg ggtcagggtt taaatggtta cactgtagag 4020 gaggcaaaga cagtgcttaa aaagtgtaaa agtgcctttt acattctacc atctattatc 4080 tctaatgaga agcaagaaat tcttggaact gtttcttgga atttgcgaga aatgcttgca 4140 catgcagaag aaacacgcaa attaatgcct gtctgtgtgg aaactaaagc catagtttca 4200 actatacagc gtaaatataa gggtattaaa atacaagagg gtgtggttga ttatggtgct 4260 agattttact tttacaccag taaaacaact gtagcgtcac ttatcaacac acttaacgat 4320 ctaaatgaaa ctcttgttac aatgccactt ggctatgtaa cacatggctt aaatttggaa 4380 gaagctgctc ggtatatgag atctctcaaa gtgccagcta cagtttctgt ttcttcacct 4440 gatgctgtta cagcgtataa tggttatctt acttcttctt ctaaaacacc tgaagaacat 4500 tttattgaaa ccatctcact tgctggttcc tataaagatt ggtcctattc tggacaatct 4560 acacaactag gtatagaatt tcttaagaga ggtgataaaa gtgtatatta cactagtaat 4620 cctaccacat tccacctaga tggtgaagtt atcacctttg acaatcttaa gacacttctt 4680 tctttgagag aagtgaggac tattaaggtg tttacaacag tagacaacat taacctccac 4740 acgcaagttg tggacatgtc aatgacatat ggacaacagt ttggtccaac ttatttggat 4800 ggagctgatg ttactaaaat aaaacctcat aattcacatg aaggtaaaac attttatgtt 4860 ttacctaatg atgacactct acgtgttgag gcttttgagt actaccacac aactgatcct 4920 agttttctgg gtaggtacat gtcagcatta aatcacacta aaaagtggaa atacccacaa 4980 gttaatggtt taacttctat taaatgggca gataacaact gttatcttgc cactgcattg 5040 ttaacactcc aacaaataga gttgaagttt aatccacctg ctctacaaga tgcttattac 5100 agagcaaggg ctggtgaagc tgctaacttt tgtgcactta tcttagccta ctgtaataag 5160 acagtaggtg agttaggtga tgttagagaa acaatgagtt acttgtttca acatgccaat 5220 ttagattctt gcaaaagagt cttgaacgtg gtgtgtaaaa cttgtggaca acagcagaca 5280 acccttaagg gtgtagaagc tgttatgtac atgggcacac tttcttatga acaatttaag 5340 aaaggtgttc agataccttg tacgtgtggt aaacaagcta caaaatatct agtacaacag 5400 gagtcacctt ttgttatgat gtcagcacca cctgctcagt atgaacttaa gcatggtaca 5460 tttacttgtg ctagtgagta cactggtaat taccagtgtg gtcactataa acatataact 5520 tctaaagaaa ctttgtattg catagacggt gctttactta caaagtcctc agaatacaaa 5580 ggtcctatta cggatgtttt ctacaaagaa aacagttaca caacaaccat aaaaccagtt 5640 acttataaat tggatggtgt tgtttgtaca gaaattgacc ctaagttgga caattattat 5700 aagaaagaca attcttattt cacagagcaa ccaattgatc ttgtaccaaa ccaaccatat 5760 ccaaacgcaa gcttcgataa ttttaagttt gtatgtgata atatcaaatt tgctgatgat 5820 ttaaaccagt taactggtta taagaaacct gcttcaagag agcttaaagt tacatttttc 5880 cctgacttaa atggtgatgt ggtggctatt gattataaac actacacacc ctcttttaag 5940 aaaggagcta aattgttaca taaacctatt gtttggcatg ttaacaatgc aactaataaa 6000 gccacgtata aaccaaatac ctggtgtata cgttgtcttt ggagcacaaa accagttgaa 6060 acatcaaatt cgtttgatgt actgaagtca gaggacgcgc agggaatgga taatcttgcc 6120 tgcgaagatc taaaaccagt ctctgaagaa gtagtggaaa atcctaccat acagaaagac 6180 gttcttgagt gtaatgtgaa aactaccgaa gttgtaggag acattatact taaaccagca 6240 aataatagtt taaaaattac agaagaggtt ggccacacag atctaatggc tgcttatgta 6300 gacaattcta gtcttactat taagaaacct aatgaattat ctagagtatt aggtttgaaa 6360 acccttgcta ctcatggttt agctgctgtt aatagtgtcc cttgggatac tatagctaat 6420 tatgctaagc cttttcttaa caaagttgtt agtacaacta ctaacatagt tacacggtgt 6480 ttaaaccgtg tttgtactaa ttatatgcct tatttcttta ctttattgct acaattgtgt 6540 acttttacta gaagtacaaa ttctagaatt aaagcatcta tgccgactac tatagcaaag 6600 aatactgtta agagtgtcgg taaattttgt ctagaggctt catttaatta tttgaagtca 6660 cctaattttt ctaaactgat aaatattata atttggtttt tactattaag tgtttgccta 6720 ggttctttaa tctactcaac cgctgcttta ggtgttttaa tgtctaattt aggcatgcct 6780 tcttactgta ctggttacag agaaggctat ttgaactcta ctaatgtcac tattgcaacc 6840 tactgtactg gttctatacc ttgtagtgtt tgtcttagtg gtttagattc tttagacacc 6900 tatccttctt tagaaactat acaaattacc atttcatctt ttaaatggga tttaactgct 6960 tttggcttag ttgcagagtg gtttttggca tatattcttt tcactaggtt tttctatgta 7020 cttggattgg ctgcaatcat gcaattgttt ttcagctatt ttgcagtaca ttttattagt 7080 aattcttggc ttatgtggtt aataattaat cttgtacaaa tggccccgat ttcagctatg 7140 gttagaatgt acatcttctt tgcatcattt tattatgtat ggaaaagtta tgtgcatgtt 7200 gtagacggtt gtaattcatc aacttgtatg atgtgttaca aacgtaatag agcaacaaga 7260 gtcgaatgta caactattgt taatggtgtt agaaggtcct tttatgtcta tgctaatgga 7320 ggtaaaggct tttgcaaact acacaattgg aattgtgtta attgtgatac attctgtgct 7380 ggtagtacat ttattagtga tgaagttgcg agagacttgt cactacagtt taaaagacca 7440 ataaatccta ctgaccagtc ttcttacatc gttgatagtg ttacagtgaa gaatggttcc 7500 atccatcttt actttgataa agctggtcaa aagacttatg aaagacattc tctctctcat 7560 tttgttaact tagacaacct gagagctaat aacactaaag gttcattgcc tattaatgtt 7620 atagtttttg atggtaaatc aaaatgtgaa gaatcatctg caaaatcagc gtctgtttac 7680 tacagtcagc ttatgtgtca acctatactg ttactagatc aggcattagt gtctgatgtt 7740 ggtgatagtg cggaagttgc agttaaaatg tttgatgctt acgttaatac gttttcatca 7800 acttttaacg taccaatgga aaaactcaaa acactagttg caactgcaga agctgaactt 7860 gcaaagaatg tgtccttaga caatgtctta tctactttta tttcagcagc tcggcaaggg 7920 tttgttgatt cagatgtaga aactaaagat gttgttgaat gtcttaaatt gtcacatcaa 7980 tctgacatag aagttactgg cgatagttgt aataactata tgctcaccta taacaaagtt 8040 gaaaacatga caccccgtga ccttggtgct tgtattgact gtagtgcgcg tcatattaat 8100 gcgcaggtag caaaaagtca caacattgct ttgatatgga acgttaaaga tttcatgtca 8160 ttgtctgaac aactacgaaa acaaatacgt agtgctgcta aaaagaataa cttacctttt 8220 aagttgacat gtgcaactac tagacaagtt gttaatgttg taacaacaaa gatagcactt 8280 aagggtggta aaattgttaa taattggttg aagcagttaa ttaaagttac acttgtgttc 8340 ctttttgttg ctgctatttt ctatttaata acacctgttc atgtcatgtc taaacatact 8400 gacttttcaa gtgaaatcat aggatacaag gctattgatg gtggtgtcac tcgtgacata 8460 gcatctacag atacttgttt tgctaacaaa catgctgatt ttgacacatg gtttagccag 8520 cgtggtggta gttatactaa tgacaaagct tgcccattga ttgctgcagt cataacaaga 8580 gaagtgggtt ttgtcgtgcc tggtttgcct ggcacgatat tacgcacaac taatggtgac 8640 tttttgcatt tcttacctag agtttttagt gcagttggta acatctgtta cacaccatca 8700 aaacttatag agtacactga ctttgcaaca tcagcttgtg ttttggctgc tgaatgtaca 8760 atttttaaag atgcttctgg taagccagta ccatattgtt atgataccaa tgtactagaa 8820 ggttctgttg cttatgaaag tttacgccct gacacacgtt atgtgctcat ggatggctct 8880 attattcaat ttcctaacac ctaccttgaa ggttctgtta gagtggtaac aacttttgat 8940 tctgagtact gtaggcacgg cacttgtgaa agatcagaag ctggtgtttg tgtatctact 9000 agtggtagat gggtacttaa caatgattat tacagatctt taccaggagt tttctgtggt 9060 gtagatgctg taaatttact tactaatatg tttacaccac taattcaacc tattggtgct 9120 ttggacatat cagcatctat agtagctggt ggtattgtag ctatcgtagt aacatgcctt 9180 gcctactatt ttatgaggtt tagaagagct tttggtgaat acagtcatgt agttgccttt 9240 aatactttac tattccttat gtcattcact gtactctgtt taacaccagt ttactcattc 9300 ttacctggtg tttattctgt tatttacttg tacttgacat tttatcttac taatgatgtt 9360 tcttttttag cacatattca gtggatggtt atgttcacac ctttagtacc tttctggata 9420 acaattgctt atatcatttg tatttccaca aagcatttct attggttctt tagtaattac 9480 ctaaagagac gtgtagtctt taatggtgtt tcctttagta cttttgaaga agctgcgctg 9540 tgcacctttt tgttaaataa agaaatgtat ctaaagttgc gtagtgatgt gctattacct 9600 cttacgcaat ataatagata cttagctctt tataataagt acaagtattt tagtggagca 9660 atggatacaa ctagctacag agaagctgct tgttgtcatc tcgcaaaggc tctcaatgac 9720 ttcagtaact caggttctga tgttctttac caaccaccac aaacctctat cacctcagct 9780 gttttgcaga gtggttttag aaaaatggca ttcccatctg gtaaagttga gggttgtatg 9840 gtacaagtaa cttgtggtac aactacactt aacggtcttt ggcttgatga cgtagtttac 9900 tgtccaagac atgtgatctg cacctctgaa gacatgctta accctaatta tgaagattta 9960 ctcattcgta agtctaatca taatttcttg gtacaggctg gtaatgttca actcagggtt 10020 attggacatt ctatgcaaaa ttgtgtactt aagcttaagg ttgatacagc caatcctaag 10080 acacctaagt ataagtttgt tcgcattcaa ccaggacaga ctttttcagt gttagcttgt 10140 tacaatggtt caccatctgg tgtttaccaa tgtgctatga ggcccaattt cactattaag 10200 ggttcattcc ttaatggttc atgtggtagt gttggtttta acatagatta tgactgtgtc 10260 tctttttgtt acatgcacca tatggaatta ccaactggag ttcatgctgg cacagactta 10320 gaaggtaact tttatggacc ttttgttgac aggcaaacag cacaagcagc tggtacggac 10380 acaactatta cagttaatgt tttagcttgg ttgtacgctg ctgttataaa tggagacagg 10440 tggtttctca atcgatttac cacaactctt aatgacttta accttgtggc tatgaagtac 10500 aattatgaac ctctaacaca agaccatgtt gacatactag gacctctttc tgctcaaact 10560 ggaattgccg ttttagatat gtgtgcttca ttaaaagaat tactgcaaaa tggtatgaat 10620 ggacgtacca tattgggtag tgctttatta gaagatgaat ttacaccttt tgatgttgtt 10680 agacaatgct caggtgttac tttccaaagt gcagtgaaaa gaacaatcaa gggtacacac 10740 cactggttgt tactcacaat tttgacttca cttttagttt tagtccagag tactcaatgg 10800 tctttgttct tttttttgta tgaaaatgcc tttttacctt ttgctatggg tattattgct 10860 atgtctgctt ttgcaatgat gtttgtcaaa cataagcatg catttctctg tttgtttttg 10920 ttaccttctc ttgccactgt agcttatttt aatatggtct atatgcctgc tagttgggtg 10980 atgcgtatta tgacatggtt ggatatggtt gatactagtt tgtctggttt taagctaaaa 11040 gactgtgtta tgtatgcatc agctgtagtg ttactaatcc ttatgacagc aagaactgtg 11100 tatgatgatg gtgctaggag agtgtggaca cttatgaatg tcttgacact cgtttataaa 11160 gtttattatg gtaatgcttt agatcaagcc atttccatgt gggctcttat aatctctgtt 11220 acttctaact actcaggtgt agttacaact gtcatgtttt tggccagagg tattgttttt 11280 atgtgtgttg agtattgccc tattttcttc ataactggta atacacttca gtgtataatg 11340 ctagtttatt gtttcttagg ctatttttgt acttgttact ttggcctctt ttgtttactc 11400 aaccgctact ttagactgac tcttggtgtt tatgattact tagtttctac acaggagttt 11460 agatatatga attcacaggg actactccca cccaagaata gcatagatgc cttcaaactc 11520 aacattaaat tgttgggtgt tggtggcaaa ccttgtatca aagtagccac tgtacagtct 11580 aaaatgtcag atgtaaagtg cacatcagta gtcttactct cagttttgca acaactcaga 11640 gtagaatcat catctaaatt gtgggctcaa tgtgtccagt tacacaatga cattctctta 11700 gctaaagata ctactgaagc ctttgaaaaa atggtttcac tactttctgt tttgctttcc 11760 atgcagggtg ctgtagacat aaacaagctt tgtgaagaaa tgctggacaa cagggcaacc 11820 ttacaagcta tagcctcaga gtttagttcc cttccatcat atgcagcttt tgctactgct 11880 caagaagctt atgagcaggc tgttgctaat ggtgattctg aagttgttct taaaaagttg 11940 aagaagtctt tgaatgtggc taaatctgaa tttgaccgtg atgcagccat gcaacgtaag 12000 ttggaaaaga tggctgatca agctatgacc caaatgtata aacaggctag atctgaggac 12060 aagagggcaa aagttactag tgctatgcag acaatgcttt tcactatgct tagaaagttg 12120 gataatgatg cactcaacaa cattatcaac aatgcaagag atggttgtgt tcccttgaac 12180 ataatacctc ttacaacagc agccaaacta atggttgtca taccagacta taacacatat 12240 aaaaatacgt gtgatggtac aacatttact tatgcatcag cattgtggga aatccaacag 12300 gttgtagatg cagatagtaa aattgttcaa cttagtgaaa ttagtatgga caattcacct 12360 aatttagcat ggcctcttat tgtaacagct ttaagggcca attctgctgt caaattacag 12420 aataatgagc ttagtcctgt tgcactacga cagatgtctt gtgctgccgg tactacacaa 12480 actgcttgca ctgatgacaa tgcgttagct tactacaaca caacaaaggg aggtaggttt 12540 gtacttgcac tgttatccga tttacaggat ttgaaatggg ctagattccc taagagtgat 12600 ggaactggta ctatctatac agaactggaa ccaccttgta ggtttgttac agacacacct 12660 aaaggtccta aagtgaagta tttatacttt attaaaggat taaacaacct aaatagaggt 12720 atggtacttg gtagtttagc tgccacagta cgtctacaag ctggtaatgc aacagaagtg 12780 cctgccaatt caactgtatt atctttctgt gcttttgctg tagatgctgc taaagcttac 12840 aaagattatc tagctagtgg gggacaacca atcactaatt gtgttaagat gttgtgtaca 12900 cacactggta ctggtcaggc aataacagtt acaccggaag ccaatatgga tcaagaatcc 12960 tttggtggtg catcgtgttg tctgtactgc cgttgccaca tagatcatcc aaatcctaaa 13020 ggattttgtg acttaaaagg taagtatgta caaataccta caacttgtgc taatgaccct 13080 gtgggtttta cacttaaaaa cacagtctgt accgtctgcg gtatgtggaa aggttatggc 13140 tgtagttgtg atcaactccg cgaacccatg cttcagtcag ctgatgcaca atcgttttta 13200 aaccgggttt gcggtgtaag tgcagcccgt cttacaccgt gcggcacagg cactagtact 13260 gatgtcgtat acagggcttt tgacatctac aatgataaag tagctggttt tgctaaattc 13320 ctaaaaacta attgttgtcg cttccaagaa aaggatgaag atgacaattt aattgattct 13380 tactttgtag ttaagagaca cactttctct aactaccaac atgaagaaac aatttataat 13440 ttacttaagg attgtccagc tgttgctaaa catgacttct ttaagtttag aatagacggt 13500 gacatggtac cacatatatc acgtcaacgt cttactaaat acacaatggc agacctcgtc 13560 tatgctttaa ggcattttga tgaaggtaat tgtgacacat taaaagaaat acttgtcaca 13620 tacaattgtt gtgatgatga ttatttcaat aaaaaggact ggtatgattt tgtagaaaac 13680 ccagatatat tacgcgtata cgccaactta ggtgaacgtg tacgccaagc tttgttaaaa 13740 acagtacaat tctgtgatgc catgcgaaat gctggtattg ttggtgtact gacattagat 13800 aatcaagatc tcaatggtaa ctggtatgat ttcggtgatt tcatacaaac cacgccaggt 13860 agtggagttc ctgttgtaga ttcttattat tcattgttaa tgcctatatt aaccttgacc 13920 agggctttaa ctgcagagtc acatgttgac actgacttaa caaagcctta cattaagtgg 13980 gatttgttaa aatatgactt cacggaagag aggttaaaac tctttgaccg ttattttaaa 14040 tattgggatc agacatacca cccaaattgt gttaactgtt tggatgacag atgcattctg 14100 cattgtgcaa actttaatgt tttattctct acagtgttcc cacttacaag ttttggacca 14160 ctagtgagaa aaatatttgt tgatggtgtt ccatttgtag tttcaactgg ataccacttc 14220 agagagctag gtgttgtaca taatcaggat gtaaacttac atagctctag acttagtttt 14280 aaggaattac ttgtgtatgc tgctgaccct gctatgcacg ctgcttctgg taatctatta 14340 ctagataaac gcactacgtg cttttcagta gctgcactta ctaacaatgt tgcttttcaa 14400 actgtcaaac ccggtaattt taacaaagac ttctatgact ttgctgtgtc taagggtttc 14460 tttaaggaag gaagttctgt tgaattaaaa cacttcttct ttgctcagga tggtaatgct 14520 gctatcagcg attatgacta ctatcgttat aatctaccaa caatgtgtga tatcagacaa 14580 ctactatttg tagttgaagt tgttgataag tactttgatt gttacgatgg tggctgtatt 14640 aatgctaacc aagtcatcgt caacaaccta gacaaatcag ctggttttcc atttaataaa 14700 tggggtaagg ctagacttta ttatgattca atgagttatg aggatcaaga tgcacttttc 14760 gcatatacaa aacgtaatgt catccctact ataactcaaa tgaatcttaa gtatgccatt 14820 agtgcaaaga atagagctcg caccgtagct ggtgtctcta tctgtagtac tatgaccaat 14880 agacagtttc atcaaaaatt attgaaatca atagccgcca ctagaggagc tactgtagta 14940 attggaacaa gcaaattcta tggtggttgg cacaacatgt taaaaactgt ttatagtgat 15000 gtagaaaacc ctcaccttat gggttgggat tatcctaaat gtgatagagc catgcctaac 15060 atgcttagaa ttatggcctc acttgttctt gctcgcaaac atacaacgtg ttgtagcttg 15120 tcacaccgtt tctatagatt agctaatgag tgtgctcaag tattgagtga aatggtcatg 15180 tgtggcggtt cactatatgt taaaccaggt ggaacctcat caggagatgc cacaactgct 15240 tatgctaata gtgtttttaa catttgtcaa gctgtcacgg ccaatgttaa tgcactttta 15300 tctactgatg gtaacaaaat tgccgataag tatgtccgca atttacaaca cagactttat 15360 gagtgtctct atagaaatag agatgttgac acagactttg tgaatgagtt ttacgcatat 15420 ttgcgtaaac atttctcaat gatgatactc tctgacgatg ctgttgtgtg tttcaatagc 15480 acttatgcat ctcaaggtct agtggctagc ataaagaact ttaagtcagt tctttattat 15540 caaaacaatg tttttatgtc tgaagcaaaa tgttggactg agactgacct tactaaagga 15600 cctcatgaat tttgctctca acatacaatg ctagttaaac agggtgatga ttatgtgtac 15660 cttccttacc cagatccatc aagaatccta ggggccggct gttttgtaga tgatatcgta 15720 aaaacagatg gtacacttat gattgaacgg ttcgtgtctt tagctataga tgcttaccca 15780 cttactaaac atcctaatca ggagtatgct gatgtctttc atttgtactt acaatacata 15840 agaaagctac atgatgagtt aacaggacac atgttagaca tgtattctgt tatgcttact 15900 aatgataaca cttcaaggta ttgggaacct gagttttatg aggctatgta cacaccgcat 15960 acagtcttac aggctgttgg ggcttgtgtt ctttgcaatt cacagacttc attaagatgt 16020 ggtgcttgca tacgtagacc attcttatgt tgtaaatgct gttacgacca tgtcatatca 16080 acatcacata aattagtctt gtctgttaat ccgtatgttt gcaatgctcc aggttgtgat 16140 gtcacagatg tgactcaact ttacttagga ggtatgagct attattgtaa atcacataaa 16200 ccacccatta gttttccatt gtgtgctaat ggacaagttt ttggtttata taaaaataca 16260 tgtgttggta gcgataatgt tactgacttt aatgcaattg caacatgtga ctggacaaat 16320 gctggtgatt acattttagc taacacctgt actgaaagac tcaagctttt tgcagcagaa 16380 acgctcaaag ctactgagga gacatttaaa ctgtcttatg gtattgctac tgtacgtgaa 16440 gtgctgtctg acagagaatt acatctttca tgggaagttg gtaaacctag accaccactt 16500 aaccgaaatt atgtctttac tggttatcgt gtaactaaaa acagtaaagt acaaatagga 16560 gagtacacct ttgaaaaagg tgactatggt gatgctgttg tttaccgagg tacaacaact 16620 tacaaattaa atgttggtga ttattttgtg ctgacatcac atacagtaat gccattaagt 16680 gcacctacac tagtgccaca agagcactat gttagaatta ctggcttata cccaacactc 16740 aatatctcag atgagttttc tagcaatgtt gcaaattatc aaaaggttgg tatgcaaaag 16800 tattctacac tccagggacc acctggtact ggtaagagtc attttgctat tggcctagct 16860 ctctactacc cttctgctcg catagtgtat acagcttgct ctcatgccgc tgttgatgca 16920 ctatgtgaga aggcattaaa atatttgcct atagataaat gtagtagaat tatacctgca 16980 cgtgctcgtg tagagtgttt tgataaattc aaagtgaatt caacattaga acagtatgtc 17040 ttttgtactg taaatgcatt gcctgagacg acagcagata tagttgtctt tgatgaaatt 17100 tcaatggcca caaattatga tttgagtgtt gtcaatgcca gattacgtgc taagcactat 17160 gtgtacattg gcgaccctgc tcaattacct gcaccacgca cattgctaac taagggcaca 17220 ctagaaccag aatatttcaa ttcagtgtgt agacttatga aaactatagg tccagacatg 17280 ttcctcggaa cttgtcggcg ttgtcctgct gaaattgttg acactgtgag tgctttggtt 17340 tatgataata agcttaaagc acataaagac aaatcagctc aatgctttaa aatgttttat 17400 aagggtgtta tcacgcatga tgtttcatct gcaattaaca ggccacaaat aggcgtggta 17460 agagaattcc ttacacgtaa ccctgcttgg agaaaagctg tctttatttc accttataat 17520 tcacagaatg ctgtagcctc aaagattttg ggactaccaa ctcaaactgt tgattcatca 17580 cagggctcag aatatgacta tgtcatattc actcaaacca ctgaaacagc tcactcttgt 17640 aatgtaaaca gatttaatgt tgctattacc agagcaaaag taggcatact ttgcataatg 17700 tctgatagag acctttatga caagttgcaa tttacaagtc ttgaaattcc acgtaggaat 17760 gtggcaactt tacaagctga aaatgtaaca ggactcttta aagattgtag taaggtaatc 17820 actgggttac atcctacaca ggcacctaca cacctcagtg ttgacactaa attcaaaact 17880 gaaggtttat gtgttgacat acctggcata cctaaggaca tgacctatag aagactcatc 17940 tctatgatgg gttttaaaat gaattatcaa gttaatggtt accctaacat gtttatcacc 18000 cgcgaagaag ctataagaca tgtacgtgca tggattggct tcgatgtcga ggggtgtcat 18060 gctactagag aagctgttgg taccaattta cctttacagc taggtttttc tacaggtgtt 18120 aacctagttg ctgtacctac aggttatgtt gatacaccta ataatacaga tttttccaga 18180 gttagtgcta aaccaccgcc tggagatcaa tttaaacacc tcataccact tatgtacaaa 18240 ggacttcctt ggaatgtagt gcgtataaag attgtacaaa tgttaagtga cacacttaaa 18300 aatctctctg acagagtcgt atttgtctta tgggcacatg gctttgagtt gacatctatg 18360 aagtattttg tgaaaatagg acctgagcgc acctgttgtc tatgtgatag acgtgccaca 18420 tgcttttcca ctgcttcaga cacttatgcc tgttggcatc attctattgg atttgattac 18480 gtctataatc cgtttatgat tgatgttcaa caatggggtt ttacaggtaa cctacaaagc 18540 aaccatgatc tgtattgtca agtccatggt aatgcacatg tagctagttg tgatgcaatc 18600 atgactaggt gtctagctgt ccacgagtgc tttgttaagc gtgttgactg gactattgaa 18660 tatcctataa ttggtgatga actgaagatt aatgcggctt gtagaaaggt tcaacacatg 18720 gttgttaaag ctgcattatt agcagacaaa ttcccagttc ttcacgacat tggtaaccct 18780 aaagctatta agtgtgtacc tcaagctgat gtagaatgga agttctatga tgcacagcct 18840 tgtagtgaca aagcttataa aatagaagaa ttattctatt cttatgccac acattctgac 18900 aaattcacag atggtgtatg cctattttgg aattgcaatg tcgatagata tcctgctaat 18960 tccattgttt gtagatttga cactagagtg ctatctaacc ttaacttgcc tggttgtgat 19020 ggtggcagtt tgtatgtaaa taaacatgca ttccacacac cagcttttga taaaagtgct 19080 tttgttaatt taaaacaatt accatttttc tattactctg acagtccatg tgagtctcat 19140 ggaaaacaag tagtgtcaga tatagattat gtaccactaa agtctgctac gtgtataaca 19200 cgttgcaatt taggtggtgc tgtctgtaga catcatgcta atgagtacag attgtatctc 19260 gatgcttata acatgatgat ctcagctggc tttagcttgt gggtttacaa acaatttgat 19320 acttataacc tctggaacac ttttacaaga cttcagagtt tagaaaatgt ggcttttaat 19380 gttgtaaata agggacactt tgatggacaa cagggtgaag taccagtttc tatcattaat 19440 aacactgttt acacaaaagt tgatggtgtt gatgtagaat tgtttgaaaa taaaacaaca 19500 ttacctgtta atgtagcatt tgagctttgg gctaagcgca acattaaacc agtaccagag 19560 gtgaaaatac tcaataattt gggtgtggac attgctgcta atactgtgat ctgggactac 19620 aaaagagatg ctccagcaca tatatctact attggtgttt gttctatgac tgacatagcc 19680 aagaaaccaa ctgaaacgat ttgtgcacca ctcactgtct tttttgatgg tagagttgat 19740 ggtcaagtag acttatttag aaatgcccgt aatggtgttc ttattacaga aggtagtgtt 19800 aaaggtttac aaccatctgt aggtcccaaa caagctagtc ttaatggagt cacattaatt 19860 ggagaagccg taaaaacaca gttcaattat tataagaaag ttgatggtgt tgtccaacaa 19920 ttacctgaaa cttactttac tcagagtaga aatttacaag aatttaaacc caggagtcaa 19980 atggaaattg atttcttaga attagctatg gatgaattca ttgaacggta taaattagaa 20040 ggctatgcct tcgaacatat cgtttatgga gattttagtc atagtcagtt aggtggttta 20100 catctactga ttggactagc taaacgtttt aaggaatcac cttttgaatt agaagatttt 20160 attcctatgg acagtacagt taaaaactat ttcataacag atgcgcaaac aggttcatct 20220 aagtgtgtgt gttctgttat tgatttatta cttgatgatt ttgttgaaat aataaaatcc 20280 caagatttat ctgtagtttc taaggttgtc aaagtgacta ttgactatac agaaatttca 20340 tttatgcttt ggtgtaaaga tggccatgta gaaacatttt acccaaaatt acaatctagt 20400 caagcgtggc aaccgggtgt tgctatgcct aatctttaca aaatgcaaag aatgctatta 20460 gaaaagtgtg accttcaaaa ttatggtgat agtgcaacat tacctaaagg cataatgatg 20520 aatgtcgcaa aatatactca actgtgtcaa tatttaaaca cattaacatt agctgtaccc 20580 tataatatga gagttataca ttttggtgct ggttctgata aaggagttgc accaggtaca 20640 gctgttttaa gacagtggtt gcctacgggt acgctgcttg tcgattcaga tcttaatgac 20700 tttgtctctg atgcagattc aactttgatt ggtgattgtg caactgtaca tacagctaat 20760 aaatgggatc tcattattag tgatatgtac gaccctaaga ctaaaaatgt tacaaaagaa 20820 aatgactcta aagagggttt tttcacttac atttgtgggt ttatacaaca aaagctagct 20880 cttggaggtt ccgtggctat aaagataaca gaacattctt ggaatgctga tctttataag 20940 ctcatgggac acttcgcatg gtggacagcc tttgttacta atgtgaatgc gtcatcatct 21000 gaagcatttt taattggatg taattatctt ggcaaaccac gcgaacaaat agatggttat 21060 gtcatgcatg caaattacat attttggagg aatacaaatc caattcagtt gtcttcctat 21120 tctttatttg acatgagtaa atttcccctt aaattaaggg gtactgctgt tatgtcttta 21180 aaagaaggtc aaatcaatga tatgatttta tctcttctta gtaaaggtag acttataatt 21240 agagaaaaca acagagttgt tatttctagt gatgttcttg ttaacaacta a 21291 <210> 314 <211> 13218 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 314 atggagagcc ttgtccctgg tttcaacgag aaaacacacg tccaactcag tttgcctgtt 60 ttacaggttc gcgacgtgct cgtacgtggc tttggagact ccgtggagga ggtcttatca 120 gaggcacgtc aacatcttaa agatggcact tgtggcttag tagaagttga aaaaggcgtt 180 ttgcctcaac ttgaacagcc ctatgtgttc atcaaacgtt cggatgctcg aactgcacct 240 catggtcatg ttatggttga gctggtagca gaactcgaag gcattcagta cggtcgtagt 300 ggtgagacac ttggtgtcct tgtccctcat gtgggcgaaa taccagtggc ttaccgcaag 360 gttcttcttc gtaagaacgg taataaagga gctggtggcc atagttacgg cgccgatcta 420 aagtcatttg acttaggcga cgagcttggc actgatcctt atgaagattt tcaagaaaac 480 tggaacacta aacatagcag tggtgttacc cgtgaactca tgcgtgagct taacggaggg 540 gcatacactc gctatgtcga taacaacttc tgtggccctg atggctaccc tcttgagtgc 600 attaaagacc ttctagcacg tgctggtaaa gcttcatgca ctttgtccga acaactggac 660 tttattgaca ctaagagggg tgtatactgc tgccgtgaac atgagcatga aattgcttgg 720 tacacggaac gttctgaaaa gagctatgaa ttgcagacac cttttgaaat taaattggca 780 aagaaatttg acaccttcaa tggggaatgt ccaaattttg tatttccctt aaattccata 840 atcaagacta ttcaaccaag ggttgaaaag aaaaagcttg atggctttat gggtagaatt 900 cgatctgtct atccagttgc gtcaccaaat gaatgcaacc aaatgtgcct ttcaactctc 960 atgaagtgtg atcattgtgg tgaaacttca tggcagacgg gcgattttgt taaagccact 1020 tgcgaatttt gtggcactga gaatttgact aaagaaggtg ccactacttg tggttactta 1080 ccccaaaatg ctgttgttaa aatttattgt ccagcatgtc acaattcaga agtaggacct 1140 gagcatagtc ttgccgaata ccataatgaa tctggcttga aaaccattct tcgtaagggt 1200 ggtcgcacta ttgcctttgg aggctgtgtg ttctcttatg ttggttgcca taacaagtgt 1260 gcctattggg ttccacgtgc tagcgctaac ataggttgta accatacagg tgttgttgga 1320 gaaggttccg aaggtcttaa tgacaacctt cttgaaatac tccaaaaaga gaaagtcaac 1380 atcaatattg ttggtgactt taaacttaat gaagagatcg ccattatttt ggcatctttt 1440 tctgcttcca caagtgcttt tgtggaaact gtgaaaggtt tggattataa agcattcaaa 1500 caaattgttg aatcctgtgg taattttaaa gttacaaaag gaaaagctaa aaaaggtgcc 1560 tggaatattg gtgaacagaa atcaatactg agtcctcttt atgcatttgc atcagaggct 1620 gctcgtgttg tacgatcaat tttctcccgc actcttgaaa ctgctcaaaa ttctgtgcgt 1680 gttttacaga aggccgctat aacaatacta gatggaattt cacagtattc actgagactc 1740 attgatgcta tgatgttcac atctgatttg gctactaaca atctagttgt aatggcctac 1800 attacaggtg gtgttgttca gttgacttcg cagtggctaa ctaacatctt tggcactgtt 1860 tatgaaaaac tcaaacccgt ccttgattgg cttgaagaga agtttaagga aggtgtagag 1920 tttcttagag acggttggga aattgttaaa tttatctcaa cctgtgcttg tgaaattgtc 1980 ggtggacaaa ttgtcacctg tgcaaaggaa attaaggaga gtgttcagac attctttaag 2040 cttgtaaata aatttttggc tttgtgtgct gactctatca ttattggtgg agctaaactt 2100 aaagccttga atttaggtga aacatttgtc acgcactcaa agggattgta cagaaagtgt 2160 gttaaatcca gagaagaaac tggcctactc atgcctctaa aagccccaaa agaaattatc 2220 ttcttagagg gagaaacact tcccacagaa gtgttaacag aggaagttgt cttgaaaact 2280 ggtgatttac aaccattaga acaacctact agtgaagctg ttgaagctcc attggttggt 2340 acaccagttt gtattaacgg gcttatgttg ctcgaaatca aagacacaga aaagtactgt 2400 gcccttgcac ctaatatgat ggtaacaaac aataccttca cactcaaagg cggtgcacca 2460 acaaaggtta cttttggtga tgacactgtg atagaagtgc aaggttacaa gagtgtgaat 2520 atcacttttg aacttgatga aaggattgat aaagtactta atgagaagtg ctctgcctat 2580 acagttgaac tcggtacaga agtaaatgag ttcgcctgtg ttgtggcaga tgctgtcata 2640 aaaactttgc aaccagtatc tgaattactt acaccactgg gcattgattt agatgagtgg 2700 agtatggcta catactactt atttgatgag tctggtgagt ttaaattggc ttcacatatg 2760 tattgttctt tttaccctcc agatgaggat gaagaagaag gtgattgtga agaagaagag 2820 tttgagccat caactcaata tgagtatggt actgaagatg attaccaagg taaacctttg 2880 gaatttggtg ccacttctgc tgctcttcaa cctgaagaag agcaagaaga agattggtta 2940 gatgatgata gtcaacaaac tgttggtcaa caagacggca gtgaggacaa tcagacaact 3000 actattcaaa caattgttga ggttcaacct caattagaga tggaacttac accagttgtt 3060 cagactattg aagtgaatag ttttagtggt tatttaaaac ttactgacaa tgtatacatt 3120 aaaaatgcag acattgtgga agaagctaaa aaggtaaaac caacagtggt tgttaatgca 3180 gccaatgttt accttaaaca tggaggaggt gttgcaggag ccttaaataa ggctactaac 3240 aatgccatgc aagttgaatc tgatgattac atagctacta atggaccact taaagtgggt 3300 ggtagttgtg ttttaagcgg acacaatctt gctaaacact gtcttcatgt tgtcggccca 3360 aatgttaaca aaggtgaaga cattcaactt cttaagagtg cttatgaaaa ttttaatcag 3420 cacgaagttc tacttgcacc attattatca gctggtattt ttggtgctga ccctatacat 3480 tctttaagag tttgtgtaga tactgttcgc acaaatgtct acttagctgt ctttgataaa 3540 aatctctatg acaaacttgt ttcaagcttt ttggaaatga agagtgaaaa gcaagttgaa 3600 caaaagatcg ctgagattcc taaagaggaa gttaagccat ttataactga aagtaaacct 3660 tcagttgaac agagaaaaca agatgataag aaaatcaaag cttgtgttga agaagttaca 3720 acaactctgg aagaaactaa gttcctcaca gaaaacttgt tactttatat tgacattaat 3780 ggcaatcttc atccagattc tgccactctt gttagtgaca ttgacatcac tttcttaaag 3840 aaagatgctc catatatagt gggtgatgtt gttcaagagg gtgttttaac tgctgtggtt 3900 atacctacta aaaaggctgg tggcactact gaaatgctag cgaaagcttt gagaaaagtg 3960 ccaacagaca attatataac cacttacccg ggtcagggtt taaatggtta cactgtagag 4020 gaggcaaaga cagtgcttaa aaagtgtaaa agtgcctttt acattctacc atctattatc 4080 tctaatgaga agcaagaaat tcttggaact gtttcttgga atttgcgaga aatgcttgca 4140 catgcagaag aaacacgcaa attaatgcct gtctgtgtgg aaactaaagc catagtttca 4200 actatacagc gtaaatataa gggtattaaa atacaagagg gtgtggttga ttatggtgct 4260 agattttact tttacaccag taaaacaact gtagcgtcac ttatcaacac acttaacgat 4320 ctaaatgaaa ctcttgttac aatgccactt ggctatgtaa cacatggctt aaatttggaa 4380 gaagctgctc ggtatatgag atctctcaaa gtgccagcta cagtttctgt ttcttcacct 4440 gatgctgtta cagcgtataa tggttatctt acttcttctt ctaaaacacc tgaagaacat 4500 tttattgaaa ccatctcact tgctggttcc tataaagatt ggtcctattc tggacaatct 4560 acacaactag gtatagaatt tcttaagaga ggtgataaaa gtgtatatta cactagtaat 4620 cctaccacat tccacctaga tggtgaagtt atcacctttg acaatcttaa gacacttctt 4680 tctttgagag aagtgaggac tattaaggtg tttacaacag tagacaacat taacctccac 4740 acgcaagttg tggacatgtc aatgacatat ggacaacagt ttggtccaac ttatttggat 4800 ggagctgatg ttactaaaat aaaacctcat aattcacatg aaggtaaaac attttatgtt 4860 ttacctaatg atgacactct acgtgttgag gcttttgagt actaccacac aactgatcct 4920 agttttctgg gtaggtacat gtcagcatta aatcacacta aaaagtggaa atacccacaa 4980 gttaatggtt taacttctat taaatgggca gataacaact gttatcttgc cactgcattg 5040 ttaacactcc aacaaataga gttgaagttt aatccacctg ctctacaaga tgcttattac 5100 agagcaaggg ctggtgaagc tgctaacttt tgtgcactta tcttagccta ctgtaataag 5160 acagtaggtg agttaggtga tgttagagaa acaatgagtt acttgtttca acatgccaat 5220 ttagattctt gcaaaagagt cttgaacgtg gtgtgtaaaa cttgtggaca acagcagaca 5280 acccttaagg gtgtagaagc tgttatgtac atgggcacac tttcttatga acaatttaag 5340 aaaggtgttc agataccttg tacgtgtggt aaacaagcta caaaatatct agtacaacag 5400 gagtcacctt ttgttatgat gtcagcacca cctgctcagt atgaacttaa gcatggtaca 5460 tttacttgtg ctagtgagta cactggtaat taccagtgtg gtcactataa acatataact 5520 tctaaagaaa ctttgtattg catagacggt gctttactta caaagtcctc agaatacaaa 5580 ggtcctatta cggatgtttt ctacaaagaa aacagttaca caacaaccat aaaaccagtt 5640 acttataaat tggatggtgt tgtttgtaca gaaattgacc ctaagttgga caattattat 5700 aagaaagaca attcttattt cacagagcaa ccaattgatc ttgtaccaaa ccaaccatat 5760 ccaaacgcaa gcttcgataa ttttaagttt gtatgtgata atatcaaatt tgctgatgat 5820 ttaaaccagt taactggtta taagaaacct gcttcaagag agcttaaagt tacatttttc 5880 cctgacttaa atggtgatgt ggtggctatt gattataaac actacacacc ctcttttaag 5940 aaaggagcta aattgttaca taaacctatt gtttggcatg ttaacaatgc aactaataaa 6000 gccacgtata aaccaaatac ctggtgtata cgttgtcttt ggagcacaaa accagttgaa 6060 acatcaaatt cgtttgatgt actgaagtca gaggacgcgc agggaatgga taatcttgcc 6120 tgcgaagatc taaaaccagt ctctgaagaa gtagtggaaa atcctaccat acagaaagac 6180 gttcttgagt gtaatgtgaa aactaccgaa gttgtaggag acattatact taaaccagca 6240 aataatagtt taaaaattac agaagaggtt ggccacacag atctaatggc tgcttatgta 6300 gacaattcta gtcttactat taagaaacct aatgaattat ctagagtatt aggtttgaaa 6360 acccttgcta ctcatggttt agctgctgtt aatagtgtcc cttgggatac tatagctaat 6420 tatgctaagc cttttcttaa caaagttgtt agtacaacta ctaacatagt tacacggtgt 6480 ttaaaccgtg tttgtactaa ttatatgcct tatttcttta ctttattgct acaattgtgt 6540 acttttacta gaagtacaaa ttctagaatt aaagcatcta tgccgactac tatagcaaag 6600 aatactgtta agagtgtcgg taaattttgt ctagaggctt catttaatta tttgaagtca 6660 cctaattttt ctaaactgat aaatattata atttggtttt tactattaag tgtttgccta 6720 ggttctttaa tctactcaac cgctgcttta ggtgttttaa tgtctaattt aggcatgcct 6780 tcttactgta ctggttacag agaaggctat ttgaactcta ctaatgtcac tattgcaacc 6840 tactgtactg gttctatacc ttgtagtgtt tgtcttagtg gtttagattc tttagacacc 6900 tatccttctt tagaaactat acaaattacc atttcatctt ttaaatggga tttaactgct 6960 tttggcttag ttgcagagtg gtttttggca tatattcttt tcactaggtt tttctatgta 7020 cttggattgg ctgcaatcat gcaattgttt ttcagctatt ttgcagtaca ttttattagt 7080 aattcttggc ttatgtggtt aataattaat cttgtacaaa tggccccgat ttcagctatg 7140 gttagaatgt acatcttctt tgcatcattt tattatgtat ggaaaagtta tgtgcatgtt 7200 gtagacggtt gtaattcatc aacttgtatg atgtgttaca aacgtaatag agcaacaaga 7260 gtcgaatgta caactattgt taatggtgtt agaaggtcct tttatgtcta tgctaatgga 7320 ggtaaaggct tttgcaaact acacaattgg aattgtgtta attgtgatac attctgtgct 7380 ggtagtacat ttattagtga tgaagttgcg agagacttgt cactacagtt taaaagacca 7440 ataaatccta ctgaccagtc ttcttacatc gttgatagtg ttacagtgaa gaatggttcc 7500 atccatcttt actttgataa agctggtcaa aagacttatg aaagacattc tctctctcat 7560 tttgttaact tagacaacct gagagctaat aacactaaag gttcattgcc tattaatgtt 7620 atagtttttg atggtaaatc aaaatgtgaa gaatcatctg caaaatcagc gtctgtttac 7680 tacagtcagc ttatgtgtca acctatactg ttactagatc aggcattagt gtctgatgtt 7740 ggtgatagtg cggaagttgc agttaaaatg tttgatgctt acgttaatac gttttcatca 7800 acttttaacg taccaatgga aaaactcaaa acactagttg caactgcaga agctgaactt 7860 gcaaagaatg tgtccttaga caatgtctta tctactttta tttcagcagc tcggcaaggg 7920 tttgttgatt cagatgtaga aactaaagat gttgttgaat gtcttaaatt gtcacatcaa 7980 tctgacatag aagttactgg cgatagttgt aataactata tgctcaccta taacaaagtt 8040 gaaaacatga caccccgtga ccttggtgct tgtattgact gtagtgcgcg tcatattaat 8100 gcgcaggtag caaaaagtca caacattgct ttgatatgga acgttaaaga tttcatgtca 8160 ttgtctgaac aactacgaaa acaaatacgt agtgctgcta aaaagaataa cttacctttt 8220 aagttgacat gtgcaactac tagacaagtt gttaatgttg taacaacaaa gatagcactt 8280 aagggtggta aaattgttaa taattggttg aagcagttaa ttaaagttac acttgtgttc 8340 ctttttgttg ctgctatttt ctatttaata acacctgttc atgtcatgtc taaacatact 8400 gacttttcaa gtgaaatcat aggatacaag gctattgatg gtggtgtcac tcgtgacata 8460 gcatctacag atacttgttt tgctaacaaa catgctgatt ttgacacatg gtttagccag 8520 cgtggtggta gttatactaa tgacaaagct tgcccattga ttgctgcagt cataacaaga 8580 gaagtgggtt ttgtcgtgcc tggtttgcct ggcacgatat tacgcacaac taatggtgac 8640 tttttgcatt tcttacctag agtttttagt gcagttggta acatctgtta cacaccatca 8700 aaacttatag agtacactga ctttgcaaca tcagcttgtg ttttggctgc tgaatgtaca 8760 atttttaaag atgcttctgg taagccagta ccatattgtt atgataccaa tgtactagaa 8820 ggttctgttg cttatgaaag tttacgccct gacacacgtt atgtgctcat ggatggctct 8880 attattcaat ttcctaacac ctaccttgaa ggttctgtta gagtggtaac aacttttgat 8940 tctgagtact gtaggcacgg cacttgtgaa agatcagaag ctggtgtttg tgtatctact 9000 agtggtagat gggtacttaa caatgattat tacagatctt taccaggagt tttctgtggt 9060 gtagatgctg taaatttact tactaatatg tttacaccac taattcaacc tattggtgct 9120 ttggacatat cagcatctat agtagctggt ggtattgtag ctatcgtagt aacatgcctt 9180 gcctactatt ttatgaggtt tagaagagct tttggtgaat acagtcatgt agttgccttt 9240 aatactttac tattccttat gtcattcact gtactctgtt taacaccagt ttactcattc 9300 ttacctggtg tttattctgt tatttacttg tacttgacat tttatcttac taatgatgtt 9360 tcttttttag cacatattca gtggatggtt atgttcacac ctttagtacc tttctggata 9420 acaattgctt atatcatttg tatttccaca aagcatttct attggttctt tagtaattac 9480 ctaaagagac gtgtagtctt taatggtgtt tcctttagta cttttgaaga agctgcgctg 9540 tgcacctttt tgttaaataa agaaatgtat ctaaagttgc gtagtgatgt gctattacct 9600 cttacgcaat ataatagata cttagctctt tataataagt acaagtattt tagtggagca 9660 atggatacaa ctagctacag agaagctgct tgttgtcatc tcgcaaaggc tctcaatgac 9720 ttcagtaact caggttctga tgttctttac caaccaccac aaacctctat cacctcagct 9780 gttttgcaga gtggttttag aaaaatggca ttcccatctg gtaaagttga gggttgtatg 9840 gtacaagtaa cttgtggtac aactacactt aacggtcttt ggcttgatga cgtagtttac 9900 tgtccaagac atgtgatctg cacctctgaa gacatgctta accctaatta tgaagattta 9960 ctcattcgta agtctaatca taatttcttg gtacaggctg gtaatgttca actcagggtt 10020 attggacatt ctatgcaaaa ttgtgtactt aagcttaagg ttgatacagc caatcctaag 10080 acacctaagt ataagtttgt tcgcattcaa ccaggacaga ctttttcagt gttagcttgt 10140 tacaatggtt caccatctgg tgtttaccaa tgtgctatga ggcccaattt cactattaag 10200 ggttcattcc ttaatggttc atgtggtagt gttggtttta acatagatta tgactgtgtc 10260 tctttttgtt acatgcacca tatggaatta ccaactggag ttcatgctgg cacagactta 10320 gaaggtaact tttatggacc ttttgttgac aggcaaacag cacaagcagc tggtacggac 10380 acaactatta cagttaatgt tttagcttgg ttgtacgctg ctgttataaa tggagacagg 10440 tggtttctca atcgatttac cacaactctt aatgacttta accttgtggc tatgaagtac 10500 aattatgaac ctctaacaca agaccatgtt gacatactag gacctctttc tgctcaaact 10560 ggaattgccg ttttagatat gtgtgcttca ttaaaagaat tactgcaaaa tggtatgaat 10620 ggacgtacca tattgggtag tgctttatta gaagatgaat ttacaccttt tgatgttgtt 10680 agacaatgct caggtgttac tttccaaagt gcagtgaaaa gaacaatcaa gggtacacac 10740 cactggttgt tactcacaat tttgacttca cttttagttt tagtccagag tactcaatgg 10800 tctttgttct tttttttgta tgaaaatgcc tttttacctt ttgctatggg tattattgct 10860 atgtctgctt ttgcaatgat gtttgtcaaa cataagcatg catttctctg tttgtttttg 10920 ttaccttctc ttgccactgt agcttatttt aatatggtct atatgcctgc tagttgggtg 10980 atgcgtatta tgacatggtt ggatatggtt gatactagtt tgtctggttt taagctaaaa 11040 gactgtgtta tgtatgcatc agctgtagtg ttactaatcc ttatgacagc aagaactgtg 11100 tatgatgatg gtgctaggag agtgtggaca cttatgaatg tcttgacact cgtttataaa 11160 gtttattatg gtaatgcttt agatcaagcc atttccatgt gggctcttat aatctctgtt 11220 acttctaact actcaggtgt agttacaact gtcatgtttt tggccagagg tattgttttt 11280 atgtgtgttg agtattgccc tattttcttc ataactggta atacacttca gtgtataatg 11340 ctagtttatt gtttcttagg ctatttttgt acttgttact ttggcctctt ttgtttactc 11400 aaccgctact ttagactgac tcttggtgtt tatgattact tagtttctac acaggagttt 11460 agatatatga attcacaggg actactccca cccaagaata gcatagatgc cttcaaactc 11520 aacattaaat tgttgggtgt tggtggcaaa ccttgtatca aagtagccac tgtacagtct 11580 aaaatgtcag atgtaaagtg cacatcagta gtcttactct cagttttgca acaactcaga 11640 gtagaatcat catctaaatt gtgggctcaa tgtgtccagt tacacaatga cattctctta 11700 gctaaagata ctactgaagc ctttgaaaaa atggtttcac tactttctgt tttgctttcc 11760 atgcagggtg ctgtagacat aaacaagctt tgtgaagaaa tgctggacaa cagggcaacc 11820 ttacaagcta tagcctcaga gtttagttcc cttccatcat atgcagcttt tgctactgct 11880 caagaagctt atgagcaggc tgttgctaat ggtgattctg aagttgttct taaaaagttg 11940 aagaagtctt tgaatgtggc taaatctgaa tttgaccgtg atgcagccat gcaacgtaag 12000 ttggaaaaga tggctgatca agctatgacc caaatgtata aacaggctag atctgaggac 12060 aagagggcaa aagttactag tgctatgcag acaatgcttt tcactatgct tagaaagttg 12120 gataatgatg cactcaacaa cattatcaac aatgcaagag atggttgtgt tcccttgaac 12180 ataatacctc ttacaacagc agccaaacta atggttgtca taccagacta taacacatat 12240 aaaaatacgt gtgatggtac aacatttact tatgcatcag cattgtggga aatccaacag 12300 gttgtagatg cagatagtaa aattgttcaa cttagtgaaa ttagtatgga caattcacct 12360 aatttagcat ggcctcttat tgtaacagct ttaagggcca attctgctgt caaattacag 12420 aataatgagc ttagtcctgt tgcactacga cagatgtctt gtgctgccgg tactacacaa 12480 actgcttgca ctgatgacaa tgcgttagct tactacaaca caacaaaggg aggtaggttt 12540 gtacttgcac tgttatccga tttacaggat ttgaaatggg ctagattccc taagagtgat 12600 ggaactggta ctatctatac agaactggaa ccaccttgta ggtttgttac agacacacct 12660 aaaggtccta aagtgaagta tttatacttt attaaaggat taaacaacct aaatagaggt 12720 atggtacttg gtagtttagc tgccacagta cgtctacaag ctggtaatgc aacagaagtg 12780 cctgccaatt caactgtatt atctttctgt gcttttgctg tagatgctgc taaagcttac 12840 aaagattatc tagctagtgg gggacaacca atcactaatt gtgttaagat gttgtgtaca 12900 cacactggta ctggtcaggc aataacagtt acaccggaag ccaatatgga tcaagaatcc 12960 tttggtggtg catcgtgttg tctgtactgc cgttgccaca tagatcatcc aaatcctaaa 13020 ggattttgtg acttaaaagg taagtatgta caaataccta caacttgtgc taatgaccct 13080 gtgggtttta cacttaaaaa cacagtctgt accgtctgcg gtatgtggaa aggttatggc 13140 tgtagttgtg atcaactccg cgaacccatg cttcagtcag ctgatgcaca atcgttttta 13200 aacgggtttg cggtgtaa 13218 <210> 315 <211> 3822 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 315 atgtttgttt ttcttgtttt attgccacta gtttctagtc agtgtgttaa tcttacaacc 60 agaactcaat taccccctgc atacactaat tctttcacac gtggtgttta ttaccctgac 120 aaagttttca gatcctcagt tttacattca actcaggact tgttcttacc tttcttttcc 180 aatgttactt ggttccatgc tatacatgtc tctgggacca atggtactaa gaggtttgat 240 aaccctgtcc taccatttaa tgatggtgtt tattttgctt ccactgagaa gtctaacata 300 ataagaggct ggatttttgg tactacttta gattcgaaga cccagtccct acttattgtt 360 aataacgcta ctaatgttgt tattaaagtc tgtgaatttc aattttgtaa tgatccattt 420 ttgggtgttt attaccacaa aaacaacaaa agttggatgg aaagtgagtt cagagtttat 480 tctagtgcga ataattgcac ttttgaatat gtctctcagc cttttcttat ggaccttgaa 540 ggaaaacagg gtaatttcaa aaatcttagg gaatttgtgt ttaagaatat tgatggttat 600 tttaaaatat attctaagca cacgcctatt aatttagtgc gtgatctccc tcagggtttt 660 tcggctttag aaccattggt agatttgcca ataggtatta acatcactag gtttcaaact 720 ttacttgctt tacatagaag ttatttgact cctggtgatt cttcttcagg ttggacagct 780 ggtgctgcag cttattatgt gggttatctt caacctagga cttttctatt aaaatataat 840 gaaaatggaa ccattacaga tgctgtagac tgtgcacttg accctctctc agaaacaaag 900 tgtacgttga aatccttcac tgtagaaaaa ggaatctatc aaacttctaa ctttagagtc 960 caaccaacag aatctattgt tagatttcct aatattacaa acttgtgccc ttttggtgaa 1020 gtttttaacg ccaccagatt tgcatctgtt tatgcttgga acaggaagag aatcagcaac 1080 tgtgttgctg attattctgt cctatataat tccgcatcat tttccacttt taagtgttat 1140 ggagtgtctc ctactaaatt aaatgatctc tgctttacta atgtctatgc agattcattt 1200 gtaattagag gtgatgaagt cagacaaatc gctccagggc aaactggaaa gattgctgat 1260 tataattata aattaccaga tgattttaca ggctgcgtta tagcttggaa ttctaacaat 1320 cttgattcta aggttggtgg taattataat tacctgtata gattgtttag gaagtctaat 1380 ctcaaacctt ttgagagaga tatttcaact gaaatctatc aggccggtag cacaccttgt 1440 aatggtgttg aaggttttaa ttgttacttt cctttacaat catatggttt ccaacccact 1500 aatggtgttg gttaccaacc atacagagta gtagtacttt cttttgaact tctacatgca 1560 ccagcaactg tttgtggacc taaaaagtct actaatttgg ttaaaaacaa atgtgtcaat 1620 ttcaacttca atggtttaac aggcacaggt gttcttactg agtctaacaa aaagtttctg 1680 cctttccaac aatttggcag agacattgct gacactactg atgctgtccg tgatccacag 1740 acacttgaga ttcttgacat tacaccatgt tcttttggtg gtgtcagtgt tataacacca 1800 ggaacaaata cttctaacca ggttgctgtt ctttatcagg gtgttaactg cacagaagtc 1860 cctgttgcta ttcatgcaga tcaacttact cctacttggc gtgtttattc tacaggttct 1920 aatgtttttc aaacacgtgc aggctgttta ataggggctg aacatgtcaa caactcatat 1980 gagtgtgaca tacccattgg tgcaggtata tgcgctagtt atcagactca gactaattct 2040 cctcggcggg cacgtagtgt agctagtcaa tccatcattg cctacactat gtcacttggt 2100 gcagaaaatt cagttgctta ctctaataac tctattgcca tacccacaaa ttttactatt 2160 agtgttacca cagaaattct accagtgtct atgaccaaga catcagtaga ttgtacaatg 2220 tacatttgtg gtgattcaac tgaatgcagc aatcttttgt tgcaatatgg cagtttttgt 2280 acacaattaa accgtgcttt aactggaata gctgttgaac aagacaaaaa cacccaagaa 2340 gtttttgcac aagtcaaaca aatttacaaa acaccaccaa ttaaagattt tggtggtttt 2400 aatttttcac aaatattacc agatccatca aaaccaagca agaggtcatt tattgaagat 2460 ctacttttca acaaagtgac acttgcagat gctggcttca tcaaacaata tggtgattgc 2520 cttggtgata ttgctgctag agacctcatt tgtgcacaaa agtttaacgg ccttactgtt 2580 ttgccacctt tgctcacaga tgaaatgatt gctcaataca cttctgcact gttagcgggt 2640 acaatcactt ctggttggac ctttggtgca ggtgctgcat tacaaatacc atttgctatg 2700 caaatggctt ataggtttaa tggtattgga gttacacaga atgttctcta tgagaaccaa 2760 aaattgattg ccaaccaatt taatagtgct attggcaaaa ttcaagactc actttcttcc 2820 acagcaagtg cacttggaaa acttcaagat gtggtcaacc aaaatgcaca agctttaaac 2880 acgcttgtta aacaacttag ctccaatttt ggtgcaattt caagtgtttt aaatgatatc 2940 ctttcacgtc ttgacaaagt tgaggctgaa gtgcaaattg ataggttgat cacaggcaga 3000 cttcaaagtt tgcagacata tgtgactcaa caattaatta gagctgcaga aatcagagct 3060 tctgctaatc ttgctgctac taaaatgtca gagtgtgtac ttggacaatc aaaaagagtt 3120 gatttttgtg gaaagggcta tcatcttatg tccttccctc agtcagcacc tcatggtgta 3180 gtcttcttgc atgtgactta tgtccctgca caagaaaaga acttcacaac tgctcctgcc 3240 atttgtcatg atggaaaagc acactttcct cgtgaaggtg tctttgtttc aaatggcaca 3300 cactggtttg taacacaaag gaatttttat gaaccacaaa tcattactac agacaacaca 3360 tttgtgtctg gtaactgtga tgttgtaata ggaattgtca acaacacagt ttatgatcct 3420 ttgcaacctg aattagactc attcaaggag gagttagata aatattttaa gaatcataca 3480 tcaccagatg ttgatttagg tgacatctct ggcattaatg cttcagttgt aaacattcaa 3540 aaagaaattg accgcctcaa tgaggttgcc aagaatttaa atgaatctct catcgatctc 3600 caagaacttg gaaagtatga gcagtatata aaatggccat ggtacatttg gctaggtttt 3660 atagctggct tgattgccat agtaatggtg acaattatgc tttgctgtat gaccagttgc 3720 tgtagttgtc tcaagggctg ttgttcttgt ggatcctgct gcaaatttga tgaagacgac 3780 tctgagccag tgctcaaagg agtcaaatta cattacacat aa 3822 <210> 316 <211> 828 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 316 atggatttgt ttatgagaat cttcacaatt ggaactgtaa ctttgaagca aggtgaaatc 60 aaggatgcta ctccttcaga ttttgttcgc gctactgcaa cgataccgat acaagcctca 120 ctccctttcg gatggcttat tgttggcgtt gcacttcttg ctgtttttca gagcgcttcc 180 aaaatcataa ccctcaaaaa gagatggcaa ctagcactct ccaagggtgt tcactttgtt 240 tgcaacttgc tgttgttgtt tgtaacagtt tactcacacc ttttgctcgt tgctgctggc 300 cttgaagccc cttttctcta tctttatgct ttagtctact tcttgcagag tataaacttt 360 gtaagaataa taatgaggct ttggctttgc tggaaatgcc gttccaaaaa cccattactt 420 tatgatgcca actattttct ttgctggcat actaattgtt acgactattg tataccttac 480 aatagtgtaa cttcttcaat tgtcattact tcaggtgatg gcacaacaag tcctatttct 540 gaacatgact accagattgg tggttatact gaaaaatggg aatctggagt aaaagactgt 600 gttgtattac acagttactt cacttcagac tattaccagc tgtactcaac tcaattgagt 660 acagacactg gtgttgaaca tgttaccttc ttcatctaca ataaaattgt tgatgagcct 720 gaagaacatg tccaaattca cacaatcgac ggttcatccg gagttgttaa tccagtaatg 780 gaaccaattt atgatgaacc gacgacgact actagcgtgc ctttgtaa 828 <210> 317 <211> 228 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 317 atgtactcat tcgtttcgga agagacaggt acgttaatag ttaatagcgt acttcttttt 60 cttgctttcg tggtattctt gctagttaca ctagccatcc ttactgcgct tcgattgtgt 120 gcgtactgct gcaatattgt taacgtgagt cttgtaaaac cttcttttta cgtttactct 180 cgtgttaaaa atctgaattc ttctagagtt cctgatcttc tggtctaa 228 <210> 318 <211> 669 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 318 atggcagatt ccaacggtac tattaccgtt gaagagctta aaaagctcct tgaacaatgg 60 aacctagtaa taggtttcct attccttaca tggatttgtc ttctacaatt tgcctatgcc 120 aacaggaata ggtttttgta tataattaag ttaattttcc tctggctgtt atggccagta 180 actttagctt gttttgtgct tgctgctgtt tacagaataa attggatcac cggtggaatt 240 gctatcgcaa tggcttgtct tgtaggcttg atgtggctca gctacttcat tgcttctttc 300 agactgtttg cgcgtacgcg ttccatgtgg tcattcaatc cagaaactaa cattcttctc 360 aacgtgccac tccatggcac tattctgacc agaccgcttc tagaaagtga actcgtaatc 420 ggagctgtga tccttcgtgg acatcttcgt attgctggac accatctagg acgctgtgac 480 atcaaggacc tgcctaaaga aatcactgtt gctacatcac gaacgctttc ttattacaaa 540 ttgggagctt cgcagcgtgt agcaggtgac tcaggttttg ctgcatacag tcgctacagg 600 attggcaact ataaattaaa cacagaccat tccagtagca gtgacaatat tgctttgctt 660 gtacagtaa 669 <210> 319 <211> 186 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 319 atgtttcatc tcgttgactt tcaggttact atagcagaga tattactaat tattatgagg 60 acttttaaag tttccatttg gaatcttgat tacatcataa acctcataat taaaaattta 120 tctaagtcac taactgagaa taaatattct caattagatg aagagcaacc aatggagatt 180 gattaa 186 <210> 320 <211> 366 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 320 atgaaaatta ttcttttctt ggcactgata acactcgcta cttgtgagct ttatcactac 60 caagagtgtg ttagaggtac aacagtactt ttaaaagaac cttgctcttc tggaacatac 120 gagggcaatt caccatttca tcctctagct gataacaaat ttgcactgac ttgctttagc 180 actcaatttg cttttgcttg tcctgacggc gtaaaacacg tctatcagtt acgtgccaga 240 tcagtttcac ctaaactgtt catcagacaa gaggaagttc aagaacttta ctctccaatt 300 tttcttattg ttgcggcaat agtgtttata acactttgct tcacactcaa aagaaagaca 360 gaatga 366 <210> 321 <211> 132 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 321 atgattgaac tttcattaat tgacttctat ttgtgctttt tagcctttct gctattcctt 60 gttttaatta tgcttattat cttttggttc tcacttgaac tgcaagatca taatgaaact 120 tgtcacgcct aa 132 <210> 322 <211> 366 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 322 atgaaatttc ttgttttctt aggaatcatc acaactgtag ctgcatttca ccaagaatgt 60 agtttacagt catgtactca acatcaacca tatgtagttg atgacccgtg tcctattcac 120 ttctattcta aatggtatat tagagtagga gctagaaaat cagcaccttt aattgaattg 180 tgcgtggatg aggctggttc taaatcaccc attcagtaca tcgatatcgg taattataca 240 gtttcctgtt taccttttac aattaattgc caggaaccta aattgggtag tcttgtagtg 300 cgttgttcgt tctatgaaga ctttttagag tatcatgacg ttcgtgttgt tttagatttc 360 atctaa 366 <210> 323 <211> 1260 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 323 atgtctgata atggacccca aaatcagcga aatgcacccc gcattacgtt tggtggaccc 60 tcagattcaa ctggcagtaa ccagaatgga gaacgcagtg gggcgcgatc aaaacaacgt 120 cggccccaag gtttacccaa taatactgcg tcttggttca ccgctctcac tcaacatggc 180 aaggaagacc ttaaattccc tcgaggacaa ggcgttccaa ttaacaccaa tagcagtcca 240 gatgaccaaa ttggctacta ccgaagagct accagacgaa ttcgtggtgg tgacggtaaa 300 atgaaagatc tcagtccaag atggtatttc tactacctag gaactgggcc agaagctgga 360 cttccctatg gtgctaacaa agacggcatc atatgggttg caactgaggg agccttgaat 420 acaccaaaag atcacattgg cacccgcaat cctgctaaca atgctgcaat cgtgctacaa 480 cttcctcaag gaacaacatt gccaaaaggc ttctacgcag aagggagcag aggcggcagt 540 caagcctctt ctcgttcctc atcacgtagt cgcaacagtt caagaaattc aactccaggc 600 agcagtaggg gaacttctcc tgctagaatg gctggcaatg gcggtgatgc tgctcttgct 660 ttgctgctgc ttgacagatt gaaccagctt gagagcaaaa tgtctggtaa aggccaacaa 720 caacaaggcc aaactgtcac taagaaatct gctgctgagg cttctaagaa gcctcggcaa 780 aaacgtactg ccactaaagc atacaatgta acacaagctt tcggcagacg tggtccagaa 840 caaacccaag gaaattttgg ggaccaggaa ctaatcagac aaggaactga ttacaaacat 900 tggccgcaaa ttgcacaatt tgcccccagc gcttcagcgt tcttcggaat gtcgcgcatt 960 ggcatggaag tcacaccttc gggaacgtgg ttgacctaca caggtgccat caaattggat 1020 gacaaagatc caaatttcaa agatcaagtc attttgctga ataagcatat tgacgcatac 1080 aaaacattcc caccaacaga gcctaaaaag gacaaaaaga agaaggctga tgaaactcaa 1140 gccttaccgc agagacagaa gaaacagcaa actgtgactc ttcttcctgc tgcagatttg 1200 gatgatttct ccaaacaatt gcaacaatcc atgagcagtg ctgactcaac tcaggcctaa 1260 <210> 324 <211> 117 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 324 atgggctata taaacgtttt cgcttttccg tttacgatat atagtctact cttgtgcaga 60 atgaattctc gtaactacat agcacaagta gatgtagtta actttaatct cacatag 117 <210> 325 <211> 21291 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 325 atggagagcc ttgtccctgg tttcaacgag aaaacacacg tccaactcag tttgcctgtt 60 ttacaggttc gcgacgtgct cgtacgtggc tttggagact ccgtggagga ggtcttatca 120 gaggcacgtc aacatcttaa agatggcact tgtggcttag tagaagttga aaaaggcgtt 180 ttgcctcaac ttgaacagcc ctatgtgttc atcaaacgtt cggatgctcg aactgcacct 240 catggtcatg ttatggttga gctggtagca gaactcgaag gcattcagta cggtcgtagt 300 ggtgagacac ttggtgtcct tgtccctcat gtgggcgaaa taccagtggc ttaccgcaag 360 gttcttcttc gtaagaacgg taataaagga gctggtggcc atagttacgg cgccgatcta 420 aagtcatttg acttaggcga cgagcttggc actgatcctt atgaagattt tcaagaaaac 480 tggaacacta aacatagcag tggtgttacc cgtgaactca tgcgtgagct taacggaggg 540 gcatacactc gctatgtcga taacaacttc tgtggccctg atggctaccc tcttgagtgc 600 attaaagacc ttctagcacg tgctggtaaa gcttcatgca ctttgtccga acaactggac 660 tttattgaca ctaagagggg tgtatactgc tgccgtgaac atgagcatga aattgcttgg 720 tacacggaac gttctgaaaa gagctatgaa ttgcagacac cttttgaaat taaattggca 780 aagaaatttg acaccttcaa tggggaatgt ccaaattttg tatttccctt aaattccata 840 atcaagacta ttcaaccaag ggttgaaaag aaaaagcttg atggctttat gggtagaatt 900 cgatctgtct atccagttgc gtcaccaaat gaatgcaacc aaatgtgcct ttcaactctc 960 atgaagtgtg atcattgtgg tgaaacttca tggcagacgg gcgattttgt taaagccact 1020 tgcgaatttt gtggcactga gaatttgact aaagaaggtg ccactacttg tggttactta 1080 ccccaaaatg ctgttgttaa aatttattgt ccagcatgtc acaattcaga agtaggacct 1140 gagcatagtc ttgccgaata ccataatgaa tctggcttga aaaccattct tcgtaagggt 1200 ggtcgcacta ttgcctttgg aggctgtgtg ttctcttatg ttggttgcca taacaagtgt 1260 gcctattggg ttccacgtgc tagcgctaac ataggttgta accatacagg tgttgttgga 1320 gaaggttccg aaggtcttaa tgacaacctt cttgaaatac tccaaaaaga gaaagtcaac 1380 atcaatattg ttggtgactt taaacttaat gaagagatcg ccattatttt ggcatctttt 1440 tctgcttcca caagtgcttt tgtggaaact gtgaaaggtt tggattataa agcattcaaa 1500 caaattgttg aatcctgtgg taattttaaa gttacaaaag gaaaagctaa aaaaggtgcc 1560 tggaatattg gtgaacagaa atcaatactg agtcctcttt atgcatttgc atcagaggct 1620 gctcgtgttg tacgatcaat tttctcccgc actcttgaaa ctgctcaaaa ttctgtgcgt 1680 gttttacaga aggccgctat aacaatacta gatggaattt cacagtattc actgagactc 1740 attgatgcta tgatgttcac atctgatttg gctactaaca atctagttgt aatggcctac 1800 attacaggtg gtgttgttca gttgacttcg cagtggctaa ctaacatctt tggcactgtt 1860 tatgaaaaac tcaaacccgt ccttgattgg cttgaagaga agtttaagga aggtgtagag 1920 tttcttagag acggttggga aattgttaaa tttatctcaa cctgtgcttg tgaaattgtc 1980 ggtggacaaa ttgtcacctg tgcaaaggaa attaaggaga gtgttcagac attctttaag 2040 cttgtaaata aatttttggc tttgtgtgct gactctatca ttattggtgg agctaaactt 2100 aaagccttga atttaggtga aacatttgtc acgcactcaa agggattgta cagaaagtgt 2160 gttaaatcca gagaagaaac tggcctactc atgcctctaa aagccccaaa agaaattatc 2220 ttcttagagg gagaaacact tcccacagaa gtgttaacag aggaagttgt cttgaaaact 2280 ggtgatttac aaccattaga acaacctact agtgaagctg ttgaagctcc attggttggt 2340 acaccagttt gtattaacgg gcttatgttg ctcgaaatca aagacacaga aaagtactgt 2400 gcccttgcac ctaatatgat ggtaacaaac aataccttca cactcaaagg cggtgcacca 2460 acaaaggtta cttttggtga tgacactgtg atagaagtgc aaggttacaa gagtgtgaat 2520 atcacttttg aacttgatga aaggattgat aaagtactta atgagaagtg ctctgcctat 2580 acagttgaac tcggtacaga agtaaatgag ttcgcctgtg ttgtggcaga tgctgtcata 2640 aaaactttgc aaccagtatc tgaattactt acaccactgg gcattgattt agatgagtgg 2700 agtatggcta catactactt atttgatgag tctggtgagt ttaaattggc ttcacatatg 2760 tattgttctt tttaccctcc agatgaggat gaagaagaag gtgattgtga agaagaagag 2820 tttgagccat caactcaata tgagtatggt actgaagatg attaccaagg taaacctttg 2880 gaatttggtg ccacttctgc tgctcttcaa cctgaagaag agcaagaaga agattggtta 2940 gatgatgata gtcaacaaac tgttggtcaa caagacggca gtgaggacaa tcagacaact 3000 actattcaaa caattgttga ggttcaacct caattagaga tggaacttac accagttgtt 3060 cagactattg aagtgaatag ttttagtggt tatttaaaac ttactgacaa tgtatacatt 3120 aaaaatgcag acattgtgga agaagctaaa aaggtaaaac caacagtggt tgttaatgca 3180 gccaatgttt accttaaaca tggaggaggt gttgcaggag ccttaaataa ggctactaac 3240 aatgccatgc aagttgaatc tgatgattac atagctacta atggaccact taaagtgggt 3300 ggtagttgtg ttttaagcgg acacaatctt gctaaacact gtcttcatgt tgtcggccca 3360 aatgttaaca aaggtgaaga cattcaactt cttaagagtg cttatgaaaa ttttaatcag 3420 cacgaagttc tacttgcacc attattatca gctggtattt ttggtgctga ccctatacat 3480 tctttaagag tttgtgtaga tactgttcgc acaaatgtct acttagctgt ctttgataaa 3540 aatctctatg acaaacttgt ttcaagcttt ttggaaatga agagtgaaaa gcaagttgaa 3600 caaaagatcg ctgagattcc taaagaggaa gttaagccat ttataactga aagtaaacct 3660 tcagttgaac agagaaaaca agatgataag aaaatcaaag cttgtgttga agaagttaca 3720 acaactctgg aagaaactaa gttcctcaca gaaaacttgt tactttatat tgacattaat 3780 ggcaatcttc atccagattc tgccactctt gttagtgaca ttgacatcac tttcttaaag 3840 aaagatgctc catatatagt gggtgatgtt gttcaagagg gtgttttaac tgctgtggtt 3900 atacctacta aaaaggctgg tggcactact gaaatgctag cgaaagcttt gagaaaagtg 3960 ccaacagaca attatataac cacttacccg ggtcagggtt taaatggtta cactgtagag 4020 gaggcaaaga cagtgcttaa aaagtgtaaa agtgcctttt acattctacc atctattatc 4080 tctaatgaga agcaagaaat tcttggaact gtttcttgga atttgcgaga aatgcttgca 4140 catgcagaag aaacacgcaa attaatgcct gtctgtgtgg aaactaaagc catagtttca 4200 actatacagc gtaaatataa gggtattaaa atacaagagg gtgtggttga ttatggtgct 4260 agattttact tttacaccag taaaacaact gtagcgtcac ttatcaacac acttaacgat 4320 ctaaatgaaa ctcttgttac aatgccactt ggctatgtaa cacatggctt aaatttggaa 4380 gaagctgctc ggtatatgag atctctcaaa gtgccagcta cagtttctgt ttcttcacct 4440 gatgctgtta cagcgtataa tggttatctt acttcttctt ctaaaacacc tgaagaacat 4500 tttattgaaa ccatctcact tgctggttcc tataaagatt ggtcctattc tggacaatct 4560 acacaactag gtatagaatt tcttaagaga ggtgataaaa gtgtatatta cactagtaat 4620 cctaccacat tccacctaga tggtgaagtt atcacctttg acaatcttaa gacacttctt 4680 tctttgagag aagtgaggac tattaaggtg tttacaacag tagacaacat taacctccac 4740 acgcaagttg tggacatgtc aatgacatat ggacaacagt ttggtccaac ttatttggat 4800 ggagctgatg ttactaaaat aaaacctcat aattcacatg aaggtaaaac attttatgtt 4860 ttacctaatg atgacactct acgtgttgag gcttttgagt actaccacac aactgatcct 4920 agttttctgg gtaggtacat gtcagcatta aatcacacta aaaagtggaa atacccacaa 4980 gttaatggtt taacttctat taaatgggca gataacaact gttatcttgc cactgcattg 5040 ttaacactcc aacaaataga gttgaagttt aatccacctg ctctacaaga tgcttattac 5100 agagcaaggg ctggtgaagc tgctaacttt tgtgcactta tcttagccta ctgtaataag 5160 acagtaggtg agttaggtga tgttagagaa acaatgagtt acttgtttca acatgccaat 5220 ttagattctt gcaaaagagt cttgaacgtg gtgtgtaaaa cttgtggaca acagcagaca 5280 acccttaagg gtgtagaagc tgttatgtac atgggcacac tttcttatga acaatttaag 5340 aaaggtgttc agataccttg tacgtgtggt aaacaagcta caaaatatct agtacaacag 5400 gagtcacctt ttgttatgat gtcagcacca cctgctcagt atgaacttaa gcatggtaca 5460 tttacttgtg ctagtgagta cactggtaat taccagtgtg gtcactataa acatataact 5520 tctaaagaaa ctttgtattg catagacggt gctttactta caaagtcctc agaatacaaa 5580 ggtcctatta cggatgtttt ctacaaagaa aacagttaca caacaaccat aaaaccagtt 5640 acttataaat tggatggtgt tgtttgtaca gaaattgacc ctaagttgga caattattat 5700 aagaaagaca attcttattt cacagagcaa ccaattgatc ttgtaccaaa ccaaccatat 5760 ccaaacgcaa gcttcgataa ttttaagttt gtatgtgata atatcaaatt tgctgatgat 5820 ttaaaccagt taactggtta taagaaacct gcttcaagag agcttaaagt tacatttttc 5880 cctgacttaa atggtgatgt ggtggctatt gattataaac actacacacc ctcttttaag 5940 aaaggagcta aattgttaca taaacctatt gtttggcatg ttaacaatgc aactaataaa 6000 gccacgtata aaccaaatac ctggtgtata cgttgtcttt ggagcacaaa accagttgaa 6060 acatcaaatt cgtttgatgt actgaagtca gaggacgcgc agggaatgga taatcttgcc 6120 tgcgaagatc taaaaccagt ctctgaagaa gtagtggaaa atcctaccat acagaaagac 6180 gttcttgagt gtaatgtgaa aactaccgaa gttgtaggag acattatact taaaccagca 6240 aataatagtt taaaaattac agaagaggtt ggccacacag atctaatggc tgcttatgta 6300 gacaattcta gtcttactat taagaaacct aatgaattat ctagagtatt aggtttgaaa 6360 acccttgcta ctcatggttt agctgctgtt aatagtgtcc cttgggatac tatagctaat 6420 tatgctaagc cttttcttaa caaagttgtt agtacaacta ctaacatagt tacacggtgt 6480 ttaaaccgtg tttgtactaa ttatatgcct tatttcttta ctttattgct acaattgtgt 6540 acttttacta gaagtacaaa ttctagaatt aaagcatcta tgccgactac tatagcaaag 6600 aatactgtta agagtgtcgg taaattttgt ctagaggctt catttaatta tttgaagtca 6660 cctaattttt ctaaactgat aaatattata atttggtttt tactattaag tgtttgccta 6720 ggttctttaa tctactcaac cgctgcttta ggtgttttaa tgtctaattt aggcatgcct 6780 tcttactgta ctggttacag agaaggctat ttgaactcta ctaatgtcac tattgcaacc 6840 tactgtactg gttctatacc ttgtagtgtt tgtcttagtg gtttagattc tttagacacc 6900 tatccttctt tagaaactat acaaattacc atttcatctt ttaaatggga tttaactgct 6960 tttggcttag ttgcagagtg gtttttggca tatattcttt tcactaggtt tttctatgta 7020 cttggattgg ctgcaatcat gcaattgttt ttcagctatt ttgcagtaca ttttattagt 7080 aattcttggc ttatgtggtt aataattaat cttgtacaaa tggccccgat ttcagctatg 7140 gttagaatgt acatcttctt tgcatcattt tattatgtat ggaaaagtta tgtgcatgtt 7200 gtagacggtt gtaattcatc aacttgtatg atgtgttaca aacgtaatag agcaacaaga 7260 gtcgaatgta caactattgt taatggtgtt agaaggtcct tttatgtcta tgctaatgga 7320 ggtaaaggct tttgcaaact acacaattgg aattgtgtta attgtgatac attctgtgct 7380 ggtagtacat ttattagtga tgaagttgcg agagacttgt cactacagtt taaaagacca 7440 ataaatccta ctgaccagtc ttcttacatc gttgatagtg ttacagtgaa gaatggttcc 7500 atccatcttt actttgataa agctggtcaa aagacttatg aaagacattc tctctctcat 7560 tttgttaact tagacaacct gagagctaat aacactaaag gttcattgcc tattaatgtt 7620 atagtttttg atggtaaatc aaaatgtgaa gaatcatctg caaaatcagc gtctgtttac 7680 tacagtcagc ttatgtgtca acctatactg ttactagatc aggcattagt gtctgatgtt 7740 ggtgatagtg cggaagttgc agttaaaatg tttgatgctt acgttaatac gttttcatca 7800 acttttaacg taccaatgga aaaactcaaa acactagttg caactgcaga agctgaactt 7860 gcaaagaatg tgtccttaga caatgtctta tctactttta tttcagcagc tcggcaaggg 7920 tttgttgatt cagatgtaga aactaaagat gttgttgaat gtcttaaatt gtcacatcaa 7980 tctgacatag aagttactgg cgatagttgt aataactata tgctcaccta taacaaagtt 8040 gaaaacatga caccccgtga ccttggtgct tgtattgact gtagtgcgcg tcatattaat 8100 gcgcaggtag caaaaagtca caacattgct ttgatatgga acgttaaaga tttcatgtca 8160 ttgtctgaac aactacgaaa acaaatacgt agtgctgcta aaaagaataa cttacctttt 8220 aagttgacat gtgcaactac tagacaagtt gttaatgttg taacaacaaa gatagcactt 8280 aagggtggta aaattgttaa taattggttg aagcagttaa ttaaagttac acttgtgttc 8340 ctttttgttg ctgctatttt ctatttaata acacctgttc atgtcatgtc taaacatact 8400 gacttttcaa gtgaaatcat aggatacaag gctattgatg gtggtgtcac tcgtgacata 8460 gcatctacag atacttgttt tgctaacaaa catgctgatt ttgacacatg gtttagccag 8520 cgtggtggta gttatactaa tgacaaagct tgcccattga ttgctgcagt cataacaaga 8580 gaagtgggtt ttgtcgtgcc tggtttgcct ggcacgatat tacgcacaac taatggtgac 8640 tttttgcatt tcttacctag agtttttagt gcagttggta acatctgtta cacaccatca 8700 aaacttatag agtacactga ctttgcaaca tcagcttgtg ttttggctgc tgaatgtaca 8760 atttttaaag atgcttctgg taagccagta ccatattgtt atgataccaa tgtactagaa 8820 ggttctgttg cttatgaaag tttacgccct gacacacgtt atgtgctcat ggatggctct 8880 attattcaat ttcctaacac ctaccttgaa ggttctgtta gagtggtaac aacttttgat 8940 tctgagtact gtaggcacgg cacttgtgaa agatcagaag ctggtgtttg tgtatctact 9000 agtggtagat gggtacttaa caatgattat tacagatctt taccaggagt tttctgtggt 9060 gtagatgctg taaatttact tactaatatg tttacaccac taattcaacc tattggtgct 9120 ttggacatat cagcatctat agtagctggt ggtattgtag ctatcgtagt aacatgcctt 9180 gcctactatt ttatgaggtt tagaagagct tttggtgaat acagtcatgt agttgccttt 9240 aatactttac tattccttat gtcattcact gtactctgtt taacaccagt ttactcattc 9300 ttacctggtg tttattctgt tatttacttg tacttgacat tttatcttac taatgatgtt 9360 tcttttttag cacatattca gtggatggtt atgttcacac ctttagtacc tttctggata 9420 acaattgctt atatcatttg tatttccaca aagcatttct attggttctt tagtaattac 9480 ctaaagagac gtgtagtctt taatggtgtt tcctttagta cttttgaaga agctgcgctg 9540 tgcacctttt tgttaaataa agaaatgtat ctaaagttgc gtagtgatgt gctattacct 9600 cttacgcaat ataatagata cttagctctt tataataagt acaagtattt tagtggagca 9660 atggatacaa ctagctacag agaagctgct tgttgtcatc tcgcaaaggc tctcaatgac 9720 ttcagtaact caggttctga tgttctttac caaccaccac aaacctctat cacctcagct 9780 gttttgcaga gtggttttag aaaaatggca ttcccatctg gtaaagttga gggttgtatg 9840 gtacaagtaa cttgtggtac aactacactt aacggtcttt ggcttgatga cgtagtttac 9900 tgtccaagac atgtgatctg cacctctgaa gacatgctta accctaatta tgaagattta 9960 ctcattcgta agtctaatca taatttcttg gtacaggctg gtaatgttca actcagggtt 10020 attggacatt ctatgcaaaa ttgtgtactt aagcttaagg ttgatacagc caatcctaag 10080 acacctaagt ataagtttgt tcgcattcaa ccaggacaga ctttttcagt gttagcttgt 10140 tacaatggtt caccatctgg tgtttaccaa tgtgctatga ggcccaattt cactattaag 10200 ggttcattcc ttaatggttc atgtggtagt gttggtttta acatagatta tgactgtgtc 10260 tctttttgtt acatgcacca tatggaatta ccaactggag ttcatgctgg cacagactta 10320 gaaggtaact tttatggacc ttttgttgac aggcaaacag cacaagcagc tggtacggac 10380 acaactatta cagttaatgt tttagcttgg ttgtacgctg ctgttataaa tggagacagg 10440 tggtttctca atcgatttac cacaactctt aatgacttta accttgtggc tatgaagtac 10500 aattatgaac ctctaacaca agaccatgtt gacatactag gacctctttc tgctcaaact 10560 ggaattgccg ttttagatat gtgtgcttca ttaaaagaat tactgcaaaa tggtatgaat 10620 ggacgtacca tattgggtag tgctttatta gaagatgaat ttacaccttt tgatgttgtt 10680 agacaatgct caggtgttac tttccaaagt gcagtgaaaa gaacaatcaa gggtacacac 10740 cactggttgt tactcacaat tttgacttca cttttagttt tagtccagag tactcaatgg 10800 tctttgttct tttttttgta tgaaaatgcc tttttacctt ttgctatggg tattattgct 10860 atgtctgctt ttgcaatgat gtttgtcaaa cataagcatg catttctctg tttgtttttg 10920 ttaccttctc ttgccactgt agcttatttt aatatggtct atatgcctgc tagttgggtg 10980 atgcgtatta tgacatggtt ggatatggtt gatactagtt tgtctggttt taagctaaaa 11040 gactgtgtta tgtatgcatc agctgtagtg ttactaatcc ttatgacagc aagaactgtg 11100 tatgatgatg gtgctaggag agtgtggaca cttatgaatg tcttgacact cgtttataaa 11160 gtttattatg gtaatgcttt agatcaagcc atttccatgt gggctcttat aatctctgtt 11220 acttctaact actcaggtgt agttacaact gtcatgtttt tggccagagg tattgttttt 11280 atgtgtgttg agtattgccc tattttcttc ataactggta atacacttca gtgtataatg 11340 ctagtttatt gtttcttagg ctatttttgt acttgttact ttggcctctt ttgtttactc 11400 aaccgctact ttagactgac tcttggtgtt tatgattact tagtttctac acaggagttt 11460 agatatatga attcacaggg actactccca cccaagaata gcatagatgc cttcaaactc 11520 aacattaaat tgttgggtgt tggtggcaaa ccttgtatca aagtagccac tgtacagtct 11580 aaaatgtcag atgtaaagtg cacatcagta gtcttactct cagttttgca acaactcaga 11640 gtagaatcat catctaaatt gtgggctcaa tgtgtccagt tacacaatga cattctctta 11700 gctaaagata ctactgaagc ctttgaaaaa atggtttcac tactttctgt tttgctttcc 11760 atgcagggtg ctgtagacat aaacaagctt tgtgaagaaa tgctggacaa cagggcaacc 11820 ttacaagcta tagcctcaga gtttagttcc cttccatcat atgcagcttt tgctactgct 11880 caagaagctt atgagcaggc tgttgctaat ggtgattctg aagttgttct taaaaagttg 11940 aagaagtctt tgaatgtggc taaatctgaa tttgaccgtg atgcagccat gcaacgtaag 12000 ttggaaaaga tggctgatca agctatgacc caaatgtata aacaggctag atctgaggac 12060 aagagggcaa aagttactag tgctatgcag acaatgcttt tcactatgct tagaaagttg 12120 gataatgatg cactcaacaa cattatcaac aatgcaagag atggttgtgt tcccttgaac 12180 ataatacctc ttacaacagc agccaaacta atggttgtca taccagacta taacacatat 12240 aaaaatacgt gtgatggtac aacatttact tatgcatcag cattgtggga aatccaacag 12300 gttgtagatg cagatagtaa aattgttcaa cttagtgaaa ttagtatgga caattcacct 12360 aatttagcat ggcctcttat tgtaacagct ttaagggcca attctgctgt caaattacag 12420 aataatgagc ttagtcctgt tgcactacga cagatgtctt gtgctgccgg tactacacaa 12480 actgcttgca ctgatgacaa tgcgttagct tactacaaca caacaaaggg aggtaggttt 12540 gtacttgcac tgttatccga tttacaggat ttgaaatggg ctagattccc taagagtgat 12600 ggaactggta ctatctatac agaactggaa ccaccttgta ggtttgttac agacacacct 12660 aaaggtccta aagtgaagta tttatacttt attaaaggat taaacaacct aaatagaggt 12720 atggtacttg gtagtttagc tgccacagta cgtctacaag ctggtaatgc aacagaagtg 12780 cctgccaatt caactgtatt atctttctgt gcttttgctg tagatgctgc taaagcttac 12840 aaagattatc tagctagtgg gggacaacca atcactaatt gtgttaagat gttgtgtaca 12900 cacactggta ctggtcaggc aataacagtt acaccggaag ccaatatgga tcaagaatcc 12960 tttggtggtg catcgtgttg tctgtactgc cgttgccaca tagatcatcc aaatcctaaa 13020 ggattttgtg acttaaaagg taagtatgta caaataccta caacttgtgc taatgaccct 13080 gtgggtttta cacttaaaaa cacagtctgt accgtctgcg gtatgtggaa aggttatggc 13140 tgtagttgtg atcaactccg cgaacccatg cttcagtcag ctgatgcaca atcgttttta 13200 aaccgggttt gcggtgtaag tgcagcccgt cttacaccgt gcggcacagg cactagtact 13260 gatgtcgtat acagggcttt tgacatctac aatgataaag tagctggttt tgctaaattc 13320 ctaaaaacta attgttgtcg cttccaagaa aaggacgaag atgacaattt aattgattct 13380 tactttgtag ttaagagaca cactttctct aactaccaac atgaagaaac aatttataat 13440 ttacttaagg attgtccagc tgttgctaaa catgacttct ttaagtttag aatagacggt 13500 gacatggtac cacatatatc acgtcaacgt cttactaaat acacaatggc agacctcgtc 13560 tatgctttaa ggcattttga tgaaggtaat tgtgacacat taaaagaaat acttgtcaca 13620 tacaattgtt gtgatgatga ttatttcaat aaaaaggact ggtatgattt tgtagaaaac 13680 ccagatatat tacgcgtata cgccaactta ggtgaacgtg tacgccaagc tttgttaaaa 13740 acagtacaat tctgtgatgc catgcgaaat gctggtattg ttggtgtact gacattagat 13800 aatcaagatc tcaatggtaa ctggtatgat ttcggtgatt tcatacaaac cacgccaggt 13860 agtggagttc ctgttgtaga ttcttattat tcattgttaa tgcctatatt aaccttgacc 13920 agggctttaa ctgcagagtc acatgttgac actgacttaa caaagcctta cattaagtgg 13980 gatttgttaa aatatgactt cacggaagag aggttaaaac tctttgaccg ttattttaaa 14040 tattgggatc agacatacca cccaaattgt gttaactgtt tggatgacag atgcattctg 14100 cattgtgcaa actttaatgt tttattctct acagtgttcc cacttacaag ttttggacca 14160 ctagtgagaa aaatatttgt tgatggtgtt ccatttgtag tttcaactgg ataccacttc 14220 agagagctag gtgttgtaca taatcaggat gtaaacttac atagctctag acttagtttt 14280 aaggaattac ttgtgtatgc tgctgaccct gctatgcacg ctgcttctgg taatctatta 14340 ctagataaac gcactacgtg cttttcagta gctgcactta ctaacaatgt tgcttttcaa 14400 actgtcaaac ccggtaattt taacaaagac ttctatgact ttgctgtgtc taagggtttc 14460 tttaaggaag gaagttctgt tgaattaaaa cacttcttct ttgctcagga tggtaatgct 14520 gctatcagcg attatgacta ctatcgttat aatctaccaa caatgtgtga tatcagacaa 14580 ctactatttg tagttgaagt tgttgataag tactttgatt gttacgatgg tggctgtatt 14640 aatgctaacc aagtcatcgt caacaaccta gacaaatcag ctggttttcc atttaataaa 14700 tggggtaagg ctagacttta ttatgattca atgagttatg aggatcaaga tgcacttttc 14760 gcatatacaa aacgtaatgt catccctact ataactcaaa tgaatcttaa gtatgccatt 14820 agtgcaaaga atagagctcg caccgtagct ggtgtctcta tctgtagtac tatgaccaat 14880 agacagtttc atcaaaaatt attgaaatca atagccgcca ctagaggagc tactgtagta 14940 attggaacaa gcaaattcta tggtggttgg cacaacatgt taaaaactgt ttatagtgat 15000 gtagaaaacc ctcaccttat gggttgggat tatcctaaat gtgatagagc catgcctaac 15060 atgcttagaa ttatggcctc acttgttctt gctcgcaaac atacaacgtg ttgtagcttg 15120 tcacaccgtt tctatagatt agctaatgag tgtgctcaag tattgagtga aatggtcatg 15180 tgtggcggtt cactatatgt taaaccaggt ggaacctcat caggagatgc cacaactgct 15240 tatgctaata gtgtttttaa catttgtcaa gctgtcacgg ccaatgttaa tgcactttta 15300 tctactgatg gtaacaaaat tgccgataag tatgtccgca atttacaaca cagactttat 15360 gagtgtctct atagaaatag agatgttgac acagactttg tgaatgagtt ttacgcatat 15420 ttgcgtaaac atttctcaat gatgatactc tctgacgatg ctgttgtgtg tttcaatagc 15480 acttatgcat ctcaaggtct agtggctagc ataaagaact ttaagtcagt tctttattat 15540 caaaacaatg tttttatgtc tgaagcaaaa tgttggactg agactgacct tactaaagga 15600 cctcatgaat tttgctctca acatacaatg ctagttaaac agggtgatga ttatgtgtac 15660 cttccttacc cagatccatc aagaatccta ggggccggct gttttgtaga tgatatcgta 15720 aaaacagatg gtacacttat gattgaacgg ttcgtgtctt tagctataga tgcttaccca 15780 cttactaaac atcctaatca ggagtatgct gatgtctttc atttgtactt acaatacata 15840 agaaagctac atgatgagtt aacaggacac atgttagaca tgtattctgt tatgcttact 15900 aatgataaca cttcaaggta ttgggaacct gagttttatg aggctatgta cacaccgcat 15960 acagtcttac aggctgttgg ggcttgtgtt ctttgcaatt cacagacttc attaagatgt 16020 ggtgcttgca tacgtagacc attcttatgt tgtaaatgct gttacgacca tgtcatatca 16080 acatcacata aattagtctt gtctgttaat ccgtatgttt gcaatgctcc aggttgtgat 16140 gtcacagatg tgactcaact ttacttagga ggtatgagct attattgtaa atcacataaa 16200 ccacccatta gttttccatt gtgtgctaat ggacaagttt ttggtttata taaaaataca 16260 tgtgttggta gcgataatgt tactgacttt aatgcaattg caacatgtga ctggacaaat 16320 gctggtgatt acattttagc taacacctgt actgaaagac tcaagctttt tgcagcagaa 16380 acgctcaaag ctactgagga gacatttaaa ctgtcttatg gtattgctac tgtacgtgaa 16440 gtgctgtctg acagagaatt acatctttca tgggaagttg gtaaacctag accaccactt 16500 aaccgaaatt atgtctttac tggttatcgt gtaactaaaa acagtaaagt acaaatagga 16560 gagtacacct ttgaaaaagg tgactatggt gatgctgttg tttaccgagg tacaacaact 16620 tacaaattaa atgttggtga ttattttgtg ctgacatcac atacagtaat gccattaagt 16680 gcacctacac tagtgccaca agagcactat gttagaatta ctggcttata cccaacactc 16740 aatatctcag atgagttttc tagcaatgtt gcaaattatc aaaaggttgg tatgcaaaag 16800 tattctacac tccagggacc acctggtact ggtaagagtc attttgctat tggcctagct 16860 ctctactacc cttctgctcg catagtgtat acagcttgct ctcatgccgc tgttgatgca 16920 ctatgtgaga aggcattaaa atatttgcct atagataaat gtagtagaat tatacctgca 16980 cgtgctcgtg tagagtgttt tgataaattc aaagtgaatt caacattaga acagtatgtc 17040 ttttgtactg taaatgcatt gcctgagacg acagcagata tagttgtctt tgatgaaatt 17100 tcaatggcca caaattatga tttgagtgtt gtcaatgcca gattacgtgc taagcactat 17160 gtgtacattg gcgaccctgc tcaattacct gcaccacgca cattgctaac taagggcaca 17220 ctagaaccag aatatttcaa ttcagtgtgt agacttatga aaactatagg tccagacatg 17280 ttcctcggaa cttgtcggcg ttgtcctgct gaaattgttg acactgtgag tgctttggtt 17340 tatgataata agcttaaagc acataaagac aaatcagctc aatgctttaa aatgttttat 17400 aagggtgtta tcacgcatga tgtttcatct gcaattaaca ggccacaaat aggcgtggta 17460 agagaattcc ttacacgtaa ccctgcttgg agaaaagctg tctttatttc accttataat 17520 tcacagaatg ctgtagcctc aaagattttg ggactaccaa ctcaaactgt tgattcatca 17580 cagggctcag aatatgacta tgtcatattc actcaaacca ctgaaacagc tcactcttgt 17640 aatgtaaaca gatttaatgt tgctattacc agagcaaaag taggcatact ttgcataatg 17700 tctgatagag acctttatga caagttgcaa tttacaagtc ttgaaattcc acgtaggaat 17760 gtggcaactt tacaagctga aaatgtaaca ggactcttta aagattgtag taaggtaatc 17820 actgggttac atcctacaca ggcacctaca cacctcagtg ttgacactaa attcaaaact 17880 gaaggtttat gtgttgacat acctggcata cctaaggaca tgacctatag aagactcatc 17940 tctatgatgg gttttaaaat gaattatcaa gttaatggtt accctaacat gtttatcacc 18000 cgcgaagaag ctataagaca tgtacgtgca tggattggct tcgatgtcga ggggtgtcat 18060 gctactagag aagctgttgg taccaattta cctttacagc taggtttttc tacaggtgtt 18120 aacctagttg ctgtacctac aggttatgtt gatacaccta ataatacaga tttttccaga 18180 gttagtgcta aaccaccgcc tggagatcaa tttaaacacc tcataccact tatgtacaaa 18240 ggacttcctt ggaatgtagt gcgtataaag attgtacaaa tgttaagtga cacacttaaa 18300 aatctctctg acagagtcgt atttgtctta tgggcacatg gctttgagtt gacatctatg 18360 aagtattttg tgaaaatagg acctgagcgc acctgttgtc tatgtgatag acgtgccaca 18420 tgcttttcca ctgcttcaga cacttatgcc tgttggcatc attctattgg atttgattac 18480 gtctataatc cgtttatgat tgatgttcaa caatggggtt ttacaggtaa cctacaaagc 18540 aaccatgatc tgtattgtca agtccatggt aatgcacatg tagctagttg tgatgcaatc 18600 atgactaggt gtctagctgt ccacgagtgc tttgttaagc gtgttgactg gactattgaa 18660 tatcctataa ttggtgatga actgaagatt aatgcggctt gtagaaaggt tcaacacatg 18720 gttgttaaag ctgcattatt agcagacaaa ttcccagttc ttcacgacat tggtaaccct 18780 aaagctatta agtgtgtacc tcaagctgat gtagaatgga agttctatga tgcacagcct 18840 tgtagtgaca aagcttataa aatagaagaa ttattctatt cttatgccac acattctgac 18900 aaattcacag atggtgtatg cctattttgg aattgcaatg tcgatagata tcctgctaat 18960 tccattgttt gtagatttga cactagagtg ctatctaacc ttaacttgcc tggttgtgat 19020 ggtggcagtt tgtatgtaaa taaacatgca ttccacacac cagcttttga taaaagtgct 19080 tttgttaatt taaaacaatt accatttttc tattactctg acagtccatg tgagtctcat 19140 ggaaaacaag tagtgtcaga tatagattat gtaccactaa agtctgctac gtgtataaca 19200 cgttgcaatt taggtggtgc tgtctgtaga catcatgcta atgagtacag attgtatctc 19260 gatgcttata acatgatgat ctcagctggc tttagcttgt gggtttacaa acaatttgat 19320 acttataacc tctggaacac ttttacaaga cttcagagtt tagaaaatgt ggcttttaat 19380 gttgtaaata agggacactt tgatggacaa cagggtgaag taccagtttc tatcattaat 19440 aacactgttt acacaaaagt tgatggtgtt gatgtagaat tgtttgaaaa taaaacaaca 19500 ttacctgtta atgtagcatt tgagctttgg gctaagcgca acattaaacc agtaccagag 19560 gtgaaaatac tcaataattt gggtgtggac attgctgcta atactgtgat ctgggactac 19620 aaaagagatg ctccagcaca tatatctact attggtgttt gttctatgac tgacatagcc 19680 aagaaaccaa ctgaaacgat ttgtgcacca ctcactgtct tttttgatgg tagagttgat 19740 ggtcaagtag acttatttag aaatgcccgt aatggtgttc ttattacaga aggtagtgtt 19800 aaaggtttac aaccatctgt aggtcccaaa caagctagtc ttaatggagt cacattaatt 19860 ggagaagccg taaaaacaca gttcaattat tataagaaag ttgatggtgt tgtccaacaa 19920 ttacctgaaa cttactttac tcagagtaga aatttacaag aatttaaacc caggagtcaa 19980 atggaaattg atttcttaga attagctatg gatgaattca ttgaacggta taaattagaa 20040 ggctatgcct tcgaacatat cgtttatgga gattttagtc atagtcagtt aggtggttta 20100 catctactga ttggactagc taaacgtttt aaggaatcac cttttgaatt agaagatttt 20160 attcctatgg acagtacagt taaaaactat ttcataacag atgcgcaaac aggttcatct 20220 aagtgtgtgt gttctgttat tgatttatta cttgatgatt ttgttgaaat aataaaatcc 20280 caagatttat ctgtagtttc taaggttgtc aaagtgacta ttgactatac agaaatttca 20340 tttatgcttt ggtgtaaaga tggccatgta gaaacatttt acccaaaatt acaatctagt 20400 caagcgtggc aaccgggtgt tgctatgcct aatctttaca aaatgcaaag aatgctatta 20460 gaaaagtgtg accttcaaaa ttatggtgat agtgcaacat tacctaaagg cataatgatg 20520 aatgtcgcaa aatatactca actgtgtcaa tatttaaaca cattaacatt agctgtaccc 20580 tataatatga gagttataca ttttggtgct ggttctgata aaggagttgc accaggtaca 20640 gctgttttaa gacagtggtt gcctacgggt acgctgcttg tcgattcaga tcttaatgac 20700 tttgtctctg atgcagattc aactttgatt ggtgattgtg caactgtaca tacagctaat 20760 aaatgggatc tcattattag tgatatgtac gaccctaaga ctaaaaatgt tacaaaagaa 20820 aatgactcta aagagggttt tttcacttac atttgtgggt ttatacaaca aaagctagct 20880 cttggaggtt ccgtggctat aaagataaca gaacattctt ggaatgctga tctttataag 20940 ctcatgggac acttcgcatg gtggacagcc tttgttacta atgtgaatgc gtcatcatct 21000 gaagcatttt taattggatg taattatctt ggcaaaccac gcgaacaaat agatggttat 21060 gtcatgcatg caaattacat attttggagg aatacaaatc caattcagtt gtcttcctat 21120 tctttatttg acatgagtaa atttcccctt aaattaaggg gtactgctgt tatgtcttta 21180 aaagaaggtc aaatcaatga tatgatttta tctcttctta gtaaaggtag acttataatt 21240 agagaaaaca acagagttgt tatttctagt gatgttcttg ttaacaacta a 21291 <210> 326 <211> 13218 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 326 atggagagcc ttgtccctgg tttcaacgag aaaacacacg tccaactcag tttgcctgtt 60 ttacaggttc gcgacgtgct cgtacgtggc tttggagact ccgtggagga ggtcttatca 120 gaggcacgtc aacatcttaa agatggcact tgtggcttag tagaagttga aaaaggcgtt 180 ttgcctcaac ttgaacagcc ctatgtgttc atcaaacgtt cggatgctcg aactgcacct 240 catggtcatg ttatggttga gctggtagca gaactcgaag gcattcagta cggtcgtagt 300 ggtgagacac ttggtgtcct tgtccctcat gtgggcgaaa taccagtggc ttaccgcaag 360 gttcttcttc gtaagaacgg taataaagga gctggtggcc atagttacgg cgccgatcta 420 aagtcatttg acttaggcga cgagcttggc actgatcctt atgaagattt tcaagaaaac 480 tggaacacta aacatagcag tggtgttacc cgtgaactca tgcgtgagct taacggaggg 540 gcatacactc gctatgtcga taacaacttc tgtggccctg atggctaccc tcttgagtgc 600 attaaagacc ttctagcacg tgctggtaaa gcttcatgca ctttgtccga acaactggac 660 tttattgaca ctaagagggg tgtatactgc tgccgtgaac atgagcatga aattgcttgg 720 tacacggaac gttctgaaaa gagctatgaa ttgcagacac cttttgaaat taaattggca 780 aagaaatttg acaccttcaa tggggaatgt ccaaattttg tatttccctt aaattccata 840 atcaagacta ttcaaccaag ggttgaaaag aaaaagcttg atggctttat gggtagaatt 900 cgatctgtct atccagttgc gtcaccaaat gaatgcaacc aaatgtgcct ttcaactctc 960 atgaagtgtg atcattgtgg tgaaacttca tggcagacgg gcgattttgt taaagccact 1020 tgcgaatttt gtggcactga gaatttgact aaagaaggtg ccactacttg tggttactta 1080 ccccaaaatg ctgttgttaa aatttattgt ccagcatgtc acaattcaga agtaggacct 1140 gagcatagtc ttgccgaata ccataatgaa tctggcttga aaaccattct tcgtaagggt 1200 ggtcgcacta ttgcctttgg aggctgtgtg ttctcttatg ttggttgcca taacaagtgt 1260 gcctattggg ttccacgtgc tagcgctaac ataggttgta accatacagg tgttgttgga 1320 gaaggttccg aaggtcttaa tgacaacctt cttgaaatac tccaaaaaga gaaagtcaac 1380 atcaatattg ttggtgactt taaacttaat gaagagatcg ccattatttt ggcatctttt 1440 tctgcttcca caagtgcttt tgtggaaact gtgaaaggtt tggattataa agcattcaaa 1500 caaattgttg aatcctgtgg taattttaaa gttacaaaag gaaaagctaa aaaaggtgcc 1560 tggaatattg gtgaacagaa atcaatactg agtcctcttt atgcatttgc atcagaggct 1620 gctcgtgttg tacgatcaat tttctcccgc actcttgaaa ctgctcaaaa ttctgtgcgt 1680 gttttacaga aggccgctat aacaatacta gatggaattt cacagtattc actgagactc 1740 attgatgcta tgatgttcac atctgatttg gctactaaca atctagttgt aatggcctac 1800 attacaggtg gtgttgttca gttgacttcg cagtggctaa ctaacatctt tggcactgtt 1860 tatgaaaaac tcaaacccgt ccttgattgg cttgaagaga agtttaagga aggtgtagag 1920 tttcttagag acggttggga aattgttaaa tttatctcaa cctgtgcttg tgaaattgtc 1980 ggtggacaaa ttgtcacctg tgcaaaggaa attaaggaga gtgttcagac attctttaag 2040 cttgtaaata aatttttggc tttgtgtgct gactctatca ttattggtgg agctaaactt 2100 aaagccttga atttaggtga aacatttgtc acgcactcaa agggattgta cagaaagtgt 2160 gttaaatcca gagaagaaac tggcctactc atgcctctaa aagccccaaa agaaattatc 2220 ttcttagagg gagaaacact tcccacagaa gtgttaacag aggaagttgt cttgaaaact 2280 ggtgatttac aaccattaga acaacctact agtgaagctg ttgaagctcc attggttggt 2340 acaccagttt gtattaacgg gcttatgttg ctcgaaatca aagacacaga aaagtactgt 2400 gcccttgcac ctaatatgat ggtaacaaac aataccttca cactcaaagg cggtgcacca 2460 acaaaggtta cttttggtga tgacactgtg atagaagtgc aaggttacaa gagtgtgaat 2520 atcacttttg aacttgatga aaggattgat aaagtactta atgagaagtg ctctgcctat 2580 acagttgaac tcggtacaga agtaaatgag ttcgcctgtg ttgtggcaga tgctgtcata 2640 aaaactttgc aaccagtatc tgaattactt acaccactgg gcattgattt agatgagtgg 2700 agtatggcta catactactt atttgatgag tctggtgagt ttaaattggc ttcacatatg 2760 tattgttctt tttaccctcc agatgaggat gaagaagaag gtgattgtga agaagaagag 2820 tttgagccat caactcaata tgagtatggt actgaagatg attaccaagg taaacctttg 2880 gaatttggtg ccacttctgc tgctcttcaa cctgaagaag agcaagaaga agattggtta 2940 gatgatgata gtcaacaaac tgttggtcaa caagacggca gtgaggacaa tcagacaact 3000 actattcaaa caattgttga ggttcaacct caattagaga tggaacttac accagttgtt 3060 cagactattg aagtgaatag ttttagtggt tatttaaaac ttactgacaa tgtatacatt 3120 aaaaatgcag acattgtgga agaagctaaa aaggtaaaac caacagtggt tgttaatgca 3180 gccaatgttt accttaaaca tggaggaggt gttgcaggag ccttaaataa ggctactaac 3240 aatgccatgc aagttgaatc tgatgattac atagctacta atggaccact taaagtgggt 3300 ggtagttgtg ttttaagcgg acacaatctt gctaaacact gtcttcatgt tgtcggccca 3360 aatgttaaca aaggtgaaga cattcaactt cttaagagtg cttatgaaaa ttttaatcag 3420 cacgaagttc tacttgcacc attattatca gctggtattt ttggtgctga ccctatacat 3480 tctttaagag tttgtgtaga tactgttcgc acaaatgtct acttagctgt ctttgataaa 3540 aatctctatg acaaacttgt ttcaagcttt ttggaaatga agagtgaaaa gcaagttgaa 3600 caaaagatcg ctgagattcc taaagaggaa gttaagccat ttataactga aagtaaacct 3660 tcagttgaac agagaaaaca agatgataag aaaatcaaag cttgtgttga agaagttaca 3720 acaactctgg aagaaactaa gttcctcaca gaaaacttgt tactttatat tgacattaat 3780 ggcaatcttc atccagattc tgccactctt gttagtgaca ttgacatcac tttcttaaag 3840 aaagatgctc catatatagt gggtgatgtt gttcaagagg gtgttttaac tgctgtggtt 3900 atacctacta aaaaggctgg tggcactact gaaatgctag cgaaagcttt gagaaaagtg 3960 ccaacagaca attatataac cacttacccg ggtcagggtt taaatggtta cactgtagag 4020 gaggcaaaga cagtgcttaa aaagtgtaaa agtgcctttt acattctacc atctattatc 4080 tctaatgaga agcaagaaat tcttggaact gtttcttgga atttgcgaga aatgcttgca 4140 catgcagaag aaacacgcaa attaatgcct gtctgtgtgg aaactaaagc catagtttca 4200 actatacagc gtaaatataa gggtattaaa atacaagagg gtgtggttga ttatggtgct 4260 agattttact tttacaccag taaaacaact gtagcgtcac ttatcaacac acttaacgat 4320 ctaaatgaaa ctcttgttac aatgccactt ggctatgtaa cacatggctt aaatttggaa 4380 gaagctgctc ggtatatgag atctctcaaa gtgccagcta cagtttctgt ttcttcacct 4440 gatgctgtta cagcgtataa tggttatctt acttcttctt ctaaaacacc tgaagaacat 4500 tttattgaaa ccatctcact tgctggttcc tataaagatt ggtcctattc tggacaatct 4560 acacaactag gtatagaatt tcttaagaga ggtgataaaa gtgtatatta cactagtaat 4620 cctaccacat tccacctaga tggtgaagtt atcacctttg acaatcttaa gacacttctt 4680 tctttgagag aagtgaggac tattaaggtg tttacaacag tagacaacat taacctccac 4740 acgcaagttg tggacatgtc aatgacatat ggacaacagt ttggtccaac ttatttggat 4800 ggagctgatg ttactaaaat aaaacctcat aattcacatg aaggtaaaac attttatgtt 4860 ttacctaatg atgacactct acgtgttgag gcttttgagt actaccacac aactgatcct 4920 agttttctgg gtaggtacat gtcagcatta aatcacacta aaaagtggaa atacccacaa 4980 gttaatggtt taacttctat taaatgggca gataacaact gttatcttgc cactgcattg 5040 ttaacactcc aacaaataga gttgaagttt aatccacctg ctctacaaga tgcttattac 5100 agagcaaggg ctggtgaagc tgctaacttt tgtgcactta tcttagccta ctgtaataag 5160 acagtaggtg agttaggtga tgttagagaa acaatgagtt acttgtttca acatgccaat 5220 ttagattctt gcaaaagagt cttgaacgtg gtgtgtaaaa cttgtggaca acagcagaca 5280 acccttaagg gtgtagaagc tgttatgtac atgggcacac tttcttatga acaatttaag 5340 aaaggtgttc agataccttg tacgtgtggt aaacaagcta caaaatatct agtacaacag 5400 gagtcacctt ttgttatgat gtcagcacca cctgctcagt atgaacttaa gcatggtaca 5460 tttacttgtg ctagtgagta cactggtaat taccagtgtg gtcactataa acatataact 5520 tctaaagaaa ctttgtattg catagacggt gctttactta caaagtcctc agaatacaaa 5580 ggtcctatta cggatgtttt ctacaaagaa aacagttaca caacaaccat aaaaccagtt 5640 acttataaat tggatggtgt tgtttgtaca gaaattgacc ctaagttgga caattattat 5700 aagaaagaca attcttattt cacagagcaa ccaattgatc ttgtaccaaa ccaaccatat 5760 ccaaacgcaa gcttcgataa ttttaagttt gtatgtgata atatcaaatt tgctgatgat 5820 ttaaaccagt taactggtta taagaaacct gcttcaagag agcttaaagt tacatttttc 5880 cctgacttaa atggtgatgt ggtggctatt gattataaac actacacacc ctcttttaag 5940 aaaggagcta aattgttaca taaacctatt gtttggcatg ttaacaatgc aactaataaa 6000 gccacgtata aaccaaatac ctggtgtata cgttgtcttt ggagcacaaa accagttgaa 6060 acatcaaatt cgtttgatgt actgaagtca gaggacgcgc agggaatgga taatcttgcc 6120 tgcgaagatc taaaaccagt ctctgaagaa gtagtggaaa atcctaccat acagaaagac 6180 gttcttgagt gtaatgtgaa aactaccgaa gttgtaggag acattatact taaaccagca 6240 aataatagtt taaaaattac agaagaggtt ggccacacag atctaatggc tgcttatgta 6300 gacaattcta gtcttactat taagaaacct aatgaattat ctagagtatt aggtttgaaa 6360 acccttgcta ctcatggttt agctgctgtt aatagtgtcc cttgggatac tatagctaat 6420 tatgctaagc cttttcttaa caaagttgtt agtacaacta ctaacatagt tacacggtgt 6480 ttaaaccgtg tttgtactaa ttatatgcct tatttcttta ctttattgct acaattgtgt 6540 acttttacta gaagtacaaa ttctagaatt aaagcatcta tgccgactac tatagcaaag 6600 aatactgtta agagtgtcgg taaattttgt ctagaggctt catttaatta tttgaagtca 6660 cctaattttt ctaaactgat aaatattata atttggtttt tactattaag tgtttgccta 6720 ggttctttaa tctactcaac cgctgcttta ggtgttttaa tgtctaattt aggcatgcct 6780 tcttactgta ctggttacag agaaggctat ttgaactcta ctaatgtcac tattgcaacc 6840 tactgtactg gttctatacc ttgtagtgtt tgtcttagtg gtttagattc tttagacacc 6900 tatccttctt tagaaactat acaaattacc atttcatctt ttaaatggga tttaactgct 6960 tttggcttag ttgcagagtg gtttttggca tatattcttt tcactaggtt tttctatgta 7020 cttggattgg ctgcaatcat gcaattgttt ttcagctatt ttgcagtaca ttttattagt 7080 aattcttggc ttatgtggtt aataattaat cttgtacaaa tggccccgat ttcagctatg 7140 gttagaatgt acatcttctt tgcatcattt tattatgtat ggaaaagtta tgtgcatgtt 7200 gtagacggtt gtaattcatc aacttgtatg atgtgttaca aacgtaatag agcaacaaga 7260 gtcgaatgta caactattgt taatggtgtt agaaggtcct tttatgtcta tgctaatgga 7320 ggtaaaggct tttgcaaact acacaattgg aattgtgtta attgtgatac attctgtgct 7380 ggtagtacat ttattagtga tgaagttgcg agagacttgt cactacagtt taaaagacca 7440 ataaatccta ctgaccagtc ttcttacatc gttgatagtg ttacagtgaa gaatggttcc 7500 atccatcttt actttgataa agctggtcaa aagacttatg aaagacattc tctctctcat 7560 tttgttaact tagacaacct gagagctaat aacactaaag gttcattgcc tattaatgtt 7620 atagtttttg atggtaaatc aaaatgtgaa gaatcatctg caaaatcagc gtctgtttac 7680 tacagtcagc ttatgtgtca acctatactg ttactagatc aggcattagt gtctgatgtt 7740 ggtgatagtg cggaagttgc agttaaaatg tttgatgctt acgttaatac gttttcatca 7800 acttttaacg taccaatgga aaaactcaaa acactagttg caactgcaga agctgaactt 7860 gcaaagaatg tgtccttaga caatgtctta tctactttta tttcagcagc tcggcaaggg 7920 tttgttgatt cagatgtaga aactaaagat gttgttgaat gtcttaaatt gtcacatcaa 7980 tctgacatag aagttactgg cgatagttgt aataactata tgctcaccta taacaaagtt 8040 gaaaacatga caccccgtga ccttggtgct tgtattgact gtagtgcgcg tcatattaat 8100 gcgcaggtag caaaaagtca caacattgct ttgatatgga acgttaaaga tttcatgtca 8160 ttgtctgaac aactacgaaa acaaatacgt agtgctgcta aaaagaataa cttacctttt 8220 aagttgacat gtgcaactac tagacaagtt gttaatgttg taacaacaaa gatagcactt 8280 aagggtggta aaattgttaa taattggttg aagcagttaa ttaaagttac acttgtgttc 8340 ctttttgttg ctgctatttt ctatttaata acacctgttc atgtcatgtc taaacatact 8400 gacttttcaa gtgaaatcat aggatacaag gctattgatg gtggtgtcac tcgtgacata 8460 gcatctacag atacttgttt tgctaacaaa catgctgatt ttgacacatg gtttagccag 8520 cgtggtggta gttatactaa tgacaaagct tgcccattga ttgctgcagt cataacaaga 8580 gaagtgggtt ttgtcgtgcc tggtttgcct ggcacgatat tacgcacaac taatggtgac 8640 tttttgcatt tcttacctag agtttttagt gcagttggta acatctgtta cacaccatca 8700 aaacttatag agtacactga ctttgcaaca tcagcttgtg ttttggctgc tgaatgtaca 8760 atttttaaag atgcttctgg taagccagta ccatattgtt atgataccaa tgtactagaa 8820 ggttctgttg cttatgaaag tttacgccct gacacacgtt atgtgctcat ggatggctct 8880 attattcaat ttcctaacac ctaccttgaa ggttctgtta gagtggtaac aacttttgat 8940 tctgagtact gtaggcacgg cacttgtgaa agatcagaag ctggtgtttg tgtatctact 9000 agtggtagat gggtacttaa caatgattat tacagatctt taccaggagt tttctgtggt 9060 gtagatgctg taaatttact tactaatatg tttacaccac taattcaacc tattggtgct 9120 ttggacatat cagcatctat agtagctggt ggtattgtag ctatcgtagt aacatgcctt 9180 gcctactatt ttatgaggtt tagaagagct tttggtgaat acagtcatgt agttgccttt 9240 aatactttac tattccttat gtcattcact gtactctgtt taacaccagt ttactcattc 9300 ttacctggtg tttattctgt tatttacttg tacttgacat tttatcttac taatgatgtt 9360 tcttttttag cacatattca gtggatggtt atgttcacac ctttagtacc tttctggata 9420 acaattgctt atatcatttg tatttccaca aagcatttct attggttctt tagtaattac 9480 ctaaagagac gtgtagtctt taatggtgtt tcctttagta cttttgaaga agctgcgctg 9540 tgcacctttt tgttaaataa agaaatgtat ctaaagttgc gtagtgatgt gctattacct 9600 cttacgcaat ataatagata cttagctctt tataataagt acaagtattt tagtggagca 9660 atggatacaa ctagctacag agaagctgct tgttgtcatc tcgcaaaggc tctcaatgac 9720 ttcagtaact caggttctga tgttctttac caaccaccac aaacctctat cacctcagct 9780 gttttgcaga gtggttttag aaaaatggca ttcccatctg gtaaagttga gggttgtatg 9840 gtacaagtaa cttgtggtac aactacactt aacggtcttt ggcttgatga cgtagtttac 9900 tgtccaagac atgtgatctg cacctctgaa gacatgctta accctaatta tgaagattta 9960 ctcattcgta agtctaatca taatttcttg gtacaggctg gtaatgttca actcagggtt 10020 attggacatt ctatgcaaaa ttgtgtactt aagcttaagg ttgatacagc caatcctaag 10080 acacctaagt ataagtttgt tcgcattcaa ccaggacaga ctttttcagt gttagcttgt 10140 tacaatggtt caccatctgg tgtttaccaa tgtgctatga ggcccaattt cactattaag 10200 ggttcattcc ttaatggttc atgtggtagt gttggtttta acatagatta tgactgtgtc 10260 tctttttgtt acatgcacca tatggaatta ccaactggag ttcatgctgg cacagactta 10320 gaaggtaact tttatggacc ttttgttgac aggcaaacag cacaagcagc tggtacggac 10380 acaactatta cagttaatgt tttagcttgg ttgtacgctg ctgttataaa tggagacagg 10440 tggtttctca atcgatttac cacaactctt aatgacttta accttgtggc tatgaagtac 10500 aattatgaac ctctaacaca agaccatgtt gacatactag gacctctttc tgctcaaact 10560 ggaattgccg ttttagatat gtgtgcttca ttaaaagaat tactgcaaaa tggtatgaat 10620 ggacgtacca tattgggtag tgctttatta gaagatgaat ttacaccttt tgatgttgtt 10680 agacaatgct caggtgttac tttccaaagt gcagtgaaaa gaacaatcaa gggtacacac 10740 cactggttgt tactcacaat tttgacttca cttttagttt tagtccagag tactcaatgg 10800 tctttgttct tttttttgta tgaaaatgcc tttttacctt ttgctatggg tattattgct 10860 atgtctgctt ttgcaatgat gtttgtcaaa cataagcatg catttctctg tttgtttttg 10920 ttaccttctc ttgccactgt agcttatttt aatatggtct atatgcctgc tagttgggtg 10980 atgcgtatta tgacatggtt ggatatggtt gatactagtt tgtctggttt taagctaaaa 11040 gactgtgtta tgtatgcatc agctgtagtg ttactaatcc ttatgacagc aagaactgtg 11100 tatgatgatg gtgctaggag agtgtggaca cttatgaatg tcttgacact cgtttataaa 11160 gtttattatg gtaatgcttt agatcaagcc atttccatgt gggctcttat aatctctgtt 11220 acttctaact actcaggtgt agttacaact gtcatgtttt tggccagagg tattgttttt 11280 atgtgtgttg agtattgccc tattttcttc ataactggta atacacttca gtgtataatg 11340 ctagtttatt gtttcttagg ctatttttgt acttgttact ttggcctctt ttgtttactc 11400 aaccgctact ttagactgac tcttggtgtt tatgattact tagtttctac acaggagttt 11460 agatatatga attcacaggg actactccca cccaagaata gcatagatgc cttcaaactc 11520 aacattaaat tgttgggtgt tggtggcaaa ccttgtatca aagtagccac tgtacagtct 11580 aaaatgtcag atgtaaagtg cacatcagta gtcttactct cagttttgca acaactcaga 11640 gtagaatcat catctaaatt gtgggctcaa tgtgtccagt tacacaatga cattctctta 11700 gctaaagata ctactgaagc ctttgaaaaa atggtttcac tactttctgt tttgctttcc 11760 atgcagggtg ctgtagacat aaacaagctt tgtgaagaaa tgctggacaa cagggcaacc 11820 ttacaagcta tagcctcaga gtttagttcc cttccatcat atgcagcttt tgctactgct 11880 caagaagctt atgagcaggc tgttgctaat ggtgattctg aagttgttct taaaaagttg 11940 aagaagtctt tgaatgtggc taaatctgaa tttgaccgtg atgcagccat gcaacgtaag 12000 ttggaaaaga tggctgatca agctatgacc caaatgtata aacaggctag atctgaggac 12060 aagagggcaa aagttactag tgctatgcag acaatgcttt tcactatgct tagaaagttg 12120 gataatgatg cactcaacaa cattatcaac aatgcaagag atggttgtgt tcccttgaac 12180 ataatacctc ttacaacagc agccaaacta atggttgtca taccagacta taacacatat 12240 aaaaatacgt gtgatggtac aacatttact tatgcatcag cattgtggga aatccaacag 12300 gttgtagatg cagatagtaa aattgttcaa cttagtgaaa ttagtatgga caattcacct 12360 aatttagcat ggcctcttat tgtaacagct ttaagggcca attctgctgt caaattacag 12420 aataatgagc ttagtcctgt tgcactacga cagatgtctt gtgctgccgg tactacacaa 12480 actgcttgca ctgatgacaa tgcgttagct tactacaaca caacaaaggg aggtaggttt 12540 gtacttgcac tgttatccga tttacaggat ttgaaatggg ctagattccc taagagtgat 12600 ggaactggta ctatctatac agaactggaa ccaccttgta ggtttgttac agacacacct 12660 aaaggtccta aagtgaagta tttatacttt attaaaggat taaacaacct aaatagaggt 12720 atggtacttg gtagtttagc tgccacagta cgtctacaag ctggtaatgc aacagaagtg 12780 cctgccaatt caactgtatt atctttctgt gcttttgctg tagatgctgc taaagcttac 12840 aaagattatc tagctagtgg gggacaacca atcactaatt gtgttaagat gttgtgtaca 12900 cacactggta ctggtcaggc aataacagtt acaccggaag ccaatatgga tcaagaatcc 12960 tttggtggtg catcgtgttg tctgtactgc cgttgccaca tagatcatcc aaatcctaaa 13020 ggattttgtg acttaaaagg taagtatgta caaataccta caacttgtgc taatgaccct 13080 gtgggtttta cacttaaaaa cacagtctgt accgtctgcg gtatgtggaa aggttatggc 13140 tgtagttgtg atcaactccg cgaacccatg cttcagtcag ctgatgcaca atcgttttta 13200 aacgggtttg cggtgtaa 13218 <210> 327 <211> 3822 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 327 atgtttgttt ttcttgtttt attgccacta gtctctagtc agtgtgttaa tcttacaacc 60 agaactcaat taccccctgc atacactaat tctttcacac gtggtgttta ttaccctgac 120 aaagttttca gatcctcagt tttacattca actcaggact tgttcttacc tttcttttcc 180 aatgttactt ggttccatgc tatacatgtc tctgggacca atggtactaa gaggtttgat 240 aaccctgtcc taccatttaa tgatggtgtt tattttgctt ccactgagaa gtctaacata 300 ataagaggct ggatttttgg tactacttta gattcgaaga cccagtccct acttattgtt 360 aataacgcta ctaatgttgt tattaaagtc tgtgaatttc aattttgtaa tgatccattt 420 ttgggtgttt attaccacaa aaacaacaaa agttggatgg aaagtgagtt cagagtttat 480 tctagtgcga ataattgcac ttttgaatat gtctctcagc cttttcttat ggaccttgaa 540 ggaaaacagg gtaatttcaa aaatcttagg gaatttgtgt ttaagaatat tgatggttat 600 tttaaaatat attctaagca cacgcctatt aatttagtgc gtgatctccc tcagggtttt 660 tcggctttag aaccattggt agatttgcca ataggtatta acatcactag gtttcaaact 720 ttacttgctt tacatagaag ttatttgact cctggtgatt cttcttcagg ttggacagct 780 ggtgctgcag cttattatgt gggttatctt caacctagga cttttctatt aaaatataat 840 gaaaatggaa ccattacaga tgctgtagac tgtgcacttg accctctctc agaaacaaag 900 tgtacgttga aatccttcac tgtagaaaaa ggaatctatc aaacttctaa ctttagagtc 960 caaccaacag aatctattgt tagatttcct aatattacaa acttgtgccc ttttggtgaa 1020 gtttttaacg ccaccagatt tgcatctgtt tatgcttgga acaggaagag aatcagcaac 1080 tgtgttgctg attattctgt cctatataat tccgcatcat tttccacttt taagtgttat 1140 ggagtgtctc ctactaaatt aaatgatctc tgctttacta atgtctatgc agattcattt 1200 gtaattagag gtgatgaagt cagacaaatc gctccagggc aaactggaaa gattgctgat 1260 tataattata aattaccaga tgattttaca ggctgcgtta tagcttggaa ttctaacaat 1320 cttgattcta aggttggtgg taattataat tacctgtata gattgtttag gaagtctaat 1380 ctcaaacctt ttgagagaga tatttcaact gaaatctatc aggccggtag cacaccttgt 1440 aatggtgttg aaggttttaa ttgttacttt cctttacaat catatggttt ccaacccact 1500 aatggtgttg gttaccaacc atacagagta gtagtacttt cttttgaact tctacatgca 1560 ccagcaactg tttgtggacc taaaaagtct actaatttgg ttaaaaacaa atgtgtcaat 1620 ttcaacttca atggtttaac aggcacaggt gttcttactg agtctaacaa aaagtttctg 1680 cctttccaac aatttggcag agacattgct gacactactg atgctgtccg tgatccacag 1740 acacttgaga ttcttgacat tacaccatgt tcttttggtg gtgtcagtgt tataacacca 1800 ggaacaaata cttctaacca ggttgctgtt ctttatcagg gtgttaactg cacagaagtc 1860 cctgttgcta ttcatgcaga tcaacttact cctacttggc gtgtttattc tacaggttct 1920 aatgtttttc aaacacgtgc aggctgttta ataggggctg aacatgtcaa caactcatat 1980 gagtgtgaca tacccattgg tgcaggtata tgcgctagtt atcagactca gactaattct 2040 cctcggcggg cacgtagtgt agctagtcaa tccatcattg cctacactat gtcacttggt 2100 gcagaaaatt cagttgctta ctctaataac tctattgcca tacccacaaa ttttactatt 2160 agtgttacca cagaaattct accagtgtct atgaccaaga catcagtaga ttgtacaatg 2220 tacatttgtg gtgattcaac tgaatgcagc aatcttttgt tgcaatatgg cagtttttgt 2280 acacaattaa accgtgcttt aactggaata gctgttgaac aagacaaaaa cacccaagaa 2340 gtttttgcac aagtcaaaca aatttacaaa acaccaccaa ttaaagattt tggtggtttt 2400 aatttttcac aaatattacc agatccatca aaaccaagca agaggtcatt tattgaagat 2460 ctacttttca acaaagtgac acttgcagat gctggcttca tcaaacaata tggtgattgc 2520 cttggtgata ttgctgctag agacctcatt tgtgcacaaa agtttaacgg ccttactgtt 2580 ttgccacctt tgctcacaga tgaaatgatt gctcaataca cttctgcact gttagcgggt 2640 acaatcactt ctggttggac ctttggtgca ggtgctgcat tacaaatacc atttgctatg 2700 caaatggctt ataggtttaa tggtattgga gttacacaga atgttctcta tgagaaccaa 2760 aaattgattg ccaaccaatt taatagtgct attggcaaaa ttcaagactc actttcttcc 2820 acagcaagtg cacttggaaa acttcaagat gtggtcaacc aaaatgcaca agctttaaac 2880 acgcttgtta aacaacttag ctccaatttt ggtgcaattt caagtgtttt aaatgatatc 2940 ctttcacgtc ttgacaaagt tgaggctgaa gtgcaaattg ataggttgat cacaggcaga 3000 cttcaaagtt tgcagacata tgtgactcaa caattaatta gagctgcaga aatcagagct 3060 tctgctaatc ttgctgctac taaaatgtca gagtgtgtac ttggacaatc aaaaagagtt 3120 gatttttgtg gaaagggcta tcatcttatg tccttccctc agtcagcacc tcatggtgta 3180 gtcttcttgc atgtgactta tgtccctgca caagaaaaga acttcacaac tgctcctgcc 3240 atttgtcatg atggaaaagc acactttcct cgtgaaggtg tctttgtttc aaatggcaca 3300 cactggtttg taacacaaag gaatttttat gaaccacaaa tcattactac agacaacaca 3360 tttgtgtctg gtaactgtga tgttgtaata ggaattgtca acaacacagt ttatgatcct 3420 ttgcaacctg aattagactc attcaaggag gagttagata aatattttaa gaatcataca 3480 tcaccagatg ttgatttagg tgacatctct ggcattaatg cttcagttgt aaacattcaa 3540 aaagaaattg accgcctcaa tgaggttgcc aagaatttaa atgaatctct catcgatctc 3600 caagaacttg gaaagtatga gcagtatata aaatggccat ggtacatttg gctaggtttt 3660 atagctggct tgattgccat agtaatggtg acaattatgc tttgctgtat gaccagttgc 3720 tgtagttgtc tcaagggctg ttgttcttgt ggatcctgct gcaaatttga tgaagacgac 3780 tctgagccag tgctcaaagg agtcaaatta cattacacat aa 3822 <210> 328 <211> 828 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 328 atggatttgt ttatgagaat cttcacaatt ggaactgtaa ctttgaagca aggtgaaatc 60 aaggatgcta ctccttcaga ttttgttcgc gctactgcaa cgataccgat acaagcctca 120 ctccctttcg gatggcttat tgttggcgtt gcacttcttg ctgtttttca gagcgcttcc 180 aaaatcataa ccctcaaaaa gagatggcaa ctagcactct ccaagggtgt tcactttgtt 240 tgcaacttgc tgttgttgtt tgtaacagtt tactcacacc ttttgctcgt tgctgctggc 300 cttgaagccc cttttctcta tctttatgct ttagtctact tcttgcagag tataaacttt 360 gtaagaataa taatgaggct ttggctttgc tggaaatgcc gttccaaaaa cccattactt 420 tatgatgcca actattttct ttgctggcat actaattgtt acgactattg tataccttac 480 aatagtgtaa cttcttcaat tgtcattact tcaggtgatg gcacaacaag tcctatttct 540 gaacatgact accagattgg tggttatact gaaaaatggg aatctggagt aaaagactgt 600 gttgtattac acagttactt cacttcagac tattaccagc tgtactcaac tcaattgagt 660 acagacactg gtgttgaaca tgttaccttc ttcatctaca ataaaattgt tgatgagcct 720 gaagaacatg tccaaattca cacaatcgac ggttcatccg gagttgttaa tccagtaatg 780 gaaccaattt atgatgaacc gacgacgact actagcgtgc ctttgtaa 828 <210> 329 <211> 228 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 329 atgtactcat tcgtttcgga agagacaggt acgttaatag ttaatagcgt acttcttttt 60 cttgctttcg tggtattctt gctagttaca ctagccatcc ttactgcgct tcgattgtgt 120 gcgtactgct gcaatattgt taacgtgagt cttgtaaaac cttcttttta cgtttactct 180 cgtgttaaaa atctgaattc ttctagagtt cctgatcttc tggtctaa 228 <210> 330 <211> 186 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 330 atgtttcatc tcgttgactt tcaggttact atagcagaga tattactaat tattatgagg 60 acttttaaag tttccatttg gaatcttgat tacatcacaa acctcataat taaaaattta 120 tctaagtcac taactgagaa taaatattct caattagatg aagagcaacc aatggagatt 180 gattaa 186 <210> 331 <211> 366 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 331 atgaaaatta ttcttttctt ggcactgata acactcgcta cttgtgagct ttatcactac 60 caagagtgtg ttagaggtac aacagtactt ttaaaagaac cttgctcttc tggaacatac 120 gagggcaatt caccatttca tcctctagct gataacaaat ttgcactgac ttgctttagc 180 actcaatttg cttttgcttg tcctgacggc gtaaaacacg tctatcagtt acgtgccaga 240 tcagtttcac ctaaactgtt catcagacaa gaggaagttc aagaacttta ctctccaatt 300 tttcttattg ttgcggcaat agtgtttata acactttgct tcacactcaa aagaaagaca 360 gaatga 366 <210> 332 <211> 132 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 332 atgattgaac tttcattaat tgacttctat ttgtgctttt tagcctttct gctattcctt 60 gttttaatta tgcttattat cttttggttc tcacttgaac tgcaagatca taatgaaact 120 tgtcacgcct aa 132 <210> 333 <211> 366 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 333 atgaaatttc ttgttttctt aggaatcatc acaactgtag ctgcatttca ccaagaatgt 60 agtttacagt catgtactca acatcaacca tatgtagttg atgacccgtg tcctattcac 120 ttctattcta aatggtatat tagagtagga gctagaaaat cagcaccttt aattgaattg 180 tgcgtggatg aggctggttc taaatcaccc attcagtaca tcgatatcgg taattataca 240 gtttcctgtt taccttttac aattaattgc caggaaccta aattgggtag tcttgtagtg 300 cgttgttcgt tctatgaaga ctttttagag tatcatgacg ttcgtgttgt tttagatttc 360 atctaa 366 <210> 334 <211> 1260 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 334 atgtctgata atggacccca aaatcagcga aatgcacccc gcattacgtt tggtggaccc 60 tcagattcaa ctggcagtaa ccagaatgga gaacgcagtg gggcgcgatc aaaacaacgt 120 cggccccaag gtttacccaa taatactgcg tcttggttca ccgctctcac tcaacatggc 180 aaggaagacc ttaaattccc tcgaggacaa ggcgttccaa ttaacaccaa tagcagtcca 240 gatgaccaaa ttggctacta ccgaagagct accagacgaa ttcgtggtgg tgacggtaaa 300 atgaaagatc tcagtccaag atggtatttc tactacctag gaactgggcc agaagctgga 360 cttccctatg gtgctaacaa agacggcatc atatgggttg caactgaggg agccttgaat 420 acaccaaaag atcacattgg cacccgcaat cctgctaaca atgctgcaat cgtgctacaa 480 cttcctcaag gaacaacatt gccaaaaggc ttctacgcag aagggagcag aggcggcagt 540 caagcctctt ctcgttcctc atcacgtagt cgcaacagtt caagaaattc aactccaggc 600 agcagtaaac gaacttctcc tgctagaatg gctggcaatg gcggtgatgc tgctcttgct 660 ttgctgctgc ttgacagatt gaaccagctt gagagtaaaa tgtctggtaa aggccaacaa 720 caacaaggcc aaactgtcac taagaaatct gctgctgagg cttctaagaa gcctcggcaa 780 aaacgtactg ccactaaagc atacaatgta acacaagctt tcggcagacg tggtccagaa 840 caaacccaag gaaattttgg ggaccaggaa ctaaccagac aaggaactga ttacaaacat 900 tggccgcaaa ttgcacaatt tgcccccagc gcttcagcgt tcttcggaat gtcgcgcatt 960 ggcatggaag tcacaccttc gggaacgtgg ttgacctaca caggtgccat caaattggat 1020 gacaaagatc caaatttcaa agatcaagtc attttgctga ataagcatat tgacgcatac 1080 aaaacattcc caccaacaga gcctaaaaag gacaaaaaga agaaggctga tgaaactcaa 1140 gccttaccgc agagacagaa gaaacagcaa actgtgactc ttcttcctgc tgcagatttg 1200 gatgatttct ccaaacaatt gcaacaatcc atgagcagtg ctgactcaac tcaggcctaa 1260 <210> 335 <211> 117 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 335 atgggctata taaacgtttt cgcttttccg tttacgatat atagtctact cttgtgcaga 60 atgaattctc gtaactacat agcacaagta gatgtagtta actttaatct cacatag 117 <210> 336 <211> 21291 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <220> <221> modified_base <222> (20906)..(20915) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (20939)..(20940) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (20952)..(20968) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (20970)..(20974) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (20976)..(20985) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (21005)..(21018) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (21022)..(21030) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (21052)..(21058) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (21062)..(21093) <223> a, c, t, g, unknown or other <400> 336 atggagagcc ttgtccctgg tttcaacgag aaaacacacg tccaactcag tttgcctgtt 60 ttacaggttc gcgacgtgct cgtacgtggc tttggagact ccgtggagga ggtcttatca 120 gaggcacgtc aacatcttaa agatggcact tgtggcttag tagaagttga aaaaggcgtt 180 ttgcctcaac ttgaacagcc ctatgtgttc atcaaacgtt cggatgctcg aactgcacct 240 catggtcatg ttatggttga gctggtagca gaactcgaag gcattcagta cggtcgtagt 300 ggtgagacac ttggtgtcct tgtccctcat gtgggcgaaa taccagtggc ttaccgcaag 360 gttcttcttc gtaagaacgg taataaagga gctggtggcc atagttacgg cgccgatcta 420 aagtcatttg acttaggcga cgagcttggc actgatcctt atgaagattt tcaagaaaac 480 tggaacacta aacatagcag tggtgttacc cgtgaactca tgcgtgagct taacggaggg 540 gcatacactc gctatgtcga taacaacttc tgtggccctg atggctaccc tcttgagtgc 600 attaaagacc ttctagcacg tgctggtaaa gcttcatgca ctttgtccga acaactggac 660 tttattgaca ctaagagggg tgtatactgc tgccgtgaac atgagcatga aattgcttgg 720 tacacggaac gttctgaaaa gagctatgaa ttgcagacac cttttgaaat taaattggca 780 aagaaatttg acatcttcaa tggggaatgt ccaaattttg tatttccctt aaattccata 840 atcaagacta ttcaaccaag ggttgaaaag aaaaagcttg atggctttat gggtagaatt 900 cgatccgtct atccagttgc gtcaccaaat gaatgcaacc aaatgtgcct ttcaactctc 960 atgaagtgtg atcattgtgg tgaaacttca tggcagacgg gcgattttgt taaagccact 1020 tgcgaatttt gtggcactga gaatttgact aaagaaggtg ccactacttg tggttactta 1080 acccaaaatg ctgttgttaa aatttattgt ccagcatgtc acaattcaga agtaggacct 1140 gagcatagtc ttgccgaata ccataatgaa tctggcttga aaaccattct tcgtaagggt 1200 ggtcgcacta ttgcctttgg aggctgtgtg ttctcttatg ttggttgcca taacaagtgt 1260 gcctattggg ttccacgtgc tagcgctaac ataggttgta accatacagg tgttgttgga 1320 gaaggttccg aaggtcttaa tgacaacctt cttgaaatac tccaaaaaga gaaagtcaac 1380 atcaatattg ttggtgactt taaacttaat gaagagatcg ccattatttt ggcatctttt 1440 tctgcttcca caagtgcttt tgtggaaact gtgaaaggtt tggattataa agcattcaaa 1500 caaattgttg aatcctgtgg taattttaaa gttacaaaag gaaaagctaa aaaaggtgcc 1560 tggaatattg gtgaacagaa atcaatactg agtcctcttt atgcatttgc atcagaggct 1620 gctcgtgttg tacgatcaat tttctcccgc actcttgaaa ctgctcaaaa ttctgtgcgt 1680 gttttacaga aggccgctat aacaatacta gatggaattt cacagtattc actgagactc 1740 attgatgcta tgatgttcac atctgatttg gctactaaca atctagttgt aatggcctac 1800 attacaggtg gtgttgttca gttgacttcg cagtggctaa ctaacatctt tggcactgtt 1860 tatgaaaaac tcaaacccgt ccttgattgg cttgaagaga agtttaagga aggtgtagag 1920 tttcttagag acggttggga aattgttaaa tttatctcaa cctgtgcttg tgaaattgtc 1980 ggtggacaaa ttgtcacctg tgcaaaggaa attaaggaga gtgttcagac attctttaag 2040 cttgtaaata aatttttggc tttgtgtgct gactctatca ttattggtgg agctaaactt 2100 aaagccttga atttaggtga aacatttgtc acgcactcaa agggattgta cagaaagtgt 2160 gttaaatcca gagaagaaac tggcctactc atgcctctaa aagccccaaa agaaattatc 2220 ttcttagagg gagaaacact tcccacagaa gtgttaacag aggaagttgt cttgaaaact 2280 ggtgatttac aaccattaga acaacctact agtgaagctg ttgaagctcc attggttggt 2340 acaccagttt gtattaacgg gcttatgttg ctcgaaatca aagacacaga aaagtactgt 2400 gcccttgcac ctaatatgat ggtaacaaac aataccttca cactcaaagg cggtgcacca 2460 acaaaggtta cttttggtga tgacactgtg atagaagtgc aaggttacaa gagtgtgaat 2520 atcacttttg aacttgatga aaggattgat aaagtactta atgagaagtg ctctgcctat 2580 acagttgaac tcggtacaga agtaaatgag ttcgcctgtg ttgtggcaga tgctgtcata 2640 aaaactttgc aaccagtatc tgaattactt acaccactgg gcattgattt agatgagtgg 2700 agtatggcta catactactt atttgatgag tctggtgagt ttaaattggc ttcacatatg 2760 tattgttctt tttaccctcc agatgaggat gaagaagaag gtgattgtga agaagaagag 2820 tttgagccat caactcaata tgagtatggt actgaagatg attaccaagg taaacctttg 2880 gaatttggtg ccacttctgc tgctcttcaa cctgaagaag agcaagaaga agattggtta 2940 gatgatgata gtcaacaaac tgttggtcaa caagacggca gtgaggacaa tcagacaact 3000 actattcaaa caattgttga ggttcaacct caattagaga tggaacttac accagttgtt 3060 cagactattg aagtgaatag ttttagtggt tatttaaaac ttactgacaa tgtatacatt 3120 aaaaatgcag acattgtgga agaagctaaa aaggtaaaac caacagtggt tgttaatgca 3180 gccaatgttt accttaaaca tggaggaggt gttgcaggag ccttaaataa ggctactaac 3240 aatgccatgc aagttgaatc tgatgattac atagctacta atggaccact taaagtgggt 3300 ggtagttgtg ttttaagcgg acacaatctt gctaaacact gtcttcatgt tgtcggccca 3360 aatgttaaca aaggtgaaga cattcaactt cttaagagtg cttatgaaaa ttttaatcag 3420 cacgaagttc tacttgcacc attattatca gctggtattt ttggtgctga ccctatacat 3480 tctttaagag tttgtgtaga tactgttcgc acaaatgtct acttagctgt ctttgataaa 3540 aatctctatg acaaacttgt ttcaagcttt ttggaaatga agagtgaaaa gcaagttgaa 3600 caaaagatcg ctgagattcc taaagaggaa gttaagccat ttataactga aagtaaacct 3660 tcagttgaac agagaaaaca agatgataag aaaatcaaag cttgtgttga agaagttaca 3720 acaactctgg aagaaactaa gttcctcaca gaaaacttgt tactttatat tgacattaat 3780 ggcaatcttc atccagattc tgccactctt gttagtgaca ttgacatcac tttcttaaag 3840 aaagatgctc catatatagt gggtgatgtt gttcaagagg gtgttttaac tgctgtggtt 3900 atacctacta aaaaggctgg tggcactact gaaatgctag cgaaagcttt gagaaaagtg 3960 ccaacagaca attatataac cacttacccg ggtcagggtt taaatggtta cactgtagag 4020 gaggcaaaga cagtgcttaa aaagtgtaaa agtgcctttt acattctacc atctattatc 4080 tctaatgaga agcaagaaat tcttggaact gtttcttgga atttgcgaga aatgcttgca 4140 catgcagaag aaacacgcaa attaatgcct gtctgtgtgg aaactaaagc catagtttca 4200 actatacagc gtaaatataa gggtattaaa atacaagagg gtgtggttga ttatggtgct 4260 agattttact tttacaccag taaaacaact gtagcgtcac ttatcaacac acttaacgat 4320 ctaaatgaaa ctcttgttac aatgccactt ggctatgtaa cacatggctt aaatttggaa 4380 gaagctgctc ggtatatgag atctctcaaa gtgccagcta cagtttctgt ttcttcacct 4440 gatgctgtta cagcgtataa tggttatctt acttcttctt ctaaaacacc tgaagaacat 4500 tttattgaaa ccatctcact tgctggttcc tataaagatt ggtcctattc tggacaatct 4560 acacaactag gtatagaatt tcttaagaga ggtgataaaa gtgtatatta cactagtaat 4620 cctaccacat tccacctaga tggtgaagtt atcacctttg acaatcttaa gacacttctt 4680 tctttgagag aagtgaggac tattaaggtg tttacaacag tagacaacat taacctccac 4740 acgcaagttg tggacatgtc aatgacatat ggacaacagt ttggtccaac ttatttggat 4800 ggagctgatg ttactaaaat aaaacctcat aattcacatg aaggtaaaac attttatgtt 4860 ttacctaatg atgacactct acgtgttgag gcttttgagt actaccacac aactgatcct 4920 agttttctgg gtaggtacat gtcagcatta aatcacacta aaaagtggaa atacccacaa 4980 gttaatggtt taacttctat taaatgggca gataacaact gttatcttgc cactgcattg 5040 ttaacactcc aacaaataga gttgaagttt aatccacctg ctctacaaga tgcttattac 5100 agagcaaggg ctggtgaagc tgctaacttt tgtgcactta tcttagccta ctgtaataag 5160 acagtaggtg agttaggtga tgttagagaa acaatgagtt acttgtttca acatgccaat 5220 ttagattctt gcaaaagagt cttgaacgtg gtgtgtaaaa cttgtggaca acagcagaca 5280 acccttaagg gtgtagaagc tgttatgtac atgggcacac tttcttatga acaatttaag 5340 aaaggtgttc agataccttg tacgtgtggt aaacaagcta caaaatatct agtacaacag 5400 gagtcacctt ttgttatgat gtcagcacca cctgctcagt atgaacttaa gcatggtaca 5460 tttacttgtg ctagtgagta cgctggtaat taccagtgtg gtcactataa acatataact 5520 tctaaagaaa ctttgtattg catagacggt gctttactta caaagtcctc agaatacaaa 5580 ggtcctatta cggatgtttt ctacaaagaa aacagttaca caacaaccat aaaaccagtt 5640 acttataaat tggatggtgt tgtttgtaca gaaattgacc ctaagttgga caattattat 5700 aagaaagaca attcttattt cacagagcaa ccaattgatc ttgtaccaaa ccaaccatat 5760 ccaaacgcaa gcttcgataa ttttaagttt gtatgtgata atatcaaatt tgctgatgat 5820 ttaaaccagt taactggtta taagaaacct gcttcaagag agcttaaagt tacatttttc 5880 cctgacttaa atggtgatgt ggtggctatt gattataaac actacacacc ctcttttaag 5940 aaaggagcta aattgttaca taaacctatt gtttggcatg ttaacaatgc aactaataaa 6000 gccacgtata aaccaaatac ctggtgtata cgttgtcttt ggagcacaaa accagttgaa 6060 acatcaaatt cgtttgatgt actgaagtca gaggacgcgc agggaatgga taatcttgcc 6120 tgcgaagatc taaaaccagt ctctgaagaa gtagtggaaa atcctaccat acagaaagac 6180 gttcttgagt gtaatgtgaa aactaccgaa gttgtaggag acattatact taaaccagca 6240 aataatagtt taaaaattac agaagaggtt ggccacacag atctaatggc tgcttatgta 6300 gacaattcta gtcttactat taagaaacct aatgaattat ctagagtatt aggtttgaaa 6360 acccttgcta ctcatggttt agctgctgtt aatagtgtcc cttgggatac tatagctaat 6420 tatgctaagc cttttcttaa caaagttgtt agtacaacta ctaacatagt tacacggtgt 6480 ttaaaccgtg tttgtactaa ttatatgcct tatttcttta ctttattgct acaattgtgt 6540 acttttacta gaagtacaaa ttctagaatt aaagcatcta tgccgactac tatagcaaag 6600 aatactgtta agagtgtcgg taaattttgt ctagaggctt catttaatta tttgaagtca 6660 cctaattttt ctaaactgat aaatattata atttggtttt tactattaag tgtttgccta 6720 ggttctttaa tctactcaac cgctgcttta ggtgttttaa tgtctaattt aggcatgcct 6780 tcttactgta ctggttacag agaaggctat ttgaactcta ctaatgtcac tattgcaacc 6840 tactgtactg gttctatacc ttgtagtgtt tgtcttagtg gtttagattc tttagacacc 6900 tatccttctt tagaaactat acaaattacc atttcatctt ttaaatggga tttaactgct 6960 tttggcttag ttgcagagtg gtttttggca tatattcttt tcactaggtt tttctatgta 7020 cttggattgg ctgcaatcat gcaattgttt ttcagctatt ttgcagtaca ttttattagt 7080 aattcttggc ttatgtggtt aataattaat cttgtacaaa tggccccgat ttcagctatg 7140 gttagaatgt acatcttctt tgcatcattt tattatgtat ggaaaagtta tgtgcatgtt 7200 gtagacggtt gtaattcatc aacttgtatg atgtgttaca aacgtaatag agcaacaaga 7260 gtcgaatgta caactattgt taatggtgtt agaaggtcct tttatgtcta tgctaatgga 7320 ggtaaaggct tttgcaaact acacaattgg aattgtgtta attgtgatac attctgtgct 7380 ggtagtacat ttattagtga tgaagttgcg agagacttgt cactacagtt taaaagacca 7440 ataaatccta ctgaccagtc ttcttacatc gttgatagtg ttacagtgaa gaatggttcc 7500 atccatcttt actttgataa agctggtcaa aagacttatg aaagacattc tctctctcat 7560 tttgttaact tagacaacct gagagctaat aacactaaag gttcattgcc tattaatgtt 7620 atagtttttg atggtaaatc aaaatgtgaa gaatcatctg caaaatcagc gtctgtttac 7680 tacagtcagc ttatgtgtca acctatactg ttactagatc aggcattagt gtctgatgtt 7740 ggtgatagtg cggaagttgc agttaaaatg tttgatgctt acgttaatac gttttcatca 7800 acttttaacg taccaatgga aaaactcaaa acactagttg caactgcaga agctgaactt 7860 gcaaagaatg tgtccttaga caatgtctta tctactttta tttcagcagc tcggcaaggg 7920 tttgttgatt cagatgtaga aactaaagat gttgttgaat gtcttaaatt gtcacatcaa 7980 tctgacatag aagttactgg cgatagttgt aataactata tgctcaccta taacaaagtt 8040 gaaaacatga caccccgtga ccttggtgct tgtattgact gtagtgcgcg tcatattaat 8100 gcgcaggtag caaaaagtca caacattgct ttgatatgga acgttaaaga tttcatgtca 8160 ttgtctgaac aactacgaaa acaaatacgt agtgctgcta aaaagaataa cttacctttt 8220 aagttgacat gtgcaactac tagacaagtt gttaatgttg taacaacaaa gatagcactt 8280 aagggtggta aaattgttaa taattggttg aagcagttaa ttaaagttac acttgtgttc 8340 ctttttgttg ctgctatttt ctatttaata acacctgttc atgtcatgtc taaacatact 8400 gacttttcaa gtgaaatcat aggatacaag gctattgatg gtggtgtcac tcgtgacata 8460 gcatctacag atacttgttt tgctaacaaa catgctgatt ttgacacatg gtttagccag 8520 cgtggtggta gttatactaa tgacaaagct tgcccattga ttgctgcagt cataacaaga 8580 gaagtgggtt ttgtcgtgcc tggtttgcct ggcacgatat tacgcacaac taatggtgac 8640 tttttgcatt tcttacctag agtttttagt gcagttggta acatctgtta cacaccatca 8700 aaacttatag agtacactga ctttgcaaca tcagcttgtg ttttggctgc tgaatgtaca 8760 atttttaaag atgcttctgg taagccagta ccatattgtt atgataccaa tgtactagaa 8820 ggttctgttg cttatgaaag tttacgccct gacacacgtt atgtgctcat ggatggctct 8880 attattcaat ttcctaacac ctaccttgaa ggttctgtta gagtggtaac aacttttgat 8940 tctgagtact gtaggcacgg cacttgtgaa agatcagaag ctggtgtttg tgtatctact 9000 agtggtagat gggtacttaa caatgattat tacagatctt taccaggagt tttctgtggt 9060 gtagatgctg taaatttact tactaatatg tttacaccac taattcaacc tattggtgct 9120 ttggacatat cagcatctat agtagctggt ggtattgtag ctatcgtagt aacatgcctt 9180 gcctactatt ttatgaggtt tagaagagct tttggtgaat acagtcatgt agttgccttt 9240 aatactttac tattccttat gtcattcact gtactctgtt taacaccagt ttactcattc 9300 ttacctggtg tttattctgt tatttacttg tacttgacat tttatcttac taatgatgtt 9360 tcttttttag cacatattca gtggatggtt atgttcacac ctttagtacc tttctggata 9420 acaattgctt atatcatttg tatttccaca aagcatttct attggttctt tagtaattac 9480 ctaaagagac gtgtagtctt taatggtgtt tcctttagta cttttgaaga agctgcgctg 9540 tgcacctttt tgttaaataa agaaatgtat ctaaagttgc gtagtgatgt gctattacct 9600 cttacgcaat ataatagata cttagctctt tataataagt acaagtattt tagtggagca 9660 atggatacaa ctagctacag agaagctgct tgttgtcatc tcgcaaaggc tctcaatgac 9720 ttcagtaact caggttctga tgttctttac caaccaccac aaacctctat cacctcagct 9780 gttttgcaga gtggttttag aaaaatggca ttcccatctg gtaaagttga gggttgtatg 9840 gtacaagtaa cttgtggtac aactacactt aacggtcttt ggcttgatga cgtagtttac 9900 tgtccaagac atgtgatctg cacctctgaa gacatgctta accctaatta tgaagattta 9960 ctcattcgta agtctaatca taatttcttg gtacaggctg gtaatgttca actcagggtt 10020 attggacatt ctatgcaaaa ttgtgtactt aagcttaagg ttgatacagc caatcctaag 10080 acacctaagt ataagtttgt tcgcattcaa ccaggacaga ctttttcagt gttagcttgt 10140 tacaatggtt caccatctgg tgtttaccaa tgtgctatga ggcccaattt cactattaag 10200 ggttcattcc ttaatggttc atgtggtagt gttggtttta acatagatta tgactgtgtc 10260 tctttttgtt acatgcacca tatggaatta ccaactggag ttcatgctgg cacagactta 10320 gaaggtaact tttatggacc ttttgttgac aggcaaacag cacaagcagc tggtacggac 10380 acaactatta cagttaatgt tttagcttgg ttgtacgctg ctgttataaa tggagacagg 10440 tggtttctca atcgatttac cacaactctt aatgacttta accttgtggc tatgaagtac 10500 aattatgaac ctctaacaca agatcatgtt gacatactag gacctctttc tgctcaaact 10560 ggaattgccg ttttagatat gtgtgcttca ttaaaagaat tactgcaaaa tggtatgaat 10620 ggacgtacca tattgggtag tgctttatta gaagatgaat ttacaccttt tgatgttgtt 10680 agacaatgct caggtgttac tttccaaagt gcagtgaaaa gaacaatcaa gggtacacac 10740 cactggttgt tactcacaat tttgacttca cttttagttt tagtccagag tactcaatgg 10800 tctttgttct tttttttgta tgaaaatgcc tttttacctt ttgctatggg tattattgct 10860 atgtctgctt ttgcaatgat gtttgtcaaa cataagcatg catttctctg tttgtttttg 10920 ttaccttctc ttgccactgt agcttatttt aatatggtct atatgcctgc tagttgggtg 10980 atgcgtatta tgacatggtt ggatatggtt gatactagtt tgtctggttt taagctaaaa 11040 gactgtgtta tgtatgcatc agctgtagtg ttactaatcc ttatgacagc aagaactgtg 11100 tatgatgatg gtgctaggag agtgtggaca cttatgaatg tcttgacact cgtttataaa 11160 gtttattatg gtaatgcttt agatcaagcc atttccatgt gggctcttat aatctctgtt 11220 acttctaact actcaggtgt agttacaact gtcatgtttt tggccagagg tattgttttt 11280 atgtgtgttg agtattgccc tattttcttc ataactggta atacacttca gtgtataatg 11340 ctagtttatt gtttcttagg ctatttttgt acttgttact ttggcctctt ttgtttactc 11400 aaccgctact ttagactgac tcttggtgtt tatgattact tagtttctac acaggagttt 11460 agatatatga attcacaggg actactccca cccaagaata gcatagatgc cttcaaactc 11520 aacattaaat tgttgggtgt tggtggcaaa ccttgtatca aagtagccac tgtacagtct 11580 aaaatgtcag atgtaaagtg cacatcagta gtcttactct cagttttgca acaactcaga 11640 gtagaatcat catctaaatt gtgggctcaa tgtgtccagt tacacaatga cattctctta 11700 gctaaagata ctactgaagc ctttgaaaaa atggtttcac tactttctgt tttgctttcc 11760 atgcagggtg ctgtagacat aaacaagctt tgtgaagaaa tgctggacaa cagggcaacc 11820 ttacaagcta tagcctcaga gtttagttcc cttccatcat atgcagcttt tgctactgct 11880 caagaagctt atgagcaggc tgttgctaat ggtgattctg aagttgttct taaaaagttg 11940 aagaagtctt tgaatgtggc taaatctgaa tttgaccgtg atgcagccat gcaacgtaag 12000 ttggaaaaga tggctgatca agctatgacc caaatgtata aacaggctag atctgaggac 12060 aagagggcaa aagttactag tgctatgcag acaatgcttt tcactatgct tagaaagttg 12120 gataatgatg cactcaacaa cattatcaac aatgcaagag atggttgtgt tcccttgaac 12180 ataatacctc ttacaacagc agccaaacta atggttgtca taccagacta taacacatat 12240 aaaaatacgt gtgatggtac aacatttact tatgcatcag cattgtggga aatccaacag 12300 gttgtagatg cagatagtaa aattgttcaa cttagtgaaa ttagtatgga caattcacct 12360 aatttagcat ggcctcttat tgtaacagct ttaagggcca attctgctgt caaattacag 12420 aataatgagc ttagtcctgt tgcactacga cagatgtctt gtgctgccgg tactacacaa 12480 actgcttgca ctgatgacaa tgcgttagct tactacaaca caacaaaggg aggtaggttt 12540 gtacttgcac tgttatccga tttacaggat ttgaaatggg ctagattccc taagagtgat 12600 ggaactggta ctatctatac agaactggaa ccaccttgta ggtttgttac agacacacct 12660 aaaggtccta aagtgaagta tttatacttt attaaaggat taaacaacct aaatagaggt 12720 atggtacttg gtagtttagc tgccacagta cgtctacaag ctggtaatgc aacagaagtg 12780 cctgccaatt caactgtatt atctttctgt gcttttgctg tagatgctgc taaagcttac 12840 aaagattatc tagctagtgg gggacaacca atcactaatt gtgttaagat gttgtgtaca 12900 cacactggta ctggtcaggc aataacagtt acaccggaag ccaatatgga tcaagaatcc 12960 tttggtggtg catcgtgttg tctgtactgc cgttgccaca tagatcatcc aaatcctaaa 13020 ggattttgtg acttaaaagg taagtatgta caaataccta caacttgtgt taatgaccct 13080 gtgggtttta cacttaaaaa cacagtctgt accgtctgcg gtatgtggaa aggttatggc 13140 tgtagttgtg atcaactccg cgaacccatg cttcagtcag ctgatgcaca atcgttttta 13200 aaccgggttt gcggtgtaag tgcagcccgt cttacaccgt gcggcacagg cactagtact 13260 gatgtcgtat acagggcttt tgacatctac aatgataaag tagctggttt tgctaaattc 13320 ctaaaaacta attgttgtcg cttccaagaa aaggacgaag atgacaattt aattgattct 13380 tactttgtag ttaagagaca cactttctct aactaccaac atgaagaaac aatttataat 13440 ttacttaagg attgtccagc tgttgctaaa catgacttct ttaagtttag aatagacggt 13500 gacatggtac cacatatatc acgtcaacgt cttactaaat acacaatggc agacctcgtc 13560 tatgctttaa ggcattttga tgaaggtaat tgtgacacat taaaagaaat acttgtcaca 13620 tacaattgtt gtgatgatga ttatttcaat aaaaaggact ggtatgattt tgtagaaaac 13680 ccagatatat tacgcgtata cgccaactta ggtgaacgtg tacgccaagc tttgttaaaa 13740 acagtacaat tctgtgatgc catgcgaaat gctggtattg ttggtgtact gacattagat 13800 aatcaagatc tcaatggtaa ctggtatgat ttcggtgatt tcatacaaac cacgccaggt 13860 agtggagttc ctgttgtaga ttcttattat tcattgttaa tgcctatatt aaccttgacc 13920 agggctttaa ctgcagagtc acatgttgac actgacttaa caaagcctta cattaagtgg 13980 gatttgttaa aatatgactt cacggaagag aggttaaaac tctttgaccg ttattttaaa 14040 tattgggatc agacatacca cccaaattgt gttaactgtt tggatgacag atgcattctg 14100 cattgtgcaa actttaatgt tttattctct acagtgttcc cacttacaag ttttggacca 14160 ctagtgagaa aaatatttgt tgatggtgtt ccatttgtag tttcaactgg ataccacttc 14220 agagagctag gtgttgtaca taatcaggat gtaaacttac atagctctag acttagtttt 14280 aaggaattac ttgtgtatgc tgctgaccct gctatgcacg ctgcttctgg taatctatta 14340 ctagataaac gcactacgtg cttttcagta gctgcactta ctaacaatgt tgcttttcaa 14400 actgtcaaac ccggtaattt taacaaagac ttctatgact ttgctgtgtc taagggtttc 14460 tttaaggaag gaagttctgt tgaattaaaa cacttcttct ttgctcagga tggtaatgct 14520 gctatcagcg attatgacta ctatcgttat aatctaccaa caatgtgtga tatcagacaa 14580 ctactatttg tagttgaagt tgttgataag tactttgatt gttacgatgg tggctgtatt 14640 aatgctaacc aagtcatcgt caacaaccta gacaaatcag ctggttttcc atttaataaa 14700 tggggtaagg ctagacttta ttatgattca atgagttatg aggatcaaga tgcacttttc 14760 gcatatacaa aacgtaatgt catccctact ataactcaaa tgaatcttaa gtatgccatt 14820 agtgcaaaga atagagctcg caccgtagct ggtgtctcta tctgtagtac tatgaccaat 14880 agacagtttc atcaaaaatt attgaaatca atagccgcca ctagaggagc tactgtagta 14940 attggaacaa gcaaattcta tggtggttgg cacaacatgt taaaaactgt ttatagtgat 15000 gtagaaaacc ctcaccttat gggttgggat tatcctaaat gtgatagagc catgcctaac 15060 atgcttagaa ttatggcctc acttgttctt gctcgcaaac atacaacgtg ttgtagcttg 15120 tcacaccgtt tctatagatt agctaatgag tgtgctcaag tattgagtga aatggtcatg 15180 tgtggcggtt cactatatgt taaaccaggt ggaacctcat caggagatgc cacaactgct 15240 tatgctaata gtgtttttaa catttgtcaa gctgtcacgg ccaatgttaa tgcactttta 15300 tctactgatg gtaacaaaat tgccgataag tatgtccgca atttacaaca cagactttat 15360 gagtgtctct atagaaatag agatgttgac acagactttg tgaatgagtt ttacgcatat 15420 ttgcgtaaac atttctcaat gatgatactc tctgacgatg ctgttgtgtg tttcaatagc 15480 acttatgcat ctcaaggtct agtggctagc ataaagaact ttaagtcagt tctttattat 15540 caaaacaatg tttttatgtc tgaagcaaaa tgttggactg agactgacct tactaaagga 15600 cctcatgaat tttgctctca acatacaatg ctagttaaac agggtgatga ttatgtgtac 15660 cttccttacc cagatccatc aagaatccta ggggccggct gttttgtaga tgatatcgta 15720 aaaacagatg gtacacttat gattgaacgg ttcgtgtctt tagctataga tgcttaccca 15780 cttactaaac atcctaatca ggagtatgct gatgtctttc atttgtactt acaatacata 15840 agaaagctac atgatgagtt aacaggacac atgttagaca tgtattctgt tatgcttact 15900 aatgataaca cttcaaggta ttgggaacct gagttttatg aggctatgta cacaccgcat 15960 acagtcttac aggctgttgg ggcttgtgtt ctttgcaatt cacagacttc attaagatgt 16020 ggtgcttgca tacgtagacc attcttatgt tgtaaatgct gttacgacca tgtcatatca 16080 acatcacata aattagtctt gtctgttaat ccgtatgttt gcaatgctcc aggttgtgat 16140 gtcacagatg tgactcaact ttacttagga ggtatgagct attattgtaa atcacataaa 16200 ccacccatta gttttccatt gtgtgctaat ggacaagttt ttggtttata taaaaataca 16260 tgtgttggta gcgataatgt tactgacttt aatgcaattg caacatgtga ctggacaaat 16320 gctggtgatt acattttagc taacacctgt actgaaagac tcaagctttt tgcagcagaa 16380 acgctcaaag ctactgagga gacatttaaa ctgtcttatg gtattgctac tgtacgtgaa 16440 gtgctgtctg acagagaatt acatctttca tgggaagttg gtaaacctag accaccactt 16500 aaccgaaatt atgtctttac tggttatcgt gtaactaaaa acagtaaagt acaaatagga 16560 gagtacacct ttgaaaaagg tgactatggt gatgctgttg tttaccgagg tacaacaact 16620 tacaaattaa atgttggtga ttattttgtg ctgacatcac atacagtaat gccattaagt 16680 gcacctacac tagtgccaca agagcactat gttagaatta ctggcttata cccaacactc 16740 aatatctcag atgagttttc tagcaatgtt gcaaattatc aaaaggttgg tatgcaaaag 16800 tattctacac tccagggacc acctggtact ggtaagagtc attttgctat tggcctagct 16860 ctctactacc cttctgctcg catagtgtat acagcttgct ctcatgccgc tgttgatgca 16920 ctatgtgaga aggcattaaa atatttgcct atagataaat gtagtagaat tatacctgca 16980 cgtgctcgtg tagattgttt tgataaattc aaagtgaatt caacattaga acagtatgtc 17040 ttttgtactg taaatgcatt gcctgagacg acagcagata tagttgtctt tgatgaaatt 17100 tcaatggcca caaattatga tttgagtgtt gtcaatgcca gattacgtgc taagcactat 17160 gtgtacattg gcgaccctgc tcaattacct gcaccacgca cattgctaac taagggcaca 17220 ctagaaccag aatatttcaa ttcagtgtgt agacttatga aaactatagg tccagacatg 17280 ttcctcggaa cttgtcggcg ttgtcctgct gaaattgttg acactgtgag tgctttggtt 17340 tatgataata agcttaaagc acataaagac aaatcagctc aatgctttaa aatgttttat 17400 aagggtgtta tcacgcatga tgtttcatct gcaattaaca ggccacaaat aggcgtggta 17460 agagaattcc ttacacgtaa ccctgcttgg agaaaagctg tctttatttc accttataat 17520 tcacagaatg ctgtagcctc aaagattttg ggactaccaa ctcaaactgt tgattcatca 17580 cagggctcag aatatgacta tgtcatattc actcaaacca ctgaaacagc tcactcttgt 17640 aatgtaaaca gatttaatgt tgctattacc agagcaaaag taggcatact ttgcataatg 17700 tctgatagag acctttatga caagttgcaa tttacaagtc ttgaaattcc acgtaggaat 17760 gtggcaactt tacaagctga aaatgtaaca ggactcttta aagattgtag taaggtaatc 17820 actgggttac atcctacaca ggcacctaca cacctcagtg ttgacactaa attcaaaact 17880 gaaggtttat gtgttgacat acctggcata cctaaggaca tgacctatag aagactcatc 17940 tctatgatgg gttttaaaat gaattatcaa gttaatggtt accctaacat gtttatcacc 18000 cgcgaagaag ctataagaca tgtacgtgca tggattggct tcgatgtcga ggggtgtcat 18060 gctactagag aagctgttgg taccaattta cctttacagc taggtttttc tacaggtgtt 18120 aacctagttg ctgtacctac aggttatgtt gatacaccta ataatacaga tttttccaga 18180 gttagtgcta aaccaccgcc tggagatcaa tttaaacacc tcataccact tatgtacaaa 18240 ggacttcctt ggaatgtagt gcgtataaag attgtacaaa tgttaagtga cacacttaga 18300 aatctctctg acagagtcgt atttgtctta tgggcacatg gctttgagtt gacatctatg 18360 aagtattttg tgaaaatagg acctgagcgc acctgttgtc tatgtgatag acgtgccaca 18420 tgcttttcca ctgcttcaga cacttatgcc tgttggcatc attctattgg atttgattac 18480 gtctataatc cgtttatgat tgatgttcaa caatggggtt ttacaggtaa cctacaaagc 18540 aaccatgatc tgtattgtca agtccatggt aatgcacatg tagctagttg tgatgcaatc 18600 atgactaggt gtctagctgt ccacgagtgc tttgttaagc gtgttgactg gactattgaa 18660 tatcctataa ttggtgatga actgaagatt aatgcggctt gtagaaaggt tcaacacatg 18720 gttgttaaag ctgcattatt agcagacaaa ttcccagttc ttcacgacat tggtaaccct 18780 aaagctatta agtgtgtacc tcaagctgat gtagaatgga agttctatga tgcacagcct 18840 tgtagtgaca aagcttataa aatagaagaa ttattctatt cttatgccac acattctgac 18900 aaattcacag atggtgtatg cctattttgg aattgcaatg tcgatagata tcctgctaat 18960 tccattgttt gtagatttga cactagagtg ctatctaacc ttaacttgcc tggttgtgat 19020 ggtggcagtt tgtatgtaaa taaacatgca ttccacacac cagcttttga taaaagtgct 19080 tttgttaatt taaaacaatt accatttttc tattactctg acagtccatg tgagtctcat 19140 ggaaaacaag tagtgtcaga tatagattat gtaccactaa agtctgctac gtgtataaca 19200 cgttgcaatt taggtggtgc tgtctgtaga catcatgcta atgagtacag attgtatctc 19260 gatgcttata acatgatgat ctcagctggc tttagcttgt gggtttacaa acaatttgat 19320 acttataacc tctggaacac ttttacaaga cttcagagtt tagaaaatgt ggcttttaat 19380 gttgtaaata agggacactt tgatggacaa cagggtgaag taccagtttc tatcattaat 19440 aacactgttt acacaaaagt tgatggtgtt gatgtagaat tgtttgaaaa taaaacaaca 19500 ttacctgtta atgtagcatt tgagctttgg gctaagcgca acattaaacc agtaccagag 19560 gtgaaaatac tcaataattt gggtgtggac attgctgcta atactgtgat ctgggactac 19620 aaaagagatg ctccagcaca tatatctact attggtgttt gttctatgac tgacatagcc 19680 aagaaaccaa ctgaaacgat ttgtgcacca ctcactgtct tttttgatgg tagagttgat 19740 ggtcaagtag acttatttag aaatgcccgt aatggtgttc ttattacaga aggtagtgtt 19800 aaaggtttac aaccatctgt aggtcccaaa caagctagtc ttaatggagt cacattaatt 19860 ggagaagccg taaaaacaca gttcaattat tataagaaag ttgatggtgt tgtccaacaa 19920 ttacctgaaa cttactttac tcagagtaga aatttacaag aatttaaacc caggagtcaa 19980 atggaaattg atttcttaga attagctatg gatgaattca ttgaacggta taaattagaa 20040 ggctatgcct tcgaacatat cgtttatgga gattttagtc atagtcagtt aggtggttta 20100 catctactga ttggactagc taaacgtttt aaggaatcac cttttgaatt agaagatttt 20160 attcctatgg acagtacagt taaaaactat ttcataacag atgcgcaaac aggttcatct 20220 aagtgtgtgt gttctgttat tgatttatta cttgatgatt ttgttgaaat aataaaatcc 20280 caagatttat ctgtagtttc taaggttgtc aaagtgacta ttgactatac agaaatttca 20340 tttatgcttt ggtgtaaaga tggccatgta gaaacatttt acccaaaatt acaatctagt 20400 caagcgtggc aaccgggtgt tgctatgcct aatctttaca aaatgcaaag aatgctatta 20460 gaaaagtgtg accttcaaaa ttatggtgat agtgcaacat tacctaaagg cataatgatg 20520 aatgtcgcaa aatatactca actgtgtcaa tatttaaaca cattaacatt agctgtaccc 20580 tataatatga gagttataca ttttggtgct ggttctgata aaggagttgc accaggtaca 20640 gctgttttaa gacagtggtt gcctacgggt acgctgcttg tcgattcaga tcttaatgac 20700 tttgtctctg atgcagattc aactttgatt ggtgattgtg caactgtaca tacagctaat 20760 aaatgggatc tcattattag tgatatgtac gaccctaaga ctaaaaatgt tacaaaagaa 20820 aatgactcta aagagggttt tttcacttac atttgtgggt ttatacaaca aaagctagct 20880 cttggaggtt ccgtggctat aaagannnnn nnnnnttctt ggaatgctga tctttatann 20940 ctcatgggac annnnnnnnn nnnnnnnncn nnnntnnnnn nnnnnaatgc gtcatcatct 21000 gaagnnnnnn nnnnnnnntg tnnnnnnnnn ggcaaaccac gcgaacaaat annnnnnnat 21060 gnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnacaaatc caattcagtt gtcttcctat 21120 tctttatttg acatgagtaa atttcccctt aaattaaggg gtactgttgt tatgtcttta 21180 aaagaaggtc aaatcaatga tatgatttta tctcttctta gtaaaggtag acttataatt 21240 agagaaaaca acagagttgt tatttctagt gatgttcttg ttaacaacta a 21291 <210> 337 <211> 13218 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 337 atggagagcc ttgtccctgg tttcaacgag aaaacacacg tccaactcag tttgcctgtt 60 ttacaggttc gcgacgtgct cgtacgtggc tttggagact ccgtggagga ggtcttatca 120 gaggcacgtc aacatcttaa agatggcact tgtggcttag tagaagttga aaaaggcgtt 180 ttgcctcaac ttgaacagcc ctatgtgttc atcaaacgtt cggatgctcg aactgcacct 240 catggtcatg ttatggttga gctggtagca gaactcgaag gcattcagta cggtcgtagt 300 ggtgagacac ttggtgtcct tgtccctcat gtgggcgaaa taccagtggc ttaccgcaag 360 gttcttcttc gtaagaacgg taataaagga gctggtggcc atagttacgg cgccgatcta 420 aagtcatttg acttaggcga cgagcttggc actgatcctt atgaagattt tcaagaaaac 480 tggaacacta aacatagcag tggtgttacc cgtgaactca tgcgtgagct taacggaggg 540 gcatacactc gctatgtcga taacaacttc tgtggccctg atggctaccc tcttgagtgc 600 attaaagacc ttctagcacg tgctggtaaa gcttcatgca ctttgtccga acaactggac 660 tttattgaca ctaagagggg tgtatactgc tgccgtgaac atgagcatga aattgcttgg 720 tacacggaac gttctgaaaa gagctatgaa ttgcagacac cttttgaaat taaattggca 780 aagaaatttg acatcttcaa tggggaatgt ccaaattttg tatttccctt aaattccata 840 atcaagacta ttcaaccaag ggttgaaaag aaaaagcttg atggctttat gggtagaatt 900 cgatccgtct atccagttgc gtcaccaaat gaatgcaacc aaatgtgcct ttcaactctc 960 atgaagtgtg atcattgtgg tgaaacttca tggcagacgg gcgattttgt taaagccact 1020 tgcgaatttt gtggcactga gaatttgact aaagaaggtg ccactacttg tggttactta 1080 acccaaaatg ctgttgttaa aatttattgt ccagcatgtc acaattcaga agtaggacct 1140 gagcatagtc ttgccgaata ccataatgaa tctggcttga aaaccattct tcgtaagggt 1200 ggtcgcacta ttgcctttgg aggctgtgtg ttctcttatg ttggttgcca taacaagtgt 1260 gcctattggg ttccacgtgc tagcgctaac ataggttgta accatacagg tgttgttgga 1320 gaaggttccg aaggtcttaa tgacaacctt cttgaaatac tccaaaaaga gaaagtcaac 1380 atcaatattg ttggtgactt taaacttaat gaagagatcg ccattatttt ggcatctttt 1440 tctgcttcca caagtgcttt tgtggaaact gtgaaaggtt tggattataa agcattcaaa 1500 caaattgttg aatcctgtgg taattttaaa gttacaaaag gaaaagctaa aaaaggtgcc 1560 tggaatattg gtgaacagaa atcaatactg agtcctcttt atgcatttgc atcagaggct 1620 gctcgtgttg tacgatcaat tttctcccgc actcttgaaa ctgctcaaaa ttctgtgcgt 1680 gttttacaga aggccgctat aacaatacta gatggaattt cacagtattc actgagactc 1740 attgatgcta tgatgttcac atctgatttg gctactaaca atctagttgt aatggcctac 1800 attacaggtg gtgttgttca gttgacttcg cagtggctaa ctaacatctt tggcactgtt 1860 tatgaaaaac tcaaacccgt ccttgattgg cttgaagaga agtttaagga aggtgtagag 1920 tttcttagag acggttggga aattgttaaa tttatctcaa cctgtgcttg tgaaattgtc 1980 ggtggacaaa ttgtcacctg tgcaaaggaa attaaggaga gtgttcagac attctttaag 2040 cttgtaaata aatttttggc tttgtgtgct gactctatca ttattggtgg agctaaactt 2100 aaagccttga atttaggtga aacatttgtc acgcactcaa agggattgta cagaaagtgt 2160 gttaaatcca gagaagaaac tggcctactc atgcctctaa aagccccaaa agaaattatc 2220 ttcttagagg gagaaacact tcccacagaa gtgttaacag aggaagttgt cttgaaaact 2280 ggtgatttac aaccattaga acaacctact agtgaagctg ttgaagctcc attggttggt 2340 acaccagttt gtattaacgg gcttatgttg ctcgaaatca aagacacaga aaagtactgt 2400 gcccttgcac ctaatatgat ggtaacaaac aataccttca cactcaaagg cggtgcacca 2460 acaaaggtta cttttggtga tgacactgtg atagaagtgc aaggttacaa gagtgtgaat 2520 atcacttttg aacttgatga aaggattgat aaagtactta atgagaagtg ctctgcctat 2580 acagttgaac tcggtacaga agtaaatgag ttcgcctgtg ttgtggcaga tgctgtcata 2640 aaaactttgc aaccagtatc tgaattactt acaccactgg gcattgattt agatgagtgg 2700 agtatggcta catactactt atttgatgag tctggtgagt ttaaattggc ttcacatatg 2760 tattgttctt tttaccctcc agatgaggat gaagaagaag gtgattgtga agaagaagag 2820 tttgagccat caactcaata tgagtatggt actgaagatg attaccaagg taaacctttg 2880 gaatttggtg ccacttctgc tgctcttcaa cctgaagaag agcaagaaga agattggtta 2940 gatgatgata gtcaacaaac tgttggtcaa caagacggca gtgaggacaa tcagacaact 3000 actattcaaa caattgttga ggttcaacct caattagaga tggaacttac accagttgtt 3060 cagactattg aagtgaatag ttttagtggt tatttaaaac ttactgacaa tgtatacatt 3120 aaaaatgcag acattgtgga agaagctaaa aaggtaaaac caacagtggt tgttaatgca 3180 gccaatgttt accttaaaca tggaggaggt gttgcaggag ccttaaataa ggctactaac 3240 aatgccatgc aagttgaatc tgatgattac atagctacta atggaccact taaagtgggt 3300 ggtagttgtg ttttaagcgg acacaatctt gctaaacact gtcttcatgt tgtcggccca 3360 aatgttaaca aaggtgaaga cattcaactt cttaagagtg cttatgaaaa ttttaatcag 3420 cacgaagttc tacttgcacc attattatca gctggtattt ttggtgctga ccctatacat 3480 tctttaagag tttgtgtaga tactgttcgc acaaatgtct acttagctgt ctttgataaa 3540 aatctctatg acaaacttgt ttcaagcttt ttggaaatga agagtgaaaa gcaagttgaa 3600 caaaagatcg ctgagattcc taaagaggaa gttaagccat ttataactga aagtaaacct 3660 tcagttgaac agagaaaaca agatgataag aaaatcaaag cttgtgttga agaagttaca 3720 acaactctgg aagaaactaa gttcctcaca gaaaacttgt tactttatat tgacattaat 3780 ggcaatcttc atccagattc tgccactctt gttagtgaca ttgacatcac tttcttaaag 3840 aaagatgctc catatatagt gggtgatgtt gttcaagagg gtgttttaac tgctgtggtt 3900 atacctacta aaaaggctgg tggcactact gaaatgctag cgaaagcttt gagaaaagtg 3960 ccaacagaca attatataac cacttacccg ggtcagggtt taaatggtta cactgtagag 4020 gaggcaaaga cagtgcttaa aaagtgtaaa agtgcctttt acattctacc atctattatc 4080 tctaatgaga agcaagaaat tcttggaact gtttcttgga atttgcgaga aatgcttgca 4140 catgcagaag aaacacgcaa attaatgcct gtctgtgtgg aaactaaagc catagtttca 4200 actatacagc gtaaatataa gggtattaaa atacaagagg gtgtggttga ttatggtgct 4260 agattttact tttacaccag taaaacaact gtagcgtcac ttatcaacac acttaacgat 4320 ctaaatgaaa ctcttgttac aatgccactt ggctatgtaa cacatggctt aaatttggaa 4380 gaagctgctc ggtatatgag atctctcaaa gtgccagcta cagtttctgt ttcttcacct 4440 gatgctgtta cagcgtataa tggttatctt acttcttctt ctaaaacacc tgaagaacat 4500 tttattgaaa ccatctcact tgctggttcc tataaagatt ggtcctattc tggacaatct 4560 acacaactag gtatagaatt tcttaagaga ggtgataaaa gtgtatatta cactagtaat 4620 cctaccacat tccacctaga tggtgaagtt atcacctttg acaatcttaa gacacttctt 4680 tctttgagag aagtgaggac tattaaggtg tttacaacag tagacaacat taacctccac 4740 acgcaagttg tggacatgtc aatgacatat ggacaacagt ttggtccaac ttatttggat 4800 ggagctgatg ttactaaaat aaaacctcat aattcacatg aaggtaaaac attttatgtt 4860 ttacctaatg atgacactct acgtgttgag gcttttgagt actaccacac aactgatcct 4920 agttttctgg gtaggtacat gtcagcatta aatcacacta aaaagtggaa atacccacaa 4980 gttaatggtt taacttctat taaatgggca gataacaact gttatcttgc cactgcattg 5040 ttaacactcc aacaaataga gttgaagttt aatccacctg ctctacaaga tgcttattac 5100 agagcaaggg ctggtgaagc tgctaacttt tgtgcactta tcttagccta ctgtaataag 5160 acagtaggtg agttaggtga tgttagagaa acaatgagtt acttgtttca acatgccaat 5220 ttagattctt gcaaaagagt cttgaacgtg gtgtgtaaaa cttgtggaca acagcagaca 5280 acccttaagg gtgtagaagc tgttatgtac atgggcacac tttcttatga acaatttaag 5340 aaaggtgttc agataccttg tacgtgtggt aaacaagcta caaaatatct agtacaacag 5400 gagtcacctt ttgttatgat gtcagcacca cctgctcagt atgaacttaa gcatggtaca 5460 tttacttgtg ctagtgagta cgctggtaat taccagtgtg gtcactataa acatataact 5520 tctaaagaaa ctttgtattg catagacggt gctttactta caaagtcctc agaatacaaa 5580 ggtcctatta cggatgtttt ctacaaagaa aacagttaca caacaaccat aaaaccagtt 5640 acttataaat tggatggtgt tgtttgtaca gaaattgacc ctaagttgga caattattat 5700 aagaaagaca attcttattt cacagagcaa ccaattgatc ttgtaccaaa ccaaccatat 5760 ccaaacgcaa gcttcgataa ttttaagttt gtatgtgata atatcaaatt tgctgatgat 5820 ttaaaccagt taactggtta taagaaacct gcttcaagag agcttaaagt tacatttttc 5880 cctgacttaa atggtgatgt ggtggctatt gattataaac actacacacc ctcttttaag 5940 aaaggagcta aattgttaca taaacctatt gtttggcatg ttaacaatgc aactaataaa 6000 gccacgtata aaccaaatac ctggtgtata cgttgtcttt ggagcacaaa accagttgaa 6060 acatcaaatt cgtttgatgt actgaagtca gaggacgcgc agggaatgga taatcttgcc 6120 tgcgaagatc taaaaccagt ctctgaagaa gtagtggaaa atcctaccat acagaaagac 6180 gttcttgagt gtaatgtgaa aactaccgaa gttgtaggag acattatact taaaccagca 6240 aataatagtt taaaaattac agaagaggtt ggccacacag atctaatggc tgcttatgta 6300 gacaattcta gtcttactat taagaaacct aatgaattat ctagagtatt aggtttgaaa 6360 acccttgcta ctcatggttt agctgctgtt aatagtgtcc cttgggatac tatagctaat 6420 tatgctaagc cttttcttaa caaagttgtt agtacaacta ctaacatagt tacacggtgt 6480 ttaaaccgtg tttgtactaa ttatatgcct tatttcttta ctttattgct acaattgtgt 6540 acttttacta gaagtacaaa ttctagaatt aaagcatcta tgccgactac tatagcaaag 6600 aatactgtta agagtgtcgg taaattttgt ctagaggctt catttaatta tttgaagtca 6660 cctaattttt ctaaactgat aaatattata atttggtttt tactattaag tgtttgccta 6720 ggttctttaa tctactcaac cgctgcttta ggtgttttaa tgtctaattt aggcatgcct 6780 tcttactgta ctggttacag agaaggctat ttgaactcta ctaatgtcac tattgcaacc 6840 tactgtactg gttctatacc ttgtagtgtt tgtcttagtg gtttagattc tttagacacc 6900 tatccttctt tagaaactat acaaattacc atttcatctt ttaaatggga tttaactgct 6960 tttggcttag ttgcagagtg gtttttggca tatattcttt tcactaggtt tttctatgta 7020 cttggattgg ctgcaatcat gcaattgttt ttcagctatt ttgcagtaca ttttattagt 7080 aattcttggc ttatgtggtt aataattaat cttgtacaaa tggccccgat ttcagctatg 7140 gttagaatgt acatcttctt tgcatcattt tattatgtat ggaaaagtta tgtgcatgtt 7200 gtagacggtt gtaattcatc aacttgtatg atgtgttaca aacgtaatag agcaacaaga 7260 gtcgaatgta caactattgt taatggtgtt agaaggtcct tttatgtcta tgctaatgga 7320 ggtaaaggct tttgcaaact acacaattgg aattgtgtta attgtgatac attctgtgct 7380 ggtagtacat ttattagtga tgaagttgcg agagacttgt cactacagtt taaaagacca 7440 ataaatccta ctgaccagtc ttcttacatc gttgatagtg ttacagtgaa gaatggttcc 7500 atccatcttt actttgataa agctggtcaa aagacttatg aaagacattc tctctctcat 7560 tttgttaact tagacaacct gagagctaat aacactaaag gttcattgcc tattaatgtt 7620 atagtttttg atggtaaatc aaaatgtgaa gaatcatctg caaaatcagc gtctgtttac 7680 tacagtcagc ttatgtgtca acctatactg ttactagatc aggcattagt gtctgatgtt 7740 ggtgatagtg cggaagttgc agttaaaatg tttgatgctt acgttaatac gttttcatca 7800 acttttaacg taccaatgga aaaactcaaa acactagttg caactgcaga agctgaactt 7860 gcaaagaatg tgtccttaga caatgtctta tctactttta tttcagcagc tcggcaaggg 7920 tttgttgatt cagatgtaga aactaaagat gttgttgaat gtcttaaatt gtcacatcaa 7980 tctgacatag aagttactgg cgatagttgt aataactata tgctcaccta taacaaagtt 8040 gaaaacatga caccccgtga ccttggtgct tgtattgact gtagtgcgcg tcatattaat 8100 gcgcaggtag caaaaagtca caacattgct ttgatatgga acgttaaaga tttcatgtca 8160 ttgtctgaac aactacgaaa acaaatacgt agtgctgcta aaaagaataa cttacctttt 8220 aagttgacat gtgcaactac tagacaagtt gttaatgttg taacaacaaa gatagcactt 8280 aagggtggta aaattgttaa taattggttg aagcagttaa ttaaagttac acttgtgttc 8340 ctttttgttg ctgctatttt ctatttaata acacctgttc atgtcatgtc taaacatact 8400 gacttttcaa gtgaaatcat aggatacaag gctattgatg gtggtgtcac tcgtgacata 8460 gcatctacag atacttgttt tgctaacaaa catgctgatt ttgacacatg gtttagccag 8520 cgtggtggta gttatactaa tgacaaagct tgcccattga ttgctgcagt cataacaaga 8580 gaagtgggtt ttgtcgtgcc tggtttgcct ggcacgatat tacgcacaac taatggtgac 8640 tttttgcatt tcttacctag agtttttagt gcagttggta acatctgtta cacaccatca 8700 aaacttatag agtacactga ctttgcaaca tcagcttgtg ttttggctgc tgaatgtaca 8760 atttttaaag atgcttctgg taagccagta ccatattgtt atgataccaa tgtactagaa 8820 ggttctgttg cttatgaaag tttacgccct gacacacgtt atgtgctcat ggatggctct 8880 attattcaat ttcctaacac ctaccttgaa ggttctgtta gagtggtaac aacttttgat 8940 tctgagtact gtaggcacgg cacttgtgaa agatcagaag ctggtgtttg tgtatctact 9000 agtggtagat gggtacttaa caatgattat tacagatctt taccaggagt tttctgtggt 9060 gtagatgctg taaatttact tactaatatg tttacaccac taattcaacc tattggtgct 9120 ttggacatat cagcatctat agtagctggt ggtattgtag ctatcgtagt aacatgcctt 9180 gcctactatt ttatgaggtt tagaagagct tttggtgaat acagtcatgt agttgccttt 9240 aatactttac tattccttat gtcattcact gtactctgtt taacaccagt ttactcattc 9300 ttacctggtg tttattctgt tatttacttg tacttgacat tttatcttac taatgatgtt 9360 tcttttttag cacatattca gtggatggtt atgttcacac ctttagtacc tttctggata 9420 acaattgctt atatcatttg tatttccaca aagcatttct attggttctt tagtaattac 9480 ctaaagagac gtgtagtctt taatggtgtt tcctttagta cttttgaaga agctgcgctg 9540 tgcacctttt tgttaaataa agaaatgtat ctaaagttgc gtagtgatgt gctattacct 9600 cttacgcaat ataatagata cttagctctt tataataagt acaagtattt tagtggagca 9660 atggatacaa ctagctacag agaagctgct tgttgtcatc tcgcaaaggc tctcaatgac 9720 ttcagtaact caggttctga tgttctttac caaccaccac aaacctctat cacctcagct 9780 gttttgcaga gtggttttag aaaaatggca ttcccatctg gtaaagttga gggttgtatg 9840 gtacaagtaa cttgtggtac aactacactt aacggtcttt ggcttgatga cgtagtttac 9900 tgtccaagac atgtgatctg cacctctgaa gacatgctta accctaatta tgaagattta 9960 ctcattcgta agtctaatca taatttcttg gtacaggctg gtaatgttca actcagggtt 10020 attggacatt ctatgcaaaa ttgtgtactt aagcttaagg ttgatacagc caatcctaag 10080 acacctaagt ataagtttgt tcgcattcaa ccaggacaga ctttttcagt gttagcttgt 10140 tacaatggtt caccatctgg tgtttaccaa tgtgctatga ggcccaattt cactattaag 10200 ggttcattcc ttaatggttc atgtggtagt gttggtttta acatagatta tgactgtgtc 10260 tctttttgtt acatgcacca tatggaatta ccaactggag ttcatgctgg cacagactta 10320 gaaggtaact tttatggacc ttttgttgac aggcaaacag cacaagcagc tggtacggac 10380 acaactatta cagttaatgt tttagcttgg ttgtacgctg ctgttataaa tggagacagg 10440 tggtttctca atcgatttac cacaactctt aatgacttta accttgtggc tatgaagtac 10500 aattatgaac ctctaacaca agatcatgtt gacatactag gacctctttc tgctcaaact 10560 ggaattgccg ttttagatat gtgtgcttca ttaaaagaat tactgcaaaa tggtatgaat 10620 ggacgtacca tattgggtag tgctttatta gaagatgaat ttacaccttt tgatgttgtt 10680 agacaatgct caggtgttac tttccaaagt gcagtgaaaa gaacaatcaa gggtacacac 10740 cactggttgt tactcacaat tttgacttca cttttagttt tagtccagag tactcaatgg 10800 tctttgttct tttttttgta tgaaaatgcc tttttacctt ttgctatggg tattattgct 10860 atgtctgctt ttgcaatgat gtttgtcaaa cataagcatg catttctctg tttgtttttg 10920 ttaccttctc ttgccactgt agcttatttt aatatggtct atatgcctgc tagttgggtg 10980 atgcgtatta tgacatggtt ggatatggtt gatactagtt tgtctggttt taagctaaaa 11040 gactgtgtta tgtatgcatc agctgtagtg ttactaatcc ttatgacagc aagaactgtg 11100 tatgatgatg gtgctaggag agtgtggaca cttatgaatg tcttgacact cgtttataaa 11160 gtttattatg gtaatgcttt agatcaagcc atttccatgt gggctcttat aatctctgtt 11220 acttctaact actcaggtgt agttacaact gtcatgtttt tggccagagg tattgttttt 11280 atgtgtgttg agtattgccc tattttcttc ataactggta atacacttca gtgtataatg 11340 ctagtttatt gtttcttagg ctatttttgt acttgttact ttggcctctt ttgtttactc 11400 aaccgctact ttagactgac tcttggtgtt tatgattact tagtttctac acaggagttt 11460 agatatatga attcacaggg actactccca cccaagaata gcatagatgc cttcaaactc 11520 aacattaaat tgttgggtgt tggtggcaaa ccttgtatca aagtagccac tgtacagtct 11580 aaaatgtcag atgtaaagtg cacatcagta gtcttactct cagttttgca acaactcaga 11640 gtagaatcat catctaaatt gtgggctcaa tgtgtccagt tacacaatga cattctctta 11700 gctaaagata ctactgaagc ctttgaaaaa atggtttcac tactttctgt tttgctttcc 11760 atgcagggtg ctgtagacat aaacaagctt tgtgaagaaa tgctggacaa cagggcaacc 11820 ttacaagcta tagcctcaga gtttagttcc cttccatcat atgcagcttt tgctactgct 11880 caagaagctt atgagcaggc tgttgctaat ggtgattctg aagttgttct taaaaagttg 11940 aagaagtctt tgaatgtggc taaatctgaa tttgaccgtg atgcagccat gcaacgtaag 12000 ttggaaaaga tggctgatca agctatgacc caaatgtata aacaggctag atctgaggac 12060 aagagggcaa aagttactag tgctatgcag acaatgcttt tcactatgct tagaaagttg 12120 gataatgatg cactcaacaa cattatcaac aatgcaagag atggttgtgt tcccttgaac 12180 ataatacctc ttacaacagc agccaaacta atggttgtca taccagacta taacacatat 12240 aaaaatacgt gtgatggtac aacatttact tatgcatcag cattgtggga aatccaacag 12300 gttgtagatg cagatagtaa aattgttcaa cttagtgaaa ttagtatgga caattcacct 12360 aatttagcat ggcctcttat tgtaacagct ttaagggcca attctgctgt caaattacag 12420 aataatgagc ttagtcctgt tgcactacga cagatgtctt gtgctgccgg tactacacaa 12480 actgcttgca ctgatgacaa tgcgttagct tactacaaca caacaaaggg aggtaggttt 12540 gtacttgcac tgttatccga tttacaggat ttgaaatggg ctagattccc taagagtgat 12600 ggaactggta ctatctatac agaactggaa ccaccttgta ggtttgttac agacacacct 12660 aaaggtccta aagtgaagta tttatacttt attaaaggat taaacaacct aaatagaggt 12720 atggtacttg gtagtttagc tgccacagta cgtctacaag ctggtaatgc aacagaagtg 12780 cctgccaatt caactgtatt atctttctgt gcttttgctg tagatgctgc taaagcttac 12840 aaagattatc tagctagtgg gggacaacca atcactaatt gtgttaagat gttgtgtaca 12900 cacactggta ctggtcaggc aataacagtt acaccggaag ccaatatgga tcaagaatcc 12960 tttggtggtg catcgtgttg tctgtactgc cgttgccaca tagatcatcc aaatcctaaa 13020 ggattttgtg acttaaaagg taagtatgta caaataccta caacttgtgt taatgaccct 13080 gtgggtttta cacttaaaaa cacagtctgt accgtctgcg gtatgtggaa aggttatggc 13140 tgtagttgtg atcaactccg cgaacccatg cttcagtcag ctgatgcaca atcgttttta 13200 aacgggtttg cggtgtaa 13218 <210> 338 <211> 3816 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 338 atgtttgttt ttcttgtttt attgccacta gtctctagtc agtgtgttaa tcttacaacc 60 agaactcaat taccccctgc atacactaat tctttcacac gtggtgttta ttaccctgac 120 aaagttttca gatcctcagt tttacattca actcaggact tgttcttacc tttcttttcc 180 aatgttactt ggttccatgc tatctctggg accaatggta ctaagaggtt tgataaccct 240 gtcctaccat ttaatgatgg tgtttatttt gcttccactg agaagtctaa cataataaga 300 ggctggattt ttggtactac tttagattcg aagacccagt ccctacttat tgttaataac 360 gctactaatg ttgttattaa agtctgtgaa tttcaatttt gtaatgatcc atttttgggt 420 gtttattacc acaaaaacaa caaaagttgg atggaaagtg agttcagagt ttattctagt 480 gcgaataatt gcacttttga atatgtctct cagccttttc ttatggacct tgaaggaaaa 540 cagggtaatt tcaaaaatct tagggaattt gtgtttaaga atattgatgg ttattttaaa 600 atatattcta agcacacgcc tattaattta gtgcgtgatc tccctcaggg tttttcggct 660 ttagaaccat tggtagattt gccaataggt attaacatca ctaggtttca aactttactt 720 gctttacata gaagttattt gactcctggt gattcttctt caggttggac agctggtgct 780 gcagcttatt atgtgggtta tcttcaacct aggacttttc tattaaaata taatgaaaat 840 ggaaccatta cagatgctgt agactgtgca cttgaccctc tctcagaaac aaagtgtacg 900 ttgaaatcct tcactgtaga aaaaggaatc tatcaaactt ctaactttag agtccaacca 960 acagaatcta ttgttagatt tcctaatatt acaaacttgt gcccttttgg tgaagttttt 1020 aacgccacca gatttgcatc tgtttatgct tggaacagga agagaatcag caactgtgtt 1080 gctgattatt ctgtcctata taattccgca tcattttcca cttttaagtg ttatggagtg 1140 tctcctacta aattaaatga tctctgcttt actaatgtct atgcagattc atttgtaatt 1200 agaggtgatg aagtcagaca aatcgctcca gggcaaactg gaaagattgc tgattataat 1260 tataaattac cagatgattt tacaggctgc gttatagctt ggaattctaa caatcttgat 1320 tctaaggttg gtggtaatta taattacctg tatagattgt ttaggaagtc taatctcaaa 1380 ccttttgaga gagatatttc aactgaaatc tatcaggccg gtagcacacc ttgtaatggt 1440 gttgaaggtt ttaattgtta ctttccttta caatcatatg gtttccaacc cactaatggt 1500 gttggttacc aaccatacag agtagtagta ctttcttttg aacttctaca tgcaccagca 1560 actgtttgtg gacctaaaaa gtctactaat ttggttaaaa acaaatgtgt caatttcaac 1620 ttcaatggtt taacaggcac aggtgttctt actgagtcta acaaaaagtt tctgcctttc 1680 caacaatttg gcagagacat tgctgacact actgatgctg tccgtgatcc acagacactt 1740 gagattcttg acattacacc atgttctttt ggtggtgtca gtgttataac accaggaaca 1800 aatacttcta accaggttgc tgttctttat cagggtgtta actgcacaga agtccctgtt 1860 gctattcatg cagatcaact tactcctact tggcgtgttt attctacagg ttctaatgtt 1920 tttcaaacac gtgcaggctg tttaataggg gctgaacatg tcaacaactc atatgagtgt 1980 gacataccca ttggtgcagg tatatgcgct agttatcaga ctcagactaa ttctcctcgg 2040 cgggcacgta gtgtagctag tcaatccatc attgcctaca ctatgtcact tggtgcagaa 2100 aattcagttg cttactctaa taactctatt gccataccca caaattttac tattagtgtt 2160 accacagaaa ttctaccagt gtctatgacc aagacatcag tagattgtac aatgtacatt 2220 tgtggtgatt caactgaatg cagcaatctt ttgttgcaat atggcagttt ttgtacacaa 2280 ttaaaccgtg ctttaactgg aatagctgtt gaacaagaca aaaacaccca agaagttttt 2340 gcacaagtca aacaaattta caaaacacca ccaattaaag attttggtgg ttttaatttt 2400 tcacaaatat taccagatcc atcaaaacca agcaagagat catttattga agatctactt 2460 ttcaacaaag tgacacttgc agatgctggc ttcatcaaac aatatggtga ttgccttggt 2520 gatattgctg ctagagacct catttgtgca caaaagttta acggccttac tgttttgcca 2580 cctttgctca cagatgaaat gattgctcaa tacacttctg cactgttagc gggtacaatc 2640 acttctggtt ggacctttgg tgcaggtgct gcattacaaa taccatttgc tatgcaaatg 2700 gcttataggt ttaatggtat tggagttaca cagaatgttc tctatgagaa ccaaaaattg 2760 attgccaacc aatttaatag tgctattggc aaaattcaag actcactttc ttccacagca 2820 agtgcacttg gaaaacttca agatgtggtc aaccaaaatg cacaagcttt aaacacgctt 2880 gttaaacaac ttagctccaa ttttggtgca atttcaagtg ttttaaatga tatcctttca 2940 cgtcttgaca aagttgaggc tgaagtgcaa attgataggt tgatcacagg cagacttcaa 3000 agtttgcaga catatgtgac tcaacaatta attagagctg cagaaatcag agcttctgct 3060 aatcttgctg ctactaaaat gtcagagtgt gtacttggac aatcaaaaag agttgatttt 3120 tgtggaaagg gctatcatct tatgtccttc cctcagtcag cacctcatgg tgtagtcttc 3180 ttgcatgtga cttatgtccc tgcacaagaa aagaacttca caactgctcc tgccatttgt 3240 catgatggaa aagcacactt tcctcgtgaa ggtgtctttg tttcaaatgg cacacactgg 3300 tttgtaacac aaaggaattt ttatgaacca caaatcatta ctacagacaa cacatttgtg 3360 tctggtaact gtgatgttgt aataggaatt gtcaacaaca cagtttatga tcctttgcaa 3420 cctgaattag actcattcaa ggaggagtta gataaatatt ttaagaatca tacatcacca 3480 gatgttgatt taggtgacat ctctggcatt aatgcttcag ttgtaaacat tcaaaaagaa 3540 attgaccgcc tcaatgaggt tgccaagaat ttaaatgaat ctctcatcga tctccaagaa 3600 cttggaaagt atgagcagta tataaaatgg ccatggtaca tttggctagg ttttatagct 3660 ggcttgattg ccatagtaat ggtgacaatt atgctttgct gtatgaccag ttgctgtagt 3720 tgtctcaagg gctgttgttc ttgtggatcc tgctgcaaat ttgatgaaga cgactctgag 3780 ccagtgctca aaggagtcaa attacattac acataa 3816 <210> 339 <211> 828 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 339 atggatttgt ttatgagaat cttcacaatt ggaactgtaa ctttgaagca aggtgaaatc 60 aaggatgcta ctccttcaga ttttgttcgc gctactgcaa cgataccgat acaagcctca 120 ctccctttcg gatggcttat tgttggcgtt gcacttcttg ctgtttttca tagcgcttcc 180 aaaatcataa ccctcaaaaa gagatggcaa ctagcactct ccaagggtgt tcactttgtt 240 tgcaacttgc tgttgttgtt tgtaacagtt tactcacacc ttttgctcgt tgctgctggc 300 cttgaagccc cttttctcta tctttatgct ttagtctact tcttgcagag tataaacttt 360 gtaagaataa taatgaggct ttggctttgc tggaaatgcc gttccaaaaa cccattactt 420 tatgatgcca actattttct ttgctggcat attaattgtt acgactattg tataccttac 480 aatagtgtaa cttcttcaat tgtcattact tcaggtgatg gcacaacaag tcctatttct 540 gaacatgact accagattgg tggttatact gaaaaatggg aatctggagt aaaagactgt 600 gttgtattac acagttactt cacttcagac tattaccagc tgtactcaac tcaattgagt 660 acagacactg gtgttgaaca tgttaccttc ttcatctaca ataaaattgt tgatgagcct 720 gaagaacatg tccaaattca cacaatcgac ggttcatccg gagttgttaa tccagtaatg 780 gaaccaattt atgatgaacc gacgacgact actagcgtgc ctttgtaa 828 <210> 340 <211> 228 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 340 atgtactcat tcgtttcgga agagacaggt acgttaatag ttaatagcgt acttcttttt 60 cttgctttcg tggtattctt gctagttaca ctagccatcc ttactgcgct tcgattgtgt 120 gcgtactgct gcaatattgt taacgtgagt cttgtaaaac cttcttttta cgtttactct 180 cgtgttaaaa atctgaattc ttctagagtt cctgatcttc tggtctaa 228 <210> 341 <211> 669 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 341 atggcagatt ccaacggtac tattaccgtt gaagagctta aaaagctcct tgaacaatgg 60 aacctagtaa taggtttcct attccttaca tggatttgtc ttctacaatt tgcctatgcc 120 aacaggaata ggtttttgta tgtaattaag ttaattttcc tctggctgtt atggccagta 180 actttagctt gttttgtgct tgctgctgtt tacagaataa attggatcac cggtggaatt 240 gctatcgcaa tggcttgtct tgtaggcttg atgtggctca gctacttcat tgcttctttc 300 agactgtttg cgcgtacgcg ttccatgtgg tcattcaatc cagaaactaa cattcttctc 360 aacgtgccac tccatggcac tattctgacc agaccgcttc tagaaagtga actcgtaatc 420 ggagctgtga tccttcgtgg acatcttcgt attgctggac accatctagg acgctgtgac 480 atcaaggacc tgcctaaaga aatcactgtt gctacatcac gaacgctttc ttattacaaa 540 ttgggagctt cgcagcgtgt agcaggtgac tcaggttttg ctgcatacag tcgctacagg 600 attggcaact ataaattaaa cacagaccat tccagtagca gtgacaatat tgctttgctt 660 gtacagtaa 669 <210> 342 <211> 186 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 342 atgtttcatc tcgttgactt tcaggttact atagcagaga tattactaat tattatgagg 60 acttttaaag tttccatttg gaatcttgat tacatcataa acctcataat taaaaattta 120 tctaagtcac taactgagaa taaatattct caattagatg aagagcaacc aatggagatt 180 gattaa 186 <210> 343 <211> 366 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 343 atgaaaatta ttcttttctt ggcactgata acactcgcta cttgtgagct ttatcactac 60 caagagtgtg ttagaggtac aacagtactt ttaaaagaac cttgctcttc tggaacatac 120 gagggcaatt caccatttca tcctctagct gataacaaat ttgcactgac ttgctttagc 180 actcaatttg cttttgcttg tcctgacggc gtaaaacacg tctatcagtt acgtgccaga 240 tcagtttcac ctaaactgtt catcagacaa gaggaagttc aagaacttta ctctccaatt 300 tttcttattg ttgcggcaat agtgtttata acactttgct tcacactcaa aagaaagaca 360 gaatga 366 <210> 344 <211> 132 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 344 atgattgaac tttcattaat tgacttctat ttgtgctttt tagcctttct gctattcctt 60 gttttaatta tgcttattat cttttggttc tcacttgaac tgcaagatca taatgaaact 120 tgtcacgcct aa 132 <210> 345 <211> 366 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 345 atgaaatttc ttgttttctt aggaatcatc acaactgtag ctgcatttca ccaagaatgt 60 agtttacagt catgtactca acatcaacca tatgtagttg atgacccgtg tcctattcac 120 ttctattcta aatggtatat tagagtagga gctagaaaat cagcaccttt aattgaattg 180 tgcgtggatg aggctggttc taaatcaccc attcagtaca tcgatatcgg taattataca 240 gtttcctgtt taccttttac aattaattgc caggaaccta aattgggtag tcttgtagtg 300 cgttgttcgt tctatgaaga ctttttagag tatcatgacg ttcgtgttgt tttagatttc 360 atctaa 366 <210> 346 <211> 1260 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 346 atgtctgata atggacccca aaatcagcga aatgcacccc gcattacgtt tggtggaccc 60 tcagattcaa ctggcagtaa ccagaatgga gaacgcagtg gggcgcgatc aaaacaacgt 120 cggccccaag gtttacccaa taatactgcg tcttggttca ccgctctcac tcaacatggc 180 aaggaagacc ttaaattccc tcgaggacaa ggcgttccaa ttaacaccaa tagcagtcca 240 gatgaccaaa ttggctacta ccgaagagct accagacgaa ttcgtggtgg tgacggtaaa 300 atgaaagatc tcagtccaag atggtatttc tactacctag gaactgggcc agaagctgga 360 cttccctatg gtgctaacaa agacggcatc atatgggttg caactgaggg agcctttaat 420 acaccaaaag atcacattgg cacccgcaat cctgctaaca atgctgcaat cgtgctacaa 480 cttcctcaag gaacaacatt gccaaaaggc ttctacgcag aagggagcag aggcggcagt 540 caagcctctt ctcgttcctc atcacgtagt cgcaacagtt caagaaattc aactccaggc 600 agcagtaggg gaatttctcc tgctagaatg gctggcaatg gcggtgatgc tgctcttgct 660 ttgctgctgc ttgacagatt gaaccagctt gagagcaaaa tgtctggtaa aggccaacaa 720 caacaaggcc aaactgtcac taagaaatct gctgctgagg cttctaagaa gcctcggcaa 780 aaacgtactg ccactaaagc atacaatgta acacaagctt tcggcagacg tggtccagaa 840 caaacccaag gaaattttgg ggaccaggaa ctaatcagac aaggaactga ttacaaacat 900 tggccgcaaa ttgcacaatt tgcccccagc gcttcagcgt tcttcggaat gtcgcgcatt 960 ggcatggaag tcacaccttc gggaacgtgg ttgacctaca caggtgccat caaattggat 1020 gacaaagatc caaatttcaa agatcaagtc attttgctga ataagcatat tgacgcatac 1080 aaaacattcc caccaacaga gcctaaaaag gacaaaaaga agaaggctga tgaaactcaa 1140 gccttaccgc agagacagaa gaaacagcaa actgtgactc ttcttcctgc tgcagatttg 1200 gatgatttct ccaaacaatt gcaacaatcc atgagcagtg ctgactcaac tcaggcctaa 1260 <210> 347 <211> 117 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 347 atgggctata taaacgtttt cgcttttccg tttacgatat atagtctact cttgtgcaga 60 atgaattctc gtaactacat agcacaagta gatgtagtta actttaatct cacatag 117 <210> 348 <400> 348 000 <210> 349 <400> 349 000 <210> 350 <400> 350 000 <210> 351 <400> 351 000 <210> 352 <400> 352 000 <210> 353 <400> 353 000 <210> 354 <400> 354 000 <210> 355 <400> 355 000 <210> 356 <400> 356 000 <210> 357 <400> 357 000 <210> 358 <400> 358 000 <210> 359 <400> 359 000 <210> 360 <400> 360 000 <210> 361 <400> 361 000 <210> 362 <400> 362 000 <210> 363 <400> 363 000 <210> 364 <400> 364 000 <210> 365 <400> 365 000 <210> 366 <400> 366 000 <210> 367 <400> 367 000 <210> 368 <400> 368 000 <210> 369 <400> 369 000 <210> 370 <400> 370 000 <210> 371 <400> 371 000 <210> 372 <400> 372 000 <210> 373 <400> 373 000 <210> 374 <400> 374 000 <210> 375 <400> 375 000 <210> 376 <400> 376 000 <210> 377 <400> 377 000 <210> 378 <400> 378 000 <210> 379 <400> 379 000 <210> 380 <400> 380 000 <210> 381 <400> 381 000 <210> 382 <400> 382 000 <210> 383 <400> 383 000 <210> 384 <400> 384 000 <210> 385 <400> 385 000 <210> 386 <400> 386 000 <210> 387 <400> 387 000 <210> 388 <400> 388 000 <210> 389 <400> 389 000 <210> 390 <400> 390 000 <210> 391 <400> 391 000 <210> 392 <400> 392 000 <210> 393 <400> 393 000 <210> 394 <400> 394 000 <210> 395 <400> 395 000 <210> 396 <400> 396 000 <210> 397 <400> 397 000 <210> 398 <400> 398 000 <210> 399 <400> 399 000 <210> 400 <400> 400 000 <210> 401 <211> 7093 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 401 Met Glu Ser Leu Val Pro Gly Phe Asn Glu Lys Thr His Val Gln Leu 1 5 10 15 Ser Leu Pro Val Leu Gln Val Arg Asp Val Leu Val Arg Gly Phe Gly 20 25 30 Asp Ser Val Glu Glu Val Leu Ser Glu Ala Arg Gln His Leu Lys Asp 35 40 45 Gly Thr Cys Gly Leu Val Glu Val Glu Lys Gly Val Leu Pro Gln Leu 50 55 60 Glu Gln Pro Tyr Val Phe Ile Lys Arg Ser Asp Ala Arg Thr Ala Pro 65 70 75 80 His Gly His Val Met Val Glu Leu Val Ala Glu Leu Glu Gly Ile Gln 85 90 95 Tyr Gly Arg Ser Gly Glu Thr Leu Gly Val Leu Val Pro His Val Gly 100 105 110 Glu Ile Pro Val Ala Tyr Arg Lys Val Leu Leu Arg Lys Asn Gly Asn 115 120 125 Lys Gly Ala Gly Gly His Ser Tyr Gly Ala Asp Leu Lys Ser Phe Asp 130 135 140 Leu Gly Asp Glu Leu Gly Thr Asp Pro Tyr Glu Asp Phe Gln Glu Asn 145 150 155 160 Trp Asn Thr Lys His Ser Ser Gly Val Thr Arg Glu Leu Met Arg Glu 165 170 175 Leu Asn Gly Gly Ala Tyr Thr Arg Tyr Val Asp Asn Asn Phe Cys Gly 180 185 190 Pro Asp Gly Tyr Pro Leu Glu Cys Ile Lys Asp Leu Leu Ala Arg Ala 195 200 205 Gly Lys Ala Ser Cys Thr Leu Ser Glu Gln Leu Asp Phe Ile Asp Thr 210 215 220 Lys Arg Gly Val Tyr Cys Cys Arg Glu His Glu His Glu Ile Ala Trp 225 230 235 240 Tyr Thr Glu Arg Ser Glu Lys Ser Tyr Glu Leu Gln Thr Pro Phe Glu 245 250 255 Ile Lys Leu Ala Lys Lys Phe Asp Thr Phe Asn Gly Glu Cys Pro Asn 260 265 270 Phe Val Phe Pro Leu Asn Ser Ile Ile Lys Thr Ile Gln Pro Arg Val 275 280 285 Glu Lys Lys Lys Leu Asp Gly Phe Met Gly Arg Ile Arg Ser Val Tyr 290 295 300 Pro Val Ala Ser Pro Asn Glu Cys Asn Gln Met Cys Leu Ser Thr Leu 305 310 315 320 Met Lys Cys Asp His Cys Gly Glu Thr Ser Trp Gln Thr Gly Asp Phe 325 330 335 Val Lys Ala Thr Cys Glu Phe Cys Gly Thr Glu Asn Leu Thr Lys Glu 340 345 350 Gly Ala Thr Thr Cys Gly Tyr Leu Pro Gln Asn Ala Val Val Lys Ile 355 360 365 Tyr Cys Pro Ala Cys His Asn Ser Glu Val Gly Pro Glu His Ser Leu 370 375 380 Ala Glu Tyr His Asn Glu Ser Gly Leu Lys Thr Ile Leu Arg Lys Gly 385 390 395 400 Gly Arg Thr Ile Ala Phe Gly Gly Cys Val Phe Ser Tyr Val Gly Cys 405 410 415 His Asn Lys Cys Ala Tyr Trp Val Pro Arg Ala Ser Ala Asn Ile Gly 420 425 430 Cys Asn His Thr Gly Val Val Gly Glu Gly Ser Glu Gly Leu Asn Asp 435 440 445 Asn Leu Leu Glu Ile Leu Gln Lys Glu Lys Val Asn Ile Asn Ile Val 450 455 460 Gly Asp Phe Lys Leu Asn Glu Glu Ile Ala Ile Ile Leu Ala Ser Phe 465 470 475 480 Ser Ala Ser Thr Ser Ala Phe Val Glu Thr Val Lys Gly Leu Asp Tyr 485 490 495 Lys Ala Phe Lys Gln Ile Val Glu Ser Cys Gly Asn Phe Lys Val Thr 500 505 510 Lys Gly Lys Ala Lys Lys Gly Ala Trp Asn Ile Gly Glu Gln Lys Ser 515 520 525 Ile Leu Ser Pro Leu Tyr Ala Phe Ala Ser Glu Ala Ala Arg Val Val 530 535 540 Arg Ser Ile Phe Ser Arg Thr Leu Glu Thr Ala Gln Asn Ser Val Arg 545 550 555 560 Val Leu Gln Lys Ala Ala Ile Thr Ile Leu Asp Gly Ile Ser Gln Tyr 565 570 575 Ser Leu Arg Leu Ile Asp Ala Met Met Phe Thr Ser Asp Leu Ala Thr 580 585 590 Asn Asn Leu Val Val Met Ala Tyr Ile Thr Gly Gly Val Val Gln Leu 595 600 605 Thr Ser Gln Trp Leu Thr Asn Ile Phe Gly Thr Val Tyr Glu Lys Leu 610 615 620 Lys Pro Val Leu Asp Trp Leu Glu Glu Lys Phe Lys Glu Gly Val Glu 625 630 635 640 Phe Leu Arg Asp Gly Trp Glu Ile Val Lys Phe Ile Ser Thr Cys Ala 645 650 655 Cys Glu Ile Val Gly Gly Gln Ile Val Thr Cys Ala Lys Glu Ile Lys 660 665 670 Glu Ser Val Gln Thr Phe Phe Lys Leu Val Asn Lys Phe Leu Ala Leu 675 680 685 Cys Ala Asp Ser Ile Ile Ile Gly Gly Ala Lys Leu Lys Ala Leu Asn 690 695 700 Leu Gly Glu Thr Phe Val Thr His Ser Lys Gly Leu Tyr Arg Lys Cys 705 710 715 720 Val Lys Ser Arg Glu Glu Thr Gly Leu Leu Met Pro Leu Lys Ala Pro 725 730 735 Lys Glu Ile Ile Phe Leu Glu Gly Glu Thr Leu Pro Thr Glu Val Leu 740 745 750 Thr Glu Glu Val Val Leu Lys Thr Gly Asp Leu Gln Pro Leu Glu Gln 755 760 765 Pro Thr Ser Glu Ala Val Glu Ala Pro Leu Val Gly Thr Pro Val Cys 770 775 780 Ile Asn Gly Leu Met Leu Leu Glu Ile Lys Asp Thr Glu Lys Tyr Cys 785 790 795 800 Ala Leu Ala Pro Asn Met Met Val Thr Asn Asn Thr Phe Thr Leu Lys 805 810 815 Gly Gly Ala Pro Thr Lys Val Thr Phe Gly Asp Asp Thr Val Ile Glu 820 825 830 Val Gln Gly Tyr Lys Ser Val Asn Ile Thr Phe Glu Leu Asp Glu Arg 835 840 845 Ile Asp Lys Val Leu Asn Glu Lys Cys Ser Ala Tyr Thr Val Glu Leu 850 855 860 Gly Thr Glu Val Asn Glu Phe Ala Cys Val Val Ala Asp Ala Val Ile 865 870 875 880 Lys Thr Leu Gln Pro Val Ser Glu Leu Leu Thr Pro Leu Gly Ile Asp 885 890 895 Leu Asp Glu Trp Ser Met Ala Thr Tyr Tyr Leu Phe Asp Glu Ser Gly 900 905 910 Glu Phe Lys Leu Ala Ser His Met Tyr Cys Ser Phe Tyr Pro Pro Asp 915 920 925 Glu Asp Glu Glu Glu Gly Asp Cys Glu Glu Glu Glu Phe Glu Pro Ser 930 935 940 Thr Gln Tyr Glu Tyr Gly Thr Glu Asp Asp Tyr Gln Gly Lys Pro Leu 945 950 955 960 Glu Phe Gly Ala Thr Ser Ala Ala Leu Gln Pro Glu Glu Glu Gln Glu 965 970 975 Glu Asp Trp Leu Asp Asp Asp Ser Gln Gln Thr Val Gly Gln Gln Asp 980 985 990 Gly Ser Glu Asp Asn Gln Thr Thr Ile Ile Gln Thr Ile Val Glu Val 995 1000 1005 Gln Pro Gln Leu Glu Met Glu Leu Thr Pro Val Val Gln Thr Ile 1010 1015 1020 Glu Val Asn Ser Phe Ser Gly Tyr Leu Lys Leu Thr Asp Asn Val 1025 1030 1035 Tyr Ile Lys Asn Ala Asp Ile Val Glu Glu Ala Lys Lys Val Lys 1040 1045 1050 Pro Thr Val Val Val Asn Ala Ala Asn Val Tyr Leu Lys His Gly 1055 1060 1065 Gly Gly Val Ala Gly Ala Leu Asn Lys Ala Thr Asn Asn Ala Met 1070 1075 1080 Gln Val Glu Ser Asp Asp Tyr Ile Ala Thr Asn Gly Pro Leu Lys 1085 1090 1095 Val Gly Gly Ser Cys Val Leu Ser Gly His Asn Leu Ala Lys His 1100 1105 1110 Cys Leu His Val Val Gly Pro Asn Val Asn Lys Gly Glu Asp Ile 1115 1120 1125 Gln Leu Leu Lys Ser Ala Tyr Glu Asn Phe Asn Gln His Glu Val 1130 1135 1140 Leu Leu Ala Pro Leu Leu Ser Ala Gly Ile Phe Gly Ala Asp Pro 1145 1150 1155 Ile His Ser Leu Arg Val Cys Val Asp Thr Val Arg Thr Asn Val 1160 1165 1170 Tyr Leu Ala Val Phe Asp Lys Asn Leu Tyr Asp Lys Leu Val Ser 1175 1180 1185 Ser Phe Leu Glu Met Lys Ser Glu Lys Gln Val Glu Gln Lys Ile 1190 1195 1200 Ala Glu Ile Pro Lys Glu Glu Val Lys Pro Phe Ile Thr Glu Ser 1205 1210 1215 Lys Pro Ser Val Glu Gln Arg Lys Gln Asp Asp Lys Lys Ile Lys 1220 1225 1230 Ala Cys Val Glu Glu Val Thr Thr Thr Leu Glu Glu Thr Lys Phe 1235 1240 1245 Leu Thr Glu Asn Leu Leu Leu Tyr Ile Asp Ile Asn Gly Asn Leu 1250 1255 1260 His Pro Asp Ser Ala Thr Leu Val Ser Asp Ile Asp Ile Thr Phe 1265 1270 1275 Leu Lys Lys Asp Ala Pro Tyr Ile Val Gly Asp Val Val Gln Glu 1280 1285 1290 Gly Val Leu Thr Ala Val Val Ile Pro Thr Lys Lys Ala Gly Gly 1295 1300 1305 Thr Thr Glu Met Leu Ala Lys Ala Leu Arg Lys Val Pro Thr Asp 1310 1315 1320 Asn Tyr Ile Thr Thr Tyr Pro Gly Gln Gly Leu Asn Gly Tyr Thr 1325 1330 1335 Val Glu Glu Ala Lys Thr Val Leu Lys Lys Cys Lys Ser Ala Phe 1340 1345 1350 Tyr Ile Leu Pro Ser Ile Ile Ser Asn Glu Lys Gln Glu Ile Leu 1355 1360 1365 Gly Thr Val Ser Trp Asn Leu Arg Glu Met Leu Ala His Ala Glu 1370 1375 1380 Glu Thr Arg Lys Leu Met Pro Val Cys Val Glu Thr Lys Ala Ile 1385 1390 1395 Val Ser Thr Ile Gln Arg Lys Tyr Lys Gly Ile Lys Ile Gln Glu 1400 1405 1410 Gly Val Val Asp Tyr Gly Ala Arg Phe Tyr Phe Tyr Thr Ser Lys 1415 1420 1425 Thr Thr Val Ala Ser Leu Ile Asn Thr Leu Asn Asp Leu Asn Glu 1430 1435 1440 Thr Leu Val Thr Met Pro Leu Gly Tyr Val Thr His Gly Leu Asn 1445 1450 1455 Leu Glu Glu Ala Ala Arg Tyr Met Arg Ser Leu Lys Val Pro Ala 1460 1465 1470 Thr Val Ser Val Ser Ser Pro Asp Ala Val Thr Ala Tyr Asn Gly 1475 1480 1485 Tyr Leu Thr Ser Ser Ser Lys Thr Pro Glu Glu His Phe Ile Glu 1490 1495 1500 Thr Ile Ser Leu Ala Gly Ser Tyr Lys Asp Trp Ser Tyr Ser Gly 1505 1510 1515 Gln Ser Thr Gln Leu Gly Ile Glu Phe Leu Lys Arg Gly Asp Lys 1520 1525 1530 Ser Val Tyr Tyr Thr Ser Asn Pro Thr Thr Phe His Leu Asp Gly 1535 1540 1545 Glu Val Ile Thr Phe Asp Asn Leu Lys Thr Leu Leu Ser Leu Arg 1550 1555 1560 Glu Val Arg Thr Ile Lys Val Phe Thr Thr Val Asp Asn Ile Asn 1565 1570 1575 Leu His Thr Gln Val Val Asp Met Ser Met Thr Tyr Gly Gln Gln 1580 1585 1590 Phe Gly Pro Thr Tyr Leu Asp Gly Ala Asp Val Thr Lys Ile Lys 1595 1600 1605 Pro His Asn Ser His Glu Gly Lys Thr Phe Tyr Val Leu Pro Asn 1610 1615 1620 Asp Asp Thr Leu Arg Val Glu Ala Phe Glu Tyr Tyr His Thr Thr 1625 1630 1635 Asp Pro Ser Phe Leu Gly Arg Tyr Met Ser Ala Leu Asn His Thr 1640 1645 1650 Lys Lys Trp Lys Tyr Pro Gln Val Asn Gly Leu Thr Ser Ile Lys 1655 1660 1665 Trp Ala Asp Asn Asn Cys Tyr Leu Ala Thr Ala Leu Leu Thr Leu 1670 1675 1680 Gln Gln Ile Glu Leu Lys Phe Asn Pro Pro Ala Leu Gln Asp Ala 1685 1690 1695 Tyr Tyr Arg Ala Arg Ala Gly Glu Ala Asp Asn Phe Cys Ala Leu 1700 1705 1710 Ile Leu Ala Tyr Cys Asn Lys Thr Val Gly Glu Leu Gly Asp Val 1715 1720 1725 Arg Glu Thr Met Ser Tyr Leu Phe Gln His Ala Asn Leu Asp Ser 1730 1735 1740 Cys Lys Arg Val Leu Asn Val Val Cys Lys Thr Cys Gly Gln Gln 1745 1750 1755 Gln Thr Thr Leu Lys Gly Val Glu Ala Val Met Tyr Met Gly Thr 1760 1765 1770 Leu Ser Tyr Glu Gln Phe Lys Lys Gly Val Gln Ile Pro Cys Thr 1775 1780 1785 Cys Gly Lys Gln Ala Thr Lys Tyr Leu Val Gln Gln Glu Ser Pro 1790 1795 1800 Phe Val Met Met Ser Ala Pro Pro Ala Gln Tyr Glu Leu Lys His 1805 1810 1815 Gly Thr Phe Thr Cys Ala Ser Glu Tyr Thr Gly Asn Tyr Gln Cys 1820 1825 1830 Gly His Tyr Lys His Ile Thr Ser Lys Glu Thr Leu Tyr Cys Ile 1835 1840 1845 Asp Gly Ala Leu Leu Thr Lys Ser Ser Glu Tyr Lys Gly Pro Ile 1850 1855 1860 Thr Asp Val Phe Tyr Lys Glu Asn Ser Tyr Thr Thr Thr Ile Lys 1865 1870 1875 Pro Val Thr Tyr Lys Leu Asp Gly Val Val Cys Thr Glu Ile Asp 1880 1885 1890 Pro Lys Leu Asp Asn Tyr Tyr Lys Lys Asp Asn Ser Tyr Phe Thr 1895 1900 1905 Glu Gln Pro Ile Asp Leu Val Pro Asn Gln Pro Tyr Pro Asn Ala 1910 1915 1920 Ser Phe Asp Asn Phe Lys Phe Val Cys Asp Asn Ile Lys Phe Ala 1925 1930 1935 Asp Asp Leu Asn Gln Leu Thr Gly Tyr Lys Lys Pro Ala Ser Arg 1940 1945 1950 Glu Leu Lys Val Thr Phe Phe Pro Asp Leu Asn Gly Asp Val Val 1955 1960 1965 Ala Ile Asp Tyr Lys His Tyr Thr Pro Ser Phe Lys Lys Gly Ala 1970 1975 1980 Lys Leu Leu His Lys Pro Ile Val Trp His Val Asn Asn Ala Thr 1985 1990 1995 Asn Lys Ala Thr Tyr Lys Pro Asn Thr Trp Cys Ile Arg Cys Leu 2000 2005 2010 Trp Ser Thr Lys Pro Val Glu Thr Ser Asn Ser Phe Asp Val Leu 2015 2020 2025 Lys Ser Glu Asp Ala Gln Gly Met Asp Asn Leu Ala Cys Glu Asp 2030 2035 2040 Leu Lys Pro Val Ser Glu Glu Val Val Glu Asn Pro Thr Ile Gln 2045 2050 2055 Lys Asp Val Leu Glu Cys Asn Val Lys Thr Thr Glu Val Val Gly 2060 2065 2070 Asp Ile Ile Leu Lys Pro Ala Asn Asn Ser Leu Lys Ile Thr Glu 2075 2080 2085 Glu Val Gly His Thr Asp Leu Met Ala Ala Tyr Val Asp Asn Ser 2090 2095 2100 Ser Leu Thr Ile Lys Lys Pro Asn Glu Leu Ser Arg Val Leu Gly 2105 2110 2115 Leu Lys Thr Leu Ala Thr His Gly Leu Ala Ala Val Asn Ser Val 2120 2125 2130 Pro Trp Asp Thr Ile Ala Asn Tyr Ala Lys Pro Phe Leu Asn Lys 2135 2140 2145 Val Val Ser Thr Thr Thr Asn Ile Val Thr Arg Cys Leu Asn Arg 2150 2155 2160 Val Cys Thr Asn Tyr Met Pro Tyr Phe Phe Thr Leu Leu Leu Gln 2165 2170 2175 Leu Cys Thr Phe Thr Arg Ser Thr Asn Ser Arg Ile Lys Ala Ser 2180 2185 2190 Met Pro Thr Thr Ile Ala Lys Asn Thr Val Lys Ser Val Gly Lys 2195 2200 2205 Phe Cys Leu Glu Ala Ser Phe Asn Tyr Leu Lys Ser Pro Asn Phe 2210 2215 2220 Ser Lys Leu Ile Asn Ile Thr Ile Trp Phe Leu Leu Leu Ser Val 2225 2230 2235 Cys Leu Gly Ser Leu Ile Tyr Ser Thr Ala Ala Leu Gly Val Leu 2240 2245 2250 Met Ser Asn Leu Gly Met Pro Ser Tyr Cys Thr Gly Tyr Arg Glu 2255 2260 2265 Gly Tyr Leu Asn Ser Thr Asn Val Thr Ile Ala Thr Tyr Cys Thr 2270 2275 2280 Gly Ser Ile Pro Cys Ser Val Cys Leu Ser Gly Leu Asp Ser Leu 2285 2290 2295 Asp Thr Tyr Pro Ser Leu Glu Thr Ile Gln Ile Thr Ile Ser Ser 2300 2305 2310 Phe Lys Trp Asp Leu Thr Ala Phe Gly Leu Val Ala Glu Trp Phe 2315 2320 2325 Leu Ala Tyr Ile Leu Phe Thr Arg Phe Phe Tyr Val Leu Gly Leu 2330 2335 2340 Ala Ala Ile Met Gln Leu Phe Phe Ser Tyr Phe Ala Val His Phe 2345 2350 2355 Ile Ser Asn Ser Trp Leu Met Trp Leu Ile Ile Asn Leu Val Gln 2360 2365 2370 Met Ala Pro Ile Ser Ala Met Val Arg Met Tyr Ile Phe Phe Ala 2375 2380 2385 Ser Phe Tyr Tyr Val Trp Lys Ser Tyr Val His Val Val Asp Gly 2390 2395 2400 Cys Asn Ser Ser Thr Cys Met Met Cys Tyr Lys Arg Asn Arg Ala 2405 2410 2415 Thr Arg Val Glu Cys Thr Thr Ile Val Asn Gly Val Arg Arg Ser 2420 2425 2430 Phe Tyr Val Tyr Ala Asn Gly Gly Lys Gly Phe Cys Lys Leu His 2435 2440 2445 Asn Trp Asn Cys Val Asn Cys Asp Thr Phe Cys Ala Gly Ser Thr 2450 2455 2460 Phe Ile Ser Asp Glu Val Ala Arg Asp Leu Ser Leu Gln Phe Lys 2465 2470 2475 Arg Pro Ile Asn Pro Thr Asp Gln Ser Ser Tyr Ile Val Asp Ser 2480 2485 2490 Val Thr Val Lys Asn Gly Ser Ile His Leu Tyr Phe Asp Lys Ala 2495 2500 2505 Gly Gln Lys Thr Tyr Glu Arg His Ser Leu Ser His Phe Val Asn 2510 2515 2520 Leu Asp Asn Leu Arg Ala Asn Asn Thr Lys Gly Ser Leu Pro Ile 2525 2530 2535 Asn Val Ile Val Phe Asp Gly Lys Ser Lys Cys Glu Glu Ser Ser 2540 2545 2550 Ala Lys Ser Ala Ser Val Tyr Tyr Ser Gln Leu Met Cys Gln Pro 2555 2560 2565 Ile Leu Leu Leu Asp Gln Ala Leu Val Ser Asp Val Gly Asp Ser 2570 2575 2580 Ala Glu Val Ala Val Lys Met Phe Asp Ala Tyr Val Asn Thr Phe 2585 2590 2595 Ser Ser Thr Phe Asn Val Pro Met Glu Lys Leu Lys Thr Leu Val 2600 2605 2610 Ala Thr Ala Glu Ala Glu Leu Ala Lys Asn Val Ser Leu Asp Asn 2615 2620 2625 Val Leu Ser Thr Phe Ile Ser Ala Ala Arg Gln Gly Phe Val Asp 2630 2635 2640 Ser Asp Val Glu Thr Lys Asp Val Val Glu Cys Leu Lys Leu Ser 2645 2650 2655 His Gln Ser Asp Ile Glu Val Thr Gly Asp Ser Cys Asn Asn Tyr 2660 2665 2670 Met Leu Thr Tyr Asn Lys Val Glu Asn Met Thr Pro Arg Asp Leu 2675 2680 2685 Gly Ala Cys Ile Asp Cys Ser Ala Arg His Ile Asn Ala Gln Val 2690 2695 2700 Ala Lys Ser His Asn Ile Ala Leu Ile Trp Asn Val Lys Asp Phe 2705 2710 2715 Met Ser Leu Ser Glu Gln Leu Arg Lys Gln Ile Arg Ser Ala Ala 2720 2725 2730 Lys Lys Asn Asn Leu Pro Phe Lys Leu Thr Cys Ala Thr Thr Arg 2735 2740 2745 Gln Val Val Asn Val Val Thr Thr Lys Ile Ala Leu Lys Gly Gly 2750 2755 2760 Lys Ile Val Asn Asn Trp Leu Lys Gln Leu Ile Lys Val Thr Leu 2765 2770 2775 Val Phe Leu Phe Val Ala Ala Ile Phe Tyr Leu Ile Thr Pro Val 2780 2785 2790 His Val Met Ser Lys His Thr Asp Phe Ser Ser Glu Ile Ile Gly 2795 2800 2805 Tyr Lys Ala Ile Asp Gly Gly Val Thr Arg Asp Ile Ala Ser Thr 2810 2815 2820 Asp Thr Cys Phe Ala Asn Lys His Ala Asp Phe Asp Thr Trp Phe 2825 2830 2835 Ser Gln Arg Gly Gly Ser Tyr Thr Asn Asp Lys Ala Cys Pro Leu 2840 2845 2850 Ile Ala Ala Val Ile Thr Arg Glu Val Gly Phe Val Val Pro Gly 2855 2860 2865 Leu Pro Gly Thr Ile Leu Arg Thr Thr Asn Gly Asp Phe Leu His 2870 2875 2880 Phe Leu Pro Arg Val Phe Ser Ala Val Gly Asn Ile Cys Tyr Thr 2885 2890 2895 Pro Ser Lys Leu Ile Glu Tyr Thr Asp Phe Ala Thr Ser Ala Cys 2900 2905 2910 Val Leu Ala Ala Glu Cys Thr Ile Phe Lys Asp Ala Ser Gly Lys 2915 2920 2925 Pro Val Pro Tyr Cys Tyr Asp Thr Asn Val Leu Glu Gly Ser Val 2930 2935 2940 Ala Tyr Glu Ser Leu Arg Pro Asp Thr Arg Tyr Val Leu Met Asp 2945 2950 2955 Gly Ser Ile Ile Gln Phe Pro Asn Thr Tyr Leu Glu Gly Ser Val 2960 2965 2970 Arg Val Val Thr Thr Phe Asp Ser Glu Tyr Cys Arg His Gly Thr 2975 2980 2985 Cys Glu Arg Ser Glu Ala Gly Val Cys Val Ser Thr Ser Gly Arg 2990 2995 3000 Trp Val Leu Asn Asn Asp Tyr Tyr Arg Ser Leu Pro Gly Val Phe 3005 3010 3015 Cys Gly Val Asp Ala Val Asn Leu Leu Thr Asn Met Phe Thr Pro 3020 3025 3030 Leu Ile Gln Pro Ile Gly Ala Leu Asp Ile Ser Ala Ser Ile Val 3035 3040 3045 Ala Gly Gly Ile Val Ala Ile Val Val Thr Cys Leu Ala Tyr Tyr 3050 3055 3060 Phe Met Arg Phe Arg Arg Ala Phe Gly Glu Tyr Ser His Val Val 3065 3070 3075 Ala Phe Asn Thr Leu Leu Phe Leu Met Ser Phe Thr Val Leu Cys 3080 3085 3090 Leu Thr Pro Val Tyr Ser Phe Leu Pro Gly Val Tyr Ser Val Ile 3095 3100 3105 Tyr Leu Tyr Leu Thr Phe Tyr Leu Thr Asn Asp Val Ser Phe Leu 3110 3115 3120 Ala His Ile Gln Trp Met Val Met Phe Thr Pro Leu Val Pro Phe 3125 3130 3135 Trp Ile Thr Ile Ala Tyr Ile Ile Cys Ile Ser Thr Lys His Phe 3140 3145 3150 Tyr Trp Phe Phe Ser Asn Tyr Leu Lys Arg Arg Val Val Phe Asn 3155 3160 3165 Gly Val Ser Phe Ser Thr Phe Glu Glu Ala Ala Leu Cys Thr Phe 3170 3175 3180 Leu Leu Asn Lys Glu Met Tyr Leu Lys Leu Arg Ser Asp Val Leu 3185 3190 3195 Leu Pro Leu Thr Gln Tyr Asn Arg Tyr Leu Ala Leu Tyr Asn Lys 3200 3205 3210 Tyr Lys Tyr Phe Ser Gly Ala Met Asp Thr Thr Ser Tyr Arg Glu 3215 3220 3225 Ala Ala Cys Cys His Leu Ala Lys Ala Leu Asn Asp Phe Ser Asn 3230 3235 3240 Ser Gly Ser Asp Val Leu Tyr Gln Pro Pro Gln Thr Ser Ile Thr 3245 3250 3255 Ser Ala Val Leu Gln Ser Gly Phe Arg Lys Met Ala Phe Pro Ser 3260 3265 3270 Gly Lys Val Glu Gly Cys Met Val Gln Val Thr Cys Gly Thr Thr 3275 3280 3285 Thr Leu Asn Gly Leu Trp Leu Asp Asp Val Val Tyr Cys Pro Arg 3290 3295 3300 His Val Ile Cys Thr Ser Glu Asp Met Leu Asn Pro Asn Tyr Glu 3305 3310 3315 Asp Leu Leu Ile Arg Lys Ser Asn His Asn Phe Leu Val Gln Ala 3320 3325 3330 Gly Asn Val Gln Leu Arg Val Ile Gly His Ser Met Gln Asn Cys 3335 3340 3345 Val Leu Lys Leu Lys Val Asp Thr Ala Asn Pro Lys Thr Pro Lys 3350 3355 3360 Tyr Lys Phe Val Arg Ile Gln Pro Gly Gln Thr Phe Ser Val Leu 3365 3370 3375 Ala Cys Tyr Asn Gly Ser Pro Ser Gly Val Tyr Gln Cys Ala Met 3380 3385 3390 Arg Pro Asn Phe Thr Ile Lys Gly Ser Phe Leu Asn Gly Ser Cys 3395 3400 3405 Gly Ser Val Gly Phe Asn Ile Asp Tyr Asp Cys Val Ser Phe Cys 3410 3415 3420 Tyr Met His His Met Glu Leu Pro Thr Gly Val His Ala Gly Thr 3425 3430 3435 Asp Leu Glu Gly Asn Phe Tyr Gly Pro Phe Val Asp Arg Gln Thr 3440 3445 3450 Ala Gln Ala Ala Gly Thr Asp Thr Thr Ile Thr Val Asn Val Leu 3455 3460 3465 Ala Trp Leu Tyr Ala Ala Val Ile Asn Gly Asp Arg Trp Phe Leu 3470 3475 3480 Asn Arg Phe Thr Thr Thr Leu Asn Asp Phe Asn Leu Val Ala Met 3485 3490 3495 Lys Tyr Asn Tyr Glu Pro Leu Thr Gln Asp His Val Asp Ile Leu 3500 3505 3510 Gly Pro Leu Ser Ala Gln Thr Gly Ile Ala Val Leu Asp Met Cys 3515 3520 3525 Ala Ser Leu Lys Glu Leu Leu Gln Asn Gly Met Asn Gly Arg Thr 3530 3535 3540 Ile Leu Gly Ser Ala Leu Leu Glu Asp Glu Phe Thr Pro Phe Asp 3545 3550 3555 Val Val Arg Gln Cys Ser Gly Val Thr Phe Gln Ser Ala Val Lys 3560 3565 3570 Arg Thr Ile Lys Gly Thr His His Trp Leu Leu Leu Thr Ile Leu 3575 3580 3585 Thr Ser Leu Leu Val Leu Val Gln Ser Thr Gln Trp Ser Leu Phe 3590 3595 3600 Phe Phe Leu Tyr Glu Asn Ala Phe Leu Pro Phe Ala Met Gly Ile 3605 3610 3615 Ile Ala Met Ser Ala Phe Ala Met Met Phe Val Lys His Lys His 3620 3625 3630 Ala Phe Leu Cys Leu Phe Leu Leu Pro Ser Leu Ala Thr Val Ala 3635 3640 3645 Tyr Phe Asn Met Val Tyr Met Pro Ala Ser Trp Val Met Arg Ile 3650 3655 3660 Met Thr Trp Leu Asp Met Val Asp Thr Ser Leu Lys Leu Lys Asp 3665 3670 3675 Cys Val Met Tyr Ala Ser Ala Val Val Leu Leu Ile Leu Met Thr 3680 3685 3690 Ala Arg Thr Val Tyr Asp Asp Gly Ala Arg Arg Val Trp Thr Leu 3695 3700 3705 Met Asn Val Leu Thr Leu Val Tyr Lys Val Tyr Tyr Gly Asn Ala 3710 3715 3720 Leu Asp Gln Ala Ile Ser Met Trp Ala Leu Ile Ile Ser Val Thr 3725 3730 3735 Ser Asn Tyr Ser Gly Val Val Thr Thr Val Met Phe Leu Ala Arg 3740 3745 3750 Gly Ile Val Phe Met Cys Val Glu Tyr Cys Pro Ile Phe Phe Ile 3755 3760 3765 Thr Gly Asn Thr Leu Gln Cys Ile Met Leu Val Tyr Cys Phe Leu 3770 3775 3780 Gly Tyr Phe Cys Thr Cys Tyr Phe Gly Leu Phe Cys Leu Leu Asn 3785 3790 3795 Arg Tyr Phe Arg Leu Thr Leu Gly Val Tyr Asp Tyr Leu Val Ser 3800 3805 3810 Thr Gln Glu Phe Arg Tyr Met Asn Ser Gln Gly Leu Leu Pro Pro 3815 3820 3825 Lys Asn Ser Ile Asp Ala Phe Lys Leu Asn Ile Lys Leu Leu Gly 3830 3835 3840 Val Gly Gly Lys Pro Cys Ile Lys Val Ala Thr Val Gln Ser Lys 3845 3850 3855 Met Ser Asp Val Lys Cys Thr Ser Val Val Leu Leu Ser Val Leu 3860 3865 3870 Gln Gln Leu Arg Val Glu Ser Ser Ser Lys Leu Trp Ala Gln Cys 3875 3880 3885 Val Gln Leu His Asn Asp Ile Leu Leu Ala Lys Asp Thr Thr Glu 3890 3895 3900 Ala Phe Glu Lys Met Val Ser Leu Leu Ser Val Leu Leu Ser Met 3905 3910 3915 Gln Gly Ala Val Asp Ile Asn Lys Leu Cys Glu Glu Met Leu Asp 3920 3925 3930 Asn Arg Ala Thr Leu Gln Ala Ile Ala Ser Glu Phe Ser Ser Leu 3935 3940 3945 Pro Ser Tyr Ala Ala Phe Ala Thr Ala Gln Glu Ala Tyr Glu Gln 3950 3955 3960 Ala Val Ala Asn Gly Asp Ser Glu Val Val Leu Lys Lys Leu Lys 3965 3970 3975 Lys Ser Leu Asn Val Ala Lys Ser Glu Phe Asp Arg Asp Ala Ala 3980 3985 3990 Met Gln Arg Lys Leu Glu Lys Met Ala Asp Gln Ala Met Thr Gln 3995 4000 4005 Met Tyr Lys Gln Ala Arg Ser Glu Asp Lys Arg Ala Lys Val Thr 4010 4015 4020 Ser Ala Met Gln Thr Met Leu Phe Thr Met Leu Arg Lys Leu Asp 4025 4030 4035 Asn Asp Ala Leu Asn Asn Ile Ile Asn Asn Ala Arg Asp Gly Cys 4040 4045 4050 Val Pro Leu Asn Ile Ile Pro Leu Thr Thr Ala Ala Lys Leu Met 4055 4060 4065 Val Val Ile Pro Asp Tyr Asn Thr Tyr Lys Asn Thr Cys Asp Gly 4070 4075 4080 Thr Thr Phe Thr Tyr Ala Ser Ala Leu Trp Glu Ile Gln Gln Val 4085 4090 4095 Val Asp Ala Asp Ser Lys Ile Val Gln Leu Ser Glu Ile Ser Met 4100 4105 4110 Asp Asn Ser Pro Asn Leu Ala Trp Pro Leu Ile Val Thr Ala Leu 4115 4120 4125 Arg Ala Asn Ser Ala Val Lys Leu Gln Asn Asn Glu Leu Ser Pro 4130 4135 4140 Val Ala Leu Arg Gln Met Ser Cys Ala Ala Gly Thr Thr Gln Thr 4145 4150 4155 Ala Cys Thr Asp Asp Asn Ala Leu Ala Tyr Tyr Asn Thr Thr Lys 4160 4165 4170 Gly Gly Arg Phe Val Leu Ala Leu Leu Ser Asp Leu Gln Asp Leu 4175 4180 4185 Lys Trp Ala Arg Phe Pro Lys Ser Asp Gly Thr Gly Thr Ile Tyr 4190 4195 4200 Thr Glu Leu Glu Pro Pro Cys Arg Phe Val Thr Asp Thr Pro Lys 4205 4210 4215 Gly Pro Lys Val Lys Tyr Leu Tyr Phe Ile Lys Gly Leu Asn Asn 4220 4225 4230 Leu Asn Arg Gly Met Val Leu Gly Ser Leu Ala Ala Thr Val Arg 4235 4240 4245 Leu Gln Ala Gly Asn Ala Thr Glu Val Pro Ala Asn Ser Thr Val 4250 4255 4260 Leu Ser Phe Cys Ala Phe Ala Val Asp Ala Ala Lys Ala Tyr Lys 4265 4270 4275 Asp Tyr Leu Ala Ser Gly Gly Gln Pro Ile Thr Asn Cys Val Lys 4280 4285 4290 Met Leu Cys Thr His Thr Gly Thr Gly Gln Ala Ile Thr Val Thr 4295 4300 4305 Pro Glu Ala Asn Met Asp Gln Glu Ser Phe Gly Gly Ala Ser Cys 4310 4315 4320 Cys Leu Tyr Cys Arg Cys His Ile Asp His Pro Asn Pro Lys Gly 4325 4330 4335 Phe Cys Asp Leu Lys Gly Lys Tyr Val Gln Ile Pro Thr Thr Cys 4340 4345 4350 Ala Asn Asp Pro Val Gly Phe Thr Leu Lys Asn Thr Val Cys Thr 4355 4360 4365 Val Cys Gly Met Trp Lys Gly Tyr Gly Cys Ser Cys Asp Gln Leu 4370 4375 4380 Arg Glu Pro Met Leu Gln Ser Ala Asp Ala Gln Ser Phe Leu Asn 4385 4390 4395 Arg Val Cys Gly Val Ser Ala Ala Arg Leu Thr Pro Cys Gly Thr 4400 4405 4410 Gly Thr Ser Thr Asp Val Val Tyr Arg Ala Phe Asp Ile Tyr Asn 4415 4420 4425 Asp Lys Val Ala Gly Phe Ala Lys Phe Leu Lys Thr Asn Cys Cys 4430 4435 4440 Arg Phe Gln Glu Lys Asp Glu Asp Asp Asn Leu Ile Asp Ser Tyr 4445 4450 4455 Phe Val Val Lys Arg His Thr Phe Ser Asn Tyr Gln His Glu Glu 4460 4465 4470 Thr Ile Tyr Asn Leu Leu Lys Asp Cys Pro Ala Val Ala Lys His 4475 4480 4485 Asp Phe Phe Lys Phe Arg Ile Asp Gly Asp Met Val Pro His Ile 4490 4495 4500 Ser Arg Gln Arg Leu Thr Lys Tyr Thr Met Ala Asp Leu Val Tyr 4505 4510 4515 Ala Leu Arg His Phe Asp Glu Gly Asn Cys Asp Thr Leu Lys Glu 4520 4525 4530 Ile Leu Val Thr Tyr Asn Cys Cys Asp Asp Asp Tyr Phe Asn Lys 4535 4540 4545 Lys Asp Trp Tyr Asp Phe Val Glu Asn Pro Asp Ile Leu Arg Val 4550 4555 4560 Tyr Ala Asn Leu Gly Glu Arg Val Arg Gln Ala Leu Leu Lys Thr 4565 4570 4575 Val Gln Phe Cys Asp Ala Met Arg Asn Ala Gly Ile Val Gly Val 4580 4585 4590 Leu Thr Leu Asp Asn Gln Asp Leu Asn Gly Asn Trp Tyr Asp Phe 4595 4600 4605 Gly Asp Phe Ile Gln Thr Thr Pro Gly Ser Gly Val Pro Val Val 4610 4615 4620 Asp Ser Tyr Tyr Ser Leu Leu Met Pro Ile Leu Thr Leu Thr Arg 4625 4630 4635 Ala Leu Thr Ala Glu Ser His Val Asp Thr Asp Leu Thr Lys Pro 4640 4645 4650 Tyr Ile Lys Trp Asp Leu Leu Lys Tyr Asp Phe Thr Glu Glu Arg 4655 4660 4665 Leu Lys Leu Phe Asp Arg Tyr Phe Lys Tyr Trp Asp Gln Thr Tyr 4670 4675 4680 His Pro Asn Cys Val Asn Cys Leu Asp Asp Arg Cys Ile Leu His 4685 4690 4695 Cys Ala Asn Phe Asn Val Leu Phe Ser Thr Val Phe Pro Leu Thr 4700 4705 4710 Ser Phe Gly Pro Leu Val Arg Lys Ile Phe Val Asp Gly Val Pro 4715 4720 4725 Phe Val Val Ser Thr Gly Tyr His Phe Arg Glu Leu Gly Val Val 4730 4735 4740 His Asn Gln Asp Val Asn Leu His Ser Ser Arg Leu Ser Phe Lys 4745 4750 4755 Glu Leu Leu Val Tyr Ala Ala Asp Pro Ala Met His Ala Ala Ser 4760 4765 4770 Gly Asn Leu Leu Leu Asp Lys Arg Thr Thr Cys Phe Ser Val Ala 4775 4780 4785 Ala Leu Thr Asn Asn Val Ala Phe Gln Thr Val Lys Pro Gly Asn 4790 4795 4800 Phe Asn Lys Asp Phe Tyr Asp Phe Ala Val Ser Lys Gly Phe Phe 4805 4810 4815 Lys Glu Gly Ser Ser Val Glu Leu Lys His Phe Phe Phe Ala Gln 4820 4825 4830 Asp Gly Asn Ala Ala Ile Ser Asp Tyr Asp Tyr Tyr Arg Tyr Asn 4835 4840 4845 Leu Pro Thr Met Cys Asp Ile Arg Gln Leu Leu Phe Val Val Glu 4850 4855 4860 Val Val Asp Lys Tyr Phe Asp Cys Tyr Asp Gly Gly Cys Ile Asn 4865 4870 4875 Ala Asn Gln Val Ile Val Asn Asn Leu Asp Lys Ser Ala Gly Phe 4880 4885 4890 Pro Phe Asn Lys Trp Gly Lys Ala Arg Leu Tyr Tyr Asp Ser Met 4895 4900 4905 Ser Tyr Glu Asp Gln Asp Ala Leu Phe Ala Tyr Thr Lys Arg Asn 4910 4915 4920 Val Ile Pro Thr Ile Thr Gln Met Asn Leu Lys Tyr Ala Ile Ser 4925 4930 4935 Ala Lys Asn Arg Ala Arg Thr Val Ala Gly Val Ser Ile Cys Ser 4940 4945 4950 Thr Met Thr Asn Arg Gln Phe His Gln Lys Leu Leu Lys Ser Ile 4955 4960 4965 Ala Ala Thr Arg Gly Ala Thr Val Val Ile Gly Thr Ser Lys Phe 4970 4975 4980 Tyr Gly Gly Trp His Asn Met Leu Lys Thr Val Tyr Ser Asp Val 4985 4990 4995 Glu Asn Pro His Leu Met Gly Trp Asp Tyr Pro Lys Cys Asp Arg 5000 5005 5010 Ala Met Pro Asn Met Leu Arg Ile Met Ala Ser Leu Val Leu Ala 5015 5020 5025 Arg Lys His Thr Thr Cys Cys Ser Leu Ser His Arg Phe Tyr Arg 5030 5035 5040 Leu Ala Asn Glu Cys Ala Gln Val Leu Ser Glu Met Val Met Cys 5045 5050 5055 Gly Gly Ser Leu Tyr Val Lys Pro Gly Gly Thr Ser Ser Gly Asp 5060 5065 5070 Ala Thr Thr Ala Tyr Ala Asn Ser Val Phe Asn Ile Cys Gln Ala 5075 5080 5085 Val Thr Ala Asn Val Asn Ala Leu Leu Ser Thr Asp Gly Asn Lys 5090 5095 5100 Ile Ala Asp Lys Tyr Val Arg Asn Leu Gln His Arg Leu Tyr Glu 5105 5110 5115 Cys Leu Tyr Arg Asn Arg Asp Val Asp Thr Asp Phe Val Asn Glu 5120 5125 5130 Phe Tyr Ala Tyr Leu Arg Lys His Phe Ser Met Met Ile Leu Ser 5135 5140 5145 Asp Asp Ala Val Val Cys Phe Asn Ser Thr Tyr Ala Ser Gln Gly 5150 5155 5160 Leu Val Ala Ser Ile Lys Asn Phe Lys Ser Val Leu Tyr Tyr Gln 5165 5170 5175 Asn Asn Val Phe Met Ser Glu Ala Lys Cys Trp Thr Glu Thr Asp 5180 5185 5190 Leu Thr Lys Gly Pro His Glu Phe Cys Ser Gln His Thr Met Leu 5195 5200 5205 Val Lys Gln Gly Asp Asp Tyr Val Tyr Leu Pro Tyr Pro Asp Pro 5210 5215 5220 Ser Arg Ile Leu Gly Ala Gly Cys Phe Val Asp Asp Ile Val Lys 5225 5230 5235 Thr Asp Gly Thr Leu Met Ile Glu Arg Phe Val Ser Leu Ala Ile 5240 5245 5250 Asp Ala Tyr Pro Leu Thr Lys His Pro Asn Gln Glu Tyr Ala Asp 5255 5260 5265 Val Phe His Leu Tyr Leu Gln Tyr Ile Arg Lys Leu His Asp Glu 5270 5275 5280 Leu Thr Gly His Met Leu Asp Met Tyr Ser Val Met Leu Thr Asn 5285 5290 5295 Asp Asn Thr Ser Arg Tyr Trp Glu Pro Glu Phe Tyr Glu Ala Met 5300 5305 5310 Tyr Thr Pro His Thr Val Leu Gln Ala Val Gly Ala Cys Val Leu 5315 5320 5325 Cys Asn Ser Gln Thr Ser Leu Arg Cys Gly Ala Cys Ile Arg Arg 5330 5335 5340 Pro Phe Leu Cys Cys Lys Cys Cys Tyr Asp His Val Ile Ser Thr 5345 5350 5355 Ser His Lys Leu Val Leu Ser Val Asn Pro Tyr Val Cys Asn Ala 5360 5365 5370 Pro Gly Cys Asp Val Thr Asp Val Thr Gln Leu Tyr Leu Gly Gly 5375 5380 5385 Met Ser Tyr Tyr Cys Lys Ser His Lys Pro Ser Ile Ser Phe Pro 5390 5395 5400 Leu Cys Ala Asn Gly Gln Val Phe Gly Leu Tyr Lys Asn Thr Cys 5405 5410 5415 Val Gly Ser Asp Asn Val Thr Asp Phe Asn Ala Ile Ala Thr Cys 5420 5425 5430 Asp Trp Thr Asn Ala Gly Asp Tyr Ile Leu Ala Asn Thr Cys Thr 5435 5440 5445 Glu Arg Leu Lys Leu Phe Ala Ala Glu Thr Leu Lys Ala Thr Glu 5450 5455 5460 Glu Thr Phe Lys Leu Ser Tyr Gly Ile Ala Thr Val Arg Glu Val 5465 5470 5475 Leu Ser Asp Arg Glu Leu His Leu Ser Trp Glu Val Gly Lys Pro 5480 5485 5490 Arg Pro Pro Leu Asn Arg Asn Tyr Val Phe Thr Gly Tyr Arg Val 5495 5500 5505 Thr Lys Asn Ser Lys Val Gln Ile Gly Glu Tyr Thr Phe Glu Lys 5510 5515 5520 Gly Asp Tyr Gly Asp Ala Val Val Tyr Arg Gly Thr Thr Thr Tyr 5525 5530 5535 Lys Leu Asn Val Gly Asp Tyr Phe Val Leu Thr Ser His Thr Val 5540 5545 5550 Met Pro Leu Ser Ala Pro Thr Leu Val Pro Gln Glu His Tyr Val 5555 5560 5565 Arg Ile Thr Gly Leu Tyr Pro Thr Leu Asn Ile Ser Asp Glu Phe 5570 5575 5580 Ser Ser Asn Val Ala Asn Tyr Gln Lys Val Gly Met Gln Lys Tyr 5585 5590 5595 Ser Thr Leu Gln Gly Pro Pro Gly Thr Gly Lys Ser His Phe Ala 5600 5605 5610 Ile Gly Leu Ala Leu Tyr Tyr Pro Ser Ala Arg Ile Val Tyr Thr 5615 5620 5625 Ala Cys Ser His Ala Ala Val Asp Ala Leu Cys Glu Lys Ala Leu 5630 5635 5640 Lys Tyr Leu Pro Ile Asp Lys Cys Ser Arg Ile Ile Pro Ala Arg 5645 5650 5655 Ala Arg Val Glu Cys Phe Asp Lys Phe Lys Val Asn Ser Thr Leu 5660 5665 5670 Glu Gln Tyr Val Phe Cys Thr Val Asn Ala Leu Pro Glu Thr Thr 5675 5680 5685 Ala Asp Ile Val Val Phe Asp Glu Ile Ser Met Ala Thr Asn Tyr 5690 5695 5700 Asp Leu Ser Val Val Asn Ala Arg Leu Arg Ala Lys His Tyr Val 5705 5710 5715 Tyr Ile Gly Asp Pro Ala Gln Leu Pro Ala Pro Arg Thr Leu Leu 5720 5725 5730 Thr Lys Gly Thr Leu Glu Pro Glu Tyr Phe Asn Ser Val Cys Arg 5735 5740 5745 Leu Met Lys Thr Ile Gly Pro Asp Met Phe Leu Gly Thr Cys Arg 5750 5755 5760 Arg Cys Pro Ala Glu Ile Val Asp Thr Val Ser Ala Leu Val Tyr 5765 5770 5775 Asp Asn Arg Leu Lys Ala His Lys Asp Lys Ser Ala Gln Cys Phe 5780 5785 5790 Lys Met Phe Tyr Lys Gly Val Ile Thr His Asp Val Ser Ser Ala 5795 5800 5805 Ile Asn Arg Pro Gln Ile Gly Val Val Arg Glu Phe Leu Thr Arg 5810 5815 5820 Asn Pro Ala Trp Arg Lys Ala Val Phe Ile Ser Pro Tyr Asn Ser 5825 5830 5835 Gln Asn Ala Val Ala Ser Lys Ile Leu Gly Leu Pro Thr Gln Thr 5840 5845 5850 Val Asp Ser Ser Gln Gly Ser Glu Tyr Asp Tyr Val Ile Phe Thr 5855 5860 5865 Gln Thr Thr Glu Thr Ala His Ser Cys Asn Val Asn Arg Phe Asn 5870 5875 5880 Val Ala Ile Thr Arg Ala Lys Val Gly Ile Leu Cys Ile Met Ser 5885 5890 5895 Asp Arg Asp Leu Tyr Asp Lys Leu Gln Phe Thr Ser Leu Glu Ile 5900 5905 5910 Pro Arg Arg Asn Val Ala Thr Leu Gln Ala Glu Asn Val Thr Gly 5915 5920 5925 Leu Phe Lys Asp Cys Ser Lys Val Ile Thr Gly Leu His Pro Thr 5930 5935 5940 Gln Ala Pro Thr His Leu Ser Val Asp Thr Lys Phe Lys Thr Glu 5945 5950 5955 Gly Leu Cys Val Asp Ile Pro Gly Ile Pro Lys Asp Met Thr Tyr 5960 5965 5970 Arg Arg Leu Ile Ser Met Met Gly Phe Lys Met Asn Tyr Gln Val 5975 5980 5985 Asn Gly Tyr Pro Asn Met Phe Ile Thr Arg Glu Glu Ala Ile Arg 5990 5995 6000 His Val Arg Ala Trp Ile Gly Phe Asp Val Glu Gly Cys His Ala 6005 6010 6015 Thr Arg Glu Ala Val Gly Thr Asn Leu Pro Leu Gln Leu Gly Phe 6020 6025 6030 Ser Thr Gly Val Asn Leu Val Ala Val Pro Thr Gly Tyr Val Asp 6035 6040 6045 Thr Pro Asn Asn Thr Asp Phe Ser Arg Val Ser Ala Lys Pro Pro 6050 6055 6060 Pro Gly Asp Gln Phe Lys His Leu Ile Pro Leu Met Tyr Lys Gly 6065 6070 6075 Leu Pro Trp Asn Val Val Arg Ile Lys Ile Val Gln Met Leu Ser 6080 6085 6090 Asp Thr Leu Lys Asn Leu Ser Asp Arg Val Val Phe Val Leu Trp 6095 6100 6105 Ala His Gly Phe Glu Leu Thr Ser Met Lys Tyr Phe Val Lys Ile 6110 6115 6120 Gly Pro Glu Arg Thr Cys Cys Leu Cys Asp Arg Arg Ala Thr Cys 6125 6130 6135 Phe Ser Thr Ala Ser Asp Thr Tyr Ala Cys Trp His His Ser Ile 6140 6145 6150 Gly Phe Asp Tyr Val Tyr Asn Pro Phe Met Ile Asp Val Gln Gln 6155 6160 6165 Trp Gly Phe Thr Gly Asn Leu Gln Ser Asn His Asp Leu Tyr Cys 6170 6175 6180 Gln Val His Gly Asn Ala His Val Ala Ser Cys Asp Ala Ile Met 6185 6190 6195 Thr Arg Cys Leu Ala Val His Glu Cys Phe Val Lys Arg Val Asp 6200 6205 6210 Trp Thr Ile Glu Tyr Pro Ile Ile Gly Asp Glu Leu Lys Ile Asn 6215 6220 6225 Ala Ala Cys Arg Lys Val Gln His Met Val Val Lys Ala Ala Leu 6230 6235 6240 Leu Ala Asp Lys Phe Pro Val Leu His Asp Ile Gly Asn Pro Lys 6245 6250 6255 Ala Ile Lys Cys Val Pro Gln Ala Asp Val Glu Trp Lys Phe Tyr 6260 6265 6270 Asp Ala Gln Pro Cys Ser Asp Lys Ala Tyr Lys Ile Glu Glu Leu 6275 6280 6285 Phe Tyr Ser Tyr Ala Thr His Ser Asp Lys Phe Thr Asp Gly Val 6290 6295 6300 Cys Leu Phe Trp Asn Cys Asn Val Asp Arg Tyr Pro Ala Asn Ser 6305 6310 6315 Ile Val Cys Arg Phe Asp Thr Arg Val Leu Ser Asn Leu Asn Leu 6320 6325 6330 Pro Gly Cys Asp Gly Gly Ser Leu Tyr Val Asn Lys His Ala Phe 6335 6340 6345 His Thr Pro Ala Phe Asp Lys Ser Ala Phe Val Asn Leu Lys Gln 6350 6355 6360 Leu Pro Phe Phe Tyr Tyr Ser Asp Ser Pro Cys Glu Ser His Gly 6365 6370 6375 Lys Gln Val Val Ser Asp Ile Asp Tyr Val Pro Leu Lys Ser Ala 6380 6385 6390 Thr Cys Ile Thr Arg Cys Asn Leu Gly Gly Ala Val Cys Arg His 6395 6400 6405 His Ala Asn Glu Tyr Arg Leu Tyr Leu Asp Ala Tyr Asn Met Met 6410 6415 6420 Ile Ser Ala Gly Phe Ser Leu Trp Val Tyr Lys Gln Phe Asp Thr 6425 6430 6435 Tyr Asn Leu Trp Asn Thr Phe Thr Arg Leu Gln Ser Leu Glu Asn 6440 6445 6450 Val Ala Phe Asn Val Val Asn Lys Gly His Phe Asp Gly Gln Gln 6455 6460 6465 Gly Glu Val Pro Val Ser Ile Ile Asn Asn Thr Val Tyr Thr Lys 6470 6475 6480 Val Asp Gly Val Asp Val Glu Leu Phe Glu Asn Lys Thr Thr Leu 6485 6490 6495 Pro Val Asn Val Ala Phe Glu Leu Trp Ala Lys Arg Asn Ile Lys 6500 6505 6510 Pro Val Pro Glu Val Lys Ile Leu Asn Asn Leu Gly Val Asp Ile 6515 6520 6525 Ala Ala Asn Thr Val Ile Trp Asp Tyr Lys Arg Asp Ala Pro Ala 6530 6535 6540 His Ile Ser Thr Ile Gly Val Cys Ser Met Thr Asp Ile Ala Lys 6545 6550 6555 Lys Pro Thr Glu Thr Ile Cys Ala Pro Leu Thr Val Phe Phe Asp 6560 6565 6570 Gly Arg Val Asp Gly Gln Val Asp Leu Phe Arg Asn Ala Arg Asn 6575 6580 6585 Gly Val Leu Ile Thr Glu Gly Ser Val Lys Gly Leu Gln Pro Ser 6590 6595 6600 Val Gly Pro Lys Gln Ala Ser Leu Asn Gly Val Thr Leu Ile Gly 6605 6610 6615 Glu Ala Val Lys Thr Gln Phe Asn Tyr Tyr Lys Lys Val Asp Gly 6620 6625 6630 Val Val Gln Gln Leu Pro Glu Thr Tyr Phe Thr Gln Ser Arg Asn 6635 6640 6645 Leu Gln Glu Phe Lys Pro Arg Ser Gln Met Glu Ile Asp Phe Leu 6650 6655 6660 Glu Leu Ala Met Asp Glu Phe Ile Glu Arg Tyr Lys Leu Glu Gly 6665 6670 6675 Tyr Ala Phe Glu His Ile Val Tyr Gly Asp Phe Ser His Ser Gln 6680 6685 6690 Leu Gly Gly Leu His Leu Leu Ile Gly Leu Ala Lys Arg Phe Lys 6695 6700 6705 Glu Ser Pro Phe Glu Leu Glu Asp Phe Ile Pro Met Asp Ser Thr 6710 6715 6720 Val Lys Asn Tyr Phe Ile Thr Asp Ala Gln Thr Gly Ser Ser Lys 6725 6730 6735 Cys Val Cys Ser Val Ile Asp Leu Leu Leu Asp Asp Phe Val Glu 6740 6745 6750 Ile Ile Lys Ser Gln Asp Leu Ser Val Val Ser Lys Val Val Lys 6755 6760 6765 Val Thr Ile Asp Tyr Thr Glu Ile Ser Phe Met Leu Trp Cys Lys 6770 6775 6780 Asp Gly His Val Glu Thr Phe Tyr Pro Lys Leu Gln Ser Ser Gln 6785 6790 6795 Ala Trp Gln Pro Gly Val Ala Met Pro Asn Leu Tyr Lys Met Gln 6800 6805 6810 Arg Met Leu Leu Glu Lys Cys Asp Leu Gln Asn Tyr Gly Asp Ser 6815 6820 6825 Ala Thr Leu Pro Lys Gly Ile Met Met Asn Val Ala Lys Tyr Thr 6830 6835 6840 Gln Leu Cys Gln Tyr Leu Asn Thr Leu Thr Leu Ala Val Pro Tyr 6845 6850 6855 Asn Met Arg Val Ile His Phe Gly Ala Gly Ser Asp Lys Gly Val 6860 6865 6870 Ala Pro Gly Thr Ala Val Leu Arg Gln Trp Leu Pro Thr Gly Thr 6875 6880 6885 Leu Leu Val Asp Ser Asp Leu Asn Asp Phe Val Ser Asp Ala Asp 6890 6895 6900 Ser Thr Leu Ile Gly Asp Cys Ala Thr Val His Thr Ala Asn Lys 6905 6910 6915 Trp Asp Leu Ile Ile Ser Asp Met Tyr Asp Pro Lys Thr Lys Asn 6920 6925 6930 Val Thr Lys Glu Asn Asp Ser Lys Glu Gly Phe Phe Thr Tyr Ile 6935 6940 6945 Cys Gly Phe Ile Gln Gln Lys Leu Ala Leu Gly Gly Ser Val Ala 6950 6955 6960 Ile Lys Ile Thr Glu His Ser Trp Asn Ala Asp Leu Tyr Lys Leu 6965 6970 6975 Met Gly His Phe Ala Trp Trp Thr Ala Phe Val Thr Asn Val Asn 6980 6985 6990 Ala Ser Ser Ser Glu Ala Phe Leu Ile Gly Cys Asn Tyr Leu Gly 6995 7000 7005 Lys Pro Arg Glu Gln Ile Asp Gly Tyr Val Met His Ala Asn Tyr 7010 7015 7020 Ile Phe Trp Arg Asn Thr Asn Pro Ile Gln Leu Ser Ser Tyr Ser 7025 7030 7035 Leu Phe Asp Met Ser Lys Phe Pro Leu Lys Leu Arg Gly Thr Ala 7040 7045 7050 Val Met Ser Leu Lys Glu Gly Gln Ile Asn Asp Met Ile Leu Ser 7055 7060 7065 Leu Leu Ser Lys Gly Arg Leu Ile Ile Arg Glu Asn Asn Arg Val 7070 7075 7080 Val Ile Ser Ser Asp Val Leu Val Asn Asn 7085 7090 <210> 402 <211> 4402 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 402 Met Glu Ser Leu Val Pro Gly Phe Asn Glu Lys Thr His Val Gln Leu 1 5 10 15 Ser Leu Pro Val Leu Gln Val Arg Asp Val Leu Val Arg Gly Phe Gly 20 25 30 Asp Ser Val Glu Glu Val Leu Ser Glu Ala Arg Gln His Leu Lys Asp 35 40 45 Gly Thr Cys Gly Leu Val Glu Val Glu Lys Gly Val Leu Pro Gln Leu 50 55 60 Glu Gln Pro Tyr Val Phe Ile Lys Arg Ser Asp Ala Arg Thr Ala Pro 65 70 75 80 His Gly His Val Met Val Glu Leu Val Ala Glu Leu Glu Gly Ile Gln 85 90 95 Tyr Gly Arg Ser Gly Glu Thr Leu Gly Val Leu Val Pro His Val Gly 100 105 110 Glu Ile Pro Val Ala Tyr Arg Lys Val Leu Leu Arg Lys Asn Gly Asn 115 120 125 Lys Gly Ala Gly Gly His Ser Tyr Gly Ala Asp Leu Lys Ser Phe Asp 130 135 140 Leu Gly Asp Glu Leu Gly Thr Asp Pro Tyr Glu Asp Phe Gln Glu Asn 145 150 155 160 Trp Asn Thr Lys His Ser Ser Gly Val Thr Arg Glu Leu Met Arg Glu 165 170 175 Leu Asn Gly Gly Ala Tyr Thr Arg Tyr Val Asp Asn Asn Phe Cys Gly 180 185 190 Pro Asp Gly Tyr Pro Leu Glu Cys Ile Lys Asp Leu Leu Ala Arg Ala 195 200 205 Gly Lys Ala Ser Cys Thr Leu Ser Glu Gln Leu Asp Phe Ile Asp Thr 210 215 220 Lys Arg Gly Val Tyr Cys Cys Arg Glu His Glu His Glu Ile Ala Trp 225 230 235 240 Tyr Thr Glu Arg Ser Glu Lys Ser Tyr Glu Leu Gln Thr Pro Phe Glu 245 250 255 Ile Lys Leu Ala Lys Lys Phe Asp Thr Phe Asn Gly Glu Cys Pro Asn 260 265 270 Phe Val Phe Pro Leu Asn Ser Ile Ile Lys Thr Ile Gln Pro Arg Val 275 280 285 Glu Lys Lys Lys Leu Asp Gly Phe Met Gly Arg Ile Arg Ser Val Tyr 290 295 300 Pro Val Ala Ser Pro Asn Glu Cys Asn Gln Met Cys Leu Ser Thr Leu 305 310 315 320 Met Lys Cys Asp His Cys Gly Glu Thr Ser Trp Gln Thr Gly Asp Phe 325 330 335 Val Lys Ala Thr Cys Glu Phe Cys Gly Thr Glu Asn Leu Thr Lys Glu 340 345 350 Gly Ala Thr Thr Cys Gly Tyr Leu Pro Gln Asn Ala Val Val Lys Ile 355 360 365 Tyr Cys Pro Ala Cys His Asn Ser Glu Val Gly Pro Glu His Ser Leu 370 375 380 Ala Glu Tyr His Asn Glu Ser Gly Leu Lys Thr Ile Leu Arg Lys Gly 385 390 395 400 Gly Arg Thr Ile Ala Phe Gly Gly Cys Val Phe Ser Tyr Val Gly Cys 405 410 415 His Asn Lys Cys Ala Tyr Trp Val Pro Arg Ala Ser Ala Asn Ile Gly 420 425 430 Cys Asn His Thr Gly Val Val Gly Glu Gly Ser Glu Gly Leu Asn Asp 435 440 445 Asn Leu Leu Glu Ile Leu Gln Lys Glu Lys Val Asn Ile Asn Ile Val 450 455 460 Gly Asp Phe Lys Leu Asn Glu Glu Ile Ala Ile Ile Leu Ala Ser Phe 465 470 475 480 Ser Ala Ser Thr Ser Ala Phe Val Glu Thr Val Lys Gly Leu Asp Tyr 485 490 495 Lys Ala Phe Lys Gln Ile Val Glu Ser Cys Gly Asn Phe Lys Val Thr 500 505 510 Lys Gly Lys Ala Lys Lys Gly Ala Trp Asn Ile Gly Glu Gln Lys Ser 515 520 525 Ile Leu Ser Pro Leu Tyr Ala Phe Ala Ser Glu Ala Ala Arg Val Val 530 535 540 Arg Ser Ile Phe Ser Arg Thr Leu Glu Thr Ala Gln Asn Ser Val Arg 545 550 555 560 Val Leu Gln Lys Ala Ala Ile Thr Ile Leu Asp Gly Ile Ser Gln Tyr 565 570 575 Ser Leu Arg Leu Ile Asp Ala Met Met Phe Thr Ser Asp Leu Ala Thr 580 585 590 Asn Asn Leu Val Val Met Ala Tyr Ile Thr Gly Gly Val Val Gln Leu 595 600 605 Thr Ser Gln Trp Leu Thr Asn Ile Phe Gly Thr Val Tyr Glu Lys Leu 610 615 620 Lys Pro Val Leu Asp Trp Leu Glu Glu Lys Phe Lys Glu Gly Val Glu 625 630 635 640 Phe Leu Arg Asp Gly Trp Glu Ile Val Lys Phe Ile Ser Thr Cys Ala 645 650 655 Cys Glu Ile Val Gly Gly Gln Ile Val Thr Cys Ala Lys Glu Ile Lys 660 665 670 Glu Ser Val Gln Thr Phe Phe Lys Leu Val Asn Lys Phe Leu Ala Leu 675 680 685 Cys Ala Asp Ser Ile Ile Ile Gly Gly Ala Lys Leu Lys Ala Leu Asn 690 695 700 Leu Gly Glu Thr Phe Val Thr His Ser Lys Gly Leu Tyr Arg Lys Cys 705 710 715 720 Val Lys Ser Arg Glu Glu Thr Gly Leu Leu Met Pro Leu Lys Ala Pro 725 730 735 Lys Glu Ile Ile Phe Leu Glu Gly Glu Thr Leu Pro Thr Glu Val Leu 740 745 750 Thr Glu Glu Val Val Leu Lys Thr Gly Asp Leu Gln Pro Leu Glu Gln 755 760 765 Pro Thr Ser Glu Ala Val Glu Ala Pro Leu Val Gly Thr Pro Val Cys 770 775 780 Ile Asn Gly Leu Met Leu Leu Glu Ile Lys Asp Thr Glu Lys Tyr Cys 785 790 795 800 Ala Leu Ala Pro Asn Met Met Val Thr Asn Asn Thr Phe Thr Leu Lys 805 810 815 Gly Gly Ala Pro Thr Lys Val Thr Phe Gly Asp Asp Thr Val Ile Glu 820 825 830 Val Gln Gly Tyr Lys Ser Val Asn Ile Thr Phe Glu Leu Asp Glu Arg 835 840 845 Ile Asp Lys Val Leu Asn Glu Lys Cys Ser Ala Tyr Thr Val Glu Leu 850 855 860 Gly Thr Glu Val Asn Glu Phe Ala Cys Val Val Ala Asp Ala Val Ile 865 870 875 880 Lys Thr Leu Gln Pro Val Ser Glu Leu Leu Thr Pro Leu Gly Ile Asp 885 890 895 Leu Asp Glu Trp Ser Met Ala Thr Tyr Tyr Leu Phe Asp Glu Ser Gly 900 905 910 Glu Phe Lys Leu Ala Ser His Met Tyr Cys Ser Phe Tyr Pro Pro Asp 915 920 925 Glu Asp Glu Glu Glu Gly Asp Cys Glu Glu Glu Glu Phe Glu Pro Ser 930 935 940 Thr Gln Tyr Glu Tyr Gly Thr Glu Asp Asp Tyr Gln Gly Lys Pro Leu 945 950 955 960 Glu Phe Gly Ala Thr Ser Ala Ala Leu Gln Pro Glu Glu Glu Gln Glu 965 970 975 Glu Asp Trp Leu Asp Asp Asp Ser Gln Gln Thr Val Gly Gln Gln Asp 980 985 990 Gly Ser Glu Asp Asn Gln Thr Thr Ile Ile Gln Thr Ile Val Glu Val 995 1000 1005 Gln Pro Gln Leu Glu Met Glu Leu Thr Pro Val Val Gln Thr Ile 1010 1015 1020 Glu Val Asn Ser Phe Ser Gly Tyr Leu Lys Leu Thr Asp Asn Val 1025 1030 1035 Tyr Ile Lys Asn Ala Asp Ile Val Glu Glu Ala Lys Lys Val Lys 1040 1045 1050 Pro Thr Val Val Val Asn Ala Ala Asn Val Tyr Leu Lys His Gly 1055 1060 1065 Gly Gly Val Ala Gly Ala Leu Asn Lys Ala Thr Asn Asn Ala Met 1070 1075 1080 Gln Val Glu Ser Asp Asp Tyr Ile Ala Thr Asn Gly Pro Leu Lys 1085 1090 1095 Val Gly Gly Ser Cys Val Leu Ser Gly His Asn Leu Ala Lys His 1100 1105 1110 Cys Leu His Val Val Gly Pro Asn Val Asn Lys Gly Glu Asp Ile 1115 1120 1125 Gln Leu Leu Lys Ser Ala Tyr Glu Asn Phe Asn Gln His Glu Val 1130 1135 1140 Leu Leu Ala Pro Leu Leu Ser Ala Gly Ile Phe Gly Ala Asp Pro 1145 1150 1155 Ile His Ser Leu Arg Val Cys Val Asp Thr Val Arg Thr Asn Val 1160 1165 1170 Tyr Leu Ala Val Phe Asp Lys Asn Leu Tyr Asp Lys Leu Val Ser 1175 1180 1185 Ser Phe Leu Glu Met Lys Ser Glu Lys Gln Val Glu Gln Lys Ile 1190 1195 1200 Ala Glu Ile Pro Lys Glu Glu Val Lys Pro Phe Ile Thr Glu Ser 1205 1210 1215 Lys Pro Ser Val Glu Gln Arg Lys Gln Asp Asp Lys Lys Ile Lys 1220 1225 1230 Ala Cys Val Glu Glu Val Thr Thr Thr Leu Glu Glu Thr Lys Phe 1235 1240 1245 Leu Thr Glu Asn Leu Leu Leu Tyr Ile Asp Ile Asn Gly Asn Leu 1250 1255 1260 His Pro Asp Ser Ala Thr Leu Val Ser Asp Ile Asp Ile Thr Phe 1265 1270 1275 Leu Lys Lys Asp Ala Pro Tyr Ile Val Gly Asp Val Val Gln Glu 1280 1285 1290 Gly Val Leu Thr Ala Val Val Ile Pro Thr Lys Lys Ala Gly Gly 1295 1300 1305 Thr Thr Glu Met Leu Ala Lys Ala Leu Arg Lys Val Pro Thr Asp 1310 1315 1320 Asn Tyr Ile Thr Thr Tyr Pro Gly Gln Gly Leu Asn Gly Tyr Thr 1325 1330 1335 Val Glu Glu Ala Lys Thr Val Leu Lys Lys Cys Lys Ser Ala Phe 1340 1345 1350 Tyr Ile Leu Pro Ser Ile Ile Ser Asn Glu Lys Gln Glu Ile Leu 1355 1360 1365 Gly Thr Val Ser Trp Asn Leu Arg Glu Met Leu Ala His Ala Glu 1370 1375 1380 Glu Thr Arg Lys Leu Met Pro Val Cys Val Glu Thr Lys Ala Ile 1385 1390 1395 Val Ser Thr Ile Gln Arg Lys Tyr Lys Gly Ile Lys Ile Gln Glu 1400 1405 1410 Gly Val Val Asp Tyr Gly Ala Arg Phe Tyr Phe Tyr Thr Ser Lys 1415 1420 1425 Thr Thr Val Ala Ser Leu Ile Asn Thr Leu Asn Asp Leu Asn Glu 1430 1435 1440 Thr Leu Val Thr Met Pro Leu Gly Tyr Val Thr His Gly Leu Asn 1445 1450 1455 Leu Glu Glu Ala Ala Arg Tyr Met Arg Ser Leu Lys Val Pro Ala 1460 1465 1470 Thr Val Ser Val Ser Ser Pro Asp Ala Val Thr Ala Tyr Asn Gly 1475 1480 1485 Tyr Leu Thr Ser Ser Ser Lys Thr Pro Glu Glu His Phe Ile Glu 1490 1495 1500 Thr Ile Ser Leu Ala Gly Ser Tyr Lys Asp Trp Ser Tyr Ser Gly 1505 1510 1515 Gln Ser Thr Gln Leu Gly Ile Glu Phe Leu Lys Arg Gly Asp Lys 1520 1525 1530 Ser Val Tyr Tyr Thr Ser Asn Pro Thr Thr Phe His Leu Asp Gly 1535 1540 1545 Glu Val Ile Thr Phe Asp Asn Leu Lys Thr Leu Leu Ser Leu Arg 1550 1555 1560 Glu Val Arg Thr Ile Lys Val Phe Thr Thr Val Asp Asn Ile Asn 1565 1570 1575 Leu His Thr Gln Val Val Asp Met Ser Met Thr Tyr Gly Gln Gln 1580 1585 1590 Phe Gly Pro Thr Tyr Leu Asp Gly Ala Asp Val Thr Lys Ile Lys 1595 1600 1605 Pro His Asn Ser His Glu Gly Lys Thr Phe Tyr Val Leu Pro Asn 1610 1615 1620 Asp Asp Thr Leu Arg Val Glu Ala Phe Glu Tyr Tyr His Thr Thr 1625 1630 1635 Asp Pro Ser Phe Leu Gly Arg Tyr Met Ser Ala Leu Asn His Thr 1640 1645 1650 Lys Lys Trp Lys Tyr Pro Gln Val Asn Gly Leu Thr Ser Ile Lys 1655 1660 1665 Trp Ala Asp Asn Asn Cys Tyr Leu Ala Thr Ala Leu Leu Thr Leu 1670 1675 1680 Gln Gln Ile Glu Leu Lys Phe Asn Pro Pro Ala Leu Gln Asp Ala 1685 1690 1695 Tyr Tyr Arg Ala Arg Ala Gly Glu Ala Asp Asn Phe Cys Ala Leu 1700 1705 1710 Ile Leu Ala Tyr Cys Asn Lys Thr Val Gly Glu Leu Gly Asp Val 1715 1720 1725 Arg Glu Thr Met Ser Tyr Leu Phe Gln His Ala Asn Leu Asp Ser 1730 1735 1740 Cys Lys Arg Val Leu Asn Val Val Cys Lys Thr Cys Gly Gln Gln 1745 1750 1755 Gln Thr Thr Leu Lys Gly Val Glu Ala Val Met Tyr Met Gly Thr 1760 1765 1770 Leu Ser Tyr Glu Gln Phe Lys Lys Gly Val Gln Ile Pro Cys Thr 1775 1780 1785 Cys Gly Lys Gln Ala Thr Lys Tyr Leu Val Gln Gln Glu Ser Pro 1790 1795 1800 Phe Val Met Met Ser Ala Pro Pro Ala Gln Tyr Glu Leu Lys His 1805 1810 1815 Gly Thr Phe Thr Cys Ala Ser Glu Tyr Thr Gly Asn Tyr Gln Cys 1820 1825 1830 Gly His Tyr Lys His Ile Thr Ser Lys Glu Thr Leu Tyr Cys Ile 1835 1840 1845 Asp Gly Ala Leu Leu Thr Lys Ser Ser Glu Tyr Lys Gly Pro Ile 1850 1855 1860 Thr Asp Val Phe Tyr Lys Glu Asn Ser Tyr Thr Thr Thr Ile Lys 1865 1870 1875 Pro Val Thr Tyr Lys Leu Asp Gly Val Val Cys Thr Glu Ile Asp 1880 1885 1890 Pro Lys Leu Asp Asn Tyr Tyr Lys Lys Asp Asn Ser Tyr Phe Thr 1895 1900 1905 Glu Gln Pro Ile Asp Leu Val Pro Asn Gln Pro Tyr Pro Asn Ala 1910 1915 1920 Ser Phe Asp Asn Phe Lys Phe Val Cys Asp Asn Ile Lys Phe Ala 1925 1930 1935 Asp Asp Leu Asn Gln Leu Thr Gly Tyr Lys Lys Pro Ala Ser Arg 1940 1945 1950 Glu Leu Lys Val Thr Phe Phe Pro Asp Leu Asn Gly Asp Val Val 1955 1960 1965 Ala Ile Asp Tyr Lys His Tyr Thr Pro Ser Phe Lys Lys Gly Ala 1970 1975 1980 Lys Leu Leu His Lys Pro Ile Val Trp His Val Asn Asn Ala Thr 1985 1990 1995 Asn Lys Ala Thr Tyr Lys Pro Asn Thr Trp Cys Ile Arg Cys Leu 2000 2005 2010 Trp Ser Thr Lys Pro Val Glu Thr Ser Asn Ser Phe Asp Val Leu 2015 2020 2025 Lys Ser Glu Asp Ala Gln Gly Met Asp Asn Leu Ala Cys Glu Asp 2030 2035 2040 Leu Lys Pro Val Ser Glu Glu Val Val Glu Asn Pro Thr Ile Gln 2045 2050 2055 Lys Asp Val Leu Glu Cys Asn Val Lys Thr Thr Glu Val Val Gly 2060 2065 2070 Asp Ile Ile Leu Lys Pro Ala Asn Asn Ser Leu Lys Ile Thr Glu 2075 2080 2085 Glu Val Gly His Thr Asp Leu Met Ala Ala Tyr Val Asp Asn Ser 2090 2095 2100 Ser Leu Thr Ile Lys Lys Pro Asn Glu Leu Ser Arg Val Leu Gly 2105 2110 2115 Leu Lys Thr Leu Ala Thr His Gly Leu Ala Ala Val Asn Ser Val 2120 2125 2130 Pro Trp Asp Thr Ile Ala Asn Tyr Ala Lys Pro Phe Leu Asn Lys 2135 2140 2145 Val Val Ser Thr Thr Thr Asn Ile Val Thr Arg Cys Leu Asn Arg 2150 2155 2160 Val Cys Thr Asn Tyr Met Pro Tyr Phe Phe Thr Leu Leu Leu Gln 2165 2170 2175 Leu Cys Thr Phe Thr Arg Ser Thr Asn Ser Arg Ile Lys Ala Ser 2180 2185 2190 Met Pro Thr Thr Ile Ala Lys Asn Thr Val Lys Ser Val Gly Lys 2195 2200 2205 Phe Cys Leu Glu Ala Ser Phe Asn Tyr Leu Lys Ser Pro Asn Phe 2210 2215 2220 Ser Lys Leu Ile Asn Ile Thr Ile Trp Phe Leu Leu Leu Ser Val 2225 2230 2235 Cys Leu Gly Ser Leu Ile Tyr Ser Thr Ala Ala Leu Gly Val Leu 2240 2245 2250 Met Ser Asn Leu Gly Met Pro Ser Tyr Cys Thr Gly Tyr Arg Glu 2255 2260 2265 Gly Tyr Leu Asn Ser Thr Asn Val Thr Ile Ala Thr Tyr Cys Thr 2270 2275 2280 Gly Ser Ile Pro Cys Ser Val Cys Leu Ser Gly Leu Asp Ser Leu 2285 2290 2295 Asp Thr Tyr Pro Ser Leu Glu Thr Ile Gln Ile Thr Ile Ser Ser 2300 2305 2310 Phe Lys Trp Asp Leu Thr Ala Phe Gly Leu Val Ala Glu Trp Phe 2315 2320 2325 Leu Ala Tyr Ile Leu Phe Thr Arg Phe Phe Tyr Val Leu Gly Leu 2330 2335 2340 Ala Ala Ile Met Gln Leu Phe Phe Ser Tyr Phe Ala Val His Phe 2345 2350 2355 Ile Ser Asn Ser Trp Leu Met Trp Leu Ile Ile Asn Leu Val Gln 2360 2365 2370 Met Ala Pro Ile Ser Ala Met Val Arg Met Tyr Ile Phe Phe Ala 2375 2380 2385 Ser Phe Tyr Tyr Val Trp Lys Ser Tyr Val His Val Val Asp Gly 2390 2395 2400 Cys Asn Ser Ser Thr Cys Met Met Cys Tyr Lys Arg Asn Arg Ala 2405 2410 2415 Thr Arg Val Glu Cys Thr Thr Ile Val Asn Gly Val Arg Arg Ser 2420 2425 2430 Phe Tyr Val Tyr Ala Asn Gly Gly Lys Gly Phe Cys Lys Leu His 2435 2440 2445 Asn Trp Asn Cys Val Asn Cys Asp Thr Phe Cys Ala Gly Ser Thr 2450 2455 2460 Phe Ile Ser Asp Glu Val Ala Arg Asp Leu Ser Leu Gln Phe Lys 2465 2470 2475 Arg Pro Ile Asn Pro Thr Asp Gln Ser Ser Tyr Ile Val Asp Ser 2480 2485 2490 Val Thr Val Lys Asn Gly Ser Ile His Leu Tyr Phe Asp Lys Ala 2495 2500 2505 Gly Gln Lys Thr Tyr Glu Arg His Ser Leu Ser His Phe Val Asn 2510 2515 2520 Leu Asp Asn Leu Arg Ala Asn Asn Thr Lys Gly Ser Leu Pro Ile 2525 2530 2535 Asn Val Ile Val Phe Asp Gly Lys Ser Lys Cys Glu Glu Ser Ser 2540 2545 2550 Ala Lys Ser Ala Ser Val Tyr Tyr Ser Gln Leu Met Cys Gln Pro 2555 2560 2565 Ile Leu Leu Leu Asp Gln Ala Leu Val Ser Asp Val Gly Asp Ser 2570 2575 2580 Ala Glu Val Ala Val Lys Met Phe Asp Ala Tyr Val Asn Thr Phe 2585 2590 2595 Ser Ser Thr Phe Asn Val Pro Met Glu Lys Leu Lys Thr Leu Val 2600 2605 2610 Ala Thr Ala Glu Ala Glu Leu Ala Lys Asn Val Ser Leu Asp Asn 2615 2620 2625 Val Leu Ser Thr Phe Ile Ser Ala Ala Arg Gln Gly Phe Val Asp 2630 2635 2640 Ser Asp Val Glu Thr Lys Asp Val Val Glu Cys Leu Lys Leu Ser 2645 2650 2655 His Gln Ser Asp Ile Glu Val Thr Gly Asp Ser Cys Asn Asn Tyr 2660 2665 2670 Met Leu Thr Tyr Asn Lys Val Glu Asn Met Thr Pro Arg Asp Leu 2675 2680 2685 Gly Ala Cys Ile Asp Cys Ser Ala Arg His Ile Asn Ala Gln Val 2690 2695 2700 Ala Lys Ser His Asn Ile Ala Leu Ile Trp Asn Val Lys Asp Phe 2705 2710 2715 Met Ser Leu Ser Glu Gln Leu Arg Lys Gln Ile Arg Ser Ala Ala 2720 2725 2730 Lys Lys Asn Asn Leu Pro Phe Lys Leu Thr Cys Ala Thr Thr Arg 2735 2740 2745 Gln Val Val Asn Val Val Thr Thr Lys Ile Ala Leu Lys Gly Gly 2750 2755 2760 Lys Ile Val Asn Asn Trp Leu Lys Gln Leu Ile Lys Val Thr Leu 2765 2770 2775 Val Phe Leu Phe Val Ala Ala Ile Phe Tyr Leu Ile Thr Pro Val 2780 2785 2790 His Val Met Ser Lys His Thr Asp Phe Ser Ser Glu Ile Ile Gly 2795 2800 2805 Tyr Lys Ala Ile Asp Gly Gly Val Thr Arg Asp Ile Ala Ser Thr 2810 2815 2820 Asp Thr Cys Phe Ala Asn Lys His Ala Asp Phe Asp Thr Trp Phe 2825 2830 2835 Ser Gln Arg Gly Gly Ser Tyr Thr Asn Asp Lys Ala Cys Pro Leu 2840 2845 2850 Ile Ala Ala Val Ile Thr Arg Glu Val Gly Phe Val Val Pro Gly 2855 2860 2865 Leu Pro Gly Thr Ile Leu Arg Thr Thr Asn Gly Asp Phe Leu His 2870 2875 2880 Phe Leu Pro Arg Val Phe Ser Ala Val Gly Asn Ile Cys Tyr Thr 2885 2890 2895 Pro Ser Lys Leu Ile Glu Tyr Thr Asp Phe Ala Thr Ser Ala Cys 2900 2905 2910 Val Leu Ala Ala Glu Cys Thr Ile Phe Lys Asp Ala Ser Gly Lys 2915 2920 2925 Pro Val Pro Tyr Cys Tyr Asp Thr Asn Val Leu Glu Gly Ser Val 2930 2935 2940 Ala Tyr Glu Ser Leu Arg Pro Asp Thr Arg Tyr Val Leu Met Asp 2945 2950 2955 Gly Ser Ile Ile Gln Phe Pro Asn Thr Tyr Leu Glu Gly Ser Val 2960 2965 2970 Arg Val Val Thr Thr Phe Asp Ser Glu Tyr Cys Arg His Gly Thr 2975 2980 2985 Cys Glu Arg Ser Glu Ala Gly Val Cys Val Ser Thr Ser Gly Arg 2990 2995 3000 Trp Val Leu Asn Asn Asp Tyr Tyr Arg Ser Leu Pro Gly Val Phe 3005 3010 3015 Cys Gly Val Asp Ala Val Asn Leu Leu Thr Asn Met Phe Thr Pro 3020 3025 3030 Leu Ile Gln Pro Ile Gly Ala Leu Asp Ile Ser Ala Ser Ile Val 3035 3040 3045 Ala Gly Gly Ile Val Ala Ile Val Val Thr Cys Leu Ala Tyr Tyr 3050 3055 3060 Phe Met Arg Phe Arg Arg Ala Phe Gly Glu Tyr Ser His Val Val 3065 3070 3075 Ala Phe Asn Thr Leu Leu Phe Leu Met Ser Phe Thr Val Leu Cys 3080 3085 3090 Leu Thr Pro Val Tyr Ser Phe Leu Pro Gly Val Tyr Ser Val Ile 3095 3100 3105 Tyr Leu Tyr Leu Thr Phe Tyr Leu Thr Asn Asp Val Ser Phe Leu 3110 3115 3120 Ala His Ile Gln Trp Met Val Met Phe Thr Pro Leu Val Pro Phe 3125 3130 3135 Trp Ile Thr Ile Ala Tyr Ile Ile Cys Ile Ser Thr Lys His Phe 3140 3145 3150 Tyr Trp Phe Phe Ser Asn Tyr Leu Lys Arg Arg Val Val Phe Asn 3155 3160 3165 Gly Val Ser Phe Ser Thr Phe Glu Glu Ala Ala Leu Cys Thr Phe 3170 3175 3180 Leu Leu Asn Lys Glu Met Tyr Leu Lys Leu Arg Ser Asp Val Leu 3185 3190 3195 Leu Pro Leu Thr Gln Tyr Asn Arg Tyr Leu Ala Leu Tyr Asn Lys 3200 3205 3210 Tyr Lys Tyr Phe Ser Gly Ala Met Asp Thr Thr Ser Tyr Arg Glu 3215 3220 3225 Ala Ala Cys Cys His Leu Ala Lys Ala Leu Asn Asp Phe Ser Asn 3230 3235 3240 Ser Gly Ser Asp Val Leu Tyr Gln Pro Pro Gln Thr Ser Ile Thr 3245 3250 3255 Ser Ala Val Leu Gln Ser Gly Phe Arg Lys Met Ala Phe Pro Ser 3260 3265 3270 Gly Lys Val Glu Gly Cys Met Val Gln Val Thr Cys Gly Thr Thr 3275 3280 3285 Thr Leu Asn Gly Leu Trp Leu Asp Asp Val Val Tyr Cys Pro Arg 3290 3295 3300 His Val Ile Cys Thr Ser Glu Asp Met Leu Asn Pro Asn Tyr Glu 3305 3310 3315 Asp Leu Leu Ile Arg Lys Ser Asn His Asn Phe Leu Val Gln Ala 3320 3325 3330 Gly Asn Val Gln Leu Arg Val Ile Gly His Ser Met Gln Asn Cys 3335 3340 3345 Val Leu Lys Leu Lys Val Asp Thr Ala Asn Pro Lys Thr Pro Lys 3350 3355 3360 Tyr Lys Phe Val Arg Ile Gln Pro Gly Gln Thr Phe Ser Val Leu 3365 3370 3375 Ala Cys Tyr Asn Gly Ser Pro Ser Gly Val Tyr Gln Cys Ala Met 3380 3385 3390 Arg Pro Asn Phe Thr Ile Lys Gly Ser Phe Leu Asn Gly Ser Cys 3395 3400 3405 Gly Ser Val Gly Phe Asn Ile Asp Tyr Asp Cys Val Ser Phe Cys 3410 3415 3420 Tyr Met His His Met Glu Leu Pro Thr Gly Val His Ala Gly Thr 3425 3430 3435 Asp Leu Glu Gly Asn Phe Tyr Gly Pro Phe Val Asp Arg Gln Thr 3440 3445 3450 Ala Gln Ala Ala Gly Thr Asp Thr Thr Ile Thr Val Asn Val Leu 3455 3460 3465 Ala Trp Leu Tyr Ala Ala Val Ile Asn Gly Asp Arg Trp Phe Leu 3470 3475 3480 Asn Arg Phe Thr Thr Thr Leu Asn Asp Phe Asn Leu Val Ala Met 3485 3490 3495 Lys Tyr Asn Tyr Glu Pro Leu Thr Gln Asp His Val Asp Ile Leu 3500 3505 3510 Gly Pro Leu Ser Ala Gln Thr Gly Ile Ala Val Leu Asp Met Cys 3515 3520 3525 Ala Ser Leu Lys Glu Leu Leu Gln Asn Gly Met Asn Gly Arg Thr 3530 3535 3540 Ile Leu Gly Ser Ala Leu Leu Glu Asp Glu Phe Thr Pro Phe Asp 3545 3550 3555 Val Val Arg Gln Cys Ser Gly Val Thr Phe Gln Ser Ala Val Lys 3560 3565 3570 Arg Thr Ile Lys Gly Thr His His Trp Leu Leu Leu Thr Ile Leu 3575 3580 3585 Thr Ser Leu Leu Val Leu Val Gln Ser Thr Gln Trp Ser Leu Phe 3590 3595 3600 Phe Phe Leu Tyr Glu Asn Ala Phe Leu Pro Phe Ala Met Gly Ile 3605 3610 3615 Ile Ala Met Ser Ala Phe Ala Met Met Phe Val Lys His Lys His 3620 3625 3630 Ala Phe Leu Cys Leu Phe Leu Leu Pro Ser Leu Ala Thr Val Ala 3635 3640 3645 Tyr Phe Asn Met Val Tyr Met Pro Ala Ser Trp Val Met Arg Ile 3650 3655 3660 Met Thr Trp Leu Asp Met Val Asp Thr Ser Leu Lys Leu Lys Asp 3665 3670 3675 Cys Val Met Tyr Ala Ser Ala Val Val Leu Leu Ile Leu Met Thr 3680 3685 3690 Ala Arg Thr Val Tyr Asp Asp Gly Ala Arg Arg Val Trp Thr Leu 3695 3700 3705 Met Asn Val Leu Thr Leu Val Tyr Lys Val Tyr Tyr Gly Asn Ala 3710 3715 3720 Leu Asp Gln Ala Ile Ser Met Trp Ala Leu Ile Ile Ser Val Thr 3725 3730 3735 Ser Asn Tyr Ser Gly Val Val Thr Thr Val Met Phe Leu Ala Arg 3740 3745 3750 Gly Ile Val Phe Met Cys Val Glu Tyr Cys Pro Ile Phe Phe Ile 3755 3760 3765 Thr Gly Asn Thr Leu Gln Cys Ile Met Leu Val Tyr Cys Phe Leu 3770 3775 3780 Gly Tyr Phe Cys Thr Cys Tyr Phe Gly Leu Phe Cys Leu Leu Asn 3785 3790 3795 Arg Tyr Phe Arg Leu Thr Leu Gly Val Tyr Asp Tyr Leu Val Ser 3800 3805 3810 Thr Gln Glu Phe Arg Tyr Met Asn Ser Gln Gly Leu Leu Pro Pro 3815 3820 3825 Lys Asn Ser Ile Asp Ala Phe Lys Leu Asn Ile Lys Leu Leu Gly 3830 3835 3840 Val Gly Gly Lys Pro Cys Ile Lys Val Ala Thr Val Gln Ser Lys 3845 3850 3855 Met Ser Asp Val Lys Cys Thr Ser Val Val Leu Leu Ser Val Leu 3860 3865 3870 Gln Gln Leu Arg Val Glu Ser Ser Ser Lys Leu Trp Ala Gln Cys 3875 3880 3885 Val Gln Leu His Asn Asp Ile Leu Leu Ala Lys Asp Thr Thr Glu 3890 3895 3900 Ala Phe Glu Lys Met Val Ser Leu Leu Ser Val Leu Leu Ser Met 3905 3910 3915 Gln Gly Ala Val Asp Ile Asn Lys Leu Cys Glu Glu Met Leu Asp 3920 3925 3930 Asn Arg Ala Thr Leu Gln Ala Ile Ala Ser Glu Phe Ser Ser Leu 3935 3940 3945 Pro Ser Tyr Ala Ala Phe Ala Thr Ala Gln Glu Ala Tyr Glu Gln 3950 3955 3960 Ala Val Ala Asn Gly Asp Ser Glu Val Val Leu Lys Lys Leu Lys 3965 3970 3975 Lys Ser Leu Asn Val Ala Lys Ser Glu Phe Asp Arg Asp Ala Ala 3980 3985 3990 Met Gln Arg Lys Leu Glu Lys Met Ala Asp Gln Ala Met Thr Gln 3995 4000 4005 Met Tyr Lys Gln Ala Arg Ser Glu Asp Lys Arg Ala Lys Val Thr 4010 4015 4020 Ser Ala Met Gln Thr Met Leu Phe Thr Met Leu Arg Lys Leu Asp 4025 4030 4035 Asn Asp Ala Leu Asn Asn Ile Ile Asn Asn Ala Arg Asp Gly Cys 4040 4045 4050 Val Pro Leu Asn Ile Ile Pro Leu Thr Thr Ala Ala Lys Leu Met 4055 4060 4065 Val Val Ile Pro Asp Tyr Asn Thr Tyr Lys Asn Thr Cys Asp Gly 4070 4075 4080 Thr Thr Phe Thr Tyr Ala Ser Ala Leu Trp Glu Ile Gln Gln Val 4085 4090 4095 Val Asp Ala Asp Ser Lys Ile Val Gln Leu Ser Glu Ile Ser Met 4100 4105 4110 Asp Asn Ser Pro Asn Leu Ala Trp Pro Leu Ile Val Thr Ala Leu 4115 4120 4125 Arg Ala Asn Ser Ala Val Lys Leu Gln Asn Asn Glu Leu Ser Pro 4130 4135 4140 Val Ala Leu Arg Gln Met Ser Cys Ala Ala Gly Thr Thr Gln Thr 4145 4150 4155 Ala Cys Thr Asp Asp Asn Ala Leu Ala Tyr Tyr Asn Thr Thr Lys 4160 4165 4170 Gly Gly Arg Phe Val Leu Ala Leu Leu Ser Asp Leu Gln Asp Leu 4175 4180 4185 Lys Trp Ala Arg Phe Pro Lys Ser Asp Gly Thr Gly Thr Ile Tyr 4190 4195 4200 Thr Glu Leu Glu Pro Pro Cys Arg Phe Val Thr Asp Thr Pro Lys 4205 4210 4215 Gly Pro Lys Val Lys Tyr Leu Tyr Phe Ile Lys Gly Leu Asn Asn 4220 4225 4230 Leu Asn Arg Gly Met Val Leu Gly Ser Leu Ala Ala Thr Val Arg 4235 4240 4245 Leu Gln Ala Gly Asn Ala Thr Glu Val Pro Ala Asn Ser Thr Val 4250 4255 4260 Leu Ser Phe Cys Ala Phe Ala Val Asp Ala Ala Lys Ala Tyr Lys 4265 4270 4275 Asp Tyr Leu Ala Ser Gly Gly Gln Pro Ile Thr Asn Cys Val Lys 4280 4285 4290 Met Leu Cys Thr His Thr Gly Thr Gly Gln Ala Ile Thr Val Thr 4295 4300 4305 Pro Glu Ala Asn Met Asp Gln Glu Ser Phe Gly Gly Ala Ser Cys 4310 4315 4320 Cys Leu Tyr Cys Arg Cys His Ile Asp His Pro Asn Pro Lys Gly 4325 4330 4335 Phe Cys Asp Leu Lys Gly Lys Tyr Val Gln Ile Pro Thr Thr Cys 4340 4345 4350 Ala Asn Asp Pro Val Gly Phe Thr Leu Lys Asn Thr Val Cys Thr 4355 4360 4365 Val Cys Gly Met Trp Lys Gly Tyr Gly Cys Ser Cys Asp Gln Leu 4370 4375 4380 Arg Glu Pro Met Leu Gln Ser Ala Asp Ala Gln Ser Phe Leu Asn 4385 4390 4395 Gly Phe Ala Val 4400 <210> 403 <211> 1270 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 403 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp Asn Pro 65 70 75 80 Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu Lys Ser 85 90 95 Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser Lys Thr 100 105 110 Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile Lys Val 115 120 125 Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr His Lys 130 135 140 Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr Ser Ser Ala 145 150 155 160 Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met Asp Leu 165 170 175 Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val Phe Lys 180 185 190 Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro Ile Asn 195 200 205 Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu Val 210 215 220 Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu Ala 225 230 235 240 Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr 245 250 255 Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe 260 265 270 Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys 275 280 285 Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr 290 295 300 Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr 305 310 315 320 Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly 325 330 335 Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg 340 345 350 Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser 355 360 365 Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu 370 375 380 Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg 385 390 395 400 Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala 405 410 415 Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala 420 425 430 Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr 435 440 445 Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp 450 455 460 Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val 465 470 475 480 Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro 485 490 495 Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe 500 505 510 Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr 515 520 525 Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr 530 535 540 Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln 545 550 555 560 Gln Phe Gly Arg Asp Ile Asp Asp Thr Thr Asp Ala Val Arg Asp Pro 565 570 575 Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Val 580 585 590 Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu 595 600 605 Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala Asp 610 615 620 Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val Phe 625 630 635 640 Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn Ser 645 650 655 Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln 660 665 670 Thr Gln Thr Asn Ser His Arg Arg Ala Arg Ser Val Ala Ser Gln Ser 675 680 685 Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr 690 695 700 Ser Asn Asn Ser Ile Ala Ile Pro Ile Asn Phe Thr Ile Ser Val Thr 705 710 715 720 Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr 725 730 735 Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln 740 745 750 Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala 755 760 765 Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln 770 775 780 Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser 785 790 795 800 Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu 805 810 815 Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys 820 825 830 Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys 835 840 845 Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp 850 855 860 Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr 865 870 875 880 Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala 885 890 895 Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val 900 905 910 Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile 915 920 925 Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys 930 935 940 Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val 945 950 955 960 Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp 965 970 975 Ile Leu Ala Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp Arg 980 985 990 Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln 995 1000 1005 Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala 1010 1015 1020 Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp 1025 1030 1035 Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala 1040 1045 1050 Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln 1055 1060 1065 Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys 1070 1075 1080 Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His 1085 1090 1095 Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr 1100 1105 1110 Thr His Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly 1115 1120 1125 Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp 1130 1135 1140 Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser 1145 1150 1155 Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val 1160 1165 1170 Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys 1175 1180 1185 Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr 1190 1195 1200 Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly Phe Ile 1205 1210 1215 Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys Cys 1220 1225 1230 Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly 1235 1240 1245 Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys 1250 1255 1260 Gly Val Lys Leu His Tyr Thr 1265 1270 <210> 404 <211> 275 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 404 Met Asp Leu Phe Met Arg Ile Phe Thr Ile Gly Thr Val Thr Leu Lys 1 5 10 15 Gln Gly Glu Ile Lys Asp Ala Thr Pro Ser Asp Phe Val Arg Ala Thr 20 25 30 Ala Thr Ile Pro Ile Gln Ala Ser Leu Pro Phe Gly Trp Leu Ile Val 35 40 45 Gly Val Ala Leu Leu Ala Val Phe Gln Ser Ala Ser Lys Ile Ile Thr 50 55 60 Leu Lys Lys Arg Trp Gln Leu Ala Leu Ser Lys Gly Val His Phe Val 65 70 75 80 Cys Asn Leu Leu Leu Leu Phe Val Thr Val Tyr Ser His Leu Leu Leu 85 90 95 Val Ala Ala Gly Leu Glu Ala Pro Phe Leu Tyr Leu Tyr Ala Leu Val 100 105 110 Tyr Phe Leu Gln Ser Ile Asn Phe Val Arg Ile Ile Met Arg Leu Trp 115 120 125 Leu Cys Trp Lys Cys Arg Ser Lys Asn Pro Leu Leu Tyr Asp Ala Asn 130 135 140 Tyr Phe Leu Cys Trp His Thr Asn Cys Tyr Asp Tyr Cys Ile Pro Tyr 145 150 155 160 Asn Ser Val Thr Ser Ser Ile Val Ile Thr Ser Gly Asp Gly Thr Thr 165 170 175 Ser Pro Ile Ser Glu His Asp Tyr Gln Ile Gly Gly Tyr Thr Glu Lys 180 185 190 Trp Glu Ser Gly Val Lys Asp Cys Val Val Leu His Ser Tyr Phe Thr 195 200 205 Ser Asp Tyr Tyr Gln Leu Tyr Ser Thr Gln Leu Ser Thr Asp Thr Gly 210 215 220 Val Glu His Val Thr Phe Phe Ile Tyr Asn Lys Ile Val Asp Glu Pro 225 230 235 240 Glu Glu His Val Gln Ile His Thr Ile Asp Gly Ser Ser Gly Val Val 245 250 255 Asn Pro Val Met Glu Pro Ile Tyr Asp Glu Pro Thr Thr Thr Thr Ser 260 265 270 Val Pro Leu 275 <210> 405 <211> 75 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 405 Met Tyr Ser Phe Val Ser Glu Glu Thr Gly Thr Leu Ile Val Asn Ser 1 5 10 15 Val Leu Leu Phe Leu Ala Phe Val Val Phe Leu Leu Val Thr Leu Ala 20 25 30 Ile Leu Thr Ala Leu Arg Leu Cys Ala Tyr Cys Cys Asn Ile Val Asn 35 40 45 Val Ser Leu Val Lys Pro Ser Phe Tyr Val Tyr Ser Arg Val Lys Asn 50 55 60 Leu Asn Ser Ser Arg Val Pro Asp Leu Leu Val 65 70 75 <210> 406 <211> 222 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 406 Met Ala Asp Ser Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Lys Leu 1 5 10 15 Leu Glu Gln Trp Asn Leu Val Ile Gly Phe Leu Phe Leu Thr Trp Ile 20 25 30 Cys Leu Leu Gln Phe Ala Tyr Ala Asn Arg Asn Arg Phe Leu Tyr Ile 35 40 45 Ile Lys Leu Ile Phe Leu Trp Leu Leu Trp Pro Val Thr Leu Ala Cys 50 55 60 Phe Val Leu Ala Ala Val Tyr Arg Ile Asn Trp Ile Thr Gly Gly Ile 65 70 75 80 Ala Ile Ala Met Ala Cys Leu Val Gly Leu Met Trp Leu Ser Tyr Phe 85 90 95 Ile Ala Ser Phe Arg Leu Phe Ala Arg Thr Arg Ser Met Trp Ser Phe 100 105 110 Asn Pro Glu Thr Asn Ile Leu Leu Asn Val Pro Leu His Gly Thr Ile 115 120 125 Leu Thr Arg Pro Leu Leu Glu Ser Glu Leu Val Ile Gly Ala Val Ile 130 135 140 Leu Arg Gly His Leu Arg Ile Ala Gly His His Leu Gly Arg Cys Asp 145 150 155 160 Ile Lys Asp Leu Pro Lys Glu Ile Thr Val Ala Thr Ser Arg Thr Leu 165 170 175 Ser Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Ala Gly Asp Ser Gly 180 185 190 Phe Ala Ala Tyr Ser Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr 195 200 205 Asp His Ser Ser Ser Ser Asp Asn Ile Ala Leu Leu Val Gln 210 215 220 <210> 407 <211> 61 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 407 Met Phe His Leu Val Asp Phe Gln Val Thr Ile Ala Glu Ile Leu Leu 1 5 10 15 Ile Ile Met Arg Thr Phe Lys Val Ser Ile Trp Asn Leu Asp Tyr Ile 20 25 30 Ile Asn Leu Ile Ile Lys Asn Leu Ser Lys Ser Leu Thr Glu Asn Lys 35 40 45 Tyr Ser Gln Leu Asp Glu Glu Gln Pro Met Glu Ile Asp 50 55 60 <210> 408 <211> 121 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 408 Met Lys Ile Ile Leu Phe Leu Ala Leu Ile Thr Leu Ala Thr Cys Glu 1 5 10 15 Leu Tyr His Tyr Gln Glu Cys Val Arg Gly Thr Thr Val Leu Leu Lys 20 25 30 Glu Pro Cys Ser Ser Gly Thr Tyr Glu Gly Asn Ser Pro Phe His Pro 35 40 45 Leu Ala Asp Asn Lys Phe Ala Leu Thr Cys Phe Ser Thr Gln Phe Ala 50 55 60 Phe Ala Cys Pro Asp Gly Val Lys His Val Tyr Gln Leu Arg Ala Arg 65 70 75 80 Ser Val Ser Pro Lys Leu Phe Ile Arg Gln Glu Glu Val Gln Glu Leu 85 90 95 Tyr Ser Pro Ile Phe Leu Ile Val Ala Ala Ile Val Phe Ile Thr Leu 100 105 110 Cys Phe Thr Leu Lys Arg Lys Thr Glu 115 120 <210> 409 <211> 43 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 409 Met Ile Glu Leu Ser Leu Ile Asp Phe Tyr Leu Cys Phe Leu Ala Phe 1 5 10 15 Leu Leu Phe Leu Val Leu Ile Met Leu Ile Ile Phe Trp Phe Ser Leu 20 25 30 Glu Leu Gln Asp His Asn Glu Thr Cys His Ala 35 40 <210> 410 <211> 26 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 410 Met Lys Phe Leu Val Phe Leu Gly Ile Ile Thr Thr Val Ala Ala Phe 1 5 10 15 His Gln Glu Cys Ser Leu Gln Ser Cys Thr 20 25 <210> 411 <211> 419 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 411 Met Ser Leu Asn Gly Pro Gln Asn Gln Arg Asn Ala Pro Arg Ile Thr 1 5 10 15 Phe Gly Gly Pro Ser Asp Ser Thr Gly Ser Asn Gln Asn Gly Glu Arg 20 25 30 Ser Gly Ala Arg Ser Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn Asn 35 40 45 Thr Ala Ser Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Asp Leu 50 55 60 Lys Phe Pro Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Ser Pro 65 70 75 80 Asp Asp Gln Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Ile Arg Gly 85 90 95 Gly Asp Gly Lys Met Lys Asp Leu Ser Pro Arg Trp Tyr Phe Tyr Tyr 100 105 110 Leu Gly Thr Gly Pro Glu Ala Gly Leu Pro Tyr Gly Ala Asn Lys Asp 115 120 125 Gly Ile Ile Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys Asp 130 135 140 His Ile Gly Thr Arg Asn Pro Ala Asn Asn Ala Ala Ile Val Leu Gln 145 150 155 160 Leu Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly Ser 165 170 175 Arg Gly Gly Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg Asn 180 185 190 Ser Ser Arg Asn Ser Thr Pro Gly Ser Ser Lys Arg Thr Ser Pro Ala 195 200 205 Arg Met Ala Gly Asn Gly Gly Asp Ala Ala Leu Ala Leu Leu Leu Leu 210 215 220 Asp Arg Leu Asn Gln Leu Glu Ser Lys Met Phe Gly Lys Gly Gln Gln 225 230 235 240 Gln Gln Gly Gln Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser Lys 245 250 255 Lys Pro Arg Gln Lys Arg Thr Ala Thr Lys Ala Tyr Asn Val Thr Gln 260 265 270 Ala Phe Gly Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly Asp 275 280 285 Gln Glu Leu Ile Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln Ile 290 295 300 Ala Gln Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg Ile 305 310 315 320 Gly Met Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr Thr Gly Ala 325 330 335 Ile Lys Leu Asp Asp Lys Asp Pro Asn Phe Lys Asp Gln Val Ile Leu 340 345 350 Leu Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu Pro 355 360 365 Lys Lys Asp Lys Lys Lys Lys Ala Asp Glu Thr Gln Ala Leu Pro Gln 370 375 380 Arg Gln Lys Lys Gln Gln Thr Val Thr Leu Leu Pro Ala Ala Asp Leu 385 390 395 400 Asp Asp Phe Ser Lys Gln Leu Gln Gln Ser Met Ser Ser Ala Asp Ser 405 410 415 Thr Gln Ala <210> 412 <211> 38 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 412 Met Gly Tyr Ile Asn Val Phe Ala Phe Pro Phe Thr Ile Tyr Ser Leu 1 5 10 15 Leu Leu Cys Arg Met Asn Ser Arg Asn Tyr Ile Ala Gln Val Asp Val 20 25 30 Val Asn Phe Asn Leu Thr 35 <210> 413 <211> 7096 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 413 Met Glu Ser Leu Val Pro Gly Phe Asn Glu Lys Thr His Val Gln Leu 1 5 10 15 Ser Leu Pro Val Leu Gln Val Arg Asp Val Leu Val Arg Gly Phe Gly 20 25 30 Asp Ser Val Glu Glu Val Leu Ser Glu Ala Arg Gln His Leu Lys Asp 35 40 45 Gly Thr Cys Gly Leu Val Glu Val Glu Lys Gly Val Leu Pro Gln Leu 50 55 60 Glu Gln Pro Tyr Val Phe Ile Lys Arg Ser Asp Ala Arg Thr Ala Pro 65 70 75 80 His Gly His Val Met Val Glu Leu Val Ala Glu Leu Glu Gly Ile Gln 85 90 95 Tyr Gly Arg Ser Gly Glu Thr Leu Gly Val Leu Val Pro His Val Gly 100 105 110 Glu Ile Pro Val Ala Tyr Arg Lys Val Leu Leu Arg Lys Asn Gly Asn 115 120 125 Lys Gly Ala Gly Gly His Ser Tyr Gly Ala Asp Leu Lys Ser Phe Asp 130 135 140 Leu Gly Asp Glu Leu Gly Thr Asp Pro Tyr Glu Asp Phe Gln Glu Asn 145 150 155 160 Trp Asn Thr Lys His Ser Ser Gly Val Thr Arg Glu Leu Met Arg Glu 165 170 175 Leu Asn Gly Gly Ala Tyr Thr Arg Tyr Val Asp Asn Asn Phe Cys Gly 180 185 190 Pro Asp Gly Tyr Pro Leu Glu Cys Ile Lys Asp Leu Leu Ala Arg Ala 195 200 205 Gly Lys Ala Ser Cys Thr Leu Ser Glu Gln Leu Asp Phe Ile Asp Thr 210 215 220 Lys Arg Gly Val Tyr Cys Cys Arg Glu His Glu His Glu Ile Ala Trp 225 230 235 240 Tyr Thr Glu Arg Ser Glu Lys Ser Tyr Glu Leu Gln Thr Pro Phe Glu 245 250 255 Ile Lys Leu Ala Lys Lys Phe Asp Thr Phe Asn Gly Glu Cys Pro Asn 260 265 270 Phe Val Phe Pro Leu Asn Ser Ile Ile Lys Thr Ile Gln Pro Arg Val 275 280 285 Glu Lys Lys Lys Leu Asp Gly Phe Met Gly Arg Ile Arg Ser Val Tyr 290 295 300 Pro Val Ala Ser Pro Asn Glu Cys Asn Gln Met Cys Leu Ser Thr Leu 305 310 315 320 Met Lys Cys Asp His Cys Gly Glu Thr Ser Trp Gln Thr Gly Asp Phe 325 330 335 Val Lys Ala Thr Cys Glu Phe Cys Gly Thr Glu Asn Leu Thr Lys Glu 340 345 350 Gly Ala Thr Thr Cys Gly Tyr Leu Pro Gln Asn Ala Val Val Lys Ile 355 360 365 Tyr Cys Pro Ala Cys His Asn Ser Glu Val Gly Pro Glu His Ser Leu 370 375 380 Ala Glu Tyr His Asn Glu Ser Gly Leu Lys Thr Ile Leu Arg Lys Gly 385 390 395 400 Gly Arg Thr Ile Ala Phe Gly Gly Cys Val Phe Ser Tyr Val Gly Cys 405 410 415 His Asn Lys Cys Ala Tyr Trp Val Pro Arg Ala Ser Ala Asn Ile Gly 420 425 430 Cys Asn His Thr Gly Val Val Gly Glu Gly Ser Glu Gly Leu Asn Asp 435 440 445 Asn Leu Leu Glu Ile Leu Gln Lys Glu Lys Val Asn Ile Asn Ile Val 450 455 460 Gly Asp Phe Lys Leu Asn Glu Glu Ile Ala Ile Ile Leu Ala Ser Phe 465 470 475 480 Ser Ala Ser Thr Ser Ala Phe Val Glu Thr Val Lys Gly Leu Asp Tyr 485 490 495 Lys Ala Phe Lys Gln Ile Val Glu Ser Cys Gly Asn Phe Lys Val Thr 500 505 510 Lys Gly Lys Ala Lys Lys Gly Ala Trp Asn Ile Gly Glu Gln Lys Ser 515 520 525 Ile Leu Ser Pro Leu Tyr Ala Phe Ala Ser Glu Ala Ala Arg Val Val 530 535 540 Arg Ser Ile Phe Ser Arg Thr Leu Glu Thr Ala Gln Asn Ser Val Arg 545 550 555 560 Val Leu Gln Lys Ala Ala Ile Thr Ile Leu Asp Gly Ile Ser Gln Tyr 565 570 575 Ser Leu Arg Leu Ile Asp Ala Met Met Phe Thr Ser Asp Leu Ala Thr 580 585 590 Asn Asn Leu Val Val Met Ala Tyr Ile Thr Gly Gly Val Val Gln Leu 595 600 605 Thr Ser Gln Trp Leu Thr Asn Ile Phe Gly Thr Val Tyr Glu Lys Leu 610 615 620 Lys Pro Val Leu Asp Trp Leu Glu Glu Lys Phe Lys Glu Gly Val Glu 625 630 635 640 Phe Leu Arg Asp Gly Trp Glu Ile Val Lys Phe Ile Ser Thr Cys Ala 645 650 655 Cys Glu Ile Val Gly Gly Gln Ile Val Thr Cys Ala Lys Glu Ile Lys 660 665 670 Glu Ser Val Gln Thr Phe Phe Lys Leu Val Asn Lys Phe Leu Ala Leu 675 680 685 Cys Ala Asp Ser Ile Ile Ile Gly Gly Ala Lys Leu Lys Ala Leu Asn 690 695 700 Leu Gly Glu Thr Phe Val Thr His Ser Lys Gly Leu Tyr Arg Lys Cys 705 710 715 720 Val Lys Ser Arg Glu Glu Thr Gly Leu Leu Met Pro Leu Lys Ala Pro 725 730 735 Lys Glu Ile Ile Phe Leu Glu Gly Glu Thr Leu Pro Thr Glu Val Leu 740 745 750 Thr Glu Glu Val Val Leu Lys Thr Gly Asp Leu Gln Pro Leu Glu Gln 755 760 765 Pro Thr Ser Glu Ala Val Glu Ala Pro Leu Val Gly Thr Pro Val Cys 770 775 780 Ile Asn Gly Leu Met Leu Leu Glu Ile Lys Asp Thr Glu Lys Tyr Cys 785 790 795 800 Ala Leu Ala Pro Asn Met Met Val Thr Asn Asn Thr Phe Thr Leu Lys 805 810 815 Gly Gly Ala Pro Thr Lys Val Thr Phe Gly Asp Asp Thr Val Ile Glu 820 825 830 Val Gln Gly Tyr Lys Ser Val Asn Ile Thr Phe Glu Leu Asp Glu Arg 835 840 845 Ile Asp Lys Val Leu Asn Glu Lys Cys Ser Ala Tyr Thr Val Glu Leu 850 855 860 Gly Thr Glu Val Asn Glu Phe Ala Cys Val Val Ala Asp Ala Val Ile 865 870 875 880 Lys Thr Leu Gln Pro Val Ser Glu Leu Leu Thr Pro Leu Gly Ile Asp 885 890 895 Leu Asp Glu Trp Ser Met Ala Thr Tyr Tyr Leu Phe Asp Glu Ser Gly 900 905 910 Glu Phe Lys Leu Ala Ser His Met Tyr Cys Ser Phe Tyr Pro Pro Asp 915 920 925 Glu Asp Glu Glu Glu Gly Asp Cys Glu Glu Glu Glu Phe Glu Pro Ser 930 935 940 Thr Gln Tyr Glu Tyr Gly Thr Glu Asp Asp Tyr Gln Gly Lys Pro Leu 945 950 955 960 Glu Phe Gly Ala Thr Ser Ala Ala Leu Gln Pro Glu Glu Glu Gln Glu 965 970 975 Glu Asp Trp Leu Asp Asp Asp Ser Gln Gln Thr Val Gly Gln Gln Asp 980 985 990 Gly Ser Glu Asp Asn Gln Thr Thr Thr Ile Gln Thr Ile Val Glu Val 995 1000 1005 Gln Pro Gln Leu Glu Met Glu Leu Thr Pro Val Val Gln Thr Ile 1010 1015 1020 Glu Val Asn Ser Phe Ser Gly Tyr Leu Lys Leu Thr Asp Asn Val 1025 1030 1035 Tyr Ile Lys Asn Ala Asp Ile Val Glu Glu Ala Lys Lys Val Lys 1040 1045 1050 Pro Thr Val Val Val Asn Ala Ala Asn Val Tyr Leu Lys His Gly 1055 1060 1065 Gly Gly Val Ala Gly Ala Leu Asn Lys Ala Thr Asn Asn Ala Met 1070 1075 1080 Gln Val Glu Ser Asp Asp Tyr Ile Ala Thr Asn Gly Pro Leu Lys 1085 1090 1095 Val Gly Gly Ser Cys Val Leu Ser Gly His Asn Leu Ala Lys His 1100 1105 1110 Cys Leu His Val Val Gly Pro Asn Val Asn Lys Gly Glu Asp Ile 1115 1120 1125 Gln Leu Leu Lys Ser Ala Tyr Glu Asn Phe Asn Gln His Glu Val 1130 1135 1140 Leu Leu Ala Pro Leu Leu Ser Ala Gly Ile Phe Gly Ala Asp Pro 1145 1150 1155 Ile His Ser Leu Arg Val Cys Val Asp Thr Val Arg Thr Asn Val 1160 1165 1170 Tyr Leu Ala Val Phe Asp Lys Asn Leu Tyr Asp Lys Leu Val Ser 1175 1180 1185 Ser Phe Leu Glu Met Lys Ser Glu Lys Gln Val Glu Gln Lys Ile 1190 1195 1200 Ala Glu Ile Pro Lys Glu Glu Val Lys Pro Phe Ile Thr Glu Ser 1205 1210 1215 Lys Pro Ser Val Glu Gln Arg Lys Gln Asp Asp Lys Lys Ile Lys 1220 1225 1230 Ala Cys Val Glu Glu Val Thr Thr Thr Leu Glu Glu Thr Lys Phe 1235 1240 1245 Leu Thr Glu Asn Leu Leu Leu Tyr Ile Asp Ile Asn Gly Asn Leu 1250 1255 1260 His Pro Asp Ser Ala Thr Leu Val Ser Asp Ile Asp Ile Thr Phe 1265 1270 1275 Leu Lys Lys Asp Ala Pro Tyr Ile Val Gly Asp Val Val Gln Glu 1280 1285 1290 Gly Val Leu Thr Ala Val Val Ile Pro Thr Lys Lys Ala Gly Gly 1295 1300 1305 Thr Thr Glu Met Leu Ala Lys Ala Leu Arg Lys Val Pro Thr Asp 1310 1315 1320 Asn Tyr Ile Thr Thr Tyr Pro Gly Gln Gly Leu Asn Gly Tyr Thr 1325 1330 1335 Val Glu Glu Ala Lys Thr Val Leu Lys Lys Cys Lys Ser Ala Phe 1340 1345 1350 Tyr Ile Leu Pro Ser Ile Ile Ser Asn Glu Lys Gln Glu Ile Leu 1355 1360 1365 Gly Thr Val Ser Trp Asn Leu Arg Glu Met Leu Ala His Ala Glu 1370 1375 1380 Glu Thr Arg Lys Leu Met Pro Val Cys Val Glu Thr Lys Ala Ile 1385 1390 1395 Val Ser Thr Ile Gln Arg Lys Tyr Lys Gly Ile Lys Ile Gln Glu 1400 1405 1410 Gly Val Val Asp Tyr Gly Ala Arg Phe Tyr Phe Tyr Thr Ser Lys 1415 1420 1425 Thr Thr Val Ala Ser Leu Ile Asn Thr Leu Asn Asp Leu Asn Glu 1430 1435 1440 Thr Leu Val Thr Met Pro Leu Gly Tyr Val Thr His Gly Leu Asn 1445 1450 1455 Leu Glu Glu Ala Ala Arg Tyr Met Arg Ser Leu Lys Val Pro Ala 1460 1465 1470 Thr Val Ser Val Ser Ser Pro Asp Ala Val Thr Ala Tyr Asn Gly 1475 1480 1485 Tyr Leu Thr Ser Ser Ser Lys Thr Pro Glu Glu His Phe Ile Glu 1490 1495 1500 Thr Ile Ser Leu Ala Gly Ser Tyr Lys Asp Trp Ser Tyr Ser Gly 1505 1510 1515 Gln Ser Thr Gln Leu Gly Ile Glu Phe Leu Lys Arg Gly Asp Lys 1520 1525 1530 Ser Val Tyr Tyr Thr Ser Asn Pro Thr Thr Phe His Leu Asp Gly 1535 1540 1545 Glu Val Ile Thr Phe Asp Asn Leu Lys Thr Leu Leu Ser Leu Arg 1550 1555 1560 Glu Val Arg Thr Ile Lys Val Phe Thr Thr Val Asp Asn Ile Asn 1565 1570 1575 Leu His Thr Gln Val Val Asp Met Ser Met Thr Tyr Gly Gln Gln 1580 1585 1590 Phe Gly Pro Thr Tyr Leu Asp Gly Ala Asp Val Thr Lys Ile Lys 1595 1600 1605 Pro His Asn Ser His Glu Gly Lys Thr Phe Tyr Val Leu Pro Asn 1610 1615 1620 Asp Asp Thr Leu Arg Val Glu Ala Phe Glu Tyr Tyr His Thr Thr 1625 1630 1635 Asp Pro Ser Phe Leu Gly Arg Tyr Met Ser Ala Leu Asn His Thr 1640 1645 1650 Lys Lys Trp Lys Tyr Pro Gln Val Asn Gly Leu Thr Ser Ile Lys 1655 1660 1665 Trp Ala Asp Asn Asn Cys Tyr Leu Ala Thr Ala Leu Leu Thr Leu 1670 1675 1680 Gln Gln Ile Glu Leu Lys Phe Asn Pro Pro Ala Leu Gln Asp Ala 1685 1690 1695 Tyr Tyr Arg Ala Arg Ala Gly Glu Ala Ala Asn Phe Cys Ala Leu 1700 1705 1710 Ile Leu Ala Tyr Cys Asn Lys Thr Val Gly Glu Leu Gly Asp Val 1715 1720 1725 Arg Glu Thr Met Ser Tyr Leu Phe Gln His Ala Asn Leu Asp Ser 1730 1735 1740 Cys Lys Arg Val Leu Asn Val Val Cys Lys Thr Cys Gly Gln Gln 1745 1750 1755 Gln Thr Thr Leu Lys Gly Val Glu Ala Val Met Tyr Met Gly Thr 1760 1765 1770 Leu Ser Tyr Glu Gln Phe Lys Lys Gly Val Gln Ile Pro Cys Thr 1775 1780 1785 Cys Gly Lys Gln Ala Thr Lys Tyr Leu Val Gln Gln Glu Ser Pro 1790 1795 1800 Phe Val Met Met Ser Ala Pro Pro Ala Gln Tyr Glu Leu Lys His 1805 1810 1815 Gly Thr Phe Thr Cys Ala Ser Glu Tyr Thr Gly Asn Tyr Gln Cys 1820 1825 1830 Gly His Tyr Lys His Ile Thr Ser Lys Glu Thr Leu Tyr Cys Ile 1835 1840 1845 Asp Gly Ala Leu Leu Thr Lys Ser Ser Glu Tyr Lys Gly Pro Ile 1850 1855 1860 Thr Asp Val Phe Tyr Lys Glu Asn Ser Tyr Thr Thr Thr Ile Lys 1865 1870 1875 Pro Val Thr Tyr Lys Leu Asp Gly Val Val Cys Thr Glu Ile Asp 1880 1885 1890 Pro Lys Leu Asp Asn Tyr Tyr Lys Lys Asp Asn Ser Tyr Phe Thr 1895 1900 1905 Glu Gln Pro Ile Asp Leu Val Pro Asn Gln Pro Tyr Pro Asn Ala 1910 1915 1920 Ser Phe Asp Asn Phe Lys Phe Val Cys Asp Asn Ile Lys Phe Ala 1925 1930 1935 Asp Asp Leu Asn Gln Leu Thr Gly Tyr Lys Lys Pro Ala Ser Arg 1940 1945 1950 Glu Leu Lys Val Thr Phe Phe Pro Asp Leu Asn Gly Asp Val Val 1955 1960 1965 Ala Ile Asp Tyr Lys His Tyr Thr Pro Ser Phe Lys Lys Gly Ala 1970 1975 1980 Lys Leu Leu His Lys Pro Ile Val Trp His Val Asn Asn Ala Thr 1985 1990 1995 Asn Lys Ala Thr Tyr Lys Pro Asn Thr Trp Cys Ile Arg Cys Leu 2000 2005 2010 Trp Ser Thr Lys Pro Val Glu Thr Ser Asn Ser Phe Asp Val Leu 2015 2020 2025 Lys Ser Glu Asp Ala Gln Gly Met Asp Asn Leu Ala Cys Glu Asp 2030 2035 2040 Leu Lys Pro Val Ser Glu Glu Val Val Glu Asn Pro Thr Ile Gln 2045 2050 2055 Lys Asp Val Leu Glu Cys Asn Val Lys Thr Thr Glu Val Val Gly 2060 2065 2070 Asp Ile Ile Leu Lys Pro Ala Asn Asn Ser Leu Lys Ile Thr Glu 2075 2080 2085 Glu Val Gly His Thr Asp Leu Met Ala Ala Tyr Val Asp Asn Ser 2090 2095 2100 Ser Leu Thr Ile Lys Lys Pro Asn Glu Leu Ser Arg Val Leu Gly 2105 2110 2115 Leu Lys Thr Leu Ala Thr His Gly Leu Ala Ala Val Asn Ser Val 2120 2125 2130 Pro Trp Asp Thr Ile Ala Asn Tyr Ala Lys Pro Phe Leu Asn Lys 2135 2140 2145 Val Val Ser Thr Thr Thr Asn Ile Val Thr Arg Cys Leu Asn Arg 2150 2155 2160 Val Cys Thr Asn Tyr Met Pro Tyr Phe Phe Thr Leu Leu Leu Gln 2165 2170 2175 Leu Cys Thr Phe Thr Arg Ser Thr Asn Ser Arg Ile Lys Ala Ser 2180 2185 2190 Met Pro Thr Thr Ile Ala Lys Asn Thr Val Lys Ser Val Gly Lys 2195 2200 2205 Phe Cys Leu Glu Ala Ser Phe Asn Tyr Leu Lys Ser Pro Asn Phe 2210 2215 2220 Ser Lys Leu Ile Asn Ile Ile Ile Trp Phe Leu Leu Leu Ser Val 2225 2230 2235 Cys Leu Gly Ser Leu Ile Tyr Ser Thr Ala Ala Leu Gly Val Leu 2240 2245 2250 Met Ser Asn Leu Gly Met Pro Ser Tyr Cys Thr Gly Tyr Arg Glu 2255 2260 2265 Gly Tyr Leu Asn Ser Thr Asn Val Thr Ile Ala Thr Tyr Cys Thr 2270 2275 2280 Gly Ser Ile Pro Cys Ser Val Cys Leu Ser Gly Leu Asp Ser Leu 2285 2290 2295 Asp Thr Tyr Pro Ser Leu Glu Thr Ile Gln Ile Thr Ile Ser Ser 2300 2305 2310 Phe Lys Trp Asp Leu Thr Ala Phe Gly Leu Val Ala Glu Trp Phe 2315 2320 2325 Leu Ala Tyr Ile Leu Phe Thr Arg Phe Phe Tyr Val Leu Gly Leu 2330 2335 2340 Ala Ala Ile Met Gln Leu Phe Phe Ser Tyr Phe Ala Val His Phe 2345 2350 2355 Ile Ser Asn Ser Trp Leu Met Trp Leu Ile Ile Asn Leu Val Gln 2360 2365 2370 Met Ala Pro Ile Ser Ala Met Val Arg Met Tyr Ile Phe Phe Ala 2375 2380 2385 Ser Phe Tyr Tyr Val Trp Lys Ser Tyr Val His Val Val Asp Gly 2390 2395 2400 Cys Asn Ser Ser Thr Cys Met Met Cys Tyr Lys Arg Asn Arg Ala 2405 2410 2415 Thr Arg Val Glu Cys Thr Thr Ile Val Asn Gly Val Arg Arg Ser 2420 2425 2430 Phe Tyr Val Tyr Ala Asn Gly Gly Lys Gly Phe Cys Lys Leu His 2435 2440 2445 Asn Trp Asn Cys Val Asn Cys Asp Thr Phe Cys Ala Gly Ser Thr 2450 2455 2460 Phe Ile Ser Asp Glu Val Ala Arg Asp Leu Ser Leu Gln Phe Lys 2465 2470 2475 Arg Pro Ile Asn Pro Thr Asp Gln Ser Ser Tyr Ile Val Asp Ser 2480 2485 2490 Val Thr Val Lys Asn Gly Ser Ile His Leu Tyr Phe Asp Lys Ala 2495 2500 2505 Gly Gln Lys Thr Tyr Glu Arg His Ser Leu Ser His Phe Val Asn 2510 2515 2520 Leu Asp Asn Leu Arg Ala Asn Asn Thr Lys Gly Ser Leu Pro Ile 2525 2530 2535 Asn Val Ile Val Phe Asp Gly Lys Ser Lys Cys Glu Glu Ser Ser 2540 2545 2550 Ala Lys Ser Ala Ser Val Tyr Tyr Ser Gln Leu Met Cys Gln Pro 2555 2560 2565 Ile Leu Leu Leu Asp Gln Ala Leu Val Ser Asp Val Gly Asp Ser 2570 2575 2580 Ala Glu Val Ala Val Lys Met Phe Asp Ala Tyr Val Asn Thr Phe 2585 2590 2595 Ser Ser Thr Phe Asn Val Pro Met Glu Lys Leu Lys Thr Leu Val 2600 2605 2610 Ala Thr Ala Glu Ala Glu Leu Ala Lys Asn Val Ser Leu Asp Asn 2615 2620 2625 Val Leu Ser Thr Phe Ile Ser Ala Ala Arg Gln Gly Phe Val Asp 2630 2635 2640 Ser Asp Val Glu Thr Lys Asp Val Val Glu Cys Leu Lys Leu Ser 2645 2650 2655 His Gln Ser Asp Ile Glu Val Thr Gly Asp Ser Cys Asn Asn Tyr 2660 2665 2670 Met Leu Thr Tyr Asn Lys Val Glu Asn Met Thr Pro Arg Asp Leu 2675 2680 2685 Gly Ala Cys Ile Asp Cys Ser Ala Arg His Ile Asn Ala Gln Val 2690 2695 2700 Ala Lys Ser His Asn Ile Ala Leu Ile Trp Asn Val Lys Asp Phe 2705 2710 2715 Met Ser Leu Ser Glu Gln Leu Arg Lys Gln Ile Arg Ser Ala Ala 2720 2725 2730 Lys Lys Asn Asn Leu Pro Phe Lys Leu Thr Cys Ala Thr Thr Arg 2735 2740 2745 Gln Val Val Asn Val Val Thr Thr Lys Ile Ala Leu Lys Gly Gly 2750 2755 2760 Lys Ile Val Asn Asn Trp Leu Lys Gln Leu Ile Lys Val Thr Leu 2765 2770 2775 Val Phe Leu Phe Val Ala Ala Ile Phe Tyr Leu Ile Thr Pro Val 2780 2785 2790 His Val Met Ser Lys His Thr Asp Phe Ser Ser Glu Ile Ile Gly 2795 2800 2805 Tyr Lys Ala Ile Asp Gly Gly Val Thr Arg Asp Ile Ala Ser Thr 2810 2815 2820 Asp Thr Cys Phe Ala Asn Lys His Ala Asp Phe Asp Thr Trp Phe 2825 2830 2835 Ser Gln Arg Gly Gly Ser Tyr Thr Asn Asp Lys Ala Cys Pro Leu 2840 2845 2850 Ile Ala Ala Val Ile Thr Arg Glu Val Gly Phe Val Val Pro Gly 2855 2860 2865 Leu Pro Gly Thr Ile Leu Arg Thr Thr Asn Gly Asp Phe Leu His 2870 2875 2880 Phe Leu Pro Arg Val Phe Ser Ala Val Gly Asn Ile Cys Tyr Thr 2885 2890 2895 Pro Ser Lys Leu Ile Glu Tyr Thr Asp Phe Ala Thr Ser Ala Cys 2900 2905 2910 Val Leu Ala Ala Glu Cys Thr Ile Phe Lys Asp Ala Ser Gly Lys 2915 2920 2925 Pro Val Pro Tyr Cys Tyr Asp Thr Asn Val Leu Glu Gly Ser Val 2930 2935 2940 Ala Tyr Glu Ser Leu Arg Pro Asp Thr Arg Tyr Val Leu Met Asp 2945 2950 2955 Gly Ser Ile Ile Gln Phe Pro Asn Thr Tyr Leu Glu Gly Ser Val 2960 2965 2970 Arg Val Val Thr Thr Phe Asp Ser Glu Tyr Cys Arg His Gly Thr 2975 2980 2985 Cys Glu Arg Ser Glu Ala Gly Val Cys Val Ser Thr Ser Gly Arg 2990 2995 3000 Trp Val Leu Asn Asn Asp Tyr Tyr Arg Ser Leu Pro Gly Val Phe 3005 3010 3015 Cys Gly Val Asp Ala Val Asn Leu Leu Thr Asn Met Phe Thr Pro 3020 3025 3030 Leu Ile Gln Pro Ile Gly Ala Leu Asp Ile Ser Ala Ser Ile Val 3035 3040 3045 Ala Gly Gly Ile Val Ala Ile Val Val Thr Cys Leu Ala Tyr Tyr 3050 3055 3060 Phe Met Arg Phe Arg Arg Ala Phe Gly Glu Tyr Ser His Val Val 3065 3070 3075 Ala Phe Asn Thr Leu Leu Phe Leu Met Ser Phe Thr Val Leu Cys 3080 3085 3090 Leu Thr Pro Val Tyr Ser Phe Leu Pro Gly Val Tyr Ser Val Ile 3095 3100 3105 Tyr Leu Tyr Leu Thr Phe Tyr Leu Thr Asn Asp Val Ser Phe Leu 3110 3115 3120 Ala His Ile Gln Trp Met Val Met Phe Thr Pro Leu Val Pro Phe 3125 3130 3135 Trp Ile Thr Ile Ala Tyr Ile Ile Cys Ile Ser Thr Lys His Phe 3140 3145 3150 Tyr Trp Phe Phe Ser Asn Tyr Leu Lys Arg Arg Val Val Phe Asn 3155 3160 3165 Gly Val Ser Phe Ser Thr Phe Glu Glu Ala Ala Leu Cys Thr Phe 3170 3175 3180 Leu Leu Asn Lys Glu Met Tyr Leu Lys Leu Arg Ser Asp Val Leu 3185 3190 3195 Leu Pro Leu Thr Gln Tyr Asn Arg Tyr Leu Ala Leu Tyr Asn Lys 3200 3205 3210 Tyr Lys Tyr Phe Ser Gly Ala Met Asp Thr Thr Ser Tyr Arg Glu 3215 3220 3225 Ala Ala Cys Cys His Leu Ala Lys Ala Leu Asn Asp Phe Ser Asn 3230 3235 3240 Ser Gly Ser Asp Val Leu Tyr Gln Pro Pro Gln Thr Ser Ile Thr 3245 3250 3255 Ser Ala Val Leu Gln Ser Gly Phe Arg Lys Met Ala Phe Pro Ser 3260 3265 3270 Gly Lys Val Glu Gly Cys Met Val Gln Val Thr Cys Gly Thr Thr 3275 3280 3285 Thr Leu Asn Gly Leu Trp Leu Asp Asp Val Val Tyr Cys Pro Arg 3290 3295 3300 His Val Ile Cys Thr Ser Glu Asp Met Leu Asn Pro Asn Tyr Glu 3305 3310 3315 Asp Leu Leu Ile Arg Lys Ser Asn His Asn Phe Leu Val Gln Ala 3320 3325 3330 Gly Asn Val Gln Leu Arg Val Ile Gly His Ser Met Gln Asn Cys 3335 3340 3345 Val Leu Lys Leu Lys Val Asp Thr Ala Asn Pro Lys Thr Pro Lys 3350 3355 3360 Tyr Lys Phe Val Arg Ile Gln Pro Gly Gln Thr Phe Ser Val Leu 3365 3370 3375 Ala Cys Tyr Asn Gly Ser Pro Ser Gly Val Tyr Gln Cys Ala Met 3380 3385 3390 Arg Pro Asn Phe Thr Ile Lys Gly Ser Phe Leu Asn Gly Ser Cys 3395 3400 3405 Gly Ser Val Gly Phe Asn Ile Asp Tyr Asp Cys Val Ser Phe Cys 3410 3415 3420 Tyr Met His His Met Glu Leu Pro Thr Gly Val His Ala Gly Thr 3425 3430 3435 Asp Leu Glu Gly Asn Phe Tyr Gly Pro Phe Val Asp Arg Gln Thr 3440 3445 3450 Ala Gln Ala Ala Gly Thr Asp Thr Thr Ile Thr Val Asn Val Leu 3455 3460 3465 Ala Trp Leu Tyr Ala Ala Val Ile Asn Gly Asp Arg Trp Phe Leu 3470 3475 3480 Asn Arg Phe Thr Thr Thr Leu Asn Asp Phe Asn Leu Val Ala Met 3485 3490 3495 Lys Tyr Asn Tyr Glu Pro Leu Thr Gln Asp His Val Asp Ile Leu 3500 3505 3510 Gly Pro Leu Ser Ala Gln Thr Gly Ile Ala Val Leu Asp Met Cys 3515 3520 3525 Ala Ser Leu Lys Glu Leu Leu Gln Asn Gly Met Asn Gly Arg Thr 3530 3535 3540 Ile Leu Gly Ser Ala Leu Leu Glu Asp Glu Phe Thr Pro Phe Asp 3545 3550 3555 Val Val Arg Gln Cys Ser Gly Val Thr Phe Gln Ser Ala Val Lys 3560 3565 3570 Arg Thr Ile Lys Gly Thr His His Trp Leu Leu Leu Thr Ile Leu 3575 3580 3585 Thr Ser Leu Leu Val Leu Val Gln Ser Thr Gln Trp Ser Leu Phe 3590 3595 3600 Phe Phe Leu Tyr Glu Asn Ala Phe Leu Pro Phe Ala Met Gly Ile 3605 3610 3615 Ile Ala Met Ser Ala Phe Ala Met Met Phe Val Lys His Lys His 3620 3625 3630 Ala Phe Leu Cys Leu Phe Leu Leu Pro Ser Leu Ala Thr Val Ala 3635 3640 3645 Tyr Phe Asn Met Val Tyr Met Pro Ala Ser Trp Val Met Arg Ile 3650 3655 3660 Met Thr Trp Leu Asp Met Val Asp Thr Ser Leu Ser Gly Phe Lys 3665 3670 3675 Leu Lys Asp Cys Val Met Tyr Ala Ser Ala Val Val Leu Leu Ile 3680 3685 3690 Leu Met Thr Ala Arg Thr Val Tyr Asp Asp Gly Ala Arg Arg Val 3695 3700 3705 Trp Thr Leu Met Asn Val Leu Thr Leu Val Tyr Lys Val Tyr Tyr 3710 3715 3720 Gly Asn Ala Leu Asp Gln Ala Ile Ser Met Trp Ala Leu Ile Ile 3725 3730 3735 Ser Val Thr Ser Asn Tyr Ser Gly Val Val Thr Thr Val Met Phe 3740 3745 3750 Leu Ala Arg Gly Ile Val Phe Met Cys Val Glu Tyr Cys Pro Ile 3755 3760 3765 Phe Phe Ile Thr Gly Asn Thr Leu Gln Cys Ile Met Leu Val Tyr 3770 3775 3780 Cys Phe Leu Gly Tyr Phe Cys Thr Cys Tyr Phe Gly Leu Phe Cys 3785 3790 3795 Leu Leu Asn Arg Tyr Phe Arg Leu Thr Leu Gly Val Tyr Asp Tyr 3800 3805 3810 Leu Val Ser Thr Gln Glu Phe Arg Tyr Met Asn Ser Gln Gly Leu 3815 3820 3825 Leu Pro Pro Lys Asn Ser Ile Asp Ala Phe Lys Leu Asn Ile Lys 3830 3835 3840 Leu Leu Gly Val Gly Gly Lys Pro Cys Ile Lys Val Ala Thr Val 3845 3850 3855 Gln Ser Lys Met Ser Asp Val Lys Cys Thr Ser Val Val Leu Leu 3860 3865 3870 Ser Val Leu Gln Gln Leu Arg Val Glu Ser Ser Ser Lys Leu Trp 3875 3880 3885 Ala Gln Cys Val Gln Leu His Asn Asp Ile Leu Leu Ala Lys Asp 3890 3895 3900 Thr Thr Glu Ala Phe Glu Lys Met Val Ser Leu Leu Ser Val Leu 3905 3910 3915 Leu Ser Met Gln Gly Ala Val Asp Ile Asn Lys Leu Cys Glu Glu 3920 3925 3930 Met Leu Asp Asn Arg Ala Thr Leu Gln Ala Ile Ala Ser Glu Phe 3935 3940 3945 Ser Ser Leu Pro Ser Tyr Ala Ala Phe Ala Thr Ala Gln Glu Ala 3950 3955 3960 Tyr Glu Gln Ala Val Ala Asn Gly Asp Ser Glu Val Val Leu Lys 3965 3970 3975 Lys Leu Lys Lys Ser Leu Asn Val Ala Lys Ser Glu Phe Asp Arg 3980 3985 3990 Asp Ala Ala Met Gln Arg Lys Leu Glu Lys Met Ala Asp Gln Ala 3995 4000 4005 Met Thr Gln Met Tyr Lys Gln Ala Arg Ser Glu Asp Lys Arg Ala 4010 4015 4020 Lys Val Thr Ser Ala Met Gln Thr Met Leu Phe Thr Met Leu Arg 4025 4030 4035 Lys Leu Asp Asn Asp Ala Leu Asn Asn Ile Ile Asn Asn Ala Arg 4040 4045 4050 Asp Gly Cys Val Pro Leu Asn Ile Ile Pro Leu Thr Thr Ala Ala 4055 4060 4065 Lys Leu Met Val Val Ile Pro Asp Tyr Asn Thr Tyr Lys Asn Thr 4070 4075 4080 Cys Asp Gly Thr Thr Phe Thr Tyr Ala Ser Ala Leu Trp Glu Ile 4085 4090 4095 Gln Gln Val Val Asp Ala Asp Ser Lys Ile Val Gln Leu Ser Glu 4100 4105 4110 Ile Ser Met Asp Asn Ser Pro Asn Leu Ala Trp Pro Leu Ile Val 4115 4120 4125 Thr Ala Leu Arg Ala Asn Ser Ala Val Lys Leu Gln Asn Asn Glu 4130 4135 4140 Leu Ser Pro Val Ala Leu Arg Gln Met Ser Cys Ala Ala Gly Thr 4145 4150 4155 Thr Gln Thr Ala Cys Thr Asp Asp Asn Ala Leu Ala Tyr Tyr Asn 4160 4165 4170 Thr Thr Lys Gly Gly Arg Phe Val Leu Ala Leu Leu Ser Asp Leu 4175 4180 4185 Gln Asp Leu Lys Trp Ala Arg Phe Pro Lys Ser Asp Gly Thr Gly 4190 4195 4200 Thr Ile Tyr Thr Glu Leu Glu Pro Pro Cys Arg Phe Val Thr Asp 4205 4210 4215 Thr Pro Lys Gly Pro Lys Val Lys Tyr Leu Tyr Phe Ile Lys Gly 4220 4225 4230 Leu Asn Asn Leu Asn Arg Gly Met Val Leu Gly Ser Leu Ala Ala 4235 4240 4245 Thr Val Arg Leu Gln Ala Gly Asn Ala Thr Glu Val Pro Ala Asn 4250 4255 4260 Ser Thr Val Leu Ser Phe Cys Ala Phe Ala Val Asp Ala Ala Lys 4265 4270 4275 Ala Tyr Lys Asp Tyr Leu Ala Ser Gly Gly Gln Pro Ile Thr Asn 4280 4285 4290 Cys Val Lys Met Leu Cys Thr His Thr Gly Thr Gly Gln Ala Ile 4295 4300 4305 Thr Val Thr Pro Glu Ala Asn Met Asp Gln Glu Ser Phe Gly Gly 4310 4315 4320 Ala Ser Cys Cys Leu Tyr Cys Arg Cys His Ile Asp His Pro Asn 4325 4330 4335 Pro Lys Gly Phe Cys Asp Leu Lys Gly Lys Tyr Val Gln Ile Pro 4340 4345 4350 Thr Thr Cys Ala Asn Asp Pro Val Gly Phe Thr Leu Lys Asn Thr 4355 4360 4365 Val Cys Thr Val Cys Gly Met Trp Lys Gly Tyr Gly Cys Ser Cys 4370 4375 4380 Asp Gln Leu Arg Glu Pro Met Leu Gln Ser Ala Asp Ala Gln Ser 4385 4390 4395 Phe Leu Asn Arg Val Cys Gly Val Ser Ala Ala Arg Leu Thr Pro 4400 4405 4410 Cys Gly Thr Gly Thr Ser Thr Asp Val Val Tyr Arg Ala Phe Asp 4415 4420 4425 Ile Tyr Asn Asp Lys Val Ala Gly Phe Ala Lys Phe Leu Lys Thr 4430 4435 4440 Asn Cys Cys Arg Phe Gln Glu Lys Asp Glu Asp Asp Asn Leu Ile 4445 4450 4455 Asp Ser Tyr Phe Val Val Lys Arg His Thr Phe Ser Asn Tyr Gln 4460 4465 4470 His Glu Glu Thr Ile Tyr Asn Leu Leu Lys Asp Cys Pro Ala Val 4475 4480 4485 Ala Lys His Asp Phe Phe Lys Phe Arg Ile Asp Gly Asp Met Val 4490 4495 4500 Pro His Ile Ser Arg Gln Arg Leu Thr Lys Tyr Thr Met Ala Asp 4505 4510 4515 Leu Val Tyr Ala Leu Arg His Phe Asp Glu Gly Asn Cys Asp Thr 4520 4525 4530 Leu Lys Glu Ile Leu Val Thr Tyr Asn Cys Cys Asp Asp Asp Tyr 4535 4540 4545 Phe Asn Lys Lys Asp Trp Tyr Asp Phe Val Glu Asn Pro Asp Ile 4550 4555 4560 Leu Arg Val Tyr Ala Asn Leu Gly Glu Arg Val Arg Gln Ala Leu 4565 4570 4575 Leu Lys Thr Val Gln Phe Cys Asp Ala Met Arg Asn Ala Gly Ile 4580 4585 4590 Val Gly Val Leu Thr Leu Asp Asn Gln Asp Leu Asn Gly Asn Trp 4595 4600 4605 Tyr Asp Phe Gly Asp Phe Ile Gln Thr Thr Pro Gly Ser Gly Val 4610 4615 4620 Pro Val Val Asp Ser Tyr Tyr Ser Leu Leu Met Pro Ile Leu Thr 4625 4630 4635 Leu Thr Arg Ala Leu Thr Ala Glu Ser His Val Asp Thr Asp Leu 4640 4645 4650 Thr Lys Pro Tyr Ile Lys Trp Asp Leu Leu Lys Tyr Asp Phe Thr 4655 4660 4665 Glu Glu Arg Leu Lys Leu Phe Asp Arg Tyr Phe Lys Tyr Trp Asp 4670 4675 4680 Gln Thr Tyr His Pro Asn Cys Val Asn Cys Leu Asp Asp Arg Cys 4685 4690 4695 Ile Leu His Cys Ala Asn Phe Asn Val Leu Phe Ser Thr Val Phe 4700 4705 4710 Pro Leu Thr Ser Phe Gly Pro Leu Val Arg Lys Ile Phe Val Asp 4715 4720 4725 Gly Val Pro Phe Val Val Ser Thr Gly Tyr His Phe Arg Glu Leu 4730 4735 4740 Gly Val Val His Asn Gln Asp Val Asn Leu His Ser Ser Arg Leu 4745 4750 4755 Ser Phe Lys Glu Leu Leu Val Tyr Ala Ala Asp Pro Ala Met His 4760 4765 4770 Ala Ala Ser Gly Asn Leu Leu Leu Asp Lys Arg Thr Thr Cys Phe 4775 4780 4785 Ser Val Ala Ala Leu Thr Asn Asn Val Ala Phe Gln Thr Val Lys 4790 4795 4800 Pro Gly Asn Phe Asn Lys Asp Phe Tyr Asp Phe Ala Val Ser Lys 4805 4810 4815 Gly Phe Phe Lys Glu Gly Ser Ser Val Glu Leu Lys His Phe Phe 4820 4825 4830 Phe Ala Gln Asp Gly Asn Ala Ala Ile Ser Asp Tyr Asp Tyr Tyr 4835 4840 4845 Arg Tyr Asn Leu Pro Thr Met Cys Asp Ile Arg Gln Leu Leu Phe 4850 4855 4860 Val Val Glu Val Val Asp Lys Tyr Phe Asp Cys Tyr Asp Gly Gly 4865 4870 4875 Cys Ile Asn Ala Asn Gln Val Ile Val Asn Asn Leu Asp Lys Ser 4880 4885 4890 Ala Gly Phe Pro Phe Asn Lys Trp Gly Lys Ala Arg Leu Tyr Tyr 4895 4900 4905 Asp Ser Met Ser Tyr Glu Asp Gln Asp Ala Leu Phe Ala Tyr Thr 4910 4915 4920 Lys Arg Asn Val Ile Pro Thr Ile Thr Gln Met Asn Leu Lys Tyr 4925 4930 4935 Ala Ile Ser Ala Lys Asn Arg Ala Arg Thr Val Ala Gly Val Ser 4940 4945 4950 Ile Cys Ser Thr Met Thr Asn Arg Gln Phe His Gln Lys Leu Leu 4955 4960 4965 Lys Ser Ile Ala Ala Thr Arg Gly Ala Thr Val Val Ile Gly Thr 4970 4975 4980 Ser Lys Phe Tyr Gly Gly Trp His Asn Met Leu Lys Thr Val Tyr 4985 4990 4995 Ser Asp Val Glu Asn Pro His Leu Met Gly Trp Asp Tyr Pro Lys 5000 5005 5010 Cys Asp Arg Ala Met Pro Asn Met Leu Arg Ile Met Ala Ser Leu 5015 5020 5025 Val Leu Ala Arg Lys His Thr Thr Cys Cys Ser Leu Ser His Arg 5030 5035 5040 Phe Tyr Arg Leu Ala Asn Glu Cys Ala Gln Val Leu Ser Glu Met 5045 5050 5055 Val Met Cys Gly Gly Ser Leu Tyr Val Lys Pro Gly Gly Thr Ser 5060 5065 5070 Ser Gly Asp Ala Thr Thr Ala Tyr Ala Asn Ser Val Phe Asn Ile 5075 5080 5085 Cys Gln Ala Val Thr Ala Asn Val Asn Ala Leu Leu Ser Thr Asp 5090 5095 5100 Gly Asn Lys Ile Ala Asp Lys Tyr Val Arg Asn Leu Gln His Arg 5105 5110 5115 Leu Tyr Glu Cys Leu Tyr Arg Asn Arg Asp Val Asp Thr Asp Phe 5120 5125 5130 Val Asn Glu Phe Tyr Ala Tyr Leu Arg Lys His Phe Ser Met Met 5135 5140 5145 Ile Leu Ser Asp Asp Ala Val Val Cys Phe Asn Ser Thr Tyr Ala 5150 5155 5160 Ser Gln Gly Leu Val Ala Ser Ile Lys Asn Phe Lys Ser Val Leu 5165 5170 5175 Tyr Tyr Gln Asn Asn Val Phe Met Ser Glu Ala Lys Cys Trp Thr 5180 5185 5190 Glu Thr Asp Leu Thr Lys Gly Pro His Glu Phe Cys Ser Gln His 5195 5200 5205 Thr Met Leu Val Lys Gln Gly Asp Asp Tyr Val Tyr Leu Pro Tyr 5210 5215 5220 Pro Asp Pro Ser Arg Ile Leu Gly Ala Gly Cys Phe Val Asp Asp 5225 5230 5235 Ile Val Lys Thr Asp Gly Thr Leu Met Ile Glu Arg Phe Val Ser 5240 5245 5250 Leu Ala Ile Asp Ala Tyr Pro Leu Thr Lys His Pro Asn Gln Glu 5255 5260 5265 Tyr Ala Asp Val Phe His Leu Tyr Leu Gln Tyr Ile Arg Lys Leu 5270 5275 5280 His Asp Glu Leu Thr Gly His Met Leu Asp Met Tyr Ser Val Met 5285 5290 5295 Leu Thr Asn Asp Asn Thr Ser Arg Tyr Trp Glu Pro Glu Phe Tyr 5300 5305 5310 Glu Ala Met Tyr Thr Pro His Thr Val Leu Gln Ala Val Gly Ala 5315 5320 5325 Cys Val Leu Cys Asn Ser Gln Thr Ser Leu Arg Cys Gly Ala Cys 5330 5335 5340 Ile Arg Arg Pro Phe Leu Cys Cys Lys Cys Cys Tyr Asp His Val 5345 5350 5355 Ile Ser Thr Ser His Lys Leu Val Leu Ser Val Asn Pro Tyr Val 5360 5365 5370 Cys Asn Ala Pro Gly Cys Asp Val Thr Asp Val Thr Gln Leu Tyr 5375 5380 5385 Leu Gly Gly Met Ser Tyr Tyr Cys Lys Ser His Lys Pro Pro Ile 5390 5395 5400 Ser Phe Pro Leu Cys Ala Asn Gly Gln Val Phe Gly Leu Tyr Lys 5405 5410 5415 Asn Thr Cys Val Gly Ser Asp Asn Val Thr Asp Phe Asn Ala Ile 5420 5425 5430 Ala Thr Cys Asp Trp Thr Asn Ala Gly Asp Tyr Ile Leu Ala Asn 5435 5440 5445 Thr Cys Thr Glu Arg Leu Lys Leu Phe Ala Ala Glu Thr Leu Lys 5450 5455 5460 Ala Thr Glu Glu Thr Phe Lys Leu Ser Tyr Gly Ile Ala Thr Val 5465 5470 5475 Arg Glu Val Leu Ser Asp Arg Glu Leu His Leu Ser Trp Glu Val 5480 5485 5490 Gly Lys Pro Arg Pro Pro Leu Asn Arg Asn Tyr Val Phe Thr Gly 5495 5500 5505 Tyr Arg Val Thr Lys Asn Ser Lys Val Gln Ile Gly Glu Tyr Thr 5510 5515 5520 Phe Glu Lys Gly Asp Tyr Gly Asp Ala Val Val Tyr Arg Gly Thr 5525 5530 5535 Thr Thr Tyr Lys Leu Asn Val Gly Asp Tyr Phe Val Leu Thr Ser 5540 5545 5550 His Thr Val Met Pro Leu Ser Ala Pro Thr Leu Val Pro Gln Glu 5555 5560 5565 His Tyr Val Arg Ile Thr Gly Leu Tyr Pro Thr Leu Asn Ile Ser 5570 5575 5580 Asp Glu Phe Ser Ser Asn Val Ala Asn Tyr Gln Lys Val Gly Met 5585 5590 5595 Gln Lys Tyr Ser Thr Leu Gln Gly Pro Pro Gly Thr Gly Lys Ser 5600 5605 5610 His Phe Ala Ile Gly Leu Ala Leu Tyr Tyr Pro Ser Ala Arg Ile 5615 5620 5625 Val Tyr Thr Ala Cys Ser His Ala Ala Val Asp Ala Leu Cys Glu 5630 5635 5640 Lys Ala Leu Lys Tyr Leu Pro Ile Asp Lys Cys Ser Arg Ile Ile 5645 5650 5655 Pro Ala Arg Ala Arg Val Glu Cys Phe Asp Lys Phe Lys Val Asn 5660 5665 5670 Ser Thr Leu Glu Gln Tyr Val Phe Cys Thr Val Asn Ala Leu Pro 5675 5680 5685 Glu Thr Thr Ala Asp Ile Val Val Phe Asp Glu Ile Ser Met Ala 5690 5695 5700 Thr Asn Tyr Asp Leu Ser Val Val Asn Ala Arg Leu Arg Ala Lys 5705 5710 5715 His Tyr Val Tyr Ile Gly Asp Pro Ala Gln Leu Pro Ala Pro Arg 5720 5725 5730 Thr Leu Leu Thr Lys Gly Thr Leu Glu Pro Glu Tyr Phe Asn Ser 5735 5740 5745 Val Cys Arg Leu Met Lys Thr Ile Gly Pro Asp Met Phe Leu Gly 5750 5755 5760 Thr Cys Arg Arg Cys Pro Ala Glu Ile Val Asp Thr Val Ser Ala 5765 5770 5775 Leu Val Tyr Asp Asn Lys Leu Lys Ala His Lys Asp Lys Ser Ala 5780 5785 5790 Gln Cys Phe Lys Met Phe Tyr Lys Gly Val Ile Thr His Asp Val 5795 5800 5805 Ser Ser Ala Ile Asn Arg Pro Gln Ile Gly Val Val Arg Glu Phe 5810 5815 5820 Leu Thr Arg Asn Pro Ala Trp Arg Lys Ala Val Phe Ile Ser Pro 5825 5830 5835 Tyr Asn Ser Gln Asn Ala Val Ala Ser Lys Ile Leu Gly Leu Pro 5840 5845 5850 Thr Gln Thr Val Asp Ser Ser Gln Gly Ser Glu Tyr Asp Tyr Val 5855 5860 5865 Ile Phe Thr Gln Thr Thr Glu Thr Ala His Ser Cys Asn Val Asn 5870 5875 5880 Arg Phe Asn Val Ala Ile Thr Arg Ala Lys Val Gly Ile Leu Cys 5885 5890 5895 Ile Met Ser Asp Arg Asp Leu Tyr Asp Lys Leu Gln Phe Thr Ser 5900 5905 5910 Leu Glu Ile Pro Arg Arg Asn Val Ala Thr Leu Gln Ala Glu Asn 5915 5920 5925 Val Thr Gly Leu Phe Lys Asp Cys Ser Lys Val Ile Thr Gly Leu 5930 5935 5940 His Pro Thr Gln Ala Pro Thr His Leu Ser Val Asp Thr Lys Phe 5945 5950 5955 Lys Thr Glu Gly Leu Cys Val Asp Ile Pro Gly Ile Pro Lys Asp 5960 5965 5970 Met Thr Tyr Arg Arg Leu Ile Ser Met Met Gly Phe Lys Met Asn 5975 5980 5985 Tyr Gln Val Asn Gly Tyr Pro Asn Met Phe Ile Thr Arg Glu Glu 5990 5995 6000 Ala Ile Arg His Val Arg Ala Trp Ile Gly Phe Asp Val Glu Gly 6005 6010 6015 Cys His Ala Thr Arg Glu Ala Val Gly Thr Asn Leu Pro Leu Gln 6020 6025 6030 Leu Gly Phe Ser Thr Gly Val Asn Leu Val Ala Val Pro Thr Gly 6035 6040 6045 Tyr Val Asp Thr Pro Asn Asn Thr Asp Phe Ser Arg Val Ser Ala 6050 6055 6060 Lys Pro Pro Pro Gly Asp Gln Phe Lys His Leu Ile Pro Leu Met 6065 6070 6075 Tyr Lys Gly Leu Pro Trp Asn Val Val Arg Ile Lys Ile Val Gln 6080 6085 6090 Met Leu Ser Asp Thr Leu Lys Asn Leu Ser Asp Arg Val Val Phe 6095 6100 6105 Val Leu Trp Ala His Gly Phe Glu Leu Thr Ser Met Lys Tyr Phe 6110 6115 6120 Val Lys Ile Gly Pro Glu Arg Thr Cys Cys Leu Cys Asp Arg Arg 6125 6130 6135 Ala Thr Cys Phe Ser Thr Ala Ser Asp Thr Tyr Ala Cys Trp His 6140 6145 6150 His Ser Ile Gly Phe Asp Tyr Val Tyr Asn Pro Phe Met Ile Asp 6155 6160 6165 Val Gln Gln Trp Gly Phe Thr Gly Asn Leu Gln Ser Asn His Asp 6170 6175 6180 Leu Tyr Cys Gln Val His Gly Asn Ala His Val Ala Ser Cys Asp 6185 6190 6195 Ala Ile Met Thr Arg Cys Leu Ala Val His Glu Cys Phe Val Lys 6200 6205 6210 Arg Val Asp Trp Thr Ile Glu Tyr Pro Ile Ile Gly Asp Glu Leu 6215 6220 6225 Lys Ile Asn Ala Ala Cys Arg Lys Val Gln His Met Val Val Lys 6230 6235 6240 Ala Ala Leu Leu Ala Asp Lys Phe Pro Val Leu His Asp Ile Gly 6245 6250 6255 Asn Pro Lys Ala Ile Lys Cys Val Pro Gln Ala Asp Val Glu Trp 6260 6265 6270 Lys Phe Tyr Asp Ala Gln Pro Cys Ser Asp Lys Ala Tyr Lys Ile 6275 6280 6285 Glu Glu Leu Phe Tyr Ser Tyr Ala Thr His Ser Asp Lys Phe Thr 6290 6295 6300 Asp Gly Val Cys Leu Phe Trp Asn Cys Asn Val Asp Arg Tyr Pro 6305 6310 6315 Ala Asn Ser Ile Val Cys Arg Phe Asp Thr Arg Val Leu Ser Asn 6320 6325 6330 Leu Asn Leu Pro Gly Cys Asp Gly Gly Ser Leu Tyr Val Asn Lys 6335 6340 6345 His Ala Phe His Thr Pro Ala Phe Asp Lys Ser Ala Phe Val Asn 6350 6355 6360 Leu Lys Gln Leu Pro Phe Phe Tyr Tyr Ser Asp Ser Pro Cys Glu 6365 6370 6375 Ser His Gly Lys Gln Val Val Ser Asp Ile Asp Tyr Val Pro Leu 6380 6385 6390 Lys Ser Ala Thr Cys Ile Thr Arg Cys Asn Leu Gly Gly Ala Val 6395 6400 6405 Cys Arg His His Ala Asn Glu Tyr Arg Leu Tyr Leu Asp Ala Tyr 6410 6415 6420 Asn Met Met Ile Ser Ala Gly Phe Ser Leu Trp Val Tyr Lys Gln 6425 6430 6435 Phe Asp Thr Tyr Asn Leu Trp Asn Thr Phe Thr Arg Leu Gln Ser 6440 6445 6450 Leu Glu Asn Val Ala Phe Asn Val Val Asn Lys Gly His Phe Asp 6455 6460 6465 Gly Gln Gln Gly Glu Val Pro Val Ser Ile Ile Asn Asn Thr Val 6470 6475 6480 Tyr Thr Lys Val Asp Gly Val Asp Val Glu Leu Phe Glu Asn Lys 6485 6490 6495 Thr Thr Leu Pro Val Asn Val Ala Phe Glu Leu Trp Ala Lys Arg 6500 6505 6510 Asn Ile Lys Pro Val Pro Glu Val Lys Ile Leu Asn Asn Leu Gly 6515 6520 6525 Val Asp Ile Ala Ala Asn Thr Val Ile Trp Asp Tyr Lys Arg Asp 6530 6535 6540 Ala Pro Ala His Ile Ser Thr Ile Gly Val Cys Ser Met Thr Asp 6545 6550 6555 Ile Ala Lys Lys Pro Thr Glu Thr Ile Cys Ala Pro Leu Thr Val 6560 6565 6570 Phe Phe Asp Gly Arg Val Asp Gly Gln Val Asp Leu Phe Arg Asn 6575 6580 6585 Ala Arg Asn Gly Val Leu Ile Thr Glu Gly Ser Val Lys Gly Leu 6590 6595 6600 Gln Pro Ser Val Gly Pro Lys Gln Ala Ser Leu Asn Gly Val Thr 6605 6610 6615 Leu Ile Gly Glu Ala Val Lys Thr Gln Phe Asn Tyr Tyr Lys Lys 6620 6625 6630 Val Asp Gly Val Val Gln Gln Leu Pro Glu Thr Tyr Phe Thr Gln 6635 6640 6645 Ser Arg Asn Leu Gln Glu Phe Lys Pro Arg Ser Gln Met Glu Ile 6650 6655 6660 Asp Phe Leu Glu Leu Ala Met Asp Glu Phe Ile Glu Arg Tyr Lys 6665 6670 6675 Leu Glu Gly Tyr Ala Phe Glu His Ile Val Tyr Gly Asp Phe Ser 6680 6685 6690 His Ser Gln Leu Gly Gly Leu His Leu Leu Ile Gly Leu Ala Lys 6695 6700 6705 Arg Phe Lys Glu Ser Pro Phe Glu Leu Glu Asp Phe Ile Pro Met 6710 6715 6720 Asp Ser Thr Val Lys Asn Tyr Phe Ile Thr Asp Ala Gln Thr Gly 6725 6730 6735 Ser Ser Lys Cys Val Cys Ser Val Ile Asp Leu Leu Leu Asp Asp 6740 6745 6750 Phe Val Glu Ile Ile Lys Ser Gln Asp Leu Ser Val Val Ser Lys 6755 6760 6765 Val Val Lys Val Thr Ile Asp Tyr Thr Glu Ile Ser Phe Met Leu 6770 6775 6780 Trp Cys Lys Asp Gly His Val Glu Thr Phe Tyr Pro Lys Leu Gln 6785 6790 6795 Ser Ser Gln Ala Trp Gln Pro Gly Val Ala Met Pro Asn Leu Tyr 6800 6805 6810 Lys Met Gln Arg Met Leu Leu Glu Lys Cys Asp Leu Gln Asn Tyr 6815 6820 6825 Gly Asp Ser Ala Thr Leu Pro Lys Gly Ile Met Met Asn Val Ala 6830 6835 6840 Lys Tyr Thr Gln Leu Cys Gln Tyr Leu Asn Thr Leu Thr Leu Ala 6845 6850 6855 Val Pro Tyr Asn Met Arg Val Ile His Phe Gly Ala Gly Ser Asp 6860 6865 6870 Lys Gly Val Ala Pro Gly Thr Ala Val Leu Arg Gln Trp Leu Pro 6875 6880 6885 Thr Gly Thr Leu Leu Val Asp Ser Asp Leu Asn Asp Phe Val Ser 6890 6895 6900 Asp Ala Asp Ser Thr Leu Ile Gly Asp Cys Ala Thr Val His Thr 6905 6910 6915 Ala Asn Lys Trp Asp Leu Ile Ile Ser Asp Met Tyr Asp Pro Lys 6920 6925 6930 Thr Lys Asn Val Thr Lys Glu Asn Asp Ser Lys Glu Gly Phe Phe 6935 6940 6945 Thr Tyr Ile Cys Gly Phe Ile Gln Gln Lys Leu Ala Leu Gly Gly 6950 6955 6960 Ser Val Ala Ile Lys Ile Thr Glu His Ser Trp Asn Ala Asp Leu 6965 6970 6975 Tyr Lys Leu Met Gly His Phe Ala Trp Trp Thr Ala Phe Val Thr 6980 6985 6990 Asn Val Asn Ala Ser Ser Ser Glu Ala Phe Leu Ile Gly Cys Asn 6995 7000 7005 Tyr Leu Gly Lys Pro Arg Glu Gln Ile Asp Gly Tyr Val Met His 7010 7015 7020 Ala Asn Tyr Ile Phe Trp Arg Asn Thr Asn Pro Ile Gln Leu Ser 7025 7030 7035 Ser Tyr Ser Leu Phe Asp Met Ser Lys Phe Pro Leu Lys Leu Arg 7040 7045 7050 Gly Thr Ala Val Met Ser Leu Lys Glu Gly Gln Ile Asn Asp Met 7055 7060 7065 Ile Leu Ser Leu Leu Ser Lys Gly Arg Leu Ile Ile Arg Glu Asn 7070 7075 7080 Asn Arg Val Val Ile Ser Ser Asp Val Leu Val Asn Asn 7085 7090 7095 <210> 414 <211> 4405 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 414 Met Glu Ser Leu Val Pro Gly Phe Asn Glu Lys Thr His Val Gln Leu 1 5 10 15 Ser Leu Pro Val Leu Gln Val Arg Asp Val Leu Val Arg Gly Phe Gly 20 25 30 Asp Ser Val Glu Glu Val Leu Ser Glu Ala Arg Gln His Leu Lys Asp 35 40 45 Gly Thr Cys Gly Leu Val Glu Val Glu Lys Gly Val Leu Pro Gln Leu 50 55 60 Glu Gln Pro Tyr Val Phe Ile Lys Arg Ser Asp Ala Arg Thr Ala Pro 65 70 75 80 His Gly His Val Met Val Glu Leu Val Ala Glu Leu Glu Gly Ile Gln 85 90 95 Tyr Gly Arg Ser Gly Glu Thr Leu Gly Val Leu Val Pro His Val Gly 100 105 110 Glu Ile Pro Val Ala Tyr Arg Lys Val Leu Leu Arg Lys Asn Gly Asn 115 120 125 Lys Gly Ala Gly Gly His Ser Tyr Gly Ala Asp Leu Lys Ser Phe Asp 130 135 140 Leu Gly Asp Glu Leu Gly Thr Asp Pro Tyr Glu Asp Phe Gln Glu Asn 145 150 155 160 Trp Asn Thr Lys His Ser Ser Gly Val Thr Arg Glu Leu Met Arg Glu 165 170 175 Leu Asn Gly Gly Ala Tyr Thr Arg Tyr Val Asp Asn Asn Phe Cys Gly 180 185 190 Pro Asp Gly Tyr Pro Leu Glu Cys Ile Lys Asp Leu Leu Ala Arg Ala 195 200 205 Gly Lys Ala Ser Cys Thr Leu Ser Glu Gln Leu Asp Phe Ile Asp Thr 210 215 220 Lys Arg Gly Val Tyr Cys Cys Arg Glu His Glu His Glu Ile Ala Trp 225 230 235 240 Tyr Thr Glu Arg Ser Glu Lys Ser Tyr Glu Leu Gln Thr Pro Phe Glu 245 250 255 Ile Lys Leu Ala Lys Lys Phe Asp Thr Phe Asn Gly Glu Cys Pro Asn 260 265 270 Phe Val Phe Pro Leu Asn Ser Ile Ile Lys Thr Ile Gln Pro Arg Val 275 280 285 Glu Lys Lys Lys Leu Asp Gly Phe Met Gly Arg Ile Arg Ser Val Tyr 290 295 300 Pro Val Ala Ser Pro Asn Glu Cys Asn Gln Met Cys Leu Ser Thr Leu 305 310 315 320 Met Lys Cys Asp His Cys Gly Glu Thr Ser Trp Gln Thr Gly Asp Phe 325 330 335 Val Lys Ala Thr Cys Glu Phe Cys Gly Thr Glu Asn Leu Thr Lys Glu 340 345 350 Gly Ala Thr Thr Cys Gly Tyr Leu Pro Gln Asn Ala Val Val Lys Ile 355 360 365 Tyr Cys Pro Ala Cys His Asn Ser Glu Val Gly Pro Glu His Ser Leu 370 375 380 Ala Glu Tyr His Asn Glu Ser Gly Leu Lys Thr Ile Leu Arg Lys Gly 385 390 395 400 Gly Arg Thr Ile Ala Phe Gly Gly Cys Val Phe Ser Tyr Val Gly Cys 405 410 415 His Asn Lys Cys Ala Tyr Trp Val Pro Arg Ala Ser Ala Asn Ile Gly 420 425 430 Cys Asn His Thr Gly Val Val Gly Glu Gly Ser Glu Gly Leu Asn Asp 435 440 445 Asn Leu Leu Glu Ile Leu Gln Lys Glu Lys Val Asn Ile Asn Ile Val 450 455 460 Gly Asp Phe Lys Leu Asn Glu Glu Ile Ala Ile Ile Leu Ala Ser Phe 465 470 475 480 Ser Ala Ser Thr Ser Ala Phe Val Glu Thr Val Lys Gly Leu Asp Tyr 485 490 495 Lys Ala Phe Lys Gln Ile Val Glu Ser Cys Gly Asn Phe Lys Val Thr 500 505 510 Lys Gly Lys Ala Lys Lys Gly Ala Trp Asn Ile Gly Glu Gln Lys Ser 515 520 525 Ile Leu Ser Pro Leu Tyr Ala Phe Ala Ser Glu Ala Ala Arg Val Val 530 535 540 Arg Ser Ile Phe Ser Arg Thr Leu Glu Thr Ala Gln Asn Ser Val Arg 545 550 555 560 Val Leu Gln Lys Ala Ala Ile Thr Ile Leu Asp Gly Ile Ser Gln Tyr 565 570 575 Ser Leu Arg Leu Ile Asp Ala Met Met Phe Thr Ser Asp Leu Ala Thr 580 585 590 Asn Asn Leu Val Val Met Ala Tyr Ile Thr Gly Gly Val Val Gln Leu 595 600 605 Thr Ser Gln Trp Leu Thr Asn Ile Phe Gly Thr Val Tyr Glu Lys Leu 610 615 620 Lys Pro Val Leu Asp Trp Leu Glu Glu Lys Phe Lys Glu Gly Val Glu 625 630 635 640 Phe Leu Arg Asp Gly Trp Glu Ile Val Lys Phe Ile Ser Thr Cys Ala 645 650 655 Cys Glu Ile Val Gly Gly Gln Ile Val Thr Cys Ala Lys Glu Ile Lys 660 665 670 Glu Ser Val Gln Thr Phe Phe Lys Leu Val Asn Lys Phe Leu Ala Leu 675 680 685 Cys Ala Asp Ser Ile Ile Ile Gly Gly Ala Lys Leu Lys Ala Leu Asn 690 695 700 Leu Gly Glu Thr Phe Val Thr His Ser Lys Gly Leu Tyr Arg Lys Cys 705 710 715 720 Val Lys Ser Arg Glu Glu Thr Gly Leu Leu Met Pro Leu Lys Ala Pro 725 730 735 Lys Glu Ile Ile Phe Leu Glu Gly Glu Thr Leu Pro Thr Glu Val Leu 740 745 750 Thr Glu Glu Val Val Leu Lys Thr Gly Asp Leu Gln Pro Leu Glu Gln 755 760 765 Pro Thr Ser Glu Ala Val Glu Ala Pro Leu Val Gly Thr Pro Val Cys 770 775 780 Ile Asn Gly Leu Met Leu Leu Glu Ile Lys Asp Thr Glu Lys Tyr Cys 785 790 795 800 Ala Leu Ala Pro Asn Met Met Val Thr Asn Asn Thr Phe Thr Leu Lys 805 810 815 Gly Gly Ala Pro Thr Lys Val Thr Phe Gly Asp Asp Thr Val Ile Glu 820 825 830 Val Gln Gly Tyr Lys Ser Val Asn Ile Thr Phe Glu Leu Asp Glu Arg 835 840 845 Ile Asp Lys Val Leu Asn Glu Lys Cys Ser Ala Tyr Thr Val Glu Leu 850 855 860 Gly Thr Glu Val Asn Glu Phe Ala Cys Val Val Ala Asp Ala Val Ile 865 870 875 880 Lys Thr Leu Gln Pro Val Ser Glu Leu Leu Thr Pro Leu Gly Ile Asp 885 890 895 Leu Asp Glu Trp Ser Met Ala Thr Tyr Tyr Leu Phe Asp Glu Ser Gly 900 905 910 Glu Phe Lys Leu Ala Ser His Met Tyr Cys Ser Phe Tyr Pro Pro Asp 915 920 925 Glu Asp Glu Glu Glu Gly Asp Cys Glu Glu Glu Glu Phe Glu Pro Ser 930 935 940 Thr Gln Tyr Glu Tyr Gly Thr Glu Asp Asp Tyr Gln Gly Lys Pro Leu 945 950 955 960 Glu Phe Gly Ala Thr Ser Ala Ala Leu Gln Pro Glu Glu Glu Gln Glu 965 970 975 Glu Asp Trp Leu Asp Asp Asp Ser Gln Gln Thr Val Gly Gln Gln Asp 980 985 990 Gly Ser Glu Asp Asn Gln Thr Thr Thr Ile Gln Thr Ile Val Glu Val 995 1000 1005 Gln Pro Gln Leu Glu Met Glu Leu Thr Pro Val Val Gln Thr Ile 1010 1015 1020 Glu Val Asn Ser Phe Ser Gly Tyr Leu Lys Leu Thr Asp Asn Val 1025 1030 1035 Tyr Ile Lys Asn Ala Asp Ile Val Glu Glu Ala Lys Lys Val Lys 1040 1045 1050 Pro Thr Val Val Val Asn Ala Ala Asn Val Tyr Leu Lys His Gly 1055 1060 1065 Gly Gly Val Ala Gly Ala Leu Asn Lys Ala Thr Asn Asn Ala Met 1070 1075 1080 Gln Val Glu Ser Asp Asp Tyr Ile Ala Thr Asn Gly Pro Leu Lys 1085 1090 1095 Val Gly Gly Ser Cys Val Leu Ser Gly His Asn Leu Ala Lys His 1100 1105 1110 Cys Leu His Val Val Gly Pro Asn Val Asn Lys Gly Glu Asp Ile 1115 1120 1125 Gln Leu Leu Lys Ser Ala Tyr Glu Asn Phe Asn Gln His Glu Val 1130 1135 1140 Leu Leu Ala Pro Leu Leu Ser Ala Gly Ile Phe Gly Ala Asp Pro 1145 1150 1155 Ile His Ser Leu Arg Val Cys Val Asp Thr Val Arg Thr Asn Val 1160 1165 1170 Tyr Leu Ala Val Phe Asp Lys Asn Leu Tyr Asp Lys Leu Val Ser 1175 1180 1185 Ser Phe Leu Glu Met Lys Ser Glu Lys Gln Val Glu Gln Lys Ile 1190 1195 1200 Ala Glu Ile Pro Lys Glu Glu Val Lys Pro Phe Ile Thr Glu Ser 1205 1210 1215 Lys Pro Ser Val Glu Gln Arg Lys Gln Asp Asp Lys Lys Ile Lys 1220 1225 1230 Ala Cys Val Glu Glu Val Thr Thr Thr Leu Glu Glu Thr Lys Phe 1235 1240 1245 Leu Thr Glu Asn Leu Leu Leu Tyr Ile Asp Ile Asn Gly Asn Leu 1250 1255 1260 His Pro Asp Ser Ala Thr Leu Val Ser Asp Ile Asp Ile Thr Phe 1265 1270 1275 Leu Lys Lys Asp Ala Pro Tyr Ile Val Gly Asp Val Val Gln Glu 1280 1285 1290 Gly Val Leu Thr Ala Val Val Ile Pro Thr Lys Lys Ala Gly Gly 1295 1300 1305 Thr Thr Glu Met Leu Ala Lys Ala Leu Arg Lys Val Pro Thr Asp 1310 1315 1320 Asn Tyr Ile Thr Thr Tyr Pro Gly Gln Gly Leu Asn Gly Tyr Thr 1325 1330 1335 Val Glu Glu Ala Lys Thr Val Leu Lys Lys Cys Lys Ser Ala Phe 1340 1345 1350 Tyr Ile Leu Pro Ser Ile Ile Ser Asn Glu Lys Gln Glu Ile Leu 1355 1360 1365 Gly Thr Val Ser Trp Asn Leu Arg Glu Met Leu Ala His Ala Glu 1370 1375 1380 Glu Thr Arg Lys Leu Met Pro Val Cys Val Glu Thr Lys Ala Ile 1385 1390 1395 Val Ser Thr Ile Gln Arg Lys Tyr Lys Gly Ile Lys Ile Gln Glu 1400 1405 1410 Gly Val Val Asp Tyr Gly Ala Arg Phe Tyr Phe Tyr Thr Ser Lys 1415 1420 1425 Thr Thr Val Ala Ser Leu Ile Asn Thr Leu Asn Asp Leu Asn Glu 1430 1435 1440 Thr Leu Val Thr Met Pro Leu Gly Tyr Val Thr His Gly Leu Asn 1445 1450 1455 Leu Glu Glu Ala Ala Arg Tyr Met Arg Ser Leu Lys Val Pro Ala 1460 1465 1470 Thr Val Ser Val Ser Ser Pro Asp Ala Val Thr Ala Tyr Asn Gly 1475 1480 1485 Tyr Leu Thr Ser Ser Ser Lys Thr Pro Glu Glu His Phe Ile Glu 1490 1495 1500 Thr Ile Ser Leu Ala Gly Ser Tyr Lys Asp Trp Ser Tyr Ser Gly 1505 1510 1515 Gln Ser Thr Gln Leu Gly Ile Glu Phe Leu Lys Arg Gly Asp Lys 1520 1525 1530 Ser Val Tyr Tyr Thr Ser Asn Pro Thr Thr Phe His Leu Asp Gly 1535 1540 1545 Glu Val Ile Thr Phe Asp Asn Leu Lys Thr Leu Leu Ser Leu Arg 1550 1555 1560 Glu Val Arg Thr Ile Lys Val Phe Thr Thr Val Asp Asn Ile Asn 1565 1570 1575 Leu His Thr Gln Val Val Asp Met Ser Met Thr Tyr Gly Gln Gln 1580 1585 1590 Phe Gly Pro Thr Tyr Leu Asp Gly Ala Asp Val Thr Lys Ile Lys 1595 1600 1605 Pro His Asn Ser His Glu Gly Lys Thr Phe Tyr Val Leu Pro Asn 1610 1615 1620 Asp Asp Thr Leu Arg Val Glu Ala Phe Glu Tyr Tyr His Thr Thr 1625 1630 1635 Asp Pro Ser Phe Leu Gly Arg Tyr Met Ser Ala Leu Asn His Thr 1640 1645 1650 Lys Lys Trp Lys Tyr Pro Gln Val Asn Gly Leu Thr Ser Ile Lys 1655 1660 1665 Trp Ala Asp Asn Asn Cys Tyr Leu Ala Thr Ala Leu Leu Thr Leu 1670 1675 1680 Gln Gln Ile Glu Leu Lys Phe Asn Pro Pro Ala Leu Gln Asp Ala 1685 1690 1695 Tyr Tyr Arg Ala Arg Ala Gly Glu Ala Ala Asn Phe Cys Ala Leu 1700 1705 1710 Ile Leu Ala Tyr Cys Asn Lys Thr Val Gly Glu Leu Gly Asp Val 1715 1720 1725 Arg Glu Thr Met Ser Tyr Leu Phe Gln His Ala Asn Leu Asp Ser 1730 1735 1740 Cys Lys Arg Val Leu Asn Val Val Cys Lys Thr Cys Gly Gln Gln 1745 1750 1755 Gln Thr Thr Leu Lys Gly Val Glu Ala Val Met Tyr Met Gly Thr 1760 1765 1770 Leu Ser Tyr Glu Gln Phe Lys Lys Gly Val Gln Ile Pro Cys Thr 1775 1780 1785 Cys Gly Lys Gln Ala Thr Lys Tyr Leu Val Gln Gln Glu Ser Pro 1790 1795 1800 Phe Val Met Met Ser Ala Pro Pro Ala Gln Tyr Glu Leu Lys His 1805 1810 1815 Gly Thr Phe Thr Cys Ala Ser Glu Tyr Thr Gly Asn Tyr Gln Cys 1820 1825 1830 Gly His Tyr Lys His Ile Thr Ser Lys Glu Thr Leu Tyr Cys Ile 1835 1840 1845 Asp Gly Ala Leu Leu Thr Lys Ser Ser Glu Tyr Lys Gly Pro Ile 1850 1855 1860 Thr Asp Val Phe Tyr Lys Glu Asn Ser Tyr Thr Thr Thr Ile Lys 1865 1870 1875 Pro Val Thr Tyr Lys Leu Asp Gly Val Val Cys Thr Glu Ile Asp 1880 1885 1890 Pro Lys Leu Asp Asn Tyr Tyr Lys Lys Asp Asn Ser Tyr Phe Thr 1895 1900 1905 Glu Gln Pro Ile Asp Leu Val Pro Asn Gln Pro Tyr Pro Asn Ala 1910 1915 1920 Ser Phe Asp Asn Phe Lys Phe Val Cys Asp Asn Ile Lys Phe Ala 1925 1930 1935 Asp Asp Leu Asn Gln Leu Thr Gly Tyr Lys Lys Pro Ala Ser Arg 1940 1945 1950 Glu Leu Lys Val Thr Phe Phe Pro Asp Leu Asn Gly Asp Val Val 1955 1960 1965 Ala Ile Asp Tyr Lys His Tyr Thr Pro Ser Phe Lys Lys Gly Ala 1970 1975 1980 Lys Leu Leu His Lys Pro Ile Val Trp His Val Asn Asn Ala Thr 1985 1990 1995 Asn Lys Ala Thr Tyr Lys Pro Asn Thr Trp Cys Ile Arg Cys Leu 2000 2005 2010 Trp Ser Thr Lys Pro Val Glu Thr Ser Asn Ser Phe Asp Val Leu 2015 2020 2025 Lys Ser Glu Asp Ala Gln Gly Met Asp Asn Leu Ala Cys Glu Asp 2030 2035 2040 Leu Lys Pro Val Ser Glu Glu Val Val Glu Asn Pro Thr Ile Gln 2045 2050 2055 Lys Asp Val Leu Glu Cys Asn Val Lys Thr Thr Glu Val Val Gly 2060 2065 2070 Asp Ile Ile Leu Lys Pro Ala Asn Asn Ser Leu Lys Ile Thr Glu 2075 2080 2085 Glu Val Gly His Thr Asp Leu Met Ala Ala Tyr Val Asp Asn Ser 2090 2095 2100 Ser Leu Thr Ile Lys Lys Pro Asn Glu Leu Ser Arg Val Leu Gly 2105 2110 2115 Leu Lys Thr Leu Ala Thr His Gly Leu Ala Ala Val Asn Ser Val 2120 2125 2130 Pro Trp Asp Thr Ile Ala Asn Tyr Ala Lys Pro Phe Leu Asn Lys 2135 2140 2145 Val Val Ser Thr Thr Thr Asn Ile Val Thr Arg Cys Leu Asn Arg 2150 2155 2160 Val Cys Thr Asn Tyr Met Pro Tyr Phe Phe Thr Leu Leu Leu Gln 2165 2170 2175 Leu Cys Thr Phe Thr Arg Ser Thr Asn Ser Arg Ile Lys Ala Ser 2180 2185 2190 Met Pro Thr Thr Ile Ala Lys Asn Thr Val Lys Ser Val Gly Lys 2195 2200 2205 Phe Cys Leu Glu Ala Ser Phe Asn Tyr Leu Lys Ser Pro Asn Phe 2210 2215 2220 Ser Lys Leu Ile Asn Ile Ile Ile Trp Phe Leu Leu Leu Ser Val 2225 2230 2235 Cys Leu Gly Ser Leu Ile Tyr Ser Thr Ala Ala Leu Gly Val Leu 2240 2245 2250 Met Ser Asn Leu Gly Met Pro Ser Tyr Cys Thr Gly Tyr Arg Glu 2255 2260 2265 Gly Tyr Leu Asn Ser Thr Asn Val Thr Ile Ala Thr Tyr Cys Thr 2270 2275 2280 Gly Ser Ile Pro Cys Ser Val Cys Leu Ser Gly Leu Asp Ser Leu 2285 2290 2295 Asp Thr Tyr Pro Ser Leu Glu Thr Ile Gln Ile Thr Ile Ser Ser 2300 2305 2310 Phe Lys Trp Asp Leu Thr Ala Phe Gly Leu Val Ala Glu Trp Phe 2315 2320 2325 Leu Ala Tyr Ile Leu Phe Thr Arg Phe Phe Tyr Val Leu Gly Leu 2330 2335 2340 Ala Ala Ile Met Gln Leu Phe Phe Ser Tyr Phe Ala Val His Phe 2345 2350 2355 Ile Ser Asn Ser Trp Leu Met Trp Leu Ile Ile Asn Leu Val Gln 2360 2365 2370 Met Ala Pro Ile Ser Ala Met Val Arg Met Tyr Ile Phe Phe Ala 2375 2380 2385 Ser Phe Tyr Tyr Val Trp Lys Ser Tyr Val His Val Val Asp Gly 2390 2395 2400 Cys Asn Ser Ser Thr Cys Met Met Cys Tyr Lys Arg Asn Arg Ala 2405 2410 2415 Thr Arg Val Glu Cys Thr Thr Ile Val Asn Gly Val Arg Arg Ser 2420 2425 2430 Phe Tyr Val Tyr Ala Asn Gly Gly Lys Gly Phe Cys Lys Leu His 2435 2440 2445 Asn Trp Asn Cys Val Asn Cys Asp Thr Phe Cys Ala Gly Ser Thr 2450 2455 2460 Phe Ile Ser Asp Glu Val Ala Arg Asp Leu Ser Leu Gln Phe Lys 2465 2470 2475 Arg Pro Ile Asn Pro Thr Asp Gln Ser Ser Tyr Ile Val Asp Ser 2480 2485 2490 Val Thr Val Lys Asn Gly Ser Ile His Leu Tyr Phe Asp Lys Ala 2495 2500 2505 Gly Gln Lys Thr Tyr Glu Arg His Ser Leu Ser His Phe Val Asn 2510 2515 2520 Leu Asp Asn Leu Arg Ala Asn Asn Thr Lys Gly Ser Leu Pro Ile 2525 2530 2535 Asn Val Ile Val Phe Asp Gly Lys Ser Lys Cys Glu Glu Ser Ser 2540 2545 2550 Ala Lys Ser Ala Ser Val Tyr Tyr Ser Gln Leu Met Cys Gln Pro 2555 2560 2565 Ile Leu Leu Leu Asp Gln Ala Leu Val Ser Asp Val Gly Asp Ser 2570 2575 2580 Ala Glu Val Ala Val Lys Met Phe Asp Ala Tyr Val Asn Thr Phe 2585 2590 2595 Ser Ser Thr Phe Asn Val Pro Met Glu Lys Leu Lys Thr Leu Val 2600 2605 2610 Ala Thr Ala Glu Ala Glu Leu Ala Lys Asn Val Ser Leu Asp Asn 2615 2620 2625 Val Leu Ser Thr Phe Ile Ser Ala Ala Arg Gln Gly Phe Val Asp 2630 2635 2640 Ser Asp Val Glu Thr Lys Asp Val Val Glu Cys Leu Lys Leu Ser 2645 2650 2655 His Gln Ser Asp Ile Glu Val Thr Gly Asp Ser Cys Asn Asn Tyr 2660 2665 2670 Met Leu Thr Tyr Asn Lys Val Glu Asn Met Thr Pro Arg Asp Leu 2675 2680 2685 Gly Ala Cys Ile Asp Cys Ser Ala Arg His Ile Asn Ala Gln Val 2690 2695 2700 Ala Lys Ser His Asn Ile Ala Leu Ile Trp Asn Val Lys Asp Phe 2705 2710 2715 Met Ser Leu Ser Glu Gln Leu Arg Lys Gln Ile Arg Ser Ala Ala 2720 2725 2730 Lys Lys Asn Asn Leu Pro Phe Lys Leu Thr Cys Ala Thr Thr Arg 2735 2740 2745 Gln Val Val Asn Val Val Thr Thr Lys Ile Ala Leu Lys Gly Gly 2750 2755 2760 Lys Ile Val Asn Asn Trp Leu Lys Gln Leu Ile Lys Val Thr Leu 2765 2770 2775 Val Phe Leu Phe Val Ala Ala Ile Phe Tyr Leu Ile Thr Pro Val 2780 2785 2790 His Val Met Ser Lys His Thr Asp Phe Ser Ser Glu Ile Ile Gly 2795 2800 2805 Tyr Lys Ala Ile Asp Gly Gly Val Thr Arg Asp Ile Ala Ser Thr 2810 2815 2820 Asp Thr Cys Phe Ala Asn Lys His Ala Asp Phe Asp Thr Trp Phe 2825 2830 2835 Ser Gln Arg Gly Gly Ser Tyr Thr Asn Asp Lys Ala Cys Pro Leu 2840 2845 2850 Ile Ala Ala Val Ile Thr Arg Glu Val Gly Phe Val Val Pro Gly 2855 2860 2865 Leu Pro Gly Thr Ile Leu Arg Thr Thr Asn Gly Asp Phe Leu His 2870 2875 2880 Phe Leu Pro Arg Val Phe Ser Ala Val Gly Asn Ile Cys Tyr Thr 2885 2890 2895 Pro Ser Lys Leu Ile Glu Tyr Thr Asp Phe Ala Thr Ser Ala Cys 2900 2905 2910 Val Leu Ala Ala Glu Cys Thr Ile Phe Lys Asp Ala Ser Gly Lys 2915 2920 2925 Pro Val Pro Tyr Cys Tyr Asp Thr Asn Val Leu Glu Gly Ser Val 2930 2935 2940 Ala Tyr Glu Ser Leu Arg Pro Asp Thr Arg Tyr Val Leu Met Asp 2945 2950 2955 Gly Ser Ile Ile Gln Phe Pro Asn Thr Tyr Leu Glu Gly Ser Val 2960 2965 2970 Arg Val Val Thr Thr Phe Asp Ser Glu Tyr Cys Arg His Gly Thr 2975 2980 2985 Cys Glu Arg Ser Glu Ala Gly Val Cys Val Ser Thr Ser Gly Arg 2990 2995 3000 Trp Val Leu Asn Asn Asp Tyr Tyr Arg Ser Leu Pro Gly Val Phe 3005 3010 3015 Cys Gly Val Asp Ala Val Asn Leu Leu Thr Asn Met Phe Thr Pro 3020 3025 3030 Leu Ile Gln Pro Ile Gly Ala Leu Asp Ile Ser Ala Ser Ile Val 3035 3040 3045 Ala Gly Gly Ile Val Ala Ile Val Val Thr Cys Leu Ala Tyr Tyr 3050 3055 3060 Phe Met Arg Phe Arg Arg Ala Phe Gly Glu Tyr Ser His Val Val 3065 3070 3075 Ala Phe Asn Thr Leu Leu Phe Leu Met Ser Phe Thr Val Leu Cys 3080 3085 3090 Leu Thr Pro Val Tyr Ser Phe Leu Pro Gly Val Tyr Ser Val Ile 3095 3100 3105 Tyr Leu Tyr Leu Thr Phe Tyr Leu Thr Asn Asp Val Ser Phe Leu 3110 3115 3120 Ala His Ile Gln Trp Met Val Met Phe Thr Pro Leu Val Pro Phe 3125 3130 3135 Trp Ile Thr Ile Ala Tyr Ile Ile Cys Ile Ser Thr Lys His Phe 3140 3145 3150 Tyr Trp Phe Phe Ser Asn Tyr Leu Lys Arg Arg Val Val Phe Asn 3155 3160 3165 Gly Val Ser Phe Ser Thr Phe Glu Glu Ala Ala Leu Cys Thr Phe 3170 3175 3180 Leu Leu Asn Lys Glu Met Tyr Leu Lys Leu Arg Ser Asp Val Leu 3185 3190 3195 Leu Pro Leu Thr Gln Tyr Asn Arg Tyr Leu Ala Leu Tyr Asn Lys 3200 3205 3210 Tyr Lys Tyr Phe Ser Gly Ala Met Asp Thr Thr Ser Tyr Arg Glu 3215 3220 3225 Ala Ala Cys Cys His Leu Ala Lys Ala Leu Asn Asp Phe Ser Asn 3230 3235 3240 Ser Gly Ser Asp Val Leu Tyr Gln Pro Pro Gln Thr Ser Ile Thr 3245 3250 3255 Ser Ala Val Leu Gln Ser Gly Phe Arg Lys Met Ala Phe Pro Ser 3260 3265 3270 Gly Lys Val Glu Gly Cys Met Val Gln Val Thr Cys Gly Thr Thr 3275 3280 3285 Thr Leu Asn Gly Leu Trp Leu Asp Asp Val Val Tyr Cys Pro Arg 3290 3295 3300 His Val Ile Cys Thr Ser Glu Asp Met Leu Asn Pro Asn Tyr Glu 3305 3310 3315 Asp Leu Leu Ile Arg Lys Ser Asn His Asn Phe Leu Val Gln Ala 3320 3325 3330 Gly Asn Val Gln Leu Arg Val Ile Gly His Ser Met Gln Asn Cys 3335 3340 3345 Val Leu Lys Leu Lys Val Asp Thr Ala Asn Pro Lys Thr Pro Lys 3350 3355 3360 Tyr Lys Phe Val Arg Ile Gln Pro Gly Gln Thr Phe Ser Val Leu 3365 3370 3375 Ala Cys Tyr Asn Gly Ser Pro Ser Gly Val Tyr Gln Cys Ala Met 3380 3385 3390 Arg Pro Asn Phe Thr Ile Lys Gly Ser Phe Leu Asn Gly Ser Cys 3395 3400 3405 Gly Ser Val Gly Phe Asn Ile Asp Tyr Asp Cys Val Ser Phe Cys 3410 3415 3420 Tyr Met His His Met Glu Leu Pro Thr Gly Val His Ala Gly Thr 3425 3430 3435 Asp Leu Glu Gly Asn Phe Tyr Gly Pro Phe Val Asp Arg Gln Thr 3440 3445 3450 Ala Gln Ala Ala Gly Thr Asp Thr Thr Ile Thr Val Asn Val Leu 3455 3460 3465 Ala Trp Leu Tyr Ala Ala Val Ile Asn Gly Asp Arg Trp Phe Leu 3470 3475 3480 Asn Arg Phe Thr Thr Thr Leu Asn Asp Phe Asn Leu Val Ala Met 3485 3490 3495 Lys Tyr Asn Tyr Glu Pro Leu Thr Gln Asp His Val Asp Ile Leu 3500 3505 3510 Gly Pro Leu Ser Ala Gln Thr Gly Ile Ala Val Leu Asp Met Cys 3515 3520 3525 Ala Ser Leu Lys Glu Leu Leu Gln Asn Gly Met Asn Gly Arg Thr 3530 3535 3540 Ile Leu Gly Ser Ala Leu Leu Glu Asp Glu Phe Thr Pro Phe Asp 3545 3550 3555 Val Val Arg Gln Cys Ser Gly Val Thr Phe Gln Ser Ala Val Lys 3560 3565 3570 Arg Thr Ile Lys Gly Thr His His Trp Leu Leu Leu Thr Ile Leu 3575 3580 3585 Thr Ser Leu Leu Val Leu Val Gln Ser Thr Gln Trp Ser Leu Phe 3590 3595 3600 Phe Phe Leu Tyr Glu Asn Ala Phe Leu Pro Phe Ala Met Gly Ile 3605 3610 3615 Ile Ala Met Ser Ala Phe Ala Met Met Phe Val Lys His Lys His 3620 3625 3630 Ala Phe Leu Cys Leu Phe Leu Leu Pro Ser Leu Ala Thr Val Ala 3635 3640 3645 Tyr Phe Asn Met Val Tyr Met Pro Ala Ser Trp Val Met Arg Ile 3650 3655 3660 Met Thr Trp Leu Asp Met Val Asp Thr Ser Leu Ser Gly Phe Lys 3665 3670 3675 Leu Lys Asp Cys Val Met Tyr Ala Ser Ala Val Val Leu Leu Ile 3680 3685 3690 Leu Met Thr Ala Arg Thr Val Tyr Asp Asp Gly Ala Arg Arg Val 3695 3700 3705 Trp Thr Leu Met Asn Val Leu Thr Leu Val Tyr Lys Val Tyr Tyr 3710 3715 3720 Gly Asn Ala Leu Asp Gln Ala Ile Ser Met Trp Ala Leu Ile Ile 3725 3730 3735 Ser Val Thr Ser Asn Tyr Ser Gly Val Val Thr Thr Val Met Phe 3740 3745 3750 Leu Ala Arg Gly Ile Val Phe Met Cys Val Glu Tyr Cys Pro Ile 3755 3760 3765 Phe Phe Ile Thr Gly Asn Thr Leu Gln Cys Ile Met Leu Val Tyr 3770 3775 3780 Cys Phe Leu Gly Tyr Phe Cys Thr Cys Tyr Phe Gly Leu Phe Cys 3785 3790 3795 Leu Leu Asn Arg Tyr Phe Arg Leu Thr Leu Gly Val Tyr Asp Tyr 3800 3805 3810 Leu Val Ser Thr Gln Glu Phe Arg Tyr Met Asn Ser Gln Gly Leu 3815 3820 3825 Leu Pro Pro Lys Asn Ser Ile Asp Ala Phe Lys Leu Asn Ile Lys 3830 3835 3840 Leu Leu Gly Val Gly Gly Lys Pro Cys Ile Lys Val Ala Thr Val 3845 3850 3855 Gln Ser Lys Met Ser Asp Val Lys Cys Thr Ser Val Val Leu Leu 3860 3865 3870 Ser Val Leu Gln Gln Leu Arg Val Glu Ser Ser Ser Lys Leu Trp 3875 3880 3885 Ala Gln Cys Val Gln Leu His Asn Asp Ile Leu Leu Ala Lys Asp 3890 3895 3900 Thr Thr Glu Ala Phe Glu Lys Met Val Ser Leu Leu Ser Val Leu 3905 3910 3915 Leu Ser Met Gln Gly Ala Val Asp Ile Asn Lys Leu Cys Glu Glu 3920 3925 3930 Met Leu Asp Asn Arg Ala Thr Leu Gln Ala Ile Ala Ser Glu Phe 3935 3940 3945 Ser Ser Leu Pro Ser Tyr Ala Ala Phe Ala Thr Ala Gln Glu Ala 3950 3955 3960 Tyr Glu Gln Ala Val Ala Asn Gly Asp Ser Glu Val Val Leu Lys 3965 3970 3975 Lys Leu Lys Lys Ser Leu Asn Val Ala Lys Ser Glu Phe Asp Arg 3980 3985 3990 Asp Ala Ala Met Gln Arg Lys Leu Glu Lys Met Ala Asp Gln Ala 3995 4000 4005 Met Thr Gln Met Tyr Lys Gln Ala Arg Ser Glu Asp Lys Arg Ala 4010 4015 4020 Lys Val Thr Ser Ala Met Gln Thr Met Leu Phe Thr Met Leu Arg 4025 4030 4035 Lys Leu Asp Asn Asp Ala Leu Asn Asn Ile Ile Asn Asn Ala Arg 4040 4045 4050 Asp Gly Cys Val Pro Leu Asn Ile Ile Pro Leu Thr Thr Ala Ala 4055 4060 4065 Lys Leu Met Val Val Ile Pro Asp Tyr Asn Thr Tyr Lys Asn Thr 4070 4075 4080 Cys Asp Gly Thr Thr Phe Thr Tyr Ala Ser Ala Leu Trp Glu Ile 4085 4090 4095 Gln Gln Val Val Asp Ala Asp Ser Lys Ile Val Gln Leu Ser Glu 4100 4105 4110 Ile Ser Met Asp Asn Ser Pro Asn Leu Ala Trp Pro Leu Ile Val 4115 4120 4125 Thr Ala Leu Arg Ala Asn Ser Ala Val Lys Leu Gln Asn Asn Glu 4130 4135 4140 Leu Ser Pro Val Ala Leu Arg Gln Met Ser Cys Ala Ala Gly Thr 4145 4150 4155 Thr Gln Thr Ala Cys Thr Asp Asp Asn Ala Leu Ala Tyr Tyr Asn 4160 4165 4170 Thr Thr Lys Gly Gly Arg Phe Val Leu Ala Leu Leu Ser Asp Leu 4175 4180 4185 Gln Asp Leu Lys Trp Ala Arg Phe Pro Lys Ser Asp Gly Thr Gly 4190 4195 4200 Thr Ile Tyr Thr Glu Leu Glu Pro Pro Cys Arg Phe Val Thr Asp 4205 4210 4215 Thr Pro Lys Gly Pro Lys Val Lys Tyr Leu Tyr Phe Ile Lys Gly 4220 4225 4230 Leu Asn Asn Leu Asn Arg Gly Met Val Leu Gly Ser Leu Ala Ala 4235 4240 4245 Thr Val Arg Leu Gln Ala Gly Asn Ala Thr Glu Val Pro Ala Asn 4250 4255 4260 Ser Thr Val Leu Ser Phe Cys Ala Phe Ala Val Asp Ala Ala Lys 4265 4270 4275 Ala Tyr Lys Asp Tyr Leu Ala Ser Gly Gly Gln Pro Ile Thr Asn 4280 4285 4290 Cys Val Lys Met Leu Cys Thr His Thr Gly Thr Gly Gln Ala Ile 4295 4300 4305 Thr Val Thr Pro Glu Ala Asn Met Asp Gln Glu Ser Phe Gly Gly 4310 4315 4320 Ala Ser Cys Cys Leu Tyr Cys Arg Cys His Ile Asp His Pro Asn 4325 4330 4335 Pro Lys Gly Phe Cys Asp Leu Lys Gly Lys Tyr Val Gln Ile Pro 4340 4345 4350 Thr Thr Cys Ala Asn Asp Pro Val Gly Phe Thr Leu Lys Asn Thr 4355 4360 4365 Val Cys Thr Val Cys Gly Met Trp Lys Gly Tyr Gly Cys Ser Cys 4370 4375 4380 Asp Gln Leu Arg Glu Pro Met Leu Gln Ser Ala Asp Ala Gln Ser 4385 4390 4395 Phe Leu Asn Gly Phe Ala Val 4400 4405 <210> 415 <211> 1273 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 415 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile 885 890 895 Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn 1145 1150 1155 His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn 1160 1165 1170 Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu 1175 1180 1185 Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu 1190 1195 1200 Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu 1205 1210 1215 Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met 1220 1225 1230 Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys 1235 1240 1245 Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro 1250 1255 1260 Val Leu Lys Gly Val Lys Leu His Tyr Thr 1265 1270 <210> 416 <211> 275 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 416 Met Asp Leu Phe Met Arg Ile Phe Thr Ile Gly Thr Val Thr Leu Lys 1 5 10 15 Gln Gly Glu Ile Lys Asp Ala Thr Pro Ser Asp Phe Val Arg Ala Thr 20 25 30 Ala Thr Ile Pro Ile Gln Ala Ser Leu Pro Phe Gly Trp Leu Ile Val 35 40 45 Gly Val Ala Leu Leu Ala Val Phe Gln Ser Ala Ser Lys Ile Ile Thr 50 55 60 Leu Lys Lys Arg Trp Gln Leu Ala Leu Ser Lys Gly Val His Phe Val 65 70 75 80 Cys Asn Leu Leu Leu Leu Phe Val Thr Val Tyr Ser His Leu Leu Leu 85 90 95 Val Ala Ala Gly Leu Glu Ala Pro Phe Leu Tyr Leu Tyr Ala Leu Val 100 105 110 Tyr Phe Leu Gln Ser Ile Asn Phe Val Arg Ile Ile Met Arg Leu Trp 115 120 125 Leu Cys Trp Lys Cys Arg Ser Lys Asn Pro Leu Leu Tyr Asp Ala Asn 130 135 140 Tyr Phe Leu Cys Trp His Thr Asn Cys Tyr Asp Tyr Cys Ile Pro Tyr 145 150 155 160 Asn Ser Val Thr Ser Ser Ile Val Ile Thr Ser Gly Asp Gly Thr Thr 165 170 175 Ser Pro Ile Ser Glu His Asp Tyr Gln Ile Gly Gly Tyr Thr Glu Lys 180 185 190 Trp Glu Ser Gly Val Lys Asp Cys Val Val Leu His Ser Tyr Phe Thr 195 200 205 Ser Asp Tyr Tyr Gln Leu Tyr Ser Thr Gln Leu Ser Thr Asp Thr Gly 210 215 220 Val Glu His Val Thr Phe Phe Ile Tyr Asn Lys Ile Val Asp Glu Pro 225 230 235 240 Glu Glu His Val Gln Ile His Thr Ile Asp Gly Ser Ser Gly Val Val 245 250 255 Asn Pro Val Met Glu Pro Ile Tyr Asp Glu Pro Thr Thr Thr Thr Ser 260 265 270 Val Pro Leu 275 <210> 417 <211> 75 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 417 Met Tyr Ser Phe Val Ser Glu Glu Thr Gly Thr Leu Ile Val Asn Ser 1 5 10 15 Val Leu Leu Phe Leu Ala Phe Val Val Phe Leu Leu Val Thr Leu Ala 20 25 30 Ile Leu Thr Ala Leu Arg Leu Cys Ala Tyr Cys Cys Asn Ile Val Asn 35 40 45 Val Ser Leu Val Lys Pro Ser Phe Tyr Val Tyr Ser Arg Val Lys Asn 50 55 60 Leu Asn Ser Ser Arg Val Pro Asp Leu Leu Val 65 70 75 <210> 418 <211> 222 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 418 Met Ala Asp Ser Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Lys Leu 1 5 10 15 Leu Glu Gln Trp Asn Leu Val Ile Gly Phe Leu Phe Leu Thr Trp Ile 20 25 30 Cys Leu Leu Gln Phe Ala Tyr Ala Asn Arg Asn Arg Phe Leu Tyr Ile 35 40 45 Ile Lys Leu Ile Phe Leu Trp Leu Leu Trp Pro Val Thr Leu Ala Cys 50 55 60 Phe Val Leu Ala Ala Val Tyr Arg Ile Asn Trp Ile Thr Gly Gly Ile 65 70 75 80 Ala Ile Ala Met Ala Cys Leu Val Gly Leu Met Trp Leu Ser Tyr Phe 85 90 95 Ile Ala Ser Phe Arg Leu Phe Ala Arg Thr Arg Ser Met Trp Ser Phe 100 105 110 Asn Pro Glu Thr Asn Ile Leu Leu Asn Val Pro Leu His Gly Thr Ile 115 120 125 Leu Thr Arg Pro Leu Leu Glu Ser Glu Leu Val Ile Gly Ala Val Ile 130 135 140 Leu Arg Gly His Leu Arg Ile Ala Gly His His Leu Gly Arg Cys Asp 145 150 155 160 Ile Lys Asp Leu Pro Lys Glu Ile Thr Val Ala Thr Ser Arg Thr Leu 165 170 175 Ser Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Ala Gly Asp Ser Gly 180 185 190 Phe Ala Ala Tyr Ser Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr 195 200 205 Asp His Ser Ser Ser Ser Asp Asn Ile Ala Leu Leu Val Gln 210 215 220 <210> 419 <211> 61 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 419 Met Phe His Leu Val Asp Phe Gln Val Thr Ile Ala Glu Ile Leu Leu 1 5 10 15 Ile Ile Met Arg Thr Phe Lys Val Ser Ile Trp Asn Leu Asp Tyr Ile 20 25 30 Ile Asn Leu Ile Ile Lys Asn Leu Ser Lys Ser Leu Thr Glu Asn Lys 35 40 45 Tyr Ser Gln Leu Asp Glu Glu Gln Pro Met Glu Ile Asp 50 55 60 <210> 420 <211> 121 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 420 Met Lys Ile Ile Leu Phe Leu Ala Leu Ile Thr Leu Ala Thr Cys Glu 1 5 10 15 Leu Tyr His Tyr Gln Glu Cys Val Arg Gly Thr Thr Val Leu Leu Lys 20 25 30 Glu Pro Cys Ser Ser Gly Thr Tyr Glu Gly Asn Ser Pro Phe His Pro 35 40 45 Leu Ala Asp Asn Lys Phe Ala Leu Thr Cys Phe Ser Thr Gln Phe Ala 50 55 60 Phe Ala Cys Pro Asp Gly Val Lys His Val Tyr Gln Leu Arg Ala Arg 65 70 75 80 Ser Val Ser Pro Lys Leu Phe Ile Arg Gln Glu Glu Val Gln Glu Leu 85 90 95 Tyr Ser Pro Ile Phe Leu Ile Val Ala Ala Ile Val Phe Ile Thr Leu 100 105 110 Cys Phe Thr Leu Lys Arg Lys Thr Glu 115 120 <210> 421 <211> 43 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 421 Met Ile Glu Leu Ser Leu Ile Asp Phe Tyr Leu Cys Phe Leu Ala Phe 1 5 10 15 Leu Leu Phe Leu Val Leu Ile Met Leu Ile Ile Phe Trp Phe Ser Leu 20 25 30 Glu Leu Gln Asp His Asn Glu Thr Cys His Ala 35 40 <210> 422 <211> 121 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 422 Met Lys Phe Leu Val Phe Leu Gly Ile Ile Thr Thr Val Ala Ala Phe 1 5 10 15 His Gln Glu Cys Ser Leu Gln Ser Cys Thr Gln His Gln Pro Tyr Val 20 25 30 Val Asp Asp Pro Cys Pro Ile His Phe Tyr Ser Lys Trp Tyr Ile Arg 35 40 45 Val Gly Ala Arg Lys Ser Ala Pro Leu Ile Glu Leu Cys Val Asp Glu 50 55 60 Ala Gly Ser Lys Ser Pro Ile Gln Tyr Ile Asp Ile Gly Asn Tyr Thr 65 70 75 80 Val Ser Cys Leu Pro Phe Thr Ile Asn Cys Gln Glu Pro Lys Leu Gly 85 90 95 Ser Leu Val Val Arg Cys Ser Phe Tyr Glu Asp Phe Leu Glu Tyr His 100 105 110 Asp Val Arg Val Val Leu Asp Phe Ile 115 120 <210> 423 <211> 419 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 423 Met Ser Asp Asn Gly Pro Gln Asn Gln Arg Asn Ala Pro Arg Ile Thr 1 5 10 15 Phe Gly Gly Pro Ser Asp Ser Thr Gly Ser Asn Gln Asn Gly Glu Arg 20 25 30 Ser Gly Ala Arg Ser Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn Asn 35 40 45 Thr Ala Ser Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Asp Leu 50 55 60 Lys Phe Pro Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Ser Pro 65 70 75 80 Asp Asp Gln Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Ile Arg Gly 85 90 95 Gly Asp Gly Lys Met Lys Asp Leu Ser Pro Arg Trp Tyr Phe Tyr Tyr 100 105 110 Leu Gly Thr Gly Pro Glu Ala Gly Leu Pro Tyr Gly Ala Asn Lys Asp 115 120 125 Gly Ile Ile Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys Asp 130 135 140 His Ile Gly Thr Arg Asn Pro Ala Asn Asn Ala Ala Ile Val Leu Gln 145 150 155 160 Leu Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly Ser 165 170 175 Arg Gly Gly Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg Asn 180 185 190 Ser Ser Arg Asn Ser Thr Pro Gly Ser Ser Arg Gly Thr Ser Pro Ala 195 200 205 Arg Met Ala Gly Asn Gly Gly Asp Ala Ala Leu Ala Leu Leu Leu Leu 210 215 220 Asp Arg Leu Asn Gln Leu Glu Ser Lys Met Ser Gly Lys Gly Gln Gln 225 230 235 240 Gln Gln Gly Gln Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser Lys 245 250 255 Lys Pro Arg Gln Lys Arg Thr Ala Thr Lys Ala Tyr Asn Val Thr Gln 260 265 270 Ala Phe Gly Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly Asp 275 280 285 Gln Glu Leu Ile Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln Ile 290 295 300 Ala Gln Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg Ile 305 310 315 320 Gly Met Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr Thr Gly Ala 325 330 335 Ile Lys Leu Asp Asp Lys Asp Pro Asn Phe Lys Asp Gln Val Ile Leu 340 345 350 Leu Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu Pro 355 360 365 Lys Lys Asp Lys Lys Lys Lys Ala Asp Glu Thr Gln Ala Leu Pro Gln 370 375 380 Arg Gln Lys Lys Gln Gln Thr Val Thr Leu Leu Pro Ala Ala Asp Leu 385 390 395 400 Asp Asp Phe Ser Lys Gln Leu Gln Gln Ser Met Ser Ser Ala Asp Ser 405 410 415 Thr Gln Ala <210> 424 <211> 38 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 424 Met Gly Tyr Ile Asn Val Phe Ala Phe Pro Phe Thr Ile Tyr Ser Leu 1 5 10 15 Leu Leu Cys Arg Met Asn Ser Arg Asn Tyr Ile Ala Gln Val Asp Val 20 25 30 Val Asn Phe Asn Leu Thr 35 <210> 425 <211> 7096 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 425 Met Glu Ser Leu Val Pro Gly Phe Asn Glu Lys Thr His Val Gln Leu 1 5 10 15 Ser Leu Pro Val Leu Gln Val Arg Asp Val Leu Val Arg Gly Phe Gly 20 25 30 Asp Ser Val Glu Glu Val Leu Ser Glu Ala Arg Gln His Leu Lys Asp 35 40 45 Gly Thr Cys Gly Leu Val Glu Val Glu Lys Gly Val Leu Pro Gln Leu 50 55 60 Glu Gln Pro Tyr Val Phe Ile Lys Arg Ser Asp Ala Arg Thr Ala Pro 65 70 75 80 His Gly His Val Met Val Glu Leu Val Ala Glu Leu Glu Gly Ile Gln 85 90 95 Tyr Gly Arg Ser Gly Glu Thr Leu Gly Val Leu Val Pro His Val Gly 100 105 110 Glu Ile Pro Val Ala Tyr Arg Lys Val Leu Leu Arg Lys Asn Gly Asn 115 120 125 Lys Gly Ala Gly Gly His Ser Tyr Gly Ala Asp Leu Lys Ser Phe Asp 130 135 140 Leu Gly Asp Glu Leu Gly Thr Asp Pro Tyr Glu Asp Phe Gln Glu Asn 145 150 155 160 Trp Asn Thr Lys His Ser Ser Gly Val Thr Arg Glu Leu Met Arg Glu 165 170 175 Leu Asn Gly Gly Ala Tyr Thr Arg Tyr Val Asp Asn Asn Phe Cys Gly 180 185 190 Pro Asp Gly Tyr Pro Leu Glu Cys Ile Lys Asp Leu Leu Ala Arg Ala 195 200 205 Gly Lys Ala Ser Cys Thr Leu Ser Glu Gln Leu Asp Phe Ile Asp Thr 210 215 220 Lys Arg Gly Val Tyr Cys Cys Arg Glu His Glu His Glu Ile Ala Trp 225 230 235 240 Tyr Thr Glu Arg Ser Glu Lys Ser Tyr Glu Leu Gln Thr Pro Phe Glu 245 250 255 Ile Lys Leu Ala Lys Lys Phe Asp Thr Phe Asn Gly Glu Cys Pro Asn 260 265 270 Phe Val Phe Pro Leu Asn Ser Ile Ile Lys Thr Ile Gln Pro Arg Val 275 280 285 Glu Lys Lys Lys Leu Asp Gly Phe Met Gly Arg Ile Arg Ser Val Tyr 290 295 300 Pro Val Ala Ser Pro Asn Glu Cys Asn Gln Met Cys Leu Ser Thr Leu 305 310 315 320 Met Lys Cys Asp His Cys Gly Glu Thr Ser Trp Gln Thr Gly Asp Phe 325 330 335 Val Lys Ala Thr Cys Glu Phe Cys Gly Thr Glu Asn Leu Thr Lys Glu 340 345 350 Gly Ala Thr Thr Cys Gly Tyr Leu Pro Gln Asn Ala Val Val Lys Ile 355 360 365 Tyr Cys Pro Ala Cys His Asn Ser Glu Val Gly Pro Glu His Ser Leu 370 375 380 Ala Glu Tyr His Asn Glu Ser Gly Leu Lys Thr Ile Leu Arg Lys Gly 385 390 395 400 Gly Arg Thr Ile Ala Phe Gly Gly Cys Val Phe Ser Tyr Val Gly Cys 405 410 415 His Asn Lys Cys Ala Tyr Trp Val Pro Arg Ala Ser Ala Asn Ile Gly 420 425 430 Cys Asn His Thr Gly Val Val Gly Glu Gly Ser Glu Gly Leu Asn Asp 435 440 445 Asn Leu Leu Glu Ile Leu Gln Lys Glu Lys Val Asn Ile Asn Ile Val 450 455 460 Gly Asp Phe Lys Leu Asn Glu Glu Ile Ala Ile Ile Leu Ala Ser Phe 465 470 475 480 Ser Ala Ser Thr Ser Ala Phe Val Glu Thr Val Lys Gly Leu Asp Tyr 485 490 495 Lys Ala Phe Lys Gln Ile Val Glu Ser Cys Gly Asn Phe Lys Val Thr 500 505 510 Lys Gly Lys Ala Lys Lys Gly Ala Trp Asn Ile Gly Glu Gln Lys Ser 515 520 525 Ile Leu Ser Pro Leu Tyr Ala Phe Ala Ser Glu Ala Ala Arg Val Val 530 535 540 Arg Ser Ile Phe Ser Arg Thr Leu Glu Thr Ala Gln Asn Ser Val Arg 545 550 555 560 Val Leu Gln Lys Ala Ala Ile Thr Ile Leu Asp Gly Ile Ser Gln Tyr 565 570 575 Ser Leu Arg Leu Ile Asp Ala Met Met Phe Thr Ser Asp Leu Ala Thr 580 585 590 Asn Asn Leu Val Val Met Ala Tyr Ile Thr Gly Gly Val Val Gln Leu 595 600 605 Thr Ser Gln Trp Leu Thr Asn Ile Phe Gly Thr Val Tyr Glu Lys Leu 610 615 620 Lys Pro Val Leu Asp Trp Leu Glu Glu Lys Phe Lys Glu Gly Val Glu 625 630 635 640 Phe Leu Arg Asp Gly Trp Glu Ile Val Lys Phe Ile Ser Thr Cys Ala 645 650 655 Cys Glu Ile Val Gly Gly Gln Ile Val Thr Cys Ala Lys Glu Ile Lys 660 665 670 Glu Ser Val Gln Thr Phe Phe Lys Leu Val Asn Lys Phe Leu Ala Leu 675 680 685 Cys Ala Asp Ser Ile Ile Ile Gly Gly Ala Lys Leu Lys Ala Leu Asn 690 695 700 Leu Gly Glu Thr Phe Val Thr His Ser Lys Gly Leu Tyr Arg Lys Cys 705 710 715 720 Val Lys Ser Arg Glu Glu Thr Gly Leu Leu Met Pro Leu Lys Ala Pro 725 730 735 Lys Glu Ile Ile Phe Leu Glu Gly Glu Thr Leu Pro Thr Glu Val Leu 740 745 750 Thr Glu Glu Val Val Leu Lys Thr Gly Asp Leu Gln Pro Leu Glu Gln 755 760 765 Pro Thr Ser Glu Ala Val Glu Ala Pro Leu Val Gly Thr Pro Val Cys 770 775 780 Ile Asn Gly Leu Met Leu Leu Glu Ile Lys Asp Thr Glu Lys Tyr Cys 785 790 795 800 Ala Leu Ala Pro Asn Met Met Val Thr Asn Asn Thr Phe Thr Leu Lys 805 810 815 Gly Gly Ala Pro Thr Lys Val Thr Phe Gly Asp Asp Thr Val Ile Glu 820 825 830 Val Gln Gly Tyr Lys Ser Val Asn Ile Thr Phe Glu Leu Asp Glu Arg 835 840 845 Ile Asp Lys Val Leu Asn Glu Lys Cys Ser Ala Tyr Thr Val Glu Leu 850 855 860 Gly Thr Glu Val Asn Glu Phe Ala Cys Val Val Ala Asp Ala Val Ile 865 870 875 880 Lys Thr Leu Gln Pro Val Ser Glu Leu Leu Thr Pro Leu Gly Ile Asp 885 890 895 Leu Asp Glu Trp Ser Met Ala Thr Tyr Tyr Leu Phe Asp Glu Ser Gly 900 905 910 Glu Phe Lys Leu Ala Ser His Met Tyr Cys Ser Phe Tyr Pro Pro Asp 915 920 925 Glu Asp Glu Glu Glu Gly Asp Cys Glu Glu Glu Glu Phe Glu Pro Ser 930 935 940 Thr Gln Tyr Glu Tyr Gly Thr Glu Asp Asp Tyr Gln Gly Lys Pro Leu 945 950 955 960 Glu Phe Gly Ala Thr Ser Ala Ala Leu Gln Pro Glu Glu Glu Gln Glu 965 970 975 Glu Asp Trp Leu Asp Asp Asp Ser Gln Gln Thr Val Gly Gln Gln Asp 980 985 990 Gly Ser Glu Asp Asn Gln Thr Thr Thr Ile Gln Thr Ile Val Glu Val 995 1000 1005 Gln Pro Gln Leu Glu Met Glu Leu Thr Pro Val Val Gln Thr Ile 1010 1015 1020 Glu Val Asn Ser Phe Ser Gly Tyr Leu Lys Leu Thr Asp Asn Val 1025 1030 1035 Tyr Ile Lys Asn Ala Asp Ile Val Glu Glu Ala Lys Lys Val Lys 1040 1045 1050 Pro Thr Val Val Val Asn Ala Ala Asn Val Tyr Leu Lys His Gly 1055 1060 1065 Gly Gly Val Ala Gly Ala Leu Asn Lys Ala Thr Asn Asn Ala Met 1070 1075 1080 Gln Val Glu Ser Asp Asp Tyr Ile Ala Thr Asn Gly Pro Leu Lys 1085 1090 1095 Val Gly Gly Ser Cys Val Leu Ser Gly His Asn Leu Ala Lys His 1100 1105 1110 Cys Leu His Val Val Gly Pro Asn Val Asn Lys Gly Glu Asp Ile 1115 1120 1125 Gln Leu Leu Lys Ser Ala Tyr Glu Asn Phe Asn Gln His Glu Val 1130 1135 1140 Leu Leu Ala Pro Leu Leu Ser Ala Gly Ile Phe Gly Ala Asp Pro 1145 1150 1155 Ile His Ser Leu Arg Val Cys Val Asp Thr Val Arg Thr Asn Val 1160 1165 1170 Tyr Leu Ala Val Phe Asp Lys Asn Leu Tyr Asp Lys Leu Val Ser 1175 1180 1185 Ser Phe Leu Glu Met Lys Ser Glu Lys Gln Val Glu Gln Lys Ile 1190 1195 1200 Ala Glu Ile Pro Lys Glu Glu Val Lys Pro Phe Ile Thr Glu Ser 1205 1210 1215 Lys Pro Ser Val Glu Gln Arg Lys Gln Asp Asp Lys Lys Ile Lys 1220 1225 1230 Ala Cys Val Glu Glu Val Thr Thr Thr Leu Glu Glu Thr Lys Phe 1235 1240 1245 Leu Thr Glu Asn Leu Leu Leu Tyr Ile Asp Ile Asn Gly Asn Leu 1250 1255 1260 His Pro Asp Ser Ala Thr Leu Val Ser Asp Ile Asp Ile Thr Phe 1265 1270 1275 Leu Lys Lys Asp Ala Pro Tyr Ile Val Gly Asp Val Val Gln Glu 1280 1285 1290 Gly Val Leu Thr Ala Val Val Ile Pro Thr Lys Lys Ala Gly Gly 1295 1300 1305 Thr Thr Glu Met Leu Ala Lys Ala Leu Arg Lys Val Pro Thr Asp 1310 1315 1320 Asn Tyr Ile Thr Thr Tyr Pro Gly Gln Gly Leu Asn Gly Tyr Thr 1325 1330 1335 Val Glu Glu Ala Lys Thr Val Leu Lys Lys Cys Lys Ser Ala Phe 1340 1345 1350 Tyr Ile Leu Pro Ser Ile Ile Ser Asn Glu Lys Gln Glu Ile Leu 1355 1360 1365 Gly Thr Val Ser Trp Asn Leu Arg Glu Met Leu Ala His Ala Glu 1370 1375 1380 Glu Thr Arg Lys Leu Met Pro Val Cys Val Glu Thr Lys Ala Ile 1385 1390 1395 Val Ser Thr Ile Gln Arg Lys Tyr Lys Gly Ile Lys Ile Gln Glu 1400 1405 1410 Gly Val Val Asp Tyr Gly Ala Arg Phe Tyr Phe Tyr Thr Ser Lys 1415 1420 1425 Thr Thr Val Ala Ser Leu Ile Asn Thr Leu Asn Asp Leu Asn Glu 1430 1435 1440 Thr Leu Val Thr Met Pro Leu Gly Tyr Val Thr His Gly Leu Asn 1445 1450 1455 Leu Glu Glu Ala Ala Arg Tyr Met Arg Ser Leu Lys Val Pro Ala 1460 1465 1470 Thr Val Ser Val Ser Ser Pro Asp Ala Val Thr Ala Tyr Asn Gly 1475 1480 1485 Tyr Leu Thr Ser Ser Ser Lys Thr Pro Glu Glu His Phe Ile Glu 1490 1495 1500 Thr Ile Ser Leu Ala Gly Ser Tyr Lys Asp Trp Ser Tyr Ser Gly 1505 1510 1515 Gln Ser Thr Gln Leu Gly Ile Glu Phe Leu Lys Arg Gly Asp Lys 1520 1525 1530 Ser Val Tyr Tyr Thr Ser Asn Pro Thr Thr Phe His Leu Asp Gly 1535 1540 1545 Glu Val Ile Thr Phe Asp Asn Leu Lys Thr Leu Leu Ser Leu Arg 1550 1555 1560 Glu Val Arg Thr Ile Lys Val Phe Thr Thr Val Asp Asn Ile Asn 1565 1570 1575 Leu His Thr Gln Val Val Asp Met Ser Met Thr Tyr Gly Gln Gln 1580 1585 1590 Phe Gly Pro Thr Tyr Leu Asp Gly Ala Asp Val Thr Lys Ile Lys 1595 1600 1605 Pro His Asn Ser His Glu Gly Lys Thr Phe Tyr Val Leu Pro Asn 1610 1615 1620 Asp Asp Thr Leu Arg Val Glu Ala Phe Glu Tyr Tyr His Thr Thr 1625 1630 1635 Asp Pro Ser Phe Leu Gly Arg Tyr Met Ser Ala Leu Asn His Thr 1640 1645 1650 Lys Lys Trp Lys Tyr Pro Gln Val Asn Gly Leu Thr Ser Ile Lys 1655 1660 1665 Trp Ala Asp Asn Asn Cys Tyr Leu Ala Thr Ala Leu Leu Thr Leu 1670 1675 1680 Gln Gln Ile Glu Leu Lys Phe Asn Pro Pro Ala Leu Gln Asp Ala 1685 1690 1695 Tyr Tyr Arg Ala Arg Ala Gly Glu Ala Ala Asn Phe Cys Ala Leu 1700 1705 1710 Ile Leu Ala Tyr Cys Asn Lys Thr Val Gly Glu Leu Gly Asp Val 1715 1720 1725 Arg Glu Thr Met Ser Tyr Leu Phe Gln His Ala Asn Leu Asp Ser 1730 1735 1740 Cys Lys Arg Val Leu Asn Val Val Cys Lys Thr Cys Gly Gln Gln 1745 1750 1755 Gln Thr Thr Leu Lys Gly Val Glu Ala Val Met Tyr Met Gly Thr 1760 1765 1770 Leu Ser Tyr Glu Gln Phe Lys Lys Gly Val Gln Ile Pro Cys Thr 1775 1780 1785 Cys Gly Lys Gln Ala Thr Lys Tyr Leu Val Gln Gln Glu Ser Pro 1790 1795 1800 Phe Val Met Met Ser Ala Pro Pro Ala Gln Tyr Glu Leu Lys His 1805 1810 1815 Gly Thr Phe Thr Cys Ala Ser Glu Tyr Thr Gly Asn Tyr Gln Cys 1820 1825 1830 Gly His Tyr Lys His Ile Thr Ser Lys Glu Thr Leu Tyr Cys Ile 1835 1840 1845 Asp Gly Ala Leu Leu Thr Lys Ser Ser Glu Tyr Lys Gly Pro Ile 1850 1855 1860 Thr Asp Val Phe Tyr Lys Glu Asn Ser Tyr Thr Thr Thr Ile Lys 1865 1870 1875 Pro Val Thr Tyr Lys Leu Asp Gly Val Val Cys Thr Glu Ile Asp 1880 1885 1890 Pro Lys Leu Asp Asn Tyr Tyr Lys Lys Asp Asn Ser Tyr Phe Thr 1895 1900 1905 Glu Gln Pro Ile Asp Leu Val Pro Asn Gln Pro Tyr Pro Asn Ala 1910 1915 1920 Ser Phe Asp Asn Phe Lys Phe Val Cys Asp Asn Ile Lys Phe Ala 1925 1930 1935 Asp Asp Leu Asn Gln Leu Thr Gly Tyr Lys Lys Pro Ala Ser Arg 1940 1945 1950 Glu Leu Lys Val Thr Phe Phe Pro Asp Leu Asn Gly Asp Val Val 1955 1960 1965 Ala Ile Asp Tyr Lys His Tyr Thr Pro Ser Phe Lys Lys Gly Ala 1970 1975 1980 Lys Leu Leu His Lys Pro Ile Val Trp His Val Asn Asn Ala Thr 1985 1990 1995 Asn Lys Ala Thr Tyr Lys Pro Asn Thr Trp Cys Ile Arg Cys Leu 2000 2005 2010 Trp Ser Thr Lys Pro Val Glu Thr Ser Asn Ser Phe Asp Val Leu 2015 2020 2025 Lys Ser Glu Asp Ala Gln Gly Met Asp Asn Leu Ala Cys Glu Asp 2030 2035 2040 Leu Lys Pro Val Ser Glu Glu Val Val Glu Asn Pro Thr Ile Gln 2045 2050 2055 Lys Asp Val Leu Glu Cys Asn Val Lys Thr Thr Glu Val Val Gly 2060 2065 2070 Asp Ile Ile Leu Lys Pro Ala Asn Asn Ser Leu Lys Ile Thr Glu 2075 2080 2085 Glu Val Gly His Thr Asp Leu Met Ala Ala Tyr Val Asp Asn Ser 2090 2095 2100 Ser Leu Thr Ile Lys Lys Pro Asn Glu Leu Ser Arg Val Leu Gly 2105 2110 2115 Leu Lys Thr Leu Ala Thr His Gly Leu Ala Ala Val Asn Ser Val 2120 2125 2130 Pro Trp Asp Thr Ile Ala Asn Tyr Ala Lys Pro Phe Leu Asn Lys 2135 2140 2145 Val Val Ser Thr Thr Thr Asn Ile Val Thr Arg Cys Leu Asn Arg 2150 2155 2160 Val Cys Thr Asn Tyr Met Pro Tyr Phe Phe Thr Leu Leu Leu Gln 2165 2170 2175 Leu Cys Thr Phe Thr Arg Ser Thr Asn Ser Arg Ile Lys Ala Ser 2180 2185 2190 Met Pro Thr Thr Ile Ala Lys Asn Thr Val Lys Ser Val Gly Lys 2195 2200 2205 Phe Cys Leu Glu Ala Ser Phe Asn Tyr Leu Lys Ser Pro Asn Phe 2210 2215 2220 Ser Lys Leu Ile Asn Ile Ile Ile Trp Phe Leu Leu Leu Ser Val 2225 2230 2235 Cys Leu Gly Ser Leu Ile Tyr Ser Thr Ala Ala Leu Gly Val Leu 2240 2245 2250 Met Ser Asn Leu Gly Met Pro Ser Tyr Cys Thr Gly Tyr Arg Glu 2255 2260 2265 Gly Tyr Leu Asn Ser Thr Asn Val Thr Ile Ala Thr Tyr Cys Thr 2270 2275 2280 Gly Ser Ile Pro Cys Ser Val Cys Leu Ser Gly Leu Asp Ser Leu 2285 2290 2295 Asp Thr Tyr Pro Ser Leu Glu Thr Ile Gln Ile Thr Ile Ser Ser 2300 2305 2310 Phe Lys Trp Asp Leu Thr Ala Phe Gly Leu Val Ala Glu Trp Phe 2315 2320 2325 Leu Ala Tyr Ile Leu Phe Thr Arg Phe Phe Tyr Val Leu Gly Leu 2330 2335 2340 Ala Ala Ile Met Gln Leu Phe Phe Ser Tyr Phe Ala Val His Phe 2345 2350 2355 Ile Ser Asn Ser Trp Leu Met Trp Leu Ile Ile Asn Leu Val Gln 2360 2365 2370 Met Ala Pro Ile Ser Ala Met Val Arg Met Tyr Ile Phe Phe Ala 2375 2380 2385 Ser Phe Tyr Tyr Val Trp Lys Ser Tyr Val His Val Val Asp Gly 2390 2395 2400 Cys Asn Ser Ser Thr Cys Met Met Cys Tyr Lys Arg Asn Arg Ala 2405 2410 2415 Thr Arg Val Glu Cys Thr Thr Ile Val Asn Gly Val Arg Arg Ser 2420 2425 2430 Phe Tyr Val Tyr Ala Asn Gly Gly Lys Gly Phe Cys Lys Leu His 2435 2440 2445 Asn Trp Asn Cys Val Asn Cys Asp Thr Phe Cys Ala Gly Ser Thr 2450 2455 2460 Phe Ile Ser Asp Glu Val Ala Arg Asp Leu Ser Leu Gln Phe Lys 2465 2470 2475 Arg Pro Ile Asn Pro Thr Asp Gln Ser Ser Tyr Ile Val Asp Ser 2480 2485 2490 Val Thr Val Lys Asn Gly Ser Ile His Leu Tyr Phe Asp Lys Ala 2495 2500 2505 Gly Gln Lys Thr Tyr Glu Arg His Ser Leu Ser His Phe Val Asn 2510 2515 2520 Leu Asp Asn Leu Arg Ala Asn Asn Thr Lys Gly Ser Leu Pro Ile 2525 2530 2535 Asn Val Ile Val Phe Asp Gly Lys Ser Lys Cys Glu Glu Ser Ser 2540 2545 2550 Ala Lys Ser Ala Ser Val Tyr Tyr Ser Gln Leu Met Cys Gln Pro 2555 2560 2565 Ile Leu Leu Leu Asp Gln Ala Leu Val Ser Asp Val Gly Asp Ser 2570 2575 2580 Ala Glu Val Ala Val Lys Met Phe Asp Ala Tyr Val Asn Thr Phe 2585 2590 2595 Ser Ser Thr Phe Asn Val Pro Met Glu Lys Leu Lys Thr Leu Val 2600 2605 2610 Ala Thr Ala Glu Ala Glu Leu Ala Lys Asn Val Ser Leu Asp Asn 2615 2620 2625 Val Leu Ser Thr Phe Ile Ser Ala Ala Arg Gln Gly Phe Val Asp 2630 2635 2640 Ser Asp Val Glu Thr Lys Asp Val Val Glu Cys Leu Lys Leu Ser 2645 2650 2655 His Gln Ser Asp Ile Glu Val Thr Gly Asp Ser Cys Asn Asn Tyr 2660 2665 2670 Met Leu Thr Tyr Asn Lys Val Glu Asn Met Thr Pro Arg Asp Leu 2675 2680 2685 Gly Ala Cys Ile Asp Cys Ser Ala Arg His Ile Asn Ala Gln Val 2690 2695 2700 Ala Lys Ser His Asn Ile Ala Leu Ile Trp Asn Val Lys Asp Phe 2705 2710 2715 Met Ser Leu Ser Glu Gln Leu Arg Lys Gln Ile Arg Ser Ala Ala 2720 2725 2730 Lys Lys Asn Asn Leu Pro Phe Lys Leu Thr Cys Ala Thr Thr Arg 2735 2740 2745 Gln Val Val Asn Val Val Thr Thr Lys Ile Ala Leu Lys Gly Gly 2750 2755 2760 Lys Ile Val Asn Asn Trp Leu Lys Gln Leu Ile Lys Val Thr Leu 2765 2770 2775 Val Phe Leu Phe Val Ala Ala Ile Phe Tyr Leu Ile Thr Pro Val 2780 2785 2790 His Val Met Ser Lys His Thr Asp Phe Ser Ser Glu Ile Ile Gly 2795 2800 2805 Tyr Lys Ala Ile Asp Gly Gly Val Thr Arg Asp Ile Ala Ser Thr 2810 2815 2820 Asp Thr Cys Phe Ala Asn Lys His Ala Asp Phe Asp Thr Trp Phe 2825 2830 2835 Ser Gln Arg Gly Gly Ser Tyr Thr Asn Asp Lys Ala Cys Pro Leu 2840 2845 2850 Ile Ala Ala Val Ile Thr Arg Glu Val Gly Phe Val Val Pro Gly 2855 2860 2865 Leu Pro Gly Thr Ile Leu Arg Thr Thr Asn Gly Asp Phe Leu His 2870 2875 2880 Phe Leu Pro Arg Val Phe Ser Ala Val Gly Asn Ile Cys Tyr Thr 2885 2890 2895 Pro Ser Lys Leu Ile Glu Tyr Thr Asp Phe Ala Thr Ser Ala Cys 2900 2905 2910 Val Leu Ala Ala Glu Cys Thr Ile Phe Lys Asp Ala Ser Gly Lys 2915 2920 2925 Pro Val Pro Tyr Cys Tyr Asp Thr Asn Val Leu Glu Gly Ser Val 2930 2935 2940 Ala Tyr Glu Ser Leu Arg Pro Asp Thr Arg Tyr Val Leu Met Asp 2945 2950 2955 Gly Ser Ile Ile Gln Phe Pro Asn Thr Tyr Leu Glu Gly Ser Val 2960 2965 2970 Arg Val Val Thr Thr Phe Asp Ser Glu Tyr Cys Arg His Gly Thr 2975 2980 2985 Cys Glu Arg Ser Glu Ala Gly Val Cys Val Ser Thr Ser Gly Arg 2990 2995 3000 Trp Val Leu Asn Asn Asp Tyr Tyr Arg Ser Leu Pro Gly Val Phe 3005 3010 3015 Cys Gly Val Asp Ala Val Asn Leu Leu Thr Asn Met Phe Thr Pro 3020 3025 3030 Leu Ile Gln Pro Ile Gly Ala Leu Asp Ile Ser Ala Ser Ile Val 3035 3040 3045 Ala Gly Gly Ile Val Ala Ile Val Val Thr Cys Leu Ala Tyr Tyr 3050 3055 3060 Phe Met Arg Phe Arg Arg Ala Phe Gly Glu Tyr Ser His Val Val 3065 3070 3075 Ala Phe Asn Thr Leu Leu Phe Leu Met Ser Phe Thr Val Leu Cys 3080 3085 3090 Leu Thr Pro Val Tyr Ser Phe Leu Pro Gly Val Tyr Ser Val Ile 3095 3100 3105 Tyr Leu Tyr Leu Thr Phe Tyr Leu Thr Asn Asp Val Ser Phe Leu 3110 3115 3120 Ala His Ile Gln Trp Met Val Met Phe Thr Pro Leu Val Pro Phe 3125 3130 3135 Trp Ile Thr Ile Ala Tyr Ile Ile Cys Ile Ser Thr Lys His Phe 3140 3145 3150 Tyr Trp Phe Phe Ser Asn Tyr Leu Lys Arg Arg Val Val Phe Asn 3155 3160 3165 Gly Val Ser Phe Ser Thr Phe Glu Glu Ala Ala Leu Cys Thr Phe 3170 3175 3180 Leu Leu Asn Lys Glu Met Tyr Leu Lys Leu Arg Ser Asp Val Leu 3185 3190 3195 Leu Pro Leu Thr Gln Tyr Asn Arg Tyr Leu Ala Leu Tyr Asn Lys 3200 3205 3210 Tyr Lys Tyr Phe Ser Gly Ala Met Asp Thr Thr Ser Tyr Arg Glu 3215 3220 3225 Ala Ala Cys Cys His Leu Ala Lys Ala Leu Asn Asp Phe Ser Asn 3230 3235 3240 Ser Gly Ser Asp Val Leu Tyr Gln Pro Pro Gln Thr Ser Ile Thr 3245 3250 3255 Ser Ala Val Leu Gln Ser Gly Phe Arg Lys Met Ala Phe Pro Ser 3260 3265 3270 Gly Lys Val Glu Gly Cys Met Val Gln Val Thr Cys Gly Thr Thr 3275 3280 3285 Thr Leu Asn Gly Leu Trp Leu Asp Asp Val Val Tyr Cys Pro Arg 3290 3295 3300 His Val Ile Cys Thr Ser Glu Asp Met Leu Asn Pro Asn Tyr Glu 3305 3310 3315 Asp Leu Leu Ile Arg Lys Ser Asn His Asn Phe Leu Val Gln Ala 3320 3325 3330 Gly Asn Val Gln Leu Arg Val Ile Gly His Ser Met Gln Asn Cys 3335 3340 3345 Val Leu Lys Leu Lys Val Asp Thr Ala Asn Pro Lys Thr Pro Lys 3350 3355 3360 Tyr Lys Phe Val Arg Ile Gln Pro Gly Gln Thr Phe Ser Val Leu 3365 3370 3375 Ala Cys Tyr Asn Gly Ser Pro Ser Gly Val Tyr Gln Cys Ala Met 3380 3385 3390 Arg Pro Asn Phe Thr Ile Lys Gly Ser Phe Leu Asn Gly Ser Cys 3395 3400 3405 Gly Ser Val Gly Phe Asn Ile Asp Tyr Asp Cys Val Ser Phe Cys 3410 3415 3420 Tyr Met His His Met Glu Leu Pro Thr Gly Val His Ala Gly Thr 3425 3430 3435 Asp Leu Glu Gly Asn Phe Tyr Gly Pro Phe Val Asp Arg Gln Thr 3440 3445 3450 Ala Gln Ala Ala Gly Thr Asp Thr Thr Ile Thr Val Asn Val Leu 3455 3460 3465 Ala Trp Leu Tyr Ala Ala Val Ile Asn Gly Asp Arg Trp Phe Leu 3470 3475 3480 Asn Arg Phe Thr Thr Thr Leu Asn Asp Phe Asn Leu Val Ala Met 3485 3490 3495 Lys Tyr Asn Tyr Glu Pro Leu Thr Gln Asp His Val Asp Ile Leu 3500 3505 3510 Gly Pro Leu Ser Ala Gln Thr Gly Ile Ala Val Leu Asp Met Cys 3515 3520 3525 Ala Ser Leu Lys Glu Leu Leu Gln Asn Gly Met Asn Gly Arg Thr 3530 3535 3540 Ile Leu Gly Ser Ala Leu Leu Glu Asp Glu Phe Thr Pro Phe Asp 3545 3550 3555 Val Val Arg Gln Cys Ser Gly Val Thr Phe Gln Ser Ala Val Lys 3560 3565 3570 Arg Thr Ile Lys Gly Thr His His Trp Leu Leu Leu Thr Ile Leu 3575 3580 3585 Thr Ser Leu Leu Val Leu Val Gln Ser Thr Gln Trp Ser Leu Phe 3590 3595 3600 Phe Phe Leu Tyr Glu Asn Ala Phe Leu Pro Phe Ala Met Gly Ile 3605 3610 3615 Ile Ala Met Ser Ala Phe Ala Met Met Phe Val Lys His Lys His 3620 3625 3630 Ala Phe Leu Cys Leu Phe Leu Leu Pro Ser Leu Ala Thr Val Ala 3635 3640 3645 Tyr Phe Asn Met Val Tyr Met Pro Ala Ser Trp Val Met Arg Ile 3650 3655 3660 Met Thr Trp Leu Asp Met Val Asp Thr Ser Leu Ser Gly Phe Lys 3665 3670 3675 Leu Lys Asp Cys Val Met Tyr Ala Ser Ala Val Val Leu Leu Ile 3680 3685 3690 Leu Met Thr Ala Arg Thr Val Tyr Asp Asp Gly Ala Arg Arg Val 3695 3700 3705 Trp Thr Leu Met Asn Val Leu Thr Leu Val Tyr Lys Val Tyr Tyr 3710 3715 3720 Gly Asn Ala Leu Asp Gln Ala Ile Ser Met Trp Ala Leu Ile Ile 3725 3730 3735 Ser Val Thr Ser Asn Tyr Ser Gly Val Val Thr Thr Val Met Phe 3740 3745 3750 Leu Ala Arg Gly Ile Val Phe Met Cys Val Glu Tyr Cys Pro Ile 3755 3760 3765 Phe Phe Ile Thr Gly Asn Thr Leu Gln Cys Ile Met Leu Val Tyr 3770 3775 3780 Cys Phe Leu Gly Tyr Phe Cys Thr Cys Tyr Phe Gly Leu Phe Cys 3785 3790 3795 Leu Leu Asn Arg Tyr Phe Arg Leu Thr Leu Gly Val Tyr Asp Tyr 3800 3805 3810 Leu Val Ser Thr Gln Glu Phe Arg Tyr Met Asn Ser Gln Gly Leu 3815 3820 3825 Leu Pro Pro Lys Asn Ser Ile Asp Ala Phe Lys Leu Asn Ile Lys 3830 3835 3840 Leu Leu Gly Val Gly Gly Lys Pro Cys Ile Lys Val Ala Thr Val 3845 3850 3855 Gln Ser Lys Met Ser Asp Val Lys Cys Thr Ser Val Val Leu Leu 3860 3865 3870 Ser Val Leu Gln Gln Leu Arg Val Glu Ser Ser Ser Lys Leu Trp 3875 3880 3885 Ala Gln Cys Val Gln Leu His Asn Asp Ile Leu Leu Ala Lys Asp 3890 3895 3900 Thr Thr Glu Ala Phe Glu Lys Met Val Ser Leu Leu Ser Val Leu 3905 3910 3915 Leu Ser Met Gln Gly Ala Val Asp Ile Asn Lys Leu Cys Glu Glu 3920 3925 3930 Met Leu Asp Asn Arg Ala Thr Leu Gln Ala Ile Ala Ser Glu Phe 3935 3940 3945 Ser Ser Leu Pro Ser Tyr Ala Ala Phe Ala Thr Ala Gln Glu Ala 3950 3955 3960 Tyr Glu Gln Ala Val Ala Asn Gly Asp Ser Glu Val Val Leu Lys 3965 3970 3975 Lys Leu Lys Lys Ser Leu Asn Val Ala Lys Ser Glu Phe Asp Arg 3980 3985 3990 Asp Ala Ala Met Gln Arg Lys Leu Glu Lys Met Ala Asp Gln Ala 3995 4000 4005 Met Thr Gln Met Tyr Lys Gln Ala Arg Ser Glu Asp Lys Arg Ala 4010 4015 4020 Lys Val Thr Ser Ala Met Gln Thr Met Leu Phe Thr Met Leu Arg 4025 4030 4035 Lys Leu Asp Asn Asp Ala Leu Asn Asn Ile Ile Asn Asn Ala Arg 4040 4045 4050 Asp Gly Cys Val Pro Leu Asn Ile Ile Pro Leu Thr Thr Ala Ala 4055 4060 4065 Lys Leu Met Val Val Ile Pro Asp Tyr Asn Thr Tyr Lys Asn Thr 4070 4075 4080 Cys Asp Gly Thr Thr Phe Thr Tyr Ala Ser Ala Leu Trp Glu Ile 4085 4090 4095 Gln Gln Val Val Asp Ala Asp Ser Lys Ile Val Gln Leu Ser Glu 4100 4105 4110 Ile Ser Met Asp Asn Ser Pro Asn Leu Ala Trp Pro Leu Ile Val 4115 4120 4125 Thr Ala Leu Arg Ala Asn Ser Ala Val Lys Leu Gln Asn Asn Glu 4130 4135 4140 Leu Ser Pro Val Ala Leu Arg Gln Met Ser Cys Ala Ala Gly Thr 4145 4150 4155 Thr Gln Thr Ala Cys Thr Asp Asp Asn Ala Leu Ala Tyr Tyr Asn 4160 4165 4170 Thr Thr Lys Gly Gly Arg Phe Val Leu Ala Leu Leu Ser Asp Leu 4175 4180 4185 Gln Asp Leu Lys Trp Ala Arg Phe Pro Lys Ser Asp Gly Thr Gly 4190 4195 4200 Thr Ile Tyr Thr Glu Leu Glu Pro Pro Cys Arg Phe Val Thr Asp 4205 4210 4215 Thr Pro Lys Gly Pro Lys Val Lys Tyr Leu Tyr Phe Ile Lys Gly 4220 4225 4230 Leu Asn Asn Leu Asn Arg Gly Met Val Leu Gly Ser Leu Ala Ala 4235 4240 4245 Thr Val Arg Leu Gln Ala Gly Asn Ala Thr Glu Val Pro Ala Asn 4250 4255 4260 Ser Thr Val Leu Ser Phe Cys Ala Phe Ala Val Asp Ala Ala Lys 4265 4270 4275 Ala Tyr Lys Asp Tyr Leu Ala Ser Gly Gly Gln Pro Ile Thr Asn 4280 4285 4290 Cys Val Lys Met Leu Cys Thr His Thr Gly Thr Gly Gln Ala Ile 4295 4300 4305 Thr Val Thr Pro Glu Ala Asn Met Asp Gln Glu Ser Phe Gly Gly 4310 4315 4320 Ala Ser Cys Cys Leu Tyr Cys Arg Cys His Ile Asp His Pro Asn 4325 4330 4335 Pro Lys Gly Phe Cys Asp Leu Lys Gly Lys Tyr Val Gln Ile Pro 4340 4345 4350 Thr Thr Cys Ala Asn Asp Pro Val Gly Phe Thr Leu Lys Asn Thr 4355 4360 4365 Val Cys Thr Val Cys Gly Met Trp Lys Gly Tyr Gly Cys Ser Cys 4370 4375 4380 Asp Gln Leu Arg Glu Pro Met Leu Gln Ser Ala Asp Ala Gln Ser 4385 4390 4395 Phe Leu Asn Arg Val Cys Gly Val Ser Ala Ala Arg Leu Thr Pro 4400 4405 4410 Cys Gly Thr Gly Thr Ser Thr Asp Val Val Tyr Arg Ala Phe Asp 4415 4420 4425 Ile Tyr Asn Asp Lys Val Ala Gly Phe Ala Lys Phe Leu Lys Thr 4430 4435 4440 Asn Cys Cys Arg Phe Gln Glu Lys Asp Glu Asp Asp Asn Leu Ile 4445 4450 4455 Asp Ser Tyr Phe Val Val Lys Arg His Thr Phe Ser Asn Tyr Gln 4460 4465 4470 His Glu Glu Thr Ile Tyr Asn Leu Leu Lys Asp Cys Pro Ala Val 4475 4480 4485 Ala Lys His Asp Phe Phe Lys Phe Arg Ile Asp Gly Asp Met Val 4490 4495 4500 Pro His Ile Ser Arg Gln Arg Leu Thr Lys Tyr Thr Met Ala Asp 4505 4510 4515 Leu Val Tyr Ala Leu Arg His Phe Asp Glu Gly Asn Cys Asp Thr 4520 4525 4530 Leu Lys Glu Ile Leu Val Thr Tyr Asn Cys Cys Asp Asp Asp Tyr 4535 4540 4545 Phe Asn Lys Lys Asp Trp Tyr Asp Phe Val Glu Asn Pro Asp Ile 4550 4555 4560 Leu Arg Val Tyr Ala Asn Leu Gly Glu Arg Val Arg Gln Ala Leu 4565 4570 4575 Leu Lys Thr Val Gln Phe Cys Asp Ala Met Arg Asn Ala Gly Ile 4580 4585 4590 Val Gly Val Leu Thr Leu Asp Asn Gln Asp Leu Asn Gly Asn Trp 4595 4600 4605 Tyr Asp Phe Gly Asp Phe Ile Gln Thr Thr Pro Gly Ser Gly Val 4610 4615 4620 Pro Val Val Asp Ser Tyr Tyr Ser Leu Leu Met Pro Ile Leu Thr 4625 4630 4635 Leu Thr Arg Ala Leu Thr Ala Glu Ser His Val Asp Thr Asp Leu 4640 4645 4650 Thr Lys Pro Tyr Ile Lys Trp Asp Leu Leu Lys Tyr Asp Phe Thr 4655 4660 4665 Glu Glu Arg Leu Lys Leu Phe Asp Arg Tyr Phe Lys Tyr Trp Asp 4670 4675 4680 Gln Thr Tyr His Pro Asn Cys Val Asn Cys Leu Asp Asp Arg Cys 4685 4690 4695 Ile Leu His Cys Ala Asn Phe Asn Val Leu Phe Ser Thr Val Phe 4700 4705 4710 Pro Leu Thr Ser Phe Gly Pro Leu Val Arg Lys Ile Phe Val Asp 4715 4720 4725 Gly Val Pro Phe Val Val Ser Thr Gly Tyr His Phe Arg Glu Leu 4730 4735 4740 Gly Val Val His Asn Gln Asp Val Asn Leu His Ser Ser Arg Leu 4745 4750 4755 Ser Phe Lys Glu Leu Leu Val Tyr Ala Ala Asp Pro Ala Met His 4760 4765 4770 Ala Ala Ser Gly Asn Leu Leu Leu Asp Lys Arg Thr Thr Cys Phe 4775 4780 4785 Ser Val Ala Ala Leu Thr Asn Asn Val Ala Phe Gln Thr Val Lys 4790 4795 4800 Pro Gly Asn Phe Asn Lys Asp Phe Tyr Asp Phe Ala Val Ser Lys 4805 4810 4815 Gly Phe Phe Lys Glu Gly Ser Ser Val Glu Leu Lys His Phe Phe 4820 4825 4830 Phe Ala Gln Asp Gly Asn Ala Ala Ile Ser Asp Tyr Asp Tyr Tyr 4835 4840 4845 Arg Tyr Asn Leu Pro Thr Met Cys Asp Ile Arg Gln Leu Leu Phe 4850 4855 4860 Val Val Glu Val Val Asp Lys Tyr Phe Asp Cys Tyr Asp Gly Gly 4865 4870 4875 Cys Ile Asn Ala Asn Gln Val Ile Val Asn Asn Leu Asp Lys Ser 4880 4885 4890 Ala Gly Phe Pro Phe Asn Lys Trp Gly Lys Ala Arg Leu Tyr Tyr 4895 4900 4905 Asp Ser Met Ser Tyr Glu Asp Gln Asp Ala Leu Phe Ala Tyr Thr 4910 4915 4920 Lys Arg Asn Val Ile Pro Thr Ile Thr Gln Met Asn Leu Lys Tyr 4925 4930 4935 Ala Ile Ser Ala Lys Asn Arg Ala Arg Thr Val Ala Gly Val Ser 4940 4945 4950 Ile Cys Ser Thr Met Thr Asn Arg Gln Phe His Gln Lys Leu Leu 4955 4960 4965 Lys Ser Ile Ala Ala Thr Arg Gly Ala Thr Val Val Ile Gly Thr 4970 4975 4980 Ser Lys Phe Tyr Gly Gly Trp His Asn Met Leu Lys Thr Val Tyr 4985 4990 4995 Ser Asp Val Glu Asn Pro His Leu Met Gly Trp Asp Tyr Pro Lys 5000 5005 5010 Cys Asp Arg Ala Met Pro Asn Met Leu Arg Ile Met Ala Ser Leu 5015 5020 5025 Val Leu Ala Arg Lys His Thr Thr Cys Cys Ser Leu Ser His Arg 5030 5035 5040 Phe Tyr Arg Leu Ala Asn Glu Cys Ala Gln Val Leu Ser Glu Met 5045 5050 5055 Val Met Cys Gly Gly Ser Leu Tyr Val Lys Pro Gly Gly Thr Ser 5060 5065 5070 Ser Gly Asp Ala Thr Thr Ala Tyr Ala Asn Ser Val Phe Asn Ile 5075 5080 5085 Cys Gln Ala Val Thr Ala Asn Val Asn Ala Leu Leu Ser Thr Asp 5090 5095 5100 Gly Asn Lys Ile Ala Asp Lys Tyr Val Arg Asn Leu Gln His Arg 5105 5110 5115 Leu Tyr Glu Cys Leu Tyr Arg Asn Arg Asp Val Asp Thr Asp Phe 5120 5125 5130 Val Asn Glu Phe Tyr Ala Tyr Leu Arg Lys His Phe Ser Met Met 5135 5140 5145 Ile Leu Ser Asp Asp Ala Val Val Cys Phe Asn Ser Thr Tyr Ala 5150 5155 5160 Ser Gln Gly Leu Val Ala Ser Ile Lys Asn Phe Lys Ser Val Leu 5165 5170 5175 Tyr Tyr Gln Asn Asn Val Phe Met Ser Glu Ala Lys Cys Trp Thr 5180 5185 5190 Glu Thr Asp Leu Thr Lys Gly Pro His Glu Phe Cys Ser Gln His 5195 5200 5205 Thr Met Leu Val Lys Gln Gly Asp Asp Tyr Val Tyr Leu Pro Tyr 5210 5215 5220 Pro Asp Pro Ser Arg Ile Leu Gly Ala Gly Cys Phe Val Asp Asp 5225 5230 5235 Ile Val Lys Thr Asp Gly Thr Leu Met Ile Glu Arg Phe Val Ser 5240 5245 5250 Leu Ala Ile Asp Ala Tyr Pro Leu Thr Lys His Pro Asn Gln Glu 5255 5260 5265 Tyr Ala Asp Val Phe His Leu Tyr Leu Gln Tyr Ile Arg Lys Leu 5270 5275 5280 His Asp Glu Leu Thr Gly His Met Leu Asp Met Tyr Ser Val Met 5285 5290 5295 Leu Thr Asn Asp Asn Thr Ser Arg Tyr Trp Glu Pro Glu Phe Tyr 5300 5305 5310 Glu Ala Met Tyr Thr Pro His Thr Val Leu Gln Ala Val Gly Ala 5315 5320 5325 Cys Val Leu Cys Asn Ser Gln Thr Ser Leu Arg Cys Gly Ala Cys 5330 5335 5340 Ile Arg Arg Pro Phe Leu Cys Cys Lys Cys Cys Tyr Asp His Val 5345 5350 5355 Ile Ser Thr Ser His Lys Leu Val Leu Ser Val Asn Pro Tyr Val 5360 5365 5370 Cys Asn Ala Pro Gly Cys Asp Val Thr Asp Val Thr Gln Leu Tyr 5375 5380 5385 Leu Gly Gly Met Ser Tyr Tyr Cys Lys Ser His Lys Pro Pro Ile 5390 5395 5400 Ser Phe Pro Leu Cys Ala Asn Gly Gln Val Phe Gly Leu Tyr Lys 5405 5410 5415 Asn Thr Cys Val Gly Ser Asp Asn Val Thr Asp Phe Asn Ala Ile 5420 5425 5430 Ala Thr Cys Asp Trp Thr Asn Ala Gly Asp Tyr Ile Leu Ala Asn 5435 5440 5445 Thr Cys Thr Glu Arg Leu Lys Leu Phe Ala Ala Glu Thr Leu Lys 5450 5455 5460 Ala Thr Glu Glu Thr Phe Lys Leu Ser Tyr Gly Ile Ala Thr Val 5465 5470 5475 Arg Glu Val Leu Ser Asp Arg Glu Leu His Leu Ser Trp Glu Val 5480 5485 5490 Gly Lys Pro Arg Pro Pro Leu Asn Arg Asn Tyr Val Phe Thr Gly 5495 5500 5505 Tyr Arg Val Thr Lys Asn Ser Lys Val Gln Ile Gly Glu Tyr Thr 5510 5515 5520 Phe Glu Lys Gly Asp Tyr Gly Asp Ala Val Val Tyr Arg Gly Thr 5525 5530 5535 Thr Thr Tyr Lys Leu Asn Val Gly Asp Tyr Phe Val Leu Thr Ser 5540 5545 5550 His Thr Val Met Pro Leu Ser Ala Pro Thr Leu Val Pro Gln Glu 5555 5560 5565 His Tyr Val Arg Ile Thr Gly Leu Tyr Pro Thr Leu Asn Ile Ser 5570 5575 5580 Asp Glu Phe Ser Ser Asn Val Ala Asn Tyr Gln Lys Val Gly Met 5585 5590 5595 Gln Lys Tyr Ser Thr Leu Gln Gly Pro Pro Gly Thr Gly Lys Ser 5600 5605 5610 His Phe Ala Ile Gly Leu Ala Leu Tyr Tyr Pro Ser Ala Arg Ile 5615 5620 5625 Val Tyr Thr Ala Cys Ser His Ala Ala Val Asp Ala Leu Cys Glu 5630 5635 5640 Lys Ala Leu Lys Tyr Leu Pro Ile Asp Lys Cys Ser Arg Ile Ile 5645 5650 5655 Pro Ala Arg Ala Arg Val Glu Cys Phe Asp Lys Phe Lys Val Asn 5660 5665 5670 Ser Thr Leu Glu Gln Tyr Val Phe Cys Thr Val Asn Ala Leu Pro 5675 5680 5685 Glu Thr Thr Ala Asp Ile Val Val Phe Asp Glu Ile Ser Met Ala 5690 5695 5700 Thr Asn Tyr Asp Leu Ser Val Val Asn Ala Arg Leu Arg Ala Lys 5705 5710 5715 His Tyr Val Tyr Ile Gly Asp Pro Ala Gln Leu Pro Ala Pro Arg 5720 5725 5730 Thr Leu Leu Thr Lys Gly Thr Leu Glu Pro Glu Tyr Phe Asn Ser 5735 5740 5745 Val Cys Arg Leu Met Lys Thr Ile Gly Pro Asp Met Phe Leu Gly 5750 5755 5760 Thr Cys Arg Arg Cys Pro Ala Glu Ile Val Asp Thr Val Ser Ala 5765 5770 5775 Leu Val Tyr Asp Asn Lys Leu Lys Ala His Lys Asp Lys Ser Ala 5780 5785 5790 Gln Cys Phe Lys Met Phe Tyr Lys Gly Val Ile Thr His Asp Val 5795 5800 5805 Ser Ser Ala Ile Asn Arg Pro Gln Ile Gly Val Val Arg Glu Phe 5810 5815 5820 Leu Thr Arg Asn Pro Ala Trp Arg Lys Ala Val Phe Ile Ser Pro 5825 5830 5835 Tyr Asn Ser Gln Asn Ala Val Ala Ser Lys Ile Leu Gly Leu Pro 5840 5845 5850 Thr Gln Thr Val Asp Ser Ser Gln Gly Ser Glu Tyr Asp Tyr Val 5855 5860 5865 Ile Phe Thr Gln Thr Thr Glu Thr Ala His Ser Cys Asn Val Asn 5870 5875 5880 Arg Phe Asn Val Ala Ile Thr Arg Ala Lys Val Gly Ile Leu Cys 5885 5890 5895 Ile Met Ser Asp Arg Asp Leu Tyr Asp Lys Leu Gln Phe Thr Ser 5900 5905 5910 Leu Glu Ile Pro Arg Arg Asn Val Ala Thr Leu Gln Ala Glu Asn 5915 5920 5925 Val Thr Gly Leu Phe Lys Asp Cys Ser Lys Val Ile Thr Gly Leu 5930 5935 5940 His Pro Thr Gln Ala Pro Thr His Leu Ser Val Asp Thr Lys Phe 5945 5950 5955 Lys Thr Glu Gly Leu Cys Val Asp Ile Pro Gly Ile Pro Lys Asp 5960 5965 5970 Met Thr Tyr Arg Arg Leu Ile Ser Met Met Gly Phe Lys Met Asn 5975 5980 5985 Tyr Gln Val Asn Gly Tyr Pro Asn Met Phe Ile Thr Arg Glu Glu 5990 5995 6000 Ala Ile Arg His Val Arg Ala Trp Ile Gly Phe Asp Val Glu Gly 6005 6010 6015 Cys His Ala Thr Arg Glu Ala Val Gly Thr Asn Leu Pro Leu Gln 6020 6025 6030 Leu Gly Phe Ser Thr Gly Val Asn Leu Val Ala Val Pro Thr Gly 6035 6040 6045 Tyr Val Asp Thr Pro Asn Asn Thr Asp Phe Ser Arg Val Ser Ala 6050 6055 6060 Lys Pro Pro Pro Gly Asp Gln Phe Lys His Leu Ile Pro Leu Met 6065 6070 6075 Tyr Lys Gly Leu Pro Trp Asn Val Val Arg Ile Lys Ile Val Gln 6080 6085 6090 Met Leu Ser Asp Thr Leu Lys Asn Leu Ser Asp Arg Val Val Phe 6095 6100 6105 Val Leu Trp Ala His Gly Phe Glu Leu Thr Ser Met Lys Tyr Phe 6110 6115 6120 Val Lys Ile Gly Pro Glu Arg Thr Cys Cys Leu Cys Asp Arg Arg 6125 6130 6135 Ala Thr Cys Phe Ser Thr Ala Ser Asp Thr Tyr Ala Cys Trp His 6140 6145 6150 His Ser Ile Gly Phe Asp Tyr Val Tyr Asn Pro Phe Met Ile Asp 6155 6160 6165 Val Gln Gln Trp Gly Phe Thr Gly Asn Leu Gln Ser Asn His Asp 6170 6175 6180 Leu Tyr Cys Gln Val His Gly Asn Ala His Val Ala Ser Cys Asp 6185 6190 6195 Ala Ile Met Thr Arg Cys Leu Ala Val His Glu Cys Phe Val Lys 6200 6205 6210 Arg Val Asp Trp Thr Ile Glu Tyr Pro Ile Ile Gly Asp Glu Leu 6215 6220 6225 Lys Ile Asn Ala Ala Cys Arg Lys Val Gln His Met Val Val Lys 6230 6235 6240 Ala Ala Leu Leu Ala Asp Lys Phe Pro Val Leu His Asp Ile Gly 6245 6250 6255 Asn Pro Lys Ala Ile Lys Cys Val Pro Gln Ala Asp Val Glu Trp 6260 6265 6270 Lys Phe Tyr Asp Ala Gln Pro Cys Ser Asp Lys Ala Tyr Lys Ile 6275 6280 6285 Glu Glu Leu Phe Tyr Ser Tyr Ala Thr His Ser Asp Lys Phe Thr 6290 6295 6300 Asp Gly Val Cys Leu Phe Trp Asn Cys Asn Val Asp Arg Tyr Pro 6305 6310 6315 Ala Asn Ser Ile Val Cys Arg Phe Asp Thr Arg Val Leu Ser Asn 6320 6325 6330 Leu Asn Leu Pro Gly Cys Asp Gly Gly Ser Leu Tyr Val Asn Lys 6335 6340 6345 His Ala Phe His Thr Pro Ala Phe Asp Lys Ser Ala Phe Val Asn 6350 6355 6360 Leu Lys Gln Leu Pro Phe Phe Tyr Tyr Ser Asp Ser Pro Cys Glu 6365 6370 6375 Ser His Gly Lys Gln Val Val Ser Asp Ile Asp Tyr Val Pro Leu 6380 6385 6390 Lys Ser Ala Thr Cys Ile Thr Arg Cys Asn Leu Gly Gly Ala Val 6395 6400 6405 Cys Arg His His Ala Asn Glu Tyr Arg Leu Tyr Leu Asp Ala Tyr 6410 6415 6420 Asn Met Met Ile Ser Ala Gly Phe Ser Leu Trp Val Tyr Lys Gln 6425 6430 6435 Phe Asp Thr Tyr Asn Leu Trp Asn Thr Phe Thr Arg Leu Gln Ser 6440 6445 6450 Leu Glu Asn Val Ala Phe Asn Val Val Asn Lys Gly His Phe Asp 6455 6460 6465 Gly Gln Gln Gly Glu Val Pro Val Ser Ile Ile Asn Asn Thr Val 6470 6475 6480 Tyr Thr Lys Val Asp Gly Val Asp Val Glu Leu Phe Glu Asn Lys 6485 6490 6495 Thr Thr Leu Pro Val Asn Val Ala Phe Glu Leu Trp Ala Lys Arg 6500 6505 6510 Asn Ile Lys Pro Val Pro Glu Val Lys Ile Leu Asn Asn Leu Gly 6515 6520 6525 Val Asp Ile Ala Ala Asn Thr Val Ile Trp Asp Tyr Lys Arg Asp 6530 6535 6540 Ala Pro Ala His Ile Ser Thr Ile Gly Val Cys Ser Met Thr Asp 6545 6550 6555 Ile Ala Lys Lys Pro Thr Glu Thr Ile Cys Ala Pro Leu Thr Val 6560 6565 6570 Phe Phe Asp Gly Arg Val Asp Gly Gln Val Asp Leu Phe Arg Asn 6575 6580 6585 Ala Arg Asn Gly Val Leu Ile Thr Glu Gly Ser Val Lys Gly Leu 6590 6595 6600 Gln Pro Ser Val Gly Pro Lys Gln Ala Ser Leu Asn Gly Val Thr 6605 6610 6615 Leu Ile Gly Glu Ala Val Lys Thr Gln Phe Asn Tyr Tyr Lys Lys 6620 6625 6630 Val Asp Gly Val Val Gln Gln Leu Pro Glu Thr Tyr Phe Thr Gln 6635 6640 6645 Ser Arg Asn Leu Gln Glu Phe Lys Pro Arg Ser Gln Met Glu Ile 6650 6655 6660 Asp Phe Leu Glu Leu Ala Met Asp Glu Phe Ile Glu Arg Tyr Lys 6665 6670 6675 Leu Glu Gly Tyr Ala Phe Glu His Ile Val Tyr Gly Asp Phe Ser 6680 6685 6690 His Ser Gln Leu Gly Gly Leu His Leu Leu Ile Gly Leu Ala Lys 6695 6700 6705 Arg Phe Lys Glu Ser Pro Phe Glu Leu Glu Asp Phe Ile Pro Met 6710 6715 6720 Asp Ser Thr Val Lys Asn Tyr Phe Ile Thr Asp Ala Gln Thr Gly 6725 6730 6735 Ser Ser Lys Cys Val Cys Ser Val Ile Asp Leu Leu Leu Asp Asp 6740 6745 6750 Phe Val Glu Ile Ile Lys Ser Gln Asp Leu Ser Val Val Ser Lys 6755 6760 6765 Val Val Lys Val Thr Ile Asp Tyr Thr Glu Ile Ser Phe Met Leu 6770 6775 6780 Trp Cys Lys Asp Gly His Val Glu Thr Phe Tyr Pro Lys Leu Gln 6785 6790 6795 Ser Ser Gln Ala Trp Gln Pro Gly Val Ala Met Pro Asn Leu Tyr 6800 6805 6810 Lys Met Gln Arg Met Leu Leu Glu Lys Cys Asp Leu Gln Asn Tyr 6815 6820 6825 Gly Asp Ser Ala Thr Leu Pro Lys Gly Ile Met Met Asn Val Ala 6830 6835 6840 Lys Tyr Thr Gln Leu Cys Gln Tyr Leu Asn Thr Leu Thr Leu Ala 6845 6850 6855 Val Pro Tyr Asn Met Arg Val Ile His Phe Gly Ala Gly Ser Asp 6860 6865 6870 Lys Gly Val Ala Pro Gly Thr Ala Val Leu Arg Gln Trp Leu Pro 6875 6880 6885 Thr Gly Thr Leu Leu Val Asp Ser Asp Leu Asn Asp Phe Val Ser 6890 6895 6900 Asp Ala Asp Ser Thr Leu Ile Gly Asp Cys Ala Thr Val His Thr 6905 6910 6915 Ala Asn Lys Trp Asp Leu Ile Ile Ser Asp Met Tyr Asp Pro Lys 6920 6925 6930 Thr Lys Asn Val Thr Lys Glu Asn Asp Ser Lys Glu Gly Phe Phe 6935 6940 6945 Thr Tyr Ile Cys Gly Phe Ile Gln Gln Lys Leu Ala Leu Gly Gly 6950 6955 6960 Ser Val Ala Ile Lys Ile Thr Glu His Ser Trp Asn Ala Asp Leu 6965 6970 6975 Tyr Lys Leu Met Gly His Phe Ala Trp Trp Thr Ala Phe Val Thr 6980 6985 6990 Asn Val Asn Ala Ser Ser Ser Glu Ala Phe Leu Ile Gly Cys Asn 6995 7000 7005 Tyr Leu Gly Lys Pro Arg Glu Gln Ile Asp Gly Tyr Val Met His 7010 7015 7020 Ala Asn Tyr Ile Phe Trp Arg Asn Thr Asn Pro Ile Gln Leu Ser 7025 7030 7035 Ser Tyr Ser Leu Phe Asp Met Ser Lys Phe Pro Leu Lys Leu Arg 7040 7045 7050 Gly Thr Ala Val Met Ser Leu Lys Glu Gly Gln Ile Asn Asp Met 7055 7060 7065 Ile Leu Ser Leu Leu Ser Lys Gly Arg Leu Ile Ile Arg Glu Asn 7070 7075 7080 Asn Arg Val Val Ile Ser Ser Asp Val Leu Val Asn Asn 7085 7090 7095 <210> 426 <211> 4405 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 426 Met Glu Ser Leu Val Pro Gly Phe Asn Glu Lys Thr His Val Gln Leu 1 5 10 15 Ser Leu Pro Val Leu Gln Val Arg Asp Val Leu Val Arg Gly Phe Gly 20 25 30 Asp Ser Val Glu Glu Val Leu Ser Glu Ala Arg Gln His Leu Lys Asp 35 40 45 Gly Thr Cys Gly Leu Val Glu Val Glu Lys Gly Val Leu Pro Gln Leu 50 55 60 Glu Gln Pro Tyr Val Phe Ile Lys Arg Ser Asp Ala Arg Thr Ala Pro 65 70 75 80 His Gly His Val Met Val Glu Leu Val Ala Glu Leu Glu Gly Ile Gln 85 90 95 Tyr Gly Arg Ser Gly Glu Thr Leu Gly Val Leu Val Pro His Val Gly 100 105 110 Glu Ile Pro Val Ala Tyr Arg Lys Val Leu Leu Arg Lys Asn Gly Asn 115 120 125 Lys Gly Ala Gly Gly His Ser Tyr Gly Ala Asp Leu Lys Ser Phe Asp 130 135 140 Leu Gly Asp Glu Leu Gly Thr Asp Pro Tyr Glu Asp Phe Gln Glu Asn 145 150 155 160 Trp Asn Thr Lys His Ser Ser Gly Val Thr Arg Glu Leu Met Arg Glu 165 170 175 Leu Asn Gly Gly Ala Tyr Thr Arg Tyr Val Asp Asn Asn Phe Cys Gly 180 185 190 Pro Asp Gly Tyr Pro Leu Glu Cys Ile Lys Asp Leu Leu Ala Arg Ala 195 200 205 Gly Lys Ala Ser Cys Thr Leu Ser Glu Gln Leu Asp Phe Ile Asp Thr 210 215 220 Lys Arg Gly Val Tyr Cys Cys Arg Glu His Glu His Glu Ile Ala Trp 225 230 235 240 Tyr Thr Glu Arg Ser Glu Lys Ser Tyr Glu Leu Gln Thr Pro Phe Glu 245 250 255 Ile Lys Leu Ala Lys Lys Phe Asp Thr Phe Asn Gly Glu Cys Pro Asn 260 265 270 Phe Val Phe Pro Leu Asn Ser Ile Ile Lys Thr Ile Gln Pro Arg Val 275 280 285 Glu Lys Lys Lys Leu Asp Gly Phe Met Gly Arg Ile Arg Ser Val Tyr 290 295 300 Pro Val Ala Ser Pro Asn Glu Cys Asn Gln Met Cys Leu Ser Thr Leu 305 310 315 320 Met Lys Cys Asp His Cys Gly Glu Thr Ser Trp Gln Thr Gly Asp Phe 325 330 335 Val Lys Ala Thr Cys Glu Phe Cys Gly Thr Glu Asn Leu Thr Lys Glu 340 345 350 Gly Ala Thr Thr Cys Gly Tyr Leu Pro Gln Asn Ala Val Val Lys Ile 355 360 365 Tyr Cys Pro Ala Cys His Asn Ser Glu Val Gly Pro Glu His Ser Leu 370 375 380 Ala Glu Tyr His Asn Glu Ser Gly Leu Lys Thr Ile Leu Arg Lys Gly 385 390 395 400 Gly Arg Thr Ile Ala Phe Gly Gly Cys Val Phe Ser Tyr Val Gly Cys 405 410 415 His Asn Lys Cys Ala Tyr Trp Val Pro Arg Ala Ser Ala Asn Ile Gly 420 425 430 Cys Asn His Thr Gly Val Val Gly Glu Gly Ser Glu Gly Leu Asn Asp 435 440 445 Asn Leu Leu Glu Ile Leu Gln Lys Glu Lys Val Asn Ile Asn Ile Val 450 455 460 Gly Asp Phe Lys Leu Asn Glu Glu Ile Ala Ile Ile Leu Ala Ser Phe 465 470 475 480 Ser Ala Ser Thr Ser Ala Phe Val Glu Thr Val Lys Gly Leu Asp Tyr 485 490 495 Lys Ala Phe Lys Gln Ile Val Glu Ser Cys Gly Asn Phe Lys Val Thr 500 505 510 Lys Gly Lys Ala Lys Lys Gly Ala Trp Asn Ile Gly Glu Gln Lys Ser 515 520 525 Ile Leu Ser Pro Leu Tyr Ala Phe Ala Ser Glu Ala Ala Arg Val Val 530 535 540 Arg Ser Ile Phe Ser Arg Thr Leu Glu Thr Ala Gln Asn Ser Val Arg 545 550 555 560 Val Leu Gln Lys Ala Ala Ile Thr Ile Leu Asp Gly Ile Ser Gln Tyr 565 570 575 Ser Leu Arg Leu Ile Asp Ala Met Met Phe Thr Ser Asp Leu Ala Thr 580 585 590 Asn Asn Leu Val Val Met Ala Tyr Ile Thr Gly Gly Val Val Gln Leu 595 600 605 Thr Ser Gln Trp Leu Thr Asn Ile Phe Gly Thr Val Tyr Glu Lys Leu 610 615 620 Lys Pro Val Leu Asp Trp Leu Glu Glu Lys Phe Lys Glu Gly Val Glu 625 630 635 640 Phe Leu Arg Asp Gly Trp Glu Ile Val Lys Phe Ile Ser Thr Cys Ala 645 650 655 Cys Glu Ile Val Gly Gly Gln Ile Val Thr Cys Ala Lys Glu Ile Lys 660 665 670 Glu Ser Val Gln Thr Phe Phe Lys Leu Val Asn Lys Phe Leu Ala Leu 675 680 685 Cys Ala Asp Ser Ile Ile Ile Gly Gly Ala Lys Leu Lys Ala Leu Asn 690 695 700 Leu Gly Glu Thr Phe Val Thr His Ser Lys Gly Leu Tyr Arg Lys Cys 705 710 715 720 Val Lys Ser Arg Glu Glu Thr Gly Leu Leu Met Pro Leu Lys Ala Pro 725 730 735 Lys Glu Ile Ile Phe Leu Glu Gly Glu Thr Leu Pro Thr Glu Val Leu 740 745 750 Thr Glu Glu Val Val Leu Lys Thr Gly Asp Leu Gln Pro Leu Glu Gln 755 760 765 Pro Thr Ser Glu Ala Val Glu Ala Pro Leu Val Gly Thr Pro Val Cys 770 775 780 Ile Asn Gly Leu Met Leu Leu Glu Ile Lys Asp Thr Glu Lys Tyr Cys 785 790 795 800 Ala Leu Ala Pro Asn Met Met Val Thr Asn Asn Thr Phe Thr Leu Lys 805 810 815 Gly Gly Ala Pro Thr Lys Val Thr Phe Gly Asp Asp Thr Val Ile Glu 820 825 830 Val Gln Gly Tyr Lys Ser Val Asn Ile Thr Phe Glu Leu Asp Glu Arg 835 840 845 Ile Asp Lys Val Leu Asn Glu Lys Cys Ser Ala Tyr Thr Val Glu Leu 850 855 860 Gly Thr Glu Val Asn Glu Phe Ala Cys Val Val Ala Asp Ala Val Ile 865 870 875 880 Lys Thr Leu Gln Pro Val Ser Glu Leu Leu Thr Pro Leu Gly Ile Asp 885 890 895 Leu Asp Glu Trp Ser Met Ala Thr Tyr Tyr Leu Phe Asp Glu Ser Gly 900 905 910 Glu Phe Lys Leu Ala Ser His Met Tyr Cys Ser Phe Tyr Pro Pro Asp 915 920 925 Glu Asp Glu Glu Glu Gly Asp Cys Glu Glu Glu Glu Phe Glu Pro Ser 930 935 940 Thr Gln Tyr Glu Tyr Gly Thr Glu Asp Asp Tyr Gln Gly Lys Pro Leu 945 950 955 960 Glu Phe Gly Ala Thr Ser Ala Ala Leu Gln Pro Glu Glu Glu Gln Glu 965 970 975 Glu Asp Trp Leu Asp Asp Asp Ser Gln Gln Thr Val Gly Gln Gln Asp 980 985 990 Gly Ser Glu Asp Asn Gln Thr Thr Thr Ile Gln Thr Ile Val Glu Val 995 1000 1005 Gln Pro Gln Leu Glu Met Glu Leu Thr Pro Val Val Gln Thr Ile 1010 1015 1020 Glu Val Asn Ser Phe Ser Gly Tyr Leu Lys Leu Thr Asp Asn Val 1025 1030 1035 Tyr Ile Lys Asn Ala Asp Ile Val Glu Glu Ala Lys Lys Val Lys 1040 1045 1050 Pro Thr Val Val Val Asn Ala Ala Asn Val Tyr Leu Lys His Gly 1055 1060 1065 Gly Gly Val Ala Gly Ala Leu Asn Lys Ala Thr Asn Asn Ala Met 1070 1075 1080 Gln Val Glu Ser Asp Asp Tyr Ile Ala Thr Asn Gly Pro Leu Lys 1085 1090 1095 Val Gly Gly Ser Cys Val Leu Ser Gly His Asn Leu Ala Lys His 1100 1105 1110 Cys Leu His Val Val Gly Pro Asn Val Asn Lys Gly Glu Asp Ile 1115 1120 1125 Gln Leu Leu Lys Ser Ala Tyr Glu Asn Phe Asn Gln His Glu Val 1130 1135 1140 Leu Leu Ala Pro Leu Leu Ser Ala Gly Ile Phe Gly Ala Asp Pro 1145 1150 1155 Ile His Ser Leu Arg Val Cys Val Asp Thr Val Arg Thr Asn Val 1160 1165 1170 Tyr Leu Ala Val Phe Asp Lys Asn Leu Tyr Asp Lys Leu Val Ser 1175 1180 1185 Ser Phe Leu Glu Met Lys Ser Glu Lys Gln Val Glu Gln Lys Ile 1190 1195 1200 Ala Glu Ile Pro Lys Glu Glu Val Lys Pro Phe Ile Thr Glu Ser 1205 1210 1215 Lys Pro Ser Val Glu Gln Arg Lys Gln Asp Asp Lys Lys Ile Lys 1220 1225 1230 Ala Cys Val Glu Glu Val Thr Thr Thr Leu Glu Glu Thr Lys Phe 1235 1240 1245 Leu Thr Glu Asn Leu Leu Leu Tyr Ile Asp Ile Asn Gly Asn Leu 1250 1255 1260 His Pro Asp Ser Ala Thr Leu Val Ser Asp Ile Asp Ile Thr Phe 1265 1270 1275 Leu Lys Lys Asp Ala Pro Tyr Ile Val Gly Asp Val Val Gln Glu 1280 1285 1290 Gly Val Leu Thr Ala Val Val Ile Pro Thr Lys Lys Ala Gly Gly 1295 1300 1305 Thr Thr Glu Met Leu Ala Lys Ala Leu Arg Lys Val Pro Thr Asp 1310 1315 1320 Asn Tyr Ile Thr Thr Tyr Pro Gly Gln Gly Leu Asn Gly Tyr Thr 1325 1330 1335 Val Glu Glu Ala Lys Thr Val Leu Lys Lys Cys Lys Ser Ala Phe 1340 1345 1350 Tyr Ile Leu Pro Ser Ile Ile Ser Asn Glu Lys Gln Glu Ile Leu 1355 1360 1365 Gly Thr Val Ser Trp Asn Leu Arg Glu Met Leu Ala His Ala Glu 1370 1375 1380 Glu Thr Arg Lys Leu Met Pro Val Cys Val Glu Thr Lys Ala Ile 1385 1390 1395 Val Ser Thr Ile Gln Arg Lys Tyr Lys Gly Ile Lys Ile Gln Glu 1400 1405 1410 Gly Val Val Asp Tyr Gly Ala Arg Phe Tyr Phe Tyr Thr Ser Lys 1415 1420 1425 Thr Thr Val Ala Ser Leu Ile Asn Thr Leu Asn Asp Leu Asn Glu 1430 1435 1440 Thr Leu Val Thr Met Pro Leu Gly Tyr Val Thr His Gly Leu Asn 1445 1450 1455 Leu Glu Glu Ala Ala Arg Tyr Met Arg Ser Leu Lys Val Pro Ala 1460 1465 1470 Thr Val Ser Val Ser Ser Pro Asp Ala Val Thr Ala Tyr Asn Gly 1475 1480 1485 Tyr Leu Thr Ser Ser Ser Lys Thr Pro Glu Glu His Phe Ile Glu 1490 1495 1500 Thr Ile Ser Leu Ala Gly Ser Tyr Lys Asp Trp Ser Tyr Ser Gly 1505 1510 1515 Gln Ser Thr Gln Leu Gly Ile Glu Phe Leu Lys Arg Gly Asp Lys 1520 1525 1530 Ser Val Tyr Tyr Thr Ser Asn Pro Thr Thr Phe His Leu Asp Gly 1535 1540 1545 Glu Val Ile Thr Phe Asp Asn Leu Lys Thr Leu Leu Ser Leu Arg 1550 1555 1560 Glu Val Arg Thr Ile Lys Val Phe Thr Thr Val Asp Asn Ile Asn 1565 1570 1575 Leu His Thr Gln Val Val Asp Met Ser Met Thr Tyr Gly Gln Gln 1580 1585 1590 Phe Gly Pro Thr Tyr Leu Asp Gly Ala Asp Val Thr Lys Ile Lys 1595 1600 1605 Pro His Asn Ser His Glu Gly Lys Thr Phe Tyr Val Leu Pro Asn 1610 1615 1620 Asp Asp Thr Leu Arg Val Glu Ala Phe Glu Tyr Tyr His Thr Thr 1625 1630 1635 Asp Pro Ser Phe Leu Gly Arg Tyr Met Ser Ala Leu Asn His Thr 1640 1645 1650 Lys Lys Trp Lys Tyr Pro Gln Val Asn Gly Leu Thr Ser Ile Lys 1655 1660 1665 Trp Ala Asp Asn Asn Cys Tyr Leu Ala Thr Ala Leu Leu Thr Leu 1670 1675 1680 Gln Gln Ile Glu Leu Lys Phe Asn Pro Pro Ala Leu Gln Asp Ala 1685 1690 1695 Tyr Tyr Arg Ala Arg Ala Gly Glu Ala Ala Asn Phe Cys Ala Leu 1700 1705 1710 Ile Leu Ala Tyr Cys Asn Lys Thr Val Gly Glu Leu Gly Asp Val 1715 1720 1725 Arg Glu Thr Met Ser Tyr Leu Phe Gln His Ala Asn Leu Asp Ser 1730 1735 1740 Cys Lys Arg Val Leu Asn Val Val Cys Lys Thr Cys Gly Gln Gln 1745 1750 1755 Gln Thr Thr Leu Lys Gly Val Glu Ala Val Met Tyr Met Gly Thr 1760 1765 1770 Leu Ser Tyr Glu Gln Phe Lys Lys Gly Val Gln Ile Pro Cys Thr 1775 1780 1785 Cys Gly Lys Gln Ala Thr Lys Tyr Leu Val Gln Gln Glu Ser Pro 1790 1795 1800 Phe Val Met Met Ser Ala Pro Pro Ala Gln Tyr Glu Leu Lys His 1805 1810 1815 Gly Thr Phe Thr Cys Ala Ser Glu Tyr Thr Gly Asn Tyr Gln Cys 1820 1825 1830 Gly His Tyr Lys His Ile Thr Ser Lys Glu Thr Leu Tyr Cys Ile 1835 1840 1845 Asp Gly Ala Leu Leu Thr Lys Ser Ser Glu Tyr Lys Gly Pro Ile 1850 1855 1860 Thr Asp Val Phe Tyr Lys Glu Asn Ser Tyr Thr Thr Thr Ile Lys 1865 1870 1875 Pro Val Thr Tyr Lys Leu Asp Gly Val Val Cys Thr Glu Ile Asp 1880 1885 1890 Pro Lys Leu Asp Asn Tyr Tyr Lys Lys Asp Asn Ser Tyr Phe Thr 1895 1900 1905 Glu Gln Pro Ile Asp Leu Val Pro Asn Gln Pro Tyr Pro Asn Ala 1910 1915 1920 Ser Phe Asp Asn Phe Lys Phe Val Cys Asp Asn Ile Lys Phe Ala 1925 1930 1935 Asp Asp Leu Asn Gln Leu Thr Gly Tyr Lys Lys Pro Ala Ser Arg 1940 1945 1950 Glu Leu Lys Val Thr Phe Phe Pro Asp Leu Asn Gly Asp Val Val 1955 1960 1965 Ala Ile Asp Tyr Lys His Tyr Thr Pro Ser Phe Lys Lys Gly Ala 1970 1975 1980 Lys Leu Leu His Lys Pro Ile Val Trp His Val Asn Asn Ala Thr 1985 1990 1995 Asn Lys Ala Thr Tyr Lys Pro Asn Thr Trp Cys Ile Arg Cys Leu 2000 2005 2010 Trp Ser Thr Lys Pro Val Glu Thr Ser Asn Ser Phe Asp Val Leu 2015 2020 2025 Lys Ser Glu Asp Ala Gln Gly Met Asp Asn Leu Ala Cys Glu Asp 2030 2035 2040 Leu Lys Pro Val Ser Glu Glu Val Val Glu Asn Pro Thr Ile Gln 2045 2050 2055 Lys Asp Val Leu Glu Cys Asn Val Lys Thr Thr Glu Val Val Gly 2060 2065 2070 Asp Ile Ile Leu Lys Pro Ala Asn Asn Ser Leu Lys Ile Thr Glu 2075 2080 2085 Glu Val Gly His Thr Asp Leu Met Ala Ala Tyr Val Asp Asn Ser 2090 2095 2100 Ser Leu Thr Ile Lys Lys Pro Asn Glu Leu Ser Arg Val Leu Gly 2105 2110 2115 Leu Lys Thr Leu Ala Thr His Gly Leu Ala Ala Val Asn Ser Val 2120 2125 2130 Pro Trp Asp Thr Ile Ala Asn Tyr Ala Lys Pro Phe Leu Asn Lys 2135 2140 2145 Val Val Ser Thr Thr Thr Asn Ile Val Thr Arg Cys Leu Asn Arg 2150 2155 2160 Val Cys Thr Asn Tyr Met Pro Tyr Phe Phe Thr Leu Leu Leu Gln 2165 2170 2175 Leu Cys Thr Phe Thr Arg Ser Thr Asn Ser Arg Ile Lys Ala Ser 2180 2185 2190 Met Pro Thr Thr Ile Ala Lys Asn Thr Val Lys Ser Val Gly Lys 2195 2200 2205 Phe Cys Leu Glu Ala Ser Phe Asn Tyr Leu Lys Ser Pro Asn Phe 2210 2215 2220 Ser Lys Leu Ile Asn Ile Ile Ile Trp Phe Leu Leu Leu Ser Val 2225 2230 2235 Cys Leu Gly Ser Leu Ile Tyr Ser Thr Ala Ala Leu Gly Val Leu 2240 2245 2250 Met Ser Asn Leu Gly Met Pro Ser Tyr Cys Thr Gly Tyr Arg Glu 2255 2260 2265 Gly Tyr Leu Asn Ser Thr Asn Val Thr Ile Ala Thr Tyr Cys Thr 2270 2275 2280 Gly Ser Ile Pro Cys Ser Val Cys Leu Ser Gly Leu Asp Ser Leu 2285 2290 2295 Asp Thr Tyr Pro Ser Leu Glu Thr Ile Gln Ile Thr Ile Ser Ser 2300 2305 2310 Phe Lys Trp Asp Leu Thr Ala Phe Gly Leu Val Ala Glu Trp Phe 2315 2320 2325 Leu Ala Tyr Ile Leu Phe Thr Arg Phe Phe Tyr Val Leu Gly Leu 2330 2335 2340 Ala Ala Ile Met Gln Leu Phe Phe Ser Tyr Phe Ala Val His Phe 2345 2350 2355 Ile Ser Asn Ser Trp Leu Met Trp Leu Ile Ile Asn Leu Val Gln 2360 2365 2370 Met Ala Pro Ile Ser Ala Met Val Arg Met Tyr Ile Phe Phe Ala 2375 2380 2385 Ser Phe Tyr Tyr Val Trp Lys Ser Tyr Val His Val Val Asp Gly 2390 2395 2400 Cys Asn Ser Ser Thr Cys Met Met Cys Tyr Lys Arg Asn Arg Ala 2405 2410 2415 Thr Arg Val Glu Cys Thr Thr Ile Val Asn Gly Val Arg Arg Ser 2420 2425 2430 Phe Tyr Val Tyr Ala Asn Gly Gly Lys Gly Phe Cys Lys Leu His 2435 2440 2445 Asn Trp Asn Cys Val Asn Cys Asp Thr Phe Cys Ala Gly Ser Thr 2450 2455 2460 Phe Ile Ser Asp Glu Val Ala Arg Asp Leu Ser Leu Gln Phe Lys 2465 2470 2475 Arg Pro Ile Asn Pro Thr Asp Gln Ser Ser Tyr Ile Val Asp Ser 2480 2485 2490 Val Thr Val Lys Asn Gly Ser Ile His Leu Tyr Phe Asp Lys Ala 2495 2500 2505 Gly Gln Lys Thr Tyr Glu Arg His Ser Leu Ser His Phe Val Asn 2510 2515 2520 Leu Asp Asn Leu Arg Ala Asn Asn Thr Lys Gly Ser Leu Pro Ile 2525 2530 2535 Asn Val Ile Val Phe Asp Gly Lys Ser Lys Cys Glu Glu Ser Ser 2540 2545 2550 Ala Lys Ser Ala Ser Val Tyr Tyr Ser Gln Leu Met Cys Gln Pro 2555 2560 2565 Ile Leu Leu Leu Asp Gln Ala Leu Val Ser Asp Val Gly Asp Ser 2570 2575 2580 Ala Glu Val Ala Val Lys Met Phe Asp Ala Tyr Val Asn Thr Phe 2585 2590 2595 Ser Ser Thr Phe Asn Val Pro Met Glu Lys Leu Lys Thr Leu Val 2600 2605 2610 Ala Thr Ala Glu Ala Glu Leu Ala Lys Asn Val Ser Leu Asp Asn 2615 2620 2625 Val Leu Ser Thr Phe Ile Ser Ala Ala Arg Gln Gly Phe Val Asp 2630 2635 2640 Ser Asp Val Glu Thr Lys Asp Val Val Glu Cys Leu Lys Leu Ser 2645 2650 2655 His Gln Ser Asp Ile Glu Val Thr Gly Asp Ser Cys Asn Asn Tyr 2660 2665 2670 Met Leu Thr Tyr Asn Lys Val Glu Asn Met Thr Pro Arg Asp Leu 2675 2680 2685 Gly Ala Cys Ile Asp Cys Ser Ala Arg His Ile Asn Ala Gln Val 2690 2695 2700 Ala Lys Ser His Asn Ile Ala Leu Ile Trp Asn Val Lys Asp Phe 2705 2710 2715 Met Ser Leu Ser Glu Gln Leu Arg Lys Gln Ile Arg Ser Ala Ala 2720 2725 2730 Lys Lys Asn Asn Leu Pro Phe Lys Leu Thr Cys Ala Thr Thr Arg 2735 2740 2745 Gln Val Val Asn Val Val Thr Thr Lys Ile Ala Leu Lys Gly Gly 2750 2755 2760 Lys Ile Val Asn Asn Trp Leu Lys Gln Leu Ile Lys Val Thr Leu 2765 2770 2775 Val Phe Leu Phe Val Ala Ala Ile Phe Tyr Leu Ile Thr Pro Val 2780 2785 2790 His Val Met Ser Lys His Thr Asp Phe Ser Ser Glu Ile Ile Gly 2795 2800 2805 Tyr Lys Ala Ile Asp Gly Gly Val Thr Arg Asp Ile Ala Ser Thr 2810 2815 2820 Asp Thr Cys Phe Ala Asn Lys His Ala Asp Phe Asp Thr Trp Phe 2825 2830 2835 Ser Gln Arg Gly Gly Ser Tyr Thr Asn Asp Lys Ala Cys Pro Leu 2840 2845 2850 Ile Ala Ala Val Ile Thr Arg Glu Val Gly Phe Val Val Pro Gly 2855 2860 2865 Leu Pro Gly Thr Ile Leu Arg Thr Thr Asn Gly Asp Phe Leu His 2870 2875 2880 Phe Leu Pro Arg Val Phe Ser Ala Val Gly Asn Ile Cys Tyr Thr 2885 2890 2895 Pro Ser Lys Leu Ile Glu Tyr Thr Asp Phe Ala Thr Ser Ala Cys 2900 2905 2910 Val Leu Ala Ala Glu Cys Thr Ile Phe Lys Asp Ala Ser Gly Lys 2915 2920 2925 Pro Val Pro Tyr Cys Tyr Asp Thr Asn Val Leu Glu Gly Ser Val 2930 2935 2940 Ala Tyr Glu Ser Leu Arg Pro Asp Thr Arg Tyr Val Leu Met Asp 2945 2950 2955 Gly Ser Ile Ile Gln Phe Pro Asn Thr Tyr Leu Glu Gly Ser Val 2960 2965 2970 Arg Val Val Thr Thr Phe Asp Ser Glu Tyr Cys Arg His Gly Thr 2975 2980 2985 Cys Glu Arg Ser Glu Ala Gly Val Cys Val Ser Thr Ser Gly Arg 2990 2995 3000 Trp Val Leu Asn Asn Asp Tyr Tyr Arg Ser Leu Pro Gly Val Phe 3005 3010 3015 Cys Gly Val Asp Ala Val Asn Leu Leu Thr Asn Met Phe Thr Pro 3020 3025 3030 Leu Ile Gln Pro Ile Gly Ala Leu Asp Ile Ser Ala Ser Ile Val 3035 3040 3045 Ala Gly Gly Ile Val Ala Ile Val Val Thr Cys Leu Ala Tyr Tyr 3050 3055 3060 Phe Met Arg Phe Arg Arg Ala Phe Gly Glu Tyr Ser His Val Val 3065 3070 3075 Ala Phe Asn Thr Leu Leu Phe Leu Met Ser Phe Thr Val Leu Cys 3080 3085 3090 Leu Thr Pro Val Tyr Ser Phe Leu Pro Gly Val Tyr Ser Val Ile 3095 3100 3105 Tyr Leu Tyr Leu Thr Phe Tyr Leu Thr Asn Asp Val Ser Phe Leu 3110 3115 3120 Ala His Ile Gln Trp Met Val Met Phe Thr Pro Leu Val Pro Phe 3125 3130 3135 Trp Ile Thr Ile Ala Tyr Ile Ile Cys Ile Ser Thr Lys His Phe 3140 3145 3150 Tyr Trp Phe Phe Ser Asn Tyr Leu Lys Arg Arg Val Val Phe Asn 3155 3160 3165 Gly Val Ser Phe Ser Thr Phe Glu Glu Ala Ala Leu Cys Thr Phe 3170 3175 3180 Leu Leu Asn Lys Glu Met Tyr Leu Lys Leu Arg Ser Asp Val Leu 3185 3190 3195 Leu Pro Leu Thr Gln Tyr Asn Arg Tyr Leu Ala Leu Tyr Asn Lys 3200 3205 3210 Tyr Lys Tyr Phe Ser Gly Ala Met Asp Thr Thr Ser Tyr Arg Glu 3215 3220 3225 Ala Ala Cys Cys His Leu Ala Lys Ala Leu Asn Asp Phe Ser Asn 3230 3235 3240 Ser Gly Ser Asp Val Leu Tyr Gln Pro Pro Gln Thr Ser Ile Thr 3245 3250 3255 Ser Ala Val Leu Gln Ser Gly Phe Arg Lys Met Ala Phe Pro Ser 3260 3265 3270 Gly Lys Val Glu Gly Cys Met Val Gln Val Thr Cys Gly Thr Thr 3275 3280 3285 Thr Leu Asn Gly Leu Trp Leu Asp Asp Val Val Tyr Cys Pro Arg 3290 3295 3300 His Val Ile Cys Thr Ser Glu Asp Met Leu Asn Pro Asn Tyr Glu 3305 3310 3315 Asp Leu Leu Ile Arg Lys Ser Asn His Asn Phe Leu Val Gln Ala 3320 3325 3330 Gly Asn Val Gln Leu Arg Val Ile Gly His Ser Met Gln Asn Cys 3335 3340 3345 Val Leu Lys Leu Lys Val Asp Thr Ala Asn Pro Lys Thr Pro Lys 3350 3355 3360 Tyr Lys Phe Val Arg Ile Gln Pro Gly Gln Thr Phe Ser Val Leu 3365 3370 3375 Ala Cys Tyr Asn Gly Ser Pro Ser Gly Val Tyr Gln Cys Ala Met 3380 3385 3390 Arg Pro Asn Phe Thr Ile Lys Gly Ser Phe Leu Asn Gly Ser Cys 3395 3400 3405 Gly Ser Val Gly Phe Asn Ile Asp Tyr Asp Cys Val Ser Phe Cys 3410 3415 3420 Tyr Met His His Met Glu Leu Pro Thr Gly Val His Ala Gly Thr 3425 3430 3435 Asp Leu Glu Gly Asn Phe Tyr Gly Pro Phe Val Asp Arg Gln Thr 3440 3445 3450 Ala Gln Ala Ala Gly Thr Asp Thr Thr Ile Thr Val Asn Val Leu 3455 3460 3465 Ala Trp Leu Tyr Ala Ala Val Ile Asn Gly Asp Arg Trp Phe Leu 3470 3475 3480 Asn Arg Phe Thr Thr Thr Leu Asn Asp Phe Asn Leu Val Ala Met 3485 3490 3495 Lys Tyr Asn Tyr Glu Pro Leu Thr Gln Asp His Val Asp Ile Leu 3500 3505 3510 Gly Pro Leu Ser Ala Gln Thr Gly Ile Ala Val Leu Asp Met Cys 3515 3520 3525 Ala Ser Leu Lys Glu Leu Leu Gln Asn Gly Met Asn Gly Arg Thr 3530 3535 3540 Ile Leu Gly Ser Ala Leu Leu Glu Asp Glu Phe Thr Pro Phe Asp 3545 3550 3555 Val Val Arg Gln Cys Ser Gly Val Thr Phe Gln Ser Ala Val Lys 3560 3565 3570 Arg Thr Ile Lys Gly Thr His His Trp Leu Leu Leu Thr Ile Leu 3575 3580 3585 Thr Ser Leu Leu Val Leu Val Gln Ser Thr Gln Trp Ser Leu Phe 3590 3595 3600 Phe Phe Leu Tyr Glu Asn Ala Phe Leu Pro Phe Ala Met Gly Ile 3605 3610 3615 Ile Ala Met Ser Ala Phe Ala Met Met Phe Val Lys His Lys His 3620 3625 3630 Ala Phe Leu Cys Leu Phe Leu Leu Pro Ser Leu Ala Thr Val Ala 3635 3640 3645 Tyr Phe Asn Met Val Tyr Met Pro Ala Ser Trp Val Met Arg Ile 3650 3655 3660 Met Thr Trp Leu Asp Met Val Asp Thr Ser Leu Ser Gly Phe Lys 3665 3670 3675 Leu Lys Asp Cys Val Met Tyr Ala Ser Ala Val Val Leu Leu Ile 3680 3685 3690 Leu Met Thr Ala Arg Thr Val Tyr Asp Asp Gly Ala Arg Arg Val 3695 3700 3705 Trp Thr Leu Met Asn Val Leu Thr Leu Val Tyr Lys Val Tyr Tyr 3710 3715 3720 Gly Asn Ala Leu Asp Gln Ala Ile Ser Met Trp Ala Leu Ile Ile 3725 3730 3735 Ser Val Thr Ser Asn Tyr Ser Gly Val Val Thr Thr Val Met Phe 3740 3745 3750 Leu Ala Arg Gly Ile Val Phe Met Cys Val Glu Tyr Cys Pro Ile 3755 3760 3765 Phe Phe Ile Thr Gly Asn Thr Leu Gln Cys Ile Met Leu Val Tyr 3770 3775 3780 Cys Phe Leu Gly Tyr Phe Cys Thr Cys Tyr Phe Gly Leu Phe Cys 3785 3790 3795 Leu Leu Asn Arg Tyr Phe Arg Leu Thr Leu Gly Val Tyr Asp Tyr 3800 3805 3810 Leu Val Ser Thr Gln Glu Phe Arg Tyr Met Asn Ser Gln Gly Leu 3815 3820 3825 Leu Pro Pro Lys Asn Ser Ile Asp Ala Phe Lys Leu Asn Ile Lys 3830 3835 3840 Leu Leu Gly Val Gly Gly Lys Pro Cys Ile Lys Val Ala Thr Val 3845 3850 3855 Gln Ser Lys Met Ser Asp Val Lys Cys Thr Ser Val Val Leu Leu 3860 3865 3870 Ser Val Leu Gln Gln Leu Arg Val Glu Ser Ser Ser Lys Leu Trp 3875 3880 3885 Ala Gln Cys Val Gln Leu His Asn Asp Ile Leu Leu Ala Lys Asp 3890 3895 3900 Thr Thr Glu Ala Phe Glu Lys Met Val Ser Leu Leu Ser Val Leu 3905 3910 3915 Leu Ser Met Gln Gly Ala Val Asp Ile Asn Lys Leu Cys Glu Glu 3920 3925 3930 Met Leu Asp Asn Arg Ala Thr Leu Gln Ala Ile Ala Ser Glu Phe 3935 3940 3945 Ser Ser Leu Pro Ser Tyr Ala Ala Phe Ala Thr Ala Gln Glu Ala 3950 3955 3960 Tyr Glu Gln Ala Val Ala Asn Gly Asp Ser Glu Val Val Leu Lys 3965 3970 3975 Lys Leu Lys Lys Ser Leu Asn Val Ala Lys Ser Glu Phe Asp Arg 3980 3985 3990 Asp Ala Ala Met Gln Arg Lys Leu Glu Lys Met Ala Asp Gln Ala 3995 4000 4005 Met Thr Gln Met Tyr Lys Gln Ala Arg Ser Glu Asp Lys Arg Ala 4010 4015 4020 Lys Val Thr Ser Ala Met Gln Thr Met Leu Phe Thr Met Leu Arg 4025 4030 4035 Lys Leu Asp Asn Asp Ala Leu Asn Asn Ile Ile Asn Asn Ala Arg 4040 4045 4050 Asp Gly Cys Val Pro Leu Asn Ile Ile Pro Leu Thr Thr Ala Ala 4055 4060 4065 Lys Leu Met Val Val Ile Pro Asp Tyr Asn Thr Tyr Lys Asn Thr 4070 4075 4080 Cys Asp Gly Thr Thr Phe Thr Tyr Ala Ser Ala Leu Trp Glu Ile 4085 4090 4095 Gln Gln Val Val Asp Ala Asp Ser Lys Ile Val Gln Leu Ser Glu 4100 4105 4110 Ile Ser Met Asp Asn Ser Pro Asn Leu Ala Trp Pro Leu Ile Val 4115 4120 4125 Thr Ala Leu Arg Ala Asn Ser Ala Val Lys Leu Gln Asn Asn Glu 4130 4135 4140 Leu Ser Pro Val Ala Leu Arg Gln Met Ser Cys Ala Ala Gly Thr 4145 4150 4155 Thr Gln Thr Ala Cys Thr Asp Asp Asn Ala Leu Ala Tyr Tyr Asn 4160 4165 4170 Thr Thr Lys Gly Gly Arg Phe Val Leu Ala Leu Leu Ser Asp Leu 4175 4180 4185 Gln Asp Leu Lys Trp Ala Arg Phe Pro Lys Ser Asp Gly Thr Gly 4190 4195 4200 Thr Ile Tyr Thr Glu Leu Glu Pro Pro Cys Arg Phe Val Thr Asp 4205 4210 4215 Thr Pro Lys Gly Pro Lys Val Lys Tyr Leu Tyr Phe Ile Lys Gly 4220 4225 4230 Leu Asn Asn Leu Asn Arg Gly Met Val Leu Gly Ser Leu Ala Ala 4235 4240 4245 Thr Val Arg Leu Gln Ala Gly Asn Ala Thr Glu Val Pro Ala Asn 4250 4255 4260 Ser Thr Val Leu Ser Phe Cys Ala Phe Ala Val Asp Ala Ala Lys 4265 4270 4275 Ala Tyr Lys Asp Tyr Leu Ala Ser Gly Gly Gln Pro Ile Thr Asn 4280 4285 4290 Cys Val Lys Met Leu Cys Thr His Thr Gly Thr Gly Gln Ala Ile 4295 4300 4305 Thr Val Thr Pro Glu Ala Asn Met Asp Gln Glu Ser Phe Gly Gly 4310 4315 4320 Ala Ser Cys Cys Leu Tyr Cys Arg Cys His Ile Asp His Pro Asn 4325 4330 4335 Pro Lys Gly Phe Cys Asp Leu Lys Gly Lys Tyr Val Gln Ile Pro 4340 4345 4350 Thr Thr Cys Ala Asn Asp Pro Val Gly Phe Thr Leu Lys Asn Thr 4355 4360 4365 Val Cys Thr Val Cys Gly Met Trp Lys Gly Tyr Gly Cys Ser Cys 4370 4375 4380 Asp Gln Leu Arg Glu Pro Met Leu Gln Ser Ala Asp Ala Gln Ser 4385 4390 4395 Phe Leu Asn Gly Phe Ala Val 4400 4405 <210> 427 <211> 1273 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 427 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile 885 890 895 Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn 1145 1150 1155 His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn 1160 1165 1170 Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu 1175 1180 1185 Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu 1190 1195 1200 Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu 1205 1210 1215 Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met 1220 1225 1230 Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys 1235 1240 1245 Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro 1250 1255 1260 Val Leu Lys Gly Val Lys Leu His Tyr Thr 1265 1270 <210> 428 <211> 275 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 428 Met Asp Leu Phe Met Arg Ile Phe Thr Ile Gly Thr Val Thr Leu Lys 1 5 10 15 Gln Gly Glu Ile Lys Asp Ala Thr Pro Ser Asp Phe Val Arg Ala Thr 20 25 30 Ala Thr Ile Pro Ile Gln Ala Ser Leu Pro Phe Gly Trp Leu Ile Val 35 40 45 Gly Val Ala Leu Leu Ala Val Phe Gln Ser Ala Ser Lys Ile Ile Thr 50 55 60 Leu Lys Lys Arg Trp Gln Leu Ala Leu Ser Lys Gly Val His Phe Val 65 70 75 80 Cys Asn Leu Leu Leu Leu Phe Val Thr Val Tyr Ser His Leu Leu Leu 85 90 95 Val Ala Ala Gly Leu Glu Ala Pro Phe Leu Tyr Leu Tyr Ala Leu Val 100 105 110 Tyr Phe Leu Gln Ser Ile Asn Phe Val Arg Ile Ile Met Arg Leu Trp 115 120 125 Leu Cys Trp Lys Cys Arg Ser Lys Asn Pro Leu Leu Tyr Asp Ala Asn 130 135 140 Tyr Phe Leu Cys Trp His Thr Asn Cys Tyr Asp Tyr Cys Ile Pro Tyr 145 150 155 160 Asn Ser Val Thr Ser Ser Ile Val Ile Thr Ser Gly Asp Gly Thr Thr 165 170 175 Ser Pro Ile Ser Glu His Asp Tyr Gln Ile Gly Gly Tyr Thr Glu Lys 180 185 190 Trp Glu Ser Gly Val Lys Asp Cys Val Val Leu His Ser Tyr Phe Thr 195 200 205 Ser Asp Tyr Tyr Gln Leu Tyr Ser Thr Gln Leu Ser Thr Asp Thr Gly 210 215 220 Val Glu His Val Thr Phe Phe Ile Tyr Asn Lys Ile Val Asp Glu Pro 225 230 235 240 Glu Glu His Val Gln Ile His Thr Ile Asp Gly Ser Ser Gly Val Val 245 250 255 Asn Pro Val Met Glu Pro Ile Tyr Asp Glu Pro Thr Thr Thr Thr Ser 260 265 270 Val Pro Leu 275 <210> 429 <211> 669 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 429 atggcagatt ccaacggtac tattaccgtt gaagagctta aaaagctcct tgaacaatgg 60 aacctagtaa taggtttcct attccttaca tggatttgtc ttctacaatt tgcctatgcc 120 aacaggaata ggtttttgta tataattaag ttaattttcc tctggctgtt atggccagta 180 actttagctt gttttgtgct tgctgctgtt tacagaataa attggatcac cggtggaatt 240 gctatcgcaa tggcttgtct tgtaggcttg atgtggctca gctacttcat tgcttctttc 300 agactgtttg cgcgtacgcg ttccatgtgg tcattcaatc cagaaactaa cattcttctc 360 aacgtgccac tccatggcac tattctgacc agaccgcttc tagaaagtga actcgtaatc 420 ggagctgtga tccttcgtgg acatcttcgt attgctggac accatctagg acgctgtgac 480 atcaaggacc tgcctaaaga aatcactgtt gctacatcac gaacgctttc ttattacaaa 540 ttgggagctt cgcagcgtgt agcaggtgac tcaggttttg ctgcatacag tcgctacagg 600 attggcaact ataaattaaa cacagaccat tccagtagca gtgacaatat tgctttgctt 660 gtacagtaa 669 <210> 430 <211> 222 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 430 Met Ala Asp Ser Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Lys Leu 1 5 10 15 Leu Glu Gln Trp Asn Leu Val Ile Gly Phe Leu Phe Leu Thr Trp Ile 20 25 30 Cys Leu Leu Gln Phe Ala Tyr Ala Asn Arg Asn Arg Phe Leu Tyr Ile 35 40 45 Ile Lys Leu Ile Phe Leu Trp Leu Leu Trp Pro Val Thr Leu Ala Cys 50 55 60 Phe Val Leu Ala Ala Val Tyr Arg Ile Asn Trp Ile Thr Gly Gly Ile 65 70 75 80 Ala Ile Ala Met Ala Cys Leu Val Gly Leu Met Trp Leu Ser Tyr Phe 85 90 95 Ile Ala Ser Phe Arg Leu Phe Ala Arg Thr Arg Ser Met Trp Ser Phe 100 105 110 Asn Pro Glu Thr Asn Ile Leu Leu Asn Val Pro Leu His Gly Thr Ile 115 120 125 Leu Thr Arg Pro Leu Leu Glu Ser Glu Leu Val Ile Gly Ala Val Ile 130 135 140 Leu Arg Gly His Leu Arg Ile Ala Gly His His Leu Gly Arg Cys Asp 145 150 155 160 Ile Lys Asp Leu Pro Lys Glu Ile Thr Val Ala Thr Ser Arg Thr Leu 165 170 175 Ser Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Ala Gly Asp Ser Gly 180 185 190 Phe Ala Ala Tyr Ser Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr 195 200 205 Asp His Ser Ser Ser Ser Asp Asn Ile Ala Leu Leu Val Gln 210 215 220 <210> 431 <211> 61 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 431 Met Phe His Leu Val Asp Phe Gln Val Thr Ile Ala Glu Ile Leu Leu 1 5 10 15 Ile Ile Met Arg Thr Phe Lys Val Ser Ile Trp Asn Leu Asp Tyr Ile 20 25 30 Thr Asn Leu Ile Ile Lys Asn Leu Ser Lys Ser Leu Thr Glu Asn Lys 35 40 45 Tyr Ser Gln Leu Asp Glu Glu Gln Pro Met Glu Ile Asp 50 55 60 <210> 432 <211> 121 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 432 Met Lys Ile Ile Leu Phe Leu Ala Leu Ile Thr Leu Ala Thr Cys Glu 1 5 10 15 Leu Tyr His Tyr Gln Glu Cys Val Arg Gly Thr Thr Val Leu Leu Lys 20 25 30 Glu Pro Cys Ser Ser Gly Thr Tyr Glu Gly Asn Ser Pro Phe His Pro 35 40 45 Leu Ala Asp Asn Lys Phe Ala Leu Thr Cys Phe Ser Thr Gln Phe Ala 50 55 60 Phe Ala Cys Pro Asp Gly Val Lys His Val Tyr Gln Leu Arg Ala Arg 65 70 75 80 Ser Val Ser Pro Lys Leu Phe Ile Arg Gln Glu Glu Val Gln Glu Leu 85 90 95 Tyr Ser Pro Ile Phe Leu Ile Val Ala Ala Ile Val Phe Ile Thr Leu 100 105 110 Cys Phe Thr Leu Lys Arg Lys Thr Glu 115 120 <210> 433 <211> 43 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 433 Met Ile Glu Leu Ser Leu Ile Asp Phe Tyr Leu Cys Phe Leu Ala Phe 1 5 10 15 Leu Leu Phe Leu Val Leu Ile Met Leu Ile Ile Phe Trp Phe Ser Leu 20 25 30 Glu Leu Gln Asp His Asn Glu Thr Cys His Ala 35 40 <210> 434 <211> 121 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 434 Met Lys Phe Leu Val Phe Leu Gly Ile Ile Thr Thr Val Ala Ala Phe 1 5 10 15 His Gln Glu Cys Ser Leu Gln Ser Cys Thr Gln His Gln Pro Tyr Val 20 25 30 Val Asp Asp Pro Cys Pro Ile His Phe Tyr Ser Lys Trp Tyr Ile Arg 35 40 45 Val Gly Ala Arg Lys Ser Ala Pro Leu Ile Glu Leu Cys Val Asp Glu 50 55 60 Ala Gly Ser Lys Ser Pro Ile Gln Tyr Ile Asp Ile Gly Asn Tyr Thr 65 70 75 80 Val Ser Cys Leu Pro Phe Thr Ile Asn Cys Gln Glu Pro Lys Leu Gly 85 90 95 Ser Leu Val Val Arg Cys Ser Phe Tyr Glu Asp Phe Leu Glu Tyr His 100 105 110 Asp Val Arg Val Val Leu Asp Phe Ile 115 120 <210> 435 <211> 419 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 435 Met Ser Asp Asn Gly Pro Gln Asn Gln Arg Asn Ala Pro Arg Ile Thr 1 5 10 15 Phe Gly Gly Pro Ser Asp Ser Thr Gly Ser Asn Gln Asn Gly Glu Arg 20 25 30 Ser Gly Ala Arg Ser Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn Asn 35 40 45 Thr Ala Ser Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Asp Leu 50 55 60 Lys Phe Pro Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Ser Pro 65 70 75 80 Asp Asp Gln Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Ile Arg Gly 85 90 95 Gly Asp Gly Lys Met Lys Asp Leu Ser Pro Arg Trp Tyr Phe Tyr Tyr 100 105 110 Leu Gly Thr Gly Pro Glu Ala Gly Leu Pro Tyr Gly Ala Asn Lys Asp 115 120 125 Gly Ile Ile Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys Asp 130 135 140 His Ile Gly Thr Arg Asn Pro Ala Asn Asn Ala Ala Ile Val Leu Gln 145 150 155 160 Leu Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly Ser 165 170 175 Arg Gly Gly Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg Asn 180 185 190 Ser Ser Arg Asn Ser Thr Pro Gly Ser Ser Lys Arg Thr Ser Pro Ala 195 200 205 Arg Met Ala Gly Asn Gly Gly Asp Ala Ala Leu Ala Leu Leu Leu Leu 210 215 220 Asp Arg Leu Asn Gln Leu Glu Ser Lys Met Ser Gly Lys Gly Gln Gln 225 230 235 240 Gln Gln Gly Gln Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser Lys 245 250 255 Lys Pro Arg Gln Lys Arg Thr Ala Thr Lys Ala Tyr Asn Val Thr Gln 260 265 270 Ala Phe Gly Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly Asp 275 280 285 Gln Glu Leu Thr Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln Ile 290 295 300 Ala Gln Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg Ile 305 310 315 320 Gly Met Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr Thr Gly Ala 325 330 335 Ile Lys Leu Asp Asp Lys Asp Pro Asn Phe Lys Asp Gln Val Ile Leu 340 345 350 Leu Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu Pro 355 360 365 Lys Lys Asp Lys Lys Lys Lys Ala Asp Glu Thr Gln Ala Leu Pro Gln 370 375 380 Arg Gln Lys Lys Gln Gln Thr Val Thr Leu Leu Pro Ala Ala Asp Leu 385 390 395 400 Asp Asp Phe Ser Lys Gln Leu Gln Gln Ser Met Ser Ser Ala Asp Ser 405 410 415 Thr Gln Ala <210> 436 <211> 38 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 436 Met Gly Tyr Ile Asn Val Phe Ala Phe Pro Phe Thr Ile Tyr Ser Leu 1 5 10 15 Leu Leu Cys Arg Met Asn Ser Arg Asn Tyr Ile Ala Gln Val Asp Val 20 25 30 Val Asn Phe Asn Leu Thr 35 <210> 437 <211> 4405 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 437 Met Glu Ser Leu Val Pro Gly Phe Asn Glu Lys Thr His Val Gln Leu 1 5 10 15 Ser Leu Pro Val Leu Gln Val Arg Asp Val Leu Val Arg Gly Phe Gly 20 25 30 Asp Ser Val Glu Glu Val Leu Ser Glu Ala Arg Gln His Leu Lys Asp 35 40 45 Gly Thr Cys Gly Leu Val Glu Val Glu Lys Gly Val Leu Pro Gln Leu 50 55 60 Glu Gln Pro Tyr Val Phe Ile Lys Arg Ser Asp Ala Arg Thr Ala Pro 65 70 75 80 His Gly His Val Met Val Glu Leu Val Ala Glu Leu Glu Gly Ile Gln 85 90 95 Tyr Gly Arg Ser Gly Glu Thr Leu Gly Val Leu Val Pro His Val Gly 100 105 110 Glu Ile Pro Val Ala Tyr Arg Lys Val Leu Leu Arg Lys Asn Gly Asn 115 120 125 Lys Gly Ala Gly Gly His Ser Tyr Gly Ala Asp Leu Lys Ser Phe Asp 130 135 140 Leu Gly Asp Glu Leu Gly Thr Asp Pro Tyr Glu Asp Phe Gln Glu Asn 145 150 155 160 Trp Asn Thr Lys His Ser Ser Gly Val Thr Arg Glu Leu Met Arg Glu 165 170 175 Leu Asn Gly Gly Ala Tyr Thr Arg Tyr Val Asp Asn Asn Phe Cys Gly 180 185 190 Pro Asp Gly Tyr Pro Leu Glu Cys Ile Lys Asp Leu Leu Ala Arg Ala 195 200 205 Gly Lys Ala Ser Cys Thr Leu Ser Glu Gln Leu Asp Phe Ile Asp Thr 210 215 220 Lys Arg Gly Val Tyr Cys Cys Arg Glu His Glu His Glu Ile Ala Trp 225 230 235 240 Tyr Thr Glu Arg Ser Glu Lys Ser Tyr Glu Leu Gln Thr Pro Phe Glu 245 250 255 Ile Lys Leu Ala Lys Lys Phe Asp Ile Phe Asn Gly Glu Cys Pro Asn 260 265 270 Phe Val Phe Pro Leu Asn Ser Ile Ile Lys Thr Ile Gln Pro Arg Val 275 280 285 Glu Lys Lys Lys Leu Asp Gly Phe Met Gly Arg Ile Arg Ser Val Tyr 290 295 300 Pro Val Ala Ser Pro Asn Glu Cys Asn Gln Met Cys Leu Ser Thr Leu 305 310 315 320 Met Lys Cys Asp His Cys Gly Glu Thr Ser Trp Gln Thr Gly Asp Phe 325 330 335 Val Lys Ala Thr Cys Glu Phe Cys Gly Thr Glu Asn Leu Thr Lys Glu 340 345 350 Gly Ala Thr Thr Cys Gly Tyr Leu Thr Gln Asn Ala Val Val Lys Ile 355 360 365 Tyr Cys Pro Ala Cys His Asn Ser Glu Val Gly Pro Glu His Ser Leu 370 375 380 Ala Glu Tyr His Asn Glu Ser Gly Leu Lys Thr Ile Leu Arg Lys Gly 385 390 395 400 Gly Arg Thr Ile Ala Phe Gly Gly Cys Val Phe Ser Tyr Val Gly Cys 405 410 415 His Asn Lys Cys Ala Tyr Trp Val Pro Arg Ala Ser Ala Asn Ile Gly 420 425 430 Cys Asn His Thr Gly Val Val Gly Glu Gly Ser Glu Gly Leu Asn Asp 435 440 445 Asn Leu Leu Glu Ile Leu Gln Lys Glu Lys Val Asn Ile Asn Ile Val 450 455 460 Gly Asp Phe Lys Leu Asn Glu Glu Ile Ala Ile Ile Leu Ala Ser Phe 465 470 475 480 Ser Ala Ser Thr Ser Ala Phe Val Glu Thr Val Lys Gly Leu Asp Tyr 485 490 495 Lys Ala Phe Lys Gln Ile Val Glu Ser Cys Gly Asn Phe Lys Val Thr 500 505 510 Lys Gly Lys Ala Lys Lys Gly Ala Trp Asn Ile Gly Glu Gln Lys Ser 515 520 525 Ile Leu Ser Pro Leu Tyr Ala Phe Ala Ser Glu Ala Ala Arg Val Val 530 535 540 Arg Ser Ile Phe Ser Arg Thr Leu Glu Thr Ala Gln Asn Ser Val Arg 545 550 555 560 Val Leu Gln Lys Ala Ala Ile Thr Ile Leu Asp Gly Ile Ser Gln Tyr 565 570 575 Ser Leu Arg Leu Ile Asp Ala Met Met Phe Thr Ser Asp Leu Ala Thr 580 585 590 Asn Asn Leu Val Val Met Ala Tyr Ile Thr Gly Gly Val Val Gln Leu 595 600 605 Thr Ser Gln Trp Leu Thr Asn Ile Phe Gly Thr Val Tyr Glu Lys Leu 610 615 620 Lys Pro Val Leu Asp Trp Leu Glu Glu Lys Phe Lys Glu Gly Val Glu 625 630 635 640 Phe Leu Arg Asp Gly Trp Glu Ile Val Lys Phe Ile Ser Thr Cys Ala 645 650 655 Cys Glu Ile Val Gly Gly Gln Ile Val Thr Cys Ala Lys Glu Ile Lys 660 665 670 Glu Ser Val Gln Thr Phe Phe Lys Leu Val Asn Lys Phe Leu Ala Leu 675 680 685 Cys Ala Asp Ser Ile Ile Ile Gly Gly Ala Lys Leu Lys Ala Leu Asn 690 695 700 Leu Gly Glu Thr Phe Val Thr His Ser Lys Gly Leu Tyr Arg Lys Cys 705 710 715 720 Val Lys Ser Arg Glu Glu Thr Gly Leu Leu Met Pro Leu Lys Ala Pro 725 730 735 Lys Glu Ile Ile Phe Leu Glu Gly Glu Thr Leu Pro Thr Glu Val Leu 740 745 750 Thr Glu Glu Val Val Leu Lys Thr Gly Asp Leu Gln Pro Leu Glu Gln 755 760 765 Pro Thr Ser Glu Ala Val Glu Ala Pro Leu Val Gly Thr Pro Val Cys 770 775 780 Ile Asn Gly Leu Met Leu Leu Glu Ile Lys Asp Thr Glu Lys Tyr Cys 785 790 795 800 Ala Leu Ala Pro Asn Met Met Val Thr Asn Asn Thr Phe Thr Leu Lys 805 810 815 Gly Gly Ala Pro Thr Lys Val Thr Phe Gly Asp Asp Thr Val Ile Glu 820 825 830 Val Gln Gly Tyr Lys Ser Val Asn Ile Thr Phe Glu Leu Asp Glu Arg 835 840 845 Ile Asp Lys Val Leu Asn Glu Lys Cys Ser Ala Tyr Thr Val Glu Leu 850 855 860 Gly Thr Glu Val Asn Glu Phe Ala Cys Val Val Ala Asp Ala Val Ile 865 870 875 880 Lys Thr Leu Gln Pro Val Ser Glu Leu Leu Thr Pro Leu Gly Ile Asp 885 890 895 Leu Asp Glu Trp Ser Met Ala Thr Tyr Tyr Leu Phe Asp Glu Ser Gly 900 905 910 Glu Phe Lys Leu Ala Ser His Met Tyr Cys Ser Phe Tyr Pro Pro Asp 915 920 925 Glu Asp Glu Glu Glu Gly Asp Cys Glu Glu Glu Glu Phe Glu Pro Ser 930 935 940 Thr Gln Tyr Glu Tyr Gly Thr Glu Asp Asp Tyr Gln Gly Lys Pro Leu 945 950 955 960 Glu Phe Gly Ala Thr Ser Ala Ala Leu Gln Pro Glu Glu Glu Gln Glu 965 970 975 Glu Asp Trp Leu Asp Asp Asp Ser Gln Gln Thr Val Gly Gln Gln Asp 980 985 990 Gly Ser Glu Asp Asn Gln Thr Thr Thr Ile Gln Thr Ile Val Glu Val 995 1000 1005 Gln Pro Gln Leu Glu Met Glu Leu Thr Pro Val Val Gln Thr Ile 1010 1015 1020 Glu Val Asn Ser Phe Ser Gly Tyr Leu Lys Leu Thr Asp Asn Val 1025 1030 1035 Tyr Ile Lys Asn Ala Asp Ile Val Glu Glu Ala Lys Lys Val Lys 1040 1045 1050 Pro Thr Val Val Val Asn Ala Ala Asn Val Tyr Leu Lys His Gly 1055 1060 1065 Gly Gly Val Ala Gly Ala Leu Asn Lys Ala Thr Asn Asn Ala Met 1070 1075 1080 Gln Val Glu Ser Asp Asp Tyr Ile Ala Thr Asn Gly Pro Leu Lys 1085 1090 1095 Val Gly Gly Ser Cys Val Leu Ser Gly His Asn Leu Ala Lys His 1100 1105 1110 Cys Leu His Val Val Gly Pro Asn Val Asn Lys Gly Glu Asp Ile 1115 1120 1125 Gln Leu Leu Lys Ser Ala Tyr Glu Asn Phe Asn Gln His Glu Val 1130 1135 1140 Leu Leu Ala Pro Leu Leu Ser Ala Gly Ile Phe Gly Ala Asp Pro 1145 1150 1155 Ile His Ser Leu Arg Val Cys Val Asp Thr Val Arg Thr Asn Val 1160 1165 1170 Tyr Leu Ala Val Phe Asp Lys Asn Leu Tyr Asp Lys Leu Val Ser 1175 1180 1185 Ser Phe Leu Glu Met Lys Ser Glu Lys Gln Val Glu Gln Lys Ile 1190 1195 1200 Ala Glu Ile Pro Lys Glu Glu Val Lys Pro Phe Ile Thr Glu Ser 1205 1210 1215 Lys Pro Ser Val Glu Gln Arg Lys Gln Asp Asp Lys Lys Ile Lys 1220 1225 1230 Ala Cys Val Glu Glu Val Thr Thr Thr Leu Glu Glu Thr Lys Phe 1235 1240 1245 Leu Thr Glu Asn Leu Leu Leu Tyr Ile Asp Ile Asn Gly Asn Leu 1250 1255 1260 His Pro Asp Ser Ala Thr Leu Val Ser Asp Ile Asp Ile Thr Phe 1265 1270 1275 Leu Lys Lys Asp Ala Pro Tyr Ile Val Gly Asp Val Val Gln Glu 1280 1285 1290 Gly Val Leu Thr Ala Val Val Ile Pro Thr Lys Lys Ala Gly Gly 1295 1300 1305 Thr Thr Glu Met Leu Ala Lys Ala Leu Arg Lys Val Pro Thr Asp 1310 1315 1320 Asn Tyr Ile Thr Thr Tyr Pro Gly Gln Gly Leu Asn Gly Tyr Thr 1325 1330 1335 Val Glu Glu Ala Lys Thr Val Leu Lys Lys Cys Lys Ser Ala Phe 1340 1345 1350 Tyr Ile Leu Pro Ser Ile Ile Ser Asn Glu Lys Gln Glu Ile Leu 1355 1360 1365 Gly Thr Val Ser Trp Asn Leu Arg Glu Met Leu Ala His Ala Glu 1370 1375 1380 Glu Thr Arg Lys Leu Met Pro Val Cys Val Glu Thr Lys Ala Ile 1385 1390 1395 Val Ser Thr Ile Gln Arg Lys Tyr Lys Gly Ile Lys Ile Gln Glu 1400 1405 1410 Gly Val Val Asp Tyr Gly Ala Arg Phe Tyr Phe Tyr Thr Ser Lys 1415 1420 1425 Thr Thr Val Ala Ser Leu Ile Asn Thr Leu Asn Asp Leu Asn Glu 1430 1435 1440 Thr Leu Val Thr Met Pro Leu Gly Tyr Val Thr His Gly Leu Asn 1445 1450 1455 Leu Glu Glu Ala Ala Arg Tyr Met Arg Ser Leu Lys Val Pro Ala 1460 1465 1470 Thr Val Ser Val Ser Ser Pro Asp Ala Val Thr Ala Tyr Asn Gly 1475 1480 1485 Tyr Leu Thr Ser Ser Ser Lys Thr Pro Glu Glu His Phe Ile Glu 1490 1495 1500 Thr Ile Ser Leu Ala Gly Ser Tyr Lys Asp Trp Ser Tyr Ser Gly 1505 1510 1515 Gln Ser Thr Gln Leu Gly Ile Glu Phe Leu Lys Arg Gly Asp Lys 1520 1525 1530 Ser Val Tyr Tyr Thr Ser Asn Pro Thr Thr Phe His Leu Asp Gly 1535 1540 1545 Glu Val Ile Thr Phe Asp Asn Leu Lys Thr Leu Leu Ser Leu Arg 1550 1555 1560 Glu Val Arg Thr Ile Lys Val Phe Thr Thr Val Asp Asn Ile Asn 1565 1570 1575 Leu His Thr Gln Val Val Asp Met Ser Met Thr Tyr Gly Gln Gln 1580 1585 1590 Phe Gly Pro Thr Tyr Leu Asp Gly Ala Asp Val Thr Lys Ile Lys 1595 1600 1605 Pro His Asn Ser His Glu Gly Lys Thr Phe Tyr Val Leu Pro Asn 1610 1615 1620 Asp Asp Thr Leu Arg Val Glu Ala Phe Glu Tyr Tyr His Thr Thr 1625 1630 1635 Asp Pro Ser Phe Leu Gly Arg Tyr Met Ser Ala Leu Asn His Thr 1640 1645 1650 Lys Lys Trp Lys Tyr Pro Gln Val Asn Gly Leu Thr Ser Ile Lys 1655 1660 1665 Trp Ala Asp Asn Asn Cys Tyr Leu Ala Thr Ala Leu Leu Thr Leu 1670 1675 1680 Gln Gln Ile Glu Leu Lys Phe Asn Pro Pro Ala Leu Gln Asp Ala 1685 1690 1695 Tyr Tyr Arg Ala Arg Ala Gly Glu Ala Ala Asn Phe Cys Ala Leu 1700 1705 1710 Ile Leu Ala Tyr Cys Asn Lys Thr Val Gly Glu Leu Gly Asp Val 1715 1720 1725 Arg Glu Thr Met Ser Tyr Leu Phe Gln His Ala Asn Leu Asp Ser 1730 1735 1740 Cys Lys Arg Val Leu Asn Val Val Cys Lys Thr Cys Gly Gln Gln 1745 1750 1755 Gln Thr Thr Leu Lys Gly Val Glu Ala Val Met Tyr Met Gly Thr 1760 1765 1770 Leu Ser Tyr Glu Gln Phe Lys Lys Gly Val Gln Ile Pro Cys Thr 1775 1780 1785 Cys Gly Lys Gln Ala Thr Lys Tyr Leu Val Gln Gln Glu Ser Pro 1790 1795 1800 Phe Val Met Met Ser Ala Pro Pro Ala Gln Tyr Glu Leu Lys His 1805 1810 1815 Gly Thr Phe Thr Cys Ala Ser Glu Tyr Ala Gly Asn Tyr Gln Cys 1820 1825 1830 Gly His Tyr Lys His Ile Thr Ser Lys Glu Thr Leu Tyr Cys Ile 1835 1840 1845 Asp Gly Ala Leu Leu Thr Lys Ser Ser Glu Tyr Lys Gly Pro Ile 1850 1855 1860 Thr Asp Val Phe Tyr Lys Glu Asn Ser Tyr Thr Thr Thr Ile Lys 1865 1870 1875 Pro Val Thr Tyr Lys Leu Asp Gly Val Val Cys Thr Glu Ile Asp 1880 1885 1890 Pro Lys Leu Asp Asn Tyr Tyr Lys Lys Asp Asn Ser Tyr Phe Thr 1895 1900 1905 Glu Gln Pro Ile Asp Leu Val Pro Asn Gln Pro Tyr Pro Asn Ala 1910 1915 1920 Ser Phe Asp Asn Phe Lys Phe Val Cys Asp Asn Ile Lys Phe Ala 1925 1930 1935 Asp Asp Leu Asn Gln Leu Thr Gly Tyr Lys Lys Pro Ala Ser Arg 1940 1945 1950 Glu Leu Lys Val Thr Phe Phe Pro Asp Leu Asn Gly Asp Val Val 1955 1960 1965 Ala Ile Asp Tyr Lys His Tyr Thr Pro Ser Phe Lys Lys Gly Ala 1970 1975 1980 Lys Leu Leu His Lys Pro Ile Val Trp His Val Asn Asn Ala Thr 1985 1990 1995 Asn Lys Ala Thr Tyr Lys Pro Asn Thr Trp Cys Ile Arg Cys Leu 2000 2005 2010 Trp Ser Thr Lys Pro Val Glu Thr Ser Asn Ser Phe Asp Val Leu 2015 2020 2025 Lys Ser Glu Asp Ala Gln Gly Met Asp Asn Leu Ala Cys Glu Asp 2030 2035 2040 Leu Lys Pro Val Ser Glu Glu Val Val Glu Asn Pro Thr Ile Gln 2045 2050 2055 Lys Asp Val Leu Glu Cys Asn Val Lys Thr Thr Glu Val Val Gly 2060 2065 2070 Asp Ile Ile Leu Lys Pro Ala Asn Asn Ser Leu Lys Ile Thr Glu 2075 2080 2085 Glu Val Gly His Thr Asp Leu Met Ala Ala Tyr Val Asp Asn Ser 2090 2095 2100 Ser Leu Thr Ile Lys Lys Pro Asn Glu Leu Ser Arg Val Leu Gly 2105 2110 2115 Leu Lys Thr Leu Ala Thr His Gly Leu Ala Ala Val Asn Ser Val 2120 2125 2130 Pro Trp Asp Thr Ile Ala Asn Tyr Ala Lys Pro Phe Leu Asn Lys 2135 2140 2145 Val Val Ser Thr Thr Thr Asn Ile Val Thr Arg Cys Leu Asn Arg 2150 2155 2160 Val Cys Thr Asn Tyr Met Pro Tyr Phe Phe Thr Leu Leu Leu Gln 2165 2170 2175 Leu Cys Thr Phe Thr Arg Ser Thr Asn Ser Arg Ile Lys Ala Ser 2180 2185 2190 Met Pro Thr Thr Ile Ala Lys Asn Thr Val Lys Ser Val Gly Lys 2195 2200 2205 Phe Cys Leu Glu Ala Ser Phe Asn Tyr Leu Lys Ser Pro Asn Phe 2210 2215 2220 Ser Lys Leu Ile Asn Ile Ile Ile Trp Phe Leu Leu Leu Ser Val 2225 2230 2235 Cys Leu Gly Ser Leu Ile Tyr Ser Thr Ala Ala Leu Gly Val Leu 2240 2245 2250 Met Ser Asn Leu Gly Met Pro Ser Tyr Cys Thr Gly Tyr Arg Glu 2255 2260 2265 Gly Tyr Leu Asn Ser Thr Asn Val Thr Ile Ala Thr Tyr Cys Thr 2270 2275 2280 Gly Ser Ile Pro Cys Ser Val Cys Leu Ser Gly Leu Asp Ser Leu 2285 2290 2295 Asp Thr Tyr Pro Ser Leu Glu Thr Ile Gln Ile Thr Ile Ser Ser 2300 2305 2310 Phe Lys Trp Asp Leu Thr Ala Phe Gly Leu Val Ala Glu Trp Phe 2315 2320 2325 Leu Ala Tyr Ile Leu Phe Thr Arg Phe Phe Tyr Val Leu Gly Leu 2330 2335 2340 Ala Ala Ile Met Gln Leu Phe Phe Ser Tyr Phe Ala Val His Phe 2345 2350 2355 Ile Ser Asn Ser Trp Leu Met Trp Leu Ile Ile Asn Leu Val Gln 2360 2365 2370 Met Ala Pro Ile Ser Ala Met Val Arg Met Tyr Ile Phe Phe Ala 2375 2380 2385 Ser Phe Tyr Tyr Val Trp Lys Ser Tyr Val His Val Val Asp Gly 2390 2395 2400 Cys Asn Ser Ser Thr Cys Met Met Cys Tyr Lys Arg Asn Arg Ala 2405 2410 2415 Thr Arg Val Glu Cys Thr Thr Ile Val Asn Gly Val Arg Arg Ser 2420 2425 2430 Phe Tyr Val Tyr Ala Asn Gly Gly Lys Gly Phe Cys Lys Leu His 2435 2440 2445 Asn Trp Asn Cys Val Asn Cys Asp Thr Phe Cys Ala Gly Ser Thr 2450 2455 2460 Phe Ile Ser Asp Glu Val Ala Arg Asp Leu Ser Leu Gln Phe Lys 2465 2470 2475 Arg Pro Ile Asn Pro Thr Asp Gln Ser Ser Tyr Ile Val Asp Ser 2480 2485 2490 Val Thr Val Lys Asn Gly Ser Ile His Leu Tyr Phe Asp Lys Ala 2495 2500 2505 Gly Gln Lys Thr Tyr Glu Arg His Ser Leu Ser His Phe Val Asn 2510 2515 2520 Leu Asp Asn Leu Arg Ala Asn Asn Thr Lys Gly Ser Leu Pro Ile 2525 2530 2535 Asn Val Ile Val Phe Asp Gly Lys Ser Lys Cys Glu Glu Ser Ser 2540 2545 2550 Ala Lys Ser Ala Ser Val Tyr Tyr Ser Gln Leu Met Cys Gln Pro 2555 2560 2565 Ile Leu Leu Leu Asp Gln Ala Leu Val Ser Asp Val Gly Asp Ser 2570 2575 2580 Ala Glu Val Ala Val Lys Met Phe Asp Ala Tyr Val Asn Thr Phe 2585 2590 2595 Ser Ser Thr Phe Asn Val Pro Met Glu Lys Leu Lys Thr Leu Val 2600 2605 2610 Ala Thr Ala Glu Ala Glu Leu Ala Lys Asn Val Ser Leu Asp Asn 2615 2620 2625 Val Leu Ser Thr Phe Ile Ser Ala Ala Arg Gln Gly Phe Val Asp 2630 2635 2640 Ser Asp Val Glu Thr Lys Asp Val Val Glu Cys Leu Lys Leu Ser 2645 2650 2655 His Gln Ser Asp Ile Glu Val Thr Gly Asp Ser Cys Asn Asn Tyr 2660 2665 2670 Met Leu Thr Tyr Asn Lys Val Glu Asn Met Thr Pro Arg Asp Leu 2675 2680 2685 Gly Ala Cys Ile Asp Cys Ser Ala Arg His Ile Asn Ala Gln Val 2690 2695 2700 Ala Lys Ser His Asn Ile Ala Leu Ile Trp Asn Val Lys Asp Phe 2705 2710 2715 Met Ser Leu Ser Glu Gln Leu Arg Lys Gln Ile Arg Ser Ala Ala 2720 2725 2730 Lys Lys Asn Asn Leu Pro Phe Lys Leu Thr Cys Ala Thr Thr Arg 2735 2740 2745 Gln Val Val Asn Val Val Thr Thr Lys Ile Ala Leu Lys Gly Gly 2750 2755 2760 Lys Ile Val Asn Asn Trp Leu Lys Gln Leu Ile Lys Val Thr Leu 2765 2770 2775 Val Phe Leu Phe Val Ala Ala Ile Phe Tyr Leu Ile Thr Pro Val 2780 2785 2790 His Val Met Ser Lys His Thr Asp Phe Ser Ser Glu Ile Ile Gly 2795 2800 2805 Tyr Lys Ala Ile Asp Gly Gly Val Thr Arg Asp Ile Ala Ser Thr 2810 2815 2820 Asp Thr Cys Phe Ala Asn Lys His Ala Asp Phe Asp Thr Trp Phe 2825 2830 2835 Ser Gln Arg Gly Gly Ser Tyr Thr Asn Asp Lys Ala Cys Pro Leu 2840 2845 2850 Ile Ala Ala Val Ile Thr Arg Glu Val Gly Phe Val Val Pro Gly 2855 2860 2865 Leu Pro Gly Thr Ile Leu Arg Thr Thr Asn Gly Asp Phe Leu His 2870 2875 2880 Phe Leu Pro Arg Val Phe Ser Ala Val Gly Asn Ile Cys Tyr Thr 2885 2890 2895 Pro Ser Lys Leu Ile Glu Tyr Thr Asp Phe Ala Thr Ser Ala Cys 2900 2905 2910 Val Leu Ala Ala Glu Cys Thr Ile Phe Lys Asp Ala Ser Gly Lys 2915 2920 2925 Pro Val Pro Tyr Cys Tyr Asp Thr Asn Val Leu Glu Gly Ser Val 2930 2935 2940 Ala Tyr Glu Ser Leu Arg Pro Asp Thr Arg Tyr Val Leu Met Asp 2945 2950 2955 Gly Ser Ile Ile Gln Phe Pro Asn Thr Tyr Leu Glu Gly Ser Val 2960 2965 2970 Arg Val Val Thr Thr Phe Asp Ser Glu Tyr Cys Arg His Gly Thr 2975 2980 2985 Cys Glu Arg Ser Glu Ala Gly Val Cys Val Ser Thr Ser Gly Arg 2990 2995 3000 Trp Val Leu Asn Asn Asp Tyr Tyr Arg Ser Leu Pro Gly Val Phe 3005 3010 3015 Cys Gly Val Asp Ala Val Asn Leu Leu Thr Asn Met Phe Thr Pro 3020 3025 3030 Leu Ile Gln Pro Ile Gly Ala Leu Asp Ile Ser Ala Ser Ile Val 3035 3040 3045 Ala Gly Gly Ile Val Ala Ile Val Val Thr Cys Leu Ala Tyr Tyr 3050 3055 3060 Phe Met Arg Phe Arg Arg Ala Phe Gly Glu Tyr Ser His Val Val 3065 3070 3075 Ala Phe Asn Thr Leu Leu Phe Leu Met Ser Phe Thr Val Leu Cys 3080 3085 3090 Leu Thr Pro Val Tyr Ser Phe Leu Pro Gly Val Tyr Ser Val Ile 3095 3100 3105 Tyr Leu Tyr Leu Thr Phe Tyr Leu Thr Asn Asp Val Ser Phe Leu 3110 3115 3120 Ala His Ile Gln Trp Met Val Met Phe Thr Pro Leu Val Pro Phe 3125 3130 3135 Trp Ile Thr Ile Ala Tyr Ile Ile Cys Ile Ser Thr Lys His Phe 3140 3145 3150 Tyr Trp Phe Phe Ser Asn Tyr Leu Lys Arg Arg Val Val Phe Asn 3155 3160 3165 Gly Val Ser Phe Ser Thr Phe Glu Glu Ala Ala Leu Cys Thr Phe 3170 3175 3180 Leu Leu Asn Lys Glu Met Tyr Leu Lys Leu Arg Ser Asp Val Leu 3185 3190 3195 Leu Pro Leu Thr Gln Tyr Asn Arg Tyr Leu Ala Leu Tyr Asn Lys 3200 3205 3210 Tyr Lys Tyr Phe Ser Gly Ala Met Asp Thr Thr Ser Tyr Arg Glu 3215 3220 3225 Ala Ala Cys Cys His Leu Ala Lys Ala Leu Asn Asp Phe Ser Asn 3230 3235 3240 Ser Gly Ser Asp Val Leu Tyr Gln Pro Pro Gln Thr Ser Ile Thr 3245 3250 3255 Ser Ala Val Leu Gln Ser Gly Phe Arg Lys Met Ala Phe Pro Ser 3260 3265 3270 Gly Lys Val Glu Gly Cys Met Val Gln Val Thr Cys Gly Thr Thr 3275 3280 3285 Thr Leu Asn Gly Leu Trp Leu Asp Asp Val Val Tyr Cys Pro Arg 3290 3295 3300 His Val Ile Cys Thr Ser Glu Asp Met Leu Asn Pro Asn Tyr Glu 3305 3310 3315 Asp Leu Leu Ile Arg Lys Ser Asn His Asn Phe Leu Val Gln Ala 3320 3325 3330 Gly Asn Val Gln Leu Arg Val Ile Gly His Ser Met Gln Asn Cys 3335 3340 3345 Val Leu Lys Leu Lys Val Asp Thr Ala Asn Pro Lys Thr Pro Lys 3350 3355 3360 Tyr Lys Phe Val Arg Ile Gln Pro Gly Gln Thr Phe Ser Val Leu 3365 3370 3375 Ala Cys Tyr Asn Gly Ser Pro Ser Gly Val Tyr Gln Cys Ala Met 3380 3385 3390 Arg Pro Asn Phe Thr Ile Lys Gly Ser Phe Leu Asn Gly Ser Cys 3395 3400 3405 Gly Ser Val Gly Phe Asn Ile Asp Tyr Asp Cys Val Ser Phe Cys 3410 3415 3420 Tyr Met His His Met Glu Leu Pro Thr Gly Val His Ala Gly Thr 3425 3430 3435 Asp Leu Glu Gly Asn Phe Tyr Gly Pro Phe Val Asp Arg Gln Thr 3440 3445 3450 Ala Gln Ala Ala Gly Thr Asp Thr Thr Ile Thr Val Asn Val Leu 3455 3460 3465 Ala Trp Leu Tyr Ala Ala Val Ile Asn Gly Asp Arg Trp Phe Leu 3470 3475 3480 Asn Arg Phe Thr Thr Thr Leu Asn Asp Phe Asn Leu Val Ala Met 3485 3490 3495 Lys Tyr Asn Tyr Glu Pro Leu Thr Gln Asp His Val Asp Ile Leu 3500 3505 3510 Gly Pro Leu Ser Ala Gln Thr Gly Ile Ala Val Leu Asp Met Cys 3515 3520 3525 Ala Ser Leu Lys Glu Leu Leu Gln Asn Gly Met Asn Gly Arg Thr 3530 3535 3540 Ile Leu Gly Ser Ala Leu Leu Glu Asp Glu Phe Thr Pro Phe Asp 3545 3550 3555 Val Val Arg Gln Cys Ser Gly Val Thr Phe Gln Ser Ala Val Lys 3560 3565 3570 Arg Thr Ile Lys Gly Thr His His Trp Leu Leu Leu Thr Ile Leu 3575 3580 3585 Thr Ser Leu Leu Val Leu Val Gln Ser Thr Gln Trp Ser Leu Phe 3590 3595 3600 Phe Phe Leu Tyr Glu Asn Ala Phe Leu Pro Phe Ala Met Gly Ile 3605 3610 3615 Ile Ala Met Ser Ala Phe Ala Met Met Phe Val Lys His Lys His 3620 3625 3630 Ala Phe Leu Cys Leu Phe Leu Leu Pro Ser Leu Ala Thr Val Ala 3635 3640 3645 Tyr Phe Asn Met Val Tyr Met Pro Ala Ser Trp Val Met Arg Ile 3650 3655 3660 Met Thr Trp Leu Asp Met Val Asp Thr Ser Leu Ser Gly Phe Lys 3665 3670 3675 Leu Lys Asp Cys Val Met Tyr Ala Ser Ala Val Val Leu Leu Ile 3680 3685 3690 Leu Met Thr Ala Arg Thr Val Tyr Asp Asp Gly Ala Arg Arg Val 3695 3700 3705 Trp Thr Leu Met Asn Val Leu Thr Leu Val Tyr Lys Val Tyr Tyr 3710 3715 3720 Gly Asn Ala Leu Asp Gln Ala Ile Ser Met Trp Ala Leu Ile Ile 3725 3730 3735 Ser Val Thr Ser Asn Tyr Ser Gly Val Val Thr Thr Val Met Phe 3740 3745 3750 Leu Ala Arg Gly Ile Val Phe Met Cys Val Glu Tyr Cys Pro Ile 3755 3760 3765 Phe Phe Ile Thr Gly Asn Thr Leu Gln Cys Ile Met Leu Val Tyr 3770 3775 3780 Cys Phe Leu Gly Tyr Phe Cys Thr Cys Tyr Phe Gly Leu Phe Cys 3785 3790 3795 Leu Leu Asn Arg Tyr Phe Arg Leu Thr Leu Gly Val Tyr Asp Tyr 3800 3805 3810 Leu Val Ser Thr Gln Glu Phe Arg Tyr Met Asn Ser Gln Gly Leu 3815 3820 3825 Leu Pro Pro Lys Asn Ser Ile Asp Ala Phe Lys Leu Asn Ile Lys 3830 3835 3840 Leu Leu Gly Val Gly Gly Lys Pro Cys Ile Lys Val Ala Thr Val 3845 3850 3855 Gln Ser Lys Met Ser Asp Val Lys Cys Thr Ser Val Val Leu Leu 3860 3865 3870 Ser Val Leu Gln Gln Leu Arg Val Glu Ser Ser Ser Lys Leu Trp 3875 3880 3885 Ala Gln Cys Val Gln Leu His Asn Asp Ile Leu Leu Ala Lys Asp 3890 3895 3900 Thr Thr Glu Ala Phe Glu Lys Met Val Ser Leu Leu Ser Val Leu 3905 3910 3915 Leu Ser Met Gln Gly Ala Val Asp Ile Asn Lys Leu Cys Glu Glu 3920 3925 3930 Met Leu Asp Asn Arg Ala Thr Leu Gln Ala Ile Ala Ser Glu Phe 3935 3940 3945 Ser Ser Leu Pro Ser Tyr Ala Ala Phe Ala Thr Ala Gln Glu Ala 3950 3955 3960 Tyr Glu Gln Ala Val Ala Asn Gly Asp Ser Glu Val Val Leu Lys 3965 3970 3975 Lys Leu Lys Lys Ser Leu Asn Val Ala Lys Ser Glu Phe Asp Arg 3980 3985 3990 Asp Ala Ala Met Gln Arg Lys Leu Glu Lys Met Ala Asp Gln Ala 3995 4000 4005 Met Thr Gln Met Tyr Lys Gln Ala Arg Ser Glu Asp Lys Arg Ala 4010 4015 4020 Lys Val Thr Ser Ala Met Gln Thr Met Leu Phe Thr Met Leu Arg 4025 4030 4035 Lys Leu Asp Asn Asp Ala Leu Asn Asn Ile Ile Asn Asn Ala Arg 4040 4045 4050 Asp Gly Cys Val Pro Leu Asn Ile Ile Pro Leu Thr Thr Ala Ala 4055 4060 4065 Lys Leu Met Val Val Ile Pro Asp Tyr Asn Thr Tyr Lys Asn Thr 4070 4075 4080 Cys Asp Gly Thr Thr Phe Thr Tyr Ala Ser Ala Leu Trp Glu Ile 4085 4090 4095 Gln Gln Val Val Asp Ala Asp Ser Lys Ile Val Gln Leu Ser Glu 4100 4105 4110 Ile Ser Met Asp Asn Ser Pro Asn Leu Ala Trp Pro Leu Ile Val 4115 4120 4125 Thr Ala Leu Arg Ala Asn Ser Ala Val Lys Leu Gln Asn Asn Glu 4130 4135 4140 Leu Ser Pro Val Ala Leu Arg Gln Met Ser Cys Ala Ala Gly Thr 4145 4150 4155 Thr Gln Thr Ala Cys Thr Asp Asp Asn Ala Leu Ala Tyr Tyr Asn 4160 4165 4170 Thr Thr Lys Gly Gly Arg Phe Val Leu Ala Leu Leu Ser Asp Leu 4175 4180 4185 Gln Asp Leu Lys Trp Ala Arg Phe Pro Lys Ser Asp Gly Thr Gly 4190 4195 4200 Thr Ile Tyr Thr Glu Leu Glu Pro Pro Cys Arg Phe Val Thr Asp 4205 4210 4215 Thr Pro Lys Gly Pro Lys Val Lys Tyr Leu Tyr Phe Ile Lys Gly 4220 4225 4230 Leu Asn Asn Leu Asn Arg Gly Met Val Leu Gly Ser Leu Ala Ala 4235 4240 4245 Thr Val Arg Leu Gln Ala Gly Asn Ala Thr Glu Val Pro Ala Asn 4250 4255 4260 Ser Thr Val Leu Ser Phe Cys Ala Phe Ala Val Asp Ala Ala Lys 4265 4270 4275 Ala Tyr Lys Asp Tyr Leu Ala Ser Gly Gly Gln Pro Ile Thr Asn 4280 4285 4290 Cys Val Lys Met Leu Cys Thr His Thr Gly Thr Gly Gln Ala Ile 4295 4300 4305 Thr Val Thr Pro Glu Ala Asn Met Asp Gln Glu Ser Phe Gly Gly 4310 4315 4320 Ala Ser Cys Cys Leu Tyr Cys Arg Cys His Ile Asp His Pro Asn 4325 4330 4335 Pro Lys Gly Phe Cys Asp Leu Lys Gly Lys Tyr Val Gln Ile Pro 4340 4345 4350 Thr Thr Cys Val Asn Asp Pro Val Gly Phe Thr Leu Lys Asn Thr 4355 4360 4365 Val Cys Thr Val Cys Gly Met Trp Lys Gly Tyr Gly Cys Ser Cys 4370 4375 4380 Asp Gln Leu Arg Glu Pro Met Leu Gln Ser Ala Asp Ala Gln Ser 4385 4390 4395 Phe Leu Asn Gly Phe Ala Val 4400 4405 <210> 438 <211> 1271 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 438 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp Asn Pro 65 70 75 80 Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu Lys Ser 85 90 95 Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser Lys Thr 100 105 110 Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile Lys Val 115 120 125 Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr Tyr His 130 135 140 Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr Ser Ser 145 150 155 160 Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met Asp 165 170 175 Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val Phe 180 185 190 Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro Ile 195 200 205 Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu 210 215 220 Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu 225 230 235 240 Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp 245 250 255 Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr 260 265 270 Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp 275 280 285 Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe 290 295 300 Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro 305 310 315 320 Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe 325 330 335 Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn 340 345 350 Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn 355 360 365 Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys 370 375 380 Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile 385 390 395 400 Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile 405 410 415 Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile 420 425 430 Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn 435 440 445 Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg 450 455 460 Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly 465 470 475 480 Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln 485 490 495 Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser 500 505 510 Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser 515 520 525 Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu 530 535 540 Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe 545 550 555 560 Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp 565 570 575 Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly 580 585 590 Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val 595 600 605 Leu Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala 610 615 620 Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val 625 630 635 640 Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn 645 650 655 Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr 660 665 670 Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala Ser Gln 675 680 685 Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala 690 695 700 Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val 705 710 715 720 Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys 725 730 735 Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu 740 745 750 Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile 755 760 765 Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys 770 775 780 Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe 785 790 795 800 Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile 805 810 815 Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile 820 825 830 Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile 835 840 845 Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr 850 855 860 Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile 865 870 875 880 Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe 885 890 895 Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn 900 905 910 Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala 915 920 925 Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly 930 935 940 Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu 945 950 955 960 Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn 965 970 975 Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp 980 985 990 Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln 995 1000 1005 Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala 1010 1015 1020 Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val 1025 1030 1035 Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser 1040 1045 1050 Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala 1055 1060 1065 Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly 1070 1075 1080 Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr 1085 1090 1095 His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile 1100 1105 1110 Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile 1115 1120 1125 Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu 1130 1135 1140 Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr 1145 1150 1155 Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser 1160 1165 1170 Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala 1175 1180 1185 Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys 1190 1195 1200 Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly Phe 1205 1210 1215 Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys 1220 1225 1230 Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys 1235 1240 1245 Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu 1250 1255 1260 Lys Gly Val Lys Leu His Tyr Thr 1265 1270 <210> 439 <211> 275 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 439 Met Asp Leu Phe Met Arg Ile Phe Thr Ile Gly Thr Val Thr Leu Lys 1 5 10 15 Gln Gly Glu Ile Lys Asp Ala Thr Pro Ser Asp Phe Val Arg Ala Thr 20 25 30 Ala Thr Ile Pro Ile Gln Ala Ser Leu Pro Phe Gly Trp Leu Ile Val 35 40 45 Gly Val Ala Leu Leu Ala Val Phe His Ser Ala Ser Lys Ile Ile Thr 50 55 60 Leu Lys Lys Arg Trp Gln Leu Ala Leu Ser Lys Gly Val His Phe Val 65 70 75 80 Cys Asn Leu Leu Leu Leu Phe Val Thr Val Tyr Ser His Leu Leu Leu 85 90 95 Val Ala Ala Gly Leu Glu Ala Pro Phe Leu Tyr Leu Tyr Ala Leu Val 100 105 110 Tyr Phe Leu Gln Ser Ile Asn Phe Val Arg Ile Ile Met Arg Leu Trp 115 120 125 Leu Cys Trp Lys Cys Arg Ser Lys Asn Pro Leu Leu Tyr Asp Ala Asn 130 135 140 Tyr Phe Leu Cys Trp His Ile Asn Cys Tyr Asp Tyr Cys Ile Pro Tyr 145 150 155 160 Asn Ser Val Thr Ser Ser Ile Val Ile Thr Ser Gly Asp Gly Thr Thr 165 170 175 Ser Pro Ile Ser Glu His Asp Tyr Gln Ile Gly Gly Tyr Thr Glu Lys 180 185 190 Trp Glu Ser Gly Val Lys Asp Cys Val Val Leu His Ser Tyr Phe Thr 195 200 205 Ser Asp Tyr Tyr Gln Leu Tyr Ser Thr Gln Leu Ser Thr Asp Thr Gly 210 215 220 Val Glu His Val Thr Phe Phe Ile Tyr Asn Lys Ile Val Asp Glu Pro 225 230 235 240 Glu Glu His Val Gln Ile His Thr Ile Asp Gly Ser Ser Gly Val Val 245 250 255 Asn Pro Val Met Glu Pro Ile Tyr Asp Glu Pro Thr Thr Thr Thr Ser 260 265 270 Val Pro Leu 275 <210> 440 <211> 75 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 440 Met Tyr Ser Phe Val Ser Glu Glu Thr Gly Thr Leu Ile Val Asn Ser 1 5 10 15 Val Leu Leu Phe Leu Ala Phe Val Val Phe Leu Leu Val Thr Leu Ala 20 25 30 Ile Leu Thr Ala Leu Arg Leu Cys Ala Tyr Cys Cys Asn Ile Val Asn 35 40 45 Val Ser Leu Val Lys Pro Ser Phe Tyr Val Tyr Ser Arg Val Lys Asn 50 55 60 Leu Asn Ser Ser Arg Val Pro Asp Leu Leu Val 65 70 75 <210> 441 <211> 222 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 441 Met Ala Asp Ser Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Lys Leu 1 5 10 15 Leu Glu Gln Trp Asn Leu Val Ile Gly Phe Leu Phe Leu Thr Trp Ile 20 25 30 Cys Leu Leu Gln Phe Ala Tyr Ala Asn Arg Asn Arg Phe Leu Tyr Val 35 40 45 Ile Lys Leu Ile Phe Leu Trp Leu Leu Trp Pro Val Thr Leu Ala Cys 50 55 60 Phe Val Leu Ala Ala Val Tyr Arg Ile Asn Trp Ile Thr Gly Gly Ile 65 70 75 80 Ala Ile Ala Met Ala Cys Leu Val Gly Leu Met Trp Leu Ser Tyr Phe 85 90 95 Ile Ala Ser Phe Arg Leu Phe Ala Arg Thr Arg Ser Met Trp Ser Phe 100 105 110 Asn Pro Glu Thr Asn Ile Leu Leu Asn Val Pro Leu His Gly Thr Ile 115 120 125 Leu Thr Arg Pro Leu Leu Glu Ser Glu Leu Val Ile Gly Ala Val Ile 130 135 140 Leu Arg Gly His Leu Arg Ile Ala Gly His His Leu Gly Arg Cys Asp 145 150 155 160 Ile Lys Asp Leu Pro Lys Glu Ile Thr Val Ala Thr Ser Arg Thr Leu 165 170 175 Ser Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Ala Gly Asp Ser Gly 180 185 190 Phe Ala Ala Tyr Ser Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr 195 200 205 Asp His Ser Ser Ser Ser Asp Asn Ile Ala Leu Leu Val Gln 210 215 220 <210> 442 <211> 61 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 442 Met Phe His Leu Val Asp Phe Gln Val Thr Ile Ala Glu Ile Leu Leu 1 5 10 15 Ile Ile Met Arg Thr Phe Lys Val Ser Ile Trp Asn Leu Asp Tyr Ile 20 25 30 Ile Asn Leu Ile Ile Lys Asn Leu Ser Lys Ser Leu Thr Glu Asn Lys 35 40 45 Tyr Ser Gln Leu Asp Glu Glu Gln Pro Met Glu Ile Asp 50 55 60 <210> 443 <211> 121 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 443 Met Lys Ile Ile Leu Phe Leu Ala Leu Ile Thr Leu Ala Thr Cys Glu 1 5 10 15 Leu Tyr His Tyr Gln Glu Cys Val Arg Gly Thr Thr Val Leu Leu Lys 20 25 30 Glu Pro Cys Ser Ser Gly Thr Tyr Glu Gly Asn Ser Pro Phe His Pro 35 40 45 Leu Ala Asp Asn Lys Phe Ala Leu Thr Cys Phe Ser Thr Gln Phe Ala 50 55 60 Phe Ala Cys Pro Asp Gly Val Lys His Val Tyr Gln Leu Arg Ala Arg 65 70 75 80 Ser Val Ser Pro Lys Leu Phe Ile Arg Gln Glu Glu Val Gln Glu Leu 85 90 95 Tyr Ser Pro Ile Phe Leu Ile Val Ala Ala Ile Val Phe Ile Thr Leu 100 105 110 Cys Phe Thr Leu Lys Arg Lys Thr Glu 115 120 <210> 444 <211> 43 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 444 Met Ile Glu Leu Ser Leu Ile Asp Phe Tyr Leu Cys Phe Leu Ala Phe 1 5 10 15 Leu Leu Phe Leu Val Leu Ile Met Leu Ile Ile Phe Trp Phe Ser Leu 20 25 30 Glu Leu Gln Asp His Asn Glu Thr Cys His Ala 35 40 <210> 445 <211> 121 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 445 Met Lys Phe Leu Val Phe Leu Gly Ile Ile Thr Thr Val Ala Ala Phe 1 5 10 15 His Gln Glu Cys Ser Leu Gln Ser Cys Thr Gln His Gln Pro Tyr Val 20 25 30 Val Asp Asp Pro Cys Pro Ile His Phe Tyr Ser Lys Trp Tyr Ile Arg 35 40 45 Val Gly Ala Arg Lys Ser Ala Pro Leu Ile Glu Leu Cys Val Asp Glu 50 55 60 Ala Gly Ser Lys Ser Pro Ile Gln Tyr Ile Asp Ile Gly Asn Tyr Thr 65 70 75 80 Val Ser Cys Leu Pro Phe Thr Ile Asn Cys Gln Glu Pro Lys Leu Gly 85 90 95 Ser Leu Val Val Arg Cys Ser Phe Tyr Glu Asp Phe Leu Glu Tyr His 100 105 110 Asp Val Arg Val Val Leu Asp Phe Ile 115 120 <210> 446 <211> 419 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 446 Met Ser Asp Asn Gly Pro Gln Asn Gln Arg Asn Ala Pro Arg Ile Thr 1 5 10 15 Phe Gly Gly Pro Ser Asp Ser Thr Gly Ser Asn Gln Asn Gly Glu Arg 20 25 30 Ser Gly Ala Arg Ser Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn Asn 35 40 45 Thr Ala Ser Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Asp Leu 50 55 60 Lys Phe Pro Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Ser Pro 65 70 75 80 Asp Asp Gln Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Ile Arg Gly 85 90 95 Gly Asp Gly Lys Met Lys Asp Leu Ser Pro Arg Trp Tyr Phe Tyr Tyr 100 105 110 Leu Gly Thr Gly Pro Glu Ala Gly Leu Pro Tyr Gly Ala Asn Lys Asp 115 120 125 Gly Ile Ile Trp Val Ala Thr Glu Gly Ala Phe Asn Thr Pro Lys Asp 130 135 140 His Ile Gly Thr Arg Asn Pro Ala Asn Asn Ala Ala Ile Val Leu Gln 145 150 155 160 Leu Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly Ser 165 170 175 Arg Gly Gly Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg Asn 180 185 190 Ser Ser Arg Asn Ser Thr Pro Gly Ser Ser Arg Gly Ile Ser Pro Ala 195 200 205 Arg Met Ala Gly Asn Gly Gly Asp Ala Ala Leu Ala Leu Leu Leu Leu 210 215 220 Asp Arg Leu Asn Gln Leu Glu Ser Lys Met Ser Gly Lys Gly Gln Gln 225 230 235 240 Gln Gln Gly Gln Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser Lys 245 250 255 Lys Pro Arg Gln Lys Arg Thr Ala Thr Lys Ala Tyr Asn Val Thr Gln 260 265 270 Ala Phe Gly Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly Asp 275 280 285 Gln Glu Leu Ile Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln Ile 290 295 300 Ala Gln Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg Ile 305 310 315 320 Gly Met Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr Thr Gly Ala 325 330 335 Ile Lys Leu Asp Asp Lys Asp Pro Asn Phe Lys Asp Gln Val Ile Leu 340 345 350 Leu Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu Pro 355 360 365 Lys Lys Asp Lys Lys Lys Lys Ala Asp Glu Thr Gln Ala Leu Pro Gln 370 375 380 Arg Gln Lys Lys Gln Gln Thr Val Thr Leu Leu Pro Ala Ala Asp Leu 385 390 395 400 Asp Asp Phe Ser Lys Gln Leu Gln Gln Ser Met Ser Ser Ala Asp Ser 405 410 415 Thr Gln Ala <210> 447 <211> 38 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 447 Met Gly Tyr Ile Asn Val Phe Ala Phe Pro Phe Thr Ile Tyr Ser Leu 1 5 10 15 Leu Leu Cys Arg Met Asn Ser Arg Asn Tyr Ile Ala Gln Val Asp Val 20 25 30 Val Asn Phe Asn Leu Thr 35 <210> 448 <400> 448 000 <210> 449 <400> 449 000 <210> 450 <400> 450 000 <210> 451 <400> 451 000 <210> 452 <400> 452 000 <210> 453 <400> 453 000 <210> 454 <400> 454 000 <210> 455 <400> 455 000 <210> 456 <400> 456 000 <210> 457 <400> 457 000 <210> 458 <400> 458 000 <210> 459 <400> 459 000 <210> 460 <400> 460 000 <210> 461 <400> 461 000 <210> 462 <400> 462 000 <210> 463 <400> 463 000 <210> 464 <400> 464 000 <210> 465 <400> 465 000 <210> 466 <400> 466 000 <210> 467 <400> 467 000 <210> 468 <400> 468 000 <210> 469 <400> 469 000 <210> 470 <400> 470 000 <210> 471 <400> 471 000 <210> 472 <400> 472 000 <210> 473 <400> 473 000 <210> 474 <400> 474 000 <210> 475 <400> 475 000 <210> 476 <400> 476 000 <210> 477 <400> 477 000 <210> 478 <400> 478 000 <210> 479 <400> 479 000 <210> 480 <400> 480 000 <210> 481 <400> 481 000 <210> 482 <400> 482 000 <210> 483 <400> 483 000 <210> 484 <400> 484 000 <210> 485 <400> 485 000 <210> 486 <400> 486 000 <210> 487 <400> 487 000 <210> 488 <400> 488 000 <210> 489 <400> 489 000 <210> 490 <400> 490 000 <210> 491 <400> 491 000 <210> 492 <400> 492 000 <210> 493 <400> 493 000 <210> 494 <400> 494 000 <210> 495 <400> 495 000 <210> 496 <400> 496 000 <210> 497 <400> 497 000 <210> 498 <400> 498 000 <210> 499 <400> 499 000 <210> 500 <400> 500 000 <210> 501 <211> 21291 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 501 atggagagcc ttgtccctgg tttcaacgag aaaacacacg tccaactcag tttgcctgtt 60 ttacaggttc gcgacgtgct cgtacgtggc tttggagact ccgtggagga ggtcttatca 120 gaggcacgtc aacatcttaa agatggcact tgtggcttag tagaagttga aaaaggcgtt 180 ttgcctcaac ttgaacagcc ctatgtgttc atcaaacgtt cggatgctcg aactgcacct 240 catggtcatg ttatggttga gctggtagca gaactcgaag gcattcagta cggtcgtagt 300 ggtgagacac ttggtgtcct tgtccctcat gtgggcgaaa taccagtggc ttaccgcaag 360 gttcttcttc gtaagaacgg taataaagga gctggtggcc atagttacgg cgccgatcta 420 aagtcatttg acttaggcga cgagcttggc actgatcctt atgaagattt tcaagaaaac 480 tggaacacta aacatagcag tggtgttacc cgtgaactca tgcgtgagct taacggaggg 540 gcatacactc gctatgtcga taacaacttc tgtggccctg atggctaccc tcttgagtgc 600 attaaagacc ttctagcacg tgctggtaaa gcttcatgca ctttgtccga acaactggac 660 tttattgaca ctaagagggg tgtatactgc tgccgtgaac atgagcatga aattgcttgg 720 tacacggaac gttctgaaaa gagctatgaa ttgcagacac cttttgaaat taaattggca 780 aagaaatttg acaccttcaa tggggaatgt ccaaattttg tatttccctt aaattccata 840 atcaagacta ttcaaccaag ggttgaaaag aaaaagcttg atggctttat gggtagaatt 900 cgatctgtct atccagttgc gtcaccaaat gaatgcaacc aaatgtgcct ttcaactctc 960 atgaagtgtg atcattgtgg tgaaacttca tggcagacgg gcgattttgt taaagccact 1020 tgcgaatttt gtggcactga gaatttgact aaagaaggtg ccactacttg tggttactta 1080 ccccaaaatg ctgttgttaa aatttattgt ccagcatgtc acaattcaga agtaggacct 1140 gagcatagtc ttgccgaata ccataatgaa tctggcttga aaaccattct tcgtaagggt 1200 ggtcgcacta ttgcctttgg aggctgtgtg ttctcttatg ttggttgcca taacaagtgt 1260 gcctattggg ttccacgtgc tagcgctaac ataggttgta accatacagg tgttgttgga 1320 gaaggttccg aaggtcttaa tgacaacctt cttgaaatac tccaaaaaga gaaagtcaac 1380 atcaatattg ttggtgactt taaacttaat gaagagatcg ccattatttt ggcatctttt 1440 tctgcttcca caagtgcttt tgtggaaact gtgaaaggtt tggattataa agcattcaaa 1500 caaattgttg aatcctgtgg taattttaaa gttacaaaag gaaaagctaa aaaaggtgcc 1560 tggaatattg gtgaacagaa atcaatactg agtcctcttt atgcatttgc atcagaggct 1620 gctcgtgttg tacgatcaat tttctcccgc actcttgaaa ctgctcaaaa ttctgtgcgt 1680 gttttacaga aggccgctat aacaatacta gatggaattt cacagtattc actgagactc 1740 attgatgcta tgatgttcac atctgatttg gctactaaca atctagttgt aatggcctac 1800 attacaggtg gtgttgttca gttgacttcg cagtggctaa ctaacatctt tggcactgtt 1860 tatgaaaaac tcaaacccgt ccttgattgg cttgaagaga agtttaagga aggtgtagag 1920 tttcttagag acggttggga aattgttaaa tttatctcaa cctgtgcttg tgaaattgtc 1980 ggtggacaaa ttgtcacctg tgcaaaggaa attaaggaga gtgttcagac attctttaag 2040 cttgtaaata aatttttggc tttgtgtgct gactctatca ttattggtgg agctaaactt 2100 aaagccttga atttaggtga aacatttgtc acgcactcaa agggattgta cagaaagtgt 2160 gttaaatcca gagaagaaac tggcctactc atgcctctaa aagccccaaa agaaattatc 2220 ttcttagagg gagaaacact tcccacagaa gtgttaacag aggaagttgt cttgaaaact 2280 ggtgatttac aaccattaga acaacctact agtgaagctg ttgaagctcc attggttggt 2340 acaccagttt gtattaacgg gcttatgttg ctcgaaatca aagacacaga aaagtactgt 2400 gcccttgcac ctaatatgat ggtaacaaac aataccttca cactcaaagg cggtgcacca 2460 acaaaggtta cttttggtga tgacactgtg atagaagtgc aaggttacaa gagtgtgaat 2520 atcacttttg aacttgatga aaggattgat aaagtactta atgagaagtg ctctgcctat 2580 acagttgaac tcggtacaga agtaaatgag ttcgcctgtg ttgtggcaga tgctgtcata 2640 aaaactttgc aaccagtatc tgaattactt acaccactgg gcattgattt agatgagtgg 2700 agtatggcta catactactt atttgatgag tctggtgagt ttaaattggc ttcacatatg 2760 tattgttctt tctaccctcc agatgaggat gaagaagaag gtgattgtga agaagaagag 2820 tttgagccat caactcaata tgagtatggt actgaagatg attaccaagg taaacctttg 2880 gaatttggtg ccacttctgc tgctcttcaa cctgaagaag agcaagaaga agattggtta 2940 gatgatgata gtcaacaaac tgttggtcaa caagacggca gtgaggacaa tcagacaact 3000 actattcaaa caattgttga ggttcaacct caattagaga tggaacttac accagttgtt 3060 cagactattg aagtgaatag ttttagtggt tatttaaaac ttactgacaa tgtatacatt 3120 aaaaatgcag acattgtgga agaagctaaa aaggtaaaac caacagtggt tgttaatgca 3180 gccaatgttt accttaaaca tggaggaggt gttgcaggag ccttaaataa ggctactaac 3240 aatgccatgc aagttgaatc tgatgattac atagctacta atggaccact taaagtgggt 3300 ggtagttgtg ttttaagcgg acacaatctt gctaaacact gtcttcatgt tgtcggccca 3360 aatgttaaca aaggtgaaga cattcaactt cttaagagtg cttatgaaaa ttttaatcag 3420 cacgaagttc tacttgcacc attattatca gctggtattt ttggtgctga ccctatacat 3480 tctttaagag tttgtgtaga tactgttcgc acaaatgtct acttagctgt ctttgataaa 3540 aatctctatg acaaacttgt ttcaagcttt ttggaaatga agagtgaaaa gcaagttgaa 3600 caaaagatcg ctgagattcc taaagaggaa gttaagccat ttataactga aagtaaacct 3660 tcagttgaac agagaaaaca agatgataag aaaatcaaag cttgtgttga agaagttaca 3720 acaactctgg aagaaactaa gttcctcaca gaaaacttgt tactttatat tgacattaat 3780 ggcaatcttc atccagattc tgccactctt gttagtgaca ttgacatcac tttcttaaag 3840 aaagatgctc catatatagt gggtgatgtt gttcaagagg gtgttttaac tgctgtggtt 3900 atacctacta aaaaggctgg tggcactact gaaatgctag cgaaagcttt gagaaaagtg 3960 ccaacagaca attatataac cacttacccg ggtcagggtt taaatggtta cactgtagag 4020 gaggcaaaga cagtgcttaa aaagtgtaaa agtgcctttt acattctacc atctattatc 4080 tctaatgaga agcaagaaat tcttggaact gtttcttgga atttgcgaga aatgcttgca 4140 catgcagaag aaacacgcaa attaatgcct gtctgtgtgg aaactaaagc catagtttca 4200 actatacagc gtaaatataa gggtattaaa atacaagagg gtgtggttga ttatggtgct 4260 agattttact tttacaccag taaaacaact gtagcgtcac ttatcaacac acttaacgat 4320 ctaaatgaaa ctcttgttac aatgccactt ggctatgtaa cacatggctt aaatttggaa 4380 gaagctgctc ggtatatgag atctctcaaa gtgccagcta cagtttctgt ttcttcacct 4440 gatgctgtta cagcgtataa tggttatctt acttcttctt ctaaaacacc tgaagaacat 4500 tttattgaaa ccatctcact tgctggttcc tataaagatt ggtcctattc tggacaatct 4560 acacaactag gtatagaatt tcttaagaga ggtgataaaa gtgtatatta cactagtaat 4620 cctaccacat tccacctaga tggtgaagtt atcacctttg acaatcttaa gacacttctt 4680 tctttgagag aagtgaggac tattaaggtg tttacaacag tagacaacat taacctccac 4740 acgcaagttg tggacatgtc aatgacatat ggacaacagt ttggtccaac ttatttggat 4800 ggagctgatg ttactaaaat aaaacctcat aattcacatg aaggtaaaac attttatgtt 4860 ttacctaatg atgacactct acgtgttgag gcttttgagt actaccacac aactgatcct 4920 agttttctgg gtaggtacat gtcagcatta aatcacacta aaaagtggaa atacccacaa 4980 gttaatggtt taacttctat taaatgggca gataacaact gttatcttgc cactgcattg 5040 ttaacactcc aacaaataga gttgaagttt aatccacctg ctctacaaga tgcttattac 5100 agagcaaggg ctggtgaagc tgctaacttt tgtgcactta tcttagccta ctgtaataag 5160 acagtaggtg agttaggtga tgttagagaa acaatgagtt acttgtttca acatgccaat 5220 ttagattctt gcaaaagagt cttgaacgtg gtgtgtaaaa cttgtggaca acagcagaca 5280 acccttaagg gtgtagaagc tgttatgtac atgggcacac tttcttatga acaatttaag 5340 aaaggtgttc agataccttg tacgtgtggt aaacaagcta caaaatatct agtacaacag 5400 gagtcacctt ttgttatgat gtcagcacca cctgctcagt atgaacttaa gcatggtaca 5460 tttacttgtg ctagtgagta cactggtaat taccagtgtg gtcactataa acatataact 5520 tctaaagaaa ctttgtattg catagacggt gctttactta caaagtcctc agaatacaaa 5580 ggtcctatta cggatgtttt ctacaaagaa aacagttaca caacaaccat aaaaccagtt 5640 acttataaat tggatggtgt tgtttgtaca gaaattgacc ctaagttgga caattattat 5700 aagaaagaca attcttattt cacagagcaa ccaattgatc ttgtaccaaa ccaaccatat 5760 ccaaacgcaa gcttcgataa ttttaagttt gtatgtgata atatcaaatt tgctgatgat 5820 ttaaaccagt taactggtta taagaaacct gcttcaagag agcttaaagt tacatttttc 5880 cctgacttaa atggtgatgt ggtggctatt gattataaac actacacacc ctcttttaag 5940 aaaggagcta aattgttaca taaacctatt gtttggcatg ttaacaatgc aactaataaa 6000 gccacgtata aaccaaatac ctggtgtata cgttgtcttt ggagcacaaa accagttgaa 6060 acatcaaatt cgtttgatgt actgaagtca gaggacgcgc agggaatgga taatcttgcc 6120 tgcgaagatc taaaaccagt ctctgaagaa gtagtggaaa atcctaccat acagaaagac 6180 gttcttgagt gtaatgtgaa aactaccgaa gttgtaggag acattatact taaaccagca 6240 aataatagtt taaaaattac agaagaggtt ggccacacag atctaatggc tgcttatgta 6300 gacaattcta gtcttactat taagaaacct aatgaattat ctagagtatt aggtttgaaa 6360 acccttgcta ctcatggttt agctgctgtt aatagtgtcc cttgggatac tatagctaat 6420 tatgctaagc cttttcttaa caaagttgtt agtacaacta ctaacatagt tacacggtgt 6480 ttaaaccgtg tttgtactaa ttatatgcct tatttcttta ctttattgct acaattgtgt 6540 acttttacta gaagtacaaa ttctagaatt aaagcatcta tgccgactac tatagcaaag 6600 aatactgtta agagtgtcgg taaattttgt ctagaggctt catttaatta tttgaagtca 6660 cctaattttt ctaaactgat aaatattata atttggtttt tactattaag tgtttgccta 6720 ggttctttaa tctactcaac cgctgcttta ggtgttttaa tgtctaattt aggcatgcct 6780 tcttactgta ctggttacag agaaggctat ttgaactcta ctaatgtcac tattgcaacc 6840 tactgtactg gttctatacc ttgtagtgtt tgtcttagtg gtttagattc tttagacacc 6900 tatccttctt tagaaactat acaaattacc atttcatctt ttaaatggga tttaactgct 6960 tttggcttag ttgcagagtg gtttttggca tatattcttt tcactaggtt tttctatgta 7020 cttggattgg ctgcaatcat gcaattgttt ttcagctatt ttgcagtaca ttttattagt 7080 aattcttggc ttatgtggtt aataattaat cttgtacaaa tggccccgat ttcagctatg 7140 gttagaatgt acatcttctt tgcatcattt tattatgtat ggaaaagtta tgtgcatgtt 7200 gtagacggtt gtaattcatc aacttgtatg atgtgttaca aacgtaatag agcaacaaga 7260 gtcgaatgta caactattgt taatggtgtt agaaggtcct tttatgtcta tgctaatgga 7320 ggtaaaggct tttgcaaact acacaattgg aattgtgtta attgtgatac attctgtgct 7380 ggtagtacat ttattagtga tgaagttgcg agagacttgt cactacagtt taaaagacca 7440 ataaatccta ctgaccagtc ttcttacatc gttgatagtg ttacagtgaa gaatggttcc 7500 atccatcttt actttgataa agctggtcaa aagacttatg aaagacattc tctctctcat 7560 tttgttaact tagacaacct gagagctaat aacactaaag gttcattgcc tattaatgtt 7620 atagtttttg atggtaaatc aaaatgtgaa gaatcatctg caaaatcagc gtctgtttac 7680 tacagtcagc ttatgtgtca acctatactg ttactagatc aggcattagt gtctgatgtt 7740 ggtgatagtg cggaagttgc agttaaaatg tttgatgctt acgttaatac gttttcatca 7800 acttttaacg taccaatgga aaaactcaaa acactagttg caactgcaga agctgaactt 7860 gcaaagaatg tgtccttaga caatgtctta tctactttta tttcagcagc tcggcaaggg 7920 tttgttgatt cagatgtaga aactaaagat gttgttgaat gtcttaaatt gtcacatcaa 7980 tctgacatag aagttactgg cgatagttgt aataactata tgctcaccta taacaaagtt 8040 gaaaacatga caccccgtga ccttggtgct tgtattgact gtagtgcgcg tcatattaat 8100 gcgcaggtag caaaaagtca caacattgct ttgatatgga acgttaaaga tttcatgtca 8160 ttgtctgaac aactacgaaa acaaatacgt agtgctgcta aaaagaataa cttacctttt 8220 aagttgacat gtgcaactac tagacaagtt gttaatgttg taacaacaaa gatagcactt 8280 aagggtggta aaattgttaa taattggttg aagcagttaa ttaaagttac acttgtgttc 8340 ctttttgttg ctgctatttt ctatttaata acacctgttc atgtcatgtc taaacatact 8400 gacttttcaa gtgaaatcat aggatacaag gctattgatg gtggtgtcac tcgtgacata 8460 gcatctacag atacttgttt tgctaacaaa catgctgatt ttgacacatg gtttagccag 8520 cgtggtggta gttatactaa tgacaaagct tgcccattga ttgctgcagt cataacaaga 8580 gaagtgggtt ttgtcgtgcc tggtttgcct ggcacgatat tacgcacaac taatggtgac 8640 tttttgcatt tcttacctag agtttttagt gcagttggta acatctgtta cacaccatca 8700 aaacttatag agtacactga ctttgcaaca tcagcttgtg ttttggctgc tgaatgtaca 8760 atttttaaag atgcttctgg taagccagta ccatattgtt atgataccaa tgtactagaa 8820 ggttctgttg cttatgaaag tttacgccct gacacacgtt atgtgctcat ggatggctct 8880 attattcaat ttcctaacac ctaccttgaa ggttctgtta gagtggtaac aacttttgat 8940 tctgagtact gtaggcacgg cacttgtgaa agatcagaag ctggtgtttg tgtatctact 9000 agtggtagat gggtacttaa caatgattat tacagatctt taccaggagt tttctgtggt 9060 gtagatgctg taaatttact tactaatatg tttacaccac taattcaacc tattggtgct 9120 ttggacatat cagcatctat agtagctggt ggtattgtag ctatcgtagt aacatgcctt 9180 gcctactatt ttatgaggtt tagaagagct tttggtgaat acagtcatgt agttgccttt 9240 aatactttac tattccttat gtcattcact gtactctgtt taacaccagt ttactcattc 9300 ttacctggtg tttattctgt tatttacttg tacttgacat tttatcttac taatgatgtt 9360 tcttttttag cacatattca gtggatggtt atgttcacac ctttagtacc tttctggata 9420 acaattgctt atatcatttg tatttccaca aagcatttct attggttctt tagtaattac 9480 ctaaagagac gtgtagtctt taatggtgtt tcctttagta cttttgaaga agctgcgctg 9540 tgcacctttt tgttaaataa agaaatgtat ctaaagttgc gtagtgatgt gctattacct 9600 cttacgcaat ataatagata cttagctctt tataataagt acaagtattt tagtggagca 9660 atggatacaa ctagctacag agaagctgct tgttgtcatc tcgcaaaggc tctcaatgac 9720 ttcagtaact caggttctga tgttctttac caaccaccac aaacctctat cacctcagct 9780 gttttgcaga gtggttttag aaaaatggca ttcccatctg gtaaagttga gggttgtatg 9840 gtacaagtaa cttgtggtac aactacactt aacggtcttt ggcttgatga cgtagtttac 9900 tgtccaagac atgtgatctg cacctctgaa gacatgctta accctaatta tgaagattta 9960 ctcattcgta agtctaatca taatttcttg gtacaggctg gtaatgttca actcagggtt 10020 attggacatt ctatgcaaaa ttgtgtactt aagcttaagg ttgatacagc caatcctaag 10080 acacctaagt ataagtttgt tcgcattcaa ccaggacaga ctttttcagt gttagcttgt 10140 tacaatggtt caccatctgg tgtttaccaa tgtgctatga ggcccaattt cactattaag 10200 ggttcattcc ttaatggttc atgtggtagt gttggtttta acatagatta tgactgtgtc 10260 tctttttgtt acatgcacca tatggaatta ccaactggag ttcatgctgg cacagactta 10320 gaaggtaact tttatggacc ttttgttgac aggcaaacag cacaagcagc tggtacggac 10380 acaactatta cagttaatgt tttagcttgg ttgtacgctg ctgttataaa tggagacagg 10440 tggtttctca atcgatttac cacaactctt aatgacttta accttgtggc tatgaagtac 10500 aattatgaac ctctaacaca agaccatgtt gacatactag gacctctttc tgctcaaact 10560 ggaattgccg ttttagatat gtgtgcttca ttaaaagaat tactgcaaaa tggtatgaat 10620 ggacgtacca tattgggtag tgctttatta gaagatgaat ttacaccttt tgatgttgtt 10680 agacaatgct caggtgttac tttccaaagt gcagtgaaaa gaacaatcaa gggtacacac 10740 cactggttgt tactcacaat tttgacttca cttttagttt tagtccagag tactcaatgg 10800 tctttgttct tttttttgta tgaaaatgcc tttttacctt ttgctatggg tattattgct 10860 atgtctgctt ttgcaatgat gtttgtcaaa cataagcatg catttctctg tttgtttttg 10920 ttaccttctc ttgccactgt agcttatttt aatatggtct atatgcctgc tagttgggtg 10980 atgcgtatta tgacatggtt ggatatggtt gatactagtt tgtctggttt taagctaaaa 11040 gactgtgtta tgtatgcatc agctgtagtg ttactaatcc ttatgacagc aagaactgtg 11100 tatgatgatg gtgctaggag agtgtggaca cttatgaatg tcttgacact cgtttataaa 11160 gtttattatg gtaatgcttt agatcaagcc atttccatgt gggctcttat aatctctgtt 11220 acttctaact actcaggtgt agttacaact gtcatgtttt tggccagagg tattgttttt 11280 atgtgtgttg agtattgccc tattttcttc ataactggta atacacttca gtgtataatg 11340 ctagtttatt gtttcttagg ctatttttgt acttgttact ttggcctctt ttgtttactc 11400 aaccgctact ttagactgac tcttggtgtt tatgattact tagtttctac acaggagttt 11460 agatatatga attcacaggg actactccca cccaagaata gcatagatgc cttcaaactc 11520 aacattaaat tgttgggtgt tggtggcaaa ccttgtatca aagtagccac tgtacagtct 11580 aaaatgtcag atgtaaagtg cacatcagta gtcttactct cagttttgca acaactcaga 11640 gtagaatcat catctaaatt gtgggctcaa tgtgtccagt tacacaatga cattctctta 11700 gctaaagata ctactgaagc ctttgaaaaa atggtttcac tactttctgt tttgctttcc 11760 atgcagggtg ctgtagacat aaacaagctt tgtgaagaaa tgctggacaa cagggcaacc 11820 ttacaagcta tagcctcaga gtttagttcc cttccatcat atgcagcttt tgctactgct 11880 caagaagctt atgagcaggc tgttgctaat ggtgattctg aagttgttct taaaaagttg 11940 aagaagtctt tgaatgtggc taaatctgaa tttgaccgtg atgcagccat gcaacgtaag 12000 ttggaaaaga tggctgatca agctatgacc caaatgtata aacaggctag atctgaggac 12060 aagagggcaa aagttactag tgctatgcag acaatgcttt tcactatgct tagaaagttg 12120 gataatgatg cactcaacaa cattatcaac aatgcaagag atggttgtgt tcccttgaac 12180 ataatacctc ttacaacagc agccaaacta atggttgtca taccagacta taacacatat 12240 aaaaatacgt gtgatggtac aacatttact tatgcatcag cattgtggga aatccaacag 12300 gttgtagatg cagatagtaa aattgttcaa cttagtgaaa ttagtatgga caattcacct 12360 aatttagcat ggcctcttat tgtaacagct ttaagggcca attctgctgt caaattacag 12420 aataatgagc ttagtcctgt tgcactacga cagatgtctt gtgctgccgg tactacacaa 12480 actgcttgca ctgatgacaa tgcgttagct tactacaaca caacaaaggg aggtaggttt 12540 gtacttgcac tgttatccga tttacaggat ttgaaatggg ctagattccc taagagtgat 12600 ggaactggta ctatctatac agaactggaa ccaccttgta ggtttgttac agacacacct 12660 aaaggtccta aagtgaagta tttatacttt attaaaggat taaacaacct aaatagaggt 12720 atggtacttg gtagtttagc tgccacagta cgtctacaag ctggtaatgc aacagaagtg 12780 cctgccaatt caactgtatt atctttctgt gcttttgctg tagatgctgc taaagcttac 12840 aaagattatc tagctagtgg gggacaacca atcactaatt gtgttaagat gttgtgtaca 12900 cacactggta ctggtcaggc aataacagtt acaccggaag ccaatatgga tcaagaatcc 12960 tttggtggtg catcgtgttg tctgtactgc cgttgccaca tagatcatcc aaatcctaaa 13020 ggattttgtg acttaaaagg taagtatgta caaataccta caacttgtgc taatgaccct 13080 gtgggtttta cacttaaaaa cacagtctgt accgtctgcg gtatgtggaa aggttatggc 13140 tgtagttgtg atcaactccg cgaacccatg cttcagtcag ctgatgcaca atcgttttta 13200 aaccgggttt gcggtgtaag tgcagcccgt cttacaccgt gcggcacagg cactagtact 13260 gatgtcgtat acagggcttt tgacatctac aatgataaag tagctggttt tgctaaattc 13320 ctaaaaacta attgttgtcg cttccaagaa aaggacgaag atgacaattt aattgattct 13380 tactttgtag ttaagagaca cactttctct aactaccaac atgaagaaac aatttataat 13440 ttacttaagg attgtccagc tgttgctaaa catgacttct ttaagtttag aatagacggt 13500 gacatggtac cacatatatc acgtcaacgt cttactaaat acacaatggc agacctcgtc 13560 tatgctttaa ggcattttga tgaaggtaat tgtgacacat taaaagaaat acttgtcaca 13620 tacaattgtt gtgatgatga ttatttcaat aaaaaggact ggtatgattt tgtagaaaac 13680 ccagatatat tacgcgtata cgccaactta ggtgaacgtg tacgccaagc tttgttaaaa 13740 acagtacaat tctgtgatgc catgcgaaat gctggtattg ttggtgtact gacattagat 13800 aatcaagatc tcaatggtaa ctggtatgat ttcggtgatt tcatacaaac cacgccaggt 13860 agtggagttc ctgttgtaga ttcttattat tcattgttaa tgcctatatt aaccttgacc 13920 agggctttaa ctgcagagtc acatgttgac actgacttaa caaagcctta cattaagtgg 13980 gatttgttaa aatatgactt cacggaagag aggttaaaac tctttgaccg ttattttaaa 14040 tattgggatc agacatacca cccaaattgt gttaactgtt tggatgacag atgcattctg 14100 cattgtgcaa actttaatgt tttattctct acagtgttcc cacctacaag ttttggacca 14160 ctagtgagaa aaatatttgt tgatggtgtt ccatttgtag tttcaactgg ataccacttc 14220 agagagctag gtgttgtaca taatcaggat gtaaacttac atagctctag acttagtttt 14280 aaggaattac ttgtgtatgc tgctgaccct gctatgcacg ctgcttctgg taatctatta 14340 ctagataaac gcactacgtg cttttcagta gctgcactta ctaacaatgt tgcttttcaa 14400 actgtcaaac ccggtaattt taacaaagac ttctatgact ttgctgtgtc taagggtttc 14460 tttaaggaag gaagttctgt tgaattaaaa cacttcttct ttgctcagga tggtaatgct 14520 gctatcagcg attatgacta ctatcgttat aatctaccaa caatgtgtga tatcagacaa 14580 ctactatttg tagttgaagt tgttgataag tactttgatt gttacgatgg tggctgtatt 14640 aatgctaacc aagtcatcgt caacaaccta gacaaatcag ctggttttcc atttaataaa 14700 tggggtaagg ctagacttta ttatgattca atgagttatg aggatcaaga tgcacttttc 14760 gcatatacaa aacgtaatgt catccctact ataactcaaa tgaatcttaa gtatgccatt 14820 agtgcaaaga atagagctcg caccgtagct ggtgtctcta tctgtagtac tatgaccaat 14880 agacagtttc atcaaaaatt attgaaatca atagccgcca ctagaggagc tactgtagta 14940 attggaacaa gcaaattcta tggtggttgg cacaacatgt taaaaactgt ttatagtgat 15000 gtagaaaacc ctcaccttat gggttgggat tatcctaaat gtgatagagc catgcctaac 15060 atgcttagaa ttatggcctc acttgttctt gctcgcaaac atacaacgtg ttgtagcttg 15120 tcacaccgtt tctatagatt agctaatgag tgtgctcaag tattgagtga aatggtcatg 15180 tgtggcggtt cactatatgt taaaccaggt ggaacctcat caggagatgc cacaactgct 15240 tatgctaata gtgtttttaa catttgtcaa gctgtcacgg ccaatgttaa tgcactttta 15300 tctactgatg gtaacaaaat tgccgataag tatgtccgca atttacaaca cagactttat 15360 gagtgtctct atagaaatag agatgttgac acagactttg tgaatgagtt ttacgcatat 15420 ttgcgtaaac atttctcaat gatgatactc tctgacgatg ctgttgtgtg tttcaatagc 15480 acttatgcat ctcaaggtct agtggctagc ataaagaact ttaagtcagt tctttattat 15540 caaaacaatg tttttatgtc tgaagcaaaa tgttggactg agactgacct tactaaagga 15600 cctcatgaat tttgctctca acatacaatg ctagttaaac agggtgatga ttatgtgtac 15660 cttccttacc cagatccatc aagaatccta ggggccggct gttttgtaga tgatatcgta 15720 aaaacagatg gtacacttat gattgaacgg ttcgtgtctt tagctataga tgcttaccca 15780 cttactaaac atcctaatca ggagtatgct gatgtctttc atttgtactt acaatacata 15840 agaaagctac atgatgagtt aacaggacac atgttagaca tgtattctgt tatgcttact 15900 aatgataaca cttcaaggta ttgggaacct gagttttatg aggctatgta cacaccgcat 15960 acagtcttac aggctgttgg ggcttgtgtt ctttgcaatt cacagacttc attaagatgt 16020 ggtgcttgca tacgtagacc attcttatgt tgtaaatgct gttacgacca tgtcatatca 16080 acatcacata aattagtctt gtctgttaat ccgtatgttt gcaatgctcc aggttgtgat 16140 gtcacagatg tgactcaact ttacttagga ggtatgagct attattgtaa atcacataaa 16200 ccacccatta gttttccatt gtgtgctaat ggacaagttt ttggtttata taaaaataca 16260 tgtgttggta gcgataatgt tactgacttt aatgcaattg caacatgtga ctggacaaat 16320 gctggtgatt acattttagc taacacctgt actgaaagac tcaagctttt tgcagcagaa 16380 acgctcaaag ctactgagga gacatttaaa ctgtcttatg gtattgctac tgtacgtgaa 16440 gtgctgtctg acagagaatt acatctttca tgggaagttg gtaaacctag accaccactt 16500 aaccgaaatt atgtctttac tggttatcgt gtaactaaaa acagtaaagt acaaatagga 16560 gagtacacct ttgaaaaagg tgactatggt gatgctgttg tttaccgagg tacaacaact 16620 tacaaattaa atgttggtga ttattttgtg ctgacatcac atacagtaat gccattaagt 16680 gcacctacac tagtgccaca agagcactat gttagaatta ctggcttata cccaacactc 16740 aatatctcag atgagttttc tagcaatgtt gcaaattatc aaaaggttgg tatgcaaaag 16800 tattctacac tccagggacc acctggtact ggtaagagtc attttgctat tggcctagct 16860 ctctactacc cttctgctcg catagtgtat acagcttgct ctcatgccgc tgttgatgca 16920 ctatgtgaga aggcattaaa atatttgcct atagataaat gtagtagaat tatacctgca 16980 cgtgctcgtg tagagtgttt tgataaattc aaagtgaatt caacattaga acagtatgtc 17040 ttttgtactg taaatgcatt gcctgagacg acagcagata tagttgtctt tgatgaaatt 17100 tcaatggcca caaattatga tttgagtgtt gtcaatgcca gattacgtgc taagcactat 17160 gtgtacattg gcgaccctgc tcaattacct gcaccacgca cattgctaac taagggcaca 17220 ctagaaccag aatatttcaa ttcagtgtgt agacttatga aaactatagg tccagacatg 17280 ttcctcggaa cttgtcggcg ttgtcctgct gaaattgttg acactgtgag tgctttggtt 17340 tatgataata agcttaaagc acataaagac aaatcagctc aatgctttaa aatgttttat 17400 aagggtgtta tcacgcatga tgtttcatct gcaattaaca ggccacaaat aggcgtggta 17460 agagaattcc ttacacgtaa ccctgcttgg agaaaagctg tctttatttc accttataat 17520 tcacagaatg ctgtagcctc aaagattttg ggactaccaa ctcaaactgt tgattcatca 17580 cagggctcag aatatgacta tgtcatattc actcaaacca ctgaaacagc tcactcttgt 17640 aatgtaaaca gatttaatgt tgctattacc agagcaaaag taggcatact ttgcataatg 17700 tctgatagag acctttatga caagttgcaa tttacaagtc ttgaaattcc acgtaggaat 17760 gtggcaactt tacaagctga aaatgtaaca ggactcttta aagattgtag taaggtaatc 17820 actgggttac atcctacaca ggcacctaca cacctcagtg ttgacactaa attcaaaact 17880 gaaggtttat gtgttgacat acctggcata cctaaggaca tgacctatag aagactcatc 17940 tctatgatgg gttttaaaat gaattatcaa gttaatggtt accctaacat gtttatcacc 18000 cgcgaagaag ctataagaca tgtacgtgca tggattggct tcgatgtcga ggggtgtcat 18060 gctactagag aagctgttgg taccaattta cctttacagc taggtttttc tacaggtgtt 18120 aacctagttg ctgtacctac aggttatgtt gatacaccta ataatacaga tttttccaga 18180 gttagtgcta aaccaccgcc tggagatcaa tttaaacacc tcataccact tatgtacaaa 18240 ggacttcctt ggaatgtagt gcgtataaag attgtacaaa tgttaagtga cacacttaaa 18300 aatctctctg acagagtcgt atttgtctta tgggcacatg gctttgagtt gacatctatg 18360 aagtattttg tgaaaatagg acctgagcgc acctgttgtc tatgtgatag acgtgccaca 18420 tgcttttcca ctgcttcaga cacttatgcc tgttggcatc attctattgg atttgattac 18480 gtctataatc cgtttatgat tgatgttcaa caatggggtt ttacaggtaa cctacaaagc 18540 aaccatgatc tgtattgtca agtccatggt aatgcacatg tagctagttg tgatgcaatc 18600 atgactaggt gtctagctgt ccacgagtgc tttgttaagc gtgttgactg gactattgaa 18660 tatcctataa ttggtgatga actgaagatt aatgcggctt gtagaaaggt tcaacacatg 18720 gttgttaaag ctgcattatt agcagacaaa ttcccagttc ttcacgacat tggtaaccct 18780 aaagctatta agtgtgtacc tcaagctgat gtagaatgga agttctatga tgcacagcct 18840 tgtagtgaca aagcttataa aatagaagaa ttattctatt cttatgccac acattctgac 18900 aaattcacag atggtgtatg cctattttgg aattgcaatg tcgatagata tcctgctaat 18960 tccattgttt gtagatttga cactagagtg ctatctaacc ttaacttgcc tggttgtgat 19020 ggtggcagtt tgtatgtaaa taaacatgca ttccacacac cagcttttga taaaagtgct 19080 tttgttaatt taaaacaatt accatttttc tattactctg acagtccatg tgagtctcat 19140 ggaaaacaag tagtgtcaga tatagattat gtaccactaa agtctgctac gtgtataaca 19200 cgttgcaatt taggtggtgc tgtctgtaga catcatgcta atgagtacag attgtatctc 19260 gatgcttata acatgatgat ctcagctggc tttagcttgt gggtttacaa acaatttgat 19320 acttataacc tctggaacac ttttacaaga cttcagagtt tagaaaatgt ggcttttaat 19380 gttgtaaata agggacactt tgatggacaa cagggtgaag taccagtttc tatcattaat 19440 aacactgttt acacaaaagt tgatggtgtt gatgtagaat tgtttgaaaa taaaacaaca 19500 ttacctgtta atgtagcatt tgagctttgg gctaagcgca acattaaacc agtaccagag 19560 gtgaaaatac tcaataattt gggtgtggac attgctgcta atactgtgat ctgggactac 19620 aaaagagatg ctccagcaca tatatctact attggtgttt gttctatgac tgacatagcc 19680 aagaaaccaa ctgaaacgat ttgtgcacca ctcactgtct tttttgatgg tagagttgat 19740 ggtcaagtag acttatttag aaatgcccgt aatggtgttc ttattacaga aggtagtgtt 19800 aaaggtttac aaccatctgt aggtcccaaa caagctagtc ttaatggagt cacattaatt 19860 ggagaagccg taaaaacaca gttcaattat tataagaaag ttgatggtgt tgtccaacaa 19920 ttacctgaaa cttactttac tcagagtaga aatttacaag aatttaaacc caggagtcaa 19980 atggaaattg atttcttaga attagctatg gatgaattca ttgaacggta taaattagaa 20040 ggctatgcct tcgaacatat cgtttatgga gattttagtc atagtcagtt aggtggttta 20100 catctactga ttggactagc taaacgtttt aaggaatcac cttttgaatt agaagatttt 20160 attcctatgg acagtacagt taaaaactat ttcataacag atgcgcaaac aggttcatct 20220 aagtgtgtgt gttctgttat tgatttatta cttgatgatt ttgttgaaat aataaaatcc 20280 caagatttat ctgtagtttc taaggttgtc aaagtgacta ttgactatac agaaatttca 20340 tttatgcttt ggtgtaaaga tggccatgta gaaacatttt acccaaaatt acaatctagt 20400 caagcgtggc aaccgggtgt tgctatgcct aatctttaca aaatgcaaag aatgctatta 20460 gaaaagtgtg accttcaaaa ttatggtgat agtgcaacat tacctaaagg cataatgatg 20520 aatgtcgcaa aatatactca actgtgtcaa tatttaaaca cattaacatt agctgtaccc 20580 tataatatga gagttataca ttttggtgct ggttctgata aaggagttgc accaggtaca 20640 gctgttttaa gacagtggtt gcctacgggt acgctgcttg tcgattcaga tcttaatgac 20700 tttgtctctg atgcagattc aactttgatt ggtgattgtg caactgtaca tacagctaat 20760 aaatgggatc tcattattag tgatatgtac gaccctaaga ctaaaaatgt tacaaaagaa 20820 aatgactcta aagagggttt tttcacttac atttgtgggt ttatacaaca aaagctagct 20880 cttggaggtt ccgtggctat aaagataaca gaacattctt ggaatgctga tctttataag 20940 ctcatgggac acttcgcatg gtggacagcc tttgttacta atgtgaatgc gtcatcatct 21000 gaagcatttt taattggatg taattatctt ggcaaaccac gcgaacaaat agatggttat 21060 gtcatgcatg caaattacat attttggagg aatacaaatc caattcagtt gtcttcctat 21120 tctttatttg acatgagtaa atttcccctt aaattaaggg gtactgctgt tatgtcttta 21180 aaagaaggtc aaatcaatga tatgatttta tctcttctta gtaaaggtag acttataatt 21240 agagaaaaca acagagttgt tatttctagt gatgttcttg ttaacaacta a 21291 <210> 502 <211> 13218 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 502 atggagagcc ttgtccctgg tttcaacgag aaaacacacg tccaactcag tttgcctgtt 60 ttacaggttc gcgacgtgct cgtacgtggc tttggagact ccgtggagga ggtcttatca 120 gaggcacgtc aacatcttaa agatggcact tgtggcttag tagaagttga aaaaggcgtt 180 ttgcctcaac ttgaacagcc ctatgtgttc atcaaacgtt cggatgctcg aactgcacct 240 catggtcatg ttatggttga gctggtagca gaactcgaag gcattcagta cggtcgtagt 300 ggtgagacac ttggtgtcct tgtccctcat gtgggcgaaa taccagtggc ttaccgcaag 360 gttcttcttc gtaagaacgg taataaagga gctggtggcc atagttacgg cgccgatcta 420 aagtcatttg acttaggcga cgagcttggc actgatcctt atgaagattt tcaagaaaac 480 tggaacacta aacatagcag tggtgttacc cgtgaactca tgcgtgagct taacggaggg 540 gcatacactc gctatgtcga taacaacttc tgtggccctg atggctaccc tcttgagtgc 600 attaaagacc ttctagcacg tgctggtaaa gcttcatgca ctttgtccga acaactggac 660 tttattgaca ctaagagggg tgtatactgc tgccgtgaac atgagcatga aattgcttgg 720 tacacggaac gttctgaaaa gagctatgaa ttgcagacac cttttgaaat taaattggca 780 aagaaatttg acaccttcaa tggggaatgt ccaaattttg tatttccctt aaattccata 840 atcaagacta ttcaaccaag ggttgaaaag aaaaagcttg atggctttat gggtagaatt 900 cgatctgtct atccagttgc gtcaccaaat gaatgcaacc aaatgtgcct ttcaactctc 960 atgaagtgtg atcattgtgg tgaaacttca tggcagacgg gcgattttgt taaagccact 1020 tgcgaatttt gtggcactga gaatttgact aaagaaggtg ccactacttg tggttactta 1080 ccccaaaatg ctgttgttaa aatttattgt ccagcatgtc acaattcaga agtaggacct 1140 gagcatagtc ttgccgaata ccataatgaa tctggcttga aaaccattct tcgtaagggt 1200 ggtcgcacta ttgcctttgg aggctgtgtg ttctcttatg ttggttgcca taacaagtgt 1260 gcctattggg ttccacgtgc tagcgctaac ataggttgta accatacagg tgttgttgga 1320 gaaggttccg aaggtcttaa tgacaacctt cttgaaatac tccaaaaaga gaaagtcaac 1380 atcaatattg ttggtgactt taaacttaat gaagagatcg ccattatttt ggcatctttt 1440 tctgcttcca caagtgcttt tgtggaaact gtgaaaggtt tggattataa agcattcaaa 1500 caaattgttg aatcctgtgg taattttaaa gttacaaaag gaaaagctaa aaaaggtgcc 1560 tggaatattg gtgaacagaa atcaatactg agtcctcttt atgcatttgc atcagaggct 1620 gctcgtgttg tacgatcaat tttctcccgc actcttgaaa ctgctcaaaa ttctgtgcgt 1680 gttttacaga aggccgctat aacaatacta gatggaattt cacagtattc actgagactc 1740 attgatgcta tgatgttcac atctgatttg gctactaaca atctagttgt aatggcctac 1800 attacaggtg gtgttgttca gttgacttcg cagtggctaa ctaacatctt tggcactgtt 1860 tatgaaaaac tcaaacccgt ccttgattgg cttgaagaga agtttaagga aggtgtagag 1920 tttcttagag acggttggga aattgttaaa tttatctcaa cctgtgcttg tgaaattgtc 1980 ggtggacaaa ttgtcacctg tgcaaaggaa attaaggaga gtgttcagac attctttaag 2040 cttgtaaata aatttttggc tttgtgtgct gactctatca ttattggtgg agctaaactt 2100 aaagccttga atttaggtga aacatttgtc acgcactcaa agggattgta cagaaagtgt 2160 gttaaatcca gagaagaaac tggcctactc atgcctctaa aagccccaaa agaaattatc 2220 ttcttagagg gagaaacact tcccacagaa gtgttaacag aggaagttgt cttgaaaact 2280 ggtgatttac aaccattaga acaacctact agtgaagctg ttgaagctcc attggttggt 2340 acaccagttt gtattaacgg gcttatgttg ctcgaaatca aagacacaga aaagtactgt 2400 gcccttgcac ctaatatgat ggtaacaaac aataccttca cactcaaagg cggtgcacca 2460 acaaaggtta cttttggtga tgacactgtg atagaagtgc aaggttacaa gagtgtgaat 2520 atcacttttg aacttgatga aaggattgat aaagtactta atgagaagtg ctctgcctat 2580 acagttgaac tcggtacaga agtaaatgag ttcgcctgtg ttgtggcaga tgctgtcata 2640 aaaactttgc aaccagtatc tgaattactt acaccactgg gcattgattt agatgagtgg 2700 agtatggcta catactactt atttgatgag tctggtgagt ttaaattggc ttcacatatg 2760 tattgttctt tctaccctcc agatgaggat gaagaagaag gtgattgtga agaagaagag 2820 tttgagccat caactcaata tgagtatggt actgaagatg attaccaagg taaacctttg 2880 gaatttggtg ccacttctgc tgctcttcaa cctgaagaag agcaagaaga agattggtta 2940 gatgatgata gtcaacaaac tgttggtcaa caagacggca gtgaggacaa tcagacaact 3000 actattcaaa caattgttga ggttcaacct caattagaga tggaacttac accagttgtt 3060 cagactattg aagtgaatag ttttagtggt tatttaaaac ttactgacaa tgtatacatt 3120 aaaaatgcag acattgtgga agaagctaaa aaggtaaaac caacagtggt tgttaatgca 3180 gccaatgttt accttaaaca tggaggaggt gttgcaggag ccttaaataa ggctactaac 3240 aatgccatgc aagttgaatc tgatgattac atagctacta atggaccact taaagtgggt 3300 ggtagttgtg ttttaagcgg acacaatctt gctaaacact gtcttcatgt tgtcggccca 3360 aatgttaaca aaggtgaaga cattcaactt cttaagagtg cttatgaaaa ttttaatcag 3420 cacgaagttc tacttgcacc attattatca gctggtattt ttggtgctga ccctatacat 3480 tctttaagag tttgtgtaga tactgttcgc acaaatgtct acttagctgt ctttgataaa 3540 aatctctatg acaaacttgt ttcaagcttt ttggaaatga agagtgaaaa gcaagttgaa 3600 caaaagatcg ctgagattcc taaagaggaa gttaagccat ttataactga aagtaaacct 3660 tcagttgaac agagaaaaca agatgataag aaaatcaaag cttgtgttga agaagttaca 3720 acaactctgg aagaaactaa gttcctcaca gaaaacttgt tactttatat tgacattaat 3780 ggcaatcttc atccagattc tgccactctt gttagtgaca ttgacatcac tttcttaaag 3840 aaagatgctc catatatagt gggtgatgtt gttcaagagg gtgttttaac tgctgtggtt 3900 atacctacta aaaaggctgg tggcactact gaaatgctag cgaaagcttt gagaaaagtg 3960 ccaacagaca attatataac cacttacccg ggtcagggtt taaatggtta cactgtagag 4020 gaggcaaaga cagtgcttaa aaagtgtaaa agtgcctttt acattctacc atctattatc 4080 tctaatgaga agcaagaaat tcttggaact gtttcttgga atttgcgaga aatgcttgca 4140 catgcagaag aaacacgcaa attaatgcct gtctgtgtgg aaactaaagc catagtttca 4200 actatacagc gtaaatataa gggtattaaa atacaagagg gtgtggttga ttatggtgct 4260 agattttact tttacaccag taaaacaact gtagcgtcac ttatcaacac acttaacgat 4320 ctaaatgaaa ctcttgttac aatgccactt ggctatgtaa cacatggctt aaatttggaa 4380 gaagctgctc ggtatatgag atctctcaaa gtgccagcta cagtttctgt ttcttcacct 4440 gatgctgtta cagcgtataa tggttatctt acttcttctt ctaaaacacc tgaagaacat 4500 tttattgaaa ccatctcact tgctggttcc tataaagatt ggtcctattc tggacaatct 4560 acacaactag gtatagaatt tcttaagaga ggtgataaaa gtgtatatta cactagtaat 4620 cctaccacat tccacctaga tggtgaagtt atcacctttg acaatcttaa gacacttctt 4680 tctttgagag aagtgaggac tattaaggtg tttacaacag tagacaacat taacctccac 4740 acgcaagttg tggacatgtc aatgacatat ggacaacagt ttggtccaac ttatttggat 4800 ggagctgatg ttactaaaat aaaacctcat aattcacatg aaggtaaaac attttatgtt 4860 ttacctaatg atgacactct acgtgttgag gcttttgagt actaccacac aactgatcct 4920 agttttctgg gtaggtacat gtcagcatta aatcacacta aaaagtggaa atacccacaa 4980 gttaatggtt taacttctat taaatgggca gataacaact gttatcttgc cactgcattg 5040 ttaacactcc aacaaataga gttgaagttt aatccacctg ctctacaaga tgcttattac 5100 agagcaaggg ctggtgaagc tgctaacttt tgtgcactta tcttagccta ctgtaataag 5160 acagtaggtg agttaggtga tgttagagaa acaatgagtt acttgtttca acatgccaat 5220 ttagattctt gcaaaagagt cttgaacgtg gtgtgtaaaa cttgtggaca acagcagaca 5280 acccttaagg gtgtagaagc tgttatgtac atgggcacac tttcttatga acaatttaag 5340 aaaggtgttc agataccttg tacgtgtggt aaacaagcta caaaatatct agtacaacag 5400 gagtcacctt ttgttatgat gtcagcacca cctgctcagt atgaacttaa gcatggtaca 5460 tttacttgtg ctagtgagta cactggtaat taccagtgtg gtcactataa acatataact 5520 tctaaagaaa ctttgtattg catagacggt gctttactta caaagtcctc agaatacaaa 5580 ggtcctatta cggatgtttt ctacaaagaa aacagttaca caacaaccat aaaaccagtt 5640 acttataaat tggatggtgt tgtttgtaca gaaattgacc ctaagttgga caattattat 5700 aagaaagaca attcttattt cacagagcaa ccaattgatc ttgtaccaaa ccaaccatat 5760 ccaaacgcaa gcttcgataa ttttaagttt gtatgtgata atatcaaatt tgctgatgat 5820 ttaaaccagt taactggtta taagaaacct gcttcaagag agcttaaagt tacatttttc 5880 cctgacttaa atggtgatgt ggtggctatt gattataaac actacacacc ctcttttaag 5940 aaaggagcta aattgttaca taaacctatt gtttggcatg ttaacaatgc aactaataaa 6000 gccacgtata aaccaaatac ctggtgtata cgttgtcttt ggagcacaaa accagttgaa 6060 acatcaaatt cgtttgatgt actgaagtca gaggacgcgc agggaatgga taatcttgcc 6120 tgcgaagatc taaaaccagt ctctgaagaa gtagtggaaa atcctaccat acagaaagac 6180 gttcttgagt gtaatgtgaa aactaccgaa gttgtaggag acattatact taaaccagca 6240 aataatagtt taaaaattac agaagaggtt ggccacacag atctaatggc tgcttatgta 6300 gacaattcta gtcttactat taagaaacct aatgaattat ctagagtatt aggtttgaaa 6360 acccttgcta ctcatggttt agctgctgtt aatagtgtcc cttgggatac tatagctaat 6420 tatgctaagc cttttcttaa caaagttgtt agtacaacta ctaacatagt tacacggtgt 6480 ttaaaccgtg tttgtactaa ttatatgcct tatttcttta ctttattgct acaattgtgt 6540 acttttacta gaagtacaaa ttctagaatt aaagcatcta tgccgactac tatagcaaag 6600 aatactgtta agagtgtcgg taaattttgt ctagaggctt catttaatta tttgaagtca 6660 cctaattttt ctaaactgat aaatattata atttggtttt tactattaag tgtttgccta 6720 ggttctttaa tctactcaac cgctgcttta ggtgttttaa tgtctaattt aggcatgcct 6780 tcttactgta ctggttacag agaaggctat ttgaactcta ctaatgtcac tattgcaacc 6840 tactgtactg gttctatacc ttgtagtgtt tgtcttagtg gtttagattc tttagacacc 6900 tatccttctt tagaaactat acaaattacc atttcatctt ttaaatggga tttaactgct 6960 tttggcttag ttgcagagtg gtttttggca tatattcttt tcactaggtt tttctatgta 7020 cttggattgg ctgcaatcat gcaattgttt ttcagctatt ttgcagtaca ttttattagt 7080 aattcttggc ttatgtggtt aataattaat cttgtacaaa tggccccgat ttcagctatg 7140 gttagaatgt acatcttctt tgcatcattt tattatgtat ggaaaagtta tgtgcatgtt 7200 gtagacggtt gtaattcatc aacttgtatg atgtgttaca aacgtaatag agcaacaaga 7260 gtcgaatgta caactattgt taatggtgtt agaaggtcct tttatgtcta tgctaatgga 7320 ggtaaaggct tttgcaaact acacaattgg aattgtgtta attgtgatac attctgtgct 7380 ggtagtacat ttattagtga tgaagttgcg agagacttgt cactacagtt taaaagacca 7440 ataaatccta ctgaccagtc ttcttacatc gttgatagtg ttacagtgaa gaatggttcc 7500 atccatcttt actttgataa agctggtcaa aagacttatg aaagacattc tctctctcat 7560 tttgttaact tagacaacct gagagctaat aacactaaag gttcattgcc tattaatgtt 7620 atagtttttg atggtaaatc aaaatgtgaa gaatcatctg caaaatcagc gtctgtttac 7680 tacagtcagc ttatgtgtca acctatactg ttactagatc aggcattagt gtctgatgtt 7740 ggtgatagtg cggaagttgc agttaaaatg tttgatgctt acgttaatac gttttcatca 7800 acttttaacg taccaatgga aaaactcaaa acactagttg caactgcaga agctgaactt 7860 gcaaagaatg tgtccttaga caatgtctta tctactttta tttcagcagc tcggcaaggg 7920 tttgttgatt cagatgtaga aactaaagat gttgttgaat gtcttaaatt gtcacatcaa 7980 tctgacatag aagttactgg cgatagttgt aataactata tgctcaccta taacaaagtt 8040 gaaaacatga caccccgtga ccttggtgct tgtattgact gtagtgcgcg tcatattaat 8100 gcgcaggtag caaaaagtca caacattgct ttgatatgga acgttaaaga tttcatgtca 8160 ttgtctgaac aactacgaaa acaaatacgt agtgctgcta aaaagaataa cttacctttt 8220 aagttgacat gtgcaactac tagacaagtt gttaatgttg taacaacaaa gatagcactt 8280 aagggtggta aaattgttaa taattggttg aagcagttaa ttaaagttac acttgtgttc 8340 ctttttgttg ctgctatttt ctatttaata acacctgttc atgtcatgtc taaacatact 8400 gacttttcaa gtgaaatcat aggatacaag gctattgatg gtggtgtcac tcgtgacata 8460 gcatctacag atacttgttt tgctaacaaa catgctgatt ttgacacatg gtttagccag 8520 cgtggtggta gttatactaa tgacaaagct tgcccattga ttgctgcagt cataacaaga 8580 gaagtgggtt ttgtcgtgcc tggtttgcct ggcacgatat tacgcacaac taatggtgac 8640 tttttgcatt tcttacctag agtttttagt gcagttggta acatctgtta cacaccatca 8700 aaacttatag agtacactga ctttgcaaca tcagcttgtg ttttggctgc tgaatgtaca 8760 atttttaaag atgcttctgg taagccagta ccatattgtt atgataccaa tgtactagaa 8820 ggttctgttg cttatgaaag tttacgccct gacacacgtt atgtgctcat ggatggctct 8880 attattcaat ttcctaacac ctaccttgaa ggttctgtta gagtggtaac aacttttgat 8940 tctgagtact gtaggcacgg cacttgtgaa agatcagaag ctggtgtttg tgtatctact 9000 agtggtagat gggtacttaa caatgattat tacagatctt taccaggagt tttctgtggt 9060 gtagatgctg taaatttact tactaatatg tttacaccac taattcaacc tattggtgct 9120 ttggacatat cagcatctat agtagctggt ggtattgtag ctatcgtagt aacatgcctt 9180 gcctactatt ttatgaggtt tagaagagct tttggtgaat acagtcatgt agttgccttt 9240 aatactttac tattccttat gtcattcact gtactctgtt taacaccagt ttactcattc 9300 ttacctggtg tttattctgt tatttacttg tacttgacat tttatcttac taatgatgtt 9360 tcttttttag cacatattca gtggatggtt atgttcacac ctttagtacc tttctggata 9420 acaattgctt atatcatttg tatttccaca aagcatttct attggttctt tagtaattac 9480 ctaaagagac gtgtagtctt taatggtgtt tcctttagta cttttgaaga agctgcgctg 9540 tgcacctttt tgttaaataa agaaatgtat ctaaagttgc gtagtgatgt gctattacct 9600 cttacgcaat ataatagata cttagctctt tataataagt acaagtattt tagtggagca 9660 atggatacaa ctagctacag agaagctgct tgttgtcatc tcgcaaaggc tctcaatgac 9720 ttcagtaact caggttctga tgttctttac caaccaccac aaacctctat cacctcagct 9780 gttttgcaga gtggttttag aaaaatggca ttcccatctg gtaaagttga gggttgtatg 9840 gtacaagtaa cttgtggtac aactacactt aacggtcttt ggcttgatga cgtagtttac 9900 tgtccaagac atgtgatctg cacctctgaa gacatgctta accctaatta tgaagattta 9960 ctcattcgta agtctaatca taatttcttg gtacaggctg gtaatgttca actcagggtt 10020 attggacatt ctatgcaaaa ttgtgtactt aagcttaagg ttgatacagc caatcctaag 10080 acacctaagt ataagtttgt tcgcattcaa ccaggacaga ctttttcagt gttagcttgt 10140 tacaatggtt caccatctgg tgtttaccaa tgtgctatga ggcccaattt cactattaag 10200 ggttcattcc ttaatggttc atgtggtagt gttggtttta acatagatta tgactgtgtc 10260 tctttttgtt acatgcacca tatggaatta ccaactggag ttcatgctgg cacagactta 10320 gaaggtaact tttatggacc ttttgttgac aggcaaacag cacaagcagc tggtacggac 10380 acaactatta cagttaatgt tttagcttgg ttgtacgctg ctgttataaa tggagacagg 10440 tggtttctca atcgatttac cacaactctt aatgacttta accttgtggc tatgaagtac 10500 aattatgaac ctctaacaca agaccatgtt gacatactag gacctctttc tgctcaaact 10560 ggaattgccg ttttagatat gtgtgcttca ttaaaagaat tactgcaaaa tggtatgaat 10620 ggacgtacca tattgggtag tgctttatta gaagatgaat ttacaccttt tgatgttgtt 10680 agacaatgct caggtgttac tttccaaagt gcagtgaaaa gaacaatcaa gggtacacac 10740 cactggttgt tactcacaat tttgacttca cttttagttt tagtccagag tactcaatgg 10800 tctttgttct tttttttgta tgaaaatgcc tttttacctt ttgctatggg tattattgct 10860 atgtctgctt ttgcaatgat gtttgtcaaa cataagcatg catttctctg tttgtttttg 10920 ttaccttctc ttgccactgt agcttatttt aatatggtct atatgcctgc tagttgggtg 10980 atgcgtatta tgacatggtt ggatatggtt gatactagtt tgtctggttt taagctaaaa 11040 gactgtgtta tgtatgcatc agctgtagtg ttactaatcc ttatgacagc aagaactgtg 11100 tatgatgatg gtgctaggag agtgtggaca cttatgaatg tcttgacact cgtttataaa 11160 gtttattatg gtaatgcttt agatcaagcc atttccatgt gggctcttat aatctctgtt 11220 acttctaact actcaggtgt agttacaact gtcatgtttt tggccagagg tattgttttt 11280 atgtgtgttg agtattgccc tattttcttc ataactggta atacacttca gtgtataatg 11340 ctagtttatt gtttcttagg ctatttttgt acttgttact ttggcctctt ttgtttactc 11400 aaccgctact ttagactgac tcttggtgtt tatgattact tagtttctac acaggagttt 11460 agatatatga attcacaggg actactccca cccaagaata gcatagatgc cttcaaactc 11520 aacattaaat tgttgggtgt tggtggcaaa ccttgtatca aagtagccac tgtacagtct 11580 aaaatgtcag atgtaaagtg cacatcagta gtcttactct cagttttgca acaactcaga 11640 gtagaatcat catctaaatt gtgggctcaa tgtgtccagt tacacaatga cattctctta 11700 gctaaagata ctactgaagc ctttgaaaaa atggtttcac tactttctgt tttgctttcc 11760 atgcagggtg ctgtagacat aaacaagctt tgtgaagaaa tgctggacaa cagggcaacc 11820 ttacaagcta tagcctcaga gtttagttcc cttccatcat atgcagcttt tgctactgct 11880 caagaagctt atgagcaggc tgttgctaat ggtgattctg aagttgttct taaaaagttg 11940 aagaagtctt tgaatgtggc taaatctgaa tttgaccgtg atgcagccat gcaacgtaag 12000 ttggaaaaga tggctgatca agctatgacc caaatgtata aacaggctag atctgaggac 12060 aagagggcaa aagttactag tgctatgcag acaatgcttt tcactatgct tagaaagttg 12120 gataatgatg cactcaacaa cattatcaac aatgcaagag atggttgtgt tcccttgaac 12180 ataatacctc ttacaacagc agccaaacta atggttgtca taccagacta taacacatat 12240 aaaaatacgt gtgatggtac aacatttact tatgcatcag cattgtggga aatccaacag 12300 gttgtagatg cagatagtaa aattgttcaa cttagtgaaa ttagtatgga caattcacct 12360 aatttagcat ggcctcttat tgtaacagct ttaagggcca attctgctgt caaattacag 12420 aataatgagc ttagtcctgt tgcactacga cagatgtctt gtgctgccgg tactacacaa 12480 actgcttgca ctgatgacaa tgcgttagct tactacaaca caacaaaggg aggtaggttt 12540 gtacttgcac tgttatccga tttacaggat ttgaaatggg ctagattccc taagagtgat 12600 ggaactggta ctatctatac agaactggaa ccaccttgta ggtttgttac agacacacct 12660 aaaggtccta aagtgaagta tttatacttt attaaaggat taaacaacct aaatagaggt 12720 atggtacttg gtagtttagc tgccacagta cgtctacaag ctggtaatgc aacagaagtg 12780 cctgccaatt caactgtatt atctttctgt gcttttgctg tagatgctgc taaagcttac 12840 aaagattatc tagctagtgg gggacaacca atcactaatt gtgttaagat gttgtgtaca 12900 cacactggta ctggtcaggc aataacagtt acaccggaag ccaatatgga tcaagaatcc 12960 tttggtggtg catcgtgttg tctgtactgc cgttgccaca tagatcatcc aaatcctaaa 13020 ggattttgtg acttaaaagg taagtatgta caaataccta caacttgtgc taatgaccct 13080 gtgggtttta cacttaaaaa cacagtctgt accgtctgcg gtatgtggaa aggttatggc 13140 tgtagttgtg atcaactccg cgaacccatg cttcagtcag ctgatgcaca atcgttttta 13200 aacgggtttg cggtgtaa 13218 <210> 503 <211> 3822 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 503 atgtttgttt ttcttgtttt attgccacta gtctctagtc agtgtgttaa tcttacaacc 60 agaactcaat taccccctgc atacactaat tctttcacac gtggtgttta ttaccctgac 120 aaagttttca gatcctcagt tttacattca actcaggact tgttcttacc tttcttttcc 180 aatgttactt ggttccatgc tatacatgtc tctgggacca atggtactaa gaggtttgat 240 aaccctgtcc taccatttaa tgatggtgtt tattttgctt ccactgagaa gtctaacata 300 ataagaggct ggatttttgg tactacttta gattcgaaga cccagtccct acttattgtt 360 aataacgcta ctaatgttgt tattaaagtc tgtgaatttc aattttgtaa tgatccattt 420 ttgggtgttt attaccacaa aaacaacaaa agttggatgg aaagtgagtt cagagtttat 480 tctagtgcga ataattgcac ttttgaatat gtctctcagc cttttcttat ggaccttgaa 540 ggaaaacagg gtaatttcaa aaatcttagg gaatttgtgt ttaagaatat tgatggttat 600 tttaaaatat attctaagca cacgcctatt aatttagtgc gtgatctccc tcagggtttt 660 tcggctttag aaccattggt agatttgcca ataggtatta acatcactag gtttcaaact 720 ttacttgctt tacatagaag ttatttgact cctggtgatt cttcttcagg ttggacagct 780 ggtgctgcag cttattatgt gggttatctt caacctagga cttttctatt aaaatataat 840 gaaaatggaa ccattacaga tgctgtagac tgtgcacttg accctctctc agaaacaaag 900 tgtacgttga aatccttcac tgtagaaaaa ggaatctatc aaacttctaa ctttagagtc 960 caaccaacag aatctattgt tagatttcct aatattacaa acttgtgccc ttttggtgaa 1020 gtttttaacg ccaccagatt tgcatctgtt tatgcttgga acaggaagag aatcagcaac 1080 tgtgttgctg attattctgt cctatataat tccgcatcat tttccacttt taagtgttat 1140 ggagtgtctc ctactaaatt aaatgatctc tgctttacta atgtctatgc agattcattt 1200 gtaattagag gtgatgaagt cagacaaatc gctccagggc aaactggaaa gattgctgat 1260 tataattata aattaccaga tgattttaca ggctgcgtta tagcttggaa ttctaacaat 1320 cttgattcta aggttggtgg taattataat tacctgtata gattgtttag gaagtctaat 1380 ctcaaacctt ttgagagaga tatttcaact gaaatctatc aggccggtag cacaccttgt 1440 aatggtgttg aaggttttaa ttgttacttt cctttacaat catatggttt ccaacccact 1500 aatggtgttg gttaccaacc atacagagta gtagtacttt cttttgaact tctacatgca 1560 ccagcaactg tttgtggacc taaaaagtct actaatttgg ttaaaaacaa atgtgtcaat 1620 ttcaacttca atggtttaac aggcacaggt gttcttactg agtctaacaa aaagtttctg 1680 cctttccaac aatttggcag agacattgct gacactactg atgctgtccg tgatccacag 1740 acacttgaga ttcttgacat tacaccatgt tcttttggtg gtgtcagtgt tataacacca 1800 ggaacaaata cttctaacca ggttgctgtt ctttatcagg atgttaactg cacagaagtc 1860 cctgttgcta ttcatgcaga tcaacttact cctacttggc gtgtttattc tacaggttct 1920 aatgtttttc aaacacgtgc aggctgttta ataggggctg aacatgtcaa caactcatat 1980 gagtgtgaca tacccattgg tgcaggtata tgcgctagtt atcagactca gactaattct 2040 cctcggcggg cacgtagtgt agctagtcaa tccatcattg cctacactat gtcacttggt 2100 gcagaaaatt cagttgctta ctctaataac tctattgcca tacccacaaa ttttactatt 2160 agtgttacca cagaaattct accagtgtct atgaccaaga catcagtaga ttgtacaatg 2220 tacatttgtg gtgattcaac tgaatgcagc aatcttttgt tgcaatatgg cagtttttgt 2280 acacaattaa accgtgcttt aactggaata gctgttgaac aagacaaaaa cacccaagaa 2340 gtttttgcac aagtcaaaca aatttacaaa acaccaccaa ttaaagattt tggtggtttt 2400 aatttttcac aaatattacc agatccatca aaaccaagca agaggtcatt tattgaagat 2460 ctacttttca acaaagtgac acttgcagat gctggcttca tcaaacaata tggtgattgc 2520 cttggtgata ttgctgctag agacctcatt tgtgcacaaa agtttaacgg ccttactgtt 2580 ttgccacctt tgctcacaga tgaaatgatt gctcaataca cttctgcact gttagcgggt 2640 acaatcactt ctggttggac ctttggtgca ggtgctgcat tacaaatacc atttgctatg 2700 caaatggctt ataggtttaa tggtattgga gttacacaga atgttctcta tgagaaccaa 2760 aaattgattg ccaaccaatt taatagtgct attggcaaaa ttcaagactc actttcttcc 2820 acagcaagtg cacttggaaa acttcaagat gtggtcaacc aaaatgcaca agctttaaac 2880 acgcttgtta aacaacttag ctccaatttt ggtgcaattt caagtgtttt aaatgatatc 2940 ctttcacgtc ttgacaaagt tgaggctgaa gtgcaaattg ataggttgat cacaggcaga 3000 cttcaaagtt tgcagacata tgtgactcaa caattaatta gagctgcaga aatcagagct 3060 tctgctaatc ttgctgctac taaaatgtca gagtgtgtac ttggacaatc aaaaagagtt 3120 gatttttgtg gaaagggcta tcatcttatg tccttccctc agtcagcacc tcatggtgta 3180 gtcttcttgc atgtgactta tgtccctgca caagaaaaga acttcacaac tgctcctgcc 3240 atttgtcatg atggaaaagc acactttcct cgtgaaggtg tctttgtttc aaatggcaca 3300 cactggtttg taacacaaag gaatttttat gaaccacaaa tcattactac agacaacaca 3360 tttgtgtctg gtaactgtga tgttgtaata ggaattgtca acaacacagt ttatgatcct 3420 ttgcaacctg aattagactc attcaaggag gagttagata aatattttaa gaatcataca 3480 tcaccagatg ttgatttagg tgacatctct ggcattaatg cttcagttgt aaacattcaa 3540 aaagaaattg accgcctcaa tgaggttgcc aagaatttaa atgaatctct catcgatctc 3600 caagaacttg gaaagtatga gcagtatata aaatggccat ggtacatttg gctaggtttt 3660 atagctggct tgattgccat agtaatggtg acaattatgc tttgctgtat gaccagttgc 3720 tgtagttgtc tcaagggctg ttgttcttgt ggatcctgct gcaaatttga tgaagacgac 3780 tctgagccag tgctcaaagg agtcaaatta cattacacat aa 3822 <210> 504 <211> 828 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 504 atggatttgt ttatgagaat cttcacaatt ggaactgtaa ctttgaagca aggtgaaatc 60 aaggatgcta ctccttcaga ttttgttcgc gctactgcaa cgataccgat acaagcctca 120 ctccctttcg gatggcttat tgttggcgtt gcacttcttg ctgtttttca gagcgcttcc 180 aaaatcataa ccctcaaaaa gagatggcaa ctagcactct ccaagggtgt tcactttgtt 240 tgcaacttgc tgttgttgtt tgtaacagtt tactcacacc ttttgctcgt tgctgctggc 300 cttgaagccc cttttctcta tctttatgct ttagtctact tcttgcagag tataaacttt 360 gtaagaataa taatgaggct ttggctttgc tggaaatgcc gttccaaaaa cccattactt 420 tatgatgcca actattttct ttgctggcat actaattgtt acgactattg tataccttac 480 aatagtgtaa cttcttcaat tgtcattact tcaggtgatg gcacaacaag tcctatttct 540 gaacatgact accagattgg tggttatact gaaaaatggg aatctggagt aaaagactgt 600 gttgtattac acagttactt cacttcagac tattaccagc tgtactcaac tcaattgagt 660 acagacactg gtgttgaaca tgttaccttc ttcatctaca ataaaattgt tgatgagcct 720 gaagaacatg tccaaattca cacaatcgac ggttcatccg gagttgttaa tccagtaatg 780 gaaccaattt atgatgaacc gacgacgact actagcgtgc ctttgtaa 828 <210> 505 <211> 228 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 505 atgtactcat tcgtttcgga agagacaggt acgttaatag ttaatagcgt acttcttttt 60 cttgctttcg tggtattctt gctagttaca ctagccatcc ttactgcgct tcgattgtgt 120 gcgtactgct gcaatattgt taacgtgagt cttgtaaaac cttcttttta cgtttactct 180 cgtgttaaaa atctgaattc ttctagagtt cctgatcttc tggtctaa 228 <210> 506 <211> 669 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 506 atggcagatt ccaacggtac tattaccgtt gaagagctta aaaagctcct tgaacaatgg 60 aacctagtaa taggtttcct attccttaca tggatttgtc ttctacaatt tgcctatgcc 120 aacaggaata ggtttttgta tataattaag ttaattttcc tctggctgtt atggccagta 180 actttagctt gttttgtgct tgctgctgtt tacagaataa attggatcac cggtggaatt 240 gctatcgcaa tggcttgtct tgtaggcttg atgtggctca gctacttcat tgcttctttc 300 agactgtttg cgcgtacgcg ttccatgtgg tcattcaatc cagaaactaa cattcttctc 360 aacgtgccac tccatggcac tattctgacc agaccgcttc tagaaagtga actcgtaatc 420 ggagctgtga tccttcgtgg acatcttcgt attgctggac accatctagg acgctgtgac 480 atcaaggacc tgcctaaaga aatcactgtt gctacatcac gaacgctttc ttattacaaa 540 ttgggagctt cgcagcgtgt agcaggtgac tcaggttttg ctgcatacag tcgctacagg 600 attggcaact ataaattaaa cacagaccat tccagtagca gtgacaatat tgctttgctt 660 gtacagtaa 669 <210> 507 <211> 186 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 507 atgtttcatc tcgttgactt tcaggttact atagcagaga tattactaat tattatgagg 60 acttttaaag tttccatttg gaatcttgat tacatcataa acctcataat taaaaattta 120 tctaagtcac taactgagaa taaatattct caattagatg aagagcaacc aatggagatt 180 gattaa 186 <210> 508 <211> 366 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 508 atgaaaatta ttcttttctt ggcactgata acactcgcta cttgtgagct ttatcactac 60 caagagtgtg ttagaggtac aacagtactt ttaaaagaac cttgctcttc tggaacatac 120 gagggcaatt caccatttca tcctctagct gataacaaat ttgcactgac ttgctttagc 180 actcaatttg cttttgcttg tcctgacggc gtaaaacacg tctatcagtt acgtgccaga 240 tcagtttcac ctaaactgtt catcagacaa gaggaagttc aagaacttta ctctccaatt 300 tttcttattg ttgcggcaat agtgtttata acactttgct tcacactcaa aagaaagaca 360 gaatga 366 <210> 509 <211> 132 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 509 atgattgaac tttcattaat tgacttctat ttgtgctttt tagcctttct gctattcctt 60 gttttaatta tgcttattat cttttggttc tcacttgaac tgcaagatca taatgaaact 120 tgtcacgcct aa 132 <210> 510 <211> 366 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 510 atgaaatttc ttgttttctt aggaatcatc acaactgtag ctgcatttca ccaagaatgt 60 agtttacagt catgtactca acatcaacca tatgtagttg atgacccgtg tcctattcac 120 ttctattcta aatggtatat tagagtagga gctagaaaat cagcaccttt aattgaattg 180 tgcgtggatg aggctggttc taaatcaccc attcagtaca tcgatatcgg taattataca 240 gtttcctgtt taccttttac aattaattgc caggaaccta aattgggtag tcttgtagtg 300 cgttgttcgt tctatgaaga ctttttagag tatcatgacg ttcgtgttgt tttagatttc 360 atctaa 366 <210> 511 <211> 1260 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 511 atgtctgata atggacccca aaatcagcga aatgcacccc gcattacgtt tggtggaccc 60 tcagattcaa ctggcagtaa ccagaatgga gaacgcagtg gggcgcgatc aaaacaacgt 120 cggccccaag gtttacccaa taatactgcg tcttggttca ccgctctcac tcaacatggc 180 aaggaagacc ttaaattccc tcgaggacaa ggcgttccaa ttaacaccaa tagcagtcca 240 gatgaccaaa ttggctacta ccgaagagct accagacgaa ttcgtggtgg tgacggtaaa 300 atgaaagatc tcagtccaag atggtatttc tactacctag gaactgggcc agaagctgga 360 cttccctatg gtgctaacaa agacggcatc atatgggttg caactgaggg agccttgaat 420 acaccaaaag atcacattgg cacccgcaat cctgctaaca atgctgcaat cgtgctacaa 480 cttcctcaag gaacaacatt gccaaaaggc ttctacgcag aagggagcag aggcggcagt 540 caagcctctt ctcgttcctc atcacgtagt cgcaacagtt caagaaattc aactccaggc 600 agcagtaggg gaacttctcc tgctagaatg gctggcaatg gcggtgatgc tgctcttgct 660 ttgctgctgc ttgacagatt gaaccagctt gagagcaaaa tgtctggtaa aggccaacaa 720 caacaaggcc aaactgtcac taagaaatct gctgctgagg cttctaagaa gcctcggcaa 780 aaacgtactg ccactaaagc atacaatgta acacaagctt tcggcagacg tggtccagaa 840 caaacccaag gaaattttgg ggaccaggaa ctaatcagac aaggaactga ttacaaacat 900 tggccgcaaa ttgcacaatt tgcccccagc gcttcagcgt tcttcggaat gtcgcgcatt 960 ggcatggaag tcacaccttc gggaacgtgg ttgacctaca caggtgccat caaattggat 1020 gacaaagatc caaatttcaa agatcaagtc attttgctga ataagcatat tgacgcatac 1080 aaaacattcc caccaacaga gcctaaaaag gacaaaaaga agaaggctga tgaaactcaa 1140 gccttaccgc agagacagaa gaaacagcaa actgtgactc ttcttcctgc tgcagatttg 1200 gatgatttct ccaaacaatt gcaacaatcc atgagcagtg ctgactcaac tcaggcctaa 1260 <210> 512 <211> 117 <212> DNA <213> Severe acute respiratory syndrome coronavirus 2 <400> 512 atgggctata taaacgtttt cgcttttccg tttacgatat atagtctact cttgtgcaga 60 atgaattctc gtaactacat agcacaagta gatgtagtta actttaatct cacatag 117 <210> 513 <400> 513 000 <210> 514 <400> 514 000 <210> 515 <400> 515 000 <210> 516 <400> 516 000 <210> 517 <400> 517 000 <210> 518 <400> 518 000 <210> 519 <400> 519 000 <210> 520 <400> 520 000 <210> 521 <400> 521 000 <210> 522 <400> 522 000 <210> 523 <400> 523 000 <210> 524 <400> 524 000 <210> 525 <400> 525 000 <210> 526 <400> 526 000 <210> 527 <400> 527 000 <210> 528 <400> 528 000 <210> 529 <400> 529 000 <210> 530 <400> 530 000 <210> 531 <400> 531 000 <210> 532 <400> 532 000 <210> 533 <400> 533 000 <210> 534 <400> 534 000 <210> 535 <400> 535 000 <210> 536 <400> 536 000 <210> 537 <400> 537 000 <210> 538 <400> 538 000 <210> 539 <400> 539 000 <210> 540 <400> 540 000 <210> 541 <400> 541 000 <210> 542 <400> 542 000 <210> 543 <400> 543 000 <210> 544 <400> 544 000 <210> 545 <400> 545 000 <210> 546 <400> 546 000 <210> 547 <400> 547 000 <210> 548 <400> 548 000 <210> 549 <400> 549 000 <210> 550 <400> 550 000 <210> 551 <211> 7096 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 551 Met Glu Ser Leu Val Pro Gly Phe Asn Glu Lys Thr His Val Gln Leu 1 5 10 15 Ser Leu Pro Val Leu Gln Val Arg Asp Val Leu Val Arg Gly Phe Gly 20 25 30 Asp Ser Val Glu Glu Val Leu Ser Glu Ala Arg Gln His Leu Lys Asp 35 40 45 Gly Thr Cys Gly Leu Val Glu Val Glu Lys Gly Val Leu Pro Gln Leu 50 55 60 Glu Gln Pro Tyr Val Phe Ile Lys Arg Ser Asp Ala Arg Thr Ala Pro 65 70 75 80 His Gly His Val Met Val Glu Leu Val Ala Glu Leu Glu Gly Ile Gln 85 90 95 Tyr Gly Arg Ser Gly Glu Thr Leu Gly Val Leu Val Pro His Val Gly 100 105 110 Glu Ile Pro Val Ala Tyr Arg Lys Val Leu Leu Arg Lys Asn Gly Asn 115 120 125 Lys Gly Ala Gly Gly His Ser Tyr Gly Ala Asp Leu Lys Ser Phe Asp 130 135 140 Leu Gly Asp Glu Leu Gly Thr Asp Pro Tyr Glu Asp Phe Gln Glu Asn 145 150 155 160 Trp Asn Thr Lys His Ser Ser Gly Val Thr Arg Glu Leu Met Arg Glu 165 170 175 Leu Asn Gly Gly Ala Tyr Thr Arg Tyr Val Asp Asn Asn Phe Cys Gly 180 185 190 Pro Asp Gly Tyr Pro Leu Glu Cys Ile Lys Asp Leu Leu Ala Arg Ala 195 200 205 Gly Lys Ala Ser Cys Thr Leu Ser Glu Gln Leu Asp Phe Ile Asp Thr 210 215 220 Lys Arg Gly Val Tyr Cys Cys Arg Glu His Glu His Glu Ile Ala Trp 225 230 235 240 Tyr Thr Glu Arg Ser Glu Lys Ser Tyr Glu Leu Gln Thr Pro Phe Glu 245 250 255 Ile Lys Leu Ala Lys Lys Phe Asp Thr Phe Asn Gly Glu Cys Pro Asn 260 265 270 Phe Val Phe Pro Leu Asn Ser Ile Ile Lys Thr Ile Gln Pro Arg Val 275 280 285 Glu Lys Lys Lys Leu Asp Gly Phe Met Gly Arg Ile Arg Ser Val Tyr 290 295 300 Pro Val Ala Ser Pro Asn Glu Cys Asn Gln Met Cys Leu Ser Thr Leu 305 310 315 320 Met Lys Cys Asp His Cys Gly Glu Thr Ser Trp Gln Thr Gly Asp Phe 325 330 335 Val Lys Ala Thr Cys Glu Phe Cys Gly Thr Glu Asn Leu Thr Lys Glu 340 345 350 Gly Ala Thr Thr Cys Gly Tyr Leu Pro Gln Asn Ala Val Val Lys Ile 355 360 365 Tyr Cys Pro Ala Cys His Asn Ser Glu Val Gly Pro Glu His Ser Leu 370 375 380 Ala Glu Tyr His Asn Glu Ser Gly Leu Lys Thr Ile Leu Arg Lys Gly 385 390 395 400 Gly Arg Thr Ile Ala Phe Gly Gly Cys Val Phe Ser Tyr Val Gly Cys 405 410 415 His Asn Lys Cys Ala Tyr Trp Val Pro Arg Ala Ser Ala Asn Ile Gly 420 425 430 Cys Asn His Thr Gly Val Val Gly Glu Gly Ser Glu Gly Leu Asn Asp 435 440 445 Asn Leu Leu Glu Ile Leu Gln Lys Glu Lys Val Asn Ile Asn Ile Val 450 455 460 Gly Asp Phe Lys Leu Asn Glu Glu Ile Ala Ile Ile Leu Ala Ser Phe 465 470 475 480 Ser Ala Ser Thr Ser Ala Phe Val Glu Thr Val Lys Gly Leu Asp Tyr 485 490 495 Lys Ala Phe Lys Gln Ile Val Glu Ser Cys Gly Asn Phe Lys Val Thr 500 505 510 Lys Gly Lys Ala Lys Lys Gly Ala Trp Asn Ile Gly Glu Gln Lys Ser 515 520 525 Ile Leu Ser Pro Leu Tyr Ala Phe Ala Ser Glu Ala Ala Arg Val Val 530 535 540 Arg Ser Ile Phe Ser Arg Thr Leu Glu Thr Ala Gln Asn Ser Val Arg 545 550 555 560 Val Leu Gln Lys Ala Ala Ile Thr Ile Leu Asp Gly Ile Ser Gln Tyr 565 570 575 Ser Leu Arg Leu Ile Asp Ala Met Met Phe Thr Ser Asp Leu Ala Thr 580 585 590 Asn Asn Leu Val Val Met Ala Tyr Ile Thr Gly Gly Val Val Gln Leu 595 600 605 Thr Ser Gln Trp Leu Thr Asn Ile Phe Gly Thr Val Tyr Glu Lys Leu 610 615 620 Lys Pro Val Leu Asp Trp Leu Glu Glu Lys Phe Lys Glu Gly Val Glu 625 630 635 640 Phe Leu Arg Asp Gly Trp Glu Ile Val Lys Phe Ile Ser Thr Cys Ala 645 650 655 Cys Glu Ile Val Gly Gly Gln Ile Val Thr Cys Ala Lys Glu Ile Lys 660 665 670 Glu Ser Val Gln Thr Phe Phe Lys Leu Val Asn Lys Phe Leu Ala Leu 675 680 685 Cys Ala Asp Ser Ile Ile Ile Gly Gly Ala Lys Leu Lys Ala Leu Asn 690 695 700 Leu Gly Glu Thr Phe Val Thr His Ser Lys Gly Leu Tyr Arg Lys Cys 705 710 715 720 Val Lys Ser Arg Glu Glu Thr Gly Leu Leu Met Pro Leu Lys Ala Pro 725 730 735 Lys Glu Ile Ile Phe Leu Glu Gly Glu Thr Leu Pro Thr Glu Val Leu 740 745 750 Thr Glu Glu Val Val Leu Lys Thr Gly Asp Leu Gln Pro Leu Glu Gln 755 760 765 Pro Thr Ser Glu Ala Val Glu Ala Pro Leu Val Gly Thr Pro Val Cys 770 775 780 Ile Asn Gly Leu Met Leu Leu Glu Ile Lys Asp Thr Glu Lys Tyr Cys 785 790 795 800 Ala Leu Ala Pro Asn Met Met Val Thr Asn Asn Thr Phe Thr Leu Lys 805 810 815 Gly Gly Ala Pro Thr Lys Val Thr Phe Gly Asp Asp Thr Val Ile Glu 820 825 830 Val Gln Gly Tyr Lys Ser Val Asn Ile Thr Phe Glu Leu Asp Glu Arg 835 840 845 Ile Asp Lys Val Leu Asn Glu Lys Cys Ser Ala Tyr Thr Val Glu Leu 850 855 860 Gly Thr Glu Val Asn Glu Phe Ala Cys Val Val Ala Asp Ala Val Ile 865 870 875 880 Lys Thr Leu Gln Pro Val Ser Glu Leu Leu Thr Pro Leu Gly Ile Asp 885 890 895 Leu Asp Glu Trp Ser Met Ala Thr Tyr Tyr Leu Phe Asp Glu Ser Gly 900 905 910 Glu Phe Lys Leu Ala Ser His Met Tyr Cys Ser Phe Tyr Pro Pro Asp 915 920 925 Glu Asp Glu Glu Glu Gly Asp Cys Glu Glu Glu Glu Phe Glu Pro Ser 930 935 940 Thr Gln Tyr Glu Tyr Gly Thr Glu Asp Asp Tyr Gln Gly Lys Pro Leu 945 950 955 960 Glu Phe Gly Ala Thr Ser Ala Ala Leu Gln Pro Glu Glu Glu Gln Glu 965 970 975 Glu Asp Trp Leu Asp Asp Asp Ser Gln Gln Thr Val Gly Gln Gln Asp 980 985 990 Gly Ser Glu Asp Asn Gln Thr Thr Thr Ile Gln Thr Ile Val Glu Val 995 1000 1005 Gln Pro Gln Leu Glu Met Glu Leu Thr Pro Val Val Gln Thr Ile 1010 1015 1020 Glu Val Asn Ser Phe Ser Gly Tyr Leu Lys Leu Thr Asp Asn Val 1025 1030 1035 Tyr Ile Lys Asn Ala Asp Ile Val Glu Glu Ala Lys Lys Val Lys 1040 1045 1050 Pro Thr Val Val Val Asn Ala Ala Asn Val Tyr Leu Lys His Gly 1055 1060 1065 Gly Gly Val Ala Gly Ala Leu Asn Lys Ala Thr Asn Asn Ala Met 1070 1075 1080 Gln Val Glu Ser Asp Asp Tyr Ile Ala Thr Asn Gly Pro Leu Lys 1085 1090 1095 Val Gly Gly Ser Cys Val Leu Ser Gly His Asn Leu Ala Lys His 1100 1105 1110 Cys Leu His Val Val Gly Pro Asn Val Asn Lys Gly Glu Asp Ile 1115 1120 1125 Gln Leu Leu Lys Ser Ala Tyr Glu Asn Phe Asn Gln His Glu Val 1130 1135 1140 Leu Leu Ala Pro Leu Leu Ser Ala Gly Ile Phe Gly Ala Asp Pro 1145 1150 1155 Ile His Ser Leu Arg Val Cys Val Asp Thr Val Arg Thr Asn Val 1160 1165 1170 Tyr Leu Ala Val Phe Asp Lys Asn Leu Tyr Asp Lys Leu Val Ser 1175 1180 1185 Ser Phe Leu Glu Met Lys Ser Glu Lys Gln Val Glu Gln Lys Ile 1190 1195 1200 Ala Glu Ile Pro Lys Glu Glu Val Lys Pro Phe Ile Thr Glu Ser 1205 1210 1215 Lys Pro Ser Val Glu Gln Arg Lys Gln Asp Asp Lys Lys Ile Lys 1220 1225 1230 Ala Cys Val Glu Glu Val Thr Thr Thr Leu Glu Glu Thr Lys Phe 1235 1240 1245 Leu Thr Glu Asn Leu Leu Leu Tyr Ile Asp Ile Asn Gly Asn Leu 1250 1255 1260 His Pro Asp Ser Ala Thr Leu Val Ser Asp Ile Asp Ile Thr Phe 1265 1270 1275 Leu Lys Lys Asp Ala Pro Tyr Ile Val Gly Asp Val Val Gln Glu 1280 1285 1290 Gly Val Leu Thr Ala Val Val Ile Pro Thr Lys Lys Ala Gly Gly 1295 1300 1305 Thr Thr Glu Met Leu Ala Lys Ala Leu Arg Lys Val Pro Thr Asp 1310 1315 1320 Asn Tyr Ile Thr Thr Tyr Pro Gly Gln Gly Leu Asn Gly Tyr Thr 1325 1330 1335 Val Glu Glu Ala Lys Thr Val Leu Lys Lys Cys Lys Ser Ala Phe 1340 1345 1350 Tyr Ile Leu Pro Ser Ile Ile Ser Asn Glu Lys Gln Glu Ile Leu 1355 1360 1365 Gly Thr Val Ser Trp Asn Leu Arg Glu Met Leu Ala His Ala Glu 1370 1375 1380 Glu Thr Arg Lys Leu Met Pro Val Cys Val Glu Thr Lys Ala Ile 1385 1390 1395 Val Ser Thr Ile Gln Arg Lys Tyr Lys Gly Ile Lys Ile Gln Glu 1400 1405 1410 Gly Val Val Asp Tyr Gly Ala Arg Phe Tyr Phe Tyr Thr Ser Lys 1415 1420 1425 Thr Thr Val Ala Ser Leu Ile Asn Thr Leu Asn Asp Leu Asn Glu 1430 1435 1440 Thr Leu Val Thr Met Pro Leu Gly Tyr Val Thr His Gly Leu Asn 1445 1450 1455 Leu Glu Glu Ala Ala Arg Tyr Met Arg Ser Leu Lys Val Pro Ala 1460 1465 1470 Thr Val Ser Val Ser Ser Pro Asp Ala Val Thr Ala Tyr Asn Gly 1475 1480 1485 Tyr Leu Thr Ser Ser Ser Lys Thr Pro Glu Glu His Phe Ile Glu 1490 1495 1500 Thr Ile Ser Leu Ala Gly Ser Tyr Lys Asp Trp Ser Tyr Ser Gly 1505 1510 1515 Gln Ser Thr Gln Leu Gly Ile Glu Phe Leu Lys Arg Gly Asp Lys 1520 1525 1530 Ser Val Tyr Tyr Thr Ser Asn Pro Thr Thr Phe His Leu Asp Gly 1535 1540 1545 Glu Val Ile Thr Phe Asp Asn Leu Lys Thr Leu Leu Ser Leu Arg 1550 1555 1560 Glu Val Arg Thr Ile Lys Val Phe Thr Thr Val Asp Asn Ile Asn 1565 1570 1575 Leu His Thr Gln Val Val Asp Met Ser Met Thr Tyr Gly Gln Gln 1580 1585 1590 Phe Gly Pro Thr Tyr Leu Asp Gly Ala Asp Val Thr Lys Ile Lys 1595 1600 1605 Pro His Asn Ser His Glu Gly Lys Thr Phe Tyr Val Leu Pro Asn 1610 1615 1620 Asp Asp Thr Leu Arg Val Glu Ala Phe Glu Tyr Tyr His Thr Thr 1625 1630 1635 Asp Pro Ser Phe Leu Gly Arg Tyr Met Ser Ala Leu Asn His Thr 1640 1645 1650 Lys Lys Trp Lys Tyr Pro Gln Val Asn Gly Leu Thr Ser Ile Lys 1655 1660 1665 Trp Ala Asp Asn Asn Cys Tyr Leu Ala Thr Ala Leu Leu Thr Leu 1670 1675 1680 Gln Gln Ile Glu Leu Lys Phe Asn Pro Pro Ala Leu Gln Asp Ala 1685 1690 1695 Tyr Tyr Arg Ala Arg Ala Gly Glu Ala Ala Asn Phe Cys Ala Leu 1700 1705 1710 Ile Leu Ala Tyr Cys Asn Lys Thr Val Gly Glu Leu Gly Asp Val 1715 1720 1725 Arg Glu Thr Met Ser Tyr Leu Phe Gln His Ala Asn Leu Asp Ser 1730 1735 1740 Cys Lys Arg Val Leu Asn Val Val Cys Lys Thr Cys Gly Gln Gln 1745 1750 1755 Gln Thr Thr Leu Lys Gly Val Glu Ala Val Met Tyr Met Gly Thr 1760 1765 1770 Leu Ser Tyr Glu Gln Phe Lys Lys Gly Val Gln Ile Pro Cys Thr 1775 1780 1785 Cys Gly Lys Gln Ala Thr Lys Tyr Leu Val Gln Gln Glu Ser Pro 1790 1795 1800 Phe Val Met Met Ser Ala Pro Pro Ala Gln Tyr Glu Leu Lys His 1805 1810 1815 Gly Thr Phe Thr Cys Ala Ser Glu Tyr Thr Gly Asn Tyr Gln Cys 1820 1825 1830 Gly His Tyr Lys His Ile Thr Ser Lys Glu Thr Leu Tyr Cys Ile 1835 1840 1845 Asp Gly Ala Leu Leu Thr Lys Ser Ser Glu Tyr Lys Gly Pro Ile 1850 1855 1860 Thr Asp Val Phe Tyr Lys Glu Asn Ser Tyr Thr Thr Thr Ile Lys 1865 1870 1875 Pro Val Thr Tyr Lys Leu Asp Gly Val Val Cys Thr Glu Ile Asp 1880 1885 1890 Pro Lys Leu Asp Asn Tyr Tyr Lys Lys Asp Asn Ser Tyr Phe Thr 1895 1900 1905 Glu Gln Pro Ile Asp Leu Val Pro Asn Gln Pro Tyr Pro Asn Ala 1910 1915 1920 Ser Phe Asp Asn Phe Lys Phe Val Cys Asp Asn Ile Lys Phe Ala 1925 1930 1935 Asp Asp Leu Asn Gln Leu Thr Gly Tyr Lys Lys Pro Ala Ser Arg 1940 1945 1950 Glu Leu Lys Val Thr Phe Phe Pro Asp Leu Asn Gly Asp Val Val 1955 1960 1965 Ala Ile Asp Tyr Lys His Tyr Thr Pro Ser Phe Lys Lys Gly Ala 1970 1975 1980 Lys Leu Leu His Lys Pro Ile Val Trp His Val Asn Asn Ala Thr 1985 1990 1995 Asn Lys Ala Thr Tyr Lys Pro Asn Thr Trp Cys Ile Arg Cys Leu 2000 2005 2010 Trp Ser Thr Lys Pro Val Glu Thr Ser Asn Ser Phe Asp Val Leu 2015 2020 2025 Lys Ser Glu Asp Ala Gln Gly Met Asp Asn Leu Ala Cys Glu Asp 2030 2035 2040 Leu Lys Pro Val Ser Glu Glu Val Val Glu Asn Pro Thr Ile Gln 2045 2050 2055 Lys Asp Val Leu Glu Cys Asn Val Lys Thr Thr Glu Val Val Gly 2060 2065 2070 Asp Ile Ile Leu Lys Pro Ala Asn Asn Ser Leu Lys Ile Thr Glu 2075 2080 2085 Glu Val Gly His Thr Asp Leu Met Ala Ala Tyr Val Asp Asn Ser 2090 2095 2100 Ser Leu Thr Ile Lys Lys Pro Asn Glu Leu Ser Arg Val Leu Gly 2105 2110 2115 Leu Lys Thr Leu Ala Thr His Gly Leu Ala Ala Val Asn Ser Val 2120 2125 2130 Pro Trp Asp Thr Ile Ala Asn Tyr Ala Lys Pro Phe Leu Asn Lys 2135 2140 2145 Val Val Ser Thr Thr Thr Asn Ile Val Thr Arg Cys Leu Asn Arg 2150 2155 2160 Val Cys Thr Asn Tyr Met Pro Tyr Phe Phe Thr Leu Leu Leu Gln 2165 2170 2175 Leu Cys Thr Phe Thr Arg Ser Thr Asn Ser Arg Ile Lys Ala Ser 2180 2185 2190 Met Pro Thr Thr Ile Ala Lys Asn Thr Val Lys Ser Val Gly Lys 2195 2200 2205 Phe Cys Leu Glu Ala Ser Phe Asn Tyr Leu Lys Ser Pro Asn Phe 2210 2215 2220 Ser Lys Leu Ile Asn Ile Ile Ile Trp Phe Leu Leu Leu Ser Val 2225 2230 2235 Cys Leu Gly Ser Leu Ile Tyr Ser Thr Ala Ala Leu Gly Val Leu 2240 2245 2250 Met Ser Asn Leu Gly Met Pro Ser Tyr Cys Thr Gly Tyr Arg Glu 2255 2260 2265 Gly Tyr Leu Asn Ser Thr Asn Val Thr Ile Ala Thr Tyr Cys Thr 2270 2275 2280 Gly Ser Ile Pro Cys Ser Val Cys Leu Ser Gly Leu Asp Ser Leu 2285 2290 2295 Asp Thr Tyr Pro Ser Leu Glu Thr Ile Gln Ile Thr Ile Ser Ser 2300 2305 2310 Phe Lys Trp Asp Leu Thr Ala Phe Gly Leu Val Ala Glu Trp Phe 2315 2320 2325 Leu Ala Tyr Ile Leu Phe Thr Arg Phe Phe Tyr Val Leu Gly Leu 2330 2335 2340 Ala Ala Ile Met Gln Leu Phe Phe Ser Tyr Phe Ala Val His Phe 2345 2350 2355 Ile Ser Asn Ser Trp Leu Met Trp Leu Ile Ile Asn Leu Val Gln 2360 2365 2370 Met Ala Pro Ile Ser Ala Met Val Arg Met Tyr Ile Phe Phe Ala 2375 2380 2385 Ser Phe Tyr Tyr Val Trp Lys Ser Tyr Val His Val Val Asp Gly 2390 2395 2400 Cys Asn Ser Ser Thr Cys Met Met Cys Tyr Lys Arg Asn Arg Ala 2405 2410 2415 Thr Arg Val Glu Cys Thr Thr Ile Val Asn Gly Val Arg Arg Ser 2420 2425 2430 Phe Tyr Val Tyr Ala Asn Gly Gly Lys Gly Phe Cys Lys Leu His 2435 2440 2445 Asn Trp Asn Cys Val Asn Cys Asp Thr Phe Cys Ala Gly Ser Thr 2450 2455 2460 Phe Ile Ser Asp Glu Val Ala Arg Asp Leu Ser Leu Gln Phe Lys 2465 2470 2475 Arg Pro Ile Asn Pro Thr Asp Gln Ser Ser Tyr Ile Val Asp Ser 2480 2485 2490 Val Thr Val Lys Asn Gly Ser Ile His Leu Tyr Phe Asp Lys Ala 2495 2500 2505 Gly Gln Lys Thr Tyr Glu Arg His Ser Leu Ser His Phe Val Asn 2510 2515 2520 Leu Asp Asn Leu Arg Ala Asn Asn Thr Lys Gly Ser Leu Pro Ile 2525 2530 2535 Asn Val Ile Val Phe Asp Gly Lys Ser Lys Cys Glu Glu Ser Ser 2540 2545 2550 Ala Lys Ser Ala Ser Val Tyr Tyr Ser Gln Leu Met Cys Gln Pro 2555 2560 2565 Ile Leu Leu Leu Asp Gln Ala Leu Val Ser Asp Val Gly Asp Ser 2570 2575 2580 Ala Glu Val Ala Val Lys Met Phe Asp Ala Tyr Val Asn Thr Phe 2585 2590 2595 Ser Ser Thr Phe Asn Val Pro Met Glu Lys Leu Lys Thr Leu Val 2600 2605 2610 Ala Thr Ala Glu Ala Glu Leu Ala Lys Asn Val Ser Leu Asp Asn 2615 2620 2625 Val Leu Ser Thr Phe Ile Ser Ala Ala Arg Gln Gly Phe Val Asp 2630 2635 2640 Ser Asp Val Glu Thr Lys Asp Val Val Glu Cys Leu Lys Leu Ser 2645 2650 2655 His Gln Ser Asp Ile Glu Val Thr Gly Asp Ser Cys Asn Asn Tyr 2660 2665 2670 Met Leu Thr Tyr Asn Lys Val Glu Asn Met Thr Pro Arg Asp Leu 2675 2680 2685 Gly Ala Cys Ile Asp Cys Ser Ala Arg His Ile Asn Ala Gln Val 2690 2695 2700 Ala Lys Ser His Asn Ile Ala Leu Ile Trp Asn Val Lys Asp Phe 2705 2710 2715 Met Ser Leu Ser Glu Gln Leu Arg Lys Gln Ile Arg Ser Ala Ala 2720 2725 2730 Lys Lys Asn Asn Leu Pro Phe Lys Leu Thr Cys Ala Thr Thr Arg 2735 2740 2745 Gln Val Val Asn Val Val Thr Thr Lys Ile Ala Leu Lys Gly Gly 2750 2755 2760 Lys Ile Val Asn Asn Trp Leu Lys Gln Leu Ile Lys Val Thr Leu 2765 2770 2775 Val Phe Leu Phe Val Ala Ala Ile Phe Tyr Leu Ile Thr Pro Val 2780 2785 2790 His Val Met Ser Lys His Thr Asp Phe Ser Ser Glu Ile Ile Gly 2795 2800 2805 Tyr Lys Ala Ile Asp Gly Gly Val Thr Arg Asp Ile Ala Ser Thr 2810 2815 2820 Asp Thr Cys Phe Ala Asn Lys His Ala Asp Phe Asp Thr Trp Phe 2825 2830 2835 Ser Gln Arg Gly Gly Ser Tyr Thr Asn Asp Lys Ala Cys Pro Leu 2840 2845 2850 Ile Ala Ala Val Ile Thr Arg Glu Val Gly Phe Val Val Pro Gly 2855 2860 2865 Leu Pro Gly Thr Ile Leu Arg Thr Thr Asn Gly Asp Phe Leu His 2870 2875 2880 Phe Leu Pro Arg Val Phe Ser Ala Val Gly Asn Ile Cys Tyr Thr 2885 2890 2895 Pro Ser Lys Leu Ile Glu Tyr Thr Asp Phe Ala Thr Ser Ala Cys 2900 2905 2910 Val Leu Ala Ala Glu Cys Thr Ile Phe Lys Asp Ala Ser Gly Lys 2915 2920 2925 Pro Val Pro Tyr Cys Tyr Asp Thr Asn Val Leu Glu Gly Ser Val 2930 2935 2940 Ala Tyr Glu Ser Leu Arg Pro Asp Thr Arg Tyr Val Leu Met Asp 2945 2950 2955 Gly Ser Ile Ile Gln Phe Pro Asn Thr Tyr Leu Glu Gly Ser Val 2960 2965 2970 Arg Val Val Thr Thr Phe Asp Ser Glu Tyr Cys Arg His Gly Thr 2975 2980 2985 Cys Glu Arg Ser Glu Ala Gly Val Cys Val Ser Thr Ser Gly Arg 2990 2995 3000 Trp Val Leu Asn Asn Asp Tyr Tyr Arg Ser Leu Pro Gly Val Phe 3005 3010 3015 Cys Gly Val Asp Ala Val Asn Leu Leu Thr Asn Met Phe Thr Pro 3020 3025 3030 Leu Ile Gln Pro Ile Gly Ala Leu Asp Ile Ser Ala Ser Ile Val 3035 3040 3045 Ala Gly Gly Ile Val Ala Ile Val Val Thr Cys Leu Ala Tyr Tyr 3050 3055 3060 Phe Met Arg Phe Arg Arg Ala Phe Gly Glu Tyr Ser His Val Val 3065 3070 3075 Ala Phe Asn Thr Leu Leu Phe Leu Met Ser Phe Thr Val Leu Cys 3080 3085 3090 Leu Thr Pro Val Tyr Ser Phe Leu Pro Gly Val Tyr Ser Val Ile 3095 3100 3105 Tyr Leu Tyr Leu Thr Phe Tyr Leu Thr Asn Asp Val Ser Phe Leu 3110 3115 3120 Ala His Ile Gln Trp Met Val Met Phe Thr Pro Leu Val Pro Phe 3125 3130 3135 Trp Ile Thr Ile Ala Tyr Ile Ile Cys Ile Ser Thr Lys His Phe 3140 3145 3150 Tyr Trp Phe Phe Ser Asn Tyr Leu Lys Arg Arg Val Val Phe Asn 3155 3160 3165 Gly Val Ser Phe Ser Thr Phe Glu Glu Ala Ala Leu Cys Thr Phe 3170 3175 3180 Leu Leu Asn Lys Glu Met Tyr Leu Lys Leu Arg Ser Asp Val Leu 3185 3190 3195 Leu Pro Leu Thr Gln Tyr Asn Arg Tyr Leu Ala Leu Tyr Asn Lys 3200 3205 3210 Tyr Lys Tyr Phe Ser Gly Ala Met Asp Thr Thr Ser Tyr Arg Glu 3215 3220 3225 Ala Ala Cys Cys His Leu Ala Lys Ala Leu Asn Asp Phe Ser Asn 3230 3235 3240 Ser Gly Ser Asp Val Leu Tyr Gln Pro Pro Gln Thr Ser Ile Thr 3245 3250 3255 Ser Ala Val Leu Gln Ser Gly Phe Arg Lys Met Ala Phe Pro Ser 3260 3265 3270 Gly Lys Val Glu Gly Cys Met Val Gln Val Thr Cys Gly Thr Thr 3275 3280 3285 Thr Leu Asn Gly Leu Trp Leu Asp Asp Val Val Tyr Cys Pro Arg 3290 3295 3300 His Val Ile Cys Thr Ser Glu Asp Met Leu Asn Pro Asn Tyr Glu 3305 3310 3315 Asp Leu Leu Ile Arg Lys Ser Asn His Asn Phe Leu Val Gln Ala 3320 3325 3330 Gly Asn Val Gln Leu Arg Val Ile Gly His Ser Met Gln Asn Cys 3335 3340 3345 Val Leu Lys Leu Lys Val Asp Thr Ala Asn Pro Lys Thr Pro Lys 3350 3355 3360 Tyr Lys Phe Val Arg Ile Gln Pro Gly Gln Thr Phe Ser Val Leu 3365 3370 3375 Ala Cys Tyr Asn Gly Ser Pro Ser Gly Val Tyr Gln Cys Ala Met 3380 3385 3390 Arg Pro Asn Phe Thr Ile Lys Gly Ser Phe Leu Asn Gly Ser Cys 3395 3400 3405 Gly Ser Val Gly Phe Asn Ile Asp Tyr Asp Cys Val Ser Phe Cys 3410 3415 3420 Tyr Met His His Met Glu Leu Pro Thr Gly Val His Ala Gly Thr 3425 3430 3435 Asp Leu Glu Gly Asn Phe Tyr Gly Pro Phe Val Asp Arg Gln Thr 3440 3445 3450 Ala Gln Ala Ala Gly Thr Asp Thr Thr Ile Thr Val Asn Val Leu 3455 3460 3465 Ala Trp Leu Tyr Ala Ala Val Ile Asn Gly Asp Arg Trp Phe Leu 3470 3475 3480 Asn Arg Phe Thr Thr Thr Leu Asn Asp Phe Asn Leu Val Ala Met 3485 3490 3495 Lys Tyr Asn Tyr Glu Pro Leu Thr Gln Asp His Val Asp Ile Leu 3500 3505 3510 Gly Pro Leu Ser Ala Gln Thr Gly Ile Ala Val Leu Asp Met Cys 3515 3520 3525 Ala Ser Leu Lys Glu Leu Leu Gln Asn Gly Met Asn Gly Arg Thr 3530 3535 3540 Ile Leu Gly Ser Ala Leu Leu Glu Asp Glu Phe Thr Pro Phe Asp 3545 3550 3555 Val Val Arg Gln Cys Ser Gly Val Thr Phe Gln Ser Ala Val Lys 3560 3565 3570 Arg Thr Ile Lys Gly Thr His His Trp Leu Leu Leu Thr Ile Leu 3575 3580 3585 Thr Ser Leu Leu Val Leu Val Gln Ser Thr Gln Trp Ser Leu Phe 3590 3595 3600 Phe Phe Leu Tyr Glu Asn Ala Phe Leu Pro Phe Ala Met Gly Ile 3605 3610 3615 Ile Ala Met Ser Ala Phe Ala Met Met Phe Val Lys His Lys His 3620 3625 3630 Ala Phe Leu Cys Leu Phe Leu Leu Pro Ser Leu Ala Thr Val Ala 3635 3640 3645 Tyr Phe Asn Met Val Tyr Met Pro Ala Ser Trp Val Met Arg Ile 3650 3655 3660 Met Thr Trp Leu Asp Met Val Asp Thr Ser Leu Ser Gly Phe Lys 3665 3670 3675 Leu Lys Asp Cys Val Met Tyr Ala Ser Ala Val Val Leu Leu Ile 3680 3685 3690 Leu Met Thr Ala Arg Thr Val Tyr Asp Asp Gly Ala Arg Arg Val 3695 3700 3705 Trp Thr Leu Met Asn Val Leu Thr Leu Val Tyr Lys Val Tyr Tyr 3710 3715 3720 Gly Asn Ala Leu Asp Gln Ala Ile Ser Met Trp Ala Leu Ile Ile 3725 3730 3735 Ser Val Thr Ser Asn Tyr Ser Gly Val Val Thr Thr Val Met Phe 3740 3745 3750 Leu Ala Arg Gly Ile Val Phe Met Cys Val Glu Tyr Cys Pro Ile 3755 3760 3765 Phe Phe Ile Thr Gly Asn Thr Leu Gln Cys Ile Met Leu Val Tyr 3770 3775 3780 Cys Phe Leu Gly Tyr Phe Cys Thr Cys Tyr Phe Gly Leu Phe Cys 3785 3790 3795 Leu Leu Asn Arg Tyr Phe Arg Leu Thr Leu Gly Val Tyr Asp Tyr 3800 3805 3810 Leu Val Ser Thr Gln Glu Phe Arg Tyr Met Asn Ser Gln Gly Leu 3815 3820 3825 Leu Pro Pro Lys Asn Ser Ile Asp Ala Phe Lys Leu Asn Ile Lys 3830 3835 3840 Leu Leu Gly Val Gly Gly Lys Pro Cys Ile Lys Val Ala Thr Val 3845 3850 3855 Gln Ser Lys Met Ser Asp Val Lys Cys Thr Ser Val Val Leu Leu 3860 3865 3870 Ser Val Leu Gln Gln Leu Arg Val Glu Ser Ser Ser Lys Leu Trp 3875 3880 3885 Ala Gln Cys Val Gln Leu His Asn Asp Ile Leu Leu Ala Lys Asp 3890 3895 3900 Thr Thr Glu Ala Phe Glu Lys Met Val Ser Leu Leu Ser Val Leu 3905 3910 3915 Leu Ser Met Gln Gly Ala Val Asp Ile Asn Lys Leu Cys Glu Glu 3920 3925 3930 Met Leu Asp Asn Arg Ala Thr Leu Gln Ala Ile Ala Ser Glu Phe 3935 3940 3945 Ser Ser Leu Pro Ser Tyr Ala Ala Phe Ala Thr Ala Gln Glu Ala 3950 3955 3960 Tyr Glu Gln Ala Val Ala Asn Gly Asp Ser Glu Val Val Leu Lys 3965 3970 3975 Lys Leu Lys Lys Ser Leu Asn Val Ala Lys Ser Glu Phe Asp Arg 3980 3985 3990 Asp Ala Ala Met Gln Arg Lys Leu Glu Lys Met Ala Asp Gln Ala 3995 4000 4005 Met Thr Gln Met Tyr Lys Gln Ala Arg Ser Glu Asp Lys Arg Ala 4010 4015 4020 Lys Val Thr Ser Ala Met Gln Thr Met Leu Phe Thr Met Leu Arg 4025 4030 4035 Lys Leu Asp Asn Asp Ala Leu Asn Asn Ile Ile Asn Asn Ala Arg 4040 4045 4050 Asp Gly Cys Val Pro Leu Asn Ile Ile Pro Leu Thr Thr Ala Ala 4055 4060 4065 Lys Leu Met Val Val Ile Pro Asp Tyr Asn Thr Tyr Lys Asn Thr 4070 4075 4080 Cys Asp Gly Thr Thr Phe Thr Tyr Ala Ser Ala Leu Trp Glu Ile 4085 4090 4095 Gln Gln Val Val Asp Ala Asp Ser Lys Ile Val Gln Leu Ser Glu 4100 4105 4110 Ile Ser Met Asp Asn Ser Pro Asn Leu Ala Trp Pro Leu Ile Val 4115 4120 4125 Thr Ala Leu Arg Ala Asn Ser Ala Val Lys Leu Gln Asn Asn Glu 4130 4135 4140 Leu Ser Pro Val Ala Leu Arg Gln Met Ser Cys Ala Ala Gly Thr 4145 4150 4155 Thr Gln Thr Ala Cys Thr Asp Asp Asn Ala Leu Ala Tyr Tyr Asn 4160 4165 4170 Thr Thr Lys Gly Gly Arg Phe Val Leu Ala Leu Leu Ser Asp Leu 4175 4180 4185 Gln Asp Leu Lys Trp Ala Arg Phe Pro Lys Ser Asp Gly Thr Gly 4190 4195 4200 Thr Ile Tyr Thr Glu Leu Glu Pro Pro Cys Arg Phe Val Thr Asp 4205 4210 4215 Thr Pro Lys Gly Pro Lys Val Lys Tyr Leu Tyr Phe Ile Lys Gly 4220 4225 4230 Leu Asn Asn Leu Asn Arg Gly Met Val Leu Gly Ser Leu Ala Ala 4235 4240 4245 Thr Val Arg Leu Gln Ala Gly Asn Ala Thr Glu Val Pro Ala Asn 4250 4255 4260 Ser Thr Val Leu Ser Phe Cys Ala Phe Ala Val Asp Ala Ala Lys 4265 4270 4275 Ala Tyr Lys Asp Tyr Leu Ala Ser Gly Gly Gln Pro Ile Thr Asn 4280 4285 4290 Cys Val Lys Met Leu Cys Thr His Thr Gly Thr Gly Gln Ala Ile 4295 4300 4305 Thr Val Thr Pro Glu Ala Asn Met Asp Gln Glu Ser Phe Gly Gly 4310 4315 4320 Ala Ser Cys Cys Leu Tyr Cys Arg Cys His Ile Asp His Pro Asn 4325 4330 4335 Pro Lys Gly Phe Cys Asp Leu Lys Gly Lys Tyr Val Gln Ile Pro 4340 4345 4350 Thr Thr Cys Ala Asn Asp Pro Val Gly Phe Thr Leu Lys Asn Thr 4355 4360 4365 Val Cys Thr Val Cys Gly Met Trp Lys Gly Tyr Gly Cys Ser Cys 4370 4375 4380 Asp Gln Leu Arg Glu Pro Met Leu Gln Ser Ala Asp Ala Gln Ser 4385 4390 4395 Phe Leu Asn Arg Val Cys Gly Val Ser Ala Ala Arg Leu Thr Pro 4400 4405 4410 Cys Gly Thr Gly Thr Ser Thr Asp Val Val Tyr Arg Ala Phe Asp 4415 4420 4425 Ile Tyr Asn Asp Lys Val Ala Gly Phe Ala Lys Phe Leu Lys Thr 4430 4435 4440 Asn Cys Cys Arg Phe Gln Glu Lys Asp Glu Asp Asp Asn Leu Ile 4445 4450 4455 Asp Ser Tyr Phe Val Val Lys Arg His Thr Phe Ser Asn Tyr Gln 4460 4465 4470 His Glu Glu Thr Ile Tyr Asn Leu Leu Lys Asp Cys Pro Ala Val 4475 4480 4485 Ala Lys His Asp Phe Phe Lys Phe Arg Ile Asp Gly Asp Met Val 4490 4495 4500 Pro His Ile Ser Arg Gln Arg Leu Thr Lys Tyr Thr Met Ala Asp 4505 4510 4515 Leu Val Tyr Ala Leu Arg His Phe Asp Glu Gly Asn Cys Asp Thr 4520 4525 4530 Leu Lys Glu Ile Leu Val Thr Tyr Asn Cys Cys Asp Asp Asp Tyr 4535 4540 4545 Phe Asn Lys Lys Asp Trp Tyr Asp Phe Val Glu Asn Pro Asp Ile 4550 4555 4560 Leu Arg Val Tyr Ala Asn Leu Gly Glu Arg Val Arg Gln Ala Leu 4565 4570 4575 Leu Lys Thr Val Gln Phe Cys Asp Ala Met Arg Asn Ala Gly Ile 4580 4585 4590 Val Gly Val Leu Thr Leu Asp Asn Gln Asp Leu Asn Gly Asn Trp 4595 4600 4605 Tyr Asp Phe Gly Asp Phe Ile Gln Thr Thr Pro Gly Ser Gly Val 4610 4615 4620 Pro Val Val Asp Ser Tyr Tyr Ser Leu Leu Met Pro Ile Leu Thr 4625 4630 4635 Leu Thr Arg Ala Leu Thr Ala Glu Ser His Val Asp Thr Asp Leu 4640 4645 4650 Thr Lys Pro Tyr Ile Lys Trp Asp Leu Leu Lys Tyr Asp Phe Thr 4655 4660 4665 Glu Glu Arg Leu Lys Leu Phe Asp Arg Tyr Phe Lys Tyr Trp Asp 4670 4675 4680 Gln Thr Tyr His Pro Asn Cys Val Asn Cys Leu Asp Asp Arg Cys 4685 4690 4695 Ile Leu His Cys Ala Asn Phe Asn Val Leu Phe Ser Thr Val Phe 4700 4705 4710 Pro Pro Thr Ser Phe Gly Pro Leu Val Arg Lys Ile Phe Val Asp 4715 4720 4725 Gly Val Pro Phe Val Val Ser Thr Gly Tyr His Phe Arg Glu Leu 4730 4735 4740 Gly Val Val His Asn Gln Asp Val Asn Leu His Ser Ser Arg Leu 4745 4750 4755 Ser Phe Lys Glu Leu Leu Val Tyr Ala Ala Asp Pro Ala Met His 4760 4765 4770 Ala Ala Ser Gly Asn Leu Leu Leu Asp Lys Arg Thr Thr Cys Phe 4775 4780 4785 Ser Val Ala Ala Leu Thr Asn Asn Val Ala Phe Gln Thr Val Lys 4790 4795 4800 Pro Gly Asn Phe Asn Lys Asp Phe Tyr Asp Phe Ala Val Ser Lys 4805 4810 4815 Gly Phe Phe Lys Glu Gly Ser Ser Val Glu Leu Lys His Phe Phe 4820 4825 4830 Phe Ala Gln Asp Gly Asn Ala Ala Ile Ser Asp Tyr Asp Tyr Tyr 4835 4840 4845 Arg Tyr Asn Leu Pro Thr Met Cys Asp Ile Arg Gln Leu Leu Phe 4850 4855 4860 Val Val Glu Val Val Asp Lys Tyr Phe Asp Cys Tyr Asp Gly Gly 4865 4870 4875 Cys Ile Asn Ala Asn Gln Val Ile Val Asn Asn Leu Asp Lys Ser 4880 4885 4890 Ala Gly Phe Pro Phe Asn Lys Trp Gly Lys Ala Arg Leu Tyr Tyr 4895 4900 4905 Asp Ser Met Ser Tyr Glu Asp Gln Asp Ala Leu Phe Ala Tyr Thr 4910 4915 4920 Lys Arg Asn Val Ile Pro Thr Ile Thr Gln Met Asn Leu Lys Tyr 4925 4930 4935 Ala Ile Ser Ala Lys Asn Arg Ala Arg Thr Val Ala Gly Val Ser 4940 4945 4950 Ile Cys Ser Thr Met Thr Asn Arg Gln Phe His Gln Lys Leu Leu 4955 4960 4965 Lys Ser Ile Ala Ala Thr Arg Gly Ala Thr Val Val Ile Gly Thr 4970 4975 4980 Ser Lys Phe Tyr Gly Gly Trp His Asn Met Leu Lys Thr Val Tyr 4985 4990 4995 Ser Asp Val Glu Asn Pro His Leu Met Gly Trp Asp Tyr Pro Lys 5000 5005 5010 Cys Asp Arg Ala Met Pro Asn Met Leu Arg Ile Met Ala Ser Leu 5015 5020 5025 Val Leu Ala Arg Lys His Thr Thr Cys Cys Ser Leu Ser His Arg 5030 5035 5040 Phe Tyr Arg Leu Ala Asn Glu Cys Ala Gln Val Leu Ser Glu Met 5045 5050 5055 Val Met Cys Gly Gly Ser Leu Tyr Val Lys Pro Gly Gly Thr Ser 5060 5065 5070 Ser Gly Asp Ala Thr Thr Ala Tyr Ala Asn Ser Val Phe Asn Ile 5075 5080 5085 Cys Gln Ala Val Thr Ala Asn Val Asn Ala Leu Leu Ser Thr Asp 5090 5095 5100 Gly Asn Lys Ile Ala Asp Lys Tyr Val Arg Asn Leu Gln His Arg 5105 5110 5115 Leu Tyr Glu Cys Leu Tyr Arg Asn Arg Asp Val Asp Thr Asp Phe 5120 5125 5130 Val Asn Glu Phe Tyr Ala Tyr Leu Arg Lys His Phe Ser Met Met 5135 5140 5145 Ile Leu Ser Asp Asp Ala Val Val Cys Phe Asn Ser Thr Tyr Ala 5150 5155 5160 Ser Gln Gly Leu Val Ala Ser Ile Lys Asn Phe Lys Ser Val Leu 5165 5170 5175 Tyr Tyr Gln Asn Asn Val Phe Met Ser Glu Ala Lys Cys Trp Thr 5180 5185 5190 Glu Thr Asp Leu Thr Lys Gly Pro His Glu Phe Cys Ser Gln His 5195 5200 5205 Thr Met Leu Val Lys Gln Gly Asp Asp Tyr Val Tyr Leu Pro Tyr 5210 5215 5220 Pro Asp Pro Ser Arg Ile Leu Gly Ala Gly Cys Phe Val Asp Asp 5225 5230 5235 Ile Val Lys Thr Asp Gly Thr Leu Met Ile Glu Arg Phe Val Ser 5240 5245 5250 Leu Ala Ile Asp Ala Tyr Pro Leu Thr Lys His Pro Asn Gln Glu 5255 5260 5265 Tyr Ala Asp Val Phe His Leu Tyr Leu Gln Tyr Ile Arg Lys Leu 5270 5275 5280 His Asp Glu Leu Thr Gly His Met Leu Asp Met Tyr Ser Val Met 5285 5290 5295 Leu Thr Asn Asp Asn Thr Ser Arg Tyr Trp Glu Pro Glu Phe Tyr 5300 5305 5310 Glu Ala Met Tyr Thr Pro His Thr Val Leu Gln Ala Val Gly Ala 5315 5320 5325 Cys Val Leu Cys Asn Ser Gln Thr Ser Leu Arg Cys Gly Ala Cys 5330 5335 5340 Ile Arg Arg Pro Phe Leu Cys Cys Lys Cys Cys Tyr Asp His Val 5345 5350 5355 Ile Ser Thr Ser His Lys Leu Val Leu Ser Val Asn Pro Tyr Val 5360 5365 5370 Cys Asn Ala Pro Gly Cys Asp Val Thr Asp Val Thr Gln Leu Tyr 5375 5380 5385 Leu Gly Gly Met Ser Tyr Tyr Cys Lys Ser His Lys Pro Pro Ile 5390 5395 5400 Ser Phe Pro Leu Cys Ala Asn Gly Gln Val Phe Gly Leu Tyr Lys 5405 5410 5415 Asn Thr Cys Val Gly Ser Asp Asn Val Thr Asp Phe Asn Ala Ile 5420 5425 5430 Ala Thr Cys Asp Trp Thr Asn Ala Gly Asp Tyr Ile Leu Ala Asn 5435 5440 5445 Thr Cys Thr Glu Arg Leu Lys Leu Phe Ala Ala Glu Thr Leu Lys 5450 5455 5460 Ala Thr Glu Glu Thr Phe Lys Leu Ser Tyr Gly Ile Ala Thr Val 5465 5470 5475 Arg Glu Val Leu Ser Asp Arg Glu Leu His Leu Ser Trp Glu Val 5480 5485 5490 Gly Lys Pro Arg Pro Pro Leu Asn Arg Asn Tyr Val Phe Thr Gly 5495 5500 5505 Tyr Arg Val Thr Lys Asn Ser Lys Val Gln Ile Gly Glu Tyr Thr 5510 5515 5520 Phe Glu Lys Gly Asp Tyr Gly Asp Ala Val Val Tyr Arg Gly Thr 5525 5530 5535 Thr Thr Tyr Lys Leu Asn Val Gly Asp Tyr Phe Val Leu Thr Ser 5540 5545 5550 His Thr Val Met Pro Leu Ser Ala Pro Thr Leu Val Pro Gln Glu 5555 5560 5565 His Tyr Val Arg Ile Thr Gly Leu Tyr Pro Thr Leu Asn Ile Ser 5570 5575 5580 Asp Glu Phe Ser Ser Asn Val Ala Asn Tyr Gln Lys Val Gly Met 5585 5590 5595 Gln Lys Tyr Ser Thr Leu Gln Gly Pro Pro Gly Thr Gly Lys Ser 5600 5605 5610 His Phe Ala Ile Gly Leu Ala Leu Tyr Tyr Pro Ser Ala Arg Ile 5615 5620 5625 Val Tyr Thr Ala Cys Ser His Ala Ala Val Asp Ala Leu Cys Glu 5630 5635 5640 Lys Ala Leu Lys Tyr Leu Pro Ile Asp Lys Cys Ser Arg Ile Ile 5645 5650 5655 Pro Ala Arg Ala Arg Val Glu Cys Phe Asp Lys Phe Lys Val Asn 5660 5665 5670 Ser Thr Leu Glu Gln Tyr Val Phe Cys Thr Val Asn Ala Leu Pro 5675 5680 5685 Glu Thr Thr Ala Asp Ile Val Val Phe Asp Glu Ile Ser Met Ala 5690 5695 5700 Thr Asn Tyr Asp Leu Ser Val Val Asn Ala Arg Leu Arg Ala Lys 5705 5710 5715 His Tyr Val Tyr Ile Gly Asp Pro Ala Gln Leu Pro Ala Pro Arg 5720 5725 5730 Thr Leu Leu Thr Lys Gly Thr Leu Glu Pro Glu Tyr Phe Asn Ser 5735 5740 5745 Val Cys Arg Leu Met Lys Thr Ile Gly Pro Asp Met Phe Leu Gly 5750 5755 5760 Thr Cys Arg Arg Cys Pro Ala Glu Ile Val Asp Thr Val Ser Ala 5765 5770 5775 Leu Val Tyr Asp Asn Lys Leu Lys Ala His Lys Asp Lys Ser Ala 5780 5785 5790 Gln Cys Phe Lys Met Phe Tyr Lys Gly Val Ile Thr His Asp Val 5795 5800 5805 Ser Ser Ala Ile Asn Arg Pro Gln Ile Gly Val Val Arg Glu Phe 5810 5815 5820 Leu Thr Arg Asn Pro Ala Trp Arg Lys Ala Val Phe Ile Ser Pro 5825 5830 5835 Tyr Asn Ser Gln Asn Ala Val Ala Ser Lys Ile Leu Gly Leu Pro 5840 5845 5850 Thr Gln Thr Val Asp Ser Ser Gln Gly Ser Glu Tyr Asp Tyr Val 5855 5860 5865 Ile Phe Thr Gln Thr Thr Glu Thr Ala His Ser Cys Asn Val Asn 5870 5875 5880 Arg Phe Asn Val Ala Ile Thr Arg Ala Lys Val Gly Ile Leu Cys 5885 5890 5895 Ile Met Ser Asp Arg Asp Leu Tyr Asp Lys Leu Gln Phe Thr Ser 5900 5905 5910 Leu Glu Ile Pro Arg Arg Asn Val Ala Thr Leu Gln Ala Glu Asn 5915 5920 5925 Val Thr Gly Leu Phe Lys Asp Cys Ser Lys Val Ile Thr Gly Leu 5930 5935 5940 His Pro Thr Gln Ala Pro Thr His Leu Ser Val Asp Thr Lys Phe 5945 5950 5955 Lys Thr Glu Gly Leu Cys Val Asp Ile Pro Gly Ile Pro Lys Asp 5960 5965 5970 Met Thr Tyr Arg Arg Leu Ile Ser Met Met Gly Phe Lys Met Asn 5975 5980 5985 Tyr Gln Val Asn Gly Tyr Pro Asn Met Phe Ile Thr Arg Glu Glu 5990 5995 6000 Ala Ile Arg His Val Arg Ala Trp Ile Gly Phe Asp Val Glu Gly 6005 6010 6015 Cys His Ala Thr Arg Glu Ala Val Gly Thr Asn Leu Pro Leu Gln 6020 6025 6030 Leu Gly Phe Ser Thr Gly Val Asn Leu Val Ala Val Pro Thr Gly 6035 6040 6045 Tyr Val Asp Thr Pro Asn Asn Thr Asp Phe Ser Arg Val Ser Ala 6050 6055 6060 Lys Pro Pro Pro Gly Asp Gln Phe Lys His Leu Ile Pro Leu Met 6065 6070 6075 Tyr Lys Gly Leu Pro Trp Asn Val Val Arg Ile Lys Ile Val Gln 6080 6085 6090 Met Leu Ser Asp Thr Leu Lys Asn Leu Ser Asp Arg Val Val Phe 6095 6100 6105 Val Leu Trp Ala His Gly Phe Glu Leu Thr Ser Met Lys Tyr Phe 6110 6115 6120 Val Lys Ile Gly Pro Glu Arg Thr Cys Cys Leu Cys Asp Arg Arg 6125 6130 6135 Ala Thr Cys Phe Ser Thr Ala Ser Asp Thr Tyr Ala Cys Trp His 6140 6145 6150 His Ser Ile Gly Phe Asp Tyr Val Tyr Asn Pro Phe Met Ile Asp 6155 6160 6165 Val Gln Gln Trp Gly Phe Thr Gly Asn Leu Gln Ser Asn His Asp 6170 6175 6180 Leu Tyr Cys Gln Val His Gly Asn Ala His Val Ala Ser Cys Asp 6185 6190 6195 Ala Ile Met Thr Arg Cys Leu Ala Val His Glu Cys Phe Val Lys 6200 6205 6210 Arg Val Asp Trp Thr Ile Glu Tyr Pro Ile Ile Gly Asp Glu Leu 6215 6220 6225 Lys Ile Asn Ala Ala Cys Arg Lys Val Gln His Met Val Val Lys 6230 6235 6240 Ala Ala Leu Leu Ala Asp Lys Phe Pro Val Leu His Asp Ile Gly 6245 6250 6255 Asn Pro Lys Ala Ile Lys Cys Val Pro Gln Ala Asp Val Glu Trp 6260 6265 6270 Lys Phe Tyr Asp Ala Gln Pro Cys Ser Asp Lys Ala Tyr Lys Ile 6275 6280 6285 Glu Glu Leu Phe Tyr Ser Tyr Ala Thr His Ser Asp Lys Phe Thr 6290 6295 6300 Asp Gly Val Cys Leu Phe Trp Asn Cys Asn Val Asp Arg Tyr Pro 6305 6310 6315 Ala Asn Ser Ile Val Cys Arg Phe Asp Thr Arg Val Leu Ser Asn 6320 6325 6330 Leu Asn Leu Pro Gly Cys Asp Gly Gly Ser Leu Tyr Val Asn Lys 6335 6340 6345 His Ala Phe His Thr Pro Ala Phe Asp Lys Ser Ala Phe Val Asn 6350 6355 6360 Leu Lys Gln Leu Pro Phe Phe Tyr Tyr Ser Asp Ser Pro Cys Glu 6365 6370 6375 Ser His Gly Lys Gln Val Val Ser Asp Ile Asp Tyr Val Pro Leu 6380 6385 6390 Lys Ser Ala Thr Cys Ile Thr Arg Cys Asn Leu Gly Gly Ala Val 6395 6400 6405 Cys Arg His His Ala Asn Glu Tyr Arg Leu Tyr Leu Asp Ala Tyr 6410 6415 6420 Asn Met Met Ile Ser Ala Gly Phe Ser Leu Trp Val Tyr Lys Gln 6425 6430 6435 Phe Asp Thr Tyr Asn Leu Trp Asn Thr Phe Thr Arg Leu Gln Ser 6440 6445 6450 Leu Glu Asn Val Ala Phe Asn Val Val Asn Lys Gly His Phe Asp 6455 6460 6465 Gly Gln Gln Gly Glu Val Pro Val Ser Ile Ile Asn Asn Thr Val 6470 6475 6480 Tyr Thr Lys Val Asp Gly Val Asp Val Glu Leu Phe Glu Asn Lys 6485 6490 6495 Thr Thr Leu Pro Val Asn Val Ala Phe Glu Leu Trp Ala Lys Arg 6500 6505 6510 Asn Ile Lys Pro Val Pro Glu Val Lys Ile Leu Asn Asn Leu Gly 6515 6520 6525 Val Asp Ile Ala Ala Asn Thr Val Ile Trp Asp Tyr Lys Arg Asp 6530 6535 6540 Ala Pro Ala His Ile Ser Thr Ile Gly Val Cys Ser Met Thr Asp 6545 6550 6555 Ile Ala Lys Lys Pro Thr Glu Thr Ile Cys Ala Pro Leu Thr Val 6560 6565 6570 Phe Phe Asp Gly Arg Val Asp Gly Gln Val Asp Leu Phe Arg Asn 6575 6580 6585 Ala Arg Asn Gly Val Leu Ile Thr Glu Gly Ser Val Lys Gly Leu 6590 6595 6600 Gln Pro Ser Val Gly Pro Lys Gln Ala Ser Leu Asn Gly Val Thr 6605 6610 6615 Leu Ile Gly Glu Ala Val Lys Thr Gln Phe Asn Tyr Tyr Lys Lys 6620 6625 6630 Val Asp Gly Val Val Gln Gln Leu Pro Glu Thr Tyr Phe Thr Gln 6635 6640 6645 Ser Arg Asn Leu Gln Glu Phe Lys Pro Arg Ser Gln Met Glu Ile 6650 6655 6660 Asp Phe Leu Glu Leu Ala Met Asp Glu Phe Ile Glu Arg Tyr Lys 6665 6670 6675 Leu Glu Gly Tyr Ala Phe Glu His Ile Val Tyr Gly Asp Phe Ser 6680 6685 6690 His Ser Gln Leu Gly Gly Leu His Leu Leu Ile Gly Leu Ala Lys 6695 6700 6705 Arg Phe Lys Glu Ser Pro Phe Glu Leu Glu Asp Phe Ile Pro Met 6710 6715 6720 Asp Ser Thr Val Lys Asn Tyr Phe Ile Thr Asp Ala Gln Thr Gly 6725 6730 6735 Ser Ser Lys Cys Val Cys Ser Val Ile Asp Leu Leu Leu Asp Asp 6740 6745 6750 Phe Val Glu Ile Ile Lys Ser Gln Asp Leu Ser Val Val Ser Lys 6755 6760 6765 Val Val Lys Val Thr Ile Asp Tyr Thr Glu Ile Ser Phe Met Leu 6770 6775 6780 Trp Cys Lys Asp Gly His Val Glu Thr Phe Tyr Pro Lys Leu Gln 6785 6790 6795 Ser Ser Gln Ala Trp Gln Pro Gly Val Ala Met Pro Asn Leu Tyr 6800 6805 6810 Lys Met Gln Arg Met Leu Leu Glu Lys Cys Asp Leu Gln Asn Tyr 6815 6820 6825 Gly Asp Ser Ala Thr Leu Pro Lys Gly Ile Met Met Asn Val Ala 6830 6835 6840 Lys Tyr Thr Gln Leu Cys Gln Tyr Leu Asn Thr Leu Thr Leu Ala 6845 6850 6855 Val Pro Tyr Asn Met Arg Val Ile His Phe Gly Ala Gly Ser Asp 6860 6865 6870 Lys Gly Val Ala Pro Gly Thr Ala Val Leu Arg Gln Trp Leu Pro 6875 6880 6885 Thr Gly Thr Leu Leu Val Asp Ser Asp Leu Asn Asp Phe Val Ser 6890 6895 6900 Asp Ala Asp Ser Thr Leu Ile Gly Asp Cys Ala Thr Val His Thr 6905 6910 6915 Ala Asn Lys Trp Asp Leu Ile Ile Ser Asp Met Tyr Asp Pro Lys 6920 6925 6930 Thr Lys Asn Val Thr Lys Glu Asn Asp Ser Lys Glu Gly Phe Phe 6935 6940 6945 Thr Tyr Ile Cys Gly Phe Ile Gln Gln Lys Leu Ala Leu Gly Gly 6950 6955 6960 Ser Val Ala Ile Lys Ile Thr Glu His Ser Trp Asn Ala Asp Leu 6965 6970 6975 Tyr Lys Leu Met Gly His Phe Ala Trp Trp Thr Ala Phe Val Thr 6980 6985 6990 Asn Val Asn Ala Ser Ser Ser Glu Ala Phe Leu Ile Gly Cys Asn 6995 7000 7005 Tyr Leu Gly Lys Pro Arg Glu Gln Ile Asp Gly Tyr Val Met His 7010 7015 7020 Ala Asn Tyr Ile Phe Trp Arg Asn Thr Asn Pro Ile Gln Leu Ser 7025 7030 7035 Ser Tyr Ser Leu Phe Asp Met Ser Lys Phe Pro Leu Lys Leu Arg 7040 7045 7050 Gly Thr Ala Val Met Ser Leu Lys Glu Gly Gln Ile Asn Asp Met 7055 7060 7065 Ile Leu Ser Leu Leu Ser Lys Gly Arg Leu Ile Ile Arg Glu Asn 7070 7075 7080 Asn Arg Val Val Ile Ser Ser Asp Val Leu Val Asn Asn 7085 7090 7095 <210> 552 <211> 4405 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 552 Met Glu Ser Leu Val Pro Gly Phe Asn Glu Lys Thr His Val Gln Leu 1 5 10 15 Ser Leu Pro Val Leu Gln Val Arg Asp Val Leu Val Arg Gly Phe Gly 20 25 30 Asp Ser Val Glu Glu Val Leu Ser Glu Ala Arg Gln His Leu Lys Asp 35 40 45 Gly Thr Cys Gly Leu Val Glu Val Glu Lys Gly Val Leu Pro Gln Leu 50 55 60 Glu Gln Pro Tyr Val Phe Ile Lys Arg Ser Asp Ala Arg Thr Ala Pro 65 70 75 80 His Gly His Val Met Val Glu Leu Val Ala Glu Leu Glu Gly Ile Gln 85 90 95 Tyr Gly Arg Ser Gly Glu Thr Leu Gly Val Leu Val Pro His Val Gly 100 105 110 Glu Ile Pro Val Ala Tyr Arg Lys Val Leu Leu Arg Lys Asn Gly Asn 115 120 125 Lys Gly Ala Gly Gly His Ser Tyr Gly Ala Asp Leu Lys Ser Phe Asp 130 135 140 Leu Gly Asp Glu Leu Gly Thr Asp Pro Tyr Glu Asp Phe Gln Glu Asn 145 150 155 160 Trp Asn Thr Lys His Ser Ser Gly Val Thr Arg Glu Leu Met Arg Glu 165 170 175 Leu Asn Gly Gly Ala Tyr Thr Arg Tyr Val Asp Asn Asn Phe Cys Gly 180 185 190 Pro Asp Gly Tyr Pro Leu Glu Cys Ile Lys Asp Leu Leu Ala Arg Ala 195 200 205 Gly Lys Ala Ser Cys Thr Leu Ser Glu Gln Leu Asp Phe Ile Asp Thr 210 215 220 Lys Arg Gly Val Tyr Cys Cys Arg Glu His Glu His Glu Ile Ala Trp 225 230 235 240 Tyr Thr Glu Arg Ser Glu Lys Ser Tyr Glu Leu Gln Thr Pro Phe Glu 245 250 255 Ile Lys Leu Ala Lys Lys Phe Asp Thr Phe Asn Gly Glu Cys Pro Asn 260 265 270 Phe Val Phe Pro Leu Asn Ser Ile Ile Lys Thr Ile Gln Pro Arg Val 275 280 285 Glu Lys Lys Lys Leu Asp Gly Phe Met Gly Arg Ile Arg Ser Val Tyr 290 295 300 Pro Val Ala Ser Pro Asn Glu Cys Asn Gln Met Cys Leu Ser Thr Leu 305 310 315 320 Met Lys Cys Asp His Cys Gly Glu Thr Ser Trp Gln Thr Gly Asp Phe 325 330 335 Val Lys Ala Thr Cys Glu Phe Cys Gly Thr Glu Asn Leu Thr Lys Glu 340 345 350 Gly Ala Thr Thr Cys Gly Tyr Leu Pro Gln Asn Ala Val Val Lys Ile 355 360 365 Tyr Cys Pro Ala Cys His Asn Ser Glu Val Gly Pro Glu His Ser Leu 370 375 380 Ala Glu Tyr His Asn Glu Ser Gly Leu Lys Thr Ile Leu Arg Lys Gly 385 390 395 400 Gly Arg Thr Ile Ala Phe Gly Gly Cys Val Phe Ser Tyr Val Gly Cys 405 410 415 His Asn Lys Cys Ala Tyr Trp Val Pro Arg Ala Ser Ala Asn Ile Gly 420 425 430 Cys Asn His Thr Gly Val Val Gly Glu Gly Ser Glu Gly Leu Asn Asp 435 440 445 Asn Leu Leu Glu Ile Leu Gln Lys Glu Lys Val Asn Ile Asn Ile Val 450 455 460 Gly Asp Phe Lys Leu Asn Glu Glu Ile Ala Ile Ile Leu Ala Ser Phe 465 470 475 480 Ser Ala Ser Thr Ser Ala Phe Val Glu Thr Val Lys Gly Leu Asp Tyr 485 490 495 Lys Ala Phe Lys Gln Ile Val Glu Ser Cys Gly Asn Phe Lys Val Thr 500 505 510 Lys Gly Lys Ala Lys Lys Gly Ala Trp Asn Ile Gly Glu Gln Lys Ser 515 520 525 Ile Leu Ser Pro Leu Tyr Ala Phe Ala Ser Glu Ala Ala Arg Val Val 530 535 540 Arg Ser Ile Phe Ser Arg Thr Leu Glu Thr Ala Gln Asn Ser Val Arg 545 550 555 560 Val Leu Gln Lys Ala Ala Ile Thr Ile Leu Asp Gly Ile Ser Gln Tyr 565 570 575 Ser Leu Arg Leu Ile Asp Ala Met Met Phe Thr Ser Asp Leu Ala Thr 580 585 590 Asn Asn Leu Val Val Met Ala Tyr Ile Thr Gly Gly Val Val Gln Leu 595 600 605 Thr Ser Gln Trp Leu Thr Asn Ile Phe Gly Thr Val Tyr Glu Lys Leu 610 615 620 Lys Pro Val Leu Asp Trp Leu Glu Glu Lys Phe Lys Glu Gly Val Glu 625 630 635 640 Phe Leu Arg Asp Gly Trp Glu Ile Val Lys Phe Ile Ser Thr Cys Ala 645 650 655 Cys Glu Ile Val Gly Gly Gln Ile Val Thr Cys Ala Lys Glu Ile Lys 660 665 670 Glu Ser Val Gln Thr Phe Phe Lys Leu Val Asn Lys Phe Leu Ala Leu 675 680 685 Cys Ala Asp Ser Ile Ile Ile Gly Gly Ala Lys Leu Lys Ala Leu Asn 690 695 700 Leu Gly Glu Thr Phe Val Thr His Ser Lys Gly Leu Tyr Arg Lys Cys 705 710 715 720 Val Lys Ser Arg Glu Glu Thr Gly Leu Leu Met Pro Leu Lys Ala Pro 725 730 735 Lys Glu Ile Ile Phe Leu Glu Gly Glu Thr Leu Pro Thr Glu Val Leu 740 745 750 Thr Glu Glu Val Val Leu Lys Thr Gly Asp Leu Gln Pro Leu Glu Gln 755 760 765 Pro Thr Ser Glu Ala Val Glu Ala Pro Leu Val Gly Thr Pro Val Cys 770 775 780 Ile Asn Gly Leu Met Leu Leu Glu Ile Lys Asp Thr Glu Lys Tyr Cys 785 790 795 800 Ala Leu Ala Pro Asn Met Met Val Thr Asn Asn Thr Phe Thr Leu Lys 805 810 815 Gly Gly Ala Pro Thr Lys Val Thr Phe Gly Asp Asp Thr Val Ile Glu 820 825 830 Val Gln Gly Tyr Lys Ser Val Asn Ile Thr Phe Glu Leu Asp Glu Arg 835 840 845 Ile Asp Lys Val Leu Asn Glu Lys Cys Ser Ala Tyr Thr Val Glu Leu 850 855 860 Gly Thr Glu Val Asn Glu Phe Ala Cys Val Val Ala Asp Ala Val Ile 865 870 875 880 Lys Thr Leu Gln Pro Val Ser Glu Leu Leu Thr Pro Leu Gly Ile Asp 885 890 895 Leu Asp Glu Trp Ser Met Ala Thr Tyr Tyr Leu Phe Asp Glu Ser Gly 900 905 910 Glu Phe Lys Leu Ala Ser His Met Tyr Cys Ser Phe Tyr Pro Pro Asp 915 920 925 Glu Asp Glu Glu Glu Gly Asp Cys Glu Glu Glu Glu Phe Glu Pro Ser 930 935 940 Thr Gln Tyr Glu Tyr Gly Thr Glu Asp Asp Tyr Gln Gly Lys Pro Leu 945 950 955 960 Glu Phe Gly Ala Thr Ser Ala Ala Leu Gln Pro Glu Glu Glu Gln Glu 965 970 975 Glu Asp Trp Leu Asp Asp Asp Ser Gln Gln Thr Val Gly Gln Gln Asp 980 985 990 Gly Ser Glu Asp Asn Gln Thr Thr Thr Ile Gln Thr Ile Val Glu Val 995 1000 1005 Gln Pro Gln Leu Glu Met Glu Leu Thr Pro Val Val Gln Thr Ile 1010 1015 1020 Glu Val Asn Ser Phe Ser Gly Tyr Leu Lys Leu Thr Asp Asn Val 1025 1030 1035 Tyr Ile Lys Asn Ala Asp Ile Val Glu Glu Ala Lys Lys Val Lys 1040 1045 1050 Pro Thr Val Val Val Asn Ala Ala Asn Val Tyr Leu Lys His Gly 1055 1060 1065 Gly Gly Val Ala Gly Ala Leu Asn Lys Ala Thr Asn Asn Ala Met 1070 1075 1080 Gln Val Glu Ser Asp Asp Tyr Ile Ala Thr Asn Gly Pro Leu Lys 1085 1090 1095 Val Gly Gly Ser Cys Val Leu Ser Gly His Asn Leu Ala Lys His 1100 1105 1110 Cys Leu His Val Val Gly Pro Asn Val Asn Lys Gly Glu Asp Ile 1115 1120 1125 Gln Leu Leu Lys Ser Ala Tyr Glu Asn Phe Asn Gln His Glu Val 1130 1135 1140 Leu Leu Ala Pro Leu Leu Ser Ala Gly Ile Phe Gly Ala Asp Pro 1145 1150 1155 Ile His Ser Leu Arg Val Cys Val Asp Thr Val Arg Thr Asn Val 1160 1165 1170 Tyr Leu Ala Val Phe Asp Lys Asn Leu Tyr Asp Lys Leu Val Ser 1175 1180 1185 Ser Phe Leu Glu Met Lys Ser Glu Lys Gln Val Glu Gln Lys Ile 1190 1195 1200 Ala Glu Ile Pro Lys Glu Glu Val Lys Pro Phe Ile Thr Glu Ser 1205 1210 1215 Lys Pro Ser Val Glu Gln Arg Lys Gln Asp Asp Lys Lys Ile Lys 1220 1225 1230 Ala Cys Val Glu Glu Val Thr Thr Thr Leu Glu Glu Thr Lys Phe 1235 1240 1245 Leu Thr Glu Asn Leu Leu Leu Tyr Ile Asp Ile Asn Gly Asn Leu 1250 1255 1260 His Pro Asp Ser Ala Thr Leu Val Ser Asp Ile Asp Ile Thr Phe 1265 1270 1275 Leu Lys Lys Asp Ala Pro Tyr Ile Val Gly Asp Val Val Gln Glu 1280 1285 1290 Gly Val Leu Thr Ala Val Val Ile Pro Thr Lys Lys Ala Gly Gly 1295 1300 1305 Thr Thr Glu Met Leu Ala Lys Ala Leu Arg Lys Val Pro Thr Asp 1310 1315 1320 Asn Tyr Ile Thr Thr Tyr Pro Gly Gln Gly Leu Asn Gly Tyr Thr 1325 1330 1335 Val Glu Glu Ala Lys Thr Val Leu Lys Lys Cys Lys Ser Ala Phe 1340 1345 1350 Tyr Ile Leu Pro Ser Ile Ile Ser Asn Glu Lys Gln Glu Ile Leu 1355 1360 1365 Gly Thr Val Ser Trp Asn Leu Arg Glu Met Leu Ala His Ala Glu 1370 1375 1380 Glu Thr Arg Lys Leu Met Pro Val Cys Val Glu Thr Lys Ala Ile 1385 1390 1395 Val Ser Thr Ile Gln Arg Lys Tyr Lys Gly Ile Lys Ile Gln Glu 1400 1405 1410 Gly Val Val Asp Tyr Gly Ala Arg Phe Tyr Phe Tyr Thr Ser Lys 1415 1420 1425 Thr Thr Val Ala Ser Leu Ile Asn Thr Leu Asn Asp Leu Asn Glu 1430 1435 1440 Thr Leu Val Thr Met Pro Leu Gly Tyr Val Thr His Gly Leu Asn 1445 1450 1455 Leu Glu Glu Ala Ala Arg Tyr Met Arg Ser Leu Lys Val Pro Ala 1460 1465 1470 Thr Val Ser Val Ser Ser Pro Asp Ala Val Thr Ala Tyr Asn Gly 1475 1480 1485 Tyr Leu Thr Ser Ser Ser Lys Thr Pro Glu Glu His Phe Ile Glu 1490 1495 1500 Thr Ile Ser Leu Ala Gly Ser Tyr Lys Asp Trp Ser Tyr Ser Gly 1505 1510 1515 Gln Ser Thr Gln Leu Gly Ile Glu Phe Leu Lys Arg Gly Asp Lys 1520 1525 1530 Ser Val Tyr Tyr Thr Ser Asn Pro Thr Thr Phe His Leu Asp Gly 1535 1540 1545 Glu Val Ile Thr Phe Asp Asn Leu Lys Thr Leu Leu Ser Leu Arg 1550 1555 1560 Glu Val Arg Thr Ile Lys Val Phe Thr Thr Val Asp Asn Ile Asn 1565 1570 1575 Leu His Thr Gln Val Val Asp Met Ser Met Thr Tyr Gly Gln Gln 1580 1585 1590 Phe Gly Pro Thr Tyr Leu Asp Gly Ala Asp Val Thr Lys Ile Lys 1595 1600 1605 Pro His Asn Ser His Glu Gly Lys Thr Phe Tyr Val Leu Pro Asn 1610 1615 1620 Asp Asp Thr Leu Arg Val Glu Ala Phe Glu Tyr Tyr His Thr Thr 1625 1630 1635 Asp Pro Ser Phe Leu Gly Arg Tyr Met Ser Ala Leu Asn His Thr 1640 1645 1650 Lys Lys Trp Lys Tyr Pro Gln Val Asn Gly Leu Thr Ser Ile Lys 1655 1660 1665 Trp Ala Asp Asn Asn Cys Tyr Leu Ala Thr Ala Leu Leu Thr Leu 1670 1675 1680 Gln Gln Ile Glu Leu Lys Phe Asn Pro Pro Ala Leu Gln Asp Ala 1685 1690 1695 Tyr Tyr Arg Ala Arg Ala Gly Glu Ala Ala Asn Phe Cys Ala Leu 1700 1705 1710 Ile Leu Ala Tyr Cys Asn Lys Thr Val Gly Glu Leu Gly Asp Val 1715 1720 1725 Arg Glu Thr Met Ser Tyr Leu Phe Gln His Ala Asn Leu Asp Ser 1730 1735 1740 Cys Lys Arg Val Leu Asn Val Val Cys Lys Thr Cys Gly Gln Gln 1745 1750 1755 Gln Thr Thr Leu Lys Gly Val Glu Ala Val Met Tyr Met Gly Thr 1760 1765 1770 Leu Ser Tyr Glu Gln Phe Lys Lys Gly Val Gln Ile Pro Cys Thr 1775 1780 1785 Cys Gly Lys Gln Ala Thr Lys Tyr Leu Val Gln Gln Glu Ser Pro 1790 1795 1800 Phe Val Met Met Ser Ala Pro Pro Ala Gln Tyr Glu Leu Lys His 1805 1810 1815 Gly Thr Phe Thr Cys Ala Ser Glu Tyr Thr Gly Asn Tyr Gln Cys 1820 1825 1830 Gly His Tyr Lys His Ile Thr Ser Lys Glu Thr Leu Tyr Cys Ile 1835 1840 1845 Asp Gly Ala Leu Leu Thr Lys Ser Ser Glu Tyr Lys Gly Pro Ile 1850 1855 1860 Thr Asp Val Phe Tyr Lys Glu Asn Ser Tyr Thr Thr Thr Ile Lys 1865 1870 1875 Pro Val Thr Tyr Lys Leu Asp Gly Val Val Cys Thr Glu Ile Asp 1880 1885 1890 Pro Lys Leu Asp Asn Tyr Tyr Lys Lys Asp Asn Ser Tyr Phe Thr 1895 1900 1905 Glu Gln Pro Ile Asp Leu Val Pro Asn Gln Pro Tyr Pro Asn Ala 1910 1915 1920 Ser Phe Asp Asn Phe Lys Phe Val Cys Asp Asn Ile Lys Phe Ala 1925 1930 1935 Asp Asp Leu Asn Gln Leu Thr Gly Tyr Lys Lys Pro Ala Ser Arg 1940 1945 1950 Glu Leu Lys Val Thr Phe Phe Pro Asp Leu Asn Gly Asp Val Val 1955 1960 1965 Ala Ile Asp Tyr Lys His Tyr Thr Pro Ser Phe Lys Lys Gly Ala 1970 1975 1980 Lys Leu Leu His Lys Pro Ile Val Trp His Val Asn Asn Ala Thr 1985 1990 1995 Asn Lys Ala Thr Tyr Lys Pro Asn Thr Trp Cys Ile Arg Cys Leu 2000 2005 2010 Trp Ser Thr Lys Pro Val Glu Thr Ser Asn Ser Phe Asp Val Leu 2015 2020 2025 Lys Ser Glu Asp Ala Gln Gly Met Asp Asn Leu Ala Cys Glu Asp 2030 2035 2040 Leu Lys Pro Val Ser Glu Glu Val Val Glu Asn Pro Thr Ile Gln 2045 2050 2055 Lys Asp Val Leu Glu Cys Asn Val Lys Thr Thr Glu Val Val Gly 2060 2065 2070 Asp Ile Ile Leu Lys Pro Ala Asn Asn Ser Leu Lys Ile Thr Glu 2075 2080 2085 Glu Val Gly His Thr Asp Leu Met Ala Ala Tyr Val Asp Asn Ser 2090 2095 2100 Ser Leu Thr Ile Lys Lys Pro Asn Glu Leu Ser Arg Val Leu Gly 2105 2110 2115 Leu Lys Thr Leu Ala Thr His Gly Leu Ala Ala Val Asn Ser Val 2120 2125 2130 Pro Trp Asp Thr Ile Ala Asn Tyr Ala Lys Pro Phe Leu Asn Lys 2135 2140 2145 Val Val Ser Thr Thr Thr Asn Ile Val Thr Arg Cys Leu Asn Arg 2150 2155 2160 Val Cys Thr Asn Tyr Met Pro Tyr Phe Phe Thr Leu Leu Leu Gln 2165 2170 2175 Leu Cys Thr Phe Thr Arg Ser Thr Asn Ser Arg Ile Lys Ala Ser 2180 2185 2190 Met Pro Thr Thr Ile Ala Lys Asn Thr Val Lys Ser Val Gly Lys 2195 2200 2205 Phe Cys Leu Glu Ala Ser Phe Asn Tyr Leu Lys Ser Pro Asn Phe 2210 2215 2220 Ser Lys Leu Ile Asn Ile Ile Ile Trp Phe Leu Leu Leu Ser Val 2225 2230 2235 Cys Leu Gly Ser Leu Ile Tyr Ser Thr Ala Ala Leu Gly Val Leu 2240 2245 2250 Met Ser Asn Leu Gly Met Pro Ser Tyr Cys Thr Gly Tyr Arg Glu 2255 2260 2265 Gly Tyr Leu Asn Ser Thr Asn Val Thr Ile Ala Thr Tyr Cys Thr 2270 2275 2280 Gly Ser Ile Pro Cys Ser Val Cys Leu Ser Gly Leu Asp Ser Leu 2285 2290 2295 Asp Thr Tyr Pro Ser Leu Glu Thr Ile Gln Ile Thr Ile Ser Ser 2300 2305 2310 Phe Lys Trp Asp Leu Thr Ala Phe Gly Leu Val Ala Glu Trp Phe 2315 2320 2325 Leu Ala Tyr Ile Leu Phe Thr Arg Phe Phe Tyr Val Leu Gly Leu 2330 2335 2340 Ala Ala Ile Met Gln Leu Phe Phe Ser Tyr Phe Ala Val His Phe 2345 2350 2355 Ile Ser Asn Ser Trp Leu Met Trp Leu Ile Ile Asn Leu Val Gln 2360 2365 2370 Met Ala Pro Ile Ser Ala Met Val Arg Met Tyr Ile Phe Phe Ala 2375 2380 2385 Ser Phe Tyr Tyr Val Trp Lys Ser Tyr Val His Val Val Asp Gly 2390 2395 2400 Cys Asn Ser Ser Thr Cys Met Met Cys Tyr Lys Arg Asn Arg Ala 2405 2410 2415 Thr Arg Val Glu Cys Thr Thr Ile Val Asn Gly Val Arg Arg Ser 2420 2425 2430 Phe Tyr Val Tyr Ala Asn Gly Gly Lys Gly Phe Cys Lys Leu His 2435 2440 2445 Asn Trp Asn Cys Val Asn Cys Asp Thr Phe Cys Ala Gly Ser Thr 2450 2455 2460 Phe Ile Ser Asp Glu Val Ala Arg Asp Leu Ser Leu Gln Phe Lys 2465 2470 2475 Arg Pro Ile Asn Pro Thr Asp Gln Ser Ser Tyr Ile Val Asp Ser 2480 2485 2490 Val Thr Val Lys Asn Gly Ser Ile His Leu Tyr Phe Asp Lys Ala 2495 2500 2505 Gly Gln Lys Thr Tyr Glu Arg His Ser Leu Ser His Phe Val Asn 2510 2515 2520 Leu Asp Asn Leu Arg Ala Asn Asn Thr Lys Gly Ser Leu Pro Ile 2525 2530 2535 Asn Val Ile Val Phe Asp Gly Lys Ser Lys Cys Glu Glu Ser Ser 2540 2545 2550 Ala Lys Ser Ala Ser Val Tyr Tyr Ser Gln Leu Met Cys Gln Pro 2555 2560 2565 Ile Leu Leu Leu Asp Gln Ala Leu Val Ser Asp Val Gly Asp Ser 2570 2575 2580 Ala Glu Val Ala Val Lys Met Phe Asp Ala Tyr Val Asn Thr Phe 2585 2590 2595 Ser Ser Thr Phe Asn Val Pro Met Glu Lys Leu Lys Thr Leu Val 2600 2605 2610 Ala Thr Ala Glu Ala Glu Leu Ala Lys Asn Val Ser Leu Asp Asn 2615 2620 2625 Val Leu Ser Thr Phe Ile Ser Ala Ala Arg Gln Gly Phe Val Asp 2630 2635 2640 Ser Asp Val Glu Thr Lys Asp Val Val Glu Cys Leu Lys Leu Ser 2645 2650 2655 His Gln Ser Asp Ile Glu Val Thr Gly Asp Ser Cys Asn Asn Tyr 2660 2665 2670 Met Leu Thr Tyr Asn Lys Val Glu Asn Met Thr Pro Arg Asp Leu 2675 2680 2685 Gly Ala Cys Ile Asp Cys Ser Ala Arg His Ile Asn Ala Gln Val 2690 2695 2700 Ala Lys Ser His Asn Ile Ala Leu Ile Trp Asn Val Lys Asp Phe 2705 2710 2715 Met Ser Leu Ser Glu Gln Leu Arg Lys Gln Ile Arg Ser Ala Ala 2720 2725 2730 Lys Lys Asn Asn Leu Pro Phe Lys Leu Thr Cys Ala Thr Thr Arg 2735 2740 2745 Gln Val Val Asn Val Val Thr Thr Lys Ile Ala Leu Lys Gly Gly 2750 2755 2760 Lys Ile Val Asn Asn Trp Leu Lys Gln Leu Ile Lys Val Thr Leu 2765 2770 2775 Val Phe Leu Phe Val Ala Ala Ile Phe Tyr Leu Ile Thr Pro Val 2780 2785 2790 His Val Met Ser Lys His Thr Asp Phe Ser Ser Glu Ile Ile Gly 2795 2800 2805 Tyr Lys Ala Ile Asp Gly Gly Val Thr Arg Asp Ile Ala Ser Thr 2810 2815 2820 Asp Thr Cys Phe Ala Asn Lys His Ala Asp Phe Asp Thr Trp Phe 2825 2830 2835 Ser Gln Arg Gly Gly Ser Tyr Thr Asn Asp Lys Ala Cys Pro Leu 2840 2845 2850 Ile Ala Ala Val Ile Thr Arg Glu Val Gly Phe Val Val Pro Gly 2855 2860 2865 Leu Pro Gly Thr Ile Leu Arg Thr Thr Asn Gly Asp Phe Leu His 2870 2875 2880 Phe Leu Pro Arg Val Phe Ser Ala Val Gly Asn Ile Cys Tyr Thr 2885 2890 2895 Pro Ser Lys Leu Ile Glu Tyr Thr Asp Phe Ala Thr Ser Ala Cys 2900 2905 2910 Val Leu Ala Ala Glu Cys Thr Ile Phe Lys Asp Ala Ser Gly Lys 2915 2920 2925 Pro Val Pro Tyr Cys Tyr Asp Thr Asn Val Leu Glu Gly Ser Val 2930 2935 2940 Ala Tyr Glu Ser Leu Arg Pro Asp Thr Arg Tyr Val Leu Met Asp 2945 2950 2955 Gly Ser Ile Ile Gln Phe Pro Asn Thr Tyr Leu Glu Gly Ser Val 2960 2965 2970 Arg Val Val Thr Thr Phe Asp Ser Glu Tyr Cys Arg His Gly Thr 2975 2980 2985 Cys Glu Arg Ser Glu Ala Gly Val Cys Val Ser Thr Ser Gly Arg 2990 2995 3000 Trp Val Leu Asn Asn Asp Tyr Tyr Arg Ser Leu Pro Gly Val Phe 3005 3010 3015 Cys Gly Val Asp Ala Val Asn Leu Leu Thr Asn Met Phe Thr Pro 3020 3025 3030 Leu Ile Gln Pro Ile Gly Ala Leu Asp Ile Ser Ala Ser Ile Val 3035 3040 3045 Ala Gly Gly Ile Val Ala Ile Val Val Thr Cys Leu Ala Tyr Tyr 3050 3055 3060 Phe Met Arg Phe Arg Arg Ala Phe Gly Glu Tyr Ser His Val Val 3065 3070 3075 Ala Phe Asn Thr Leu Leu Phe Leu Met Ser Phe Thr Val Leu Cys 3080 3085 3090 Leu Thr Pro Val Tyr Ser Phe Leu Pro Gly Val Tyr Ser Val Ile 3095 3100 3105 Tyr Leu Tyr Leu Thr Phe Tyr Leu Thr Asn Asp Val Ser Phe Leu 3110 3115 3120 Ala His Ile Gln Trp Met Val Met Phe Thr Pro Leu Val Pro Phe 3125 3130 3135 Trp Ile Thr Ile Ala Tyr Ile Ile Cys Ile Ser Thr Lys His Phe 3140 3145 3150 Tyr Trp Phe Phe Ser Asn Tyr Leu Lys Arg Arg Val Val Phe Asn 3155 3160 3165 Gly Val Ser Phe Ser Thr Phe Glu Glu Ala Ala Leu Cys Thr Phe 3170 3175 3180 Leu Leu Asn Lys Glu Met Tyr Leu Lys Leu Arg Ser Asp Val Leu 3185 3190 3195 Leu Pro Leu Thr Gln Tyr Asn Arg Tyr Leu Ala Leu Tyr Asn Lys 3200 3205 3210 Tyr Lys Tyr Phe Ser Gly Ala Met Asp Thr Thr Ser Tyr Arg Glu 3215 3220 3225 Ala Ala Cys Cys His Leu Ala Lys Ala Leu Asn Asp Phe Ser Asn 3230 3235 3240 Ser Gly Ser Asp Val Leu Tyr Gln Pro Pro Gln Thr Ser Ile Thr 3245 3250 3255 Ser Ala Val Leu Gln Ser Gly Phe Arg Lys Met Ala Phe Pro Ser 3260 3265 3270 Gly Lys Val Glu Gly Cys Met Val Gln Val Thr Cys Gly Thr Thr 3275 3280 3285 Thr Leu Asn Gly Leu Trp Leu Asp Asp Val Val Tyr Cys Pro Arg 3290 3295 3300 His Val Ile Cys Thr Ser Glu Asp Met Leu Asn Pro Asn Tyr Glu 3305 3310 3315 Asp Leu Leu Ile Arg Lys Ser Asn His Asn Phe Leu Val Gln Ala 3320 3325 3330 Gly Asn Val Gln Leu Arg Val Ile Gly His Ser Met Gln Asn Cys 3335 3340 3345 Val Leu Lys Leu Lys Val Asp Thr Ala Asn Pro Lys Thr Pro Lys 3350 3355 3360 Tyr Lys Phe Val Arg Ile Gln Pro Gly Gln Thr Phe Ser Val Leu 3365 3370 3375 Ala Cys Tyr Asn Gly Ser Pro Ser Gly Val Tyr Gln Cys Ala Met 3380 3385 3390 Arg Pro Asn Phe Thr Ile Lys Gly Ser Phe Leu Asn Gly Ser Cys 3395 3400 3405 Gly Ser Val Gly Phe Asn Ile Asp Tyr Asp Cys Val Ser Phe Cys 3410 3415 3420 Tyr Met His His Met Glu Leu Pro Thr Gly Val His Ala Gly Thr 3425 3430 3435 Asp Leu Glu Gly Asn Phe Tyr Gly Pro Phe Val Asp Arg Gln Thr 3440 3445 3450 Ala Gln Ala Ala Gly Thr Asp Thr Thr Ile Thr Val Asn Val Leu 3455 3460 3465 Ala Trp Leu Tyr Ala Ala Val Ile Asn Gly Asp Arg Trp Phe Leu 3470 3475 3480 Asn Arg Phe Thr Thr Thr Leu Asn Asp Phe Asn Leu Val Ala Met 3485 3490 3495 Lys Tyr Asn Tyr Glu Pro Leu Thr Gln Asp His Val Asp Ile Leu 3500 3505 3510 Gly Pro Leu Ser Ala Gln Thr Gly Ile Ala Val Leu Asp Met Cys 3515 3520 3525 Ala Ser Leu Lys Glu Leu Leu Gln Asn Gly Met Asn Gly Arg Thr 3530 3535 3540 Ile Leu Gly Ser Ala Leu Leu Glu Asp Glu Phe Thr Pro Phe Asp 3545 3550 3555 Val Val Arg Gln Cys Ser Gly Val Thr Phe Gln Ser Ala Val Lys 3560 3565 3570 Arg Thr Ile Lys Gly Thr His His Trp Leu Leu Leu Thr Ile Leu 3575 3580 3585 Thr Ser Leu Leu Val Leu Val Gln Ser Thr Gln Trp Ser Leu Phe 3590 3595 3600 Phe Phe Leu Tyr Glu Asn Ala Phe Leu Pro Phe Ala Met Gly Ile 3605 3610 3615 Ile Ala Met Ser Ala Phe Ala Met Met Phe Val Lys His Lys His 3620 3625 3630 Ala Phe Leu Cys Leu Phe Leu Leu Pro Ser Leu Ala Thr Val Ala 3635 3640 3645 Tyr Phe Asn Met Val Tyr Met Pro Ala Ser Trp Val Met Arg Ile 3650 3655 3660 Met Thr Trp Leu Asp Met Val Asp Thr Ser Leu Ser Gly Phe Lys 3665 3670 3675 Leu Lys Asp Cys Val Met Tyr Ala Ser Ala Val Val Leu Leu Ile 3680 3685 3690 Leu Met Thr Ala Arg Thr Val Tyr Asp Asp Gly Ala Arg Arg Val 3695 3700 3705 Trp Thr Leu Met Asn Val Leu Thr Leu Val Tyr Lys Val Tyr Tyr 3710 3715 3720 Gly Asn Ala Leu Asp Gln Ala Ile Ser Met Trp Ala Leu Ile Ile 3725 3730 3735 Ser Val Thr Ser Asn Tyr Ser Gly Val Val Thr Thr Val Met Phe 3740 3745 3750 Leu Ala Arg Gly Ile Val Phe Met Cys Val Glu Tyr Cys Pro Ile 3755 3760 3765 Phe Phe Ile Thr Gly Asn Thr Leu Gln Cys Ile Met Leu Val Tyr 3770 3775 3780 Cys Phe Leu Gly Tyr Phe Cys Thr Cys Tyr Phe Gly Leu Phe Cys 3785 3790 3795 Leu Leu Asn Arg Tyr Phe Arg Leu Thr Leu Gly Val Tyr Asp Tyr 3800 3805 3810 Leu Val Ser Thr Gln Glu Phe Arg Tyr Met Asn Ser Gln Gly Leu 3815 3820 3825 Leu Pro Pro Lys Asn Ser Ile Asp Ala Phe Lys Leu Asn Ile Lys 3830 3835 3840 Leu Leu Gly Val Gly Gly Lys Pro Cys Ile Lys Val Ala Thr Val 3845 3850 3855 Gln Ser Lys Met Ser Asp Val Lys Cys Thr Ser Val Val Leu Leu 3860 3865 3870 Ser Val Leu Gln Gln Leu Arg Val Glu Ser Ser Ser Lys Leu Trp 3875 3880 3885 Ala Gln Cys Val Gln Leu His Asn Asp Ile Leu Leu Ala Lys Asp 3890 3895 3900 Thr Thr Glu Ala Phe Glu Lys Met Val Ser Leu Leu Ser Val Leu 3905 3910 3915 Leu Ser Met Gln Gly Ala Val Asp Ile Asn Lys Leu Cys Glu Glu 3920 3925 3930 Met Leu Asp Asn Arg Ala Thr Leu Gln Ala Ile Ala Ser Glu Phe 3935 3940 3945 Ser Ser Leu Pro Ser Tyr Ala Ala Phe Ala Thr Ala Gln Glu Ala 3950 3955 3960 Tyr Glu Gln Ala Val Ala Asn Gly Asp Ser Glu Val Val Leu Lys 3965 3970 3975 Lys Leu Lys Lys Ser Leu Asn Val Ala Lys Ser Glu Phe Asp Arg 3980 3985 3990 Asp Ala Ala Met Gln Arg Lys Leu Glu Lys Met Ala Asp Gln Ala 3995 4000 4005 Met Thr Gln Met Tyr Lys Gln Ala Arg Ser Glu Asp Lys Arg Ala 4010 4015 4020 Lys Val Thr Ser Ala Met Gln Thr Met Leu Phe Thr Met Leu Arg 4025 4030 4035 Lys Leu Asp Asn Asp Ala Leu Asn Asn Ile Ile Asn Asn Ala Arg 4040 4045 4050 Asp Gly Cys Val Pro Leu Asn Ile Ile Pro Leu Thr Thr Ala Ala 4055 4060 4065 Lys Leu Met Val Val Ile Pro Asp Tyr Asn Thr Tyr Lys Asn Thr 4070 4075 4080 Cys Asp Gly Thr Thr Phe Thr Tyr Ala Ser Ala Leu Trp Glu Ile 4085 4090 4095 Gln Gln Val Val Asp Ala Asp Ser Lys Ile Val Gln Leu Ser Glu 4100 4105 4110 Ile Ser Met Asp Asn Ser Pro Asn Leu Ala Trp Pro Leu Ile Val 4115 4120 4125 Thr Ala Leu Arg Ala Asn Ser Ala Val Lys Leu Gln Asn Asn Glu 4130 4135 4140 Leu Ser Pro Val Ala Leu Arg Gln Met Ser Cys Ala Ala Gly Thr 4145 4150 4155 Thr Gln Thr Ala Cys Thr Asp Asp Asn Ala Leu Ala Tyr Tyr Asn 4160 4165 4170 Thr Thr Lys Gly Gly Arg Phe Val Leu Ala Leu Leu Ser Asp Leu 4175 4180 4185 Gln Asp Leu Lys Trp Ala Arg Phe Pro Lys Ser Asp Gly Thr Gly 4190 4195 4200 Thr Ile Tyr Thr Glu Leu Glu Pro Pro Cys Arg Phe Val Thr Asp 4205 4210 4215 Thr Pro Lys Gly Pro Lys Val Lys Tyr Leu Tyr Phe Ile Lys Gly 4220 4225 4230 Leu Asn Asn Leu Asn Arg Gly Met Val Leu Gly Ser Leu Ala Ala 4235 4240 4245 Thr Val Arg Leu Gln Ala Gly Asn Ala Thr Glu Val Pro Ala Asn 4250 4255 4260 Ser Thr Val Leu Ser Phe Cys Ala Phe Ala Val Asp Ala Ala Lys 4265 4270 4275 Ala Tyr Lys Asp Tyr Leu Ala Ser Gly Gly Gln Pro Ile Thr Asn 4280 4285 4290 Cys Val Lys Met Leu Cys Thr His Thr Gly Thr Gly Gln Ala Ile 4295 4300 4305 Thr Val Thr Pro Glu Ala Asn Met Asp Gln Glu Ser Phe Gly Gly 4310 4315 4320 Ala Ser Cys Cys Leu Tyr Cys Arg Cys His Ile Asp His Pro Asn 4325 4330 4335 Pro Lys Gly Phe Cys Asp Leu Lys Gly Lys Tyr Val Gln Ile Pro 4340 4345 4350 Thr Thr Cys Ala Asn Asp Pro Val Gly Phe Thr Leu Lys Asn Thr 4355 4360 4365 Val Cys Thr Val Cys Gly Met Trp Lys Gly Tyr Gly Cys Ser Cys 4370 4375 4380 Asp Gln Leu Arg Glu Pro Met Leu Gln Ser Ala Asp Ala Gln Ser 4385 4390 4395 Phe Leu Asn Gly Phe Ala Val 4400 4405 <210> 553 <211> 1273 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 553 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile 885 890 895 Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn 1145 1150 1155 His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn 1160 1165 1170 Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu 1175 1180 1185 Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu 1190 1195 1200 Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu 1205 1210 1215 Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met 1220 1225 1230 Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys 1235 1240 1245 Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro 1250 1255 1260 Val Leu Lys Gly Val Lys Leu His Tyr Thr 1265 1270 <210> 554 <211> 275 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 554 Met Asp Leu Phe Met Arg Ile Phe Thr Ile Gly Thr Val Thr Leu Lys 1 5 10 15 Gln Gly Glu Ile Lys Asp Ala Thr Pro Ser Asp Phe Val Arg Ala Thr 20 25 30 Ala Thr Ile Pro Ile Gln Ala Ser Leu Pro Phe Gly Trp Leu Ile Val 35 40 45 Gly Val Ala Leu Leu Ala Val Phe Gln Ser Ala Ser Lys Ile Ile Thr 50 55 60 Leu Lys Lys Arg Trp Gln Leu Ala Leu Ser Lys Gly Val His Phe Val 65 70 75 80 Cys Asn Leu Leu Leu Leu Phe Val Thr Val Tyr Ser His Leu Leu Leu 85 90 95 Val Ala Ala Gly Leu Glu Ala Pro Phe Leu Tyr Leu Tyr Ala Leu Val 100 105 110 Tyr Phe Leu Gln Ser Ile Asn Phe Val Arg Ile Ile Met Arg Leu Trp 115 120 125 Leu Cys Trp Lys Cys Arg Ser Lys Asn Pro Leu Leu Tyr Asp Ala Asn 130 135 140 Tyr Phe Leu Cys Trp His Thr Asn Cys Tyr Asp Tyr Cys Ile Pro Tyr 145 150 155 160 Asn Ser Val Thr Ser Ser Ile Val Ile Thr Ser Gly Asp Gly Thr Thr 165 170 175 Ser Pro Ile Ser Glu His Asp Tyr Gln Ile Gly Gly Tyr Thr Glu Lys 180 185 190 Trp Glu Ser Gly Val Lys Asp Cys Val Val Leu His Ser Tyr Phe Thr 195 200 205 Ser Asp Tyr Tyr Gln Leu Tyr Ser Thr Gln Leu Ser Thr Asp Thr Gly 210 215 220 Val Glu His Val Thr Phe Phe Ile Tyr Asn Lys Ile Val Asp Glu Pro 225 230 235 240 Glu Glu His Val Gln Ile His Thr Ile Asp Gly Ser Ser Gly Val Val 245 250 255 Asn Pro Val Met Glu Pro Ile Tyr Asp Glu Pro Thr Thr Thr Thr Ser 260 265 270 Val Pro Leu 275 <210> 555 <211> 75 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 555 Met Tyr Ser Phe Val Ser Glu Glu Thr Gly Thr Leu Ile Val Asn Ser 1 5 10 15 Val Leu Leu Phe Leu Ala Phe Val Val Phe Leu Leu Val Thr Leu Ala 20 25 30 Ile Leu Thr Ala Leu Arg Leu Cys Ala Tyr Cys Cys Asn Ile Val Asn 35 40 45 Val Ser Leu Val Lys Pro Ser Phe Tyr Val Tyr Ser Arg Val Lys Asn 50 55 60 Leu Asn Ser Ser Arg Val Pro Asp Leu Leu Val 65 70 75 <210> 556 <211> 222 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 556 Met Ala Asp Ser Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Lys Leu 1 5 10 15 Leu Glu Gln Trp Asn Leu Val Ile Gly Phe Leu Phe Leu Thr Trp Ile 20 25 30 Cys Leu Leu Gln Phe Ala Tyr Ala Asn Arg Asn Arg Phe Leu Tyr Ile 35 40 45 Ile Lys Leu Ile Phe Leu Trp Leu Leu Trp Pro Val Thr Leu Ala Cys 50 55 60 Phe Val Leu Ala Ala Val Tyr Arg Ile Asn Trp Ile Thr Gly Gly Ile 65 70 75 80 Ala Ile Ala Met Ala Cys Leu Val Gly Leu Met Trp Leu Ser Tyr Phe 85 90 95 Ile Ala Ser Phe Arg Leu Phe Ala Arg Thr Arg Ser Met Trp Ser Phe 100 105 110 Asn Pro Glu Thr Asn Ile Leu Leu Asn Val Pro Leu His Gly Thr Ile 115 120 125 Leu Thr Arg Pro Leu Leu Glu Ser Glu Leu Val Ile Gly Ala Val Ile 130 135 140 Leu Arg Gly His Leu Arg Ile Ala Gly His His Leu Gly Arg Cys Asp 145 150 155 160 Ile Lys Asp Leu Pro Lys Glu Ile Thr Val Ala Thr Ser Arg Thr Leu 165 170 175 Ser Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Ala Gly Asp Ser Gly 180 185 190 Phe Ala Ala Tyr Ser Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr 195 200 205 Asp His Ser Ser Ser Ser Asp Asn Ile Ala Leu Leu Val Gln 210 215 220 <210> 557 <211> 61 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 557 Met Phe His Leu Val Asp Phe Gln Val Thr Ile Ala Glu Ile Leu Leu 1 5 10 15 Ile Ile Met Arg Thr Phe Lys Val Ser Ile Trp Asn Leu Asp Tyr Ile 20 25 30 Ile Asn Leu Ile Ile Lys Asn Leu Ser Lys Ser Leu Thr Glu Asn Lys 35 40 45 Tyr Ser Gln Leu Asp Glu Glu Gln Pro Met Glu Ile Asp 50 55 60 <210> 558 <211> 121 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 558 Met Lys Ile Ile Leu Phe Leu Ala Leu Ile Thr Leu Ala Thr Cys Glu 1 5 10 15 Leu Tyr His Tyr Gln Glu Cys Val Arg Gly Thr Thr Val Leu Leu Lys 20 25 30 Glu Pro Cys Ser Ser Gly Thr Tyr Glu Gly Asn Ser Pro Phe His Pro 35 40 45 Leu Ala Asp Asn Lys Phe Ala Leu Thr Cys Phe Ser Thr Gln Phe Ala 50 55 60 Phe Ala Cys Pro Asp Gly Val Lys His Val Tyr Gln Leu Arg Ala Arg 65 70 75 80 Ser Val Ser Pro Lys Leu Phe Ile Arg Gln Glu Glu Val Gln Glu Leu 85 90 95 Tyr Ser Pro Ile Phe Leu Ile Val Ala Ala Ile Val Phe Ile Thr Leu 100 105 110 Cys Phe Thr Leu Lys Arg Lys Thr Glu 115 120 <210> 559 <211> 43 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 559 Met Ile Glu Leu Ser Leu Ile Asp Phe Tyr Leu Cys Phe Leu Ala Phe 1 5 10 15 Leu Leu Phe Leu Val Leu Ile Met Leu Ile Ile Phe Trp Phe Ser Leu 20 25 30 Glu Leu Gln Asp His Asn Glu Thr Cys His Ala 35 40 <210> 560 <211> 121 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 560 Met Lys Phe Leu Val Phe Leu Gly Ile Ile Thr Thr Val Ala Ala Phe 1 5 10 15 His Gln Glu Cys Ser Leu Gln Ser Cys Thr Gln His Gln Pro Tyr Val 20 25 30 Val Asp Asp Pro Cys Pro Ile His Phe Tyr Ser Lys Trp Tyr Ile Arg 35 40 45 Val Gly Ala Arg Lys Ser Ala Pro Leu Ile Glu Leu Cys Val Asp Glu 50 55 60 Ala Gly Ser Lys Ser Pro Ile Gln Tyr Ile Asp Ile Gly Asn Tyr Thr 65 70 75 80 Val Ser Cys Leu Pro Phe Thr Ile Asn Cys Gln Glu Pro Lys Leu Gly 85 90 95 Ser Leu Val Val Arg Cys Ser Phe Tyr Glu Asp Phe Leu Glu Tyr His 100 105 110 Asp Val Arg Val Val Leu Asp Phe Ile 115 120 <210> 561 <211> 419 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 561 Met Ser Asp Asn Gly Pro Gln Asn Gln Arg Asn Ala Pro Arg Ile Thr 1 5 10 15 Phe Gly Gly Pro Ser Asp Ser Thr Gly Ser Asn Gln Asn Gly Glu Arg 20 25 30 Ser Gly Ala Arg Ser Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn Asn 35 40 45 Thr Ala Ser Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Asp Leu 50 55 60 Lys Phe Pro Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Ser Pro 65 70 75 80 Asp Asp Gln Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Ile Arg Gly 85 90 95 Gly Asp Gly Lys Met Lys Asp Leu Ser Pro Arg Trp Tyr Phe Tyr Tyr 100 105 110 Leu Gly Thr Gly Pro Glu Ala Gly Leu Pro Tyr Gly Ala Asn Lys Asp 115 120 125 Gly Ile Ile Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys Asp 130 135 140 His Ile Gly Thr Arg Asn Pro Ala Asn Asn Ala Ala Ile Val Leu Gln 145 150 155 160 Leu Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly Ser 165 170 175 Arg Gly Gly Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg Asn 180 185 190 Ser Ser Arg Asn Ser Thr Pro Gly Ser Ser Arg Gly Thr Ser Pro Ala 195 200 205 Arg Met Ala Gly Asn Gly Gly Asp Ala Ala Leu Ala Leu Leu Leu Leu 210 215 220 Asp Arg Leu Asn Gln Leu Glu Ser Lys Met Ser Gly Lys Gly Gln Gln 225 230 235 240 Gln Gln Gly Gln Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser Lys 245 250 255 Lys Pro Arg Gln Lys Arg Thr Ala Thr Lys Ala Tyr Asn Val Thr Gln 260 265 270 Ala Phe Gly Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly Asp 275 280 285 Gln Glu Leu Ile Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln Ile 290 295 300 Ala Gln Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg Ile 305 310 315 320 Gly Met Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr Thr Gly Ala 325 330 335 Ile Lys Leu Asp Asp Lys Asp Pro Asn Phe Lys Asp Gln Val Ile Leu 340 345 350 Leu Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu Pro 355 360 365 Lys Lys Asp Lys Lys Lys Lys Ala Asp Glu Thr Gln Ala Leu Pro Gln 370 375 380 Arg Gln Lys Lys Gln Gln Thr Val Thr Leu Leu Pro Ala Ala Asp Leu 385 390 395 400 Asp Asp Phe Ser Lys Gln Leu Gln Gln Ser Met Ser Ser Ala Asp Ser 405 410 415 Thr Gln Ala <210> 562 <211> 38 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 562 Met Gly Tyr Ile Asn Val Phe Ala Phe Pro Phe Thr Ile Tyr Ser Leu 1 5 10 15 Leu Leu Cys Arg Met Asn Ser Arg Asn Tyr Ile Ala Gln Val Asp Val 20 25 30 Val Asn Phe Asn Leu Thr 35 <210> 563 <400> 563 000 <210> 564 <400> 564 000 <210> 565 <400> 565 000 <210> 566 <400> 566 000 <210> 567 <400> 567 000 <210> 568 <400> 568 000 <210> 569 <400> 569 000 <210> 570 <400> 570 000 <210> 571 <400> 571 000 <210> 572 <400> 572 000 <210> 573 <400> 573 000 <210> 574 <400> 574 000 <210> 575 <400> 575 000 <210> 576 <400> 576 000 <210> 577 <400> 577 000 <210> 578 <400> 578 000 <210> 579 <400> 579 000 <210> 580 <400> 580 000 <210> 581 <400> 581 000 <210> 582 <400> 582 000 <210> 583 <400> 583 000 <210> 584 <400> 584 000 <210> 585 <400> 585 000 <210> 586 <400> 586 000 <210> 587 <400> 587 000 <210> 588 <400> 588 000 <210> 589 <400> 589 000 <210> 590 <400> 590 000 <210> 591 <400> 591 000 <210> 592 <400> 592 000 <210> 593 <400> 593 000 <210> 594 <400> 594 000 <210> 595 <400> 595 000 <210> 596 <400> 596 000 <210> 597 <400> 597 000 <210> 598 <400> 598 000 <210> 599 <400> 599 000 <210> 600 <400> 600 000 <210> 601 <211> 4308 <212> DNA <213> Human immunodeficiency virus 1 <400> 601 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acaaataatc cacctatccc agtaggagaa 780 atttataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccggttc 900 tataaaactc taagagccga gcaagcttca caggaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagcg 1020 gctacactag aagaaatgat gacagcatgt cagggagtag gaggacccgg ccataaggca 1080 agagttttgg ctgaagcaat gagccaagta acaaattcag ctaccataat gatgcagaga 1140 ggcaatttta ggaaccaaag aaagattgtt aagtgtttca attgtggcaa agaagggcac 1200 acagccagaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt taagggaaga tctggccttc 1320 ctacaaggga aggccaggga attttcttca gagcagacca gagccaacag ccccaccaga 1380 agagagcttc aggtctgggg tagagacaac aactccccct cagaagcagg agccgataga 1440 caaggaactg tatcctttaa cttccctcag gtcactcttt ggcaacgacc cctcgtcaca 1500 ataaagatag gggggcaact aaaggaagct ctattagata caggagcaga tgatacagta 1560 ttagaagaaa tgagtttgcc aggaagatgg aaaccaaaaa tgataggggg aattggaggt 1620 tttatcaaag taagacagta tgatcagata ctcatagaaa tctgtggaca taaagctata 1680 ggtacagtat tagtaggacc tacacctgtc aacataattg gaagaaatct gttgactcag 1740 attggttgca ctttaaattt tcccattagc cctattgaga ctgtaccagt aaaattaaag 1800 ccaggaatgg atggcccaaa agttaaacaa tggccattga cagaagaaaa aataaaagca 1860 ttagtagaaa tttgtacaga gatggaaaag gaagggaaaa tttcaaaaat tgggcctgaa 1920 aatccataca atactccagt atttgccata aagaaaaaag acagtactaa atggagaaaa 1980 ttagtagatt tcagagaact taataagaga actcaagact tctgggaagt tcaattagga 2040 ataccacatc ccgcagggtt aaaaaagaaa aaatcagtaa cagtactgga tgtgggtgat 2100 gcatattttt cagttccctt agatgaagac ttcaggaagt atactgcatt taccatacct 2160 agtataaaca atgagacacc agggattaga tatcagtaca atgtgcttcc acagggatgg 2220 aaaggatcac cagcaatatt ccaaagtagc atgacaaaaa tcttagagcc ttttagaaaa 2280 caaaatccag acatagttat ctatcaatac atggatgatt tgtatgtagg atctgactta 2340 gaaatagggc agcatagaac aaaaatagag gagctgagac aacatctgtt gaggtgggga 2400 cttaccacac cagacaaaaa acatcagaaa gaacctccat tcctttggat gggttatgaa 2460 ctccatcctg ataaatggac agtacagcct atagtgctgc cagaaaaaga cagctggact 2520 gtcaatgaca tacagaagtt agtggggaaa ttgaattggg caagtcagat ttacccaggg 2580 attaaagtaa ggcaattatg taaactcctt agaggaacca aagcactaac agaagtaata 2640 ccactaacag aagaagcaga gctagaactg gcagaaaaca gagagattct aaaagaacca 2700 gtacatggag tgtattatga cccatcaaaa gacttaatag cagaaataca gaagcagggg 2760 caaggccaat ggacatatca aatttatcaa gagccattta aaaatctgaa aacaggaaaa 2820 tatgcaagaa tgaggggtgc ccacactaat gatgtaaaac aattaacaga ggcagtgcaa 2880 aaaataacca cagaaagcat agtaatatgg ggaaagactc ctaaatttaa actgcccata 2940 caaaaggaaa catgggaaac atggtggaca gagtattggc aagccacctg gattcctgag 3000 tgggagtttg ttaatacccc tcccttagtg aaattatggt accagttaga gaaagaaccc 3060 atagtaggag cagaaacctt ctatgtagat ggggcagcta acagggagac taaattagga 3120 aaagcaggat atgttactaa tagaggaaga caaaaagttg tcaccctaac tgacacaaca 3180 aatcagaaga ctgagttaca agcaatttat ctagctttgc aggattcggg attagaagta 3240 aacatagtaa cagactcaca atatgcatta ggaatcattc aagcacaacc agatcaaagt 3300 gaatcagagt tagtcaatca aataatagag cagttaataa aaaaggaaaa ggtctatctg 3360 gcatgggtac cagcacacaa aggaattgga ggaaatgaac aagtagataa attagtcagt 3420 gctggaatca ggaaagtact atttttagat ggaatagata aggcccaaga tgaacatgag 3480 aaatatcaca gtaattggag agcaatggct agtgatttta acctgccacc tgtagtagca 3540 aaagaaatag tagccagctg tgataaatgt cagctaaaag gagaagccat gcatggacaa 3600 gtagactgta gtccaggaat atggcaacta gattgtacac atttagaagg aaaagttatc 3660 ctggtagcag ttcatgtagc cagtggatat atagaagcag aagttattcc agcagaaaca 3720 gggcaggaaa cagcatattt tcttttaaaa ttagcaggaa gatggccagt aaaaacaata 3780 catactgaca atggcagcaa tttcaccggt gctacggtta gggccgcctg ttggtgggcg 3840 ggaatcaagc aggaatttgg aattccctac aatccccaaa gtcaaggagt agtagaatct 3900 atgaataaag aattaaagaa aattatagga caggtaagag atcaggctga acatcttaag 3960 acagcagtac aaatggcagt attcatccac aattttaaaa gaaaaggggg gattgggggg 4020 tacagtgcag gggaaagaat agtagacata atagcaacag acatacaaac taaagaatta 4080 caaaaacaaa ttacaaaaat tcaaaatttt cgggtttatt acagggacag cagaaatcca 4140 ctttggaaag gaccagcaaa gctcctctgg aaaggtgaag gggcagtagt aatacaagat 4200 aatagtgaca taaaagtagt gccaagaaga aaagcaaaga tcattaggga ttatggaaaa 4260 cagatggcag gtgatgattg tgtggcaagt agacaggatg aggattag 4308 <210> 602 <211> 1503 <212> DNA <213> Human immunodeficiency virus 1 <400> 602 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acaaataatc cacctatccc agtaggagaa 780 atttataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccggttc 900 tataaaactc taagagccga gcaagcttca caggaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagcg 1020 gctacactag aagaaatgat gacagcatgt cagggagtag gaggacccgg ccataaggca 1080 agagttttgg ctgaagcaat gagccaagta acaaattcag ctaccataat gatgcagaga 1140 ggcaatttta ggaaccaaag aaagattgtt aagtgtttca attgtggcaa agaagggcac 1200 acagccagaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 tacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtctggggt agagacaaca actccccctc agaagcagga gccgatagac 1440 aaggaactgt atcctttaac ttccctcagg tcactctttg gcaacgaccc ctcgtcacaa 1500 taa 1503 <210> 603 <211> 579 <212> DNA <213> Human immunodeficiency virus 1 <400> 603 atggaaaaca gatggcaggt gatgattgtg tggcaagtag acaggatgag gattagaaca 60 tggaaaagtt tagtaaaaca ccatatgtat gtttcaggga aagctagggg atggttttat 120 agacatcact atgaaagccc tcatccaaga ataagttcag aagtacacat cccactaggg 180 gatgctagat tggtaataac aacatattgg ggtctgcata caggagaaag agactggcat 240 ttgggtcagg gagtctccat agaatggagg aaaaagagat atagcacaca agtagaccct 300 gaactagcag accaactaat tcatctgtat tactttgact gtttttcaga ctctgctata 360 agaaaggcct tattaggaca catagttagc cctaggtgtg aatatcaagc aggacataac 420 aaggtaggat ctctacaata cttggcacta gcagcattaa taacaccaaa aaagataaag 480 ccacctttgc ctagtgttac gaaactgaca gaggatagat ggaacaagcc ccagaagacc 540 aagggccaca gagggagcca cacaatgaat ggacactag 579 <210> 604 <211> 291 <212> DNA <213> Human immunodeficiency virus 1 <400> 604 atggaacaag ccccagaaga ccaagggcca cagagggagc cacacaatga atggacacta 60 gagcttttag aggagcttaa gaatgaagct gttagacatt ttcctaggat ttggctccat 120 ggcttagggc aacatatcta tgaaacttat ggggatactt gggcaggagt ggaagccata 180 ataagaattc tgcaacaact gctgtttatc catttcagaa ttgggtgtcg acatagcaga 240 ataggcgtta ctcgacagag gagagcaaga aatggagcca gtagatccta g 291 <210> 605 <211> 261 <212> DNA <213> Human immunodeficiency virus 1 <400> 605 atggagccag tagatcctag actagagccc tggaagcatc caggaagtca gcctaaaact 60 gcttgtacca attgctattg taaaaagtgt tgctttcatt gccaagtttg tttcataaca 120 aaagccttag gcatctccta tggcaggaag aagcggagac agcgacgaag agctcatcag 180 aacagtcaga ctcatcaagc ttctctatca aagcaaccca cctcccaacc ccgaggggac 240 ccgacaggcc cgaaggaata g 261 <210> 606 <211> 351 <212> DNA <213> Human immunodeficiency virus 1 <400> 606 atggcaggaa gaagcggaga cagcgacgaa gagctcatca gaacagtcag actcatcaag 60 cttctctatc aaagcaaccc acctcccaac cccgagggga cccgacaggc ccgaaggaat 120 agaagaagaa ggtggagaga gagacagaga cagatccatt cgattagtga acggatcctt 180 ggcacttatc tgggacgatc tgcggagcct gtgcctcttc agctaccacc gcttgagaga 240 cttactcttg attgtaacga ggattgtgga acttctggga cgcagggggt gggaagccct 300 caaatattgg tggaatctcc tacagtattg gagtcaggaa ctaaagaata g 351 <210> 607 <211> 249 <212> DNA <213> Human immunodeficiency virus 1 <400> 607 atgcaaccta taccaatagt agcaatagta gcattagtag tagcaataat aatagcaata 60 gttgtgtggt ccatagtaat catagaatat aggaaaatat taagacaaag aaaaatagac 120 aggttaattg atagactaat agaaagagca gaagacagtg gcaatgagag tgaaggagaa 180 atatcagcac ttgtggagat gggggtggag atggggcacc atgctccttg ggatgttgat 240 gatctgtag 249 <210> 608 <211> 2571 <212> DNA <213> Human immunodeficiency virus 1 <400> 608 atgagagtga aggagaaata tcagcacttg tggagatggg ggtggagatg gggcaccatg 60 ctccttggga tgttgatgat ctgtagtgct acagaaaaat tgtgggtcac agtctattat 120 ggggtacctg tgtggaagga agcaaccacc actctatttt gtgcatcaga tgctaaagca 180 tatgatacag aggtacataa tgtttgggcc acacatgcct gtgtacccac agaccccaac 240 ccacaagaag tagtattggt aaatgtgaca gaaaatttta acatgtggaa aaatgacatg 300 gtagaacaga tgcatgagga tataatcagt ttatgggatc aaagcctaaa gccatgtgta 360 aaattaaccc cactctgtgt tagtttaaag tgcactgatt tgaagaatga tactaatacc 420 aatagtagta gcgggagaat gataatggag aaaggagaga taaaaaactg ctctttcaat 480 atcagcacaa gcataagagg taaggtgcag aaagaatatg cattttttta taaacttgat 540 ataataccaa tagataatga tactaccagc tataagttga caagttgtaa cacctcagtc 600 attacacagg cctgtccaaa ggtatccttt gagccaattc ccatacatta ttgtgccccg 660 gctggttttg cgattctaaa atgtaataat aagacgttca atggaacagg accatgtaca 720 aatgtcagca cagtacaatg tacacatgga attaggccag tagtatcaac tcaactgctg 780 ttaaatggca gtctagcaga agaagaggta gtaattagat ctgtcaattt cacggacaat 840 gctaaaacca taatagtaca gctgaacaca tctgtagaaa ttaattgtac aagacccaac 900 aacaatacaa gaaaaagaat ccgtatccag agaggaccag ggagagcatt tgttacaata 960 ggaaaaatag gaaatatgag acaagcacat tgtaacatta gtagagcaaa atggaataac 1020 actttaaaac agatagctag caaattaaga gaacaatttg gaaataataa aacaataatc 1080 tttaagcaat cctcaggagg ggacccagaa attgtaacgc acagttttaa ttgtggaggg 1140 gaatttttct actgtaattc aacacaactg tttaatagta cttggtttaa tagtacttgg 1200 agtactgaag ggtcaaataa cactgaagga agtgacacaa tcaccctccc atgcagaata 1260 aaacaaatta taaacatgtg gcagaaagta ggaaaagcaa tgtatgcccc tcccatcagt 1320 ggacaaatta gatgttcatc aaatattaca gggctgctat taacaagaga tggtggtaat 1380 agcaacaatg agtccgagat cttcagacct ggaggaggag atatgaggga caattggaga 1440 agtgaattat ataaatataa agtagtaaaa attgaaccat taggagtagc acccaccaag 1500 gcaaagagaa gagtggtgca gagagaaaaa agagcagtgg gaataggagc tttgttcctt 1560 gggttcttgg gagcagcagg aagcactatg ggcgcagcct caatgacgct gacggtacag 1620 gccagacaat tattgtctgg tatagtgcag cagcagaaca atttgctgag ggctattgag 1680 gcgcaacagc atctgttgca actcacagtc tggggcatca agcagctcca ggcaagaatc 1740 ctggctgtgg aaagatacct aaaggatcaa cagctcctgg ggatttgggg ttgctctgga 1800 aaactcattt gcaccactgc tgtgccttgg aatgctagtt ggagtaataa atctctggaa 1860 cagatttgga atcacacgac ctggatggag tgggacagag aaattaacaa ttacacaagc 1920 ttaatacact ccttaattga agaatcgcaa aaccagcaag aaaagaatga acaagaatta 1980 ttggaattag ataaatgggc aagtttgtgg aattggttta acataacaaa ttggctgtgg 2040 tatataaaat tattcataat gatagtagga ggcttggtag gtttaagaat agtttttgct 2100 gtactttcta tagtgaatag agttaggcag ggatattcac cattatcgtt tcagacccac 2160 ctcccaaccc cgaggggacc cgacaggccc gaaggaatag aagaagaagg tggagagaga 2220 gacagagaca gatccattcg attagtgaac ggatccttgg cacttatctg ggacgatctg 2280 cggagcctgt gcctcttcag ctaccaccgc ttgagagact tactcttgat tgtaacgagg 2340 attgtggaac ttctgggacg cagggggtgg gaagccctca aatattggtg gaatctccta 2400 cagtattgga gtcaggaact aaagaatagt gctgttagct tgctcaatgc cacagccata 2460 gcagtagctg aggggacaga tagggttata gaagtagtac aaggagcttg tagagctatt 2520 cgccacatac ctagaagaat aagacagggc ttggaaagga ttttgctata a 2571 <210> 609 <211> 570 <212> DNA <213> Human immunodeficiency virus 1 <400> 609 atgccccaga ctgtgagttg caacagatgc tgttgcgcct caatagccct cagcaaattg 60 ttctgctgct gcactatacc agacaataat tgtctggcct gtaccgtcag cgtcattgag 120 gctgcgccca tagtgcttcc tgctgctccc aagaacccaa ggaacaaagc tcctattccc 180 actgctcttt tttctctctg caccactctt ctctttgcct tggtgggtgc tactcctaat 240 ggttcaattt ttactacttt atatttatat aattcacttc tccaattgtc cctcatatct 300 cctcctccag gtctgaagat ctcggactca ttgttgctat taccaccatc tcttgttaat 360 agcagccctg taatatttga tgaacatcta atttgtccac tgatgggagg ggcatacatt 420 gcttttccta ctttctgcca catgtttata atttgtttta ttctgcatgg gagggtgatt 480 gtgtcacttc cttcagtgtt atttgaccct tcagtactcc aagtactatt aaaccaagta 540 ctattaaaca gttgtgttga attacagtag 570 <210> 610 <211> 621 <212> DNA <213> Human immunodeficiency virus 1 <400> 610 atgggtggca agtggtcaaa aagtagtgtg attggatggc ctactgtaag ggaaagaatg 60 agacgagctg agccagcagc agatagggtg ggagcagcat ctcgagacct ggaaaaacat 120 ggagcaatca caagtagcaa tacagcagct accaatgctg cttgtgcctg gctagaagca 180 caagaggagg aggaggtggg ttttccagtc acacctcagg tacctttaag accaatgact 240 tacaaggcag ctgtagatct tagccacttt ttaaaagaaa aggggggact ggaagggcta 300 attcactccc aaagaagaca agatatcctt gatctgtgga tctaccacac acaaggctac 360 ttccctgatt agcagaacta cacaccaggg ccaggggtca gatatccact gacctttgga 420 tggtgctaca agctagtacc agttgagcca gataagatag aagaggccaa taaaggagag 480 aacaccagct tgttacaccc tgtgagcctg catgggatgg atgacccgga gagagaagtg 540 ttagagtgga ggtttgacag ccgcctagca tttcatcacg tggcccgaga gctgcatccg 600 gagtacttca agaactgctg a 621 <210> 611 <400> 611 000 <210> 612 <400> 612 000 <210> 613 <400> 613 000 <210> 614 <400> 614 000 <210> 615 <400> 615 000 <210> 616 <400> 616 000 <210> 617 <400> 617 000 <210> 618 <400> 618 000 <210> 619 <400> 619 000 <210> 620 <400> 620 000 <210> 621 <400> 621 000 <210> 622 <400> 622 000 <210> 623 <400> 623 000 <210> 624 <400> 624 000 <210> 625 <400> 625 000 <210> 626 <400> 626 000 <210> 627 <400> 627 000 <210> 628 <400> 628 000 <210> 629 <400> 629 000 <210> 630 <400> 630 000 <210> 631 <400> 631 000 <210> 632 <400> 632 000 <210> 633 <400> 633 000 <210> 634 <400> 634 000 <210> 635 <400> 635 000 <210> 636 <400> 636 000 <210> 637 <400> 637 000 <210> 638 <400> 638 000 <210> 639 <400> 639 000 <210> 640 <400> 640 000 <210> 641 <400> 641 000 <210> 642 <400> 642 000 <210> 643 <400> 643 000 <210> 644 <400> 644 000 <210> 645 <400> 645 000 <210> 646 <400> 646 000 <210> 647 <400> 647 000 <210> 648 <400> 648 000 <210> 649 <400> 649 000 <210> 650 <400> 650 000 <210> 651 <211> 1435 <212> PRT <213> Human immunodeficiency virus 1 <400> 651 Met Gly Ala Arg Ala Ser Val Leu Ser Gly Gly Glu Leu Asp Arg Trp 1 5 10 15 Glu Lys Ile Arg Leu Arg Pro Gly Gly Lys Lys Lys Tyr Lys Leu Lys 20 25 30 His Ile Val Trp Ala Ser Arg Glu Leu Glu Arg Phe Ala Val Asn Pro 35 40 45 Gly Leu Leu Glu Thr Ser Glu Gly Cys Arg Gln Ile Leu Gly Gln Leu 50 55 60 Gln Pro Ser Leu Gln Thr Gly Ser Glu Glu Leu Arg Ser Leu Tyr Asn 65 70 75 80 Thr Val Ala Thr Leu Tyr Cys Val His Gln Arg Ile Glu Ile Lys Asp 85 90 95 Thr Lys Glu Ala Leu Asp Lys Ile Glu Glu Glu Gln Asn Lys Ser Lys 100 105 110 Lys Lys Ala Gln Gln Ala Ala Ala Asp Thr Gly His Ser Asn Gln Val 115 120 125 Ser Gln Asn Tyr Pro Ile Val Gln Asn Ile Gln Gly Gln Met Val His 130 135 140 Gln Ala Ile Ser Pro Arg Thr Leu Asn Ala Trp Val Lys Val Val Glu 145 150 155 160 Glu Lys Ala Phe Ser Pro Glu Val Ile Pro Met Phe Ser Ala Leu Ser 165 170 175 Glu Gly Ala Thr Pro Gln Asp Leu Asn Thr Met Leu Asn Thr Val Gly 180 185 190 Gly His Gln Ala Ala Met Gln Met Leu Lys Glu Thr Ile Asn Glu Glu 195 200 205 Ala Ala Glu Trp Asp Arg Val His Pro Val His Ala Gly Pro Ile Ala 210 215 220 Pro Gly Gln Met Arg Glu Pro Arg Gly Ser Asp Ile Ala Gly Thr Thr 225 230 235 240 Ser Thr Leu Gln Glu Gln Ile Gly Trp Met Thr Asn Asn Pro Pro Ile 245 250 255 Pro Val Gly Glu Ile Tyr Lys Arg Trp Ile Ile Leu Gly Leu Asn Lys 260 265 270 Ile Val Arg Met Tyr Ser Pro Thr Ser Ile Leu Asp Ile Arg Gln Gly 275 280 285 Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe Tyr Lys Thr Leu 290 295 300 Arg Ala Glu Gln Ala Ser Gln Glu Val Lys Asn Trp Met Thr Glu Thr 305 310 315 320 Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys Thr Ile Leu Lys Ala 325 330 335 Leu Gly Pro Ala Ala Thr Leu Glu Glu Met Met Thr Ala Cys Gln Gly 340 345 350 Val Gly Gly Pro Gly His Lys Ala Arg Val Leu Ala Glu Ala Met Ser 355 360 365 Gln Val Thr Asn Ser Ala Thr Ile Met Met Gln Arg Gly Asn Phe Arg 370 375 380 Asn Gln Arg Lys Ile Val Lys Cys Phe Asn Cys Gly Lys Glu Gly His 385 390 395 400 Thr Ala Arg Asn Cys Arg Ala Pro Arg Lys Lys Gly Cys Trp Lys Cys 405 410 415 Gly Lys Glu Gly His Gln Met Lys Asp Cys Thr Glu Arg Gln Ala Asn 420 425 430 Phe Leu Arg Glu Asp Leu Ala Phe Leu Gln Gly Lys Ala Arg Glu Phe 435 440 445 Ser Ser Glu Gln Thr Arg Ala Asn Ser Pro Thr Arg Arg Glu Leu Gln 450 455 460 Val Trp Gly Arg Asp Asn Asn Ser Pro Ser Glu Ala Gly Ala Asp Arg 465 470 475 480 Gln Gly Thr Val Ser Phe Asn Phe Pro Gln Val Thr Leu Trp Gln Arg 485 490 495 Pro Leu Val Thr Ile Lys Ile Gly Gly Gln Leu Lys Glu Ala Leu Leu 500 505 510 Asp Thr Gly Ala Asp Asp Thr Val Leu Glu Glu Met Ser Leu Pro Gly 515 520 525 Arg Trp Lys Pro Lys Met Ile Gly Gly Ile Gly Gly Phe Ile Lys Val 530 535 540 Arg Gln Tyr Asp Gln Ile Leu Ile Glu Ile Cys Gly His Lys Ala Ile 545 550 555 560 Gly Thr Val Leu Val Gly Pro Thr Pro Val Asn Ile Ile Gly Arg Asn 565 570 575 Leu Leu Thr Gln Ile Gly Cys Thr Leu Asn Phe Pro Ile Ser Pro Ile 580 585 590 Glu Thr Val Pro Val Lys Leu Lys Pro Gly Met Asp Gly Pro Lys Val 595 600 605 Lys Gln Trp Pro Leu Thr Glu Glu Lys Ile Lys Ala Leu Val Glu Ile 610 615 620 Cys Thr Glu Met Glu Lys Glu Gly Lys Ile Ser Lys Ile Gly Pro Glu 625 630 635 640 Asn Pro Tyr Asn Thr Pro Val Phe Ala Ile Lys Lys Lys Asp Ser Thr 645 650 655 Lys Trp Arg Lys Leu Val Asp Phe Arg Glu Leu Asn Lys Arg Thr Gln 660 665 670 Asp Phe Trp Glu Val Gln Leu Gly Ile Pro His Pro Ala Gly Leu Lys 675 680 685 Lys Lys Lys Ser Val Thr Val Leu Asp Val Gly Asp Ala Tyr Phe Ser 690 695 700 Val Pro Leu Asp Glu Asp Phe Arg Lys Tyr Thr Ala Phe Thr Ile Pro 705 710 715 720 Ser Ile Asn Asn Glu Thr Pro Gly Ile Arg Tyr Gln Tyr Asn Val Leu 725 730 735 Pro Gln Gly Trp Lys Gly Ser Pro Ala Ile Phe Gln Ser Ser Met Thr 740 745 750 Lys Ile Leu Glu Pro Phe Arg Lys Gln Asn Pro Asp Ile Val Ile Tyr 755 760 765 Gln Tyr Met Asp Asp Leu Tyr Val Gly Ser Asp Leu Glu Ile Gly Gln 770 775 780 His Arg Thr Lys Ile Glu Glu Leu Arg Gln His Leu Leu Arg Trp Gly 785 790 795 800 Leu Thr Thr Pro Asp Lys Lys His Gln Lys Glu Pro Pro Phe Leu Trp 805 810 815 Met Gly Tyr Glu Leu His Pro Asp Lys Trp Thr Val Gln Pro Ile Val 820 825 830 Leu Pro Glu Lys Asp Ser Trp Thr Val Asn Asp Ile Gln Lys Leu Val 835 840 845 Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr Pro Gly Ile Lys Val Arg 850 855 860 Gln Leu Cys Lys Leu Leu Arg Gly Thr Lys Ala Leu Thr Glu Val Ile 865 870 875 880 Pro Leu Thr Glu Glu Ala Glu Leu Glu Leu Ala Glu Asn Arg Glu Ile 885 890 895 Leu Lys Glu Pro Val His Gly Val Tyr Tyr Asp Pro Ser Lys Asp Leu 900 905 910 Ile Ala Glu Ile Gln Lys Gln Gly Gln Gly Gln Trp Thr Tyr Gln Ile 915 920 925 Tyr Gln Glu Pro Phe Lys Asn Leu Lys Thr Gly Lys Tyr Ala Arg Met 930 935 940 Arg Gly Ala His Thr Asn Asp Val Lys Gln Leu Thr Glu Ala Val Gln 945 950 955 960 Lys Ile Thr Thr Glu Ser Ile Val Ile Trp Gly Lys Thr Pro Lys Phe 965 970 975 Lys Leu Pro Ile Gln Lys Glu Thr Trp Glu Thr Trp Trp Thr Glu Tyr 980 985 990 Trp Gln Ala Thr Trp Ile Pro Glu Trp Glu Phe Val Asn Thr Pro Pro 995 1000 1005 Leu Val Lys Leu Trp Tyr Gln Leu Glu Lys Glu Pro Ile Val Gly 1010 1015 1020 Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala Asn Arg Glu Thr Lys 1025 1030 1035 Leu Gly Lys Ala Gly Tyr Val Thr Asn Arg Gly Arg Gln Lys Val 1040 1045 1050 Val Thr Leu Thr Asp Thr Thr Asn Gln Lys Thr Glu Leu Gln Ala 1055 1060 1065 Ile Tyr Leu Ala Leu Gln Asp Ser Gly Leu Glu Val Asn Ile Val 1070 1075 1080 Thr Asp Ser Gln Tyr Ala Leu Gly Ile Ile Gln Ala Gln Pro Asp 1085 1090 1095 Gln Ser Glu Ser Glu Leu Val Asn Gln Ile Ile Glu Gln Leu Ile 1100 1105 1110 Lys Lys Glu Lys Val Tyr Leu Ala Trp Val Pro Ala His Lys Gly 1115 1120 1125 Ile Gly Gly Asn Glu Gln Val Asp Lys Leu Val Ser Ala Gly Ile 1130 1135 1140 Arg Lys Val Leu Phe Leu Asp Gly Ile Asp Lys Ala Gln Asp Glu 1145 1150 1155 His Glu Lys Tyr His Ser Asn Trp Arg Ala Met Ala Ser Asp Phe 1160 1165 1170 Asn Leu Pro Pro Val Val Ala Lys Glu Ile Val Ala Ser Cys Asp 1175 1180 1185 Lys Cys Gln Leu Lys Gly Glu Ala Met His Gly Gln Val Asp Cys 1190 1195 1200 Ser Pro Gly Ile Trp Gln Leu Asp Cys Thr His Leu Glu Gly Lys 1205 1210 1215 Val Ile Leu Val Ala Val His Val Ala Ser Gly Tyr Ile Glu Ala 1220 1225 1230 Glu Val Ile Pro Ala Glu Thr Gly Gln Glu Thr Ala Tyr Phe Leu 1235 1240 1245 Leu Lys Leu Ala Gly Arg Trp Pro Val Lys Thr Ile His Thr Asp 1250 1255 1260 Asn Gly Ser Asn Phe Thr Gly Ala Thr Val Arg Ala Ala Cys Trp 1265 1270 1275 Trp Ala Gly Ile Lys Gln Glu Phe Gly Ile Pro Tyr Asn Pro Gln 1280 1285 1290 Ser Gln Gly Val Val Glu Ser Met Asn Lys Glu Leu Lys Lys Ile 1295 1300 1305 Ile Gly Gln Val Arg Asp Gln Ala Glu His Leu Lys Thr Ala Val 1310 1315 1320 Gln Met Ala Val Phe Ile His Asn Phe Lys Arg Lys Gly Gly Ile 1325 1330 1335 Gly Gly Tyr Ser Ala Gly Glu Arg Ile Val Asp Ile Ile Ala Thr 1340 1345 1350 Asp Ile Gln Thr Lys Glu Leu Gln Lys Gln Ile Thr Lys Ile Gln 1355 1360 1365 Asn Phe Arg Val Tyr Tyr Arg Asp Ser Arg Asn Pro Leu Trp Lys 1370 1375 1380 Gly Pro Ala Lys Leu Leu Trp Lys Gly Glu Gly Ala Val Val Ile 1385 1390 1395 Gln Asp Asn Ser Asp Ile Lys Val Val Pro Arg Arg Lys Ala Lys 1400 1405 1410 Ile Ile Arg Asp Tyr Gly Lys Gln Met Ala Gly Asp Asp Cys Val 1415 1420 1425 Ala Ser Arg Gln Asp Glu Asp 1430 1435 <210> 652 <211> 500 <212> PRT <213> Human immunodeficiency virus 1 <400> 652 Met Gly Ala Arg Ala Ser Val Leu Ser Gly Gly Glu Leu Asp Arg Trp 1 5 10 15 Glu Lys Ile Arg Leu Arg Pro Gly Gly Lys Lys Lys Tyr Lys Leu Lys 20 25 30 His Ile Val Trp Ala Ser Arg Glu Leu Glu Arg Phe Ala Val Asn Pro 35 40 45 Gly Leu Leu Glu Thr Ser Glu Gly Cys Arg Gln Ile Leu Gly Gln Leu 50 55 60 Gln Pro Ser Leu Gln Thr Gly Ser Glu Glu Leu Arg Ser Leu Tyr Asn 65 70 75 80 Thr Val Ala Thr Leu Tyr Cys Val His Gln Arg Ile Glu Ile Lys Asp 85 90 95 Thr Lys Glu Ala Leu Asp Lys Ile Glu Glu Glu Gln Asn Lys Ser Lys 100 105 110 Lys Lys Ala Gln Gln Ala Ala Ala Asp Thr Gly His Ser Asn Gln Val 115 120 125 Ser Gln Asn Tyr Pro Ile Val Gln Asn Ile Gln Gly Gln Met Val His 130 135 140 Gln Ala Ile Ser Pro Arg Thr Leu Asn Ala Trp Val Lys Val Val Glu 145 150 155 160 Glu Lys Ala Phe Ser Pro Glu Val Ile Pro Met Phe Ser Ala Leu Ser 165 170 175 Glu Gly Ala Thr Pro Gln Asp Leu Asn Thr Met Leu Asn Thr Val Gly 180 185 190 Gly His Gln Ala Ala Met Gln Met Leu Lys Glu Thr Ile Asn Glu Glu 195 200 205 Ala Ala Glu Trp Asp Arg Val His Pro Val His Ala Gly Pro Ile Ala 210 215 220 Pro Gly Gln Met Arg Glu Pro Arg Gly Ser Asp Ile Ala Gly Thr Thr 225 230 235 240 Ser Thr Leu Gln Glu Gln Ile Gly Trp Met Thr Asn Asn Pro Pro Ile 245 250 255 Pro Val Gly Glu Ile Tyr Lys Arg Trp Ile Ile Leu Gly Leu Asn Lys 260 265 270 Ile Val Arg Met Tyr Ser Pro Thr Ser Ile Leu Asp Ile Arg Gln Gly 275 280 285 Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe Tyr Lys Thr Leu 290 295 300 Arg Ala Glu Gln Ala Ser Gln Glu Val Lys Asn Trp Met Thr Glu Thr 305 310 315 320 Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys Thr Ile Leu Lys Ala 325 330 335 Leu Gly Pro Ala Ala Thr Leu Glu Glu Met Met Thr Ala Cys Gln Gly 340 345 350 Val Gly Gly Pro Gly His Lys Ala Arg Val Leu Ala Glu Ala Met Ser 355 360 365 Gln Val Thr Asn Ser Ala Thr Ile Met Met Gln Arg Gly Asn Phe Arg 370 375 380 Asn Gln Arg Lys Ile Val Lys Cys Phe Asn Cys Gly Lys Glu Gly His 385 390 395 400 Thr Ala Arg Asn Cys Arg Ala Pro Arg Lys Lys Gly Cys Trp Lys Cys 405 410 415 Gly Lys Glu Gly His Gln Met Lys Asp Cys Thr Glu Arg Gln Ala Asn 420 425 430 Phe Leu Gly Lys Ile Trp Pro Ser Tyr Lys Gly Arg Pro Gly Asn Phe 435 440 445 Leu Gln Ser Arg Pro Glu Pro Thr Ala Pro Pro Glu Glu Ser Phe Arg 450 455 460 Ser Gly Val Glu Thr Thr Thr Pro Pro Gln Lys Gln Glu Pro Ile Asp 465 470 475 480 Lys Glu Leu Tyr Pro Leu Thr Ser Leu Arg Ser Leu Phe Gly Asn Asp 485 490 495 Pro Ser Ser Gln 500 <210> 653 <211> 192 <212> PRT <213> Human immunodeficiency virus 1 <400> 653 Met Glu Asn Arg Trp Gln Val Met Ile Val Trp Gln Val Asp Arg Met 1 5 10 15 Arg Ile Arg Thr Trp Lys Ser Leu Val Lys His His Met Tyr Val Ser 20 25 30 Gly Lys Ala Arg Gly Trp Phe Tyr Arg His His Tyr Glu Ser Pro His 35 40 45 Pro Arg Ile Ser Ser Glu Val His Ile Pro Leu Gly Asp Ala Arg Leu 50 55 60 Val Ile Thr Thr Tyr Trp Gly Leu His Thr Gly Glu Arg Asp Trp His 65 70 75 80 Leu Gly Gln Gly Val Ser Ile Glu Trp Arg Lys Lys Arg Tyr Ser Thr 85 90 95 Gln Val Asp Pro Glu Leu Ala Asp Gln Leu Ile His Leu Tyr Tyr Phe 100 105 110 Asp Cys Phe Ser Asp Ser Ala Ile Arg Lys Ala Leu Leu Gly His Ile 115 120 125 Val Ser Pro Arg Cys Glu Tyr Gln Ala Gly His Asn Lys Val Gly Ser 130 135 140 Leu Gln Tyr Leu Ala Leu Ala Ala Leu Ile Thr Pro Lys Lys Ile Lys 145 150 155 160 Pro Pro Leu Pro Ser Val Thr Lys Leu Thr Glu Asp Arg Trp Asn Lys 165 170 175 Pro Gln Lys Thr Lys Gly His Arg Gly Ser His Thr Met Asn Gly His 180 185 190 <210> 654 <211> 96 <212> PRT <213> Human immunodeficiency virus 1 <400> 654 Met Glu Gln Ala Pro Glu Asp Gln Gly Pro Gln Arg Glu Pro His Asn 1 5 10 15 Glu Trp Thr Leu Glu Leu Leu Glu Glu Leu Lys Asn Glu Ala Val Arg 20 25 30 His Phe Pro Arg Ile Trp Leu His Gly Leu Gly Gln His Ile Tyr Glu 35 40 45 Thr Tyr Gly Asp Thr Trp Ala Gly Val Glu Ala Ile Ile Arg Ile Leu 50 55 60 Gln Gln Leu Leu Phe Ile His Phe Arg Ile Gly Cys Arg His Ser Arg 65 70 75 80 Ile Gly Val Thr Arg Gln Arg Arg Ala Arg Asn Gly Ala Ser Arg Ser 85 90 95 <210> 655 <211> 86 <212> PRT <213> Human immunodeficiency virus 1 <400> 655 Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser 1 5 10 15 Gln Pro Lys Thr Ala Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Phe 20 25 30 His Cys Gln Val Cys Phe Ile Thr Lys Ala Leu Gly Ile Ser Tyr Gly 35 40 45 Arg Lys Lys Arg Arg Gln Arg Arg Arg Ala His Gln Asn Ser Gln Thr 50 55 60 His Gln Ala Ser Leu Ser Lys Gln Pro Thr Ser Gln Pro Arg Gly Asp 65 70 75 80 Pro Thr Gly Pro Lys Glu 85 <210> 656 <211> 116 <212> PRT <213> Human immunodeficiency virus 1 <400> 656 Met Ala Gly Arg Ser Gly Asp Ser Asp Glu Glu Leu Ile Arg Thr Val 1 5 10 15 Arg Leu Ile Lys Leu Leu Tyr Gln Ser Asn Pro Pro Pro Asn Pro Glu 20 25 30 Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Glu Arg 35 40 45 Gln Arg Gln Ile His Ser Ile Ser Glu Arg Ile Leu Gly Thr Tyr Leu 50 55 60 Gly Arg Ser Ala Glu Pro Val Pro Leu Gln Leu Pro Pro Leu Glu Arg 65 70 75 80 Leu Thr Leu Asp Cys Asn Glu Asp Cys Gly Thr Ser Gly Thr Gln Gly 85 90 95 Val Gly Ser Pro Gln Ile Leu Val Glu Ser Pro Thr Val Leu Glu Ser 100 105 110 Gly Thr Lys Glu 115 <210> 657 <211> 82 <212> PRT <213> Human immunodeficiency virus 1 <400> 657 Met Gln Pro Ile Pro Ile Val Ala Ile Val Ala Leu Val Val Ala Ile 1 5 10 15 Ile Ile Ala Ile Val Val Trp Ser Ile Val Ile Ile Glu Tyr Arg Lys 20 25 30 Ile Leu Arg Gln Arg Lys Ile Asp Arg Leu Ile Asp Arg Leu Ile Glu 35 40 45 Arg Ala Glu Asp Ser Gly Asn Glu Ser Glu Gly Glu Ile Ser Ala Leu 50 55 60 Val Glu Met Gly Val Glu Met Gly His His Ala Pro Trp Asp Val Asp 65 70 75 80 Asp Leu <210> 658 <211> 856 <212> PRT <213> Human immunodeficiency virus 1 <400> 658 Met Arg Val Lys Glu Lys Tyr Gln His Leu Trp Arg Trp Gly Trp Arg 1 5 10 15 Trp Gly Thr Met Leu Leu Gly Met Leu Met Ile Cys Ser Ala Thr Glu 20 25 30 Lys Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala 35 40 45 Thr Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Asp Thr Glu 50 55 60 Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn 65 70 75 80 Pro Gln Glu Val Val Leu Val Asn Val Thr Glu Asn Phe Asn Met Trp 85 90 95 Lys Asn Asp Met Val Glu Gln Met His Glu Asp Ile Ile Ser Leu Trp 100 105 110 Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Ser 115 120 125 Leu Lys Cys Thr Asp Leu Lys Asn Asp Thr Asn Thr Asn Ser Ser Ser 130 135 140 Gly Arg Met Ile Met Glu Lys Gly Glu Ile Lys Asn Cys Ser Phe Asn 145 150 155 160 Ile Ser Thr Ser Ile Arg Gly Lys Val Gln Lys Glu Tyr Ala Phe Phe 165 170 175 Tyr Lys Leu Asp Ile Ile Pro Ile Asp Asn Asp Thr Thr Ser Tyr Lys 180 185 190 Leu Thr Ser Cys Asn Thr Ser Val Ile Thr Gln Ala Cys Pro Lys Val 195 200 205 Ser Phe Glu Pro Ile Pro Ile His Tyr Cys Ala Pro Ala Gly Phe Ala 210 215 220 Ile Leu Lys Cys Asn Asn Lys Thr Phe Asn Gly Thr Gly Pro Cys Thr 225 230 235 240 Asn Val Ser Thr Val Gln Cys Thr His Gly Ile Arg Pro Val Val Ser 245 250 255 Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu Glu Val Val Ile 260 265 270 Arg Ser Val Asn Phe Thr Asp Asn Ala Lys Thr Ile Ile Val Gln Leu 275 280 285 Asn Thr Ser Val Glu Ile Asn Cys Thr Arg Pro Asn Asn Asn Thr Arg 290 295 300 Lys Arg Ile Arg Ile Gln Arg Gly Pro Gly Arg Ala Phe Val Thr Ile 305 310 315 320 Gly Lys Ile Gly Asn Met Arg Gln Ala His Cys Asn Ile Ser Arg Ala 325 330 335 Lys Trp Asn Asn Thr Leu Lys Gln Ile Ala Ser Lys Leu Arg Glu Gln 340 345 350 Phe Gly Asn Asn Lys Thr Ile Ile Phe Lys Gln Ser Ser Gly Gly Asp 355 360 365 Pro Glu Ile Val Thr His Ser Phe Asn Cys Gly Gly Glu Phe Phe Tyr 370 375 380 Cys Asn Ser Thr Gln Leu Phe Asn Ser Thr Trp Phe Asn Ser Thr Trp 385 390 395 400 Ser Thr Glu Gly Ser Asn Asn Thr Glu Gly Ser Asp Thr Ile Thr Leu 405 410 415 Pro Cys Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Lys Val Gly Lys 420 425 430 Ala Met Tyr Ala Pro Pro Ile Ser Gly Gln Ile Arg Cys Ser Ser Asn 435 440 445 Ile Thr Gly Leu Leu Leu Thr Arg Asp Gly Gly Asn Ser Asn Asn Glu 450 455 460 Ser Glu Ile Phe Arg Pro Gly Gly Gly Asp Met Arg Asp Asn Trp Arg 465 470 475 480 Ser Glu Leu Tyr Lys Tyr Lys Val Val Lys Ile Glu Pro Leu Gly Val 485 490 495 Ala Pro Thr Lys Ala Lys Arg Arg Val Val Gln Arg Glu Lys Arg Ala 500 505 510 Val Gly Ile Gly Ala Leu Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser 515 520 525 Thr Met Gly Ala Ala Ser Met Thr Leu Thr Val Gln Ala Arg Gln Leu 530 535 540 Leu Ser Gly Ile Val Gln Gln Gln Asn Asn Leu Leu Arg Ala Ile Glu 545 550 555 560 Ala Gln Gln His Leu Leu Gln Leu Thr Val Trp Gly Ile Lys Gln Leu 565 570 575 Gln Ala Arg Ile Leu Ala Val Glu Arg Tyr Leu Lys Asp Gln Gln Leu 580 585 590 Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Thr Thr Ala Val 595 600 605 Pro Trp Asn Ala Ser Trp Ser Asn Lys Ser Leu Glu Gln Ile Trp Asn 610 615 620 His Thr Thr Trp Met Glu Trp Asp Arg Glu Ile Asn Asn Tyr Thr Ser 625 630 635 640 Leu Ile His Ser Leu Ile Glu Glu Ser Gln Asn Gln Gln Glu Lys Asn 645 650 655 Glu Gln Glu Leu Leu Glu Leu Asp Lys Trp Ala Ser Leu Trp Asn Trp 660 665 670 Phe Asn Ile Thr Asn Trp Leu Trp Tyr Ile Lys Leu Phe Ile Met Ile 675 680 685 Val Gly Gly Leu Val Gly Leu Arg Ile Val Phe Ala Val Leu Ser Ile 690 695 700 Val Asn Arg Val Arg Gln Gly Tyr Ser Pro Leu Ser Phe Gln Thr His 705 710 715 720 Leu Pro Thr Pro Arg Gly Pro Asp Arg Pro Glu Gly Ile Glu Glu Glu 725 730 735 Gly Gly Glu Arg Asp Arg Asp Arg Ser Ile Arg Leu Val Asn Gly Ser 740 745 750 Leu Ala Leu Ile Trp Asp Asp Leu Arg Ser Leu Cys Leu Phe Ser Tyr 755 760 765 His Arg Leu Arg Asp Leu Leu Leu Ile Val Thr Arg Ile Val Glu Leu 770 775 780 Leu Gly Arg Arg Gly Trp Glu Ala Leu Lys Tyr Trp Trp Asn Leu Leu 785 790 795 800 Gln Tyr Trp Ser Gln Glu Leu Lys Asn Ser Ala Val Ser Leu Leu Asn 805 810 815 Ala Thr Ala Ile Ala Val Ala Glu Gly Thr Asp Arg Val Ile Glu Val 820 825 830 Val Gln Gly Ala Cys Arg Ala Ile Arg His Ile Pro Arg Arg Ile Arg 835 840 845 Gln Gly Leu Glu Arg Ile Leu Leu 850 855 <210> 659 <211> 189 <212> PRT <213> Human immunodeficiency virus 1 <400> 659 Met Pro Gln Thr Val Ser Cys Asn Arg Cys Cys Cys Ala Ser Ile Ala 1 5 10 15 Leu Ser Lys Leu Phe Cys Cys Cys Thr Ile Pro Asp Asn Asn Cys Leu 20 25 30 Ala Cys Thr Val Ser Val Ile Glu Ala Ala Pro Ile Val Leu Pro Ala 35 40 45 Ala Pro Lys Asn Pro Arg Asn Lys Ala Pro Ile Pro Thr Ala Leu Phe 50 55 60 Ser Leu Cys Thr Thr Leu Leu Phe Ala Leu Val Gly Ala Thr Pro Asn 65 70 75 80 Gly Ser Ile Phe Thr Thr Leu Tyr Leu Tyr Asn Ser Leu Leu Gln Leu 85 90 95 Ser Leu Ile Ser Pro Pro Pro Gly Leu Lys Ile Ser Asp Ser Leu Leu 100 105 110 Leu Leu Pro Pro Ser Leu Val Asn Ser Ser Pro Val Ile Phe Asp Glu 115 120 125 His Leu Ile Cys Pro Leu Met Gly Gly Ala Tyr Ile Ala Phe Pro Thr 130 135 140 Phe Cys His Met Phe Ile Ile Cys Phe Ile Leu His Gly Arg Val Ile 145 150 155 160 Val Ser Leu Pro Ser Val Leu Phe Asp Pro Ser Val Leu Gln Val Leu 165 170 175 Leu Asn Gln Val Leu Leu Asn Ser Cys Val Glu Leu Gln 180 185 <210> 660 <211> 206 <212> PRT <213> Human immunodeficiency virus 1 <400> 660 Met Gly Gly Lys Trp Ser Lys Ser Ser Val Ile Gly Trp Pro Thr Val 1 5 10 15 Arg Glu Arg Met Arg Arg Ala Glu Pro Ala Ala Asp Arg Val Gly Ala 20 25 30 Ala Ser Arg Asp Leu Glu Lys His Gly Ala Ile Thr Ser Ser Asn Thr 35 40 45 Ala Ala Thr Asn Ala Ala Cys Ala Trp Leu Glu Ala Gln Glu Glu Glu 50 55 60 Glu Val Gly Phe Pro Val Thr Pro Gln Val Pro Leu Arg Pro Met Thr 65 70 75 80 Tyr Lys Ala Ala Val Asp Leu Ser His Phe Leu Lys Glu Lys Gly Gly 85 90 95 Leu Glu Gly Leu Ile His Ser Gln Arg Arg Gln Asp Ile Leu Asp Leu 100 105 110 Trp Ile Tyr His Thr Gln Gly Tyr Phe Pro Asp Trp Gln Asn Tyr Thr 115 120 125 Pro Gly Pro Gly Val Arg Tyr Pro Leu Thr Phe Gly Trp Cys Tyr Lys 130 135 140 Leu Val Pro Val Glu Pro Asp Lys Ile Glu Glu Ala Asn Lys Gly Glu 145 150 155 160 Asn Thr Ser Leu Leu His Pro Val Ser Leu His Gly Met Asp Asp Pro 165 170 175 Glu Arg Glu Val Leu Glu Trp Arg Phe Asp Ser Arg Leu Ala Phe His 180 185 190 His Val Ala Arg Glu Leu His Pro Glu Tyr Phe Lys Asn Cys 195 200 205 <210> 661 <400> 661 000 <210> 662 <400> 662 000 <210> 663 <400> 663 000 <210> 664 <400> 664 000 <210> 665 <400> 665 000 <210> 666 <400> 666 000 <210> 667 <400> 667 000 <210> 668 <400> 668 000 <210> 669 <400> 669 000 <210> 670 <400> 670 000 <210> 671 <400> 671 000 <210> 672 <400> 672 000 <210> 673 <400> 673 000 <210> 674 <400> 674 000 <210> 675 <400> 675 000 <210> 676 <400> 676 000 <210> 677 <400> 677 000 <210> 678 <400> 678 000 <210> 679 <400> 679 000 <210> 680 <400> 680 000 <210> 681 <400> 681 000 <210> 682 <400> 682 000 <210> 683 <400> 683 000 <210> 684 <400> 684 000 <210> 685 <400> 685 000 <210> 686 <400> 686 000 <210> 687 <400> 687 000 <210> 688 <400> 688 000 <210> 689 <400> 689 000 <210> 690 <400> 690 000 <210> 691 <400> 691 000 <210> 692 <400> 692 000 <210> 693 <400> 693 000 <210> 694 <400> 694 000 <210> 695 <400> 695 000 <210> 696 <400> 696 000 <210> 697 <400> 697 000 <210> 698 <400> 698 000 <210> 699 <400> 699 000 <210> 700 <400> 700 000 <210> 701 <211> 420 <212> DNA <213> Respiratory syncytial virus <400> 701 atgggcagca attcattgag tatgataaaa gttagattgc aaaatttatt tgacaatgat 60 gaagtagcat tgttaaaaat aacctgctat actgacaaat tgatacattt aactaatgct 120 ttggctaagg cagtgataca tacaatcaaa ttgaatggca ttgtatttgt gcatgttatt 180 acaagtagtg atatttgccc taataataat attgtagtga aatccaactt cacaacaatg 240 ccagtgttac aaaatggagg ttatatatgg gaaatgatgg aattaacaca ctgctctcaa 300 cccaatggcc taatagatga caattgtgaa atcaaattct ccaaaaaact aagcgattca 360 acaatgacca actatatgaa tcaattatct gaattacttg gatttgatct caatccataa 420 <210> 702 <211> 375 <212> DNA <213> Respiratory syncytial virus <400> 702 atggacacaa cacacaatgg tactacacca caaagactga tgatcacaga catgagacca 60 ttgtcacttg agactataat aacatcacta accagagaca tcataacaca cagatttata 120 tacttgataa atcatgaatg tatagtgaga aaacttgatg aaagacaggc cacatttaca 180 ttcctggtca actatgaaat gaaactattg cacaaagtgg gaagcactaa gtacaaaaaa 240 tatactgaat acaacacaaa atatggcact tttcctatgc caatatttat caatcatgat 300 gggttcttag aatgcattgg cattaagcct acaaagcaca ctcccataat atacaagtat 360 gatctcaatc catga 375 <210> 703 <211> 1176 <212> DNA <213> Respiratory syncytial virus <400> 703 atggctctta gcaaagtcaa gttgaacgat acactcaaca aagatcaact tctgtcatcc 60 agcaaataca ccatccaacg gagcacagga gatagtattg atactcctaa ttatgatgtg 120 cagaaacaca tcaacaagtt atgtggcatg ttattaatca cagaagatgc taatcataaa 180 ttcactgggg taataggtat gttatatgct atgtctagat taggaagaga agacaccata 240 aaaatactca gagatgcggg atatcatgta aaagcaaatg gagtggatgt aacaacacat 300 cgtcaagaca ttaatggaaa agaaatgaaa tttgaagtgt taacattggc aagcttaaca 360 actgaaattc aaatcaacat tgagatagaa tctaggaaat cctacaaaaa aatgctaaaa 420 gaaatgggag aggtggctcc agaatacagg catgactctc ctgattgtgg aatgataata 480 ttatgtatag cagcattagt aataaccaaa ttagcagcag gggatagatc tggtcttact 540 gctgtgatta ggagagctaa taatgttcta aaaaatgaaa tgaaacgtta taaaggctta 600 ctaccaaagg atatagccaa cagcttctat gaagtgtttg aaaaatatcc tcactttata 660 gatgtttttg ttcattttgg tatagcacaa tcttctacca gaggtggcag tagagttgaa 720 gggatttttg caggattgtt tatgaatgcc tatggtgcag ggcaagtgat gttacggtgg 780 ggagtcttag caaaatcagt taaaaatatt atgctaggac atgctagtgt gcaagcagaa 840 atggaacaag ttgtggaagt ttatgaatat gcccaaaaat tgggtggaga agcaggattc 900 taccatatat tgaacaatcc aaaagcatca ttattatctt tgactcaatt tccccacttc 960 tccagtgtag tattgggcaa tgctgctggc ctaggcataa tgggagaata cagaggtaca 1020 ccaaggaatc aagatctata tgatgctgca aaggcatatg ctgaacaact caaagaaaat 1080 ggtgtgatta actacagtgt attagacttg acagcagaag aactagaggc tatcaaacat 1140 cagcttaatc caaaagataa tgatgtagag ctttga 1176 <210> 704 <211> 726 <212> DNA <213> Respiratory syncytial virus <400> 704 atggaaaagt ttgctcctga attccatgga gaagacgcaa acaacagagc cactaaattc 60 ctagaatcaa taaagggcaa attcacatca cctaaagatc ccaagaaaaa agatagtatc 120 atatctgtca actcaataga tatagaagta accaaagaaa gccctataac ttcaaattca 180 accattataa accctacaaa tgagacagat gatactgcag ggaacaagcc caattatcaa 240 agaaaaccac tagtgagttt caaagaagac cctacgccaa gtgataatcc cttttcaaaa 300 ctatacaaag aaaccataga aacatttgat aacaatgaag aagaatctag ctattcatat 360 gaagaaataa atgatcagac aaacgataat ataacagcaa gattagatag gattgatgaa 420 aaattaagtg aaatactagg aatgcttcac acactagtag tagcaagtgc aggacctaca 480 tctgctcggg atggtataag agatgccatg gttggtttaa gagaagaaat gatagaaaaa 540 atcagaactg aagcattgat gaccaatgat agattagaag ctatggcaag actcaggaat 600 gaggaaagtg aaaagatggc aaaagacaca tcagatgaag tgtctctcaa tccaacatca 660 gagaaattga acaacctgtt ggaaggaaat gatagtgata atgatctatc acttgaagat 720 ttctga 726 <210> 705 <211> 771 <212> DNA <213> Respiratory syncytial virus <400> 705 atggaaacat acgtgaacaa acttcacgaa ggctccacat acacagctgc tgttcaatac 60 aatgtcctag aaaaagacga tgaccctgca tcacttacaa tatgggtgcc catgttccaa 120 tcatccatgc cagcagattt acttataaaa gaactagcta atgtcaacat actagtgaaa 180 caaatatcca cacccaaagg accttcatta agagtcatga taaactcaag aagtgcagtg 240 ctagcacaaa tgcccagcaa attcactata tgtgccaatg tgtccttgga tgaaagaagc 300 aagctggcat atgatgtaac cacaccctgc gaaatcaagg catgtagtct aacatgccta 360 aaatcaaaaa atatgttaac tacagttaaa gatctcacta tgaaaacact caacccaaca 420 catgacatca ttgctttatg tgaatttgaa aatatagtaa catcaaaaaa agtcataata 480 ccaacatact taagatccat cagtgtcaga aataaagatc tgaacacact tgaaaatata 540 acaaccaccg aattcaaaaa tgccatcaca aatgcaaaaa tcatccctta ctcaggatta 600 ctgttagtca tcacagtgac tgacaacaaa ggagcattta aatacataaa gccacaaagt 660 caattcatag tagatcttgg agcttaccta gaaaaagaaa gtatatatta tgttacaaca 720 aattggaagc acacagctac acgatttgca atcaaaccca tggaagatta a 771 <210> 706 <211> 195 <212> DNA <213> Respiratory syncytial virus <400> 706 atggaaaata catccataac aatagaattc tcaagcaaat tctggcctta ctttacacta 60 atacatatga tcacaacaat aatctctttg ctaatcataa tctccatcat gattgcaata 120 ctaaacaaac tctgtgaata taacgtattc cataacaaaa cctttgagct accaagagct 180 cgagtcaata catag 195 <210> 707 <211> 897 <212> DNA <213> Respiratory syncytial virus <400> 707 atgtccaaaa ccaaggacca acgcaccgcc aagacactag aaaagacctg ggacactctc 60 aatcatctat tattcatatc atcgtgctta tacaagttaa atcttaaatc tatagcacaa 120 atcacattat ccattctggc aatgataatc tcaacttcac ttataattgt agctatcata 180 ttcatagcct cagcaaacaa caaagtcaca ctaacaactg caatcataca agatgcaaca 240 agccagatca agaacacaac cccaacatac ctgacccaga atccccagct tggaatcagc 300 ttcttcaatc tgtctggaac tatatcacaa accaccgcca tactagcttt aacaacacca 360 agtgtcgagt caatcctgca atctacaaca gtcaagacca aaaacacaac aacaacccaa 420 atacaaccca gcaagcccac cacaaaacaa cgccaaaaca aaccaccaaa caaacccaat 480 gatgattttc actttgaagt gttcaacttt gtaccctgca gcatatgcag caacaatcca 540 acttgctggg ccatctgcaa aagaatacca agcaaaaaac ctggaaagaa aaccaccacc 600 aagcccacga aaaaaccaac catcaagaca accaaaaaag atctcaaacc tcaaaccaca 660 aaaccaaagg aagcacccac caccaagccc acagataagc caaccatcaa catcaccaaa 720 ccaaacatca gaactacact gctcaccaac agtaccacag gaaatccaga acacacaagt 780 caagaggaaa ccctccattc aacctcctcc gaaggcaaca caagcccttc acaaatctat 840 acaacatccg agtacctatc acaacctcca tctccatcca acataacaga ccagtag 897 <210> 708 <211> 1725 <212> DNA <213> Respiratory syncytial virus <400> 708 atggagttgc caatcctcaa aacaaatgca attaccacaa tccttgctgc agtcacactc 60 tgtttcgctt ccagtcaaaa catcactgaa gaattttatc aatcaacatg cagtgcagtt 120 agcaaaggct atcttagtgc tttaagaact ggttggtata ctagtgttat aactatagaa 180 ttaagtaata tcaaggaaaa taagtgtaat ggaacagatg ctaaggtaaa attgataaaa 240 caagaattag ataaatataa aaatgctgta acagaattgc agttgctcat gcaaagcaca 300 ccagcagcca acaatcgagc cagaagagaa ctaccaaggt ttatgaatta tacactcaac 360 aataccaaaa ataacaatgt aacattaagc aagaaaagga aaagaagatt tcttggcttt 420 ttgttaggtg ttggatctgc aatcgccagt ggcattgctg tatctaaagt cctgcaccta 480 gaaggggaag tgaacaaaat caaaaatgct ctactatcca caaacaaggc tgtagtcagc 540 ttatcaaatg gagttagtgt cttaaccagc aaagtgttag acctcaaaaa ctatatagat 600 aaacagttgt tacccattgt gaacaagcaa agctgcagca tatcaaacat tgaaactgtg 660 atagaattcc aacaaaagaa caacagacta ctagagatta ccagggaatt tagtgttaat 720 gcaggtgtaa ctacacctgt aagcacttat atgttaacaa atagtgaatt attatcatta 780 atcaatgata tgcctataac aaatgatcag aaaaagttaa tgtccaacaa tgttcaaata 840 gttagacagc aaagttactc tatcatgtcc ataataaagg aggaagtctt agcatatgta 900 gttcaattac cactatatgg tgtaatagat acaccttgtt ggaaactaca cacatcccct 960 ctatgcacaa ccaacacaaa ggaagggtcc aacatctgtt taacaagaac cgacagagga 1020 tggtactgtg acaatgcagg atcagtgtct ttcttcccac aagctgaaac atgcaaagtt 1080 caatcgaatc gagtattttg tgacacaatg aacagtctaa cattaccaag tgaagtaaat 1140 ctctgcaaca ttgacatatt caaccctaaa tatgattgca aaattatgac ttcaaaaaca 1200 gatgtgagca gctccgttat cacatctcta ggagccattg tgtcatgcta tggcaaaact 1260 aaatgtacag catccaataa aaatcgtgga atcataaaga cattttctaa cgggtgtgat 1320 tatgtatcaa ataagggggt ggacactgta tctgtaggta atacattata ttatgtaaat 1380 aagcaagaag gaaaaagcct ctatgtaaaa ggtgaaccaa taataaattt ctatgaccca 1440 ttagtgttcc cttctgatga atttgatgca tcaatatctc aagtcaatga gaagattaac 1500 cagagcctag catttattcg taaatccgat gaattattac ataatgtaaa tgttggtaaa 1560 tccaccacaa atatcatgat aactactata attatagtga ttatagtaat attgttatta 1620 ttaattgcag ttgggctgtt cctatactgc aaggccagaa gcacaccagt cacactaagc 1680 aaggatcaac tgagtggtat aaataatatt gcatttagta actga 1725 <210> 709 <211> 585 <212> DNA <213> Respiratory syncytial virus <400> 709 atgtcacgaa ggaatccttg caaatttgaa attcgaggtc attgcttgaa tggtaagagg 60 tgtcatttta gtcataatta ttttgaatgg ccaccccatg cactgcttgt aagacaaaac 120 tttatgttaa acagaatact taagtctatg gataaaagca tagatacttt atcagaaata 180 agtggagctg cagagttgga cagaactgaa gagtatgccc tcggtgtagt tggagtgcta 240 gagagttata taggatcaat aaataatata actaaacaat cagcatgtgt tgccatgagc 300 aaactcctca ctgaactcaa cagtgatgac atcaaaaaac taagagataa tgaagagcca 360 aattcaccta agataagagt gtacaatact gtcatatcat atattgaaag caacaggaaa 420 aacaataaac aaactatcca tctgttaaaa agattgccag cagacgtatt gaagaaaacc 480 atcaaaaaca cattggatat ccacaagagc ataaccatca acaacccaaa agaatcaact 540 gttaatgata caaatgacca tgccaaaaat aatgatacta cctga 585 <210> 710 <211> 267 <212> DNA <213> Respiratory syncytial virus <400> 710 atgccaaaaa taatgatact acctgacaaa tatccttgta gtataaattc catactaata 60 acaagtagtt gtagagttac tatgtataat caaaagaaca cactatattt caatcaaaac 120 aaccaaaata accatacata ctcaccaaat caaccattca atgaaatcca ttggacctct 180 caagacttga ttgatgcaat tcaaaatttt ctacaacatc taggtattac tgatgatata 240 tatacaatat atatattagt gtcataa 267 <210> 711 <211> 6498 <212> DNA <213> Respiratory syncytial virus <400> 711 atggatccca ttattaatgg aaattctgct aatgtttatc taaccgatag ttatttaaaa 60 ggtgttattt ctttctcaga atgtaatgct ttaggaagtt acatattcaa tggtccttat 120 ctcaaaaatg attacaccaa cttaattagt agacaaaatc cattaataga acacataaat 180 ctaaagaaat taaatataac acagtcttta atatctaagt atcataaagg tgaaataaaa 240 atagaagaac ctacttattt tcagtcatta cttatgacat acaagagtat gacctcgtca 300 gaacagatta ctaccactaa tttacttaaa aagataataa gaagagcaat agaaattagt 360 gatgtcaaag tctatgctat attgaataaa ctggggctta aagaaaaaga caagattaaa 420 tccaacaatg gacaagatga aaacaactca gttattacaa ccataatcaa agatgatata 480 cttttagctg ttaaggataa tcaatctcat cttaaagcag gcaaaaatca ctctacaaaa 540 caaaaagata ctatcaaaac aacactcttg aaaaaattaa tgtgttcgat gcaacatcct 600 ccatcatggt taatacattg gtttaattta tacacaaaat taaacaacat attaacacag 660 tatcgatcaa atgaggtaaa aaaccatggt tttatattga tagataatca aactctcaat 720 ggattccaat ttattttgaa tcaatatggt tgtatagttt atcataagga actcaaaaga 780 attactgtga caacctataa tcaattcttg acatggaaag atattagcct tagtagatta 840 aatgtttgtt taattacatg gattagtaac tgtttgaaca cattaaacaa aagcttaggc 900 ttaagatgcg gattcaataa tgttatcttg acacaactat tcctttatgg agattgtata 960 ttaaaactat ttcacaatga agggttctac ataataaaag aggtagaggg ttttattatg 1020 tctctaattt taaacataac agaagaagat caattcagaa aacggtttta taatagtatg 1080 ctcaacaaca tcacagatgc tgctaataaa gctcagaaaa atctgttatc aagagtatgt 1140 catacattat tagataagac agtgtccgat aatataataa atggcagatg gataattcta 1200 ttaagtaagt ttcttaaatt aattaagctt gcaggtgaca acaaccttaa caatctgagt 1260 gaattatatt ttttattcag aatatttgga cacccaatgg tagatgaaag acaagccatg 1320 gatgctgtta aagttaattg caacgagacc aaattttact tgttaagcag tttgagtatg 1380 ttaagaggtg cctttatata tagaattata aaagggtttg taaataatta caacagatgg 1440 cctactttaa ggaatgctat tgttttaccc ttaagatggt taacttacta taaactaaac 1500 acttatcctt ccttattgga acttacagaa agagatttga ttgttttatc aggactacgt 1560 ttctatcgtg agtttcggtt gcctaaaaaa gtggatcttg aaatgatcat aaatgataag 1620 gctatatcac ctcctaaaaa tttgatatgg actagtttcc ctagaaatta tatgccgtca 1680 cacatacaaa attatataga acatgaaaaa ttaaaatttt ccgagagtga taaatcaaga 1740 agagtattag agtactattt aagagataac aaattcaatg aatgtgattt atataactgt 1800 gtagttaatc aaagctatct taacaaccct aatcatgtgg tatcattgac tggcaaagaa 1860 agagaactca gtgtaggtag aatgtttgca atgcaaccag gaatgttcag gcaagttcaa 1920 atattagcag agaaaatgat agctgaaaac attttacaat tctttcctga aagtcttaca 1980 agatatggtg atctagaatt acagaaaata ttagaattga aagcgggaat aagtaacaaa 2040 tcaaatcgtt acaatgacaa ttacaacaat tacatcagta agtgctctat catcacagat 2100 ctcagcaaat tcaatcaagc attccggtat gaaacatcat gtatttgtag tgatgtatta 2160 gatgaactgc atggtgtaca atctctattt tcctggttac atttaactat tcctcatgtc 2220 acaataatat gcacatatag gcatgcaccc ccctatataa gagatcacat tgtagatctt 2280 aacaatgtag atgaacaaag tggattatat agatatcata tgggtggtat cgaagggtgg 2340 tgtcaaaaac tatggaccat agaagctata tcactattgg atctaatatc tctcaagggg 2400 aaattctcaa ttactgcctt aattaatggt gacaatcaat caatagatat aagcaaacca 2460 gtcagactca tggaaggtca aactcatgct caagcagatt atttgctagc attaaatagt 2520 cttaaattgc tgtataaaga gtatgcaggc ataggccaca aattaaaagg aactgagact 2580 tatatatcaa gagatatgca atttatgagt aaaacaattc aacataacgg tgtatattac 2640 ccagctagta taaagaaagt cctaagagtg ggaccatgga taaacactat acttgatgat 2700 ttcaaagtga gtctagaatc tataggtagt ttgacacaag aattagaata tagaggtgaa 2760 agtctattat gcagtttaat atttagaaat gtgtggttat ataatcaaat tgctttacaa 2820 ctaaaaaatc atgcattatg taacaataaa ttatatttgg acatattaaa ggttctgaaa 2880 cacttaaaaa ccttttttaa tcttgataat attgatacag cattaacatt gtatatgaat 2940 ttgcccatgc tatttggtgg tggtgatccc aacttgttat atcgaagttt ctatagaaga 3000 actcctgatt tcctcacaga ggctatagtt cactctgtgt tcatacttag ttattataca 3060 aaccatgatt taaaggataa acttcaagat ctgtcagacg atagattgaa taagttctta 3120 acatgcataa tcacgtttga caaaaaccct aatgctgaat tcgtaacatt gatgagagat 3180 cctcaagctt tagggtctga gaggcaagct aaaattacta gcgaaatcaa tagactggca 3240 gttactgagg ttttgagcac agctccaaac aaaatattct ccaaaagtgc acaacactat 3300 accactacag agatagatct aaatgatatt atgcaaaata tagaacctac atatcctcat 3360 gggctaagag ttgtttatga aagtttaccc ttttataaag cagagaaaat agtaaatctt 3420 atatccggta caaaatctat aactaacata ctggaaaaga cttctgccat agacttaaca 3480 gatattgata gagccactga gatgatgagg aaaaacataa ctttgcttat aaggatattt 3540 ccattagatt gtaacagaga taaaagagaa atattgagta tggaaaacct aagtattact 3600 gaattaagca aatatgttag agaaagatct tggtctttat ccaatatagt tggtgttaca 3660 tcacccagta tcatgtatac aatggacatc aaatatacaa caagcactat agctagtggc 3720 ataatcatag agaaatataa tgtcaacagt ttaacacgtg gtgagagagg acccactaaa 3780 ccatgggttg gttcatctac acaagagaaa aaaacaatgc cagtttacaa tagacaagtt 3840 ttaaccaaaa aacagagaga tcaaattgat ctattagcaa aattggactg ggtgtatgca 3900 tctatagata acaaggatga attcatggaa gaactcagca taggaactct tgggttaaca 3960 tatgagaaag ccaaaaaatt atttccacaa tatttaagtg ttaactattt gcatcgcctt 4020 acagtcagta gtagaccatg tgaattccct gcatcaatac cagcttatag aactacaaat 4080 tatcactttg atactagccc tattaatcgc atattaacag aaaagtatgg tgatgaagat 4140 attgatatag tattccaaaa ctgtataagt tttggcctta gcttaatgtc agtagtagag 4200 caatttacca atgtatgtcc taacagaatt attctcatac ccaagcttaa tgagatacat 4260 ttgatgaaac ctcccatatt cacaggtgat gttgatattc acaagttaaa acaagtgatc 4320 caaaaacagc atatgttttt accagacaaa ataagtttga ctcaatatgt ggaattattt 4380 ttaagtaata aaacactcaa atctggatct catgttaatt ctaatttaat attggcacat 4440 aagatatctg actattttca taatacttac attttaagta ctaatttagc tggacattgg 4500 attctgatta tacaacttat gaaagattct aaaggtattt ttgaaaaaga ttggggagag 4560 ggatatataa ctgatcatat gttcattaat ttgaaagttt tcttcaatgc ttataagacc 4620 tatctcttgt gttttcataa aggttacggc agagcaaagc tagagtgcga tatgaatact 4680 tcagatctcc tatgtgtatt ggaattaata gacagtagtt attggaagtc tatgtctaag 4740 gtatttttag aacaaaaagt tatcaaatac attctcagcc aggatgcaag tttacataga 4800 gtaaaaggat gtcatagctt caaactatgg tttcttaaac gtcttaatgt agcagaattc 4860 acagtttgcc cttgggttgt taacatagat tatcatccaa cacatatgaa agcaatatta 4920 acttatatag atcttgttag aatgggattg ataaatatag atagaatata cattaaaaat 4980 aaacacaaat tcaatgatga attttatact tctaatctct tttacattaa ttataacttc 5040 tcagataata ctcatctatt aactaaacat ataaggattg ctaattctga attagaaaat 5100 aattacaaca aattatatca tcctacacct gaaactctag aaaatatact aaccaatccg 5160 gttaaatgtg atgacaaaaa gacactgaat gactattgta taggtaaaaa tgttgactca 5220 ataatgttac cattgttatc taataagaag cttattaaat cgtctacaat gattagaacc 5280 aattacagca aacaagattt gtataattta tttcctacgg ttgtgattga taaaattata 5340 gatcattcag gtaatacagc caaatctaac caactttaca ctactacttc tcatcaaata 5400 tctttagtac acaatagcac atcactttat tgcatgcttc cttggcatca tattaataga 5460 ttcaattttg tgtttagttc tacaggttgt aaaattagta tagagtatat tttaaaagac 5520 cttaaaatta aagatcctaa ttgtatagca ttcataggtg aaggagcagg gaatttattg 5580 ttgcgtacag tagtggaact tcatcctgat ataaaatata tttacagaag tctgaaagat 5640 tgcaatgatc atagtttacc tattgagttt ttaaggctgt acaatgggca tatcaacatt 5700 gattatggtg aaaatttgac cattcccgct acagatgcaa ccaacaacat tcattggtct 5760 tatttgcata taaagtttgc tgaacctatc agtctttttg tttgtgatgc tgaattgcct 5820 gtaacagtca actggagtaa aattataata gagtggagca agcatgtaag aaaatgcaag 5880 tactgttcct cagttaataa atgtacgtta atagtaaaat atcatgctca agatgatatc 5940 gatttcaaat tagacaacat aactatatta aaaacttatg tatgcttagg cagtaagtta 6000 aaggggtctg aagtttactt agtccttaca ataggtcctg caaatgtgtt cccagtattt 6060 aatgtagtac aaaatgctaa attgatacta tcaagaacca aaaatttcat catgcctaag 6120 aaggctgata aagagtctat tgatgcaaat attaaaagtt tgataccctt tctttgttac 6180 cctataacaa aaaaaggaat taatactgca ttatcaaaac taaagagtgt tgttagtgga 6240 gatatactat catattctat agctggacgt aatgaagttt tcagcaataa acttataaat 6300 cataagcata tgaacatctt aaagtggttc aaccatgttt taaatttcag atcaacagaa 6360 cttaactata atcatttata tatggtagaa tccacatatc cttatctaag tgaattgtta 6420 aacagcttga caactaatga acttaaaaaa ctgattaaaa tcacaggtag tttgttatac 6480 aactttcata atgaataa 6498 <210> 712 <400> 712 000 <210> 713 <400> 713 000 <210> 714 <400> 714 000 <210> 715 <400> 715 000 <210> 716 <400> 716 000 <210> 717 <400> 717 000 <210> 718 <400> 718 000 <210> 719 <400> 719 000 <210> 720 <400> 720 000 <210> 721 <400> 721 000 <210> 722 <400> 722 000 <210> 723 <400> 723 000 <210> 724 <400> 724 000 <210> 725 <400> 725 000 <210> 726 <400> 726 000 <210> 727 <400> 727 000 <210> 728 <400> 728 000 <210> 729 <400> 729 000 <210> 730 <400> 730 000 <210> 731 <400> 731 000 <210> 732 <400> 732 000 <210> 733 <400> 733 000 <210> 734 <400> 734 000 <210> 735 <400> 735 000 <210> 736 <400> 736 000 <210> 737 <400> 737 000 <210> 738 <400> 738 000 <210> 739 <400> 739 000 <210> 740 <400> 740 000 <210> 741 <400> 741 000 <210> 742 <400> 742 000 <210> 743 <400> 743 000 <210> 744 <400> 744 000 <210> 745 <400> 745 000 <210> 746 <400> 746 000 <210> 747 <400> 747 000 <210> 748 <400> 748 000 <210> 749 <400> 749 000 <210> 750 <400> 750 000 <210> 751 <211> 139 <212> PRT <213> Respiratory syncytial virus <400> 751 Met Gly Ser Asn Ser Leu Ser Met Ile Lys Val Arg Leu Gln Asn Leu 1 5 10 15 Phe Asp Asn Asp Glu Val Ala Leu Leu Lys Ile Thr Cys Tyr Thr Asp 20 25 30 Lys Leu Ile His Leu Thr Asn Ala Leu Ala Lys Ala Val Ile His Thr 35 40 45 Ile Lys Leu Asn Gly Ile Val Phe Val His Val Ile Thr Ser Ser Asp 50 55 60 Ile Cys Pro Asn Asn Asn Ile Val Val Lys Ser Asn Phe Thr Thr Met 65 70 75 80 Pro Val Leu Gln Asn Gly Gly Tyr Ile Trp Glu Met Met Glu Leu Thr 85 90 95 His Cys Ser Gln Pro Asn Gly Leu Ile Asp Asp Asn Cys Glu Ile Lys 100 105 110 Phe Ser Lys Lys Leu Ser Asp Ser Thr Met Thr Asn Tyr Met Asn Gln 115 120 125 Leu Ser Glu Leu Leu Gly Phe Asp Leu Asn Pro 130 135 <210> 752 <211> 124 <212> PRT <213> Respiratory syncytial virus <400> 752 Met Asp Thr Thr His Asn Gly Thr Thr Pro Gln Arg Leu Met Ile Thr 1 5 10 15 Asp Met Arg Pro Leu Ser Leu Glu Thr Ile Ile Thr Ser Leu Thr Arg 20 25 30 Asp Ile Ile Thr His Arg Phe Ile Tyr Leu Ile Asn His Glu Cys Ile 35 40 45 Val Arg Lys Leu Asp Glu Arg Gln Ala Thr Phe Thr Phe Leu Val Asn 50 55 60 Tyr Glu Met Lys Leu Leu His Lys Val Gly Ser Thr Lys Tyr Lys Lys 65 70 75 80 Tyr Thr Glu Tyr Asn Thr Lys Tyr Gly Thr Phe Pro Met Pro Ile Phe 85 90 95 Ile Asn His Asp Gly Phe Leu Glu Cys Ile Gly Ile Lys Pro Thr Lys 100 105 110 His Thr Pro Ile Ile Tyr Lys Tyr Asp Leu Asn Pro 115 120 <210> 753 <211> 391 <212> PRT <213> Respiratory syncytial virus <400> 753 Met Ala Leu Ser Lys Val Lys Leu Asn Asp Thr Leu Asn Lys Asp Gln 1 5 10 15 Leu Leu Ser Ser Ser Lys Tyr Thr Ile Gln Arg Ser Thr Gly Asp Ser 20 25 30 Ile Asp Thr Pro Asn Tyr Asp Val Gln Lys His Ile Asn Lys Leu Cys 35 40 45 Gly Met Leu Leu Ile Thr Glu Asp Ala Asn His Lys Phe Thr Gly Val 50 55 60 Ile Gly Met Leu Tyr Ala Met Ser Arg Leu Gly Arg Glu Asp Thr Ile 65 70 75 80 Lys Ile Leu Arg Asp Ala Gly Tyr His Val Lys Ala Asn Gly Val Asp 85 90 95 Val Thr Thr His Arg Gln Asp Ile Asn Gly Lys Glu Met Lys Phe Glu 100 105 110 Val Leu Thr Leu Ala Ser Leu Thr Thr Glu Ile Gln Ile Asn Ile Glu 115 120 125 Ile Glu Ser Arg Lys Ser Tyr Lys Lys Met Leu Lys Glu Met Gly Glu 130 135 140 Val Ala Pro Glu Tyr Arg His Asp Ser Pro Asp Cys Gly Met Ile Ile 145 150 155 160 Leu Cys Ile Ala Ala Leu Val Ile Thr Lys Leu Ala Ala Gly Asp Arg 165 170 175 Ser Gly Leu Thr Ala Val Ile Arg Arg Ala Asn Asn Val Leu Lys Asn 180 185 190 Glu Met Lys Arg Tyr Lys Gly Leu Leu Pro Lys Asp Ile Ala Asn Ser 195 200 205 Phe Tyr Glu Val Phe Glu Lys Tyr Pro His Phe Ile Asp Val Phe Val 210 215 220 His Phe Gly Ile Ala Gln Ser Ser Thr Arg Gly Gly Ser Arg Val Glu 225 230 235 240 Gly Ile Phe Ala Gly Leu Phe Met Asn Ala Tyr Gly Ala Gly Gln Val 245 250 255 Met Leu Arg Trp Gly Val Leu Ala Lys Ser Val Lys Asn Ile Met Leu 260 265 270 Gly His Ala Ser Val Gln Ala Glu Met Glu Gln Val Val Glu Val Tyr 275 280 285 Glu Tyr Ala Gln Lys Leu Gly Gly Glu Ala Gly Phe Tyr His Ile Leu 290 295 300 Asn Asn Pro Lys Ala Ser Leu Leu Ser Leu Thr Gln Phe Pro His Phe 305 310 315 320 Ser Ser Val Val Leu Gly Asn Ala Ala Gly Leu Gly Ile Met Gly Glu 325 330 335 Tyr Arg Gly Thr Pro Arg Asn Gln Asp Leu Tyr Asp Ala Ala Lys Ala 340 345 350 Tyr Ala Glu Gln Leu Lys Glu Asn Gly Val Ile Asn Tyr Ser Val Leu 355 360 365 Asp Leu Thr Ala Glu Glu Leu Glu Ala Ile Lys His Gln Leu Asn Pro 370 375 380 Lys Asp Asn Asp Val Glu Leu 385 390 <210> 754 <211> 241 <212> PRT <213> Respiratory syncytial virus <400> 754 Met Glu Lys Phe Ala Pro Glu Phe His Gly Glu Asp Ala Asn Asn Arg 1 5 10 15 Ala Thr Lys Phe Leu Glu Ser Ile Lys Gly Lys Phe Thr Ser Pro Lys 20 25 30 Asp Pro Lys Lys Lys Asp Ser Ile Ile Ser Val Asn Ser Ile Asp Ile 35 40 45 Glu Val Thr Lys Glu Ser Pro Ile Thr Ser Asn Ser Thr Ile Ile Asn 50 55 60 Pro Thr Asn Glu Thr Asp Asp Thr Ala Gly Asn Lys Pro Asn Tyr Gln 65 70 75 80 Arg Lys Pro Leu Val Ser Phe Lys Glu Asp Pro Thr Pro Ser Asp Asn 85 90 95 Pro Phe Ser Lys Leu Tyr Lys Glu Thr Ile Glu Thr Phe Asp Asn Asn 100 105 110 Glu Glu Glu Ser Ser Tyr Ser Tyr Glu Glu Ile Asn Asp Gln Thr Asn 115 120 125 Asp Asn Ile Thr Ala Arg Leu Asp Arg Ile Asp Glu Lys Leu Ser Glu 130 135 140 Ile Leu Gly Met Leu His Thr Leu Val Val Ala Ser Ala Gly Pro Thr 145 150 155 160 Ser Ala Arg Asp Gly Ile Arg Asp Ala Met Val Gly Leu Arg Glu Glu 165 170 175 Met Ile Glu Lys Ile Arg Thr Glu Ala Leu Met Thr Asn Asp Arg Leu 180 185 190 Glu Ala Met Ala Arg Leu Arg Asn Glu Glu Ser Glu Lys Met Ala Lys 195 200 205 Asp Thr Ser Asp Glu Val Ser Leu Asn Pro Thr Ser Glu Lys Leu Asn 210 215 220 Asn Leu Leu Glu Gly Asn Asp Ser Asp Asn Asp Leu Ser Leu Glu Asp 225 230 235 240 Phe <210> 755 <211> 256 <212> PRT <213> Respiratory syncytial virus <400> 755 Met Glu Thr Tyr Val Asn Lys Leu His Glu Gly Ser Thr Tyr Thr Ala 1 5 10 15 Ala Val Gln Tyr Asn Val Leu Glu Lys Asp Asp Asp Pro Ala Ser Leu 20 25 30 Thr Ile Trp Val Pro Met Phe Gln Ser Ser Met Pro Ala Asp Leu Leu 35 40 45 Ile Lys Glu Leu Ala Asn Val Asn Ile Leu Val Lys Gln Ile Ser Thr 50 55 60 Pro Lys Gly Pro Ser Leu Arg Val Met Ile Asn Ser Arg Ser Ala Val 65 70 75 80 Leu Ala Gln Met Pro Ser Lys Phe Thr Ile Cys Ala Asn Val Ser Leu 85 90 95 Asp Glu Arg Ser Lys Leu Ala Tyr Asp Val Thr Thr Pro Cys Glu Ile 100 105 110 Lys Ala Cys Ser Leu Thr Cys Leu Lys Ser Lys Asn Met Leu Thr Thr 115 120 125 Val Lys Asp Leu Thr Met Lys Thr Leu Asn Pro Thr His Asp Ile Ile 130 135 140 Ala Leu Cys Glu Phe Glu Asn Ile Val Thr Ser Lys Lys Val Ile Ile 145 150 155 160 Pro Thr Tyr Leu Arg Ser Ile Ser Val Arg Asn Lys Asp Leu Asn Thr 165 170 175 Leu Glu Asn Ile Thr Thr Thr Glu Phe Lys Asn Ala Ile Thr Asn Ala 180 185 190 Lys Ile Ile Pro Tyr Ser Gly Leu Leu Leu Val Ile Thr Val Thr Asp 195 200 205 Asn Lys Gly Ala Phe Lys Tyr Ile Lys Pro Gln Ser Gln Phe Ile Val 210 215 220 Asp Leu Gly Ala Tyr Leu Glu Lys Glu Ser Ile Tyr Tyr Val Thr Thr 225 230 235 240 Asn Trp Lys His Thr Ala Thr Arg Phe Ala Ile Lys Pro Met Glu Asp 245 250 255 <210> 756 <211> 64 <212> PRT <213> Respiratory syncytial virus <400> 756 Met Glu Asn Thr Ser Ile Thr Ile Glu Phe Ser Ser Lys Phe Trp Pro 1 5 10 15 Tyr Phe Thr Leu Ile His Met Ile Thr Thr Ile Ile Ser Leu Leu Ile 20 25 30 Ile Ile Ser Ile Met Ile Ala Ile Leu Asn Lys Leu Cys Glu Tyr Asn 35 40 45 Val Phe His Asn Lys Thr Phe Glu Leu Pro Arg Ala Arg Val Asn Thr 50 55 60 <210> 757 <211> 298 <212> PRT <213> Respiratory syncytial virus <400> 757 Met Ser Lys Thr Lys Asp Gln Arg Thr Ala Lys Thr Leu Glu Lys Thr 1 5 10 15 Trp Asp Thr Leu Asn His Leu Leu Phe Ile Ser Ser Cys Leu Tyr Lys 20 25 30 Leu Asn Leu Lys Ser Ile Ala Gln Ile Thr Leu Ser Ile Leu Ala Met 35 40 45 Ile Ile Ser Thr Ser Leu Ile Ile Val Ala Ile Ile Phe Ile Ala Ser 50 55 60 Ala Asn Asn Lys Val Thr Leu Thr Thr Ala Ile Ile Gln Asp Ala Thr 65 70 75 80 Ser Gln Ile Lys Asn Thr Thr Pro Thr Tyr Leu Thr Gln Asn Pro Gln 85 90 95 Leu Gly Ile Ser Phe Phe Asn Leu Ser Gly Thr Ile Ser Gln Thr Thr 100 105 110 Ala Ile Leu Ala Leu Thr Thr Pro Ser Val Glu Ser Ile Leu Gln Ser 115 120 125 Thr Thr Val Lys Thr Lys Asn Thr Thr Thr Thr Gln Ile Gln Pro Ser 130 135 140 Lys Pro Thr Thr Lys Gln Arg Gln Asn Lys Pro Pro Asn Lys Pro Asn 145 150 155 160 Asp Asp Phe His Phe Glu Val Phe Asn Phe Val Pro Cys Ser Ile Cys 165 170 175 Ser Asn Asn Pro Thr Cys Trp Ala Ile Cys Lys Arg Ile Pro Ser Lys 180 185 190 Lys Pro Gly Lys Lys Thr Thr Thr Lys Pro Thr Lys Lys Pro Thr Ile 195 200 205 Lys Thr Thr Lys Lys Asp Leu Lys Pro Gln Thr Thr Lys Pro Lys Glu 210 215 220 Ala Pro Thr Thr Lys Pro Thr Asp Lys Pro Thr Ile Asn Ile Thr Lys 225 230 235 240 Pro Asn Ile Arg Thr Thr Leu Leu Thr Asn Ser Thr Thr Gly Asn Pro 245 250 255 Glu His Thr Ser Gln Glu Glu Thr Leu His Ser Thr Ser Ser Glu Gly 260 265 270 Asn Thr Ser Pro Ser Gln Ile Tyr Thr Thr Ser Glu Tyr Leu Ser Gln 275 280 285 Pro Pro Ser Pro Ser Asn Ile Thr Asp Gln 290 295 <210> 758 <211> 574 <212> PRT <213> Respiratory syncytial virus <400> 758 Met Glu Leu Pro Ile Leu Lys Thr Asn Ala Ile Thr Thr Ile Leu Ala 1 5 10 15 Ala Val Thr Leu Cys Phe Ala Ser Ser Gln Asn Ile Thr Glu Glu Phe 20 25 30 Tyr Gln Ser Thr Cys Ser Ala Val Ser Lys Gly Tyr Leu Ser Ala Leu 35 40 45 Arg Thr Gly Trp Tyr Thr Ser Val Ile Thr Ile Glu Leu Ser Asn Ile 50 55 60 Lys Glu Asn Lys Cys Asn Gly Thr Asp Ala Lys Val Lys Leu Ile Lys 65 70 75 80 Gln Glu Leu Asp Lys Tyr Lys Asn Ala Val Thr Glu Leu Gln Leu Leu 85 90 95 Met Gln Ser Thr Pro Ala Ala Asn Asn Arg Ala Arg Arg Glu Leu Pro 100 105 110 Arg Phe Met Asn Tyr Thr Leu Asn Asn Thr Lys Asn Asn Asn Val Thr 115 120 125 Leu Ser Lys Lys Arg Lys Arg Arg Phe Leu Gly Phe Leu Leu Gly Val 130 135 140 Gly Ser Ala Ile Ala Ser Gly Ile Ala Val Ser Lys Val Leu His Leu 145 150 155 160 Glu Gly Glu Val Asn Lys Ile Lys Asn Ala Leu Leu Ser Thr Asn Lys 165 170 175 Ala Val Val Ser Leu Ser Asn Gly Val Ser Val Leu Thr Ser Lys Val 180 185 190 Leu Asp Leu Lys Asn Tyr Ile Asp Lys Gln Leu Leu Pro Ile Val Asn 195 200 205 Lys Gln Ser Cys Ser Ile Ser Asn Ile Glu Thr Val Ile Glu Phe Gln 210 215 220 Gln Lys Asn Asn Arg Leu Leu Glu Ile Thr Arg Glu Phe Ser Val Asn 225 230 235 240 Ala Gly Val Thr Thr Pro Val Ser Thr Tyr Met Leu Thr Asn Ser Glu 245 250 255 Leu Leu Ser Leu Ile Asn Asp Met Pro Ile Thr Asn Asp Gln Lys Lys 260 265 270 Leu Met Ser Asn Asn Val Gln Ile Val Arg Gln Gln Ser Tyr Ser Ile 275 280 285 Met Ser Ile Ile Lys Glu Glu Val Leu Ala Tyr Val Val Gln Leu Pro 290 295 300 Leu Tyr Gly Val Ile Asp Thr Pro Cys Trp Lys Leu His Thr Ser Pro 305 310 315 320 Leu Cys Thr Thr Asn Thr Lys Glu Gly Ser Asn Ile Cys Leu Thr Arg 325 330 335 Thr Asp Arg Gly Trp Tyr Cys Asp Asn Ala Gly Ser Val Ser Phe Phe 340 345 350 Pro Gln Ala Glu Thr Cys Lys Val Gln Ser Asn Arg Val Phe Cys Asp 355 360 365 Thr Met Asn Ser Leu Thr Leu Pro Ser Glu Val Asn Leu Cys Asn Ile 370 375 380 Asp Ile Phe Asn Pro Lys Tyr Asp Cys Lys Ile Met Thr Ser Lys Thr 385 390 395 400 Asp Val Ser Ser Ser Val Ile Thr Ser Leu Gly Ala Ile Val Ser Cys 405 410 415 Tyr Gly Lys Thr Lys Cys Thr Ala Ser Asn Lys Asn Arg Gly Ile Ile 420 425 430 Lys Thr Phe Ser Asn Gly Cys Asp Tyr Val Ser Asn Lys Gly Val Asp 435 440 445 Thr Val Ser Val Gly Asn Thr Leu Tyr Tyr Val Asn Lys Gln Glu Gly 450 455 460 Lys Ser Leu Tyr Val Lys Gly Glu Pro Ile Ile Asn Phe Tyr Asp Pro 465 470 475 480 Leu Val Phe Pro Ser Asp Glu Phe Asp Ala Ser Ile Ser Gln Val Asn 485 490 495 Glu Lys Ile Asn Gln Ser Leu Ala Phe Ile Arg Lys Ser Asp Glu Leu 500 505 510 Leu His Asn Val Asn Val Gly Lys Ser Thr Thr Asn Ile Met Ile Thr 515 520 525 Thr Ile Ile Ile Val Ile Ile Val Ile Leu Leu Leu Leu Ile Ala Val 530 535 540 Gly Leu Phe Leu Tyr Cys Lys Ala Arg Ser Thr Pro Val Thr Leu Ser 545 550 555 560 Lys Asp Gln Leu Ser Gly Ile Asn Asn Ile Ala Phe Ser Asn 565 570 <210> 759 <211> 194 <212> PRT <213> Respiratory syncytial virus <400> 759 Met Ser Arg Arg Asn Pro Cys Lys Phe Glu Ile Arg Gly His Cys Leu 1 5 10 15 Asn Gly Lys Arg Cys His Phe Ser His Asn Tyr Phe Glu Trp Pro Pro 20 25 30 His Ala Leu Leu Val Arg Gln Asn Phe Met Leu Asn Arg Ile Leu Lys 35 40 45 Ser Met Asp Lys Ser Ile Asp Thr Leu Ser Glu Ile Ser Gly Ala Ala 50 55 60 Glu Leu Asp Arg Thr Glu Glu Tyr Ala Leu Gly Val Val Gly Val Leu 65 70 75 80 Glu Ser Tyr Ile Gly Ser Ile Asn Asn Ile Thr Lys Gln Ser Ala Cys 85 90 95 Val Ala Met Ser Lys Leu Leu Thr Glu Leu Asn Ser Asp Asp Ile Lys 100 105 110 Lys Leu Arg Asp Asn Glu Glu Pro Asn Ser Pro Lys Ile Arg Val Tyr 115 120 125 Asn Thr Val Ile Ser Tyr Ile Glu Ser Asn Arg Lys Asn Asn Lys Gln 130 135 140 Thr Ile His Leu Leu Lys Arg Leu Pro Ala Asp Val Leu Lys Lys Thr 145 150 155 160 Ile Lys Asn Thr Leu Asp Ile His Lys Ser Ile Thr Ile Asn Asn Pro 165 170 175 Lys Glu Ser Thr Val Asn Asp Thr Asn Asp His Ala Lys Asn Asn Asp 180 185 190 Thr Thr <210> 760 <211> 88 <212> PRT <213> Respiratory syncytial virus <400> 760 Met Pro Lys Ile Met Ile Leu Pro Asp Lys Tyr Pro Cys Ser Ile Asn 1 5 10 15 Ser Ile Leu Ile Thr Ser Ser Cys Arg Val Thr Met Tyr Asn Gln Lys 20 25 30 Asn Thr Leu Tyr Phe Asn Gln Asn Asn Gln Asn Asn His Thr Tyr Ser 35 40 45 Pro Asn Gln Pro Phe Asn Glu Ile His Trp Thr Ser Gln Asp Leu Ile 50 55 60 Asp Ala Ile Gln Asn Phe Leu Gln His Leu Gly Ile Thr Asp Asp Ile 65 70 75 80 Tyr Thr Ile Tyr Ile Leu Val Ser 85 <210> 761 <211> 2165 <212> PRT <213> Respiratory syncytial virus <400> 761 Met Asp Pro Ile Ile Asn Gly Asn Ser Ala Asn Val Tyr Leu Thr Asp 1 5 10 15 Ser Tyr Leu Lys Gly Val Ile Ser Phe Ser Glu Cys Asn Ala Leu Gly 20 25 30 Ser Tyr Ile Phe Asn Gly Pro Tyr Leu Lys Asn Asp Tyr Thr Asn Leu 35 40 45 Ile Ser Arg Gln Asn Pro Leu Ile Glu His Ile Asn Leu Lys Lys Leu 50 55 60 Asn Ile Thr Gln Ser Leu Ile Ser Lys Tyr His Lys Gly Glu Ile Lys 65 70 75 80 Ile Glu Glu Pro Thr Tyr Phe Gln Ser Leu Leu Met Thr Tyr Lys Ser 85 90 95 Met Thr Ser Ser Glu Gln Ile Thr Thr Thr Asn Leu Leu Lys Lys Ile 100 105 110 Ile Arg Arg Ala Ile Glu Ile Ser Asp Val Lys Val Tyr Ala Ile Leu 115 120 125 Asn Lys Leu Gly Leu Lys Glu Lys Asp Lys Ile Lys Ser Asn Asn Gly 130 135 140 Gln Asp Glu Asn Asn Ser Val Ile Thr Thr Ile Ile Lys Asp Asp Ile 145 150 155 160 Leu Leu Ala Val Lys Asp Asn Gln Ser His Leu Lys Ala Gly Lys Asn 165 170 175 His Ser Thr Lys Gln Lys Asp Thr Ile Lys Thr Thr Leu Leu Lys Lys 180 185 190 Leu Met Cys Ser Met Gln His Pro Pro Ser Trp Leu Ile His Trp Phe 195 200 205 Asn Leu Tyr Thr Lys Leu Asn Asn Ile Leu Thr Gln Tyr Arg Ser Asn 210 215 220 Glu Val Lys Asn His Gly Phe Ile Leu Ile Asp Asn Gln Thr Leu Asn 225 230 235 240 Gly Phe Gln Phe Ile Leu Asn Gln Tyr Gly Cys Ile Val Tyr His Lys 245 250 255 Glu Leu Lys Arg Ile Thr Val Thr Thr Tyr Asn Gln Phe Leu Thr Trp 260 265 270 Lys Asp Ile Ser Leu Ser Arg Leu Asn Val Cys Leu Ile Thr Trp Ile 275 280 285 Ser Asn Cys Leu Asn Thr Leu Asn Lys Ser Leu Gly Leu Arg Cys Gly 290 295 300 Phe Asn Asn Val Ile Leu Thr Gln Leu Phe Leu Tyr Gly Asp Cys Ile 305 310 315 320 Leu Lys Leu Phe His Asn Glu Gly Phe Tyr Ile Ile Lys Glu Val Glu 325 330 335 Gly Phe Ile Met Ser Leu Ile Leu Asn Ile Thr Glu Glu Asp Gln Phe 340 345 350 Arg Lys Arg Phe Tyr Asn Ser Met Leu Asn Asn Ile Thr Asp Ala Ala 355 360 365 Asn Lys Ala Gln Lys Asn Leu Leu Ser Arg Val Cys His Thr Leu Leu 370 375 380 Asp Lys Thr Val Ser Asp Asn Ile Ile Asn Gly Arg Trp Ile Ile Leu 385 390 395 400 Leu Ser Lys Phe Leu Lys Leu Ile Lys Leu Ala Gly Asp Asn Asn Leu 405 410 415 Asn Asn Leu Ser Glu Leu Tyr Phe Leu Phe Arg Ile Phe Gly His Pro 420 425 430 Met Val Asp Glu Arg Gln Ala Met Asp Ala Val Lys Val Asn Cys Asn 435 440 445 Glu Thr Lys Phe Tyr Leu Leu Ser Ser Leu Ser Met Leu Arg Gly Ala 450 455 460 Phe Ile Tyr Arg Ile Ile Lys Gly Phe Val Asn Asn Tyr Asn Arg Trp 465 470 475 480 Pro Thr Leu Arg Asn Ala Ile Val Leu Pro Leu Arg Trp Leu Thr Tyr 485 490 495 Tyr Lys Leu Asn Thr Tyr Pro Ser Leu Leu Glu Leu Thr Glu Arg Asp 500 505 510 Leu Ile Val Leu Ser Gly Leu Arg Phe Tyr Arg Glu Phe Arg Leu Pro 515 520 525 Lys Lys Val Asp Leu Glu Met Ile Ile Asn Asp Lys Ala Ile Ser Pro 530 535 540 Pro Lys Asn Leu Ile Trp Thr Ser Phe Pro Arg Asn Tyr Met Pro Ser 545 550 555 560 His Ile Gln Asn Tyr Ile Glu His Glu Lys Leu Lys Phe Ser Glu Ser 565 570 575 Asp Lys Ser Arg Arg Val Leu Glu Tyr Tyr Leu Arg Asp Asn Lys Phe 580 585 590 Asn Glu Cys Asp Leu Tyr Asn Cys Val Val Asn Gln Ser Tyr Leu Asn 595 600 605 Asn Pro Asn His Val Val Ser Leu Thr Gly Lys Glu Arg Glu Leu Ser 610 615 620 Val Gly Arg Met Phe Ala Met Gln Pro Gly Met Phe Arg Gln Val Gln 625 630 635 640 Ile Leu Ala Glu Lys Met Ile Ala Glu Asn Ile Leu Gln Phe Phe Pro 645 650 655 Glu Ser Leu Thr Arg Tyr Gly Asp Leu Glu Leu Gln Lys Ile Leu Glu 660 665 670 Leu Lys Ala Gly Ile Ser Asn Lys Ser Asn Arg Tyr Asn Asp Asn Tyr 675 680 685 Asn Asn Tyr Ile Ser Lys Cys Ser Ile Ile Thr Asp Leu Ser Lys Phe 690 695 700 Asn Gln Ala Phe Arg Tyr Glu Thr Ser Cys Ile Cys Ser Asp Val Leu 705 710 715 720 Asp Glu Leu His Gly Val Gln Ser Leu Phe Ser Trp Leu His Leu Thr 725 730 735 Ile Pro His Val Thr Ile Ile Cys Thr Tyr Arg His Ala Pro Pro Tyr 740 745 750 Ile Arg Asp His Ile Val Asp Leu Asn Asn Val Asp Glu Gln Ser Gly 755 760 765 Leu Tyr Arg Tyr His Met Gly Gly Ile Glu Gly Trp Cys Gln Lys Leu 770 775 780 Trp Thr Ile Glu Ala Ile Ser Leu Leu Asp Leu Ile Ser Leu Lys Gly 785 790 795 800 Lys Phe Ser Ile Thr Ala Leu Ile Asn Gly Asp Asn Gln Ser Ile Asp 805 810 815 Ile Ser Lys Pro Val Arg Leu Met Glu Gly Gln Thr His Ala Gln Ala 820 825 830 Asp Tyr Leu Leu Ala Leu Asn Ser Leu Lys Leu Leu Tyr Lys Glu Tyr 835 840 845 Ala Gly Ile Gly His Lys Leu Lys Gly Thr Glu Thr Tyr Ile Ser Arg 850 855 860 Asp Met Gln Phe Met Ser Lys Thr Ile Gln His Asn Gly Val Tyr Tyr 865 870 875 880 Pro Ala Ser Ile Lys Lys Val Leu Arg Val Gly Pro Trp Ile Asn Thr 885 890 895 Ile Leu Asp Asp Phe Lys Val Ser Leu Glu Ser Ile Gly Ser Leu Thr 900 905 910 Gln Glu Leu Glu Tyr Arg Gly Glu Ser Leu Leu Cys Ser Leu Ile Phe 915 920 925 Arg Asn Val Trp Leu Tyr Asn Gln Ile Ala Leu Gln Leu Lys Asn His 930 935 940 Ala Leu Cys Asn Asn Lys Leu Tyr Leu Asp Ile Leu Lys Val Leu Lys 945 950 955 960 His Leu Lys Thr Phe Phe Asn Leu Asp Asn Ile Asp Thr Ala Leu Thr 965 970 975 Leu Tyr Met Asn Leu Pro Met Leu Phe Gly Gly Gly Asp Pro Asn Leu 980 985 990 Leu Tyr Arg Ser Phe Tyr Arg Arg Thr Pro Asp Phe Leu Thr Glu Ala 995 1000 1005 Ile Val His Ser Val Phe Ile Leu Ser Tyr Tyr Thr Asn His Asp 1010 1015 1020 Leu Lys Asp Lys Leu Gln Asp Leu Ser Asp Asp Arg Leu Asn Lys 1025 1030 1035 Phe Leu Thr Cys Ile Ile Thr Phe Asp Lys Asn Pro Asn Ala Glu 1040 1045 1050 Phe Val Thr Leu Met Arg Asp Pro Gln Ala Leu Gly Ser Glu Arg 1055 1060 1065 Gln Ala Lys Ile Thr Ser Glu Ile Asn Arg Leu Ala Val Thr Glu 1070 1075 1080 Val Leu Ser Thr Ala Pro Asn Lys Ile Phe Ser Lys Ser Ala Gln 1085 1090 1095 His Tyr Thr Thr Thr Glu Ile Asp Leu Asn Asp Ile Met Gln Asn 1100 1105 1110 Ile Glu Pro Thr Tyr Pro His Gly Leu Arg Val Val Tyr Glu Ser 1115 1120 1125 Leu Pro Phe Tyr Lys Ala Glu Lys Ile Val Asn Leu Ile Ser Gly 1130 1135 1140 Thr Lys Ser Ile Thr Asn Ile Leu Glu Lys Thr Ser Ala Ile Asp 1145 1150 1155 Leu Thr Asp Ile Asp Arg Ala Thr Glu Met Met Arg Lys Asn Ile 1160 1165 1170 Thr Leu Leu Ile Arg Ile Phe Pro Leu Asp Cys Asn Arg Asp Lys 1175 1180 1185 Arg Glu Ile Leu Ser Met Glu Asn Leu Ser Ile Thr Glu Leu Ser 1190 1195 1200 Lys Tyr Val Arg Glu Arg Ser Trp Ser Leu Ser Asn Ile Val Gly 1205 1210 1215 Val Thr Ser Pro Ser Ile Met Tyr Thr Met Asp Ile Lys Tyr Thr 1220 1225 1230 Thr Ser Thr Ile Ala Ser Gly Ile Ile Ile Glu Lys Tyr Asn Val 1235 1240 1245 Asn Ser Leu Thr Arg Gly Glu Arg Gly Pro Thr Lys Pro Trp Val 1250 1255 1260 Gly Ser Ser Thr Gln Glu Lys Lys Thr Met Pro Val Tyr Asn Arg 1265 1270 1275 Gln Val Leu Thr Lys Lys Gln Arg Asp Gln Ile Asp Leu Leu Ala 1280 1285 1290 Lys Leu Asp Trp Val Tyr Ala Ser Ile Asp Asn Lys Asp Glu Phe 1295 1300 1305 Met Glu Glu Leu Ser Ile Gly Thr Leu Gly Leu Thr Tyr Glu Lys 1310 1315 1320 Ala Lys Lys Leu Phe Pro Gln Tyr Leu Ser Val Asn Tyr Leu His 1325 1330 1335 Arg Leu Thr Val Ser Ser Arg Pro Cys Glu Phe Pro Ala Ser Ile 1340 1345 1350 Pro Ala Tyr Arg Thr Thr Asn Tyr His Phe Asp Thr Ser Pro Ile 1355 1360 1365 Asn Arg Ile Leu Thr Glu Lys Tyr Gly Asp Glu Asp Ile Asp Ile 1370 1375 1380 Val Phe Gln Asn Cys Ile Ser Phe Gly Leu Ser Leu Met Ser Val 1385 1390 1395 Val Glu Gln Phe Thr Asn Val Cys Pro Asn Arg Ile Ile Leu Ile 1400 1405 1410 Pro Lys Leu Asn Glu Ile His Leu Met Lys Pro Pro Ile Phe Thr 1415 1420 1425 Gly Asp Val Asp Ile His Lys Leu Lys Gln Val Ile Gln Lys Gln 1430 1435 1440 His Met Phe Leu Pro Asp Lys Ile Ser Leu Thr Gln Tyr Val Glu 1445 1450 1455 Leu Phe Leu Ser Asn Lys Thr Leu Lys Ser Gly Ser His Val Asn 1460 1465 1470 Ser Asn Leu Ile Leu Ala His Lys Ile Ser Asp Tyr Phe His Asn 1475 1480 1485 Thr Tyr Ile Leu Ser Thr Asn Leu Ala Gly His Trp Ile Leu Ile 1490 1495 1500 Ile Gln Leu Met Lys Asp Ser Lys Gly Ile Phe Glu Lys Asp Trp 1505 1510 1515 Gly Glu Gly Tyr Ile Thr Asp His Met Phe Ile Asn Leu Lys Val 1520 1525 1530 Phe Phe Asn Ala Tyr Lys Thr Tyr Leu Leu Cys Phe His Lys Gly 1535 1540 1545 Tyr Gly Arg Ala Lys Leu Glu Cys Asp Met Asn Thr Ser Asp Leu 1550 1555 1560 Leu Cys Val Leu Glu Leu Ile Asp Ser Ser Tyr Trp Lys Ser Met 1565 1570 1575 Ser Lys Val Phe Leu Glu Gln Lys Val Ile Lys Tyr Ile Leu Ser 1580 1585 1590 Gln Asp Ala Ser Leu His Arg Val Lys Gly Cys His Ser Phe Lys 1595 1600 1605 Leu Trp Phe Leu Lys Arg Leu Asn Val Ala Glu Phe Thr Val Cys 1610 1615 1620 Pro Trp Val Val Asn Ile Asp Tyr His Pro Thr His Met Lys Ala 1625 1630 1635 Ile Leu Thr Tyr Ile Asp Leu Val Arg Met Gly Leu Ile Asn Ile 1640 1645 1650 Asp Arg Ile Tyr Ile Lys Asn Lys His Lys Phe Asn Asp Glu Phe 1655 1660 1665 Tyr Thr Ser Asn Leu Phe Tyr Ile Asn Tyr Asn Phe Ser Asp Asn 1670 1675 1680 Thr His Leu Leu Thr Lys His Ile Arg Ile Ala Asn Ser Glu Leu 1685 1690 1695 Glu Asn Asn Tyr Asn Lys Leu Tyr His Pro Thr Pro Glu Thr Leu 1700 1705 1710 Glu Asn Ile Leu Thr Asn Pro Val Lys Cys Asp Asp Lys Lys Thr 1715 1720 1725 Leu Asn Asp Tyr Cys Ile Gly Lys Asn Val Asp Ser Ile Met Leu 1730 1735 1740 Pro Leu Leu Ser Asn Lys Lys Leu Ile Lys Ser Ser Thr Met Ile 1745 1750 1755 Arg Thr Asn Tyr Ser Lys Gln Asp Leu Tyr Asn Leu Phe Pro Thr 1760 1765 1770 Val Val Ile Asp Lys Ile Ile Asp His Ser Gly Asn Thr Ala Lys 1775 1780 1785 Ser Asn Gln Leu Tyr Thr Thr Thr Ser His Gln Ile Ser Leu Val 1790 1795 1800 His Asn Ser Thr Ser Leu Tyr Cys Met Leu Pro Trp His His Ile 1805 1810 1815 Asn Arg Phe Asn Phe Val Phe Ser Ser Thr Gly Cys Lys Ile Ser 1820 1825 1830 Ile Glu Tyr Ile Leu Lys Asp Leu Lys Ile Lys Asp Pro Asn Cys 1835 1840 1845 Ile Ala Phe Ile Gly Glu Gly Ala Gly Asn Leu Leu Leu Arg Thr 1850 1855 1860 Val Val Glu Leu His Pro Asp Ile Lys Tyr Ile Tyr Arg Ser Leu 1865 1870 1875 Lys Asp Cys Asn Asp His Ser Leu Pro Ile Glu Phe Leu Arg Leu 1880 1885 1890 Tyr Asn Gly His Ile Asn Ile Asp Tyr Gly Glu Asn Leu Thr Ile 1895 1900 1905 Pro Ala Thr Asp Ala Thr Asn Asn Ile His Trp Ser Tyr Leu His 1910 1915 1920 Ile Lys Phe Ala Glu Pro Ile Ser Leu Phe Val Cys Asp Ala Glu 1925 1930 1935 Leu Pro Val Thr Val Asn Trp Ser Lys Ile Ile Ile Glu Trp Ser 1940 1945 1950 Lys His Val Arg Lys Cys Lys Tyr Cys Ser Ser Val Asn Lys Cys 1955 1960 1965 Thr Leu Ile Val Lys Tyr His Ala Gln Asp Asp Ile Asp Phe Lys 1970 1975 1980 Leu Asp Asn Ile Thr Ile Leu Lys Thr Tyr Val Cys Leu Gly Ser 1985 1990 1995 Lys Leu Lys Gly Ser Glu Val Tyr Leu Val Leu Thr Ile Gly Pro 2000 2005 2010 Ala Asn Val Phe Pro Val Phe Asn Val Val Gln Asn Ala Lys Leu 2015 2020 2025 Ile Leu Ser Arg Thr Lys Asn Phe Ile Met Pro Lys Lys Ala Asp 2030 2035 2040 Lys Glu Ser Ile Asp Ala Asn Ile Lys Ser Leu Ile Pro Phe Leu 2045 2050 2055 Cys Tyr Pro Ile Thr Lys Lys Gly Ile Asn Thr Ala Leu Ser Lys 2060 2065 2070 Leu Lys Ser Val Val Ser Gly Asp Ile Leu Ser Tyr Ser Ile Ala 2075 2080 2085 Gly Arg Asn Glu Val Phe Ser Asn Lys Leu Ile Asn His Lys His 2090 2095 2100 Met Asn Ile Leu Lys Trp Phe Asn His Val Leu Asn Phe Arg Ser 2105 2110 2115 Thr Glu Leu Asn Tyr Asn His Leu Tyr Met Val Glu Ser Thr Tyr 2120 2125 2130 Pro Tyr Leu Ser Glu Leu Leu Asn Ser Leu Thr Thr Asn Glu Leu 2135 2140 2145 Lys Lys Leu Ile Lys Ile Thr Gly Ser Leu Leu Tyr Asn Phe His 2150 2155 2160 Asn Glu 2165 <210> 762 <400> 762 000 <210> 763 <400> 763 000 <210> 764 <400> 764 000 <210> 765 <400> 765 000 <210> 766 <400> 766 000 <210> 767 <400> 767 000 <210> 768 <400> 768 000 <210> 769 <400> 769 000 <210> 770 <400> 770 000 <210> 771 <400> 771 000 <210> 772 <400> 772 000 <210> 773 <400> 773 000 <210> 774 <400> 774 000 <210> 775 <400> 775 000 <210> 776 <400> 776 000 <210> 777 <400> 777 000 <210> 778 <400> 778 000 <210> 779 <400> 779 000 <210> 780 <400> 780 000 <210> 781 <400> 781 000 <210> 782 <400> 782 000 <210> 783 <400> 783 000 <210> 784 <400> 784 000 <210> 785 <400> 785 000 <210> 786 <400> 786 000 <210> 787 <400> 787 000 <210> 788 <400> 788 000 <210> 789 <400> 789 000 <210> 790 <400> 790 000 <210> 791 <400> 791 000 <210> 792 <400> 792 000 <210> 793 <400> 793 000 <210> 794 <400> 794 000 <210> 795 <400> 795 000 <210> 796 <400> 796 000 <210> 797 <400> 797 000 <210> 798 <400> 798 000 <210> 799 <400> 799 000 <210> 800 <400> 800 000 <210> 801 <211> 2220 <212> DNA <213> Zaire ebolavirus <400> 801 atggattctc gtcctcagaa aatctggatg gcgccgagtc tcactgaatc tgacatggat 60 taccacaaga tcttgacagc aggtctgtcc gttcaacagg ggattgttcg gcaaagagtc 120 atcccagtgt atcaagtaaa caatcttgaa gaaatttgcc aacttatcat acaggccttt 180 gaagcaggtg ttgattttca agagagtgcg gacagtttcc ttctcatgct ttgtcttcat 240 catgcgtacc agggagatta caaacttttc ttggaaagtg gcgcagtcaa gtatttggaa 300 gggcacgggt tccgttttga agtcaagaag cgtgatggag tgaagcgcct tgaggaattg 360 ctgccagcag tatctagtgg aaaaaacatt aagagaacac ttgctgccat gccggaagag 420 gagacaactg aagctaatgc cggtcagttt ctctcctttg caagtctatt ccttccgaaa 480 ttggtagtag gagaaaaggc ttgccttgag aaggttcaaa ggcaaattca agtacatgca 540 gagcaaggac tgatacaata tccaacagct tggcaatcag taggacacat gatggtgatt 600 ttccgtttga tgcgaacaaa ttttctgatc aaatttctcc taatacacca agggatgcac 660 atggttgccg ggcatgatgc caacgatgct gtgatttcaa attcagtggc tcaagctcgt 720 ttttcaggct tattgattgt caaaacagta cttgatcata tcctacaaaa gacagaacga 780 ggagttcgtc tccatcctct tgcaaggacc gccaaggtaa aaaatgaggt gaactccttt 840 aaggctgcac tcagctccct ggccaagcat ggagagtatg ctcctttcgc ccgacttttg 900 aacctttctg gagtaaataa tcttgagcat ggtcttttcc ctcaactatc ggcaattgca 960 ctcggagtcg ccacagcaca cgggagtacc ctcgcaggag taaatgttgg agaacagtat 1020 caacaactca gagaggctgc cactgaggct gagaagcaac tccaacaata tgcagagtct 1080 cgcgaacttg accatcttgg acttgatgat caggaaaaga aaattcttat gaacttccat 1140 cagaaaaaga acgaaatcag cttccagcaa acaaacgcta tggtaactct aagaaaagag 1200 cgcctggcca agctgacaga agctatcact gctgcgtcac tgcccaaaac aagtggacat 1260 tacgatgatg atgacgacat tccctttcca ggacccatca atgatgacga caatcctggc 1320 catcaagatg atgatccgac tgactcacag gatacgacca ttcccgatgt ggtggttgat 1380 cccgatgatg gaagctacgg cgaataccag agttactcgg aaaacggcat gaatgcacca 1440 gatgacttgg tcctattcga tctagacgag gacgacgagg acactaagcc agtgcctaat 1500 agatcgacca agggtggaca acagaagaac agtcaaaagg gccagcatat agagggcaga 1560 cagacacaat ccaggccaat tcaaaatgtc ccaggccctc acagaacaat ccaccacgcc 1620 agtgcgccac tcacggacaa tgacagaaga aatgaaccct ccggctcaac cagccctcgc 1680 atgctgacac caattaacga agaggcagac ccactggacg atgccgacga cgagacgtct 1740 agccttccgc ccttggagtc agatgatgaa gagcaggaca gggacggaac ttccaaccgc 1800 acacccactg tcgccccacc ggctcccgta tacagagatc actctgaaaa gaaagaactc 1860 ccgcaagacg agcaacaaga tcaggaccac actcaagagg ccaggaacca ggacagtgac 1920 aacacccagt cagaacactc ttttgaggag atgtatcgcc acattctaag atcacagggg 1980 ccatttgatg ctgttttgta ttatcatatg atgaaggatg agcctgtagt tttcagtacc 2040 agtgatggca aagagtacac gtatccagac tcccttgaag aggaatatcc accatggctc 2100 actgaaaaag aggctatgaa tgaagagaat agatttgtta cattggatgg tcaacaattt 2160 tattggccgg tgatgaatca caagaataaa ttcatggcaa tcctgcaaca tcatcagtga 2220 <210> 802 <211> 1023 <212> DNA <213> Zaire ebolavirus <400> 802 atgacaacta gaacaaaggg caggggccat actgcggcca cgactcaaaa cgacagaatg 60 ccaggccctg agctttcggg ctggatctct gagcagctaa tgaccggaag aattcctgta 120 agcgacatct tctgtgatat tgagaacaat ccaggattat gctacgcatc ccaaatgcaa 180 caaacgaagc caaacccgaa gacgcgcaac agtcaaaccc aaacggaccc aatttgcaat 240 catagttttg aggaggtagt acaaacattg gcttcattgg ctactgttgt gcaacaacaa 300 accatcgcat cagaatcatt agaacaacgc attacgagtc ttgagaatgg tctaaagcca 360 gtttatgata tggcaaaaac aatctcctca ttgaacaggg tttgtgctga gatggttgca 420 aaatatgatc ttctggtgat gacaaccggt cgggcaacag caaccgctgc ggcaactgag 480 gcttattggg ccgaacatgg tcaaccacca cctggaccat cactttatga agaaagtgcg 540 attcggggta agattgaatc tagagatgag accgtccctc aaagtgttag ggaggcattc 600 aacaatctaa acagtaccac ttcactaact gaggaaaatt ttgggaaacc tgacatttcg 660 gcaaaggatt tgagaaacat tatgtatgat cacttgcctg gttttggaac tgctttccac 720 caattagtac aagtgatttg taaattggga aaagatagca actcattgga catcattcat 780 gctgagttcc aggccagcct ggctgaagga gactctcctc aatgtgccct aattcaaatt 840 acaaaaagag ttccaatctt ccaagatgct gctccacctg tcatccacat ccgctctcga 900 ggtgacattc cccgagcttg ccagaaaagc ttgcgtccag tcccaccatc gcccaagatt 960 gatcgaggtt gggtatgtgt ttttcagctt caagatggta aaacacttgg actcaaaatt 1020 tga 1023 <210> 803 <211> 981 <212> DNA <213> Zaire ebolavirus <400> 803 atgaggcggg ttatattgcc tactgctcct cctgaatata tggaggccat ataccctgtc 60 aggtcaaatt caacaattgc tagaggtggc aacagcaata caggcttcct gacaccggag 120 tcagtcaatg gggacactcc atcgaatcca ctcaggccaa ttgccgatga caccatcgac 180 catgccagcc acacaccagg cagtgtgtca tcagcattca tccttgaagc tatggtgaat 240 gtcatatcgg gccccaaagt gctaatgaag caaattccaa tttggcttcc tctaggtgtc 300 gctgatcaaa agacctacag ctttgactca actacggccg ccatcatgct tgcttcatac 360 actatcaccc atttcggcaa ggcaaccaat ccacttgtca gagtcaatcg gctgggtcct 420 ggaatcccgg atcatcccct caggctcctg cgaattggaa accaggcttt cctccaggag 480 ttcgttcttc cgccagtcca actaccccag tatttcacct ttgatttgac agcactcaaa 540 ctgatcaccc aaccactgcc tgctgcaaca tggaccgatg acactccaac aggatcaaat 600 ggagcgttgc gtccaggaat ttcatttcat ccaaaacttc gccccattct tttacccaac 660 aaaagtggga agaaggggaa cagtgccgat ctaacatctc cggagaaaat ccaagcaata 720 atgacttcac tccaggactt taagatcgtt ccaattgatc caaccaaaaa tatcatggga 780 atcgaagtgc cagaaactct ggtccacaag ctgaccggta agaaggtgac ttctaaaaat 840 ggacaaccaa tcatccctgt tcttttgcca aagtacattg ggttggaccc ggtggctcca 900 ggagacctca ccatggtaat cacacaggat tgtgacacgt gtcattctcc tgcaagtctt 960 ccagctgtga ttgagaagta a 981 <210> 804 <211> 2031 <212> DNA <213> Zaire ebolavirus <400> 804 atgggcgtta caggaatatt gcagttacct cgtgatcgat tcaagaggac atcattcttt 60 ctttgggtaa ttatcctttt ccaaagaaca ttttccatcc cacttggagt catccacaat 120 agcacattac aggttagtga tgtcgacaaa ctagtttgtc gtgacaaact gtcatccaca 180 aatcaattga gatcagttgg actgaatctc gaagggaatg gagtggcaac tgacgtgcca 240 tctgcaacta aaagatgggg cttcaggtcc ggtgtcccac caaaggtggt caattatgaa 300 gctggtgaat gggctgaaaa ctgctacaat cttgaaatca aaaaacctga cgggagtgag 360 tgtctaccag cagcgccaga cgggattcgg ggcttccccc ggtgccggta tgtgcacaaa 420 gtatcaggaa cgggaccgtg tgccggagac tttgccttcc ataaagaggg tgctttcttc 480 ctgtatgatc gacttgcttc cacagttatc taccgaggaa cgactttcgc tgaaggtgtc 540 gttgcatttc tgatactgcc ccaagctaag aaggacttct tcagctcaca ccccttgaga 600 gagccggtca atgcaacgga ggacccgtct agtggctact attctaccac aattagatat 660 caggctaccg gttttggaac caatgagaca gagtacttgt tcgaggttga caatttgacc 720 tacgtccaac ttgaatcaag attcacacca cagtttctgc tccagctgaa tgagacaata 780 tatacaagtg ggaaaaggag caataccacg ggaaaactaa tttggaaggt caaccccgaa 840 attgatacaa caatcgggga gtgggccttc tgggaaacta aaaaaaacct cactagaaaa 900 attcgcagtg aagagttgtc tttcacagtt gtatcaaacg gagccaaaaa catcagtggt 960 cagagtccgg cgcgaacttc ttccgaccca gggaccaaca caacaactga agaccacaaa 1020 atcatggctt cagaaaattc ctctgcaatg gttcaagtgc acagtcaagg aagggaagct 1080 gcagtgtcgc atctaacaac ccttgccaca atctccacga gtccccaatc cctcacaacc 1140 aaaccaggtc cggacaacag cacccataat acacccgtgt ataaacttga catctctgag 1200 gcaactcaag ttgaacaaca tcaccgcaga acagacaacg acagcacagc ctccgacact 1260 ccctctgcca cgaccgcagc cggaccccca aaagcagaga acaccaacac gagcaagagc 1320 actgacttcc tggaccccgc caccacaaca agtccccaaa accacagcga gaccgctggc 1380 aacaacaaca ctcatcacca agataccgga gaagagagtg ccagcagcgg gaagctaggc 1440 ttaattacca atactattgc tggagtcgca ggactgatca caggcgggag aagaactcga 1500 agagaagcaa ttgtcaatgc tcaacccaaa tgcaacccta atttacatta ctggactact 1560 caggatgaag gtgctgcaat cggactggcc tggataccat atttcgggcc agcagccgag 1620 ggaatttaca tagaggggct aatgcacaat caagatggtt taatctgtgg gttgagacag 1680 ctggccaacg agacgactca agctcttcaa ctgttcctga gagccacaac tgagctacgc 1740 accttttcaa tcctcaaccg taaggcaatt gatttcttgc tgcagcgatg gggcggcaca 1800 tgccacattc tgggaccgga ctgctgtatc gaaccacatg attggaccaa gaacataaca 1860 gacaaaattg atcagattat tcatgatttt gttgataaaa cccttccgga ccagggggac 1920 aatgacaatt ggtggacagg atggagacaa tggataccgg caggtattgg agttacaggc 1980 gttataattg cagttatcgc tttattctgt atatgcaaat ttgtctttta g 2031 <210> 805 <211> 1095 <212> DNA <213> Zaire ebolavirus <400> 805 atgggcgtta caggaatatt gcagttacct cgtgatcgat tcaagaggac atcattcttt 60 ctttgggtaa ttatcctttt ccaaagaaca ttttccatcc cacttggagt catccacaat 120 agcacattac aggttagtga tgtcgacaaa ctagtttgtc gtgacaaact gtcatccaca 180 aatcaattga gatcagttgg actgaatctc gaagggaatg gagtggcaac tgacgtgcca 240 tctgcaacta aaagatgggg cttcaggtcc ggtgtcccac caaaggtggt caattatgaa 300 gctggtgaat gggctgaaaa ctgctacaat cttgaaatca aaaaacctga cgggagtgag 360 tgtctaccag cagcgccaga cgggattcgg ggcttccccc ggtgccggta tgtgcacaaa 420 gtatcaggaa cgggaccgtg tgccggagac tttgccttcc ataaagaggg tgctttcttc 480 ctgtatgatc gacttgcttc cacagttatc taccgaggaa cgactttcgc tgaaggtgtc 540 gttgcatttc tgatactgcc ccaagctaag aaggacttct tcagctcaca ccccttgaga 600 gagccggtca atgcaacgga ggacccgtct agtggctact attctaccac aattagatat 660 caggctaccg gttttggaac caatgagaca gagtacttgt tcgaggttga caatttgacc 720 tacgtccaac ttgaatcaag attcacacca cagtttctgc tccagctgaa tgagacaata 780 tatacaagtg ggaaaaggag caataccacg ggaaaactaa tttggaaggt caaccccgaa 840 attgatacaa caatcgggga gtgggccttc tgggaaacta aaaaaacctc actagaaaaa 900 ttcgcagtga agagttgtct ttcacagttg tatcaaacgg agccaaaaac atcagtggtc 960 agagtccggc gcgaacttct tccgacccag ggaccaacac aacaactgaa gaccacaaaa 1020 tcatggcttc agaaaattcc tctgcaatgg ttcaagtgca cagtcaagga agggaagctg 1080 cagtgtcgca tctaa 1095 <210> 806 <211> 894 <212> DNA <213> Zaire ebolavirus <400> 806 atgggcgtta caggaatatt gcagttacct cgtgatcgat tcaagaggac atcattcttt 60 ctttgggtaa ttatcctttt ccaaagaaca ttttccatcc cacttggagt catccacaat 120 agcacattac aggttagtga tgtcgacaaa ctagtttgtc gtgacaaact gtcatccaca 180 aatcaattga gatcagttgg actgaatctc gaagggaatg gagtggcaac tgacgtgcca 240 tctgcaacta aaagatgggg cttcaggtcc ggtgtcccac caaaggtggt caattatgaa 300 gctggtgaat gggctgaaaa ctgctacaat cttgaaatca aaaaacctga cgggagtgag 360 tgtctaccag cagcgccaga cgggattcgg ggcttccccc ggtgccggta tgtgcacaaa 420 gtatcaggaa cgggaccgtg tgccggagac tttgccttcc ataaagaggg tgctttcttc 480 ctgtatgatc gacttgcttc cacagttatc taccgaggaa cgactttcgc tgaaggtgtc 540 gttgcatttc tgatactgcc ccaagctaag aaggacttct tcagctcaca ccccttgaga 600 gagccggtca atgcaacgga ggacccgtct agtggctact attctaccac aattagatat 660 caggctaccg gttttggaac caatgagaca gagtacttgt tcgaggttga caatttgacc 720 tacgtccaac ttgaatcaag attcacacca cagtttctgc tccagctgaa tgagacaata 780 tatacaagtg ggaaaaggag caataccacg ggaaaactaa tttggaaggt caaccccgaa 840 attgatacaa caatcgggga gtgggccttc tgggaaacta aaaaacctca ctag 894 <210> 807 <211> 867 <212> DNA <213> Zaire ebolavirus <400> 807 atggaagctt catatgagag aggacgccca cgagctgcca gacagcattc aagggatgga 60 cacgaccacc atgttcgagc acgatcatca tccagagaga attatcgagg tgagtaccgt 120 caatcaagga gcgcctcaca agtgcgcgtt cctactgtat ttcataagaa gagagttgaa 180 ccattaacag ttcctccagc acctaaagac atatgtccga ccttgaaaaa aggatttttg 240 tgtgacagta gtttttgcaa aaaagatcac cagttggaga gtttaactga tagggaatta 300 ctcctactaa tcgcccgtaa gacttgtgga tcagtagaac aacaattaaa tataactgca 360 cccaaggact cgcgcttagc aaatccaacg gctgatgatt tccagcaaga ggaaggtcca 420 aaaattacct tgttgacact gatcaagacg gcagaacact gggcgagaca agacatcaga 480 accatagagg attcaaaatt aagagcattg ttgactctat gtgctgtgat gacgaggaaa 540 ttctcaaaat cccagctgag tcttttatgt gagacacacc taaggcgcga ggggcttggg 600 caagatcagg cagaacccgt tctcgaagta tatcaacgat tacacagtga taaaggaggc 660 agttttgaag ctgcactatg gcaacaatgg gaccgacaat ccctaattat gtttatcact 720 gcattcttga atattgctct ccagttaccg tgtgaaagtt ctgctgtcgt tgtttcaggg 780 ttaagaacat tggttcctca atcagataat gaggaagctt caaccaaccc ggggacatgc 840 tcatggtctg atgagggtac cccttaa 867 <210> 808 <211> 756 <212> DNA <213> Zaire ebolavirus <400> 808 atggctaaag ctacgggacg atacaatcta atatcgccca aaaaggacct ggagaaaggg 60 gttgtcttaa gcgacctctg taacttctta gttagccaaa ctattcaggg gtggaaggtt 120 tattgggctg gtattgagtt tgatgtgact cacaaaggaa tggccctatt gcatagactg 180 aaaactaatg actttgcccc tgcatggtca atgacaagga atctctttcc tcatttattt 240 caaaatccga attccacaat tgaatcaccg ctgtgggcat tgagagtcat ccttgcagca 300 gggatacagg accagctgat tgaccagtct ttgattgaac ccttagcagg agcccttggt 360 ctgatctctg attggctgct aacaaccaac actaaccatt tcaacatgcg aacacaacgt 420 gtcaaggaac aattgagcct aaaaatgctg tcgttgattc gatccaatat tctcaagttt 480 attaacaaat tggatgctct acatgtcgtg aactacaacg gattgttgag cagtattgaa 540 attggaactc aaaatcatac aatcatcata actcgaacta acatgggttt tctggtggag 600 ctccaagaac ccgacaaatc ggcaatgaac cgcatgaagc ctgggccggc gaaattttcc 660 ctccttcatg agtccacact gaaagcattt acacaaggat cctcgacacg aatgcaaagt 720 ttgattcttg aatttaatag ctctcttgct atctaa 756 <210> 809 <211> 6639 <212> DNA <213> Zaire ebolavirus <400> 809 atggctacac aacataccca atacccagac gctaggttat catcaccaat tgtattggac 60 caatgtgacc tagtcactag agcttgcggg ttatattcat catactccct taatccgcaa 120 ctacgcaact gtaaactccc gaaacatatc taccgtttga aatacgatgt aactgttacc 180 aagttcttga gtgatgtacc agtggcgaca ttgcccatag atttcatagt cccagttctt 240 ctcaaggcac tgtcaggcaa tggattctgt cctgttgagc cgcggtgcca acagttctta 300 gatgaaatca ttaagtacac aatgcaagat gctctcttct tgaaatatta tctcaaaaat 360 gtgggtgctc aagaagactg tgttgatgaa cactttcaag agaaaatctt atcttcaatt 420 cagggcaatg aatttttaca tcaaatgttt ttctggtatg atctggctat tttaactcga 480 aggggtagat taaatcgagg aaactctaga tcaacatggt ttgttcatga tgatttaata 540 gacatcttag gctatgggga ctatgttttt tggaagatcc caatttcaat gttaccactg 600 aacacacaag gaatccccca tgctgctatg gactggtatc aggcatcagt attcaaagaa 660 gcggttcaag ggcatacaca cattgtttct gtttctactg ccgacgtctt gataatgtgc 720 aaagatttaa ttacatgtcg attcaacaca actctaatct caaaaatagc agagattgag 780 gatccagttt gttctgatta tcccaatttt aagattgtgt ctatgcttta ccagagcgga 840 gattacttac tctccatatt agggtctgat gggtataaaa ttattaagtt cctcgaacca 900 ttgtgcttgg ccaaaattca attatgctca aagtacactg agaggaaggg ccgattctta 960 acacaaatgc atttagctgt aaatcacacc ctagaagaaa ttacagaaat gcgtgcacta 1020 aagccttcac aggctcaaaa gatccgtgaa ttccatagaa cattgataag gctggagatg 1080 acgccacaac aactttgtga gctattttcc attcaaaaac actgggggca tcctgtgcta 1140 catagtgaaa cagcaatcca aaaagttaaa aaacatgcta cggtgctaaa agcattacgc 1200 cctatagtga ttttcgagac atactgtgtt tttaaatata gtattgccaa acattatttt 1260 gatagtcaag gatcttggta cagtgttact tcagatagga atctaacacc gggtcttaat 1320 tcttatatca aaagaaatca attccctccg ttgccaatga ttaaagaact actatgggaa 1380 ttttaccacc ttgaccaccc tccacttttc tcaaccaaaa ttattagtga cttaagtatt 1440 tttataaaag acagagctac cgcagtagaa aggacatgct gggatgcagt attcgagcct 1500 aatgttctag gatataatcc acctcacaaa tttagtacta aacgtgtacc ggaacaattt 1560 ttagagcaag aaaacttttc tattgagaat gttctttcct acgcacaaaa actcgagtat 1620 ctactaccac aatatcggaa cttttctttc tcattgaaag agaaagagtt gaatgtaggt 1680 agaaccttcg gaaaattgcc ttatccgact cgcaatgttc aaacactttg tgaagctctg 1740 ttagctgatg gtcttgctaa agcatttcct agcaatatga tggtagttac ggaacgtgag 1800 caaaaagaaa gcttattgca tcaagcatca tggcaccaca caagtgatga ttttggtgaa 1860 catgccacag ttagagggag tagctttgta actgatttag agaaatacaa tcttgcattt 1920 agatatgagt ttacagcacc ttttatagaa tattgcaacc gttgctatgg tgttaagaat 1980 gtttttaatt ggatgcatta tacaatccca cagtgttata tgcatgtcag tgattattat 2040 aatccaccac ataacctcac actggagaat cgagacaacc cccccgaagg gcctagttca 2100 tacaggggtc atatgggagg gattgaagga ctgcaacaaa aactctggac aagtatttca 2160 tgtgctcaaa tttctttagt tgaaattaag actggtttta agttacgctc agctgtgatg 2220 ggtgacaatc agtgcattac tgttttatca gtcttcccct tagagactga cgcagacgag 2280 caggaacaga gcgccgaaga caatgcagcg agggtggccg ccagcctagc aaaagttaca 2340 agtgcctgtg gaatcttttt aaaacctgat gaaacatttg tacattcagg ttttatctat 2400 tttggaaaaa aacaatattt gaatggggtc caattgcctc agtcccttaa aacggctaca 2460 agaatggcac cattgtctga tgcaattttt gatgatcttc aagggaccct ggctagtata 2520 ggcactgctt ttgagcgatc catctctgag acacgacata tctttccttg caggataacc 2580 gcagctttcc atacgttttt ttcggtgaga atcttgcaat atcatcatct cgggttcaat 2640 aaaggttttg accttggaca gttaacactc ggcaaacctc tggatttcgg aacaatatca 2700 ttggcactag cggtaccgca ggtgcttgga gggttatcct tcttgaatcc tgagaaatgt 2760 ttctaccgga atctaggaga tccagttacc tcaggcttat tccagttaaa aacttatctc 2820 cgaatgattg agatggatga tttattctta cctttaattg cgaagaaccc tgggaactgc 2880 actgccattg actttgtgct aaatcctagc ggattaaatg tccctgggtc gcaagactta 2940 acttcatttc tgcgccagat tgtacgcagg accatcaccc taagtgcgaa aaacaaactt 3000 attaatacct tatttcatgc gtcagctgac ttcgaagacg aaatggtttg taaatggcta 3060 ttatcatcaa ctcctgttat gagtcgtttt gcggccgata tcttttcacg cacgccgagc 3120 gggaagcgat tgcaaattct aggatacctg gaaggaacac gcacattatt agcctctaag 3180 atcatcaaca ataatacaga gacaccggtt ttggacagac tgaggaaaat aacattgcaa 3240 aggtggagcc tatggtttag ttatcttgat cattgtgata atatcctggc ggaggcttta 3300 acccaaataa cttgcacagt tgatttagca cagattctga gggaatattc atgggctcat 3360 attttagagg gaagacctct tattggagcc acactcccat gtatgattga gcaattcaaa 3420 gtgttttggc tgaaacccta cgaacaatgt ccgcagtgtt caaatgcaaa gcaaccaggt 3480 gggaaaccat tcgtgtcagt ggcagtcaag aaacatattg ttagtgcatg gccgaacgca 3540 tcccgaataa gctggactat cggggatgga atcccataca ttggatcaag gacagaagat 3600 aagataggac aacctgctat taaaccaaaa tgtccttccg cagccttaag agaggccatt 3660 gaattggcgt cccgtttaac atgggtaact caaggcagtt cgaacagtga cttgctaata 3720 aaaccatttt tggaagcacg agtaaattta agtgttcaag aaatacttca aatgacccct 3780 tcacattact caggaaatat tgttcacagg tacaacgatc aatacagtcc tcattctttc 3840 atggccaatc gtatgagtaa ttcagcaacg cgattgattg tttctacaaa cactttaggt 3900 gagttttcag gaggtggcca gtctgcacgc gacagcaata ttattttcca gaatgttata 3960 aattatgcag ttgcactgtt cgatattaaa tttagaaaca ctgaggctac agatatccaa 4020 tataatcgtg ctcaccttca tctaactaag tgttgcaccc gggaagtacc agctcagtat 4080 ttaacataca catctacatt ggatttagat ttaacaagat accgagaaaa cgaattgatt 4140 tatgacagta atcctctaaa aggaggactc aattgcaata tctcattcga taatccattt 4200 ttccaaggta aacggctgaa cattatagaa gatgatctta ttcgactgcc tcacttatct 4260 ggatgggagc tagccaagac catcatgcaa tcaattattt cagatagcaa caattcatct 4320 acagacccaa ttagcagtgg agaaacaaga tcattcacta cccatttctt aacttatccc 4380 aagataggac ttctgtacag ttttggggcc tttgtaagtt attatcttgg caatacaatt 4440 cttcggacta agaaattaac acttgacaat tttttatatt acttaactac tcaaattcat 4500 aatctaccac atcgctcatt gcgaatactt aagccaacat tcaaacatgc aagcgttatg 4560 tcacggttaa tgagtattga tcctcatttt tctatttaca taggcggtgc tgcaggtgac 4620 agaggactct cagatgcggc caggttattt ttgagaacgt ccatttcatc ttttcttaca 4680 tttgtaaaag aatggataat taatcgcgga acaattgtcc ctttatggat agtatatccg 4740 ctagagggtc aaaacccaac acctgtgaat aattttctct atcagatcgt agaactgctg 4800 gtgcatgatt catcaagaca acaggctttt aaaactacca taagtgatca tgtacatcct 4860 cacgacaatc ttgtttacac atgtaagagt acagccagca atttcttcca tgcatcattg 4920 gcgtactgga ggagcagaca cagaaacagc aaccgaaaat acttggcaag agactcttca 4980 actggatcaa gcacaaacaa cagtgatggt catattgaga gaagtcaaga acaaaccacc 5040 agagatccac atgatggcac tgaacggaat ctagtcctac aaatgagcca tgaaataaaa 5100 agaacgacaa ttccacaaga aaacacgcac cagggtccgt cgttccagtc ctttctaagt 5160 gactctgctt gtggtacagc aaatccaaaa ctaaatttcg atcgatcgag acacaatgtg 5220 aaatttcagg atcataactc ggcatccaag agggaaggtc atcaaataat ctcacaccgt 5280 ctagtcctac ctttctttac attatctcaa gggacacgcc aattaacgtc atccaatgag 5340 tcacaaaccc aagacgagat atcaaagtac ttacggcaat tgagatccgt cattgatacc 5400 acagtttatt gtagatttac cggtatagtc tcgtccatgc attacaaact tgatgaggtc 5460 ctttgggaaa tagagagttt caagtcggct gtgacgctag cagagggaga aggtgctggt 5520 gccttactat tgattcagaa ataccaagtt aagaccttat ttttcaacac gctagctact 5580 gagtccagta tagagtcaga aatagtatca ggaatgacta ctcctaggat gcttctacct 5640 gttatgtcaa aattccataa tgaccaaatt gagattattc ttaacaactc agcaagccaa 5700 ataacagaca taacaaatcc tacttggttt aaagaccaaa gagcaaggct acctaagcaa 5760 gtcgaggtta taaccatgga tgcagagaca acagagaata taaacagatc gaaattgtac 5820 gaagctgtat ataaattgat cttacaccat attgatccta gcgtattgaa agcagtggtc 5880 cttaaagtct ttctaagtga tactgagggt atgttatggc taaatgataa tttagccccg 5940 ttttttgcca ctggttattt aattaagcca ataacgtcaa gtgctagatc tagtgagtgg 6000 tatctttgtc tgacgaactt cttatcaact acacgtaaga tgccacacca aaaccatctc 6060 agttgtaaac aggtaatact tacggcattg caactgcaaa ttcaacgaag cccatactgg 6120 ctaagtcatt taactcagta tgctgactgt gagttacatt taagttatat ccgccttggt 6180 tttccatcat tagagaaagt actataccac aggtataacc tcgtcgattc aaaaagaggt 6240 ccactagtct ctatcactca gcacttagca catcttagag cagagattcg agaattaact 6300 aatgattata atcaacagcg acaaagtcgg actcaaacat atcactttat tcgtactgca 6360 aaaggacgaa tcacaaaact agtcaatgat tatttaaaat tctttcttat tgtgcaagca 6420 ttaaaacata atgggacatg gcaagctgag tttaagaaat taccagagtt gattagtgtg 6480 tgcaataggt tctaccatat tagagattgc aattgtgaag aacgtttctt agttcaaacc 6540 ttatatttac atagaatgca ggattctgaa gttaagctta tcgaaaggct gacagggctt 6600 ctgagtttat ttccggatgg tctctacagg tttgattga 6639 <210> 810 <400> 810 000 <210> 811 <400> 811 000 <210> 812 <400> 812 000 <210> 813 <400> 813 000 <210> 814 <400> 814 000 <210> 815 <400> 815 000 <210> 816 <400> 816 000 <210> 817 <400> 817 000 <210> 818 <400> 818 000 <210> 819 <400> 819 000 <210> 820 <400> 820 000 <210> 821 <400> 821 000 <210> 822 <400> 822 000 <210> 823 <400> 823 000 <210> 824 <400> 824 000 <210> 825 <400> 825 000 <210> 826 <400> 826 000 <210> 827 <400> 827 000 <210> 828 <400> 828 000 <210> 829 <400> 829 000 <210> 830 <400> 830 000 <210> 831 <400> 831 000 <210> 832 <400> 832 000 <210> 833 <400> 833 000 <210> 834 <400> 834 000 <210> 835 <400> 835 000 <210> 836 <400> 836 000 <210> 837 <400> 837 000 <210> 838 <400> 838 000 <210> 839 <400> 839 000 <210> 840 <400> 840 000 <210> 841 <400> 841 000 <210> 842 <400> 842 000 <210> 843 <400> 843 000 <210> 844 <400> 844 000 <210> 845 <400> 845 000 <210> 846 <400> 846 000 <210> 847 <400> 847 000 <210> 848 <400> 848 000 <210> 849 <400> 849 000 <210> 850 <400> 850 000 <210> 851 <211> 739 <212> PRT <213> Zaire ebolavirus <400> 851 Met Asp Ser Arg Pro Gln Lys Ile Trp Met Ala Pro Ser Leu Thr Glu 1 5 10 15 Ser Asp Met Asp Tyr His Lys Ile Leu Thr Ala Gly Leu Ser Val Gln 20 25 30 Gln Gly Ile Val Arg Gln Arg Val Ile Pro Val Tyr Gln Val Asn Asn 35 40 45 Leu Glu Glu Ile Cys Gln Leu Ile Ile Gln Ala Phe Glu Ala Gly Val 50 55 60 Asp Phe Gln Glu Ser Ala Asp Ser Phe Leu Leu Met Leu Cys Leu His 65 70 75 80 His Ala Tyr Gln Gly Asp Tyr Lys Leu Phe Leu Glu Ser Gly Ala Val 85 90 95 Lys Tyr Leu Glu Gly His Gly Phe Arg Phe Glu Val Lys Lys Arg Asp 100 105 110 Gly Val Lys Arg Leu Glu Glu Leu Leu Pro Ala Val Ser Ser Gly Lys 115 120 125 Asn Ile Lys Arg Thr Leu Ala Ala Met Pro Glu Glu Glu Thr Thr Glu 130 135 140 Ala Asn Ala Gly Gln Phe Leu Ser Phe Ala Ser Leu Phe Leu Pro Lys 145 150 155 160 Leu Val Val Gly Glu Lys Ala Cys Leu Glu Lys Val Gln Arg Gln Ile 165 170 175 Gln Val His Ala Glu Gln Gly Leu Ile Gln Tyr Pro Thr Ala Trp Gln 180 185 190 Ser Val Gly His Met Met Val Ile Phe Arg Leu Met Arg Thr Asn Phe 195 200 205 Leu Ile Lys Phe Leu Leu Ile His Gln Gly Met His Met Val Ala Gly 210 215 220 His Asp Ala Asn Asp Ala Val Ile Ser Asn Ser Val Ala Gln Ala Arg 225 230 235 240 Phe Ser Gly Leu Leu Ile Val Lys Thr Val Leu Asp His Ile Leu Gln 245 250 255 Lys Thr Glu Arg Gly Val Arg Leu His Pro Leu Ala Arg Thr Ala Lys 260 265 270 Val Lys Asn Glu Val Asn Ser Phe Lys Ala Ala Leu Ser Ser Leu Ala 275 280 285 Lys His Gly Glu Tyr Ala Pro Phe Ala Arg Leu Leu Asn Leu Ser Gly 290 295 300 Val Asn Asn Leu Glu His Gly Leu Phe Pro Gln Leu Ser Ala Ile Ala 305 310 315 320 Leu Gly Val Ala Thr Ala His Gly Ser Thr Leu Ala Gly Val Asn Val 325 330 335 Gly Glu Gln Tyr Gln Gln Leu Arg Glu Ala Ala Thr Glu Ala Glu Lys 340 345 350 Gln Leu Gln Gln Tyr Ala Glu Ser Arg Glu Leu Asp His Leu Gly Leu 355 360 365 Asp Asp Gln Glu Lys Lys Ile Leu Met Asn Phe His Gln Lys Lys Asn 370 375 380 Glu Ile Ser Phe Gln Gln Thr Asn Ala Met Val Thr Leu Arg Lys Glu 385 390 395 400 Arg Leu Ala Lys Leu Thr Glu Ala Ile Thr Ala Ala Ser Leu Pro Lys 405 410 415 Thr Ser Gly His Tyr Asp Asp Asp Asp Asp Ile Pro Phe Pro Gly Pro 420 425 430 Ile Asn Asp Asp Asp Asn Pro Gly His Gln Asp Asp Asp Pro Thr Asp 435 440 445 Ser Gln Asp Thr Thr Ile Pro Asp Val Val Val Asp Pro Asp Asp Gly 450 455 460 Ser Tyr Gly Glu Tyr Gln Ser Tyr Ser Glu Asn Gly Met Asn Ala Pro 465 470 475 480 Asp Asp Leu Val Leu Phe Asp Leu Asp Glu Asp Asp Glu Asp Thr Lys 485 490 495 Pro Val Pro Asn Arg Ser Thr Lys Gly Gly Gln Gln Lys Asn Ser Gln 500 505 510 Lys Gly Gln His Ile Glu Gly Arg Gln Thr Gln Ser Arg Pro Ile Gln 515 520 525 Asn Val Pro Gly Pro His Arg Thr Ile His His Ala Ser Ala Pro Leu 530 535 540 Thr Asp Asn Asp Arg Arg Asn Glu Pro Ser Gly Ser Thr Ser Pro Arg 545 550 555 560 Met Leu Thr Pro Ile Asn Glu Glu Ala Asp Pro Leu Asp Asp Ala Asp 565 570 575 Asp Glu Thr Ser Ser Leu Pro Pro Leu Glu Ser Asp Asp Glu Glu Gln 580 585 590 Asp Arg Asp Gly Thr Ser Asn Arg Thr Pro Thr Val Ala Pro Pro Ala 595 600 605 Pro Val Tyr Arg Asp His Ser Glu Lys Lys Glu Leu Pro Gln Asp Glu 610 615 620 Gln Gln Asp Gln Asp His Thr Gln Glu Ala Arg Asn Gln Asp Ser Asp 625 630 635 640 Asn Thr Gln Ser Glu His Ser Phe Glu Glu Met Tyr Arg His Ile Leu 645 650 655 Arg Ser Gln Gly Pro Phe Asp Ala Val Leu Tyr Tyr His Met Met Lys 660 665 670 Asp Glu Pro Val Val Phe Ser Thr Ser Asp Gly Lys Glu Tyr Thr Tyr 675 680 685 Pro Asp Ser Leu Glu Glu Glu Tyr Pro Pro Trp Leu Thr Glu Lys Glu 690 695 700 Ala Met Asn Glu Glu Asn Arg Phe Val Thr Leu Asp Gly Gln Gln Phe 705 710 715 720 Tyr Trp Pro Val Met Asn His Lys Asn Lys Phe Met Ala Ile Leu Gln 725 730 735 His His Gln <210> 852 <211> 340 <212> PRT <213> Zaire ebolavirus <400> 852 Met Thr Thr Arg Thr Lys Gly Arg Gly His Thr Ala Ala Thr Thr Gln 1 5 10 15 Asn Asp Arg Met Pro Gly Pro Glu Leu Ser Gly Trp Ile Ser Glu Gln 20 25 30 Leu Met Thr Gly Arg Ile Pro Val Ser Asp Ile Phe Cys Asp Ile Glu 35 40 45 Asn Asn Pro Gly Leu Cys Tyr Ala Ser Gln Met Gln Gln Thr Lys Pro 50 55 60 Asn Pro Lys Thr Arg Asn Ser Gln Thr Gln Thr Asp Pro Ile Cys Asn 65 70 75 80 His Ser Phe Glu Glu Val Val Gln Thr Leu Ala Ser Leu Ala Thr Val 85 90 95 Val Gln Gln Gln Thr Ile Ala Ser Glu Ser Leu Glu Gln Arg Ile Thr 100 105 110 Ser Leu Glu Asn Gly Leu Lys Pro Val Tyr Asp Met Ala Lys Thr Ile 115 120 125 Ser Ser Leu Asn Arg Val Cys Ala Glu Met Val Ala Lys Tyr Asp Leu 130 135 140 Leu Val Met Thr Thr Gly Arg Ala Thr Ala Thr Ala Ala Ala Thr Glu 145 150 155 160 Ala Tyr Trp Ala Glu His Gly Gln Pro Pro Pro Gly Pro Ser Leu Tyr 165 170 175 Glu Glu Ser Ala Ile Arg Gly Lys Ile Glu Ser Arg Asp Glu Thr Val 180 185 190 Pro Gln Ser Val Arg Glu Ala Phe Asn Asn Leu Asn Ser Thr Thr Ser 195 200 205 Leu Thr Glu Glu Asn Phe Gly Lys Pro Asp Ile Ser Ala Lys Asp Leu 210 215 220 Arg Asn Ile Met Tyr Asp His Leu Pro Gly Phe Gly Thr Ala Phe His 225 230 235 240 Gln Leu Val Gln Val Ile Cys Lys Leu Gly Lys Asp Ser Asn Ser Leu 245 250 255 Asp Ile Ile His Ala Glu Phe Gln Ala Ser Leu Ala Glu Gly Asp Ser 260 265 270 Pro Gln Cys Ala Leu Ile Gln Ile Thr Lys Arg Val Pro Ile Phe Gln 275 280 285 Asp Ala Ala Pro Pro Val Ile His Ile Arg Ser Arg Gly Asp Ile Pro 290 295 300 Arg Ala Cys Gln Lys Ser Leu Arg Pro Val Pro Pro Ser Pro Lys Ile 305 310 315 320 Asp Arg Gly Trp Val Cys Val Phe Gln Leu Gln Asp Gly Lys Thr Leu 325 330 335 Gly Leu Lys Ile 340 <210> 853 <211> 326 <212> PRT <213> Zaire ebolavirus <400> 853 Met Arg Arg Val Ile Leu Pro Thr Ala Pro Pro Glu Tyr Met Glu Ala 1 5 10 15 Ile Tyr Pro Val Arg Ser Asn Ser Thr Ile Ala Arg Gly Gly Asn Ser 20 25 30 Asn Thr Gly Phe Leu Thr Pro Glu Ser Val Asn Gly Asp Thr Pro Ser 35 40 45 Asn Pro Leu Arg Pro Ile Ala Asp Asp Thr Ile Asp His Ala Ser His 50 55 60 Thr Pro Gly Ser Val Ser Ser Ala Phe Ile Leu Glu Ala Met Val Asn 65 70 75 80 Val Ile Ser Gly Pro Lys Val Leu Met Lys Gln Ile Pro Ile Trp Leu 85 90 95 Pro Leu Gly Val Ala Asp Gln Lys Thr Tyr Ser Phe Asp Ser Thr Thr 100 105 110 Ala Ala Ile Met Leu Ala Ser Tyr Thr Ile Thr His Phe Gly Lys Ala 115 120 125 Thr Asn Pro Leu Val Arg Val Asn Arg Leu Gly Pro Gly Ile Pro Asp 130 135 140 His Pro Leu Arg Leu Leu Arg Ile Gly Asn Gln Ala Phe Leu Gln Glu 145 150 155 160 Phe Val Leu Pro Pro Val Gln Leu Pro Gln Tyr Phe Thr Phe Asp Leu 165 170 175 Thr Ala Leu Lys Leu Ile Thr Gln Pro Leu Pro Ala Ala Thr Trp Thr 180 185 190 Asp Asp Thr Pro Thr Gly Ser Asn Gly Ala Leu Arg Pro Gly Ile Ser 195 200 205 Phe His Pro Lys Leu Arg Pro Ile Leu Leu Pro Asn Lys Ser Gly Lys 210 215 220 Lys Gly Asn Ser Ala Asp Leu Thr Ser Pro Glu Lys Ile Gln Ala Ile 225 230 235 240 Met Thr Ser Leu Gln Asp Phe Lys Ile Val Pro Ile Asp Pro Thr Lys 245 250 255 Asn Ile Met Gly Ile Glu Val Pro Glu Thr Leu Val His Lys Leu Thr 260 265 270 Gly Lys Lys Val Thr Ser Lys Asn Gly Gln Pro Ile Ile Pro Val Leu 275 280 285 Leu Pro Lys Tyr Ile Gly Leu Asp Pro Val Ala Pro Gly Asp Leu Thr 290 295 300 Met Val Ile Thr Gln Asp Cys Asp Thr Cys His Ser Pro Ala Ser Leu 305 310 315 320 Pro Ala Val Ile Glu Lys 325 <210> 854 <211> 676 <212> PRT <213> Zaire ebolavirus <400> 854 Met Gly Val Thr Gly Ile Leu Gln Leu Pro Arg Asp Arg Phe Lys Arg 1 5 10 15 Thr Ser Phe Phe Leu Trp Val Ile Ile Leu Phe Gln Arg Thr Phe Ser 20 25 30 Ile Pro Leu Gly Val Ile His Asn Ser Thr Leu Gln Val Ser Asp Val 35 40 45 Asp Lys Leu Val Cys Arg Asp Lys Leu Ser Ser Thr Asn Gln Leu Arg 50 55 60 Ser Val Gly Leu Asn Leu Glu Gly Asn Gly Val Ala Thr Asp Val Pro 65 70 75 80 Ser Ala Thr Lys Arg Trp Gly Phe Arg Ser Gly Val Pro Pro Lys Val 85 90 95 Val Asn Tyr Glu Ala Gly Glu Trp Ala Glu Asn Cys Tyr Asn Leu Glu 100 105 110 Ile Lys Lys Pro Asp Gly Ser Glu Cys Leu Pro Ala Ala Pro Asp Gly 115 120 125 Ile Arg Gly Phe Pro Arg Cys Arg Tyr Val His Lys Val Ser Gly Thr 130 135 140 Gly Pro Cys Ala Gly Asp Phe Ala Phe His Lys Glu Gly Ala Phe Phe 145 150 155 160 Leu Tyr Asp Arg Leu Ala Ser Thr Val Ile Tyr Arg Gly Thr Thr Phe 165 170 175 Ala Glu Gly Val Val Ala Phe Leu Ile Leu Pro Gln Ala Lys Lys Asp 180 185 190 Phe Phe Ser Ser His Pro Leu Arg Glu Pro Val Asn Ala Thr Glu Asp 195 200 205 Pro Ser Ser Gly Tyr Tyr Ser Thr Thr Ile Arg Tyr Gln Ala Thr Gly 210 215 220 Phe Gly Thr Asn Glu Thr Glu Tyr Leu Phe Glu Val Asp Asn Leu Thr 225 230 235 240 Tyr Val Gln Leu Glu Ser Arg Phe Thr Pro Gln Phe Leu Leu Gln Leu 245 250 255 Asn Glu Thr Ile Tyr Thr Ser Gly Lys Arg Ser Asn Thr Thr Gly Lys 260 265 270 Leu Ile Trp Lys Val Asn Pro Glu Ile Asp Thr Thr Ile Gly Glu Trp 275 280 285 Ala Phe Trp Glu Thr Lys Lys Asn Leu Thr Arg Lys Ile Arg Ser Glu 290 295 300 Glu Leu Ser Phe Thr Val Val Ser Asn Gly Ala Lys Asn Ile Ser Gly 305 310 315 320 Gln Ser Pro Ala Arg Thr Ser Ser Asp Pro Gly Thr Asn Thr Thr Thr 325 330 335 Glu Asp His Lys Ile Met Ala Ser Glu Asn Ser Ser Ala Met Val Gln 340 345 350 Val His Ser Gln Gly Arg Glu Ala Ala Val Ser His Leu Thr Thr Leu 355 360 365 Ala Thr Ile Ser Thr Ser Pro Gln Ser Leu Thr Thr Lys Pro Gly Pro 370 375 380 Asp Asn Ser Thr His Asn Thr Pro Val Tyr Lys Leu Asp Ile Ser Glu 385 390 395 400 Ala Thr Gln Val Glu Gln His His Arg Arg Thr Asp Asn Asp Ser Thr 405 410 415 Ala Ser Asp Thr Pro Ser Ala Thr Thr Ala Ala Gly Pro Pro Lys Ala 420 425 430 Glu Asn Thr Asn Thr Ser Lys Ser Thr Asp Phe Leu Asp Pro Ala Thr 435 440 445 Thr Thr Ser Pro Gln Asn His Ser Glu Thr Ala Gly Asn Asn Asn Thr 450 455 460 His His Gln Asp Thr Gly Glu Glu Ser Ala Ser Ser Gly Lys Leu Gly 465 470 475 480 Leu Ile Thr Asn Thr Ile Ala Gly Val Ala Gly Leu Ile Thr Gly Gly 485 490 495 Arg Arg Thr Arg Arg Glu Ala Ile Val Asn Ala Gln Pro Lys Cys Asn 500 505 510 Pro Asn Leu His Tyr Trp Thr Thr Gln Asp Glu Gly Ala Ala Ile Gly 515 520 525 Leu Ala Trp Ile Pro Tyr Phe Gly Pro Ala Ala Glu Gly Ile Tyr Ile 530 535 540 Glu Gly Leu Met His Asn Gln Asp Gly Leu Ile Cys Gly Leu Arg Gln 545 550 555 560 Leu Ala Asn Glu Thr Thr Gln Ala Leu Gln Leu Phe Leu Arg Ala Thr 565 570 575 Thr Glu Leu Arg Thr Phe Ser Ile Leu Asn Arg Lys Ala Ile Asp Phe 580 585 590 Leu Leu Gln Arg Trp Gly Gly Thr Cys His Ile Leu Gly Pro Asp Cys 595 600 605 Cys Ile Glu Pro His Asp Trp Thr Lys Asn Ile Thr Asp Lys Ile Asp 610 615 620 Gln Ile Ile His Asp Phe Val Asp Lys Thr Leu Pro Asp Gln Gly Asp 625 630 635 640 Asn Asp Asn Trp Trp Thr Gly Trp Arg Gln Trp Ile Pro Ala Gly Ile 645 650 655 Gly Val Thr Gly Val Ile Ile Ala Val Ile Ala Leu Phe Cys Ile Cys 660 665 670 Lys Phe Val Phe 675 <210> 855 <211> 364 <212> PRT <213> Zaire ebolavirus <400> 855 Met Gly Val Thr Gly Ile Leu Gln Leu Pro Arg Asp Arg Phe Lys Arg 1 5 10 15 Thr Ser Phe Phe Leu Trp Val Ile Ile Leu Phe Gln Arg Thr Phe Ser 20 25 30 Ile Pro Leu Gly Val Ile His Asn Ser Thr Leu Gln Val Ser Asp Val 35 40 45 Asp Lys Leu Val Cys Arg Asp Lys Leu Ser Ser Thr Asn Gln Leu Arg 50 55 60 Ser Val Gly Leu Asn Leu Glu Gly Asn Gly Val Ala Thr Asp Val Pro 65 70 75 80 Ser Ala Thr Lys Arg Trp Gly Phe Arg Ser Gly Val Pro Pro Lys Val 85 90 95 Val Asn Tyr Glu Ala Gly Glu Trp Ala Glu Asn Cys Tyr Asn Leu Glu 100 105 110 Ile Lys Lys Pro Asp Gly Ser Glu Cys Leu Pro Ala Ala Pro Asp Gly 115 120 125 Ile Arg Gly Phe Pro Arg Cys Arg Tyr Val His Lys Val Ser Gly Thr 130 135 140 Gly Pro Cys Ala Gly Asp Phe Ala Phe His Lys Glu Gly Ala Phe Phe 145 150 155 160 Leu Tyr Asp Arg Leu Ala Ser Thr Val Ile Tyr Arg Gly Thr Thr Phe 165 170 175 Ala Glu Gly Val Val Ala Phe Leu Ile Leu Pro Gln Ala Lys Lys Asp 180 185 190 Phe Phe Ser Ser His Pro Leu Arg Glu Pro Val Asn Ala Thr Glu Asp 195 200 205 Pro Ser Ser Gly Tyr Tyr Ser Thr Thr Ile Arg Tyr Gln Ala Thr Gly 210 215 220 Phe Gly Thr Asn Glu Thr Glu Tyr Leu Phe Glu Val Asp Asn Leu Thr 225 230 235 240 Tyr Val Gln Leu Glu Ser Arg Phe Thr Pro Gln Phe Leu Leu Gln Leu 245 250 255 Asn Glu Thr Ile Tyr Thr Ser Gly Lys Arg Ser Asn Thr Thr Gly Lys 260 265 270 Leu Ile Trp Lys Val Asn Pro Glu Ile Asp Thr Thr Ile Gly Glu Trp 275 280 285 Ala Phe Trp Glu Thr Lys Lys Thr Ser Leu Glu Lys Phe Ala Val Lys 290 295 300 Ser Cys Leu Ser Gln Leu Tyr Gln Thr Glu Pro Lys Thr Ser Val Val 305 310 315 320 Arg Val Arg Arg Glu Leu Leu Pro Thr Gln Gly Pro Thr Gln Gln Leu 325 330 335 Lys Thr Thr Lys Ser Trp Leu Gln Lys Ile Pro Leu Gln Trp Phe Lys 340 345 350 Cys Thr Val Lys Glu Gly Lys Leu Gln Cys Arg Ile 355 360 <210> 856 <211> 297 <212> PRT <213> Zaire ebolavirus <400> 856 Met Gly Val Thr Gly Ile Leu Gln Leu Pro Arg Asp Arg Phe Lys Arg 1 5 10 15 Thr Ser Phe Phe Leu Trp Val Ile Ile Leu Phe Gln Arg Thr Phe Ser 20 25 30 Ile Pro Leu Gly Val Ile His Asn Ser Thr Leu Gln Val Ser Asp Val 35 40 45 Asp Lys Leu Val Cys Arg Asp Lys Leu Ser Ser Thr Asn Gln Leu Arg 50 55 60 Ser Val Gly Leu Asn Leu Glu Gly Asn Gly Val Ala Thr Asp Val Pro 65 70 75 80 Ser Ala Thr Lys Arg Trp Gly Phe Arg Ser Gly Val Pro Pro Lys Val 85 90 95 Val Asn Tyr Glu Ala Gly Glu Trp Ala Glu Asn Cys Tyr Asn Leu Glu 100 105 110 Ile Lys Lys Pro Asp Gly Ser Glu Cys Leu Pro Ala Ala Pro Asp Gly 115 120 125 Ile Arg Gly Phe Pro Arg Cys Arg Tyr Val His Lys Val Ser Gly Thr 130 135 140 Gly Pro Cys Ala Gly Asp Phe Ala Phe His Lys Glu Gly Ala Phe Phe 145 150 155 160 Leu Tyr Asp Arg Leu Ala Ser Thr Val Ile Tyr Arg Gly Thr Thr Phe 165 170 175 Ala Glu Gly Val Val Ala Phe Leu Ile Leu Pro Gln Ala Lys Lys Asp 180 185 190 Phe Phe Ser Ser His Pro Leu Arg Glu Pro Val Asn Ala Thr Glu Asp 195 200 205 Pro Ser Ser Gly Tyr Tyr Ser Thr Thr Ile Arg Tyr Gln Ala Thr Gly 210 215 220 Phe Gly Thr Asn Glu Thr Glu Tyr Leu Phe Glu Val Asp Asn Leu Thr 225 230 235 240 Tyr Val Gln Leu Glu Ser Arg Phe Thr Pro Gln Phe Leu Leu Gln Leu 245 250 255 Asn Glu Thr Ile Tyr Thr Ser Gly Lys Arg Ser Asn Thr Thr Gly Lys 260 265 270 Leu Ile Trp Lys Val Asn Pro Glu Ile Asp Thr Thr Ile Gly Glu Trp 275 280 285 Ala Phe Trp Glu Thr Lys Lys Pro His 290 295 <210> 857 <211> 288 <212> PRT <213> Zaire ebolavirus <400> 857 Met Glu Ala Ser Tyr Glu Arg Gly Arg Pro Arg Ala Ala Arg Gln His 1 5 10 15 Ser Arg Asp Gly His Asp His His Val Arg Ala Arg Ser Ser Ser Arg 20 25 30 Glu Asn Tyr Arg Gly Glu Tyr Arg Gln Ser Arg Ser Ala Ser Gln Val 35 40 45 Arg Val Pro Thr Val Phe His Lys Lys Arg Val Glu Pro Leu Thr Val 50 55 60 Pro Pro Ala Pro Lys Asp Ile Cys Pro Thr Leu Lys Lys Gly Phe Leu 65 70 75 80 Cys Asp Ser Ser Phe Cys Lys Lys Asp His Gln Leu Glu Ser Leu Thr 85 90 95 Asp Arg Glu Leu Leu Leu Leu Ile Ala Arg Lys Thr Cys Gly Ser Val 100 105 110 Glu Gln Gln Leu Asn Ile Thr Ala Pro Lys Asp Ser Arg Leu Ala Asn 115 120 125 Pro Thr Ala Asp Asp Phe Gln Gln Glu Glu Gly Pro Lys Ile Thr Leu 130 135 140 Leu Thr Leu Ile Lys Thr Ala Glu His Trp Ala Arg Gln Asp Ile Arg 145 150 155 160 Thr Ile Glu Asp Ser Lys Leu Arg Ala Leu Leu Thr Leu Cys Ala Val 165 170 175 Met Thr Arg Lys Phe Ser Lys Ser Gln Leu Ser Leu Leu Cys Glu Thr 180 185 190 His Leu Arg Arg Glu Gly Leu Gly Gln Asp Gln Ala Glu Pro Val Leu 195 200 205 Glu Val Tyr Gln Arg Leu His Ser Asp Lys Gly Gly Ser Phe Glu Ala 210 215 220 Ala Leu Trp Gln Gln Trp Asp Arg Gln Ser Leu Ile Met Phe Ile Thr 225 230 235 240 Ala Phe Leu Asn Ile Ala Leu Gln Leu Pro Cys Glu Ser Ser Ala Val 245 250 255 Val Val Ser Gly Leu Arg Thr Leu Val Pro Gln Ser Asp Asn Glu Glu 260 265 270 Ala Ser Thr Asn Pro Gly Thr Cys Ser Trp Ser Asp Glu Gly Thr Pro 275 280 285 <210> 858 <211> 251 <212> PRT <213> Zaire ebolavirus <400> 858 Met Ala Lys Ala Thr Gly Arg Tyr Asn Leu Ile Ser Pro Lys Lys Asp 1 5 10 15 Leu Glu Lys Gly Val Val Leu Ser Asp Leu Cys Asn Phe Leu Val Ser 20 25 30 Gln Thr Ile Gln Gly Trp Lys Val Tyr Trp Ala Gly Ile Glu Phe Asp 35 40 45 Val Thr His Lys Gly Met Ala Leu Leu His Arg Leu Lys Thr Asn Asp 50 55 60 Phe Ala Pro Ala Trp Ser Met Thr Arg Asn Leu Phe Pro His Leu Phe 65 70 75 80 Gln Asn Pro Asn Ser Thr Ile Glu Ser Pro Leu Trp Ala Leu Arg Val 85 90 95 Ile Leu Ala Ala Gly Ile Gln Asp Gln Leu Ile Asp Gln Ser Leu Ile 100 105 110 Glu Pro Leu Ala Gly Ala Leu Gly Leu Ile Ser Asp Trp Leu Leu Thr 115 120 125 Thr Asn Thr Asn His Phe Asn Met Arg Thr Gln Arg Val Lys Glu Gln 130 135 140 Leu Ser Leu Lys Met Leu Ser Leu Ile Arg Ser Asn Ile Leu Lys Phe 145 150 155 160 Ile Asn Lys Leu Asp Ala Leu His Val Val Asn Tyr Asn Gly Leu Leu 165 170 175 Ser Ser Ile Glu Ile Gly Thr Gln Asn His Thr Ile Ile Ile Thr Arg 180 185 190 Thr Asn Met Gly Phe Leu Val Glu Leu Gln Glu Pro Asp Lys Ser Ala 195 200 205 Met Asn Arg Met Lys Pro Gly Pro Ala Lys Phe Ser Leu Leu His Glu 210 215 220 Ser Thr Leu Lys Ala Phe Thr Gln Gly Ser Ser Thr Arg Met Gln Ser 225 230 235 240 Leu Ile Leu Glu Phe Asn Ser Ser Leu Ala Ile 245 250 <210> 859 <211> 2212 <212> PRT <213> Zaire ebolavirus <400> 859 Met Ala Thr Gln His Thr Gln Tyr Pro Asp Ala Arg Leu Ser Ser Pro 1 5 10 15 Ile Val Leu Asp Gln Cys Asp Leu Val Thr Arg Ala Cys Gly Leu Tyr 20 25 30 Ser Ser Tyr Ser Leu Asn Pro Gln Leu Arg Asn Cys Lys Leu Pro Lys 35 40 45 His Ile Tyr Arg Leu Lys Tyr Asp Val Thr Val Thr Lys Phe Leu Ser 50 55 60 Asp Val Pro Val Ala Thr Leu Pro Ile Asp Phe Ile Val Pro Val Leu 65 70 75 80 Leu Lys Ala Leu Ser Gly Asn Gly Phe Cys Pro Val Glu Pro Arg Cys 85 90 95 Gln Gln Phe Leu Asp Glu Ile Ile Lys Tyr Thr Met Gln Asp Ala Leu 100 105 110 Phe Leu Lys Tyr Tyr Leu Lys Asn Val Gly Ala Gln Glu Asp Cys Val 115 120 125 Asp Glu His Phe Gln Glu Lys Ile Leu Ser Ser Ile Gln Gly Asn Glu 130 135 140 Phe Leu His Gln Met Phe Phe Trp Tyr Asp Leu Ala Ile Leu Thr Arg 145 150 155 160 Arg Gly Arg Leu Asn Arg Gly Asn Ser Arg Ser Thr Trp Phe Val His 165 170 175 Asp Asp Leu Ile Asp Ile Leu Gly Tyr Gly Asp Tyr Val Phe Trp Lys 180 185 190 Ile Pro Ile Ser Met Leu Pro Leu Asn Thr Gln Gly Ile Pro His Ala 195 200 205 Ala Met Asp Trp Tyr Gln Ala Ser Val Phe Lys Glu Ala Val Gln Gly 210 215 220 His Thr His Ile Val Ser Val Ser Thr Ala Asp Val Leu Ile Met Cys 225 230 235 240 Lys Asp Leu Ile Thr Cys Arg Phe Asn Thr Thr Leu Ile Ser Lys Ile 245 250 255 Ala Glu Ile Glu Asp Pro Val Cys Ser Asp Tyr Pro Asn Phe Lys Ile 260 265 270 Val Ser Met Leu Tyr Gln Ser Gly Asp Tyr Leu Leu Ser Ile Leu Gly 275 280 285 Ser Asp Gly Tyr Lys Ile Ile Lys Phe Leu Glu Pro Leu Cys Leu Ala 290 295 300 Lys Ile Gln Leu Cys Ser Lys Tyr Thr Glu Arg Lys Gly Arg Phe Leu 305 310 315 320 Thr Gln Met His Leu Ala Val Asn His Thr Leu Glu Glu Ile Thr Glu 325 330 335 Met Arg Ala Leu Lys Pro Ser Gln Ala Gln Lys Ile Arg Glu Phe His 340 345 350 Arg Thr Leu Ile Arg Leu Glu Met Thr Pro Gln Gln Leu Cys Glu Leu 355 360 365 Phe Ser Ile Gln Lys His Trp Gly His Pro Val Leu His Ser Glu Thr 370 375 380 Ala Ile Gln Lys Val Lys Lys His Ala Thr Val Leu Lys Ala Leu Arg 385 390 395 400 Pro Ile Val Ile Phe Glu Thr Tyr Cys Val Phe Lys Tyr Ser Ile Ala 405 410 415 Lys His Tyr Phe Asp Ser Gln Gly Ser Trp Tyr Ser Val Thr Ser Asp 420 425 430 Arg Asn Leu Thr Pro Gly Leu Asn Ser Tyr Ile Lys Arg Asn Gln Phe 435 440 445 Pro Pro Leu Pro Met Ile Lys Glu Leu Leu Trp Glu Phe Tyr His Leu 450 455 460 Asp His Pro Pro Leu Phe Ser Thr Lys Ile Ile Ser Asp Leu Ser Ile 465 470 475 480 Phe Ile Lys Asp Arg Ala Thr Ala Val Glu Arg Thr Cys Trp Asp Ala 485 490 495 Val Phe Glu Pro Asn Val Leu Gly Tyr Asn Pro Pro His Lys Phe Ser 500 505 510 Thr Lys Arg Val Pro Glu Gln Phe Leu Glu Gln Glu Asn Phe Ser Ile 515 520 525 Glu Asn Val Leu Ser Tyr Ala Gln Lys Leu Glu Tyr Leu Leu Pro Gln 530 535 540 Tyr Arg Asn Phe Ser Phe Ser Leu Lys Glu Lys Glu Leu Asn Val Gly 545 550 555 560 Arg Thr Phe Gly Lys Leu Pro Tyr Pro Thr Arg Asn Val Gln Thr Leu 565 570 575 Cys Glu Ala Leu Leu Ala Asp Gly Leu Ala Lys Ala Phe Pro Ser Asn 580 585 590 Met Met Val Val Thr Glu Arg Glu Gln Lys Glu Ser Leu Leu His Gln 595 600 605 Ala Ser Trp His His Thr Ser Asp Asp Phe Gly Glu His Ala Thr Val 610 615 620 Arg Gly Ser Ser Phe Val Thr Asp Leu Glu Lys Tyr Asn Leu Ala Phe 625 630 635 640 Arg Tyr Glu Phe Thr Ala Pro Phe Ile Glu Tyr Cys Asn Arg Cys Tyr 645 650 655 Gly Val Lys Asn Val Phe Asn Trp Met His Tyr Thr Ile Pro Gln Cys 660 665 670 Tyr Met His Val Ser Asp Tyr Tyr Asn Pro Pro His Asn Leu Thr Leu 675 680 685 Glu Asn Arg Asp Asn Pro Pro Glu Gly Pro Ser Ser Tyr Arg Gly His 690 695 700 Met Gly Gly Ile Glu Gly Leu Gln Gln Lys Leu Trp Thr Ser Ile Ser 705 710 715 720 Cys Ala Gln Ile Ser Leu Val Glu Ile Lys Thr Gly Phe Lys Leu Arg 725 730 735 Ser Ala Val Met Gly Asp Asn Gln Cys Ile Thr Val Leu Ser Val Phe 740 745 750 Pro Leu Glu Thr Asp Ala Asp Glu Gln Glu Gln Ser Ala Glu Asp Asn 755 760 765 Ala Ala Arg Val Ala Ala Ser Leu Ala Lys Val Thr Ser Ala Cys Gly 770 775 780 Ile Phe Leu Lys Pro Asp Glu Thr Phe Val His Ser Gly Phe Ile Tyr 785 790 795 800 Phe Gly Lys Lys Gln Tyr Leu Asn Gly Val Gln Leu Pro Gln Ser Leu 805 810 815 Lys Thr Ala Thr Arg Met Ala Pro Leu Ser Asp Ala Ile Phe Asp Asp 820 825 830 Leu Gln Gly Thr Leu Ala Ser Ile Gly Thr Ala Phe Glu Arg Ser Ile 835 840 845 Ser Glu Thr Arg His Ile Phe Pro Cys Arg Ile Thr Ala Ala Phe His 850 855 860 Thr Phe Phe Ser Val Arg Ile Leu Gln Tyr His His Leu Gly Phe Asn 865 870 875 880 Lys Gly Phe Asp Leu Gly Gln Leu Thr Leu Gly Lys Pro Leu Asp Phe 885 890 895 Gly Thr Ile Ser Leu Ala Leu Ala Val Pro Gln Val Leu Gly Gly Leu 900 905 910 Ser Phe Leu Asn Pro Glu Lys Cys Phe Tyr Arg Asn Leu Gly Asp Pro 915 920 925 Val Thr Ser Gly Leu Phe Gln Leu Lys Thr Tyr Leu Arg Met Ile Glu 930 935 940 Met Asp Asp Leu Phe Leu Pro Leu Ile Ala Lys Asn Pro Gly Asn Cys 945 950 955 960 Thr Ala Ile Asp Phe Val Leu Asn Pro Ser Gly Leu Asn Val Pro Gly 965 970 975 Ser Gln Asp Leu Thr Ser Phe Leu Arg Gln Ile Val Arg Arg Thr Ile 980 985 990 Thr Leu Ser Ala Lys Asn Lys Leu Ile Asn Thr Leu Phe His Ala Ser 995 1000 1005 Ala Asp Phe Glu Asp Glu Met Val Cys Lys Trp Leu Leu Ser Ser 1010 1015 1020 Thr Pro Val Met Ser Arg Phe Ala Ala Asp Ile Phe Ser Arg Thr 1025 1030 1035 Pro Ser Gly Lys Arg Leu Gln Ile Leu Gly Tyr Leu Glu Gly Thr 1040 1045 1050 Arg Thr Leu Leu Ala Ser Lys Ile Ile Asn Asn Asn Thr Glu Thr 1055 1060 1065 Pro Val Leu Asp Arg Leu Arg Lys Ile Thr Leu Gln Arg Trp Ser 1070 1075 1080 Leu Trp Phe Ser Tyr Leu Asp His Cys Asp Asn Ile Leu Ala Glu 1085 1090 1095 Ala Leu Thr Gln Ile Thr Cys Thr Val Asp Leu Ala Gln Ile Leu 1100 1105 1110 Arg Glu Tyr Ser Trp Ala His Ile Leu Glu Gly Arg Pro Leu Ile 1115 1120 1125 Gly Ala Thr Leu Pro Cys Met Ile Glu Gln Phe Lys Val Phe Trp 1130 1135 1140 Leu Lys Pro Tyr Glu Gln Cys Pro Gln Cys Ser Asn Ala Lys Gln 1145 1150 1155 Pro Gly Gly Lys Pro Phe Val Ser Val Ala Val Lys Lys His Ile 1160 1165 1170 Val Ser Ala Trp Pro Asn Ala Ser Arg Ile Ser Trp Thr Ile Gly 1175 1180 1185 Asp Gly Ile Pro Tyr Ile Gly Ser Arg Thr Glu Asp Lys Ile Gly 1190 1195 1200 Gln Pro Ala Ile Lys Pro Lys Cys Pro Ser Ala Ala Leu Arg Glu 1205 1210 1215 Ala Ile Glu Leu Ala Ser Arg Leu Thr Trp Val Thr Gln Gly Ser 1220 1225 1230 Ser Asn Ser Asp Leu Leu Ile Lys Pro Phe Leu Glu Ala Arg Val 1235 1240 1245 Asn Leu Ser Val Gln Glu Ile Leu Gln Met Thr Pro Ser His Tyr 1250 1255 1260 Ser Gly Asn Ile Val His Arg Tyr Asn Asp Gln Tyr Ser Pro His 1265 1270 1275 Ser Phe Met Ala Asn Arg Met Ser Asn Ser Ala Thr Arg Leu Ile 1280 1285 1290 Val Ser Thr Asn Thr Leu Gly Glu Phe Ser Gly Gly Gly Gln Ser 1295 1300 1305 Ala Arg Asp Ser Asn Ile Ile Phe Gln Asn Val Ile Asn Tyr Ala 1310 1315 1320 Val Ala Leu Phe Asp Ile Lys Phe Arg Asn Thr Glu Ala Thr Asp 1325 1330 1335 Ile Gln Tyr Asn Arg Ala His Leu His Leu Thr Lys Cys Cys Thr 1340 1345 1350 Arg Glu Val Pro Ala Gln Tyr Leu Thr Tyr Thr Ser Thr Leu Asp 1355 1360 1365 Leu Asp Leu Thr Arg Tyr Arg Glu Asn Glu Leu Ile Tyr Asp Ser 1370 1375 1380 Asn Pro Leu Lys Gly Gly Leu Asn Cys Asn Ile Ser Phe Asp Asn 1385 1390 1395 Pro Phe Phe Gln Gly Lys Arg Leu Asn Ile Ile Glu Asp Asp Leu 1400 1405 1410 Ile Arg Leu Pro His Leu Ser Gly Trp Glu Leu Ala Lys Thr Ile 1415 1420 1425 Met Gln Ser Ile Ile Ser Asp Ser Asn Asn Ser Ser Thr Asp Pro 1430 1435 1440 Ile Ser Ser Gly Glu Thr Arg Ser Phe Thr Thr His Phe Leu Thr 1445 1450 1455 Tyr Pro Lys Ile Gly Leu Leu Tyr Ser Phe Gly Ala Phe Val Ser 1460 1465 1470 Tyr Tyr Leu Gly Asn Thr Ile Leu Arg Thr Lys Lys Leu Thr Leu 1475 1480 1485 Asp Asn Phe Leu Tyr Tyr Leu Thr Thr Gln Ile His Asn Leu Pro 1490 1495 1500 His Arg Ser Leu Arg Ile Leu Lys Pro Thr Phe Lys His Ala Ser 1505 1510 1515 Val Met Ser Arg Leu Met Ser Ile Asp Pro His Phe Ser Ile Tyr 1520 1525 1530 Ile Gly Gly Ala Ala Gly Asp Arg Gly Leu Ser Asp Ala Ala Arg 1535 1540 1545 Leu Phe Leu Arg Thr Ser Ile Ser Ser Phe Leu Thr Phe Val Lys 1550 1555 1560 Glu Trp Ile Ile Asn Arg Gly Thr Ile Val Pro Leu Trp Ile Val 1565 1570 1575 Tyr Pro Leu Glu Gly Gln Asn Pro Thr Pro Val Asn Asn Phe Leu 1580 1585 1590 Tyr Gln Ile Val Glu Leu Leu Val His Asp Ser Ser Arg Gln Gln 1595 1600 1605 Ala Phe Lys Thr Thr Ile Ser Asp His Val His Pro His Asp Asn 1610 1615 1620 Leu Val Tyr Thr Cys Lys Ser Thr Ala Ser Asn Phe Phe His Ala 1625 1630 1635 Ser Leu Ala Tyr Trp Arg Ser Arg His Arg Asn Ser Asn Arg Lys 1640 1645 1650 Tyr Leu Ala Arg Asp Ser Ser Thr Gly Ser Ser Thr Asn Asn Ser 1655 1660 1665 Asp Gly His Ile Glu Arg Ser Gln Glu Gln Thr Thr Arg Asp Pro 1670 1675 1680 His Asp Gly Thr Glu Arg Asn Leu Val Leu Gln Met Ser His Glu 1685 1690 1695 Ile Lys Arg Thr Thr Ile Pro Gln Glu Asn Thr His Gln Gly Pro 1700 1705 1710 Ser Phe Gln Ser Phe Leu Ser Asp Ser Ala Cys Gly Thr Ala Asn 1715 1720 1725 Pro Lys Leu Asn Phe Asp Arg Ser Arg His Asn Val Lys Phe Gln 1730 1735 1740 Asp His Asn Ser Ala Ser Lys Arg Glu Gly His Gln Ile Ile Ser 1745 1750 1755 His Arg Leu Val Leu Pro Phe Phe Thr Leu Ser Gln Gly Thr Arg 1760 1765 1770 Gln Leu Thr Ser Ser Asn Glu Ser Gln Thr Gln Asp Glu Ile Ser 1775 1780 1785 Lys Tyr Leu Arg Gln Leu Arg Ser Val Ile Asp Thr Thr Val Tyr 1790 1795 1800 Cys Arg Phe Thr Gly Ile Val Ser Ser Met His Tyr Lys Leu Asp 1805 1810 1815 Glu Val Leu Trp Glu Ile Glu Ser Phe Lys Ser Ala Val Thr Leu 1820 1825 1830 Ala Glu Gly Glu Gly Ala Gly Ala Leu Leu Leu Ile Gln Lys Tyr 1835 1840 1845 Gln Val Lys Thr Leu Phe Phe Asn Thr Leu Ala Thr Glu Ser Ser 1850 1855 1860 Ile Glu Ser Glu Ile Val Ser Gly Met Thr Thr Pro Arg Met Leu 1865 1870 1875 Leu Pro Val Met Ser Lys Phe His Asn Asp Gln Ile Glu Ile Ile 1880 1885 1890 Leu Asn Asn Ser Ala Ser Gln Ile Thr Asp Ile Thr Asn Pro Thr 1895 1900 1905 Trp Phe Lys Asp Gln Arg Ala Arg Leu Pro Lys Gln Val Glu Val 1910 1915 1920 Ile Thr Met Asp Ala Glu Thr Thr Glu Asn Ile Asn Arg Ser Lys 1925 1930 1935 Leu Tyr Glu Ala Val Tyr Lys Leu Ile Leu His His Ile Asp Pro 1940 1945 1950 Ser Val Leu Lys Ala Val Val Leu Lys Val Phe Leu Ser Asp Thr 1955 1960 1965 Glu Gly Met Leu Trp Leu Asn Asp Asn Leu Ala Pro Phe Phe Ala 1970 1975 1980 Thr Gly Tyr Leu Ile Lys Pro Ile Thr Ser Ser Ala Arg Ser Ser 1985 1990 1995 Glu Trp Tyr Leu Cys Leu Thr Asn Phe Leu Ser Thr Thr Arg Lys 2000 2005 2010 Met Pro His Gln Asn His Leu Ser Cys Lys Gln Val Ile Leu Thr 2015 2020 2025 Ala Leu Gln Leu Gln Ile Gln Arg Ser Pro Tyr Trp Leu Ser His 2030 2035 2040 Leu Thr Gln Tyr Ala Asp Cys Glu Leu His Leu Ser Tyr Ile Arg 2045 2050 2055 Leu Gly Phe Pro Ser Leu Glu Lys Val Leu Tyr His Arg Tyr Asn 2060 2065 2070 Leu Val Asp Ser Lys Arg Gly Pro Leu Val Ser Ile Thr Gln His 2075 2080 2085 Leu Ala His Leu Arg Ala Glu Ile Arg Glu Leu Thr Asn Asp Tyr 2090 2095 2100 Asn Gln Gln Arg Gln Ser Arg Thr Gln Thr Tyr His Phe Ile Arg 2105 2110 2115 Thr Ala Lys Gly Arg Ile Thr Lys Leu Val Asn Asp Tyr Leu Lys 2120 2125 2130 Phe Phe Leu Ile Val Gln Ala Leu Lys His Asn Gly Thr Trp Gln 2135 2140 2145 Ala Glu Phe Lys Lys Leu Pro Glu Leu Ile Ser Val Cys Asn Arg 2150 2155 2160 Phe Tyr His Ile Arg Asp Cys Asn Cys Glu Glu Arg Phe Leu Val 2165 2170 2175 Gln Thr Leu Tyr Leu His Arg Met Gln Asp Ser Glu Val Lys Leu 2180 2185 2190 Ile Glu Arg Leu Thr Gly Leu Leu Ser Leu Phe Pro Asp Gly Leu 2195 2200 2205 Tyr Arg Phe Asp 2210 <210> 860 <400> 860 000 <210> 861 <400> 861 000 <210> 862 <400> 862 000 <210> 863 <400> 863 000 <210> 864 <400> 864 000 <210> 865 <400> 865 000 <210> 866 <400> 866 000 <210> 867 <400> 867 000 <210> 868 <400> 868 000 <210> 869 <400> 869 000 <210> 870 <400> 870 000 <210> 871 <400> 871 000 <210> 872 <400> 872 000 <210> 873 <400> 873 000 <210> 874 <400> 874 000 <210> 875 <400> 875 000 <210> 876 <400> 876 000 <210> 877 <400> 877 000 <210> 878 <400> 878 000 <210> 879 <400> 879 000 <210> 880 <400> 880 000 <210> 881 <400> 881 000 <210> 882 <400> 882 000 <210> 883 <400> 883 000 <210> 884 <400> 884 000 <210> 885 <400> 885 000 <210> 886 <400> 886 000 <210> 887 <400> 887 000 <210> 888 <400> 888 000 <210> 889 <400> 889 000 <210> 890 <400> 890 000 <210> 891 <400> 891 000 <210> 892 <400> 892 000 <210> 893 <400> 893 000 <210> 894 <400> 894 000 <210> 895 <400> 895 000 <210> 896 <400> 896 000 <210> 897 <400> 897 000 <210> 898 <400> 898 000 <210> 899 <400> 899 000 <210> 900 <400> 900 000 <210> 901 <211> 1338 <212> DNA <213> Clostridium botulinum <400> 901 atgagtaccc accttacaga aacctgggaa aaagcaataa atattataaa aggtgaactt 60 acagaagtaa gttttaatac atggattaaa agtattaacc ctatttctct tgaaaataat 120 tcattgaaac tagctgtacc aaatgatttt acaaaaggaa ttcttgaaag taggtacaaa 180 gatcttatag ttaatgcgct aaaattactt acctcaaaaa aatataatat agattttatt 240 gtaactactg aagaaaaaat agaaaaaaat cataataacg aaaaatctaa tatagttgta 300 aatgatgaaa tgtctactat gttaaatcct aaatatactt ttgattcgtt tgtaatagga 360 aatagtaata gattcgctca tgcagcatct ttagcagtag cagaatcacc tgctaaagca 420 tataatcctt tatttatata tggtggagtt ggtcttggta aaactcactt aatgcatgct 480 atcggtcatt atatattaca taacaatcct aaatctcaag tagtttatgt atcttctgag 540 aaatttacaa atgaattaat taattctata aaagatgata aaaatgtaga atttagaaat 600 aaatatagaa atatagatat tttattagtt gatgatattc aatttattgc tggaaaagaa 660 agaactcaag aggaattttt ccatactttt aatgcactgt atgaagctaa caaacaaata 720 attatatcaa gtgaccgccc cccaaaagaa atacctacct tagaagatag attaagatct 780 agatttgaat ggggacttat agctgatatt caagcacctg attttgaaac caggatggct 840 attttaaaga aaaaagctga tgtagaaaaa ttaaatattc ctaatgaagt aatggtatat 900 atagctacaa aaattaaatc aaatattcgt gaattagaag gagctttgat aagaatagta 960 gccttttcat cacttactaa taaagaaata agtgtagatt tagcttctga agcactgaaa 1020 gatataatct caagtaagca aacaaggcaa gtcactatag atattatcca agaagttgta 1080 gcaaactatt ataatctaaa aatagaagat ctaaaatcag ctagaagaac acgaaatatt 1140 gcttttcctc gccaaatagc tatgtacctt tctagaaaac taacggatat gtcattacct 1200 aaaattggtg aagaatttgg aggacgtgat catactacag ttatccatgc ctatgaaaaa 1260 atatctaata acttaaaaaa agatgaaagt cttcaaaatg caataaacga attaaataaa 1320 cgaattaatc aaaaataa 1338 <210> 902 <211> 1104 <212> DNA <213> Clostridium botulinum <400> 902 atgaaaataa cttgtcaaaa aaacatttta ctagaaggta tatctatagt tcaaaaagca 60 gtaactggaa aatcaacctt acctatatta tctggaatac ttattagagc taataaaaat 120 gaattggtct taactggttc tgatatggat cttagtattg aaactaaagt aaaagctaat 180 attttagaag agggaactat agttttggat gctagacttt ttggtgaaat aataaggaaa 240 ttaccgaatg atctaataga aataaataca ttagaagata attctataga aataatatgt 300 caaaattcta gatttaatct aatatatatg aatccagatg aatttcctaa tccacctatt 360 attaatgaaa atatgatttt ttcaataggt gaaaataaat taaaaaatat gattaaagga 420 actatatttg ctacagctca agatgaaaca agacctattc ttacaggtgt tttatttcaa 480 ataaaagata aaatgttgaa tttagtagct ttagatggtt acagattagc tttaagaagt 540 gaaattgttg ataatgataa taccataaat gccgttattc caggaaaaac attaaatgaa 600 gtttcaaaga tcttagaaga agatgatgaa aatgttaata ttacatttac tcctaatcat 660 attttattta gtataggaga aacaaaaata atttctagat tattggaagg agaatttatt 720 agctataaat ctataatacc tgaagaatat aatctaaaaa taatagctaa aagattagaa 780 cttttaaatt ccatagaaag agcctctctt atggctaaag aaggaaatac taatctagtt 840 aaatttgatt tttcaaatga taaaattgta ataacatcaa attctcaatt aggaatggtt 900 agagaagaat taaaggttgt attgcaagga gaagatttgc aaattgcatt taactcaaaa 960 tatcttttag atgtattaaa aactatggaa ggcgatgagg ttgtattgga attttcaagt 1020 agtgtaagtc cttgtattat aaaaaataca gaactaaata attgtactta tttagtttta 1080 ccagtaagat taaataataa ttaa 1104 <210> 903 <211> 207 <212> DNA <213> Clostridium botulinum <400> 903 atgattgaag taaaaattaa ttcagaagta ataaaattag actctttttt aaaatggtca 60 ggggcaacaa ctttaggttc agaggctaaa ttttttatac aaaacggaga agttaaagtt 120 aatggagaaa tagaaaaaag aagaggtaga aaacttaaaa tcggagactt gatagagttt 180 aataatgaaa catataaaat tatttaa 207 <210> 904 <211> 1095 <212> DNA <213> Clostridium botulinum <400> 904 atgtatataa aaaatgtgca cttaataaat tttagaaatt atgatgatat gtatttagaa 60 ttaagtccaa atacaaatat ttttgtaggt aataatgctc aagggaaaac taacatacta 120 gaaagtatat attattcaag tataggaaag tctcatagaa caaataaaga taaagatctt 180 ataaaatggg ataaaaataa tacatactta aggacatatg tatccagaga aagattagat 240 aaaactatag atataaatat atttaaaaat ggcaaaaaag ctataactgt aaataaaata 300 aaaataaaaa aaatatctga actaatgggg aacttaaatg ttgttatgtt ttctccagaa 360 gacttaagaa taattaagga ttctcctggg aatagaagga aatttctaga tatagaatta 420 tgtaaaataa acaatgttta ttatcatgat ttagtccaat ataataaaat tttatctgaa 480 agaaatacag ctttaaaaaa ttggaataac aaaattaatg atataattga tgtttatgat 540 gagcaacttt ctaaatatgg agcttttata attaaagaga gaaataagta tttggataaa 600 ttaaatatta ttggcaaaaa tatacataac aagataacca atgatttaga agatataaac 660 tttaggtatt taactaatat aaaagatttt gataatgcag aaaaagaatt attaatgctt 720 tttaagaaaa atcgaaaaaa agatcttgag agaaattcaa cttctattgg tcctcataga 780 gatgattttg aagtcagtat aaacaatata gatactagaa tttttggatc acaaggacaa 840 caaagaacag ctgtactaac tttaaagttt gcatcattgg aaataataaa gaatataata 900 ggggaatatc ctgtactttt attagatgat gtactatctg aattagattc aaatagacaa 960 aagtttgtat tgaattctat tgataaaata caaactataa taacttgtac tggtatagaa 1020 gaaatagaca aatacttaga taagaaacaa tctcaattat atttagttaa taatggtaag 1080 ataaaaagag tttaa 1095 <210> 905 <211> 264 <212> DNA <213> Clostridium botulinum <400> 905 atgtttcttc acttaggaga aaatgtagta gtaccgataa aagatgttat aggaatattc 60 gacatggaaa cttctatgta tagttcagat actatacaat ttttaagatt agctgaagag 120 gatggatttg ttgaaagaat aactaaagag aaaccaaaat cttttgttat agctgaagta 180 gataaaaaga gtaagatata tttgtctcct atatcttcag ctacactaac taaaagaaca 240 aaagttttgt ataatgagct ataa 264 <210> 906 <211> 1914 <212> DNA <213> Clostridium botulinum <400> 906 atgtcacaag aaaataaaca agtttatgat gaaagtcaaa ttcaagtgct agaaggttta 60 gaagctgtta gaaaaagacc aggaatgtat attggaagca ctagtttaag gggacttcat 120 catttggttt atgaaatagt tgataatagt atagatgaag cacttgctgg cttttgtaca 180 catatagaag tttttataca taaagataat tctataactg ttgtagatga tggacgtgga 240 atgccagttg gtatgcattc aaaggtaaaa aaacctgctg ttgaagtaat aatgactata 300 ttacatgcag gtggaaaatt tggtggtgga ggctacaagg tttctggtgg acttcatggt 360 gttggagctt ctgttgttaa tgccttatca gaacaatgtg aagtagaagt aagaagagaa 420 ggccatattt ggaaacaaaa attcgaaaga ggtataacaa aaactggatt agatatagtt 480 ggagatacgg aagatcatgg tacaaaaata tattttaaac cagatatcga aatatttgat 540 gaactagaat ttgaatatga tactttagct cacagactca gagaattagc ctttttaaac 600 aaaggtataa aaatttcatt aacagatgaa agatatgata aaaaagaaat gttccactat 660 gagggcggat tgagatcttt tgtactttat ttaaatagaa ataaggaaaa attacatcaa 720 caacctatat atgttgatga aaataaagat ggatgtatag ttgagattgc tatgcaatat 780 aacgatggtt atgcagaaaa tattttttcc tttgctaaca atatagatac catagaaggt 840 ggaactcatt tagctggatt taaatcagct ctaacaagag ttataaatga ctatgctagg 900 aaatttaatt acttaaagga tacagataaa aatttatcag gggatgatgt tagagaggga 960 ttaacagcag ttatttcagt aaaattaaca gatcctcaat ttgaaggtca aacaaagaca 1020 aaattaggaa atggtgaagt aagaggaatt gtagatacaa tagtaggtca gagtataggt 1080 tcttttttag aggaaaatcc taatgtaggt aaaataataa ttgaaaaagg cctatcagct 1140 tcaagagcta gagaggctgc aaaaagagca agagaactta ctagaagaaa atctatttta 1200 gaaagcacgt ctcttccagg aaaattatca gattgttctt caaaggatcc atcattatgt 1260 gaaatttatt tggtcgaagg agattccgca ggtggatctg caaaacaggg aagaaataga 1320 gaattccaag ctatattacc tttaaagggt aaaataatga atgtggaaaa gcaaagattg 1380 gataaaatat tagcttcaga tgaaatacgt gctatgataa ctgcatttgg agcaggtata 1440 ggaaaagaat ttgatattga taaaataaga tataatagaa taattataat gacagatgct 1500 gacgtagatg gagcccatat aagaacttta cttttaacat tcttttatag atacatgaaa 1560 gaattaatag aggaaggtca tgtttatata gctcaaccac cactttatag aatatataag 1620 gctaaaaaag aaatttatgt ttattcagat ccagaattgg atgctgcatt attagaattg 1680 ggtggaaaag ataccaatac taatattcaa agatacaaag gtcttggaga aatgaatcca 1740 gaacaacttt gggaaactac tatggaccca gaacatagaa ctttattaca ggtaacagta 1800 gaggacgcta tggaggcaga tgaaatattt actatactta tgggaacaaa agtagaacca 1860 agaagagact ttatagaaag taatgctgat aaagtagtta acttggatat ataa 1914 <210> 907 <211> 2466 <212> DNA <213> Clostridium botulinum <400> 907 atgctaaacg aaggaaagat tttgcctgta gatgtaagta aagaaatgaa gaaatgttat 60 atagactatg ccatgagtgt aatagctggc cgtgcattac cagatgtaag ggatgggtta 120 aagccagtac atagaagaat aatatattca atgcagggat taggattagc tccagaaaaa 180 ggttatagaa aatgtgcaag aattgtagga gatgtactgg gtaagtatca tcctcatgga 240 gatacagcag tttatgaagc tttagtaaga atggctcaga atttttcaat aagatataca 300 ttagtagatg gtcatggaaa ttttggttct gtagatggtg atggagcagc agcaatgaga 360 tatacagaag ctaagatgag taaaatatct atggaactta taaaagacat aaataaaaat 420 acagttgatt ttattcctaa ctttgatggt gaagaagaag aaccatctgt attaccatca 480 aggtttccta atcttttagt taatggttct tcaggtatag cagtaggtat ggctactaat 540 attccacctc ataatttaac agaggttata gatggaataa taatgctaat agaaaatgaa 600 gatgtaaata tacttgattt aatgactaaa ataaaaggac cagatttccc tacttctgga 660 ttaatcgtag gtacaagagg aataagggaa gcttatgaaa cgggtagggg aaaagttata 720 attagagcta aagctgagat tgaagaggaa aaagggaaaa ataagataat agttacagaa 780 ataccttatc aagttaataa agctagactt atagaaaata tggctaacct tgtaaaggat 840 aaaaaaataa atggaatttc agacttaaga gatgaatcag atagagatgg tatgagaatt 900 gttatagaat taaaaaggga tgcaaatcct aatatagttt taaaccaatt atataagcat 960 acaaaacttc aagatacctt tggaataatt atgttagctt tagttaataa ccaacctcaa 1020 attttaaatt taaaagaaat attagttaat tatgtggaat tccaaaagga agtaataaga 1080 agaagaacta gatttgactt agataaagca ttagcaaggg ctcatatatt agaaggttta 1140 agaatagcct tagatcatat tgatgaagtt ataaagctta taagagcatc taaaaataca 1200 gctgaagcta aagagggatt aatgaataac tttaatcttt cagaaaaaca agctcaagct 1260 atattagata tgaagttaca aaggcttaca ggtttagaaa gagaaaaaat agaagaagaa 1320 tataaagaac ttatggaaaa gataagttat tttagagaaa tattagataa agaagaatta 1380 gtactaagta taataaaaga agaattaata gagataaaaa ataaatatgg tgatgaaaga 1440 aaaacagaaa tagtaaaagg tgaacatgat atagacatag aggacttaat tgaagataaa 1500 aaggtgatag taactttaac tcatggtgga tacataaaaa gattagatat ggatacatac 1560 tcttcacaaa aaagaggagg aaagggtatt caagctacat ctacaaaaca ggatgatttt 1620 atagaaaata tgtttgtaac atctactcat agtactatat tattctttac taataggggt 1680 aaggtatata aacttaaagc ttatgaaata ccagaagcag gaagaacagc taaaggtaca 1740 aatatagtaa atcttatacc tatagaaaat aatgagaaaa tacaaacagt aataggttta 1800 aaagacatag atgacatgaa gcattttgta atgtgtacga gaaatggaat aattaaaaag 1860 acagagataa gtaaatattc ttccataaga aaaggtggat taaatgctat taatctgcga 1920 gaagatgatg aattaataga tgtaaaaatg accaaaggaa atgatgaaat aatagtagta 1980 acacaaaatg ggtactgtat aagatttaat gaagaagatg taagacctat gggaagagtt 2040 gcaacaggtg ttaaggctat aacactaaga aaagctgata aggctgtatc tatggatgta 2100 gtaatagaag atgaaacact attatctata agtgaaaatg gatttggtaa acgaacagac 2160 atagaagaat atcctatcca tagaaggggt ggaaaaggtg ttataactta taagataact 2220 gacaaaacag gacctatagt tggagcaagg tttgtaaaag aagatgatga acttatgctt 2280 gtaaatagtg gcgatgttgc aataagaata aatgtttcgg aaatatctaa aactagtaga 2340 aatgctatgg gtgtaaaact aatgagaact agtgaagaag aaaaaatagt agctatagct 2400 aaaataaaga gtgaagacat aatagaagaa gaaattttaa atgaagaaaa tctaaatgaa 2460 gaataa 2466 <210> 908 <211> 453 <212> DNA <213> Clostridium botulinum <400> 908 ttggaatatg aagacatagt atatataaat atgcacttag ataatgagga attaaagatt 60 tttaataaat tatctataag cgaacaaaag cattctataa aggtagctta tgatatagaa 120 aagttatatg aaaagggtaa atataatcta acaaaagatg agtttataaa ggtagcttta 180 ctacacgata taggaaaatt aaattataaa gttgatatta taaaaaaaag cataatagta 240 attatggata gaattacaaa ttccagaata aaaaaatttc aaaatattaa gtcagtttat 300 gttcattata atcatcctta tttaggttat tgtattttga aacaatataa taaatatagt 360 gaaaaaatgt tatatttaat taaaaaccat cataatgaaa atattataaa taaagagtta 420 agcttattaa tatatagtga taatttaaat taa 453 <210> 909 <211> 522 <212> DNA <213> Clostridium botulinum <400> 909 atgaattcaa tagaaagaag aaaaaatatt gaaaatatgt taatgaaaaa caataaacct 60 attaaaggta gtgaaatggg acaaaaatta ggtgtaacaa ggcaggttat agtaaaagat 120 atagctattt taagagcttc tggtaaaaat ataattgcta cgcctgaagg ttatttaata 180 cctaatgaaa ataaacaatt aataaggaaa attatagctg tatgccatga tagtaaagat 240 ataaaagacg aattagagat tataattaaa tttggaggaa tagtagaaga tgttgtagta 300 gaacatccta tatatggaga aataaaagcc atgttgatga taaaatctat gtatgacata 360 gataatttta taaaaaatat acaaaacaat aaggctgaac cgttattaat acttactggt 420 ggaattcatt tgcatacaat atcttcagat aatgaagata taatgaataa aataatagaa 480 caattaaacc aaaaaaatta tttagtagat gaggaagtat aa 522 <210> 910 <211> 1164 <212> DNA <213> Clostridium botulinum <400> 910 atggataaag tagccctttt aaaatgtgat gaatatgatt tagaaaaggt agagaaaact 60 ataagaaatg gatttgaact tttaggagga aactcttttt tgaataaact tataccttat 120 aatagtaaag ttcttttaaa acctaacatg cttagtattg aaaatgaagg ttctcctgtg 180 gtaactaata gtgtagtttt tgaagcagta ataagaatat taggagatta ttctaataac 240 atatcctttg gagattctcc tggatttgga gattctaaaa aggcagctga aaaatctgga 300 ttacttaata tagcaaagaa atataatata gaatttaaag attttaaaga atctattaat 360 gtaagttgtg ataattctat tttatgcaga tcctggactg tagcgaaggc agcttatgaa 420 acagatgtac taataacatt acctaaatta aagacacatg ctatggctta ctttacaggt 480 gcagttaaga atcagtttgg atgtatacca ggaactttaa aagctacttg gcatacaaga 540 atgcctaatg caaataattt ttgtaaaatg ttattagatc taaatacatt gttagaaact 600 gattttgcta tactagatgg cattatagct atggaaggaa atggtcctaa aaatggaact 660 ccttataatc ttaatacaat tataatgggg gatagcctta cagcggtaga ttccgttgct 720 gttaaaataa taggatatga caatccatta gatatacctg tattaaaaga agcttatgat 780 agcaattggg gaagtgtttt tttaaaggac atagatatat taggtgaaaa aatagatagc 840 atggtcgtag ataattttaa actttgtaga gagggtgggg atttttattt tataaatcct 900 aaagttacaa attttttaaa ggatattatt gcaccagatc ctactttaat aaaagaaaag 960 tgtataggat gcaatagatg tgctgaagta tgtcctgaaa aaccatatgt tatagatatg 1020 ataaaaaaag gggataaaaa aataccagtt tggaatatga aaaaatgtat aagatgtttt 1080 tgttgtcagg aactttgtcc caaaggagct atagaaacta aatattcttt tattggaaga 1140 tttttaaata gagatggcag gtga 1164 <210> 911 <211> 2682 <212> DNA <213> Clostridium botulinum <400> 911 atgaaaaata aaaaagcatt gtttatacca ttattcataa taattttatt tatagcattt 60 tttaataaaa taataaattt tattattaat ataaaatggt ttaaagaagt aaactattta 120 gcggtatatt ttactaaaat gagagctata attattttaa tgattcctat atttataata 180 ttttttatat ctatatggat gtattataaa agccttatta taaacaagaa taaaagtgta 240 gtagatatag gattaaataa aaacaattat gggaaaaaat tattctttat ttttaacttt 300 atagtatcta tatttttagc ttatatattt tcaagcagtt attggtatag aatattacaa 360 tttaataatt ctgtagattt taatgtgaaa gatcctatct tttttaaaga tgtttctttt 420 tatatattta aattgccact ttttgaatct ttatataaag ttataatttc tttattatta 480 tttttagtta taacaacatt tatagcttat tttattttag aggctaaata taaaattcaa 540 agtagaaagg atataaattt aaaaaatata aatcatggca taaaatcctt tgcgggaaaa 600 caattagcta ttgtatctgg tcttataatt ctatttatat cctttggaca tttaataaaa 660 atatggaatt tagtttatag ctctaatgga gtatcttttg gtgccagcta tactgatgtt 720 cacgctactt tattattcta taaaataata gtagtaatta cactaatttc atctatagta 780 acattattaa gtatagtaaa aggtaaattt aagccagtaa gcatatgtat aggtataact 840 atatttttga tagtatcaca aaatatagca tcttttttag tacaaaactt tatagtcaaa 900 tctaatgaaa aaactttaga gcaaccatat ataaaaaata atatagattt aacaagaaaa 960 gcttttgcat tagatgatat tgaaataaga gattttgata ttaaaaatga tttacaaaag 1020 caagatattg cagacaacaa agcaagtata gataacgtaa gaataaattc ttttaaacct 1080 acattagaat tttataatca agttcaaata ataagatatt actatacttt taatgacata 1140 gatatagata ggtataatat aaatggaaaa tacaatcaag tattcctagc tgcaagagaa 1200 atagatacag atgcattaaa tccaaataca tggcaaaata gacacttaat atatacacat 1260 ggttttggag cagttatgaa taaagtaaat tctgtaacaa gtgaaggaca acctgacttt 1320 gttataaaag atataccacc ttataataaa acaaatataa aattgactaa tcctaggata 1380 tattttggag aaaaaactaa tgactatgtt atagtaaaca ctaagataaa tgaatttgat 1440 tatcctagag aagattctaa taaaactaat aaatataatg gacatgcagg tataaaaatg 1500 agctttatta atagattatt atttgctata aataaaaaag atattaattt tcttttatca 1560 aaggatataa aaaaagatag taaaataata ataaatagaa atattgtaga gagggcaaaa 1620 aaaatagcac cctttttaac ttatgatagt gatccttata tggttatata taatggcaaa 1680 atatattgga taatagatgc ttatactact acaaatagat atccttattc agagccttac 1740 gatagtataa attatataag gaattcagct aaagtagtaa tagattctgt agatggagat 1800 accaattttt atattacaga taaaaaggat cctatagtta ataattatgc taaaatattt 1860 aagggattat ttaaagaaga aaaagatgcg cctaaagaaa taagagaaca ttttagatat 1920 ccaaaagatt tatttagtat tcaaagcaaa gtattaggaa aatatcatgt aaaagatcct 1980 ggtgtgtttt ataatggtga agatctatgg gaagtgtcta aggatcaaaa acatgttgaa 2040 ggagaaacaa atacaaatga tgctccttat ataattatga aattaccaga ccaaaataaa 2100 gaagaaatgg tacttttgaa ttattttaat gtaatgaaaa aggataatat gatagcttta 2160 tttggagcaa gaatggatgg agagcaatat ggtaaaaaaa tattatataa acttccatca 2220 gacaaaacag tatatagtcc atatttattt aagcaaaaaa taaatcaaga tactaatata 2280 tctaaggaat tatcattatg gaatagagaa ggttcaaagg tgcaatatgg agacactata 2340 atattaccta taaaaaattc tcttctttat atagaaccac tatatttgcg ggctagtggg 2400 aaaaatagta taccagaaat gaaaagagta atattatcct ataatgataa attagtttta 2460 tcatctagta ttcaagaagg tataaaagaa atatttaatt ctaaagataa taaaatcaat 2520 gataaaaatg aaaaagatag tacaaagact atagatgatt caaaattgaa aaaagctcaa 2580 gaatattata ataaagccat agaagctcaa aaaaatggag actggactaa atatggagaa 2640 aatataaatg aattaggtaa tatattaaat agtataaaat aa 2682 <210> 912 <211> 777 <212> DNA <213> Clostridium botulinum <400> 912 ttgaaattta aaaaaagcgt atatattgtt gtatttactt taatattatt atttatacct 60 tgctttatac atacaaaaaa agatgtaagc acaactaata atttagacaa taaaacaaaa 120 gaaataaata aaagtgaagt ggatagaaat gaaatgtcag tattttcatc taatacttgt 180 tttaaaaaaa cttattatat aaataaaaat aaagtaccag tatataaaaa ttttgattgt 240 aatagcgaag tattatatta tttatatgaa gatgatataa ttgttagcta taaggagcaa 300 aatggatata tattttgtga agaaggaaat ttaggaagaa aaggatggat taaaaaaaat 360 aaagaaaatc ttaaaggaat tttacataaa aatactgaat ataaagtaga tgtggactta 420 atagatcaaa agataagggt atacaaaaat gataaaataa taaaaaatat caaatgctca 480 acaggagtta taggaaaaca agatacagaa actccattag gtatttttta tattacaaat 540 aagggaaaat atttttatag taacaaatat aatcaaggtg gtagatatta tattaaattt 600 tttgcaaatt atttaattca ttctatacct gtagacaaga atggtaatat aatagaagaa 660 gaaaaagaca aattaggatt tcctacatct catggatgta taagagtacc tatggaggat 720 tcaaagtggt tatatagaaa tatacctaat aaatctttga taattataca ttattaa 777 <210> 913 <211> 1398 <212> DNA <213> Clostridium botulinum <400> 913 atggattatg atgtgatgat attaggtggg ggaataatcg gatgtgcatt agcttatgaa 60 ttatcaaaat atagtttaaa tatagcttta atagaaaagg attatgatat agcagatgat 120 gtagcattta taaattcatc tgtagtgtat gatggagtgg aatgtgaaga tgatttagca 180 gctaatttgg agttaaatgg taataaatta atggaagata tagctaaaaa atttaaaatt 240 ccatttaaaa aaacagggtc attaataata gctcaaaatg ataatgaagt atacaatata 300 gaaaatatgt ataaaaaagc tttaaaaaga ggaataaaaa atatagaagt attaactaag 360 gatgaggtag aaaaaataga accaaattta aatatagatt ttaaaaaggc attatattct 420 agcaatacag catctatagc accttttgat ctagctatat cttatggaga aattgccttt 480 gataatgggg taaattttaa attagaagaa caggttttag aaatacaaaa attatctaaa 540 ggatataaaa ttataactaa taaaaacaaa tttaactgta atatagttat aaatacaacc 600 cctgatgaaa attttggaat atattcagac accaaaagaa attataaaaa aagtaattta 660 aattatttat taatagaaaa aaattcaatt aaggaattta ataatatagt ggtaaagcta 720 ggtaataatg aaaatataaa aaaaatttta gctgtaccaa ctgttcaagg tagtatggtt 780 ttagctgtag atacttatga gaagataaat tataaaaata cattagatgt gtctgctttg 840 attttagatg aaataaatga gatggatata aataattttt atcaatttcc atattatgat 900 gatagcatag taatagatga tagtttaata gataagggat atataaaagt tatagtcaat 960 cattatggac aagtaacgat gacaccttat atagccaaga ctgttacaga aactatagtt 1020 agtaatataa aatgtgtact aaagaaagag tttatagata aaagaaggga ttattataaa 1080 tttaatgagt tatctttaga agaaagaaat aaaattataa atatggacaa aaggtatgga 1140 aaaataatat gtgcctgcaa taaagtaaca gaaggagaaa ttatagatgc aataagaagg 1200 cctttaggtg cacgaacatt agagggaata aaaagaagga caggagcagc ttttggtagt 1260 tgtcagggag cctattgttt aaataaagtt gtatcgatat tagctagaga aacaaataaa 1320 tttatgacag atatagttaa ggactcaaaa aattctaaaa ttataccctg tagaattaaa 1380 gaatttgata caatttaa 1398 <210> 914 <211> 354 <212> DNA <213> Clostridium botulinum <400> 914 gtgcttagag aatttatttg taatggatgc aataaaaaat gtataatatc tctttataat 60 agtaattata atactataaa aggtaaccaa tgtaacttag gaatagatta tgctaaaaat 120 tatgttaata atactaaaga tatttttact acgttagtta ggataaaagg atctaaatat 180 aatgtattac cagtaaaaag cagtgaacct atagaaaaat ctttatggat agagtgttct 240 aaagctttaa gcagattata tgtaggttat cctatagaaa ttggagatgt aatttgtaaa 300 aatattttga acacaggagt agatataata gctattaaaa atattaatga ataa 354 <210> 915 <211> 1281 <212> DNA <213> Clostridium botulinum <400> 915 atgttagatt taaaaagaat aagaaataat tcaaatgaaa taaaagaagc attaaacaat 60 agaggagaaa agtttgatgt aactgtaatt gatgaagttt taaaattaga tgaagaaaga 120 agaaatattt tagttaaagt tgaggtttta aaaagtaaga gaaatcaagt ttcttctgaa 180 gttcctaaat taaaaaaaga aggaaaagat gtatctaata tagtagctga aatgaagaat 240 ttatcagaag agataaaagg atttgatgct actttagcta aaatagatga aaaaatacaa 300 tatataatgc ttagaatacc taatatacca aacccacaag ttccagatgg tgaaacagat 360 gaggataata tagaaataag aaattggctg gaaccaacaa aatttgattt tgaacctaaa 420 gcacattggg atataggaac aaatttaaat attcttgatt ttgaaagagc tggaaaagta 480 acaggatcaa gatttacttt ttataaagga ttaggggcta gattagaaag agcagtaata 540 tcttattttt tagatactca tacagaaaaa catggttata ctgaaatatt accaccttat 600 atggtaaata gaacaagtat gataggaaca ggacaattac ctaaatttga agaagacgct 660 tttaaaatct cagaggatga ttacttctta ataccaactg cagaggttcc tgtaactaat 720 ttatatagag atgaaatctt aaaaggtgat gaattaccat taaaacatgt agcttatagt 780 gcttgtttta gatcagaagc aggttcagca ggtagagata caagaggtct tgttagacaa 840 catcaattta ataaagtaga gcttgttaaa tttacaaaac cagaacaatc ctatgaagaa 900 ttggaaaaat taactaatga tgctgaaaca gtattaaaag agttgggtat tccatataga 960 gttgtaagaa tatgcaaagg tgatttagga tttacagctg cattaaaata tgatttagaa 1020 gtttggatgc caagttacaa tagatatgtt gaaatatcaa gctgtagtaa ctttgaagac 1080 ttccaagcaa gacgtgctaa tataagatat aaagaagatg caaaagcaaa accacaatat 1140 gttcatacat taaatggatc aggagttgct attggaagaa ctgttgcagc tatacttgaa 1200 aactatcaaa gtgaagatgg atcagttaca ataccagaag tgttaagacc ttatatggga 1260 ggaagagaag taataaaata a 1281 <210> 916 <211> 888 <212> DNA <213> Clostridium botulinum <400> 916 atgataaaat attacaatag aaaaactaac gattatgata tagaaaaagt tgcaggtgaa 60 aaatatttaa attggactta ttcatcacct attggtatga atcttttaga agtttttata 120 aaaaagaagt ttttttcaaa aatatatgga ttttattgtg atagaaagtt aagtagtaaa 180 aaaataaata aatttattaa tgattttgaa attgatatgt ctttaagtga gaatcaatca 240 agtaaattta aatgctttaa tgattttttt actagaaaat taaaaaaaga agctagacct 300 ataaaagctg ataaaaatat tttaatatcc ccaggtgatg gtaaaatact tgcatataaa 360 aatttaaatc taaattcagt aactgaagta aaaggaatca attatagttt ttatgaatta 420 ataaataatg attcattagc aaaagaatat gacaatggaa cttgcttagt tttaagatta 480 tgtcccacag actatcatag atttcatttt atagacaatg gtacctgtga aaatactata 540 aagctagatg gtttttacta ttcagtaaat ccaattgcat tatctaaaat tcctagttta 600 ttttgcaaaa acaaaagaga gtatgctatt tttcatagtg aaaactttgg tgatgtaata 660 tttatggaag ttggagcaac ctgtgtaggt tctataatac agacttataa acctaatact 720 aaaattttaa aaggtgatga aaaaggttat tttaaatttg gaggatctac agtaatttta 780 ttcttcaaaa aaaatactat aaaaattgat aatgatatat taaatcaaag taaattagga 840 tatgaaacat ctgttataat gggagaacct attgggagca aaaaataa 888 <210> 917 <211> 1599 <212> DNA <213> Clostridium botulinum <400> 917 atgtacttaa attctgttca aagatttaaa gaaataataa aaatattagc attctatggt 60 tttggtcata tagtagattc aaaatttaac gaagataaag ctcctgaaaa tttaagaaaa 120 gcttttgagg aattaggacc tacctttata aaaataggcc aaatattaag cacaagacct 180 gatatattat cagcgcccta tataaaagaa ttatcaaaac ttcaagacag tgtacctgaa 240 gataatttta gtgatataaa caaaatattt tttgaagaat ttaatatatc catagaagat 300 gctttcttaa attttaatag aaaaccttta gcttctgctt ctatatccca agtttattct 360 gctaaacttc ataataatga ggaagttata gtaaaaattc aaaggccaga aataaaagaa 420 aaaatgaaca tggatttagc tatattaaga aaaatattta ctcttggaaa aattaaaacc 480 tttgatacat taatagatcc taaagaagct atagatgagc taataaatgc aactaattta 540 gaattagatt ttaataatga aaaagaaaat attaaaaaat ttaaatactt taataaaaat 600 ctaaaatgta tttatgttcc taatactata gataaatact gtagtagcaa gataattact 660 atggaaaaaa ttcatggttt taagataacc gatacaaaat ctttagataa attaaattat 720 gataaaaaag atgtagctca taaattagct atatctatat taaaacaaat ttttgaagat 780 ggattttttc atggtgatcc tcatcctgga aatattttta tatatgaagg taaaatatgt 840 tatatagatt ttggaataat gggtactcta tcgtctgatc taaaaaatta tttaaataag 900 gctatggtag ctgtggcttt taaagatgta gataaactta tatctgtact tttgtctatt 960 ggtataaaaa aaggttatat aaataaaaat aatttatttg aagatataaa ttatttattt 1020 gatatttatc tttctactcc tttaaagaat ataaaaatgt ccaccatgct tcaagaagtc 1080 tttgaatgtg ctaatcgtaa taatattagt ttacctaaag aattgactat gctcataaga 1140 agcttaatta taatagaagg tatcttagaa aaaatagatc ctaatattca aatattagat 1200 attgcgattc cctatgtaga aaataataat aaagttaatt tttttaaaaa tattgatttg 1260 gacgaattaa tattaaatag ttataaaact gcagaagatt tatcaaaaat tcctactaaa 1320 actgttcaac tattaaatag tattttaaat ggtagatcaa aaattcaact taatgtcaat 1380 aatctagata gatcaattaa tgaattaaac aaaatgataa acagaatagt ttttgcttta 1440 ataatatcct caatgataat tggtttctct tttatactta attctaacat tggtcctaaa 1500 ttttatgata tatctataat aggaatatta ggatacctca ttgcagcctt tatgggtttt 1560 tggcttctta tatctataat aaaatctggt aaattataa 1599 <210> 918 <211> 321 <212> DNA <213> Clostridium botulinum <400> 918 gtgataaacg aatttaaaaa tatactttta gctggtattg gttcagcggc ttatacctat 60 gaaaaagcct ctaatttagt agacgaaatg gttcaaaagg gtaaaattac tgtaaatgaa 120 ggtaaggaat tatctgaaga actaaaaaga actattgatg aaaataaaaa gtctaaaaat 180 tcatctgaag aaaaacagct tacaagagaa gatataattt ctatatttaa tgaattaaat 240 tttgttaata aaaatgattt aaatgatata aacaataaaa taaaatcact tgaagataaa 300 atttctcaat tagaaaaata a 321 <210> 919 <211> 1551 <212> DNA <213> Clostridium botulinum <400> 919 atgaaattag aaataataac agaagatcgt ttaggcatgg tgctagatat tttaaatgtg 60 ttatacaatg agagtatgga tataaaatct ctagaggtat ttcctaaaaa aatatatata 120 aaaataaata aaaagatttc ttacaacaaa aacatgataa tcaagaaaat aaaaaatata 180 aagggagtag taagggtaaa aaagatagat atactacctt atgaaaagga tgaaaaaaaa 240 ttgtttacta taattgattc tttggaggag ggagtaattt ttgtcaatga aaaatgtcaa 300 gtagaggttt ttaataaata ctgtgaaaac ttatttaata ctttaaaaga aaatgcaatt 360 agaaagcata taaaagaaat tttcggacaa aatcaactca tattagatgc tttaaaaatg 420 ggaaaagatt atgataattt acaagtcttc attaataata aagatagaaa gggaatgtat 480 gtatctacag caagagctat taaagatgat aagaataaaa caataggatt tgttatatta 540 ataaaagatt taaaagaaac tattgaaata gtaaattcta ttaaatataa ggaagatgaa 600 gcatttaagg ggataatagg aaaaagtatc tgtattgata atttaaaaga aatatgtaaa 660 tcagttgcta aaacaaattc aaccgtatta atttgtggag aatctggaac aggaaaagaa 720 ctttttgcaa aagctattta taaattaagc ttgagaaata ataaaaactt tgttactgta 780 aattgtgctg gtttacagga taatttaata gaaagtgaac ttttcggtta tgaagcagga 840 agttttacag gagctaaatc taatggtaaa gaaggttttt ttaagttagc ggataaaggt 900 actatatttt tagatgaaat tggagaactt cctcttaata ttcaatgtaa atttttaaga 960 gtattacaag aaggaactat aagaaaaata ggaagtacaa aggaagaaaa aatagatgtg 1020 agaataattg ctgctactaa taaaaattta gaagaaatgg tttcaaacgg aaaatttaga 1080 gaagacttat actatagatt aaatgtagta cctatagaaa tacctccact aagagaaaga 1140 aaagaagata tacaattatt agtagataat tttgtaaaag ctttaaataa aagtttaaat 1200 aaaaatatta ggtatataga taaaaaattt ataaataaat tattaaaata taatttccca 1260 ggtaatatta gggaacttca aaatataatt gaaagaacta tgaatttgtg ttcggacaat 1320 atattaagtg ataaaaatct cagtataaat actaatatta cattaaataa tgataaaaat 1380 aatgatagtg gtgcattact tttacaagat atagtggaga aagcagaaaa atgtgctata 1440 cagaaggtaa tgaatgaata taaaagttta agaaaagtag gcaaagtatt aggagtttct 1500 catactactg taatgaataa aataaaaaaa tatggaattg tatgtaaata a 1551 <210> 920 <211> 1203 <212> DNA <213> Clostridium botulinum <400> 920 atggaaaata taaagaaaat gggatttgcg acaaaggcta tacatggagg gctcattgga 60 gataaacagt ttggttcatt ggcaactcca atataccaaa catctacatt catatttgat 120 tcagcagagc aagggggtag gcgatttgca ggagaagaaa gtggatatat atattcaaga 180 ttaggaaatc ctacatctac agaagtagag aacaagttag ctttgttgga atgtggagag 240 gcagctgttg tagctgcctc aggtatgggt gctatagctg catctttgtg gtcagcttta 300 aaatcaggag atcatgtagt tgcatcagat actttatatg gatgcacatt tgcactatta 360 aatcatggat taacaagata tggagtagag gtcacatttg tagacgtatc taatttagat 420 gaagtaagaa atgcattgaa agcaaatact aaagtagttt atttagaaac tccagctaat 480 ccaacattaa aggttactga tattaaacaa atatcaaata tggttcatga aaataataaa 540 gaatgtcttg tatttgttga taatacattt tgtacaccat acatacaaag gccattacaa 600 ttaggcgctg atgtagttgt acattctgct actaaatatt taaatgggca tggagatgtt 660 atagctggat ttgcagtagg aaaagaggaa tttataaatc aagttaaatt atttggtata 720 aaagacatga caggatcagt tataggacct tttgaggcat ttttaataat aagaggaatg 780 aaaacattac aattaaggat ggaaaaacat tgtaagaatg ctatggaagt atcaaagttt 840 ttagagtccc atcctgcagt taaaaaagtt tattatccag gattagaaag ttttgaatac 900 tatgagcttg ctaaaaagca aatgagtttg cctggtgcta tgatttcttt tgaactaaaa 960 ggtggagtag aagaaggtaa agtagttatg aataatgtta aattagctac tcttgcagta 1020 agtcttgggg atgctgaaac attaattcaa catccagcat caatgacaca ttcaccttat 1080 acagcagaag aaagaaaaga agctggtata agtgatgggc tagtaagact atccgtagga 1140 cttgaagatg tgggtgatat aattagtgat ttaaaacaag cattagattt aatagttaag 1200 taa 1203 <210> 921 <211> 438 <212> DNA <213> Clostridium botulinum <400> 921 atgaatgatt atatagaata tgcaataatt gaagcaaaaa aagcattagc aataggagaa 60 gtacctgttg gagctattat agttaaagaa aataaaatta tagcaaaaag tcataattta 120 aaagagtcat tgaaggatcc aacagctcat gcagagatat tagctataaa agaagcttgt 180 aatacaatac ataattggag attaaaagga tgtaagatgt atgtaacatt agaaccatgt 240 gctatgtgtg ctagtgcaat aattcaatct agaataagtg aattgcatat aggaaccttt 300 gatccagtgg gaggggcttg tgggtcagta gtaaatataa caaataatag ttatttaaaa 360 aataatttaa atattaaatg gttatatgat gatgaatgta gtagaataat aacaaatttt 420 tttaaaaata ttagataa 438 <210> 922 <211> 1626 <212> DNA <213> Clostridium botulinum <400> 922 gtgggttata ccgcattata tagagagtgg agaccaagaa catttaaaga ggtagttgga 60 caaaaacata taacagtaac acttaaaaat caagttatag aaaaaagaat agctcatgct 120 tatctttttt gtggaacaag aggtacaggt aagacatcta cagcaaaaat actatcaaaa 180 gcagtaaatt gtttaaatcc caaggatggt gaaccttgta acgaatgtga aatttgtaat 240 aaaataaata gtggaacttt aatggatgta atagaaatgg atgctgcttc taaaaggaaa 300 ttagaggaca taaaggaagt tatagaaaat gtaaaatatc caccacagga agggaaaaat 360 aaggtttata taatggatga ggttcatatg ttaactcaag aggcagtaaa tgcttttttg 420 aaaactttag aagaacctcc gagcaatgta atattcatat tagcaactac agatcctcaa 480 aaattaccta taactatatt atctagatgt caacgatttg attttagaag aataagaaat 540 gaggaaatat ttgaaaggct tagagcaata gtgtcagaac agggcatata tgcagatgat 600 aaaagtctta atcttatagc tagaatgtca gatggggcca tgagagatgc tcttagtata 660 ttagatcaag ttatatctac tggagatggg aaggtagagt atgatcaagt cttagatatg 720 ctaggattag ttactaatga aaatcttcta agaattacaa acagcataat agaaaaagat 780 gtagagaaat ctatgaggat aatagaagat atagtgctaa gtggaaaaga catatataat 840 tttataaaag atatgataac tcatcttaga aatatactta tggttaaagt aagcaaaaat 900 ccaaatgaaa tattagatat gtccagtgaa aatattgatt tagtaaaaga gcaatctgaa 960 aaaataagaa tagaagaaat aatgagggat ataaaaatac ttcaagaagc agaacaacaa 1020 tccaaatggg taaagcaaaa cagaatatat ttagaattgg ctgtacttaa aatgtgtaaa 1080 atagaatatg atacatctaa agaagttata ctttctaggc ttaataaaat agaagagctt 1140 ataaaatcag gtaatataaa attagcaata aatgaagaaa agaaaaaaat agagccaaag 1200 gaatttaatc taaaaagaga aaaagaaagt atacaacata gtaaaataga aaaaaattca 1260 ttagaagatt ataataagga ctctaaatta actgtagaaa ctgtcaaaaa aatgtggcgc 1320 gatatattag aagcttttaa agcaagaaga cttatggtat tatatgcagc tttagttact 1380 gcaaacataa cagattgcaa agaaggtatt attactttaa attataataa gcagtattct 1440 tttaataaaa agagattaga aaagccagaa aataataaag tagttcagga aattttttct 1500 gaggtactaa aagagaaaat tagaataata tatattgtag aggaaaaggc taaagaagaa 1560 aatttaccag aagagatttt aaaaaatact tttggagaga atatactaga aataattgat 1620 gaatag 1626 <210> 923 <211> 342 <212> DNA <213> Clostridium botulinum <400> 923 atggcaagag gtggattccc taacatgggt ggagcaaata tgaataactt aatgaaacag 60 gctcaaaagc ttcaacaaga tatggaaaaa atgcagggag aaatggaaaa gaaagaattt 120 tcagctacag ttggaggagg agcagttaca gctgttgcta atgggaaaaa acaaatagta 180 gatataaaaa ttgaaccaga agttgtagat gaagatgaca tagaaatgct tgaagatcta 240 ataatgagtg catgcaacga agctttaaag aaagctgaag aagacacttc aagcgaagtg 300 aaaagattaa ctggaggaat gaacttacca ggaatgttct aa 342 <210> 924 <211> 597 <212> DNA <213> Clostridium botulinum <400> 924 ttggattttt atcctatagc tatagaaaaa ttaatagaag agttcgctaa attaccgggt 60 ataggttata aaacagctca aagacttact ctatatgtac taaatttacc taaagaagag 120 gtaaaggaat tctcagaggc cttagtaaaa gctagaggta caattaaata ttgttctgta 180 tgtggtaatt ttacagataa agatccttgt gctatatgta gtaatcctaa taggaataaa 240 tctattattt gtgtaataga acaacctaaa gatataatgt ctatggaaaa aataagagaa 300 tataatggag tatatcatgt attacatggg aatatatctc ctatggcagg aagaggtcct 360 gaagacataa aattaaaaga attaataaga agaatagatg gtagtgtaaa tgaagttata 420 gttgctacta atcctaatgt agaaggagaa gcaacagcta tgtatatatc taaaatatta 480 aaacctctag gagttaaagt tacaagaatt gcccacggag taccagtagg tggggattta 540 gaatatgcag atgaggttac tttagctaaa gctttagaag gaagaataga attataa 597 <210> 925 <211> 264 <212> DNA <213> Clostridium botulinum <400> 925 atgggaggtt tttttataat gaaaaaatta aatgatggaa aaaatgaaaa aaagttatta 60 ctagaatcta tagacagcgt aatatcagag ataaacaaca taagaagatt gtttgaaaac 120 gcaagtgatc ctaaattaat tgattatgct atatacatgg aagaggcact aaaagctaaa 180 tatatttatc tcttaaaaga agctaaagaa gaaggtatta aggtagaata ttgtgataca 240 ataaaagaag ttgaagtagg ataa 264 <210> 926 <211> 261 <212> DNA <213> Clostridium botulinum <400> 926 atgggaatag aatatattgc ttattttatt ttagctatat ttttgttgtt tgtagtagta 60 aaaatatttt catggccatt aaaaatcctc ttaagtttaa taggaaatgc cattttagga 120 acagtattgt tatttatttt aaatgtgatt ggaggagctt ttaattttta cataggtata 180 aatatatgga cagcattaat agcaggattc tttggaatac caggagttat atttcttata 240 atatttaaat tatttttata g 261 <210> 927 <211> 693 <212> DNA <213> Clostridium botulinum <400> 927 ttgaaaataa ctaaaaatat actaaaagct gaatttataa aaaggccaaa tagatttcag 60 gcttatgtaa aaataaatga gaaaatagaa atggttcatg ttcctaatac aggaagatgc 120 aaagagatat tgattccagg ttctacggtc atattgagag aagaaaataa tgaaaataga 180 aaaactcgat atgatttaat agctggatat aagggagata tgcttataag tatagattcc 240 caaataccta ataaggtagt ctatgaagca ttaatgaact ttaaaataga aattcttaaa 300 gagtatacta atattaaaag ggaaaaaacc tttggtaaaa gtagatttga ttttagatta 360 gaaaaagaaa atggagaagt atattattta gaagtaaaag gagtaactct tgaaaatgat 420 ggtttaacta tgtttccaga tgctcctaca gaaagaggaa caaaacatat attagaactt 480 atagatgtga aaaataaagg tatgggtgca ggtgtgctat ttttaataca attaaatggt 540 gtaaaaaaat ttacaccaaa ctataaaatg gataagaatt ttggagaagc tttaaggtta 600 gcaaaagaaa agggtgtaga tattttagcc tatgattgtt tagttgagga gagtagtatt 660 tctttaaata atcctgtatc aatagaaatc tag 693 <210> 928 <211> 489 <212> DNA <213> Clostridium botulinum <400> 928 atgaaattta aatactgtcc actatgtggg gaaaaattaa ttgaaaaata cagctgggat 60 gaagggggag ttccatactg taaaagacat aatataatgt attttgatac ccctaaacct 120 tgtattgtag taggtgtact taaagaagat catgttttat tattaaagca aagctatata 180 ttcaaaaatt ctaaagttct tttatcagga tatgtatcta gtggagagac cgttgaagaa 240 gctgttcaca gagaagttaa agaagaagct ggtattaata taagagattt aaaatatcta 300 ggaagtgatt atctagagag taaagatata gtcatgatta catttatggc aacatataga 360 gatggaattt taaacaaatc agaagaagta gaatggattg attggatacc tataaaagaa 420 gccatagatc atatggaaga agatgaaata gggaaaaaaa taataaaaaa aataatgaag 480 aattgttaa 489 <210> 929 <211> 723 <212> DNA <213> Clostridium botulinum <400> 929 atgagtaaca aaattgaaaa aacacctaaa cgtgtaccag aaataaaagg tgtgttaaga 60 agtcatatga tagaagttcc ttcaattatt agagaagcta gtggcattaa agtttttggg 120 aaaagaataa aatcctttgt atacagcaca gatgttgctg ttattaaaaa taccaatgca 180 gatgctgtaa tagcagtata tccttttact cctcagccta taataactca atctttagtt 240 ttagctgcag atattcctgt attttgtggt gtaggaggag gattaactac tggaaaacga 300 gttgttaatt tagctttaga tgctgaattt aaaggtgcta tgggagttgt tataaataat 360 ccaactccta atgatgtatt acagcaaata aaagatacta tagatattcc aattgtagta 420 acggttgtat cggagtatga agacatagaa gctagaatta attcaggagc cactatactg 480 aatatatcag gagctaaaaa gacagcgtac atagttagag aaataagaaa acgatatcct 540 gatttcccta taatagctac aggaggtcca aatgaagcca gtataaaaga aaccatagaa 600 gcaggtgcaa atgctataac atatacacca cctccagcat cagacatatt tagtgaagtt 660 atggataaat atagagttaa ctttaaaaag gaacatgata gagaagaaaa tgaacaatcc 720 taa 723 <210> 930 <211> 789 <212> DNA <213> Clostridium botulinum <400> 930 atgaatggca tactatttta ctttagtgga acaggtaata ccaaatgggt agcagataga 60 ataggagata aattgtgtaa attagataat actatacata aagttaatat agagaatctt 120 gatgatgatg tattaattaa aattcataat tatgatttta taataatagg aacacctatt 180 tatgctgaga tgggtccaaa attaatacag gattttgtta ataatattcc taaagtaaaa 240 gaaaaaatta aatgtatact atattcaact caaggaggca attcaggttg tgaaacagag 300 agtatgcata aaatcttatg taataaaggt tatgatgtag ttataaaggt taatataaaa 360 atgataaata attattattt ttctgtaggg aaaaagccag atgaagctga gatggcaaat 420 atactaaggg atgcagaaaa aaaggtggat ttagttgtag ataaattttc aaaaggagaa 480 gtatatttag aaaatataag taaaactaga gtatttttgg ggaaaattgc atctaaggga 540 tttaataaat ttcttcctaa attatcaaac aatcttaaat ctacagagca ttgtattaaa 600 tgtggtatgt gtgttaggaa ttgtccaaaa ggaaatatag tatttgagaa cgggggagta 660 gtttttcata gtaattgtat attatgttta agatgtatat atatatgtcc aagcaatgca 720 atagtttata aagaaaagag aatagatcaa atagaaaaaa atataataaa attattggac 780 ataaaatag 789 <210> 931 <211> 162 <212> DNA <213> Clostridium botulinum <400> 931 atgaatataa ataatgataa ttgtagtaaa tgtataaata tattaaaaag taattgtaat 60 ggtaatttag aaaattgtat ttgccaaaag tgtgttagaa atatagaaaa gtgtataatt 120 actaagtatt gttcagaaac agaatctaca ttgagtatat aa 162 <210> 932 <211> 705 <212> DNA <213> Clostridium botulinum <400> 932 atggagaact ggttacaaag aactgaattt ttaataggaa aagaggctat agaaaaatta 60 aacaaaagta aaattgtggt tttaggtgtt ggaggagttg gaagttttgt aatagaagca 120 ttagttagat ctggagtagg taatataaca attgttgata atgatacaat agatataact 180 aatataaaca ggcaaatcca cgctaattta aatactgttg gaaaatctaa agttgaggta 240 atgaaagaga gaatactatc tataaatcct aattgtaatg ttaaaatcca tgaagaattt 300 ataaataaag ataatataag tgaattagtg gctaaagata cagattatgt tgtggatgct 360 atagatacgg cttcttctaa aatattaagt atagtatggt gtgataagaa taatataaac 420 ataataagta gtatgggtac agcaaataaa ttgcacccta ccaaattaag aatagctgat 480 atatatgata ctaaagtatg tccattagct aagattatga gatatgaact tagaaagagg 540 aatataaaaa gtttgaaggt tttatattca gaagaaactc caataaaaaa taataataga 600 ccattaaacg ataaaggtag gccaacgcca gctagtatag cttttgtccc accatgcgct 660 ggtcttataa tagcaggaga ggtagtaaga gatataatta aataa 705 <210> 933 <211> 1110 <212> DNA <213> Clostridium botulinum <400> 933 atgatattag tagcagtttg tgatagtaca agagggatct ttatccccat atttaaaaat 60 gagtttaata taaataatac taaaatagga ttgatgatta ctataagtac attgggatac 120 acagtattta catacttagg tggcatattg tgccaaaaga aagggcagaa gagggtttat 180 tctataggac ttttaataat aagtatatct ttcttactat taaattttac gcctaattat 240 ataattctta ttattttaat gtttttaata aacggaggcc aagctttctt agctatatct 300 agtaatacaa taatacctat aatttttata agttttcagg ctataataat gaatttagct 360 cattttaatt atggaatggg attagcttta tcacaaagga tttctggtat gcttttgtat 420 agaggtataa cttggagaag gatatacctt tatttatcaa ttataacttt catagtgtat 480 ctattgttat tttttattaa tatacctgtg attaataagt caaaagacga taataaatta 540 aagtcgaaag aaatttttaa agataagtta ttatattttt atatatttgc attaggattt 600 tatgtattta gcgaaatagc tacaggaaat tggttcgtta atttaatgga gaatggatac 660 agatataata aaaatcaaag ttcatattat atatttttat tttcagcttt atttgcatta 720 gggagattat tagggggatt tttagtagaa aaattcaact atataaaggc cgtatgcaca 780 tctttggctg tggctttaat gatgtatact ataggtataa cattagggca aaaggggcta 840 attttaatat cattatctgg aatatttttt tctatagtat atcctacagt agtattaact 900 attagcaaag tatattccac taatagttct tatgtgacgg gaatagtagt aaccttatct 960 tcttttgtaa atatgattat aagtttttta atgggatatt taaatgattt aataggtatt 1020 tatacatcat attatcttat tcctataagt ttatttattt ctttaatgtt tatgttttta 1080 atacacaaaa atataaaaaa attagcttaa 1110 <210> 934 <211> 945 <212> DNA <213> Clostridium botulinum <400> 934 atgaacaata aatttaaggt aagcatagaa ttagctaaag gtacagtgga tgaatatata 60 gttaaagata ttacaggtat aagtataggt agaatattca tattagagtt atctaaaaaa 120 aataaatatg gttgttttag attaaatctt tatagagatg gtgaaaattc aaatatttat 180 ttaaattata tattaaaaga ttttttacaa tatttatttt ataaaaaaga agtttgtaaa 240 ataaatatta taataaatga aaatatgaat acaaatgttt ttatagaata tggattttat 300 ttagaaggaa ttataaatga tagtagatta atagatggta taaaaactag tgaattttta 360 tttggattag atatagatac ttttaggaaa gctaatttgt ataaagaatt aagtatagaa 420 gggaaaaata taagcttaaa gctattgacg cctataaatg cacaagaatt attagattat 480 tatataagaa atgaaaggca tctaaaaagc tatgaaccca cacgagataa aactttttat 540 actttaaaag agcaaaggga tttattaatg gattcatata aacaatattt aaatggaaat 600 agtttagaac ttggtatata taaagataaa aaatttatag gtaaaataaa gatatcaaat 660 ataataatgg gcatatttaa aaattgtatt gtaggatatt caatagacaa agatttccaa 720 ggaaatggat atatgaagga agcacttaaa ttattgatag attatacatt taatgaaatt 780 gatatacata gaatagaagc ttcaacttta atagataata ttagatctca aaaagtattg 840 gaagggtgcg gatttaaaaa gctaggtata aatgaaaaat acttatatat agatggaaaa 900 tggcaagatc atgttactta ttatatagta aataataata tataa 945 <210> 935 <400> 935 000 <210> 936 <400> 936 000 <210> 937 <400> 937 000 <210> 938 <400> 938 000 <210> 939 <400> 939 000 <210> 940 <400> 940 000 <210> 941 <400> 941 000 <210> 942 <400> 942 000 <210> 943 <400> 943 000 <210> 944 <400> 944 000 <210> 945 <400> 945 000 <210> 946 <400> 946 000 <210> 947 <400> 947 000 <210> 948 <400> 948 000 <210> 949 <400> 949 000 <210> 950 <400> 950 000 <210> 951 <211> 445 <212> PRT <213> Clostridium botulinum <400> 951 Met Ser Thr His Leu Thr Glu Thr Trp Glu Lys Ala Ile Asn Ile Ile 1 5 10 15 Lys Gly Glu Leu Thr Glu Val Ser Phe Asn Thr Trp Ile Lys Ser Ile 20 25 30 Asn Pro Ile Ser Leu Glu Asn Asn Ser Leu Lys Leu Ala Val Pro Asn 35 40 45 Asp Phe Thr Lys Gly Ile Leu Glu Ser Arg Tyr Lys Asp Leu Ile Val 50 55 60 Asn Ala Leu Lys Leu Leu Thr Ser Lys Lys Tyr Asn Ile Asp Phe Ile 65 70 75 80 Val Thr Thr Glu Glu Lys Ile Glu Lys Asn His Asn Asn Glu Lys Ser 85 90 95 Asn Ile Val Val Asn Asp Glu Met Ser Thr Met Leu Asn Pro Lys Tyr 100 105 110 Thr Phe Asp Ser Phe Val Ile Gly Asn Ser Asn Arg Phe Ala His Ala 115 120 125 Ala Ser Leu Ala Val Ala Glu Ser Pro Ala Lys Ala Tyr Asn Pro Leu 130 135 140 Phe Ile Tyr Gly Gly Val Gly Leu Gly Lys Thr His Leu Met His Ala 145 150 155 160 Ile Gly His Tyr Ile Leu His Asn Asn Pro Lys Ser Gln Val Val Tyr 165 170 175 Val Ser Ser Glu Lys Phe Thr Asn Glu Leu Ile Asn Ser Ile Lys Asp 180 185 190 Asp Lys Asn Val Glu Phe Arg Asn Lys Tyr Arg Asn Ile Asp Ile Leu 195 200 205 Leu Val Asp Asp Ile Gln Phe Ile Ala Gly Lys Glu Arg Thr Gln Glu 210 215 220 Glu Phe Phe His Thr Phe Asn Ala Leu Tyr Glu Ala Asn Lys Gln Ile 225 230 235 240 Ile Ile Ser Ser Asp Arg Pro Pro Lys Glu Ile Pro Thr Leu Glu Asp 245 250 255 Arg Leu Arg Ser Arg Phe Glu Trp Gly Leu Ile Ala Asp Ile Gln Ala 260 265 270 Pro Asp Phe Glu Thr Arg Met Ala Ile Leu Lys Lys Lys Ala Asp Val 275 280 285 Glu Lys Leu Asn Ile Pro Asn Glu Val Met Val Tyr Ile Ala Thr Lys 290 295 300 Ile Lys Ser Asn Ile Arg Glu Leu Glu Gly Ala Leu Ile Arg Ile Val 305 310 315 320 Ala Phe Ser Ser Leu Thr Asn Lys Glu Ile Ser Val Asp Leu Ala Ser 325 330 335 Glu Ala Leu Lys Asp Ile Ile Ser Ser Lys Gln Thr Arg Gln Val Thr 340 345 350 Ile Asp Ile Ile Gln Glu Val Val Ala Asn Tyr Tyr Asn Leu Lys Ile 355 360 365 Glu Asp Leu Lys Ser Ala Arg Arg Thr Arg Asn Ile Ala Phe Pro Arg 370 375 380 Gln Ile Ala Met Tyr Leu Ser Arg Lys Leu Thr Asp Met Ser Leu Pro 385 390 395 400 Lys Ile Gly Glu Glu Phe Gly Gly Arg Asp His Thr Thr Val Ile His 405 410 415 Ala Tyr Glu Lys Ile Ser Asn Asn Leu Lys Lys Asp Glu Ser Leu Gln 420 425 430 Asn Ala Ile Asn Glu Leu Asn Lys Arg Ile Asn Gln Lys 435 440 445 <210> 952 <211> 367 <212> PRT <213> Clostridium botulinum <400> 952 Met Lys Ile Thr Cys Gln Lys Asn Ile Leu Leu Glu Gly Ile Ser Ile 1 5 10 15 Val Gln Lys Ala Val Thr Gly Lys Ser Thr Leu Pro Ile Leu Ser Gly 20 25 30 Ile Leu Ile Arg Ala Asn Lys Asn Glu Leu Val Leu Thr Gly Ser Asp 35 40 45 Met Asp Leu Ser Ile Glu Thr Lys Val Lys Ala Asn Ile Leu Glu Glu 50 55 60 Gly Thr Ile Val Leu Asp Ala Arg Leu Phe Gly Glu Ile Ile Arg Lys 65 70 75 80 Leu Pro Asn Asp Leu Ile Glu Ile Asn Thr Leu Glu Asp Asn Ser Ile 85 90 95 Glu Ile Ile Cys Gln Asn Ser Arg Phe Asn Leu Ile Tyr Met Asn Pro 100 105 110 Asp Glu Phe Pro Asn Pro Pro Ile Ile Asn Glu Asn Met Ile Phe Ser 115 120 125 Ile Gly Glu Asn Lys Leu Lys Asn Met Ile Lys Gly Thr Ile Phe Ala 130 135 140 Thr Ala Gln Asp Glu Thr Arg Pro Ile Leu Thr Gly Val Leu Phe Gln 145 150 155 160 Ile Lys Asp Lys Met Leu Asn Leu Val Ala Leu Asp Gly Tyr Arg Leu 165 170 175 Ala Leu Arg Ser Glu Ile Val Asp Asn Asp Asn Thr Ile Asn Ala Val 180 185 190 Ile Pro Gly Lys Thr Leu Asn Glu Val Ser Lys Ile Leu Glu Glu Asp 195 200 205 Asp Glu Asn Val Asn Ile Thr Phe Thr Pro Asn His Ile Leu Phe Ser 210 215 220 Ile Gly Glu Thr Lys Ile Ile Ser Arg Leu Leu Glu Gly Glu Phe Ile 225 230 235 240 Ser Tyr Lys Ser Ile Ile Pro Glu Glu Tyr Asn Leu Lys Ile Ile Ala 245 250 255 Lys Arg Leu Glu Leu Leu Asn Ser Ile Glu Arg Ala Ser Leu Met Ala 260 265 270 Lys Glu Gly Asn Thr Asn Leu Val Lys Phe Asp Phe Ser Asn Asp Lys 275 280 285 Ile Val Ile Thr Ser Asn Ser Gln Leu Gly Met Val Arg Glu Glu Leu 290 295 300 Lys Val Val Leu Gln Gly Glu Asp Leu Gln Ile Ala Phe Asn Ser Lys 305 310 315 320 Tyr Leu Leu Asp Val Leu Lys Thr Met Glu Gly Asp Glu Val Val Leu 325 330 335 Glu Phe Ser Ser Ser Val Ser Pro Cys Ile Ile Lys Asn Thr Glu Leu 340 345 350 Asn Asn Cys Thr Tyr Leu Val Leu Pro Val Arg Leu Asn Asn Asn 355 360 365 <210> 953 <211> 68 <212> PRT <213> Clostridium botulinum <400> 953 Met Ile Glu Val Lys Ile Asn Ser Glu Val Ile Lys Leu Asp Ser Phe 1 5 10 15 Leu Lys Trp Ser Gly Ala Thr Thr Leu Gly Ser Glu Ala Lys Phe Phe 20 25 30 Ile Gln Asn Gly Glu Val Lys Val Asn Gly Glu Ile Glu Lys Arg Arg 35 40 45 Gly Arg Lys Leu Lys Ile Gly Asp Leu Ile Glu Phe Asn Asn Glu Thr 50 55 60 Tyr Lys Ile Ile 65 <210> 954 <211> 364 <212> PRT <213> Clostridium botulinum <400> 954 Met Tyr Ile Lys Asn Val His Leu Ile Asn Phe Arg Asn Tyr Asp Asp 1 5 10 15 Met Tyr Leu Glu Leu Ser Pro Asn Thr Asn Ile Phe Val Gly Asn Asn 20 25 30 Ala Gln Gly Lys Thr Asn Ile Leu Glu Ser Ile Tyr Tyr Ser Ser Ile 35 40 45 Gly Lys Ser His Arg Thr Asn Lys Asp Lys Asp Leu Ile Lys Trp Asp 50 55 60 Lys Asn Asn Thr Tyr Leu Arg Thr Tyr Val Ser Arg Glu Arg Leu Asp 65 70 75 80 Lys Thr Ile Asp Ile Asn Ile Phe Lys Asn Gly Lys Lys Ala Ile Thr 85 90 95 Val Asn Lys Ile Lys Ile Lys Lys Ile Ser Glu Leu Met Gly Asn Leu 100 105 110 Asn Val Val Met Phe Ser Pro Glu Asp Leu Arg Ile Ile Lys Asp Ser 115 120 125 Pro Gly Asn Arg Arg Lys Phe Leu Asp Ile Glu Leu Cys Lys Ile Asn 130 135 140 Asn Val Tyr Tyr His Asp Leu Val Gln Tyr Asn Lys Ile Leu Ser Glu 145 150 155 160 Arg Asn Thr Ala Leu Lys Asn Trp Asn Asn Lys Ile Asn Asp Ile Ile 165 170 175 Asp Val Tyr Asp Glu Gln Leu Ser Lys Tyr Gly Ala Phe Ile Ile Lys 180 185 190 Glu Arg Asn Lys Tyr Leu Asp Lys Leu Asn Ile Ile Gly Lys Asn Ile 195 200 205 His Asn Lys Ile Thr Asn Asp Leu Glu Asp Ile Asn Phe Arg Tyr Leu 210 215 220 Thr Asn Ile Lys Asp Phe Asp Asn Ala Glu Lys Glu Leu Leu Met Leu 225 230 235 240 Phe Lys Lys Asn Arg Lys Lys Asp Leu Glu Arg Asn Ser Thr Ser Ile 245 250 255 Gly Pro His Arg Asp Asp Phe Glu Val Ser Ile Asn Asn Ile Asp Thr 260 265 270 Arg Ile Phe Gly Ser Gln Gly Gln Gln Arg Thr Ala Val Leu Thr Leu 275 280 285 Lys Phe Ala Ser Leu Glu Ile Ile Lys Asn Ile Ile Gly Glu Tyr Pro 290 295 300 Val Leu Leu Leu Asp Asp Val Leu Ser Glu Leu Asp Ser Asn Arg Gln 305 310 315 320 Lys Phe Val Leu Asn Ser Ile Asp Lys Ile Gln Thr Ile Ile Thr Cys 325 330 335 Thr Gly Ile Glu Glu Ile Asp Lys Tyr Leu Asp Lys Lys Gln Ser Gln 340 345 350 Leu Tyr Leu Val Asn Asn Gly Lys Ile Lys Arg Val 355 360 <210> 955 <211> 87 <212> PRT <213> Clostridium botulinum <400> 955 Met Phe Leu His Leu Gly Glu Asn Val Val Val Pro Ile Lys Asp Val 1 5 10 15 Ile Gly Ile Phe Asp Met Glu Thr Ser Met Tyr Ser Ser Asp Thr Ile 20 25 30 Gln Phe Leu Arg Leu Ala Glu Glu Asp Gly Phe Val Glu Arg Ile Thr 35 40 45 Lys Glu Lys Pro Lys Ser Phe Val Ile Ala Glu Val Asp Lys Lys Ser 50 55 60 Lys Ile Tyr Leu Ser Pro Ile Ser Ser Ala Thr Leu Thr Lys Arg Thr 65 70 75 80 Lys Val Leu Tyr Asn Glu Leu 85 <210> 956 <211> 637 <212> PRT <213> Clostridium botulinum <400> 956 Met Ser Gln Glu Asn Lys Gln Val Tyr Asp Glu Ser Gln Ile Gln Val 1 5 10 15 Leu Glu Gly Leu Glu Ala Val Arg Lys Arg Pro Gly Met Tyr Ile Gly 20 25 30 Ser Thr Ser Leu Arg Gly Leu His His Leu Val Tyr Glu Ile Val Asp 35 40 45 Asn Ser Ile Asp Glu Ala Leu Ala Gly Phe Cys Thr His Ile Glu Val 50 55 60 Phe Ile His Lys Asp Asn Ser Ile Thr Val Val Asp Asp Gly Arg Gly 65 70 75 80 Met Pro Val Gly Met His Ser Lys Val Lys Lys Pro Ala Val Glu Val 85 90 95 Ile Met Thr Ile Leu His Ala Gly Gly Lys Phe Gly Gly Gly Gly Tyr 100 105 110 Lys Val Ser Gly Gly Leu His Gly Val Gly Ala Ser Val Val Asn Ala 115 120 125 Leu Ser Glu Gln Cys Glu Val Glu Val Arg Arg Glu Gly His Ile Trp 130 135 140 Lys Gln Lys Phe Glu Arg Gly Ile Thr Lys Thr Gly Leu Asp Ile Val 145 150 155 160 Gly Asp Thr Glu Asp His Gly Thr Lys Ile Tyr Phe Lys Pro Asp Ile 165 170 175 Glu Ile Phe Asp Glu Leu Glu Phe Glu Tyr Asp Thr Leu Ala His Arg 180 185 190 Leu Arg Glu Leu Ala Phe Leu Asn Lys Gly Ile Lys Ile Ser Leu Thr 195 200 205 Asp Glu Arg Tyr Asp Lys Lys Glu Met Phe His Tyr Glu Gly Gly Leu 210 215 220 Arg Ser Phe Val Leu Tyr Leu Asn Arg Asn Lys Glu Lys Leu His Gln 225 230 235 240 Gln Pro Ile Tyr Val Asp Glu Asn Lys Asp Gly Cys Ile Val Glu Ile 245 250 255 Ala Met Gln Tyr Asn Asp Gly Tyr Ala Glu Asn Ile Phe Ser Phe Ala 260 265 270 Asn Asn Ile Asp Thr Ile Glu Gly Gly Thr His Leu Ala Gly Phe Lys 275 280 285 Ser Ala Leu Thr Arg Val Ile Asn Asp Tyr Ala Arg Lys Phe Asn Tyr 290 295 300 Leu Lys Asp Thr Asp Lys Asn Leu Ser Gly Asp Asp Val Arg Glu Gly 305 310 315 320 Leu Thr Ala Val Ile Ser Val Lys Leu Thr Asp Pro Gln Phe Glu Gly 325 330 335 Gln Thr Lys Thr Lys Leu Gly Asn Gly Glu Val Arg Gly Ile Val Asp 340 345 350 Thr Ile Val Gly Gln Ser Ile Gly Ser Phe Leu Glu Glu Asn Pro Asn 355 360 365 Val Gly Lys Ile Ile Ile Glu Lys Gly Leu Ser Ala Ser Arg Ala Arg 370 375 380 Glu Ala Ala Lys Arg Ala Arg Glu Leu Thr Arg Arg Lys Ser Ile Leu 385 390 395 400 Glu Ser Thr Ser Leu Pro Gly Lys Leu Ser Asp Cys Ser Ser Lys Asp 405 410 415 Pro Ser Leu Cys Glu Ile Tyr Leu Val Glu Gly Asp Ser Ala Gly Gly 420 425 430 Ser Ala Lys Gln Gly Arg Asn Arg Glu Phe Gln Ala Ile Leu Pro Leu 435 440 445 Lys Gly Lys Ile Met Asn Val Glu Lys Gln Arg Leu Asp Lys Ile Leu 450 455 460 Ala Ser Asp Glu Ile Arg Ala Met Ile Thr Ala Phe Gly Ala Gly Ile 465 470 475 480 Gly Lys Glu Phe Asp Ile Asp Lys Ile Arg Tyr Asn Arg Ile Ile Ile 485 490 495 Met Thr Asp Ala Asp Val Asp Gly Ala His Ile Arg Thr Leu Leu Leu 500 505 510 Thr Phe Phe Tyr Arg Tyr Met Lys Glu Leu Ile Glu Glu Gly His Val 515 520 525 Tyr Ile Ala Gln Pro Pro Leu Tyr Arg Ile Tyr Lys Ala Lys Lys Glu 530 535 540 Ile Tyr Val Tyr Ser Asp Pro Glu Leu Asp Ala Ala Leu Leu Glu Leu 545 550 555 560 Gly Gly Lys Asp Thr Asn Thr Asn Ile Gln Arg Tyr Lys Gly Leu Gly 565 570 575 Glu Met Asn Pro Glu Gln Leu Trp Glu Thr Thr Met Asp Pro Glu His 580 585 590 Arg Thr Leu Leu Gln Val Thr Val Glu Asp Ala Met Glu Ala Asp Glu 595 600 605 Ile Phe Thr Ile Leu Met Gly Thr Lys Val Glu Pro Arg Arg Asp Phe 610 615 620 Ile Glu Ser Asn Ala Asp Lys Val Val Asn Leu Asp Ile 625 630 635 <210> 957 <211> 821 <212> PRT <213> Clostridium botulinum <400> 957 Met Leu Asn Glu Gly Lys Ile Leu Pro Val Asp Val Ser Lys Glu Met 1 5 10 15 Lys Lys Cys Tyr Ile Asp Tyr Ala Met Ser Val Ile Ala Gly Arg Ala 20 25 30 Leu Pro Asp Val Arg Asp Gly Leu Lys Pro Val His Arg Arg Ile Ile 35 40 45 Tyr Ser Met Gln Gly Leu Gly Leu Ala Pro Glu Lys Gly Tyr Arg Lys 50 55 60 Cys Ala Arg Ile Val Gly Asp Val Leu Gly Lys Tyr His Pro His Gly 65 70 75 80 Asp Thr Ala Val Tyr Glu Ala Leu Val Arg Met Ala Gln Asn Phe Ser 85 90 95 Ile Arg Tyr Thr Leu Val Asp Gly His Gly Asn Phe Gly Ser Val Asp 100 105 110 Gly Asp Gly Ala Ala Ala Met Arg Tyr Thr Glu Ala Lys Met Ser Lys 115 120 125 Ile Ser Met Glu Leu Ile Lys Asp Ile Asn Lys Asn Thr Val Asp Phe 130 135 140 Ile Pro Asn Phe Asp Gly Glu Glu Glu Glu Pro Ser Val Leu Pro Ser 145 150 155 160 Arg Phe Pro Asn Leu Leu Val Asn Gly Ser Ser Gly Ile Ala Val Gly 165 170 175 Met Ala Thr Asn Ile Pro Pro His Asn Leu Thr Glu Val Ile Asp Gly 180 185 190 Ile Ile Met Leu Ile Glu Asn Glu Asp Val Asn Ile Leu Asp Leu Met 195 200 205 Thr Lys Ile Lys Gly Pro Asp Phe Pro Thr Ser Gly Leu Ile Val Gly 210 215 220 Thr Arg Gly Ile Arg Glu Ala Tyr Glu Thr Gly Arg Gly Lys Val Ile 225 230 235 240 Ile Arg Ala Lys Ala Glu Ile Glu Glu Glu Lys Gly Lys Asn Lys Ile 245 250 255 Ile Val Thr Glu Ile Pro Tyr Gln Val Asn Lys Ala Arg Leu Ile Glu 260 265 270 Asn Met Ala Asn Leu Val Lys Asp Lys Lys Ile Asn Gly Ile Ser Asp 275 280 285 Leu Arg Asp Glu Ser Asp Arg Asp Gly Met Arg Ile Val Ile Glu Leu 290 295 300 Lys Arg Asp Ala Asn Pro Asn Ile Val Leu Asn Gln Leu Tyr Lys His 305 310 315 320 Thr Lys Leu Gln Asp Thr Phe Gly Ile Ile Met Leu Ala Leu Val Asn 325 330 335 Asn Gln Pro Gln Ile Leu Asn Leu Lys Glu Ile Leu Val Asn Tyr Val 340 345 350 Glu Phe Gln Lys Glu Val Ile Arg Arg Arg Thr Arg Phe Asp Leu Asp 355 360 365 Lys Ala Leu Ala Arg Ala His Ile Leu Glu Gly Leu Arg Ile Ala Leu 370 375 380 Asp His Ile Asp Glu Val Ile Lys Leu Ile Arg Ala Ser Lys Asn Thr 385 390 395 400 Ala Glu Ala Lys Glu Gly Leu Met Asn Asn Phe Asn Leu Ser Glu Lys 405 410 415 Gln Ala Gln Ala Ile Leu Asp Met Lys Leu Gln Arg Leu Thr Gly Leu 420 425 430 Glu Arg Glu Lys Ile Glu Glu Glu Tyr Lys Glu Leu Met Glu Lys Ile 435 440 445 Ser Tyr Phe Arg Glu Ile Leu Asp Lys Glu Glu Leu Val Leu Ser Ile 450 455 460 Ile Lys Glu Glu Leu Ile Glu Ile Lys Asn Lys Tyr Gly Asp Glu Arg 465 470 475 480 Lys Thr Glu Ile Val Lys Gly Glu His Asp Ile Asp Ile Glu Asp Leu 485 490 495 Ile Glu Asp Lys Lys Val Ile Val Thr Leu Thr His Gly Gly Tyr Ile 500 505 510 Lys Arg Leu Asp Met Asp Thr Tyr Ser Ser Gln Lys Arg Gly Gly Lys 515 520 525 Gly Ile Gln Ala Thr Ser Thr Lys Gln Asp Asp Phe Ile Glu Asn Met 530 535 540 Phe Val Thr Ser Thr His Ser Thr Ile Leu Phe Phe Thr Asn Arg Gly 545 550 555 560 Lys Val Tyr Lys Leu Lys Ala Tyr Glu Ile Pro Glu Ala Gly Arg Thr 565 570 575 Ala Lys Gly Thr Asn Ile Val Asn Leu Ile Pro Ile Glu Asn Asn Glu 580 585 590 Lys Ile Gln Thr Val Ile Gly Leu Lys Asp Ile Asp Asp Met Lys His 595 600 605 Phe Val Met Cys Thr Arg Asn Gly Ile Ile Lys Lys Thr Glu Ile Ser 610 615 620 Lys Tyr Ser Ser Ile Arg Lys Gly Gly Leu Asn Ala Ile Asn Leu Arg 625 630 635 640 Glu Asp Asp Glu Leu Ile Asp Val Lys Met Thr Lys Gly Asn Asp Glu 645 650 655 Ile Ile Val Val Thr Gln Asn Gly Tyr Cys Ile Arg Phe Asn Glu Glu 660 665 670 Asp Val Arg Pro Met Gly Arg Val Ala Thr Gly Val Lys Ala Ile Thr 675 680 685 Leu Arg Lys Ala Asp Lys Ala Val Ser Met Asp Val Val Ile Glu Asp 690 695 700 Glu Thr Leu Leu Ser Ile Ser Glu Asn Gly Phe Gly Lys Arg Thr Asp 705 710 715 720 Ile Glu Glu Tyr Pro Ile His Arg Arg Gly Gly Lys Gly Val Ile Thr 725 730 735 Tyr Lys Ile Thr Asp Lys Thr Gly Pro Ile Val Gly Ala Arg Phe Val 740 745 750 Lys Glu Asp Asp Glu Leu Met Leu Val Asn Ser Gly Asp Val Ala Ile 755 760 765 Arg Ile Asn Val Ser Glu Ile Ser Lys Thr Ser Arg Asn Ala Met Gly 770 775 780 Val Lys Leu Met Arg Thr Ser Glu Glu Glu Lys Ile Val Ala Ile Ala 785 790 795 800 Lys Ile Lys Ser Glu Asp Ile Ile Glu Glu Glu Ile Leu Asn Glu Glu 805 810 815 Asn Leu Asn Glu Glu 820 <210> 958 <211> 150 <212> PRT <213> Clostridium botulinum <400> 958 Met Glu Tyr Glu Asp Ile Val Tyr Ile Asn Met His Leu Asp Asn Glu 1 5 10 15 Glu Leu Lys Ile Phe Asn Lys Leu Ser Ile Ser Glu Gln Lys His Ser 20 25 30 Ile Lys Val Ala Tyr Asp Ile Glu Lys Leu Tyr Glu Lys Gly Lys Tyr 35 40 45 Asn Leu Thr Lys Asp Glu Phe Ile Lys Val Ala Leu Leu His Asp Ile 50 55 60 Gly Lys Leu Asn Tyr Lys Val Asp Ile Ile Lys Lys Ser Ile Ile Val 65 70 75 80 Ile Met Asp Arg Ile Thr Asn Ser Arg Ile Lys Lys Phe Gln Asn Ile 85 90 95 Lys Ser Val Tyr Val His Tyr Asn His Pro Tyr Leu Gly Tyr Cys Ile 100 105 110 Leu Lys Gln Tyr Asn Lys Tyr Ser Glu Lys Met Leu Tyr Leu Ile Lys 115 120 125 Asn His His Asn Glu Asn Ile Ile Asn Lys Glu Leu Ser Leu Leu Ile 130 135 140 Tyr Ser Asp Asn Leu Asn 145 150 <210> 959 <211> 173 <212> PRT <213> Clostridium botulinum <400> 959 Met Asn Ser Ile Glu Arg Arg Lys Asn Ile Glu Asn Met Leu Met Lys 1 5 10 15 Asn Asn Lys Pro Ile Lys Gly Ser Glu Met Gly Gln Lys Leu Gly Val 20 25 30 Thr Arg Gln Val Ile Val Lys Asp Ile Ala Ile Leu Arg Ala Ser Gly 35 40 45 Lys Asn Ile Ile Ala Thr Pro Glu Gly Tyr Leu Ile Pro Asn Glu Asn 50 55 60 Lys Gln Leu Ile Arg Lys Ile Ile Ala Val Cys His Asp Ser Lys Asp 65 70 75 80 Ile Lys Asp Glu Leu Glu Ile Ile Ile Lys Phe Gly Gly Ile Val Glu 85 90 95 Asp Val Val Val Glu His Pro Ile Tyr Gly Glu Ile Lys Ala Met Leu 100 105 110 Met Ile Lys Ser Met Tyr Asp Ile Asp Asn Phe Ile Lys Asn Ile Gln 115 120 125 Asn Asn Lys Ala Glu Pro Leu Leu Ile Leu Thr Gly Gly Ile His Leu 130 135 140 His Thr Ile Ser Ser Asp Asn Glu Asp Ile Met Asn Lys Ile Ile Glu 145 150 155 160 Gln Leu Asn Gln Lys Asn Tyr Leu Val Asp Glu Glu Val 165 170 <210> 960 <211> 387 <212> PRT <213> Clostridium botulinum <400> 960 Met Asp Lys Val Ala Leu Leu Lys Cys Asp Glu Tyr Asp Leu Glu Lys 1 5 10 15 Val Glu Lys Thr Ile Arg Asn Gly Phe Glu Leu Leu Gly Gly Asn Ser 20 25 30 Phe Leu Asn Lys Leu Ile Pro Tyr Asn Ser Lys Val Leu Leu Lys Pro 35 40 45 Asn Met Leu Ser Ile Glu Asn Glu Gly Ser Pro Val Val Thr Asn Ser 50 55 60 Val Val Phe Glu Ala Val Ile Arg Ile Leu Gly Asp Tyr Ser Asn Asn 65 70 75 80 Ile Ser Phe Gly Asp Ser Pro Gly Phe Gly Asp Ser Lys Lys Ala Ala 85 90 95 Glu Lys Ser Gly Leu Leu Asn Ile Ala Lys Lys Tyr Asn Ile Glu Phe 100 105 110 Lys Asp Phe Lys Glu Ser Ile Asn Val Ser Cys Asp Asn Ser Ile Leu 115 120 125 Cys Arg Ser Trp Thr Val Ala Lys Ala Ala Tyr Glu Thr Asp Val Leu 130 135 140 Ile Thr Leu Pro Lys Leu Lys Thr His Ala Met Ala Tyr Phe Thr Gly 145 150 155 160 Ala Val Lys Asn Gln Phe Gly Cys Ile Pro Gly Thr Leu Lys Ala Thr 165 170 175 Trp His Thr Arg Met Pro Asn Ala Asn Asn Phe Cys Lys Met Leu Leu 180 185 190 Asp Leu Asn Thr Leu Leu Glu Thr Asp Phe Ala Ile Leu Asp Gly Ile 195 200 205 Ile Ala Met Glu Gly Asn Gly Pro Lys Asn Gly Thr Pro Tyr Asn Leu 210 215 220 Asn Thr Ile Ile Met Gly Asp Ser Leu Thr Ala Val Asp Ser Val Ala 225 230 235 240 Val Lys Ile Ile Gly Tyr Asp Asn Pro Leu Asp Ile Pro Val Leu Lys 245 250 255 Glu Ala Tyr Asp Ser Asn Trp Gly Ser Val Phe Leu Lys Asp Ile Asp 260 265 270 Ile Leu Gly Glu Lys Ile Asp Ser Met Val Val Asp Asn Phe Lys Leu 275 280 285 Cys Arg Glu Gly Gly Asp Phe Tyr Phe Ile Asn Pro Lys Val Thr Asn 290 295 300 Phe Leu Lys Asp Ile Ile Ala Pro Asp Pro Thr Leu Ile Lys Glu Lys 305 310 315 320 Cys Ile Gly Cys Asn Arg Cys Ala Glu Val Cys Pro Glu Lys Pro Tyr 325 330 335 Val Ile Asp Met Ile Lys Lys Gly Asp Lys Lys Ile Pro Val Trp Asn 340 345 350 Met Lys Lys Cys Ile Arg Cys Phe Cys Cys Gln Glu Leu Cys Pro Lys 355 360 365 Gly Ala Ile Glu Thr Lys Tyr Ser Phe Ile Gly Arg Phe Leu Asn Arg 370 375 380 Asp Gly Arg 385 <210> 961 <211> 893 <212> PRT <213> Clostridium botulinum <400> 961 Met Lys Asn Lys Lys Ala Leu Phe Ile Pro Leu Phe Ile Ile Ile Leu 1 5 10 15 Phe Ile Ala Phe Phe Asn Lys Ile Ile Asn Phe Ile Ile Asn Ile Lys 20 25 30 Trp Phe Lys Glu Val Asn Tyr Leu Ala Val Tyr Phe Thr Lys Met Arg 35 40 45 Ala Ile Ile Ile Leu Met Ile Pro Ile Phe Ile Ile Phe Phe Ile Ser 50 55 60 Ile Trp Met Tyr Tyr Lys Ser Leu Ile Ile Asn Lys Asn Lys Ser Val 65 70 75 80 Val Asp Ile Gly Leu Asn Lys Asn Asn Tyr Gly Lys Lys Leu Phe Phe 85 90 95 Ile Phe Asn Phe Ile Val Ser Ile Phe Leu Ala Tyr Ile Phe Ser Ser 100 105 110 Ser Tyr Trp Tyr Arg Ile Leu Gln Phe Asn Asn Ser Val Asp Phe Asn 115 120 125 Val Lys Asp Pro Ile Phe Phe Lys Asp Val Ser Phe Tyr Ile Phe Lys 130 135 140 Leu Pro Leu Phe Glu Ser Leu Tyr Lys Val Ile Ile Ser Leu Leu Leu 145 150 155 160 Phe Leu Val Ile Thr Thr Phe Ile Ala Tyr Phe Ile Leu Glu Ala Lys 165 170 175 Tyr Lys Ile Gln Ser Arg Lys Asp Ile Asn Leu Lys Asn Ile Asn His 180 185 190 Gly Ile Lys Ser Phe Ala Gly Lys Gln Leu Ala Ile Val Ser Gly Leu 195 200 205 Ile Ile Leu Phe Ile Ser Phe Gly His Leu Ile Lys Ile Trp Asn Leu 210 215 220 Val Tyr Ser Ser Asn Gly Val Ser Phe Gly Ala Ser Tyr Thr Asp Val 225 230 235 240 His Ala Thr Leu Leu Phe Tyr Lys Ile Ile Val Val Ile Thr Leu Ile 245 250 255 Ser Ser Ile Val Thr Leu Leu Ser Ile Val Lys Gly Lys Phe Lys Pro 260 265 270 Val Ser Ile Cys Ile Gly Ile Thr Ile Phe Leu Ile Val Ser Gln Asn 275 280 285 Ile Ala Ser Phe Leu Val Gln Asn Phe Ile Val Lys Ser Asn Glu Lys 290 295 300 Thr Leu Glu Gln Pro Tyr Ile Lys Asn Asn Ile Asp Leu Thr Arg Lys 305 310 315 320 Ala Phe Ala Leu Asp Asp Ile Glu Ile Arg Asp Phe Asp Ile Lys Asn 325 330 335 Asp Leu Gln Lys Gln Asp Ile Ala Asp Asn Lys Ala Ser Ile Asp Asn 340 345 350 Val Arg Ile Asn Ser Phe Lys Pro Thr Leu Glu Phe Tyr Asn Gln Val 355 360 365 Gln Ile Ile Arg Tyr Tyr Tyr Thr Phe Asn Asp Ile Asp Ile Asp Arg 370 375 380 Tyr Asn Ile Asn Gly Lys Tyr Asn Gln Val Phe Leu Ala Ala Arg Glu 385 390 395 400 Ile Asp Thr Asp Ala Leu Asn Pro Asn Thr Trp Gln Asn Arg His Leu 405 410 415 Ile Tyr Thr His Gly Phe Gly Ala Val Met Asn Lys Val Asn Ser Val 420 425 430 Thr Ser Glu Gly Gln Pro Asp Phe Val Ile Lys Asp Ile Pro Pro Tyr 435 440 445 Asn Lys Thr Asn Ile Lys Leu Thr Asn Pro Arg Ile Tyr Phe Gly Glu 450 455 460 Lys Thr Asn Asp Tyr Val Ile Val Asn Thr Lys Ile Asn Glu Phe Asp 465 470 475 480 Tyr Pro Arg Glu Asp Ser Asn Lys Thr Asn Lys Tyr Asn Gly His Ala 485 490 495 Gly Ile Lys Met Ser Phe Ile Asn Arg Leu Leu Phe Ala Ile Asn Lys 500 505 510 Lys Asp Ile Asn Phe Leu Leu Ser Lys Asp Ile Lys Lys Asp Ser Lys 515 520 525 Ile Ile Ile Asn Arg Asn Ile Val Glu Arg Ala Lys Lys Ile Ala Pro 530 535 540 Phe Leu Thr Tyr Asp Ser Asp Pro Tyr Met Val Ile Tyr Asn Gly Lys 545 550 555 560 Ile Tyr Trp Ile Ile Asp Ala Tyr Thr Thr Thr Asn Arg Tyr Pro Tyr 565 570 575 Ser Glu Pro Tyr Asp Ser Ile Asn Tyr Ile Arg Asn Ser Ala Lys Val 580 585 590 Val Ile Asp Ser Val Asp Gly Asp Thr Asn Phe Tyr Ile Thr Asp Lys 595 600 605 Lys Asp Pro Ile Val Asn Asn Tyr Ala Lys Ile Phe Lys Gly Leu Phe 610 615 620 Lys Glu Glu Lys Asp Ala Pro Lys Glu Ile Arg Glu His Phe Arg Tyr 625 630 635 640 Pro Lys Asp Leu Phe Ser Ile Gln Ser Lys Val Leu Gly Lys Tyr His 645 650 655 Val Lys Asp Pro Gly Val Phe Tyr Asn Gly Glu Asp Leu Trp Glu Val 660 665 670 Ser Lys Asp Gln Lys His Val Glu Gly Glu Thr Asn Thr Asn Asp Ala 675 680 685 Pro Tyr Ile Ile Met Lys Leu Pro Asp Gln Asn Lys Glu Glu Met Val 690 695 700 Leu Leu Asn Tyr Phe Asn Val Met Lys Lys Asp Asn Met Ile Ala Leu 705 710 715 720 Phe Gly Ala Arg Met Asp Gly Glu Gln Tyr Gly Lys Lys Ile Leu Tyr 725 730 735 Lys Leu Pro Ser Asp Lys Thr Val Tyr Ser Pro Tyr Leu Phe Lys Gln 740 745 750 Lys Ile Asn Gln Asp Thr Asn Ile Ser Lys Glu Leu Ser Leu Trp Asn 755 760 765 Arg Glu Gly Ser Lys Val Gln Tyr Gly Asp Thr Ile Ile Leu Pro Ile 770 775 780 Lys Asn Ser Leu Leu Tyr Ile Glu Pro Leu Tyr Leu Arg Ala Ser Gly 785 790 795 800 Lys Asn Ser Ile Pro Glu Met Lys Arg Val Ile Leu Ser Tyr Asn Asp 805 810 815 Lys Leu Val Leu Ser Ser Ser Ile Gln Glu Gly Ile Lys Glu Ile Phe 820 825 830 Asn Ser Lys Asp Asn Lys Ile Asn Asp Lys Asn Glu Lys Asp Ser Thr 835 840 845 Lys Thr Ile Asp Asp Ser Lys Leu Lys Lys Ala Gln Glu Tyr Tyr Asn 850 855 860 Lys Ala Ile Glu Ala Gln Lys Asn Gly Asp Trp Thr Lys Tyr Gly Glu 865 870 875 880 Asn Ile Asn Glu Leu Gly Asn Ile Leu Asn Ser Ile Lys 885 890 <210> 962 <211> 258 <212> PRT <213> Clostridium botulinum <400> 962 Met Lys Phe Lys Lys Ser Val Tyr Ile Val Val Phe Thr Leu Ile Leu 1 5 10 15 Leu Phe Ile Pro Cys Phe Ile His Thr Lys Lys Asp Val Ser Thr Thr 20 25 30 Asn Asn Leu Asp Asn Lys Thr Lys Glu Ile Asn Lys Ser Glu Val Asp 35 40 45 Arg Asn Glu Met Ser Val Phe Ser Ser Asn Thr Cys Phe Lys Lys Thr 50 55 60 Tyr Tyr Ile Asn Lys Asn Lys Val Pro Val Tyr Lys Asn Phe Asp Cys 65 70 75 80 Asn Ser Glu Val Leu Tyr Tyr Leu Tyr Glu Asp Asp Ile Ile Val Ser 85 90 95 Tyr Lys Glu Gln Asn Gly Tyr Ile Phe Cys Glu Glu Gly Asn Leu Gly 100 105 110 Arg Lys Gly Trp Ile Lys Lys Asn Lys Glu Asn Leu Lys Gly Ile Leu 115 120 125 His Lys Asn Thr Glu Tyr Lys Val Asp Val Asp Leu Ile Asp Gln Lys 130 135 140 Ile Arg Val Tyr Lys Asn Asp Lys Ile Ile Lys Asn Ile Lys Cys Ser 145 150 155 160 Thr Gly Val Ile Gly Lys Gln Asp Thr Glu Thr Pro Leu Gly Ile Phe 165 170 175 Tyr Ile Thr Asn Lys Gly Lys Tyr Phe Tyr Ser Asn Lys Tyr Asn Gln 180 185 190 Gly Gly Arg Tyr Tyr Ile Lys Phe Phe Ala Asn Tyr Leu Ile His Ser 195 200 205 Ile Pro Val Asp Lys Asn Gly Asn Ile Ile Glu Glu Glu Lys Asp Lys 210 215 220 Leu Gly Phe Pro Thr Ser His Gly Cys Ile Arg Val Pro Met Glu Asp 225 230 235 240 Ser Lys Trp Leu Tyr Arg Asn Ile Pro Asn Lys Ser Leu Ile Ile Ile 245 250 255 His Tyr <210> 963 <211> 465 <212> PRT <213> Clostridium botulinum <400> 963 Met Asp Tyr Asp Val Met Ile Leu Gly Gly Gly Ile Ile Gly Cys Ala 1 5 10 15 Leu Ala Tyr Glu Leu Ser Lys Tyr Ser Leu Asn Ile Ala Leu Ile Glu 20 25 30 Lys Asp Tyr Asp Ile Ala Asp Asp Val Ala Phe Ile Asn Ser Ser Val 35 40 45 Val Tyr Asp Gly Val Glu Cys Glu Asp Asp Leu Ala Ala Asn Leu Glu 50 55 60 Leu Asn Gly Asn Lys Leu Met Glu Asp Ile Ala Lys Lys Phe Lys Ile 65 70 75 80 Pro Phe Lys Lys Thr Gly Ser Leu Ile Ile Ala Gln Asn Asp Asn Glu 85 90 95 Val Tyr Asn Ile Glu Asn Met Tyr Lys Lys Ala Leu Lys Arg Gly Ile 100 105 110 Lys Asn Ile Glu Val Leu Thr Lys Asp Glu Val Glu Lys Ile Glu Pro 115 120 125 Asn Leu Asn Ile Asp Phe Lys Lys Ala Leu Tyr Ser Ser Asn Thr Ala 130 135 140 Ser Ile Ala Pro Phe Asp Leu Ala Ile Ser Tyr Gly Glu Ile Ala Phe 145 150 155 160 Asp Asn Gly Val Asn Phe Lys Leu Glu Glu Gln Val Leu Glu Ile Gln 165 170 175 Lys Leu Ser Lys Gly Tyr Lys Ile Ile Thr Asn Lys Asn Lys Phe Asn 180 185 190 Cys Asn Ile Val Ile Asn Thr Thr Pro Asp Glu Asn Phe Gly Ile Tyr 195 200 205 Ser Asp Thr Lys Arg Asn Tyr Lys Lys Ser Asn Leu Asn Tyr Leu Leu 210 215 220 Ile Glu Lys Asn Ser Ile Lys Glu Phe Asn Asn Ile Val Val Lys Leu 225 230 235 240 Gly Asn Asn Glu Asn Ile Lys Lys Ile Leu Ala Val Pro Thr Val Gln 245 250 255 Gly Ser Met Val Leu Ala Val Asp Thr Tyr Glu Lys Ile Asn Tyr Lys 260 265 270 Asn Thr Leu Asp Val Ser Ala Leu Ile Leu Asp Glu Ile Asn Glu Met 275 280 285 Asp Ile Asn Asn Phe Tyr Gln Phe Pro Tyr Tyr Asp Asp Ser Ile Val 290 295 300 Ile Asp Asp Ser Leu Ile Asp Lys Gly Tyr Ile Lys Val Ile Val Asn 305 310 315 320 His Tyr Gly Gln Val Thr Met Thr Pro Tyr Ile Ala Lys Thr Val Thr 325 330 335 Glu Thr Ile Val Ser Asn Ile Lys Cys Val Leu Lys Lys Glu Phe Ile 340 345 350 Asp Lys Arg Arg Asp Tyr Tyr Lys Phe Asn Glu Leu Ser Leu Glu Glu 355 360 365 Arg Asn Lys Ile Ile Asn Met Asp Lys Arg Tyr Gly Lys Ile Ile Cys 370 375 380 Ala Cys Asn Lys Val Thr Glu Gly Glu Ile Ile Asp Ala Ile Arg Arg 385 390 395 400 Pro Leu Gly Ala Arg Thr Leu Glu Gly Ile Lys Arg Arg Thr Gly Ala 405 410 415 Ala Phe Gly Ser Cys Gln Gly Ala Tyr Cys Leu Asn Lys Val Val Ser 420 425 430 Ile Leu Ala Arg Glu Thr Asn Lys Phe Met Thr Asp Ile Val Lys Asp 435 440 445 Ser Lys Asn Ser Lys Ile Ile Pro Cys Arg Ile Lys Glu Phe Asp Thr 450 455 460 Ile 465 <210> 964 <211> 117 <212> PRT <213> Clostridium botulinum <400> 964 Met Leu Arg Glu Phe Ile Cys Asn Gly Cys Asn Lys Lys Cys Ile Ile 1 5 10 15 Ser Leu Tyr Asn Ser Asn Tyr Asn Thr Ile Lys Gly Asn Gln Cys Asn 20 25 30 Leu Gly Ile Asp Tyr Ala Lys Asn Tyr Val Asn Asn Thr Lys Asp Ile 35 40 45 Phe Thr Thr Leu Val Arg Ile Lys Gly Ser Lys Tyr Asn Val Leu Pro 50 55 60 Val Lys Ser Ser Glu Pro Ile Glu Lys Ser Leu Trp Ile Glu Cys Ser 65 70 75 80 Lys Ala Leu Ser Arg Leu Tyr Val Gly Tyr Pro Ile Glu Ile Gly Asp 85 90 95 Val Ile Cys Lys Asn Ile Leu Asn Thr Gly Val Asp Ile Ile Ala Ile 100 105 110 Lys Asn Ile Asn Glu 115 <210> 965 <211> 426 <212> PRT <213> Clostridium botulinum <400> 965 Met Leu Asp Leu Lys Arg Ile Arg Asn Asn Ser Asn Glu Ile Lys Glu 1 5 10 15 Ala Leu Asn Asn Arg Gly Glu Lys Phe Asp Val Thr Val Ile Asp Glu 20 25 30 Val Leu Lys Leu Asp Glu Glu Arg Arg Asn Ile Leu Val Lys Val Glu 35 40 45 Val Leu Lys Ser Lys Arg Asn Gln Val Ser Ser Glu Val Pro Lys Leu 50 55 60 Lys Lys Glu Gly Lys Asp Val Ser Asn Ile Val Ala Glu Met Lys Asn 65 70 75 80 Leu Ser Glu Glu Ile Lys Gly Phe Asp Ala Thr Leu Ala Lys Ile Asp 85 90 95 Glu Lys Ile Gln Tyr Ile Met Leu Arg Ile Pro Asn Ile Pro Asn Pro 100 105 110 Gln Val Pro Asp Gly Glu Thr Asp Glu Asp Asn Ile Glu Ile Arg Asn 115 120 125 Trp Leu Glu Pro Thr Lys Phe Asp Phe Glu Pro Lys Ala His Trp Asp 130 135 140 Ile Gly Thr Asn Leu Asn Ile Leu Asp Phe Glu Arg Ala Gly Lys Val 145 150 155 160 Thr Gly Ser Arg Phe Thr Phe Tyr Lys Gly Leu Gly Ala Arg Leu Glu 165 170 175 Arg Ala Val Ile Ser Tyr Phe Leu Asp Thr His Thr Glu Lys His Gly 180 185 190 Tyr Thr Glu Ile Leu Pro Pro Tyr Met Val Asn Arg Thr Ser Met Ile 195 200 205 Gly Thr Gly Gln Leu Pro Lys Phe Glu Glu Asp Ala Phe Lys Ile Ser 210 215 220 Glu Asp Asp Tyr Phe Leu Ile Pro Thr Ala Glu Val Pro Val Thr Asn 225 230 235 240 Leu Tyr Arg Asp Glu Ile Leu Lys Gly Asp Glu Leu Pro Leu Lys His 245 250 255 Val Ala Tyr Ser Ala Cys Phe Arg Ser Glu Ala Gly Ser Ala Gly Arg 260 265 270 Asp Thr Arg Gly Leu Val Arg Gln His Gln Phe Asn Lys Val Glu Leu 275 280 285 Val Lys Phe Thr Lys Pro Glu Gln Ser Tyr Glu Glu Leu Glu Lys Leu 290 295 300 Thr Asn Asp Ala Glu Thr Val Leu Lys Glu Leu Gly Ile Pro Tyr Arg 305 310 315 320 Val Val Arg Ile Cys Lys Gly Asp Leu Gly Phe Thr Ala Ala Leu Lys 325 330 335 Tyr Asp Leu Glu Val Trp Met Pro Ser Tyr Asn Arg Tyr Val Glu Ile 340 345 350 Ser Ser Cys Ser Asn Phe Glu Asp Phe Gln Ala Arg Arg Ala Asn Ile 355 360 365 Arg Tyr Lys Glu Asp Ala Lys Ala Lys Pro Gln Tyr Val His Thr Leu 370 375 380 Asn Gly Ser Gly Val Ala Ile Gly Arg Thr Val Ala Ala Ile Leu Glu 385 390 395 400 Asn Tyr Gln Ser Glu Asp Gly Ser Val Thr Ile Pro Glu Val Leu Arg 405 410 415 Pro Tyr Met Gly Gly Arg Glu Val Ile Lys 420 425 <210> 966 <211> 295 <212> PRT <213> Clostridium botulinum <400> 966 Met Ile Lys Tyr Tyr Asn Arg Lys Thr Asn Asp Tyr Asp Ile Glu Lys 1 5 10 15 Val Ala Gly Glu Lys Tyr Leu Asn Trp Thr Tyr Ser Ser Pro Ile Gly 20 25 30 Met Asn Leu Leu Glu Val Phe Ile Lys Lys Lys Phe Phe Ser Lys Ile 35 40 45 Tyr Gly Phe Tyr Cys Asp Arg Lys Leu Ser Ser Lys Lys Ile Asn Lys 50 55 60 Phe Ile Asn Asp Phe Glu Ile Asp Met Ser Leu Ser Glu Asn Gln Ser 65 70 75 80 Ser Lys Phe Lys Cys Phe Asn Asp Phe Phe Thr Arg Lys Leu Lys Lys 85 90 95 Glu Ala Arg Pro Ile Lys Ala Asp Lys Asn Ile Leu Ile Ser Pro Gly 100 105 110 Asp Gly Lys Ile Leu Ala Tyr Lys Asn Leu Asn Leu Asn Ser Val Thr 115 120 125 Glu Val Lys Gly Ile Asn Tyr Ser Phe Tyr Glu Leu Ile Asn Asn Asp 130 135 140 Ser Leu Ala Lys Glu Tyr Asp Asn Gly Thr Cys Leu Val Leu Arg Leu 145 150 155 160 Cys Pro Thr Asp Tyr His Arg Phe His Phe Ile Asp Asn Gly Thr Cys 165 170 175 Glu Asn Thr Ile Lys Leu Asp Gly Phe Tyr Tyr Ser Val Asn Pro Ile 180 185 190 Ala Leu Ser Lys Ile Pro Ser Leu Phe Cys Lys Asn Lys Arg Glu Tyr 195 200 205 Ala Ile Phe His Ser Glu Asn Phe Gly Asp Val Ile Phe Met Glu Val 210 215 220 Gly Ala Thr Cys Val Gly Ser Ile Ile Gln Thr Tyr Lys Pro Asn Thr 225 230 235 240 Lys Ile Leu Lys Gly Asp Glu Lys Gly Tyr Phe Lys Phe Gly Gly Ser 245 250 255 Thr Val Ile Leu Phe Phe Lys Lys Asn Thr Ile Lys Ile Asp Asn Asp 260 265 270 Ile Leu Asn Gln Ser Lys Leu Gly Tyr Glu Thr Ser Val Ile Met Gly 275 280 285 Glu Pro Ile Gly Ser Lys Lys 290 295 <210> 967 <211> 532 <212> PRT <213> Clostridium botulinum <400> 967 Met Tyr Leu Asn Ser Val Gln Arg Phe Lys Glu Ile Ile Lys Ile Leu 1 5 10 15 Ala Phe Tyr Gly Phe Gly His Ile Val Asp Ser Lys Phe Asn Glu Asp 20 25 30 Lys Ala Pro Glu Asn Leu Arg Lys Ala Phe Glu Glu Leu Gly Pro Thr 35 40 45 Phe Ile Lys Ile Gly Gln Ile Leu Ser Thr Arg Pro Asp Ile Leu Ser 50 55 60 Ala Pro Tyr Ile Lys Glu Leu Ser Lys Leu Gln Asp Ser Val Pro Glu 65 70 75 80 Asp Asn Phe Ser Asp Ile Asn Lys Ile Phe Phe Glu Glu Phe Asn Ile 85 90 95 Ser Ile Glu Asp Ala Phe Leu Asn Phe Asn Arg Lys Pro Leu Ala Ser 100 105 110 Ala Ser Ile Ser Gln Val Tyr Ser Ala Lys Leu His Asn Asn Glu Glu 115 120 125 Val Ile Val Lys Ile Gln Arg Pro Glu Ile Lys Glu Lys Met Asn Met 130 135 140 Asp Leu Ala Ile Leu Arg Lys Ile Phe Thr Leu Gly Lys Ile Lys Thr 145 150 155 160 Phe Asp Thr Leu Ile Asp Pro Lys Glu Ala Ile Asp Glu Leu Ile Asn 165 170 175 Ala Thr Asn Leu Glu Leu Asp Phe Asn Asn Glu Lys Glu Asn Ile Lys 180 185 190 Lys Phe Lys Tyr Phe Asn Lys Asn Leu Lys Cys Ile Tyr Val Pro Asn 195 200 205 Thr Ile Asp Lys Tyr Cys Ser Ser Lys Ile Ile Thr Met Glu Lys Ile 210 215 220 His Gly Phe Lys Ile Thr Asp Thr Lys Ser Leu Asp Lys Leu Asn Tyr 225 230 235 240 Asp Lys Lys Asp Val Ala His Lys Leu Ala Ile Ser Ile Leu Lys Gln 245 250 255 Ile Phe Glu Asp Gly Phe Phe His Gly Asp Pro His Pro Gly Asn Ile 260 265 270 Phe Ile Tyr Glu Gly Lys Ile Cys Tyr Ile Asp Phe Gly Ile Met Gly 275 280 285 Thr Leu Ser Ser Asp Leu Lys Asn Tyr Leu Asn Lys Ala Met Val Ala 290 295 300 Val Ala Phe Lys Asp Val Asp Lys Leu Ile Ser Val Leu Leu Ser Ile 305 310 315 320 Gly Ile Lys Lys Gly Tyr Ile Asn Lys Asn Asn Leu Phe Glu Asp Ile 325 330 335 Asn Tyr Leu Phe Asp Ile Tyr Leu Ser Thr Pro Leu Lys Asn Ile Lys 340 345 350 Met Ser Thr Met Leu Gln Glu Val Phe Glu Cys Ala Asn Arg Asn Asn 355 360 365 Ile Ser Leu Pro Lys Glu Leu Thr Met Leu Ile Arg Ser Leu Ile Ile 370 375 380 Ile Glu Gly Ile Leu Glu Lys Ile Asp Pro Asn Ile Gln Ile Leu Asp 385 390 395 400 Ile Ala Ile Pro Tyr Val Glu Asn Asn Asn Lys Val Asn Phe Phe Lys 405 410 415 Asn Ile Asp Leu Asp Glu Leu Ile Leu Asn Ser Tyr Lys Thr Ala Glu 420 425 430 Asp Leu Ser Lys Ile Pro Thr Lys Thr Val Gln Leu Leu Asn Ser Ile 435 440 445 Leu Asn Gly Arg Ser Lys Ile Gln Leu Asn Val Asn Asn Leu Asp Arg 450 455 460 Ser Ile Asn Glu Leu Asn Lys Met Ile Asn Arg Ile Val Phe Ala Leu 465 470 475 480 Ile Ile Ser Ser Met Ile Ile Gly Phe Ser Phe Ile Leu Asn Ser Asn 485 490 495 Ile Gly Pro Lys Phe Tyr Asp Ile Ser Ile Ile Gly Ile Leu Gly Tyr 500 505 510 Leu Ile Ala Ala Phe Met Gly Phe Trp Leu Leu Ile Ser Ile Ile Lys 515 520 525 Ser Gly Lys Leu 530 <210> 968 <211> 106 <212> PRT <213> Clostridium botulinum <400> 968 Met Ile Asn Glu Phe Lys Asn Ile Leu Leu Ala Gly Ile Gly Ser Ala 1 5 10 15 Ala Tyr Thr Tyr Glu Lys Ala Ser Asn Leu Val Asp Glu Met Val Gln 20 25 30 Lys Gly Lys Ile Thr Val Asn Glu Gly Lys Glu Leu Ser Glu Glu Leu 35 40 45 Lys Arg Thr Ile Asp Glu Asn Lys Lys Ser Lys Asn Ser Ser Glu Glu 50 55 60 Lys Gln Leu Thr Arg Glu Asp Ile Ile Ser Ile Phe Asn Glu Leu Asn 65 70 75 80 Phe Val Asn Lys Asn Asp Leu Asn Asp Ile Asn Asn Lys Ile Lys Ser 85 90 95 Leu Glu Asp Lys Ile Ser Gln Leu Glu Lys 100 105 <210> 969 <211> 516 <212> PRT <213> Clostridium botulinum <400> 969 Met Lys Leu Glu Ile Ile Thr Glu Asp Arg Leu Gly Met Val Leu Asp 1 5 10 15 Ile Leu Asn Val Leu Tyr Asn Glu Ser Met Asp Ile Lys Ser Leu Glu 20 25 30 Val Phe Pro Lys Lys Ile Tyr Ile Lys Ile Asn Lys Lys Ile Ser Tyr 35 40 45 Asn Lys Asn Met Ile Ile Lys Lys Ile Lys Asn Ile Lys Gly Val Val 50 55 60 Arg Val Lys Lys Ile Asp Ile Leu Pro Tyr Glu Lys Asp Glu Lys Lys 65 70 75 80 Leu Phe Thr Ile Ile Asp Ser Leu Glu Glu Gly Val Ile Phe Val Asn 85 90 95 Glu Lys Cys Gln Val Glu Val Phe Asn Lys Tyr Cys Glu Asn Leu Phe 100 105 110 Asn Thr Leu Lys Glu Asn Ala Ile Arg Lys His Ile Lys Glu Ile Phe 115 120 125 Gly Gln Asn Gln Leu Ile Leu Asp Ala Leu Lys Met Gly Lys Asp Tyr 130 135 140 Asp Asn Leu Gln Val Phe Ile Asn Asn Lys Asp Arg Lys Gly Met Tyr 145 150 155 160 Val Ser Thr Ala Arg Ala Ile Lys Asp Asp Lys Asn Lys Thr Ile Gly 165 170 175 Phe Val Ile Leu Ile Lys Asp Leu Lys Glu Thr Ile Glu Ile Val Asn 180 185 190 Ser Ile Lys Tyr Lys Glu Asp Glu Ala Phe Lys Gly Ile Ile Gly Lys 195 200 205 Ser Ile Cys Ile Asp Asn Leu Lys Glu Ile Cys Lys Ser Val Ala Lys 210 215 220 Thr Asn Ser Thr Val Leu Ile Cys Gly Glu Ser Gly Thr Gly Lys Glu 225 230 235 240 Leu Phe Ala Lys Ala Ile Tyr Lys Leu Ser Leu Arg Asn Asn Lys Asn 245 250 255 Phe Val Thr Val Asn Cys Ala Gly Leu Gln Asp Asn Leu Ile Glu Ser 260 265 270 Glu Leu Phe Gly Tyr Glu Ala Gly Ser Phe Thr Gly Ala Lys Ser Asn 275 280 285 Gly Lys Glu Gly Phe Phe Lys Leu Ala Asp Lys Gly Thr Ile Phe Leu 290 295 300 Asp Glu Ile Gly Glu Leu Pro Leu Asn Ile Gln Cys Lys Phe Leu Arg 305 310 315 320 Val Leu Gln Glu Gly Thr Ile Arg Lys Ile Gly Ser Thr Lys Glu Glu 325 330 335 Lys Ile Asp Val Arg Ile Ile Ala Ala Thr Asn Lys Asn Leu Glu Glu 340 345 350 Met Val Ser Asn Gly Lys Phe Arg Glu Asp Leu Tyr Tyr Arg Leu Asn 355 360 365 Val Val Pro Ile Glu Ile Pro Pro Leu Arg Glu Arg Lys Glu Asp Ile 370 375 380 Gln Leu Leu Val Asp Asn Phe Val Lys Ala Leu Asn Lys Ser Leu Asn 385 390 395 400 Lys Asn Ile Arg Tyr Ile Asp Lys Lys Phe Ile Asn Lys Leu Leu Lys 405 410 415 Tyr Asn Phe Pro Gly Asn Ile Arg Glu Leu Gln Asn Ile Ile Glu Arg 420 425 430 Thr Met Asn Leu Cys Ser Asp Asn Ile Leu Ser Asp Lys Asn Leu Ser 435 440 445 Ile Asn Thr Asn Ile Thr Leu Asn Asn Asp Lys Asn Asn Asp Ser Gly 450 455 460 Ala Leu Leu Leu Gln Asp Ile Val Glu Lys Ala Glu Lys Cys Ala Ile 465 470 475 480 Gln Lys Val Met Asn Glu Tyr Lys Ser Leu Arg Lys Val Gly Lys Val 485 490 495 Leu Gly Val Ser His Thr Thr Val Met Asn Lys Ile Lys Lys Tyr Gly 500 505 510 Ile Val Cys Lys 515 <210> 970 <211> 400 <212> PRT <213> Clostridium botulinum <400> 970 Met Glu Asn Ile Lys Lys Met Gly Phe Ala Thr Lys Ala Ile His Gly 1 5 10 15 Gly Leu Ile Gly Asp Lys Gln Phe Gly Ser Leu Ala Thr Pro Ile Tyr 20 25 30 Gln Thr Ser Thr Phe Ile Phe Asp Ser Ala Glu Gln Gly Gly Arg Arg 35 40 45 Phe Ala Gly Glu Glu Ser Gly Tyr Ile Tyr Ser Arg Leu Gly Asn Pro 50 55 60 Thr Ser Thr Glu Val Glu Asn Lys Leu Ala Leu Leu Glu Cys Gly Glu 65 70 75 80 Ala Ala Val Val Ala Ala Ser Gly Met Gly Ala Ile Ala Ala Ser Leu 85 90 95 Trp Ser Ala Leu Lys Ser Gly Asp His Val Val Ala Ser Asp Thr Leu 100 105 110 Tyr Gly Cys Thr Phe Ala Leu Leu Asn His Gly Leu Thr Arg Tyr Gly 115 120 125 Val Glu Val Thr Phe Val Asp Val Ser Asn Leu Asp Glu Val Arg Asn 130 135 140 Ala Leu Lys Ala Asn Thr Lys Val Val Tyr Leu Glu Thr Pro Ala Asn 145 150 155 160 Pro Thr Leu Lys Val Thr Asp Ile Lys Gln Ile Ser Asn Met Val His 165 170 175 Glu Asn Asn Lys Glu Cys Leu Val Phe Val Asp Asn Thr Phe Cys Thr 180 185 190 Pro Tyr Ile Gln Arg Pro Leu Gln Leu Gly Ala Asp Val Val Val His 195 200 205 Ser Ala Thr Lys Tyr Leu Asn Gly His Gly Asp Val Ile Ala Gly Phe 210 215 220 Ala Val Gly Lys Glu Glu Phe Ile Asn Gln Val Lys Leu Phe Gly Ile 225 230 235 240 Lys Asp Met Thr Gly Ser Val Ile Gly Pro Phe Glu Ala Phe Leu Ile 245 250 255 Ile Arg Gly Met Lys Thr Leu Gln Leu Arg Met Glu Lys His Cys Lys 260 265 270 Asn Ala Met Glu Val Ser Lys Phe Leu Glu Ser His Pro Ala Val Lys 275 280 285 Lys Val Tyr Tyr Pro Gly Leu Glu Ser Phe Glu Tyr Tyr Glu Leu Ala 290 295 300 Lys Lys Gln Met Ser Leu Pro Gly Ala Met Ile Ser Phe Glu Leu Lys 305 310 315 320 Gly Gly Val Glu Glu Gly Lys Val Val Met Asn Asn Val Lys Leu Ala 325 330 335 Thr Leu Ala Val Ser Leu Gly Asp Ala Glu Thr Leu Ile Gln His Pro 340 345 350 Ala Ser Met Thr His Ser Pro Tyr Thr Ala Glu Glu Arg Lys Glu Ala 355 360 365 Gly Ile Ser Asp Gly Leu Val Arg Leu Ser Val Gly Leu Glu Asp Val 370 375 380 Gly Asp Ile Ile Ser Asp Leu Lys Gln Ala Leu Asp Leu Ile Val Lys 385 390 395 400 <210> 971 <211> 145 <212> PRT <213> Clostridium botulinum <400> 971 Met Asn Asp Tyr Ile Glu Tyr Ala Ile Ile Glu Ala Lys Lys Ala Leu 1 5 10 15 Ala Ile Gly Glu Val Pro Val Gly Ala Ile Ile Val Lys Glu Asn Lys 20 25 30 Ile Ile Ala Lys Ser His Asn Leu Lys Glu Ser Leu Lys Asp Pro Thr 35 40 45 Ala His Ala Glu Ile Leu Ala Ile Lys Glu Ala Cys Asn Thr Ile His 50 55 60 Asn Trp Arg Leu Lys Gly Cys Lys Met Tyr Val Thr Leu Glu Pro Cys 65 70 75 80 Ala Met Cys Ala Ser Ala Ile Ile Gln Ser Arg Ile Ser Glu Leu His 85 90 95 Ile Gly Thr Phe Asp Pro Val Gly Gly Ala Cys Gly Ser Val Val Asn 100 105 110 Ile Thr Asn Asn Ser Tyr Leu Lys Asn Asn Leu Asn Ile Lys Trp Leu 115 120 125 Tyr Asp Asp Glu Cys Ser Arg Ile Ile Thr Asn Phe Phe Lys Asn Ile 130 135 140 Arg 145 <210> 972 <211> 541 <212> PRT <213> Clostridium botulinum <400> 972 Met Gly Tyr Thr Ala Leu Tyr Arg Glu Trp Arg Pro Arg Thr Phe Lys 1 5 10 15 Glu Val Val Gly Gln Lys His Ile Thr Val Thr Leu Lys Asn Gln Val 20 25 30 Ile Glu Lys Arg Ile Ala His Ala Tyr Leu Phe Cys Gly Thr Arg Gly 35 40 45 Thr Gly Lys Thr Ser Thr Ala Lys Ile Leu Ser Lys Ala Val Asn Cys 50 55 60 Leu Asn Pro Lys Asp Gly Glu Pro Cys Asn Glu Cys Glu Ile Cys Asn 65 70 75 80 Lys Ile Asn Ser Gly Thr Leu Met Asp Val Ile Glu Met Asp Ala Ala 85 90 95 Ser Lys Arg Lys Leu Glu Asp Ile Lys Glu Val Ile Glu Asn Val Lys 100 105 110 Tyr Pro Pro Gln Glu Gly Lys Asn Lys Val Tyr Ile Met Asp Glu Val 115 120 125 His Met Leu Thr Gln Glu Ala Val Asn Ala Phe Leu Lys Thr Leu Glu 130 135 140 Glu Pro Pro Ser Asn Val Ile Phe Ile Leu Ala Thr Thr Asp Pro Gln 145 150 155 160 Lys Leu Pro Ile Thr Ile Leu Ser Arg Cys Gln Arg Phe Asp Phe Arg 165 170 175 Arg Ile Arg Asn Glu Glu Ile Phe Glu Arg Leu Arg Ala Ile Val Ser 180 185 190 Glu Gln Gly Ile Tyr Ala Asp Asp Lys Ser Leu Asn Leu Ile Ala Arg 195 200 205 Met Ser Asp Gly Ala Met Arg Asp Ala Leu Ser Ile Leu Asp Gln Val 210 215 220 Ile Ser Thr Gly Asp Gly Lys Val Glu Tyr Asp Gln Val Leu Asp Met 225 230 235 240 Leu Gly Leu Val Thr Asn Glu Asn Leu Leu Arg Ile Thr Asn Ser Ile 245 250 255 Ile Glu Lys Asp Val Glu Lys Ser Met Arg Ile Ile Glu Asp Ile Val 260 265 270 Leu Ser Gly Lys Asp Ile Tyr Asn Phe Ile Lys Asp Met Ile Thr His 275 280 285 Leu Arg Asn Ile Leu Met Val Lys Val Ser Lys Asn Pro Asn Glu Ile 290 295 300 Leu Asp Met Ser Ser Glu Asn Ile Asp Leu Val Lys Glu Gln Ser Glu 305 310 315 320 Lys Ile Arg Ile Glu Glu Ile Met Arg Asp Ile Lys Ile Leu Gln Glu 325 330 335 Ala Glu Gln Gln Ser Lys Trp Val Lys Gln Asn Arg Ile Tyr Leu Glu 340 345 350 Leu Ala Val Leu Lys Met Cys Lys Ile Glu Tyr Asp Thr Ser Lys Glu 355 360 365 Val Ile Leu Ser Arg Leu Asn Lys Ile Glu Glu Leu Ile Lys Ser Gly 370 375 380 Asn Ile Lys Leu Ala Ile Asn Glu Glu Lys Lys Lys Ile Glu Pro Lys 385 390 395 400 Glu Phe Asn Leu Lys Arg Glu Lys Glu Ser Ile Gln His Ser Lys Ile 405 410 415 Glu Lys Asn Ser Leu Glu Asp Tyr Asn Lys Asp Ser Lys Leu Thr Val 420 425 430 Glu Thr Val Lys Lys Met Trp Arg Asp Ile Leu Glu Ala Phe Lys Ala 435 440 445 Arg Arg Leu Met Val Leu Tyr Ala Ala Leu Val Thr Ala Asn Ile Thr 450 455 460 Asp Cys Lys Glu Gly Ile Ile Thr Leu Asn Tyr Asn Lys Gln Tyr Ser 465 470 475 480 Phe Asn Lys Lys Arg Leu Glu Lys Pro Glu Asn Asn Lys Val Val Gln 485 490 495 Glu Ile Phe Ser Glu Val Leu Lys Glu Lys Ile Arg Ile Ile Tyr Ile 500 505 510 Val Glu Glu Lys Ala Lys Glu Glu Asn Leu Pro Glu Glu Ile Leu Lys 515 520 525 Asn Thr Phe Gly Glu Asn Ile Leu Glu Ile Ile Asp Glu 530 535 540 <210> 973 <211> 113 <212> PRT <213> Clostridium botulinum <400> 973 Met Ala Arg Gly Gly Phe Pro Asn Met Gly Gly Ala Asn Met Asn Asn 1 5 10 15 Leu Met Lys Gln Ala Gln Lys Leu Gln Gln Asp Met Glu Lys Met Gln 20 25 30 Gly Glu Met Glu Lys Lys Glu Phe Ser Ala Thr Val Gly Gly Gly Ala 35 40 45 Val Thr Ala Val Ala Asn Gly Lys Lys Gln Ile Val Asp Ile Lys Ile 50 55 60 Glu Pro Glu Val Val Asp Glu Asp Asp Ile Glu Met Leu Glu Asp Leu 65 70 75 80 Ile Met Ser Ala Cys Asn Glu Ala Leu Lys Lys Ala Glu Glu Asp Thr 85 90 95 Ser Ser Glu Val Lys Arg Leu Thr Gly Gly Met Asn Leu Pro Gly Met 100 105 110 Phe <210> 974 <211> 198 <212> PRT <213> Clostridium botulinum <400> 974 Met Asp Phe Tyr Pro Ile Ala Ile Glu Lys Leu Ile Glu Glu Phe Ala 1 5 10 15 Lys Leu Pro Gly Ile Gly Tyr Lys Thr Ala Gln Arg Leu Thr Leu Tyr 20 25 30 Val Leu Asn Leu Pro Lys Glu Glu Val Lys Glu Phe Ser Glu Ala Leu 35 40 45 Val Lys Ala Arg Gly Thr Ile Lys Tyr Cys Ser Val Cys Gly Asn Phe 50 55 60 Thr Asp Lys Asp Pro Cys Ala Ile Cys Ser Asn Pro Asn Arg Asn Lys 65 70 75 80 Ser Ile Ile Cys Val Ile Glu Gln Pro Lys Asp Ile Met Ser Met Glu 85 90 95 Lys Ile Arg Glu Tyr Asn Gly Val Tyr His Val Leu His Gly Asn Ile 100 105 110 Ser Pro Met Ala Gly Arg Gly Pro Glu Asp Ile Lys Leu Lys Glu Leu 115 120 125 Ile Arg Arg Ile Asp Gly Ser Val Asn Glu Val Ile Val Ala Thr Asn 130 135 140 Pro Asn Val Glu Gly Glu Ala Thr Ala Met Tyr Ile Ser Lys Ile Leu 145 150 155 160 Lys Pro Leu Gly Val Lys Val Thr Arg Ile Ala His Gly Val Pro Val 165 170 175 Gly Gly Asp Leu Glu Tyr Ala Asp Glu Val Thr Leu Ala Lys Ala Leu 180 185 190 Glu Gly Arg Ile Glu Leu 195 <210> 975 <211> 87 <212> PRT <213> Clostridium botulinum <400> 975 Met Gly Gly Phe Phe Ile Met Lys Lys Leu Asn Asp Gly Lys Asn Glu 1 5 10 15 Lys Lys Leu Leu Leu Glu Ser Ile Asp Ser Val Ile Ser Glu Ile Asn 20 25 30 Asn Ile Arg Arg Leu Phe Glu Asn Ala Ser Asp Pro Lys Leu Ile Asp 35 40 45 Tyr Ala Ile Tyr Met Glu Glu Ala Leu Lys Ala Lys Tyr Ile Tyr Leu 50 55 60 Leu Lys Glu Ala Lys Glu Glu Gly Ile Lys Val Glu Tyr Cys Asp Thr 65 70 75 80 Ile Lys Glu Val Glu Val Gly 85 <210> 976 <211> 86 <212> PRT <213> Clostridium botulinum <400> 976 Met Gly Ile Glu Tyr Ile Ala Tyr Phe Ile Leu Ala Ile Phe Leu Leu 1 5 10 15 Phe Val Val Val Lys Ile Phe Ser Trp Pro Leu Lys Ile Leu Leu Ser 20 25 30 Leu Ile Gly Asn Ala Ile Leu Gly Thr Val Leu Leu Phe Ile Leu Asn 35 40 45 Val Ile Gly Gly Ala Phe Asn Phe Tyr Ile Gly Ile Asn Ile Trp Thr 50 55 60 Ala Leu Ile Ala Gly Phe Phe Gly Ile Pro Gly Val Ile Phe Leu Ile 65 70 75 80 Ile Phe Lys Leu Phe Leu 85 <210> 977 <211> 230 <212> PRT <213> Clostridium botulinum <400> 977 Met Lys Ile Thr Lys Asn Ile Leu Lys Ala Glu Phe Ile Lys Arg Pro 1 5 10 15 Asn Arg Phe Gln Ala Tyr Val Lys Ile Asn Glu Lys Ile Glu Met Val 20 25 30 His Val Pro Asn Thr Gly Arg Cys Lys Glu Ile Leu Ile Pro Gly Ser 35 40 45 Thr Val Ile Leu Arg Glu Glu Asn Asn Glu Asn Arg Lys Thr Arg Tyr 50 55 60 Asp Leu Ile Ala Gly Tyr Lys Gly Asp Met Leu Ile Ser Ile Asp Ser 65 70 75 80 Gln Ile Pro Asn Lys Val Val Tyr Glu Ala Leu Met Asn Phe Lys Ile 85 90 95 Glu Ile Leu Lys Glu Tyr Thr Asn Ile Lys Arg Glu Lys Thr Phe Gly 100 105 110 Lys Ser Arg Phe Asp Phe Arg Leu Glu Lys Glu Asn Gly Glu Val Tyr 115 120 125 Tyr Leu Glu Val Lys Gly Val Thr Leu Glu Asn Asp Gly Leu Thr Met 130 135 140 Phe Pro Asp Ala Pro Thr Glu Arg Gly Thr Lys His Ile Leu Glu Leu 145 150 155 160 Ile Asp Val Lys Asn Lys Gly Met Gly Ala Gly Val Leu Phe Leu Ile 165 170 175 Gln Leu Asn Gly Val Lys Lys Phe Thr Pro Asn Tyr Lys Met Asp Lys 180 185 190 Asn Phe Gly Glu Ala Leu Arg Leu Ala Lys Glu Lys Gly Val Asp Ile 195 200 205 Leu Ala Tyr Asp Cys Leu Val Glu Glu Ser Ser Ile Ser Leu Asn Asn 210 215 220 Pro Val Ser Ile Glu Ile 225 230 <210> 978 <211> 162 <212> PRT <213> Clostridium botulinum <400> 978 Met Lys Phe Lys Tyr Cys Pro Leu Cys Gly Glu Lys Leu Ile Glu Lys 1 5 10 15 Tyr Ser Trp Asp Glu Gly Gly Val Pro Tyr Cys Lys Arg His Asn Ile 20 25 30 Met Tyr Phe Asp Thr Pro Lys Pro Cys Ile Val Val Gly Val Leu Lys 35 40 45 Glu Asp His Val Leu Leu Leu Lys Gln Ser Tyr Ile Phe Lys Asn Ser 50 55 60 Lys Val Leu Leu Ser Gly Tyr Val Ser Ser Gly Glu Thr Val Glu Glu 65 70 75 80 Ala Val His Arg Glu Val Lys Glu Glu Ala Gly Ile Asn Ile Arg Asp 85 90 95 Leu Lys Tyr Leu Gly Ser Asp Tyr Leu Glu Ser Lys Asp Ile Val Met 100 105 110 Ile Thr Phe Met Ala Thr Tyr Arg Asp Gly Ile Leu Asn Lys Ser Glu 115 120 125 Glu Val Glu Trp Ile Asp Trp Ile Pro Ile Lys Glu Ala Ile Asp His 130 135 140 Met Glu Glu Asp Glu Ile Gly Lys Lys Ile Ile Lys Lys Ile Met Lys 145 150 155 160 Asn Cys <210> 979 <211> 240 <212> PRT <213> Clostridium botulinum <400> 979 Met Ser Asn Lys Ile Glu Lys Thr Pro Lys Arg Val Pro Glu Ile Lys 1 5 10 15 Gly Val Leu Arg Ser His Met Ile Glu Val Pro Ser Ile Ile Arg Glu 20 25 30 Ala Ser Gly Ile Lys Val Phe Gly Lys Arg Ile Lys Ser Phe Val Tyr 35 40 45 Ser Thr Asp Val Ala Val Ile Lys Asn Thr Asn Ala Asp Ala Val Ile 50 55 60 Ala Val Tyr Pro Phe Thr Pro Gln Pro Ile Ile Thr Gln Ser Leu Val 65 70 75 80 Leu Ala Ala Asp Ile Pro Val Phe Cys Gly Val Gly Gly Gly Leu Thr 85 90 95 Thr Gly Lys Arg Val Val Asn Leu Ala Leu Asp Ala Glu Phe Lys Gly 100 105 110 Ala Met Gly Val Val Ile Asn Asn Pro Thr Pro Asn Asp Val Leu Gln 115 120 125 Gln Ile Lys Asp Thr Ile Asp Ile Pro Ile Val Val Thr Val Val Ser 130 135 140 Glu Tyr Glu Asp Ile Glu Ala Arg Ile Asn Ser Gly Ala Thr Ile Leu 145 150 155 160 Asn Ile Ser Gly Ala Lys Lys Thr Ala Tyr Ile Val Arg Glu Ile Arg 165 170 175 Lys Arg Tyr Pro Asp Phe Pro Ile Ile Ala Thr Gly Gly Pro Asn Glu 180 185 190 Ala Ser Ile Lys Glu Thr Ile Glu Ala Gly Ala Asn Ala Ile Thr Tyr 195 200 205 Thr Pro Pro Pro Ala Ser Asp Ile Phe Ser Glu Val Met Asp Lys Tyr 210 215 220 Arg Val Asn Phe Lys Lys Glu His Asp Arg Glu Glu Asn Glu Gln Ser 225 230 235 240 <210> 980 <211> 262 <212> PRT <213> Clostridium botulinum <400> 980 Met Asn Gly Ile Leu Phe Tyr Phe Ser Gly Thr Gly Asn Thr Lys Trp 1 5 10 15 Val Ala Asp Arg Ile Gly Asp Lys Leu Cys Lys Leu Asp Asn Thr Ile 20 25 30 His Lys Val Asn Ile Glu Asn Leu Asp Asp Asp Val Leu Ile Lys Ile 35 40 45 His Asn Tyr Asp Phe Ile Ile Ile Gly Thr Pro Ile Tyr Ala Glu Met 50 55 60 Gly Pro Lys Leu Ile Gln Asp Phe Val Asn Asn Ile Pro Lys Val Lys 65 70 75 80 Glu Lys Ile Lys Cys Ile Leu Tyr Ser Thr Gln Gly Gly Asn Ser Gly 85 90 95 Cys Glu Thr Glu Ser Met His Lys Ile Leu Cys Asn Lys Gly Tyr Asp 100 105 110 Val Val Ile Lys Val Asn Ile Lys Met Ile Asn Asn Tyr Tyr Phe Ser 115 120 125 Val Gly Lys Lys Pro Asp Glu Ala Glu Met Ala Asn Ile Leu Arg Asp 130 135 140 Ala Glu Lys Lys Val Asp Leu Val Val Asp Lys Phe Ser Lys Gly Glu 145 150 155 160 Val Tyr Leu Glu Asn Ile Ser Lys Thr Arg Val Phe Leu Gly Lys Ile 165 170 175 Ala Ser Lys Gly Phe Asn Lys Phe Leu Pro Lys Leu Ser Asn Asn Leu 180 185 190 Lys Ser Thr Glu His Cys Ile Lys Cys Gly Met Cys Val Arg Asn Cys 195 200 205 Pro Lys Gly Asn Ile Val Phe Glu Asn Gly Gly Val Val Phe His Ser 210 215 220 Asn Cys Ile Leu Cys Leu Arg Cys Ile Tyr Ile Cys Pro Ser Asn Ala 225 230 235 240 Ile Val Tyr Lys Glu Lys Arg Ile Asp Gln Ile Glu Lys Asn Ile Ile 245 250 255 Lys Leu Leu Asp Ile Lys 260 <210> 981 <211> 53 <212> PRT <213> Clostridium botulinum <400> 981 Met Asn Ile Asn Asn Asp Asn Cys Ser Lys Cys Ile Asn Ile Leu Lys 1 5 10 15 Ser Asn Cys Asn Gly Asn Leu Glu Asn Cys Ile Cys Gln Lys Cys Val 20 25 30 Arg Asn Ile Glu Lys Cys Ile Ile Thr Lys Tyr Cys Ser Glu Thr Glu 35 40 45 Ser Thr Leu Ser Ile 50 <210> 982 <211> 234 <212> PRT <213> Clostridium botulinum <400> 982 Met Glu Asn Trp Leu Gln Arg Thr Glu Phe Leu Ile Gly Lys Glu Ala 1 5 10 15 Ile Glu Lys Leu Asn Lys Ser Lys Ile Val Val Leu Gly Val Gly Gly 20 25 30 Val Gly Ser Phe Val Ile Glu Ala Leu Val Arg Ser Gly Val Gly Asn 35 40 45 Ile Thr Ile Val Asp Asn Asp Thr Ile Asp Ile Thr Asn Ile Asn Arg 50 55 60 Gln Ile His Ala Asn Leu Asn Thr Val Gly Lys Ser Lys Val Glu Val 65 70 75 80 Met Lys Glu Arg Ile Leu Ser Ile Asn Pro Asn Cys Asn Val Lys Ile 85 90 95 His Glu Glu Phe Ile Asn Lys Asp Asn Ile Ser Glu Leu Val Ala Lys 100 105 110 Asp Thr Asp Tyr Val Val Asp Ala Ile Asp Thr Ala Ser Ser Lys Ile 115 120 125 Leu Ser Ile Val Trp Cys Asp Lys Asn Asn Ile Asn Ile Ile Ser Ser 130 135 140 Met Gly Thr Ala Asn Lys Leu His Pro Thr Lys Leu Arg Ile Ala Asp 145 150 155 160 Ile Tyr Asp Thr Lys Val Cys Pro Leu Ala Lys Ile Met Arg Tyr Glu 165 170 175 Leu Arg Lys Arg Asn Ile Lys Ser Leu Lys Val Leu Tyr Ser Glu Glu 180 185 190 Thr Pro Ile Lys Asn Asn Asn Arg Pro Leu Asn Asp Lys Gly Arg Pro 195 200 205 Thr Pro Ala Ser Ile Ala Phe Val Pro Pro Cys Ala Gly Leu Ile Ile 210 215 220 Ala Gly Glu Val Val Arg Asp Ile Ile Lys 225 230 <210> 983 <211> 369 <212> PRT <213> Clostridium botulinum <400> 983 Met Ile Leu Val Ala Val Cys Asp Ser Thr Arg Gly Ile Phe Ile Pro 1 5 10 15 Ile Phe Lys Asn Glu Phe Asn Ile Asn Asn Thr Lys Ile Gly Leu Met 20 25 30 Ile Thr Ile Ser Thr Leu Gly Tyr Thr Val Phe Thr Tyr Leu Gly Gly 35 40 45 Ile Leu Cys Gln Lys Lys Gly Gln Lys Arg Val Tyr Ser Ile Gly Leu 50 55 60 Leu Ile Ile Ser Ile Ser Phe Leu Leu Leu Asn Phe Thr Pro Asn Tyr 65 70 75 80 Ile Ile Leu Ile Ile Leu Met Phe Leu Ile Asn Gly Gly Gln Ala Phe 85 90 95 Leu Ala Ile Ser Ser Asn Thr Ile Ile Pro Ile Ile Phe Ile Ser Phe 100 105 110 Gln Ala Ile Ile Met Asn Leu Ala His Phe Asn Tyr Gly Met Gly Leu 115 120 125 Ala Leu Ser Gln Arg Ile Ser Gly Met Leu Leu Tyr Arg Gly Ile Thr 130 135 140 Trp Arg Arg Ile Tyr Leu Tyr Leu Ser Ile Ile Thr Phe Ile Val Tyr 145 150 155 160 Leu Leu Leu Phe Phe Ile Asn Ile Pro Val Ile Asn Lys Ser Lys Asp 165 170 175 Asp Asn Lys Leu Lys Ser Lys Glu Ile Phe Lys Asp Lys Leu Leu Tyr 180 185 190 Phe Tyr Ile Phe Ala Leu Gly Phe Tyr Val Phe Ser Glu Ile Ala Thr 195 200 205 Gly Asn Trp Phe Val Asn Leu Met Glu Asn Gly Tyr Arg Tyr Asn Lys 210 215 220 Asn Gln Ser Ser Tyr Tyr Ile Phe Leu Phe Ser Ala Leu Phe Ala Leu 225 230 235 240 Gly Arg Leu Leu Gly Gly Phe Leu Val Glu Lys Phe Asn Tyr Ile Lys 245 250 255 Ala Val Cys Thr Ser Leu Ala Val Ala Leu Met Met Tyr Thr Ile Gly 260 265 270 Ile Thr Leu Gly Gln Lys Gly Leu Ile Leu Ile Ser Leu Ser Gly Ile 275 280 285 Phe Phe Ser Ile Val Tyr Pro Thr Val Val Leu Thr Ile Ser Lys Val 290 295 300 Tyr Ser Thr Asn Ser Ser Tyr Val Thr Gly Ile Val Val Thr Leu Ser 305 310 315 320 Ser Phe Val Asn Met Ile Ile Ser Phe Leu Met Gly Tyr Leu Asn Asp 325 330 335 Leu Ile Gly Ile Tyr Thr Ser Tyr Tyr Leu Ile Pro Ile Ser Leu Phe 340 345 350 Ile Ser Leu Met Phe Met Phe Leu Ile His Lys Asn Ile Lys Lys Leu 355 360 365 Ala <210> 984 <211> 314 <212> PRT <213> Clostridium botulinum <400> 984 Met Asn Asn Lys Phe Lys Val Ser Ile Glu Leu Ala Lys Gly Thr Val 1 5 10 15 Asp Glu Tyr Ile Val Lys Asp Ile Thr Gly Ile Ser Ile Gly Arg Ile 20 25 30 Phe Ile Leu Glu Leu Ser Lys Lys Asn Lys Tyr Gly Cys Phe Arg Leu 35 40 45 Asn Leu Tyr Arg Asp Gly Glu Asn Ser Asn Ile Tyr Leu Asn Tyr Ile 50 55 60 Leu Lys Asp Phe Leu Gln Tyr Leu Phe Tyr Lys Lys Glu Val Cys Lys 65 70 75 80 Ile Asn Ile Ile Ile Asn Glu Asn Met Asn Thr Asn Val Phe Ile Glu 85 90 95 Tyr Gly Phe Tyr Leu Glu Gly Ile Ile Asn Asp Ser Arg Leu Ile Asp 100 105 110 Gly Ile Lys Thr Ser Glu Phe Leu Phe Gly Leu Asp Ile Asp Thr Phe 115 120 125 Arg Lys Ala Asn Leu Tyr Lys Glu Leu Ser Ile Glu Gly Lys Asn Ile 130 135 140 Ser Leu Lys Leu Leu Thr Pro Ile Asn Ala Gln Glu Leu Leu Asp Tyr 145 150 155 160 Tyr Ile Arg Asn Glu Arg His Leu Lys Ser Tyr Glu Pro Thr Arg Asp 165 170 175 Lys Thr Phe Tyr Thr Leu Lys Glu Gln Arg Asp Leu Leu Met Asp Ser 180 185 190 Tyr Lys Gln Tyr Leu Asn Gly Asn Ser Leu Glu Leu Gly Ile Tyr Lys 195 200 205 Asp Lys Lys Phe Ile Gly Lys Ile Lys Ile Ser Asn Ile Ile Met Gly 210 215 220 Ile Phe Lys Asn Cys Ile Val Gly Tyr Ser Ile Asp Lys Asp Phe Gln 225 230 235 240 Gly Asn Gly Tyr Met Lys Glu Ala Leu Lys Leu Leu Ile Asp Tyr Thr 245 250 255 Phe Asn Glu Ile Asp Ile His Arg Ile Glu Ala Ser Thr Leu Ile Asp 260 265 270 Asn Ile Arg Ser Gln Lys Val Leu Glu Gly Cys Gly Phe Lys Lys Leu 275 280 285 Gly Ile Asn Glu Lys Tyr Leu Tyr Ile Asp Gly Lys Trp Gln Asp His 290 295 300 Val Thr Tyr Tyr Ile Val Asn Asn Asn Ile 305 310 <210> 985 <400> 985 000 <210> 986 <400> 986 000 <210> 987 <400> 987 000 <210> 988 <400> 988 000 <210> 989 <400> 989 000 <210> 990 <400> 990 000 <210> 991 <400> 991 000 <210> 992 <400> 992 000 <210> 993 <400> 993 000 <210> 994 <400> 994 000 <210> 995 <400> 995 000 <210> 996 <400> 996 000 <210> 997 <400> 997 000 <210> 998 <400> 998 000 <210> 999 <400> 999 000 <210> 1000 <400> 1000 000 <210> 1001 <211> 1533 <212> DNA <213> Ricinus communis <220> <221> modified_base <222> (350)..(351) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (365)..(366) <223> a, c, t, g, unknown or other <400> 1001 atggctgcag gattggccat tacaagtgaa gggggtcagt acaatggcag gatgacctcc 60 tttgttgctc tatcttgcat gatggctgcc atgggaggag tcatttttgg ctatgatatt 120 ggagtttcag gtggtgtgac atcaatggat cccttcttga agaaattctt tccggatgtg 180 tacaggaaaa tgaaagaaga cacagaaatt agcaactact gcaagtttga tagtcaactt 240 ttaacctcct tcacatcctc actatatgtt gctggccttg ttgcttcctt cttcgcctcg 300 tcggtcacta gagcttttgg gcgcaagcca tcaattcttt taggcggtgn ngttttcctt 360 gccgnngcag cccttggtgg tgctgcagtt aatgtgtata tgttgatatt tggccgcgtc 420 ttgcttggag ttggtgtcgg ttttgcaaac caggcagttc cactttatct gtctgaaatg 480 gcaccgccaa gatatagagg ggcaatcaac aacggcttcc aatttagtgt tggtattggg 540 gcattgtctg ccaaccttat aaactatgga actgaaaaga ttgaaggtgg ctggggttgg 600 cgaatttccc tagcaatggc agcagttcca gctgcaatcc tgacatttgg tgcacttttc 660 ctcccagaga cacccaatag cctgattcag cgcagcaatg atcatgagag agccaaactt 720 atgttacaac gtgtgcgagg taccactgat gtccaagcag aacttgacga tctcatcaaa 780 gctagcataa tctcaagaac tattcagcac ccatttaaga atataatgcg aagaaagtat 840 cggcctcaac tagtaatggc agtagccata ccatttttcc agcaagtaac agggatcaat 900 gtcattgcat tttatgctcc aatacttttc aggacaatcg gcctggaaga aagtgcatcc 960 ctcttatctt ctattgtgac agggcttgtg ggtagtgcgt caacgttcat atcgatgctt 1020 atagtcgata aacttggaag aagagcattg tttatatttg ggggtgtaca gatgtttgta 1080 gcacagataa tggttgggag tattatggca gctgagctag gcgatcatgg tggtataggt 1140 aaagggtatg cttatatagt tctgattttg atctgtattt acgtggctgg attcgggtgg 1200 tcatggggtc ctcttggatg gttggttcct agtgagatat tcccattaga gattcgatca 1260 gcagggcaaa gtattgtggt ggcagtgagc tttttattca ctttcgttgt tgcacaaact 1320 tttctatcta tgctttgcca cttcaaatct ggaattttct tcttttttgg aggatgggtt 1380 gtagtgatga ctgcctttgt gcactttttg ctgccagaga cgaagaaggt gccaattgag 1440 aaaatggata tagtgtggag ggaccactgg ttttggaaga aaattatagg ggaagaagct 1500 gctgaggaaa ataataaaat ggaagcagca tga 1533 <210> 1002 <211> 660 <212> DNA <213> Ricinus communis <400> 1002 atggctgatg aggtgatact tttggatttc tgggcaagtc cttttgggat gagagttaga 60 atagcactag cagagaaagg agtaaagtat gagtatagag aagagaattt aaggaacaaa 120 agccctcttc ttttggagat gaatccagtt cataaaaaga ttcctgttct catccataat 180 ggaaaaccca tttgtgaatc acttattgct gttcaatata ttgatgaggt ttggcatgat 240 gagtctcctc ttttgccttc tgattcttac ccaagagcac atgctagatt ctgggctgat 300 tttgttgaca agaagattta tgaacttggg aggaagatat ggactacaaa aggagaggat 360 caggaggcgg gcaagaaaga attcatcgac gccattaagt tgttggaagg tgagcttgga 420 gacaagccgt actttggtgg tgagagcttt gggtatgttg atgttgcact tatcccattc 480 tattcctggt tttatgccta tgaaacctgt gggaacttca gcatagaggc tgagtgtccc 540 aagttcatgg catggattaa gaggtgcctg cagaaagagt ctgtctccaa ggcccttcct 600 gaccagcaga aggtctatga atttgttttg gagctgaaga aggtatttgg tattgagtaa 660 <210> 1003 <211> 618 <212> DNA <213> Ricinus communis <400> 1003 atggacaaaa gcaaagtaag cacagcagtt ggaggggaga ctccagtagg attaattacg 60 ggttcaagag atgatgagtt agaaagtggc tccatgcgca cagccgagac tgtgctgcgg 120 cttgtaccca tggctttttg catctcagct cttgttctca tgctcaagaa ttctcagact 180 aatgactttg gcactctttc ctactcagat cttggagctt tcaggtattt ggtgcatgcc 240 aatggcatat gtgctggcta ttcccttctg tcagctatca ttgtagccat gcctcgacca 300 tccaccatgt cccgagcctg gacattcttc ttccttgacc aggtgttgac atatgtaatc 360 ttggcggcag ccgccgtgtc tgtggaggcg ttgtacctgg ccagaaaggg ggacattgcc 420 atcacctgga gtgcagcttg tgtgtctttt ggtggattct gccacaaggc cataacatct 480 gctgtcatca catttattgt agtagtctgc tatgcactac tttcacttgt ctcctcctac 540 aagcttttta gcagatatgg tgcaccagat gtgagctacc caggcaaggg gattgaggtt 600 gctgcctttc acagttaa 618 <210> 1004 <211> 3102 <212> DNA <213> Ricinus communis <400> 1004 atgggttcaa tggtagttct tgttgggagc atgccgtctt tggcttcctt gattagctta 60 ggaagtttaa gtgtggcagc agcgacttct agttcttcag actcatatta ttcatcctca 120 tattcacttg ttcgaagagt ttctttatcg aaaaggggtc ttaagagtgc caaaagatgg 180 cattgcgttt gtaaatgctc tgttactacc acagatttta ttgctgatca aggcaatgct 240 gtatccattg attctaataa ttcatttaga gcaagcagta atggtggaga tgctgacagt 300 gaaatcttgc ttaagcctgc tcctaggcct gtcttaaaac cttcattagg gtctaaaggt 360 gattcccttt taggtatgag ctcttctcag ttgaattctg gagattctga taatgatgat 420 gaacaagaga ggaataaagt aattgagtcg cttggtgagg tgttggagaa ggctgaaaag 480 cttgaaactt ctaaaccaag tggaccgggt aatcctagca gtagtgggaa agacaatgga 540 aatgtaaata aaataacacc acctaacatt ggtactaatt cacgaattgc taaatctgag 600 agttcaggag ccactcgtaa aactaaaact ttgaagagcg tgtggcgaaa aggggatact 660 gtgtcctccg tgcaaaaggt tgtaaaggaa gctcctaaag ttattaataa gcttgtgaaa 720 gaagatacta taacagggga aggcacaaag ctagaatctc aatctagttt tcctttaaga 780 cctgtgcagc cacccttgag acctcaacca aagttacagg caaagccatc tgtagctcct 840 cctcctgtga tgaaaaagcc tgttatcttg aaggatgtgg gagcagcccc aagaccacca 900 gttagtggtg aagctgattc gaaaaataat ggacggcagc ctattttagt tgataaattt 960 gcccgcaaaa aaccagttgt agatcctcta attgctcagg cagttttagc ccccacaaaa 1020 ccaggaaagg gcccagcccc tggaaaattc aaggaccgaa agaagagtat ttcacctgga 1080 ggaccaagga gacgacttgt taataatgat gaacttgaga ttcctgatga ggagacatca 1140 gaactgaatg tctctattcc aggtacagct aggaaaggga ggaagtggag taaagctagc 1200 cggaaggctg ccagactcca ggctgccaaa gatgcagctc ctgtcaaagt agaaatttta 1260 gaggttgggg aaaatggtat gttaattgag gagttagcct acaacttaac catcagtgaa 1320 ggtgaaattc ttgggtattt gtactcaaag gggattaaac ctgatggagt gcagactttg 1380 gataaggaca tggtaaagat gatatgcaag gaacacgatg tggaagtcat agatgttgct 1440 ccagttagat ttgaagaaat ggcaaggaaa agagaaattc ttgatgaaga tgatcttgac 1500 aaactagagg acaggcctcc agttctaact ataatggggc atgtggatca tggcaagaca 1560 actctactgg attacattcg taaaagcaag gtgactgcct cagaagctgg tggaattaca 1620 caaggaattg gagcatataa agtcctcaca cctgtggatg gaaaaatgca accttgtgtt 1680 tttcttgata ctcctggaca tgaggcattt ggtgcaatga gagctcgtgg ggcaagggtg 1740 acagatattg ctattattgt ggtggcagct gatgatggga tccgtcctca aacaaatgag 1800 gccatagctc atgcaaaagc agctggagtt ccaattgttg ttgctataaa caagatagat 1860 aaagatgggg ctaatccaga aagagtcatg caagatcttt cttcaattgg tcttatgcct 1920 gaagactggg gcggtgacat cccaatggtt cagattagtg ctctcaaggg ggataacata 1980 gatgatttgc tagaaactgt tatgcttgtt gctgagttac aagagttgaa ggctaatccg 2040 catagaaatg caaagggtac agttattgag gcaggtcttg ataaatccaa aggtccaata 2100 gctacattta ttatacagaa tggcacactt aaaagagggg atgttgtggt ttgcggagaa 2160 gcctttggaa aggttcgggc tttatttgat gatggtggaa aacgagtgga tgaagctgga 2220 ccatctattc ctgtacaggt tattggattg agtaacgtac caaaagctgg cgatgaattt 2280 gaggctgttg cctctcttga tattgcacgt gaaaaggcgg aagcacgtgc tgaattattg 2340 cgaaatgagc gaataacagc caaggctgga gatggcaaga ttacactatc ttccttagca 2400 tcagctgttt catcaggaag gctgtctgga atagacttgc accaactgaa tattatatta 2460 aaagttgatg ttcagggatc tgttgaagct gtccgacaag ccttacaggt gctccctcaa 2520 gataatgtca ccttgaagtt cctcttacaa gcaacagggg atgtaagctc aagtgatgtt 2580 gatcttgcca ttgccagtga agctattatt ttaggattta atgtcaaagc accgggttct 2640 gtcaagagca atgcagaaaa caaaggtgtt gagattcggc tatatagagt tatatatgat 2700 cttattgatg atgtacgaaa tgcaatggaa ggacttctag agcctgttga ggaacaagaa 2760 acaattgggt cagcagtagt tcgggctgta tttagcagtg gaagcggccg tgttgctgga 2820 tgcatggtaa cagatgggaa agtagtgaaa ggctgtggtg ttaaggttat tcgaaagcga 2880 aagacaatcc atgttggcgt tctcgattcc ttgagacgag taaaggaact tgtaaaagag 2940 gtaagtgctg ggctagagtg tggtattgca atggaagatt atgatgattg ggaggaagga 3000 gatactattg aagccttcaa tacagtcgag aagaagcgga cccttgaaga ggcatcggct 3060 tcgatggcag ctgcactgga acatgcaggt attaatgtgt ag 3102 <210> 1005 <211> 3498 <212> DNA <213> Ricinus communis <400> 1005 atggcagatc cagatcctta ttcttcttct tctacttctg atattccaca taacgatgtg 60 tcttggaact caaatcaaat cttggaatca gttgataccc aaatgctaat tgacccagtt 120 gccaataatg ggattgatgc aggacgttcg gtgctgggtt tttctttaac atcacctgat 180 cttgttattt gtgctggttc gtgtggagat tcacctgaat tctttaatag aacgacaaag 240 aactactctt ttgagctctc gttggagaat ggtatcaacg gtactaatac caaagatacc 300 cagaagattc agtctgtaaa gttttctcca atttgtcaaa cattcaacaa acaattgtct 360 cctgaatctt ccttagaaga gcttgttgca gaaccttcaa gaatgagaaa tgatgataat 420 ttgctaaaag atcctttaat tggtgtaagc attaatgtag gatctaccaa tgaaggtgtg 480 gtcttgaatg gtgtgcagtt tttggaggac acttgttaca ccggcggtga tactgtgaag 540 actaatgcta caattggaga tttagataga gaagaagatg gtctttcttt gtaccaaacg 600 gctcgttttg gtaacttctc gtattgcatt cctgcaatgg aaccagggaa ttatgttgtt 660 accttgcatc ttgctgaaat tgtattcact gatgggcctc ctggaaggag agtgtttgat 720 gtttttatac aagagaagaa ggttgtttct tccctagata tatatgctca agtaggtgca 780 aataagcctc tagttatatc tcaacttaag acttgtgtcg atggagagga gggcttaacc 840 attaggtttc aaggagttat tggaagtccc attgtatgtg gcatttctat aaccgaagat 900 tcttctgctc atgctggtga agctcaattt tcaaaacaaa tgggaatgtc ccaagtggca 960 gaatgcaact tactgaaaca atataatagt gagcaagagc cggatggaga tcatcagaag 1020 ctagaaagac acgttgagtt tcaggaaaag gaactgacgg aaatgaggag ggcattggag 1080 gagcttaaga gggaaaacca acttaagaat agggaatgcc aagacgcttg gaactcttta 1140 catgaactcc agaatgagct tatgcgcaag tctatgcatg ttgggtcatt ggcatttgcc 1200 attgaaggac aagttaaaga gaagagcaag tggttctcat ctttgaggga catgactaga 1260 aaattgaaga ttatgaggat agagcactta aagatatcag aggaggcact ggcatataag 1320 aaatgcctca gagatatgga ggaaatgagg tccactattc agtctacaat gaagcagcaa 1380 gtagatttgc acgaggacct caagattaaa tttattgaag gggagaagaa aagaaaggaa 1440 ctctacaaca gggttttaga gttgaaagga aacataaagg tgttttgcag atgtaggccc 1500 ttaaatgctg aggaagtagc atcaggggat tctatggcta ttgattttga atctgctaaa 1560 gacggtgagc tcacagtaat atcaaatgga cttcccagaa aaaccttcaa gtttgatgct 1620 gtttttagcc ctgaggcaga ccaagctgat gtttttggag acactgcgcc atttgcaact 1680 tcagttttgg atgggtacaa tgtatgcata tttgcttatg gacaaactgg aactggaaaa 1740 acctttacca tggagggctc cgaagaagct cgtggagtaa actttaggac tcttgaggag 1800 atatttcgca taatcaagga gcgctataag ctttttcggt atgatatctt tgtgagtgtt 1860 ctagaagtct ataatgagca aatacgagat ttgttgggct caggctctca gccaggagtg 1920 gccacaaaga ggcttgaaat aaggcaagcg ggtgaagggc tgcatcatgt tccagggttg 1980 gttgaagcac aagtaaacaa cataagtgag gcctgggaag ttctacaaac tggaagtaac 2040 gcaagggcaa ttggctcaac caatgccaat gagcacagca gccgatccca ttgcatacac 2100 tgtgtgatgg tgaaaggaga gaatttattg aatggagaat gtacaaagag caagttatgg 2160 ttggttgatc tagcaggaag tgagcgagta gcgaagacag aagttcaagg agatagactt 2220 aaggaaacac aaaatattaa cagatccttg tctgcacttg gtgatgtcat atctgccctt 2280 gcaactaaaa gtcctcatat cccattcagg aattccaagc tcactcacct gcttcaagat 2340 tccctaggag gagattcaaa gaccctcatg tttgtccaga taagtcccag tgagaatgac 2400 ctgggtgaga ccgtatgctc tctgaatttt gcaagcagag ttagagggat agagttgggt 2460 cctgcaagac ggcaattgga caatactgaa cttcagagat acaaacagat ggctgaaaaa 2520 tcaaaacaag acatgaagag caaagatata cagatcaaga agatggagga aacaatcaat 2580 ggcttggtct tgaggataaa agaaaaagac cttagaaata agaatctgca agagaagttg 2640 aaggagctgg agtcgcaact tctcattgaa agaaagctag cacgtcagca tgttgacaca 2700 aagatagctg agcaacagca acaacaacaa atgaaacaac agcaggatga gcagagtagt 2760 gccccaccaa ggccaccact tgcaaatcga ctattaggaa gtaacaagaa tttcagtgaa 2820 gccgcaagta ctgcaacaac caaagagcaa gtaaattcct ggcaaccact tgtggaaaat 2880 aacagttata ggcctacact ttgcattctt ccaacagatg gcatggtcaa gtatattgat 2940 cccacagaaa aagaaaacaa ccctggcatg gctgaacatc cacgattgcc gaagaggacc 3000 ggcagagctt caatttgcac aacagcacaa cggataccag tagctccagc accaaggcgc 3060 acatcgatga ttccactccc aagtgtacca ggtttagcac atctaccttc accattagca 3120 ccattgtcgt tatgcgagat tgacataaag gaagaagaca caggagggtc tgaaattaat 3180 tgcttgccag agcaaacaca ttgcaacagt cccaaaggaa taaaacatgg gactagaaag 3240 ctaagcacca tactaagaca aagccttcaa aagaaaatgc agctgaattc tccaatgcag 3300 caacacctga gaaaacgagg tataaatgtt gggatggaga aagtcagggt ctctattgga 3360 agtcgaggga ggatggcaca cagagttttg ctaggcaatg gtagaagaac aggaataaag 3420 gatacccagc agaacaggag tcatagagaa aaagagagag gatggaatat tggaacagcg 3480 ggaagaactg caatctaa 3498 <210> 1006 <211> 3495 <212> DNA <213> Ricinus communis <400> 1006 atggcagatc cagatcctta ttcttcttct tctacttctg atattccaca taacgatgtg 60 tcttggaact caaatcaaat cttggaatca gttgataccc aaatgctaat tgacccagtt 120 gccaataatg ggattgatgg acgttcggtg ctgggttttt ctttaacatc acctgatctt 180 gttatttgtg ctggttcgtg tggagattca cctgaattct ttaatagaac gacaaagaac 240 tactcttttg agctctcgtt ggagaatggt atcaacggta ctaataccaa agatacccag 300 aagattcagt ctgtaaagtt ttctccaatt tgtcaaacat tcaacaaaca attgtctcct 360 gaatcttcct tagaagagct tgttgcagaa ccttcaagaa tgagaaatga tgataatttg 420 ctaaaagatc ctttaattgg tgtaagcatt aatgtaggat ctaccaatga aggtgtggtc 480 ttgaatggtg tgcagttttt ggaggacact tgttacaccg gcggtgatac tgtgaagact 540 aatgctacaa ttggagattt agatagagaa gaagatggtc tttctttgta ccaaacggct 600 cgttttggta acttctcgta ttgcattcct gcaatggaac cagggaatta tgttgttacc 660 ttgcatcttg ctgaaattgt attcactgat gggcctcctg gaaggagagt gtttgatgtt 720 tttatacaag agaagaaggt tgtttcttcc ctagatatat atgctcaagt aggtgcaaat 780 aagcctctag ttatatctca acttaagact tgtgtcgatg gagaggaggg cttaaccatt 840 aggtttcaag gagttattgg aagtcccatt gtatgtggca tttctataac cgaagattct 900 tctgctcatg ctggtgaagc tcaattttca aaacaaatgg gaatgtccca agtggcagaa 960 tgcaacttac tgaaacaata taatagtgag caagagccgg atggagatca tcagaagcta 1020 gaaagacacg ttgagtttca ggaaaaggaa ctgacggaaa tgaggagggc attggaggag 1080 cttaagaggg aaaaccaact taagaatagg gaatgccaag acgcttggaa ctctttacat 1140 gaactccaga atgagcttat gcgcaagtct atgcatgttg ggtcattggc atttgccatt 1200 gaaggacaag ttaaagagaa gagcaagtgg ttctcatctt tgagggacat gactagaaaa 1260 ttgaagatta tgaggataga gcacttaaag atatcagagg aggcactggc atataagaaa 1320 tgcctcagag atatggagga aatgaggtcc actattcagt ctacaatgaa gcagcaagta 1380 gatttgcacg aggacctcaa gattaaattt attgaagggg agaagaaaag aaaggaactc 1440 tacaacaggg ttttagagtt gaaaggaaac ataaaggtgt tttgcagatg taggccctta 1500 aatgctgagg aagtagcatc aggggattct atggctattg attttgaatc tgctaaagac 1560 ggtgagctca cagtaatatc aaatggactt cccagaaaaa ccttcaagtt tgatgctgtt 1620 tttagccctg aggcagacca agctgatgtt tttggagaca ctgcgccatt tgcaacttca 1680 gttttggatg ggtacaatgt atgcatattt gcttatggac aaactggaac tggaaaaacc 1740 tttaccatgg agggctccga agaagctcgt ggagtaaact ttaggactct tgaggagata 1800 tttcgcataa tcaaggagcg ctataagctt tttcggtatg atatctttgt gagtgttcta 1860 gaagtctata atgagcaaat acgagatttg ttgggctcag gctctcagcc aggagtggcc 1920 acaaagaggc ttgaaataag gcaagcgggt gaagggctgc atcatgttcc agggttggtt 1980 gaagcacaag taaacaacat aagtgaggcc tgggaagttc tacaaactgg aagtaacgca 2040 agggcaattg gctcaaccaa tgccaatgag cacagcagcc gatcccattg catacactgt 2100 gtgatggtga aaggagagaa tttattgaat ggagaatgta caaagagcaa gttatggttg 2160 gttgatctag caggaagtga gcgagtagcg aagacagaag ttcaaggaga tagacttaag 2220 gaaacacaaa atattaacag atccttgtct gcacttggtg atgtcatatc tgcccttgca 2280 actaaaagtc ctcatatccc attcaggaat tccaagctca ctcacctgct tcaagattcc 2340 ctaggaggag attcaaagac cctcatgttt gtccagataa gtcccagtga gaatgacctg 2400 ggtgagaccg tatgctctct gaattttgca agcagagtta gagggataga gttgggtcct 2460 gcaagacggc aattggacaa tactgaactt cagagataca aacagatggc tgaaaaatca 2520 aaacaagaca tgaagagcaa agatatacag atcaagaaga tggaggaaac aatcaatggc 2580 ttggtcttga ggataaaaga aaaagacctt agaaataaga atctgcaaga gaagttgaag 2640 gagctggagt cgcaacttct cattgaaaga aagctagcac gtcagcatgt tgacacaaag 2700 atagctgagc aacagcaaca acaacaaatg aaacaacagc aggatgagca gagtagtgcc 2760 ccaccaaggc caccacttgc aaatcgacta ttaggaagta acaagaattt cagtgaagcc 2820 gcaagtactg caacaaccaa agagcaagta aattcctggc aaccacttgt ggaaaataac 2880 agttataggc ctacactttg cattcttcca acagatggca tggtcaagta tattgatccc 2940 acagaaaaag aaaacaaccc tggcatggct gaacatccac gattgccgaa gaggaccggc 3000 agagcttcaa tttgcacaac agcacaacgg ataccagtag ctccagcacc aaggcgcaca 3060 tcgatgattc cactcccaag tgtaccaggt ttagcacatc taccttcacc attagcacca 3120 ttgtcgttat gcgagattga cataaaggaa gaagacacag gagggtctga aattaattgc 3180 ttgccagagc aaacacattg caacagtccc aaaggaataa aacatgggac tagaaagcta 3240 agcaccatac taagacaaag ccttcaaaag aaaatgcagc tgaattctcc aatgcagcaa 3300 cacctgagaa aacgaggtat aaatgttggg atggagaaag tcagggtctc tattggaagt 3360 cgagggagga tggcacacag agttttgcta ggcaatggta gaagaacagg aataaaggat 3420 acccagcaga acaggagtca tagagaaaaa gagagaggat ggaatattgg aacagcggga 3480 agaactgcaa tctaa 3495 <210> 1007 <211> 1285 <212> DNA <213> Ricinus communis <400> 1007 atggaggaat caaaattgga gaaaaagaat gtaccggttt tgccatggat gagatgtcca 60 gttgacatta aacaatttga agaatgctct cttgatcttg ttccttgcct tgaccctagg 120 ttaaaggtgg ctttagagaa tatgggtttc acatcattat ttgcagttca agttgctgtt 180 tggcaagaaa caataggacc tggtaatttt gaaagagacc tttgtataaa tgcaccaaca 240 ggaagtggta aaactctagc ttatgcttta ccaattattc aaatgctatc aacccgctct 300 atcaagtgcc tacgcgcttt gattgtgttg cctacacgag atttagcatt gcaggttaaa 360 caagtatttg ctgcacttgc acctgcagtg ggattatctg ttggtttggc tgttggtcaa 420 tcttcaattg ctggtgaaat ttctgagctt attaaaagac ctaagcttga ggctggcatt 480 tgttatgatc gagatgattt gaaaggggtt ttaagggaaa atcttaccct cgacttgcaa 540 agatggtttt atctgccaca ttaacccaag atccaagcaa gcttgttcaa cttgatctgc 600 atcacccttt gttcctgaca accgggcaaa gtcgttatca gctacctgaa aagttggaat 660 cctacagagt gatttgcgag ccaaagttaa aacctttata cttggttgcc cttctacaaa 720 atttagtagg ggagaagtgt attgtttttg catcatccgt ggagtcaact catcggcttt 780 gcacattatt aaaatttttt ggtgatttga aagtgaagat caaagagtat tcaggtcttc 840 aacatcaatc tgtaagaagc aagaccctga aggcattccg ggaaggaaag atacaagtac 900 ttgtttcctc agatgcaatg actcgtggaa tggatgttga aggggtgaga aatgtcatta 960 actatgataa gcctgcatac ataaagacgt acatacatcg ggctggtcgg acagcaagag 1020 caggccaggt tgggcgttgt ttcacattat tgcataaaga agaggtaagg catttcagga 1080 aacttttaca gaaggccgac aatgattcct ttccggttta ttctcttcct ccagttacat 1140 tgagcctctt taccctactt atgagtcagc attggagaaa ttgaaagaga aagttcagtc 1200 agaaacatcc aggaagcgca gaactggttt caaatttcag ggccaggtga aggagaggcg 1260 aaaagaaaaa caatcaaact catga 1285 <210> 1008 <400> 1008 000 <210> 1009 <400> 1009 000 <210> 1010 <400> 1010 000 <210> 1011 <400> 1011 000 <210> 1012 <400> 1012 000 <210> 1013 <400> 1013 000 <210> 1014 <400> 1014 000 <210> 1015 <400> 1015 000 <210> 1016 <400> 1016 000 <210> 1017 <400> 1017 000 <210> 1018 <400> 1018 000 <210> 1019 <400> 1019 000 <210> 1020 <400> 1020 000 <210> 1021 <400> 1021 000 <210> 1022 <400> 1022 000 <210> 1023 <400> 1023 000 <210> 1024 <400> 1024 000 <210> 1025 <400> 1025 000 <210> 1026 <400> 1026 000 <210> 1027 <400> 1027 000 <210> 1028 <400> 1028 000 <210> 1029 <400> 1029 000 <210> 1030 <400> 1030 000 <210> 1031 <400> 1031 000 <210> 1032 <400> 1032 000 <210> 1033 <400> 1033 000 <210> 1034 <400> 1034 000 <210> 1035 <400> 1035 000 <210> 1036 <400> 1036 000 <210> 1037 <400> 1037 000 <210> 1038 <400> 1038 000 <210> 1039 <400> 1039 000 <210> 1040 <400> 1040 000 <210> 1041 <400> 1041 000 <210> 1042 <400> 1042 000 <210> 1043 <400> 1043 000 <210> 1044 <400> 1044 000 <210> 1045 <400> 1045 000 <210> 1046 <400> 1046 000 <210> 1047 <400> 1047 000 <210> 1048 <400> 1048 000 <210> 1049 <400> 1049 000 <210> 1050 <400> 1050 000 <210> 1051 <211> 510 <212> PRT <213> Ricinus communis <220> <221> MOD_RES <222> (117)..(117) <223> Any amino acid <220> <221> MOD_RES <222> (122)..(122) <223> Any amino acid <400> 1051 Met Ala Ala Gly Leu Ala Ile Thr Ser Glu Gly Gly Gln Tyr Asn Gly 1 5 10 15 Arg Met Thr Ser Phe Val Ala Leu Ser Cys Met Met Ala Ala Met Gly 20 25 30 Gly Val Ile Phe Gly Tyr Asp Ile Gly Val Ser Gly Gly Val Thr Ser 35 40 45 Met Asp Pro Phe Leu Lys Lys Phe Phe Pro Asp Val Tyr Arg Lys Met 50 55 60 Lys Glu Asp Thr Glu Ile Ser Asn Tyr Cys Lys Phe Asp Ser Gln Leu 65 70 75 80 Leu Thr Ser Phe Thr Ser Ser Leu Tyr Val Ala Gly Leu Val Ala Ser 85 90 95 Phe Phe Ala Ser Ser Val Thr Arg Ala Phe Gly Arg Lys Pro Ser Ile 100 105 110 Leu Leu Gly Gly Xaa Val Phe Leu Ala Xaa Ala Ala Leu Gly Gly Ala 115 120 125 Ala Val Asn Val Tyr Met Leu Ile Phe Gly Arg Val Leu Leu Gly Val 130 135 140 Gly Val Gly Phe Ala Asn Gln Ala Val Pro Leu Tyr Leu Ser Glu Met 145 150 155 160 Ala Pro Pro Arg Tyr Arg Gly Ala Ile Asn Asn Gly Phe Gln Phe Ser 165 170 175 Val Gly Ile Gly Ala Leu Ser Ala Asn Leu Ile Asn Tyr Gly Thr Glu 180 185 190 Lys Ile Glu Gly Gly Trp Gly Trp Arg Ile Ser Leu Ala Met Ala Ala 195 200 205 Val Pro Ala Ala Ile Leu Thr Phe Gly Ala Leu Phe Leu Pro Glu Thr 210 215 220 Pro Asn Ser Leu Ile Gln Arg Ser Asn Asp His Glu Arg Ala Lys Leu 225 230 235 240 Met Leu Gln Arg Val Arg Gly Thr Thr Asp Val Gln Ala Glu Leu Asp 245 250 255 Asp Leu Ile Lys Ala Ser Ile Ile Ser Arg Thr Ile Gln His Pro Phe 260 265 270 Lys Asn Ile Met Arg Arg Lys Tyr Arg Pro Gln Leu Val Met Ala Val 275 280 285 Ala Ile Pro Phe Phe Gln Gln Val Thr Gly Ile Asn Val Ile Ala Phe 290 295 300 Tyr Ala Pro Ile Leu Phe Arg Thr Ile Gly Leu Glu Glu Ser Ala Ser 305 310 315 320 Leu Leu Ser Ser Ile Val Thr Gly Leu Val Gly Ser Ala Ser Thr Phe 325 330 335 Ile Ser Met Leu Ile Val Asp Lys Leu Gly Arg Arg Ala Leu Phe Ile 340 345 350 Phe Gly Gly Val Gln Met Phe Val Ala Gln Ile Met Val Gly Ser Ile 355 360 365 Met Ala Ala Glu Leu Gly Asp His Gly Gly Ile Gly Lys Gly Tyr Ala 370 375 380 Tyr Ile Val Leu Ile Leu Ile Cys Ile Tyr Val Ala Gly Phe Gly Trp 385 390 395 400 Ser Trp Gly Pro Leu Gly Trp Leu Val Pro Ser Glu Ile Phe Pro Leu 405 410 415 Glu Ile Arg Ser Ala Gly Gln Ser Ile Val Val Ala Val Ser Phe Leu 420 425 430 Phe Thr Phe Val Val Ala Gln Thr Phe Leu Ser Met Leu Cys His Phe 435 440 445 Lys Ser Gly Ile Phe Phe Phe Phe Gly Gly Trp Val Val Val Met Thr 450 455 460 Ala Phe Val His Phe Leu Leu Pro Glu Thr Lys Lys Val Pro Ile Glu 465 470 475 480 Lys Met Asp Ile Val Trp Arg Asp His Trp Phe Trp Lys Lys Ile Ile 485 490 495 Gly Glu Glu Ala Ala Glu Glu Asn Asn Lys Met Glu Ala Ala 500 505 510 <210> 1052 <211> 219 <212> PRT <213> Ricinus communis <400> 1052 Met Ala Asp Glu Val Ile Leu Leu Asp Phe Trp Ala Ser Pro Phe Gly 1 5 10 15 Met Arg Val Arg Ile Ala Leu Ala Glu Lys Gly Val Lys Tyr Glu Tyr 20 25 30 Arg Glu Glu Asn Leu Arg Asn Lys Ser Pro Leu Leu Leu Glu Met Asn 35 40 45 Pro Val His Lys Lys Ile Pro Val Leu Ile His Asn Gly Lys Pro Ile 50 55 60 Cys Glu Ser Leu Ile Ala Val Gln Tyr Ile Asp Glu Val Trp His Asp 65 70 75 80 Glu Ser Pro Leu Leu Pro Ser Asp Ser Tyr Pro Arg Ala His Ala Arg 85 90 95 Phe Trp Ala Asp Phe Val Asp Lys Lys Ile Tyr Glu Leu Gly Arg Lys 100 105 110 Ile Trp Thr Thr Lys Gly Glu Asp Gln Glu Ala Gly Lys Lys Glu Phe 115 120 125 Ile Asp Ala Ile Lys Leu Leu Glu Gly Glu Leu Gly Asp Lys Pro Tyr 130 135 140 Phe Gly Gly Glu Ser Phe Gly Tyr Val Asp Val Ala Leu Ile Pro Phe 145 150 155 160 Tyr Ser Trp Phe Tyr Ala Tyr Glu Thr Cys Gly Asn Phe Ser Ile Glu 165 170 175 Ala Glu Cys Pro Lys Phe Met Ala Trp Ile Lys Arg Cys Leu Gln Lys 180 185 190 Glu Ser Val Ser Lys Ala Leu Pro Asp Gln Gln Lys Val Tyr Glu Phe 195 200 205 Val Leu Glu Leu Lys Lys Val Phe Gly Ile Glu 210 215 <210> 1053 <211> 205 <212> PRT <213> Ricinus communis <400> 1053 Met Asp Lys Ser Lys Val Ser Thr Ala Val Gly Gly Glu Thr Pro Val 1 5 10 15 Gly Leu Ile Thr Gly Ser Arg Asp Asp Glu Leu Glu Ser Gly Ser Met 20 25 30 Arg Thr Ala Glu Thr Val Leu Arg Leu Val Pro Met Ala Phe Cys Ile 35 40 45 Ser Ala Leu Val Leu Met Leu Lys Asn Ser Gln Thr Asn Asp Phe Gly 50 55 60 Thr Leu Ser Tyr Ser Asp Leu Gly Ala Phe Arg Tyr Leu Val His Ala 65 70 75 80 Asn Gly Ile Cys Ala Gly Tyr Ser Leu Leu Ser Ala Ile Ile Val Ala 85 90 95 Met Pro Arg Pro Ser Thr Met Ser Arg Ala Trp Thr Phe Phe Phe Leu 100 105 110 Asp Gln Val Leu Thr Tyr Val Ile Leu Ala Ala Ala Ala Val Ser Val 115 120 125 Glu Ala Leu Tyr Leu Ala Arg Lys Gly Asp Ile Ala Ile Thr Trp Ser 130 135 140 Ala Ala Cys Val Ser Phe Gly Gly Phe Cys His Lys Ala Ile Thr Ser 145 150 155 160 Ala Val Ile Thr Phe Ile Val Val Val Cys Tyr Ala Leu Leu Ser Leu 165 170 175 Val Ser Ser Tyr Lys Leu Phe Ser Arg Tyr Gly Ala Pro Asp Val Ser 180 185 190 Tyr Pro Gly Lys Gly Ile Glu Val Ala Ala Phe His Ser 195 200 205 <210> 1054 <211> 1033 <212> PRT <213> Ricinus communis <400> 1054 Met Gly Ser Met Val Val Leu Val Gly Ser Met Pro Ser Leu Ala Ser 1 5 10 15 Leu Ile Ser Leu Gly Ser Leu Ser Val Ala Ala Ala Thr Ser Ser Ser 20 25 30 Ser Asp Ser Tyr Tyr Ser Ser Ser Tyr Ser Leu Val Arg Arg Val Ser 35 40 45 Leu Ser Lys Arg Gly Leu Lys Ser Ala Lys Arg Trp His Cys Val Cys 50 55 60 Lys Cys Ser Val Thr Thr Thr Asp Phe Ile Ala Asp Gln Gly Asn Ala 65 70 75 80 Val Ser Ile Asp Ser Asn Asn Ser Phe Arg Ala Ser Ser Asn Gly Gly 85 90 95 Asp Ala Asp Ser Glu Ile Leu Leu Lys Pro Ala Pro Arg Pro Val Leu 100 105 110 Lys Pro Ser Leu Gly Ser Lys Gly Asp Ser Leu Leu Gly Met Ser Ser 115 120 125 Ser Gln Leu Asn Ser Gly Asp Ser Asp Asn Asp Asp Glu Gln Glu Arg 130 135 140 Asn Lys Val Ile Glu Ser Leu Gly Glu Val Leu Glu Lys Ala Glu Lys 145 150 155 160 Leu Glu Thr Ser Lys Pro Ser Gly Pro Gly Asn Pro Ser Ser Ser Gly 165 170 175 Lys Asp Asn Gly Asn Val Asn Lys Ile Thr Pro Pro Asn Ile Gly Thr 180 185 190 Asn Ser Arg Ile Ala Lys Ser Glu Ser Ser Gly Ala Thr Arg Lys Thr 195 200 205 Lys Thr Leu Lys Ser Val Trp Arg Lys Gly Asp Thr Val Ser Ser Val 210 215 220 Gln Lys Val Val Lys Glu Ala Pro Lys Val Ile Asn Lys Leu Val Lys 225 230 235 240 Glu Asp Thr Ile Thr Gly Glu Gly Thr Lys Leu Glu Ser Gln Ser Ser 245 250 255 Phe Pro Leu Arg Pro Val Gln Pro Pro Leu Arg Pro Gln Pro Lys Leu 260 265 270 Gln Ala Lys Pro Ser Val Ala Pro Pro Pro Val Met Lys Lys Pro Val 275 280 285 Ile Leu Lys Asp Val Gly Ala Ala Pro Arg Pro Pro Val Ser Gly Glu 290 295 300 Ala Asp Ser Lys Asn Asn Gly Arg Gln Pro Ile Leu Val Asp Lys Phe 305 310 315 320 Ala Arg Lys Lys Pro Val Val Asp Pro Leu Ile Ala Gln Ala Val Leu 325 330 335 Ala Pro Thr Lys Pro Gly Lys Gly Pro Ala Pro Gly Lys Phe Lys Asp 340 345 350 Arg Lys Lys Ser Ile Ser Pro Gly Gly Pro Arg Arg Arg Leu Val Asn 355 360 365 Asn Asp Glu Leu Glu Ile Pro Asp Glu Glu Thr Ser Glu Leu Asn Val 370 375 380 Ser Ile Pro Gly Thr Ala Arg Lys Gly Arg Lys Trp Ser Lys Ala Ser 385 390 395 400 Arg Lys Ala Ala Arg Leu Gln Ala Ala Lys Asp Ala Ala Pro Val Lys 405 410 415 Val Glu Ile Leu Glu Val Gly Glu Asn Gly Met Leu Ile Glu Glu Leu 420 425 430 Ala Tyr Asn Leu Thr Ile Ser Glu Gly Glu Ile Leu Gly Tyr Leu Tyr 435 440 445 Ser Lys Gly Ile Lys Pro Asp Gly Val Gln Thr Leu Asp Lys Asp Met 450 455 460 Val Lys Met Ile Cys Lys Glu His Asp Val Glu Val Ile Asp Val Ala 465 470 475 480 Pro Val Arg Phe Glu Glu Met Ala Arg Lys Arg Glu Ile Leu Asp Glu 485 490 495 Asp Asp Leu Asp Lys Leu Glu Asp Arg Pro Pro Val Leu Thr Ile Met 500 505 510 Gly His Val Asp His Gly Lys Thr Thr Leu Leu Asp Tyr Ile Arg Lys 515 520 525 Ser Lys Val Thr Ala Ser Glu Ala Gly Gly Ile Thr Gln Gly Ile Gly 530 535 540 Ala Tyr Lys Val Leu Thr Pro Val Asp Gly Lys Met Gln Pro Cys Val 545 550 555 560 Phe Leu Asp Thr Pro Gly His Glu Ala Phe Gly Ala Met Arg Ala Arg 565 570 575 Gly Ala Arg Val Thr Asp Ile Ala Ile Ile Val Val Ala Ala Asp Asp 580 585 590 Gly Ile Arg Pro Gln Thr Asn Glu Ala Ile Ala His Ala Lys Ala Ala 595 600 605 Gly Val Pro Ile Val Val Ala Ile Asn Lys Ile Asp Lys Asp Gly Ala 610 615 620 Asn Pro Glu Arg Val Met Gln Asp Leu Ser Ser Ile Gly Leu Met Pro 625 630 635 640 Glu Asp Trp Gly Gly Asp Ile Pro Met Val Gln Ile Ser Ala Leu Lys 645 650 655 Gly Asp Asn Ile Asp Asp Leu Leu Glu Thr Val Met Leu Val Ala Glu 660 665 670 Leu Gln Glu Leu Lys Ala Asn Pro His Arg Asn Ala Lys Gly Thr Val 675 680 685 Ile Glu Ala Gly Leu Asp Lys Ser Lys Gly Pro Ile Ala Thr Phe Ile 690 695 700 Ile Gln Asn Gly Thr Leu Lys Arg Gly Asp Val Val Val Cys Gly Glu 705 710 715 720 Ala Phe Gly Lys Val Arg Ala Leu Phe Asp Asp Gly Gly Lys Arg Val 725 730 735 Asp Glu Ala Gly Pro Ser Ile Pro Val Gln Val Ile Gly Leu Ser Asn 740 745 750 Val Pro Lys Ala Gly Asp Glu Phe Glu Ala Val Ala Ser Leu Asp Ile 755 760 765 Ala Arg Glu Lys Ala Glu Ala Arg Ala Glu Leu Leu Arg Asn Glu Arg 770 775 780 Ile Thr Ala Lys Ala Gly Asp Gly Lys Ile Thr Leu Ser Ser Leu Ala 785 790 795 800 Ser Ala Val Ser Ser Gly Arg Leu Ser Gly Ile Asp Leu His Gln Leu 805 810 815 Asn Ile Ile Leu Lys Val Asp Val Gln Gly Ser Val Glu Ala Val Arg 820 825 830 Gln Ala Leu Gln Val Leu Pro Gln Asp Asn Val Thr Leu Lys Phe Leu 835 840 845 Leu Gln Ala Thr Gly Asp Val Ser Ser Ser Asp Val Asp Leu Ala Ile 850 855 860 Ala Ser Glu Ala Ile Ile Leu Gly Phe Asn Val Lys Ala Pro Gly Ser 865 870 875 880 Val Lys Ser Asn Ala Glu Asn Lys Gly Val Glu Ile Arg Leu Tyr Arg 885 890 895 Val Ile Tyr Asp Leu Ile Asp Asp Val Arg Asn Ala Met Glu Gly Leu 900 905 910 Leu Glu Pro Val Glu Glu Gln Glu Thr Ile Gly Ser Ala Val Val Arg 915 920 925 Ala Val Phe Ser Ser Gly Ser Gly Arg Val Ala Gly Cys Met Val Thr 930 935 940 Asp Gly Lys Val Val Lys Gly Cys Gly Val Lys Val Ile Arg Lys Arg 945 950 955 960 Lys Thr Ile His Val Gly Val Leu Asp Ser Leu Arg Arg Val Lys Glu 965 970 975 Leu Val Lys Glu Val Ser Ala Gly Leu Glu Cys Gly Ile Ala Met Glu 980 985 990 Asp Tyr Asp Asp Trp Glu Glu Gly Asp Thr Ile Glu Ala Phe Asn Thr 995 1000 1005 Val Glu Lys Lys Arg Thr Leu Glu Glu Ala Ser Ala Ser Met Ala 1010 1015 1020 Ala Ala Leu Glu His Ala Gly Ile Asn Val 1025 1030 <210> 1055 <211> 1165 <212> PRT <213> Ricinus communis <400> 1055 Met Ala Asp Pro Asp Pro Tyr Ser Ser Ser Ser Thr Ser Asp Ile Pro 1 5 10 15 His Asn Asp Val Ser Trp Asn Ser Asn Gln Ile Leu Glu Ser Val Asp 20 25 30 Thr Gln Met Leu Ile Asp Pro Val Ala Asn Asn Gly Ile Asp Ala Gly 35 40 45 Arg Ser Val Leu Gly Phe Ser Leu Thr Ser Pro Asp Leu Val Ile Cys 50 55 60 Ala Gly Ser Cys Gly Asp Ser Pro Glu Phe Phe Asn Arg Thr Thr Lys 65 70 75 80 Asn Tyr Ser Phe Glu Leu Ser Leu Glu Asn Gly Ile Asn Gly Thr Asn 85 90 95 Thr Lys Asp Thr Gln Lys Ile Gln Ser Val Lys Phe Ser Pro Ile Cys 100 105 110 Gln Thr Phe Asn Lys Gln Leu Ser Pro Glu Ser Ser Leu Glu Glu Leu 115 120 125 Val Ala Glu Pro Ser Arg Met Arg Asn Asp Asp Asn Leu Leu Lys Asp 130 135 140 Pro Leu Ile Gly Val Ser Ile Asn Val Gly Ser Thr Asn Glu Gly Val 145 150 155 160 Val Leu Asn Gly Val Gln Phe Leu Glu Asp Thr Cys Tyr Thr Gly Gly 165 170 175 Asp Thr Val Lys Thr Asn Ala Thr Ile Gly Asp Leu Asp Arg Glu Glu 180 185 190 Asp Gly Leu Ser Leu Tyr Gln Thr Ala Arg Phe Gly Asn Phe Ser Tyr 195 200 205 Cys Ile Pro Ala Met Glu Pro Gly Asn Tyr Val Val Thr Leu His Leu 210 215 220 Ala Glu Ile Val Phe Thr Asp Gly Pro Pro Gly Arg Arg Val Phe Asp 225 230 235 240 Val Phe Ile Gln Glu Lys Lys Val Val Ser Ser Leu Asp Ile Tyr Ala 245 250 255 Gln Val Gly Ala Asn Lys Pro Leu Val Ile Ser Gln Leu Lys Thr Cys 260 265 270 Val Asp Gly Glu Glu Gly Leu Thr Ile Arg Phe Gln Gly Val Ile Gly 275 280 285 Ser Pro Ile Val Cys Gly Ile Ser Ile Thr Glu Asp Ser Ser Ala His 290 295 300 Ala Gly Glu Ala Gln Phe Ser Lys Gln Met Gly Met Ser Gln Val Ala 305 310 315 320 Glu Cys Asn Leu Leu Lys Gln Tyr Asn Ser Glu Gln Glu Pro Asp Gly 325 330 335 Asp His Gln Lys Leu Glu Arg His Val Glu Phe Gln Glu Lys Glu Leu 340 345 350 Thr Glu Met Arg Arg Ala Leu Glu Glu Leu Lys Arg Glu Asn Gln Leu 355 360 365 Lys Asn Arg Glu Cys Gln Asp Ala Trp Asn Ser Leu His Glu Leu Gln 370 375 380 Asn Glu Leu Met Arg Lys Ser Met His Val Gly Ser Leu Ala Phe Ala 385 390 395 400 Ile Glu Gly Gln Val Lys Glu Lys Ser Lys Trp Phe Ser Ser Leu Arg 405 410 415 Asp Met Thr Arg Lys Leu Lys Ile Met Arg Ile Glu His Leu Lys Ile 420 425 430 Ser Glu Glu Ala Leu Ala Tyr Lys Lys Cys Leu Arg Asp Met Glu Glu 435 440 445 Met Arg Ser Thr Ile Gln Ser Thr Met Lys Gln Gln Val Asp Leu His 450 455 460 Glu Asp Leu Lys Ile Lys Phe Ile Glu Gly Glu Lys Lys Arg Lys Glu 465 470 475 480 Leu Tyr Asn Arg Val Leu Glu Leu Lys Gly Asn Ile Lys Val Phe Cys 485 490 495 Arg Cys Arg Pro Leu Asn Ala Glu Glu Val Ala Ser Gly Asp Ser Met 500 505 510 Ala Ile Asp Phe Glu Ser Ala Lys Asp Gly Glu Leu Thr Val Ile Ser 515 520 525 Asn Gly Leu Pro Arg Lys Thr Phe Lys Phe Asp Ala Val Phe Ser Pro 530 535 540 Glu Ala Asp Gln Ala Asp Val Phe Gly Asp Thr Ala Pro Phe Ala Thr 545 550 555 560 Ser Val Leu Asp Gly Tyr Asn Val Cys Ile Phe Ala Tyr Gly Gln Thr 565 570 575 Gly Thr Gly Lys Thr Phe Thr Met Glu Gly Ser Glu Glu Ala Arg Gly 580 585 590 Val Asn Phe Arg Thr Leu Glu Glu Ile Phe Arg Ile Ile Lys Glu Arg 595 600 605 Tyr Lys Leu Phe Arg Tyr Asp Ile Phe Val Ser Val Leu Glu Val Tyr 610 615 620 Asn Glu Gln Ile Arg Asp Leu Leu Gly Ser Gly Ser Gln Pro Gly Val 625 630 635 640 Ala Thr Lys Arg Leu Glu Ile Arg Gln Ala Gly Glu Gly Leu His His 645 650 655 Val Pro Gly Leu Val Glu Ala Gln Val Asn Asn Ile Ser Glu Ala Trp 660 665 670 Glu Val Leu Gln Thr Gly Ser Asn Ala Arg Ala Ile Gly Ser Thr Asn 675 680 685 Ala Asn Glu His Ser Ser Arg Ser His Cys Ile His Cys Val Met Val 690 695 700 Lys Gly Glu Asn Leu Leu Asn Gly Glu Cys Thr Lys Ser Lys Leu Trp 705 710 715 720 Leu Val Asp Leu Ala Gly Ser Glu Arg Val Ala Lys Thr Glu Val Gln 725 730 735 Gly Asp Arg Leu Lys Glu Thr Gln Asn Ile Asn Arg Ser Leu Ser Ala 740 745 750 Leu Gly Asp Val Ile Ser Ala Leu Ala Thr Lys Ser Pro His Ile Pro 755 760 765 Phe Arg Asn Ser Lys Leu Thr His Leu Leu Gln Asp Ser Leu Gly Gly 770 775 780 Asp Ser Lys Thr Leu Met Phe Val Gln Ile Ser Pro Ser Glu Asn Asp 785 790 795 800 Leu Gly Glu Thr Val Cys Ser Leu Asn Phe Ala Ser Arg Val Arg Gly 805 810 815 Ile Glu Leu Gly Pro Ala Arg Arg Gln Leu Asp Asn Thr Glu Leu Gln 820 825 830 Arg Tyr Lys Gln Met Ala Glu Lys Ser Lys Gln Asp Met Lys Ser Lys 835 840 845 Asp Ile Gln Ile Lys Lys Met Glu Glu Thr Ile Asn Gly Leu Val Leu 850 855 860 Arg Ile Lys Glu Lys Asp Leu Arg Asn Lys Asn Leu Gln Glu Lys Leu 865 870 875 880 Lys Glu Leu Glu Ser Gln Leu Leu Ile Glu Arg Lys Leu Ala Arg Gln 885 890 895 His Val Asp Thr Lys Ile Ala Glu Gln Gln Gln Gln Gln Gln Met Lys 900 905 910 Gln Gln Gln Asp Glu Gln Ser Ser Ala Pro Pro Arg Pro Pro Leu Ala 915 920 925 Asn Arg Leu Leu Gly Ser Asn Lys Asn Phe Ser Glu Ala Ala Ser Thr 930 935 940 Ala Thr Thr Lys Glu Gln Val Asn Ser Trp Gln Pro Leu Val Glu Asn 945 950 955 960 Asn Ser Tyr Arg Pro Thr Leu Cys Ile Leu Pro Thr Asp Gly Met Val 965 970 975 Lys Tyr Ile Asp Pro Thr Glu Lys Glu Asn Asn Pro Gly Met Ala Glu 980 985 990 His Pro Arg Leu Pro Lys Arg Thr Gly Arg Ala Ser Ile Cys Thr Thr 995 1000 1005 Ala Gln Arg Ile Pro Val Ala Pro Ala Pro Arg Arg Thr Ser Met 1010 1015 1020 Ile Pro Leu Pro Ser Val Pro Gly Leu Ala His Leu Pro Ser Pro 1025 1030 1035 Leu Ala Pro Leu Ser Leu Cys Glu Ile Asp Ile Lys Glu Glu Asp 1040 1045 1050 Thr Gly Gly Ser Glu Ile Asn Cys Leu Pro Glu Gln Thr His Cys 1055 1060 1065 Asn Ser Pro Lys Gly Ile Lys His Gly Thr Arg Lys Leu Ser Thr 1070 1075 1080 Ile Leu Arg Gln Ser Leu Gln Lys Lys Met Gln Leu Asn Ser Pro 1085 1090 1095 Met Gln Gln His Leu Arg Lys Arg Gly Ile Asn Val Gly Met Glu 1100 1105 1110 Lys Val Arg Val Ser Ile Gly Ser Arg Gly Arg Met Ala His Arg 1115 1120 1125 Val Leu Leu Gly Asn Gly Arg Arg Thr Gly Ile Lys Asp Thr Gln 1130 1135 1140 Gln Asn Arg Ser His Arg Glu Lys Glu Arg Gly Trp Asn Ile Gly 1145 1150 1155 Thr Ala Gly Arg Thr Ala Ile 1160 1165 <210> 1056 <211> 1164 <212> PRT <213> Ricinus communis <400> 1056 Met Ala Asp Pro Asp Pro Tyr Ser Ser Ser Ser Thr Ser Asp Ile Pro 1 5 10 15 His Asn Asp Val Ser Trp Asn Ser Asn Gln Ile Leu Glu Ser Val Asp 20 25 30 Thr Gln Met Leu Ile Asp Pro Val Ala Asn Asn Gly Ile Asp Gly Arg 35 40 45 Ser Val Leu Gly Phe Ser Leu Thr Ser Pro Asp Leu Val Ile Cys Ala 50 55 60 Gly Ser Cys Gly Asp Ser Pro Glu Phe Phe Asn Arg Thr Thr Lys Asn 65 70 75 80 Tyr Ser Phe Glu Leu Ser Leu Glu Asn Gly Ile Asn Gly Thr Asn Thr 85 90 95 Lys Asp Thr Gln Lys Ile Gln Ser Val Lys Phe Ser Pro Ile Cys Gln 100 105 110 Thr Phe Asn Lys Gln Leu Ser Pro Glu Ser Ser Leu Glu Glu Leu Val 115 120 125 Ala Glu Pro Ser Arg Met Arg Asn Asp Asp Asn Leu Leu Lys Asp Pro 130 135 140 Leu Ile Gly Val Ser Ile Asn Val Gly Ser Thr Asn Glu Gly Val Val 145 150 155 160 Leu Asn Gly Val Gln Phe Leu Glu Asp Thr Cys Tyr Thr Gly Gly Asp 165 170 175 Thr Val Lys Thr Asn Ala Thr Ile Gly Asp Leu Asp Arg Glu Glu Asp 180 185 190 Gly Leu Ser Leu Tyr Gln Thr Ala Arg Phe Gly Asn Phe Ser Tyr Cys 195 200 205 Ile Pro Ala Met Glu Pro Gly Asn Tyr Val Val Thr Leu His Leu Ala 210 215 220 Glu Ile Val Phe Thr Asp Gly Pro Pro Gly Arg Arg Val Phe Asp Val 225 230 235 240 Phe Ile Gln Glu Lys Lys Val Val Ser Ser Leu Asp Ile Tyr Ala Gln 245 250 255 Val Gly Ala Asn Lys Pro Leu Val Ile Ser Gln Leu Lys Thr Cys Val 260 265 270 Asp Gly Glu Glu Gly Leu Thr Ile Arg Phe Gln Gly Val Ile Gly Ser 275 280 285 Pro Ile Val Cys Gly Ile Ser Ile Thr Glu Asp Ser Ser Ala His Ala 290 295 300 Gly Glu Ala Gln Phe Ser Lys Gln Met Gly Met Ser Gln Val Ala Glu 305 310 315 320 Cys Asn Leu Leu Lys Gln Tyr Asn Ser Glu Gln Glu Pro Asp Gly Asp 325 330 335 His Gln Lys Leu Glu Arg His Val Glu Phe Gln Glu Lys Glu Leu Thr 340 345 350 Glu Met Arg Arg Ala Leu Glu Glu Leu Lys Arg Glu Asn Gln Leu Lys 355 360 365 Asn Arg Glu Cys Gln Asp Ala Trp Asn Ser Leu His Glu Leu Gln Asn 370 375 380 Glu Leu Met Arg Lys Ser Met His Val Gly Ser Leu Ala Phe Ala Ile 385 390 395 400 Glu Gly Gln Val Lys Glu Lys Ser Lys Trp Phe Ser Ser Leu Arg Asp 405 410 415 Met Thr Arg Lys Leu Lys Ile Met Arg Ile Glu His Leu Lys Ile Ser 420 425 430 Glu Glu Ala Leu Ala Tyr Lys Lys Cys Leu Arg Asp Met Glu Glu Met 435 440 445 Arg Ser Thr Ile Gln Ser Thr Met Lys Gln Gln Val Asp Leu His Glu 450 455 460 Asp Leu Lys Ile Lys Phe Ile Glu Gly Glu Lys Lys Arg Lys Glu Leu 465 470 475 480 Tyr Asn Arg Val Leu Glu Leu Lys Gly Asn Ile Lys Val Phe Cys Arg 485 490 495 Cys Arg Pro Leu Asn Ala Glu Glu Val Ala Ser Gly Asp Ser Met Ala 500 505 510 Ile Asp Phe Glu Ser Ala Lys Asp Gly Glu Leu Thr Val Ile Ser Asn 515 520 525 Gly Leu Pro Arg Lys Thr Phe Lys Phe Asp Ala Val Phe Ser Pro Glu 530 535 540 Ala Asp Gln Ala Asp Val Phe Gly Asp Thr Ala Pro Phe Ala Thr Ser 545 550 555 560 Val Leu Asp Gly Tyr Asn Val Cys Ile Phe Ala Tyr Gly Gln Thr Gly 565 570 575 Thr Gly Lys Thr Phe Thr Met Glu Gly Ser Glu Glu Ala Arg Gly Val 580 585 590 Asn Phe Arg Thr Leu Glu Glu Ile Phe Arg Ile Ile Lys Glu Arg Tyr 595 600 605 Lys Leu Phe Arg Tyr Asp Ile Phe Val Ser Val Leu Glu Val Tyr Asn 610 615 620 Glu Gln Ile Arg Asp Leu Leu Gly Ser Gly Ser Gln Pro Gly Val Ala 625 630 635 640 Thr Lys Arg Leu Glu Ile Arg Gln Ala Gly Glu Gly Leu His His Val 645 650 655 Pro Gly Leu Val Glu Ala Gln Val Asn Asn Ile Ser Glu Ala Trp Glu 660 665 670 Val Leu Gln Thr Gly Ser Asn Ala Arg Ala Ile Gly Ser Thr Asn Ala 675 680 685 Asn Glu His Ser Ser Arg Ser His Cys Ile His Cys Val Met Val Lys 690 695 700 Gly Glu Asn Leu Leu Asn Gly Glu Cys Thr Lys Ser Lys Leu Trp Leu 705 710 715 720 Val Asp Leu Ala Gly Ser Glu Arg Val Ala Lys Thr Glu Val Gln Gly 725 730 735 Asp Arg Leu Lys Glu Thr Gln Asn Ile Asn Arg Ser Leu Ser Ala Leu 740 745 750 Gly Asp Val Ile Ser Ala Leu Ala Thr Lys Ser Pro His Ile Pro Phe 755 760 765 Arg Asn Ser Lys Leu Thr His Leu Leu Gln Asp Ser Leu Gly Gly Asp 770 775 780 Ser Lys Thr Leu Met Phe Val Gln Ile Ser Pro Ser Glu Asn Asp Leu 785 790 795 800 Gly Glu Thr Val Cys Ser Leu Asn Phe Ala Ser Arg Val Arg Gly Ile 805 810 815 Glu Leu Gly Pro Ala Arg Arg Gln Leu Asp Asn Thr Glu Leu Gln Arg 820 825 830 Tyr Lys Gln Met Ala Glu Lys Ser Lys Gln Asp Met Lys Ser Lys Asp 835 840 845 Ile Gln Ile Lys Lys Met Glu Glu Thr Ile Asn Gly Leu Val Leu Arg 850 855 860 Ile Lys Glu Lys Asp Leu Arg Asn Lys Asn Leu Gln Glu Lys Leu Lys 865 870 875 880 Glu Leu Glu Ser Gln Leu Leu Ile Glu Arg Lys Leu Ala Arg Gln His 885 890 895 Val Asp Thr Lys Ile Ala Glu Gln Gln Gln Gln Gln Gln Met Lys Gln 900 905 910 Gln Gln Asp Glu Gln Ser Ser Ala Pro Pro Arg Pro Pro Leu Ala Asn 915 920 925 Arg Leu Leu Gly Ser Asn Lys Asn Phe Ser Glu Ala Ala Ser Thr Ala 930 935 940 Thr Thr Lys Glu Gln Val Asn Ser Trp Gln Pro Leu Val Glu Asn Asn 945 950 955 960 Ser Tyr Arg Pro Thr Leu Cys Ile Leu Pro Thr Asp Gly Met Val Lys 965 970 975 Tyr Ile Asp Pro Thr Glu Lys Glu Asn Asn Pro Gly Met Ala Glu His 980 985 990 Pro Arg Leu Pro Lys Arg Thr Gly Arg Ala Ser Ile Cys Thr Thr Ala 995 1000 1005 Gln Arg Ile Pro Val Ala Pro Ala Pro Arg Arg Thr Ser Met Ile 1010 1015 1020 Pro Leu Pro Ser Val Pro Gly Leu Ala His Leu Pro Ser Pro Leu 1025 1030 1035 Ala Pro Leu Ser Leu Cys Glu Ile Asp Ile Lys Glu Glu Asp Thr 1040 1045 1050 Gly Gly Ser Glu Ile Asn Cys Leu Pro Glu Gln Thr His Cys Asn 1055 1060 1065 Ser Pro Lys Gly Ile Lys His Gly Thr Arg Lys Leu Ser Thr Ile 1070 1075 1080 Leu Arg Gln Ser Leu Gln Lys Lys Met Gln Leu Asn Ser Pro Met 1085 1090 1095 Gln Gln His Leu Arg Lys Arg Gly Ile Asn Val Gly Met Glu Lys 1100 1105 1110 Val Arg Val Ser Ile Gly Ser Arg Gly Arg Met Ala His Arg Val 1115 1120 1125 Leu Leu Gly Asn Gly Arg Arg Thr Gly Ile Lys Asp Thr Gln Gln 1130 1135 1140 Asn Arg Ser His Arg Glu Lys Glu Arg Gly Trp Asn Ile Gly Thr 1145 1150 1155 Ala Gly Arg Thr Ala Ile 1160 <210> 1057 <211> 465 <212> PRT <213> Ricinus communis <220> <221> MOD_RES <222> (415)..(415) <223> Any amino acid <400> 1057 Met Glu Glu Ser Lys Leu Glu Lys Lys Asn Val Pro Val Leu Pro Trp 1 5 10 15 Met Arg Cys Pro Val Asp Ile Lys Gln Phe Glu Glu Cys Ser Leu Asp 20 25 30 Leu Val Pro Cys Leu Asp Pro Arg Leu Lys Val Ala Leu Glu Asn Met 35 40 45 Gly Phe Thr Ser Leu Phe Ala Val Gln Val Ala Val Trp Gln Glu Thr 50 55 60 Ile Gly Pro Gly Asn Phe Glu Arg Asp Leu Cys Ile Asn Ala Pro Thr 65 70 75 80 Gly Ser Gly Lys Thr Leu Ala Tyr Ala Leu Pro Ile Ile Gln Met Leu 85 90 95 Ser Thr Arg Ser Ile Lys Cys Leu Arg Ala Leu Ile Val Leu Pro Thr 100 105 110 Arg Asp Leu Ala Leu Gln Val Lys Gln Val Phe Ala Ala Leu Ala Pro 115 120 125 Ala Val Gly Leu Ser Val Gly Leu Ala Val Gly Gln Ser Ser Ile Ala 130 135 140 Gly Glu Ile Ser Glu Leu Ile Lys Arg Pro Lys Leu Glu Ala Gly Ile 145 150 155 160 Cys Tyr Asp Arg Asp Asp Leu Met Gln Glu Leu Gln Thr Ser Val Asp 165 170 175 Ile Leu Val Ala Thr Pro Gly Arg Leu Met Asp His Ile Thr Asn Thr 180 185 190 Lys Gly Phe Thr Leu Glu His Leu Cys Tyr Leu Val Glu Arg Gly Phe 195 200 205 Lys Gly Lys Ser Tyr Pro Arg Leu Ala Lys Met Val Leu Ser Ala Thr 210 215 220 Leu Thr Gln Asp Pro Ser Lys Leu Val Gln Leu Asp Leu His His Pro 225 230 235 240 Leu Phe Leu Thr Thr Gly Gln Ser Arg Tyr Gln Leu Pro Glu Lys Leu 245 250 255 Glu Ser Tyr Arg Val Ile Cys Glu Pro Lys Leu Lys Pro Leu Tyr Leu 260 265 270 Val Ala Leu Leu Gln Asn Leu Val Gly Glu Lys Cys Ile Val Phe Ala 275 280 285 Ser Ser Val Glu Ser Thr His Arg Leu Cys Thr Leu Leu Lys Phe Phe 290 295 300 Gly Asp Leu Lys Val Lys Ile Lys Glu Tyr Ser Gly Leu Gln His Gln 305 310 315 320 Ser Val Arg Ser Lys Thr Leu Lys Ala Phe Arg Glu Gly Lys Ile Gln 325 330 335 Val Leu Val Ser Ser Asp Ala Met Thr Arg Gly Met Asp Val Glu Gly 340 345 350 Val Arg Asn Val Ile Asn Tyr Asp Lys Pro Ala Tyr Ile Lys Thr Tyr 355 360 365 Ile His Arg Ala Gly Arg Thr Ala Arg Ala Gly Gln Val Gly Arg Cys 370 375 380 Phe Thr Leu Leu His Lys Glu Glu Val Arg His Phe Arg Lys Leu Leu 385 390 395 400 Gln Lys Ala Asp Asn Asp Ser Phe Pro Val Tyr Ser Leu Pro Xaa Ser 405 410 415 Tyr Ile Glu Pro Leu Tyr Pro Thr Tyr Glu Ser Ala Leu Glu Lys Leu 420 425 430 Lys Glu Lys Val Gln Ser Glu Thr Ser Arg Lys Arg Arg Thr Gly Phe 435 440 445 Lys Phe Gln Gly Gln Val Lys Glu Arg Arg Lys Glu Lys Gln Ser Asn 450 455 460 Ser 465 <210> 1058 <400> 1058 000 <210> 1059 <400> 1059 000 <210> 1060 <400> 1060 000 <210> 1061 <400> 1061 000 <210> 1062 <400> 1062 000 <210> 1063 <400> 1063 000 <210> 1064 <400> 1064 000 <210> 1065 <400> 1065 000 <210> 1066 <400> 1066 000 <210> 1067 <400> 1067 000 <210> 1068 <400> 1068 000 <210> 1069 <400> 1069 000 <210> 1070 <400> 1070 000 <210> 1071 <400> 1071 000 <210> 1072 <400> 1072 000 <210> 1073 <400> 1073 000 <210> 1074 <400> 1074 000 <210> 1075 <400> 1075 000 <210> 1076 <400> 1076 000 <210> 1077 <400> 1077 000 <210> 1078 <400> 1078 000 <210> 1079 <400> 1079 000 <210> 1080 <400> 1080 000 <210> 1081 <400> 1081 000 <210> 1082 <400> 1082 000 <210> 1083 <400> 1083 000 <210> 1084 <400> 1084 000 <210> 1085 <400> 1085 000 <210> 1086 <400> 1086 000 <210> 1087 <400> 1087 000 <210> 1088 <400> 1088 000 <210> 1089 <400> 1089 000 <210> 1090 <400> 1090 000 <210> 1091 <400> 1091 000 <210> 1092 <400> 1092 000 <210> 1093 <400> 1093 000 <210> 1094 <400> 1094 000 <210> 1095 <400> 1095 000 <210> 1096 <400> 1096 000 <210> 1097 <400> 1097 000 <210> 1098 <400> 1098 000 <210> 1099 <400> 1099 000 <210> 1100 <400> 1100 000 <210> 1101 <211> 429 <212> DNA <213> Bacillus anthracis <400> 1101 atgttaaaaa aattatcagt atttcttatt ggtactttgc tattgtttgg tttagcagcc 60 tgtgatagca tcaaatcggt ggctagcgat gttacagtag gaaaagtaat tgaagaattt 120 aaggctgcag gacttgaagc agaacagcct agtgatctac cggaaaaaga atttgggaat 180 actagaaaag atgcgaaacg cattcttgta ccagcactag gagaagatag tggtggtaga 240 atatttgagt ttaaaaacaa acaagatctt gaacaagcga aaaagtacta tgacgattta 300 ggtaacggta atcaaatgtt attctctcat acttacgcaa aaggtaattt tcttttacaa 360 atgaatggtg acatggaaga tgcccaattt aacaaatata aagaagtaat ggacaaaata 420 attaagtaa 429 <210> 1102 <211> 210 <212> DNA <213> Bacillus anthracis <400> 1102 gtgtatatca taattaattt cgagccatta agtccagtta tgaatgacat agcaatcaag 60 cttgccatgg tactatttat accgttattc ctagcattaa ttgtcaaagt tatacttatg 120 aaatttatga aagagtcgat tgctggcaga attgcaagtc tatctctctt atttttcatg 180 tactatgtat ttatatttgt tacagggtaa 210 <210> 1103 <211> 639 <212> DNA <213> Bacillus anthracis <400> 1103 atggaagtgt tgatatttga attaattctc attgcggttc tgattccgtt gaatagtgtt 60 gtgaaaaaac atgtaccgaa atggaaagga aaagccggag agaaactggt gaaacgtatg 120 ctaagtaaat tagatccaaa aagttactat gtattacata atgtgacggt ttatacggag 180 tacggtgata caacacaaat tgaccatatt gttattgctg aaacaggtgt atttgttgtg 240 gagacgaaga actatgaggg ctggatctat ggaagtgaga aagcggcaag gtggacacag 300 ggtattttta gaaagaaatc ctcttttcaa aatccatttc accaaaacta taaacatata 360 aaagccattg aatggttaat agaacaacag ctgccgtgta tctctatggc agcatttcat 420 ccaaaatgca gtctaaaaag agtaaatgtt cattctaaag agaaacatgt cctgtattat 480 aacgatctac aaaaatgtat tgaatcatat actgatgtgc aactaacaaa tgatgaggtc 540 cagcatatct atcacacaat attacgagcg aatattatgg ataaggatat tgaaaagaaa 600 catgtgaagt atttacacaa taagttcgct aagcaataa 639 <210> 1104 <400> 1104 000 <210> 1105 <400> 1105 000 <210> 1106 <400> 1106 000 <210> 1107 <400> 1107 000 <210> 1108 <400> 1108 000 <210> 1109 <400> 1109 000 <210> 1110 <400> 1110 000 <210> 1111 <400> 1111 000 <210> 1112 <400> 1112 000 <210> 1113 <400> 1113 000 <210> 1114 <400> 1114 000 <210> 1115 <400> 1115 000 <210> 1116 <400> 1116 000 <210> 1117 <400> 1117 000 <210> 1118 <400> 1118 000 <210> 1119 <400> 1119 000 <210> 1120 <400> 1120 000 <210> 1121 <400> 1121 000 <210> 1122 <400> 1122 000 <210> 1123 <400> 1123 000 <210> 1124 <400> 1124 000 <210> 1125 <400> 1125 000 <210> 1126 <400> 1126 000 <210> 1127 <400> 1127 000 <210> 1128 <400> 1128 000 <210> 1129 <400> 1129 000 <210> 1130 <400> 1130 000 <210> 1131 <400> 1131 000 <210> 1132 <400> 1132 000 <210> 1133 <400> 1133 000 <210> 1134 <400> 1134 000 <210> 1135 <400> 1135 000 <210> 1136 <400> 1136 000 <210> 1137 <400> 1137 000 <210> 1138 <400> 1138 000 <210> 1139 <400> 1139 000 <210> 1140 <400> 1140 000 <210> 1141 <400> 1141 000 <210> 1142 <400> 1142 000 <210> 1143 <400> 1143 000 <210> 1144 <400> 1144 000 <210> 1145 <400> 1145 000 <210> 1146 <400> 1146 000 <210> 1147 <400> 1147 000 <210> 1148 <400> 1148 000 <210> 1149 <400> 1149 000 <210> 1150 <400> 1150 000 <210> 1151 <211> 142 <212> PRT <213> Bacillus anthracis <400> 1151 Met Leu Lys Lys Leu Ser Val Phe Leu Ile Gly Thr Leu Leu Leu Phe 1 5 10 15 Gly Leu Ala Ala Cys Asp Ser Ile Lys Ser Val Ala Ser Asp Val Thr 20 25 30 Val Gly Lys Val Ile Glu Glu Phe Lys Ala Ala Gly Leu Glu Ala Glu 35 40 45 Gln Pro Ser Asp Leu Pro Glu Lys Glu Phe Gly Asn Thr Arg Lys Asp 50 55 60 Ala Lys Arg Ile Leu Val Pro Ala Leu Gly Glu Asp Ser Gly Gly Arg 65 70 75 80 Ile Phe Glu Phe Lys Asn Lys Gln Asp Leu Glu Gln Ala Lys Lys Tyr 85 90 95 Tyr Asp Asp Leu Gly Asn Gly Asn Gln Met Leu Phe Ser His Thr Tyr 100 105 110 Ala Lys Gly Asn Phe Leu Leu Gln Met Asn Gly Asp Met Glu Asp Ala 115 120 125 Gln Phe Asn Lys Tyr Lys Glu Val Met Asp Lys Ile Ile Lys 130 135 140 <210> 1152 <211> 69 <212> PRT <213> Bacillus anthracis <400> 1152 Met Tyr Ile Ile Ile Asn Phe Glu Pro Leu Ser Pro Val Met Asn Asp 1 5 10 15 Ile Ala Ile Lys Leu Ala Met Val Leu Phe Ile Pro Leu Phe Leu Ala 20 25 30 Leu Ile Val Lys Val Ile Leu Met Lys Phe Met Lys Glu Ser Ile Ala 35 40 45 Gly Arg Ile Ala Ser Leu Ser Leu Leu Phe Phe Met Tyr Tyr Val Phe 50 55 60 Ile Phe Val Thr Gly 65 <210> 1153 <211> 212 <212> PRT <213> Bacillus anthracis <400> 1153 Met Glu Val Leu Ile Phe Glu Leu Ile Leu Ile Ala Val Leu Ile Pro 1 5 10 15 Leu Asn Ser Val Val Lys Lys His Val Pro Lys Trp Lys Gly Lys Ala 20 25 30 Gly Glu Lys Leu Val Lys Arg Met Leu Ser Lys Leu Asp Pro Lys Ser 35 40 45 Tyr Tyr Val Leu His Asn Val Thr Val Tyr Thr Glu Tyr Gly Asp Thr 50 55 60 Thr Gln Ile Asp His Ile Val Ile Ala Glu Thr Gly Val Phe Val Val 65 70 75 80 Glu Thr Lys Asn Tyr Glu Gly Trp Ile Tyr Gly Ser Glu Lys Ala Ala 85 90 95 Arg Trp Thr Gln Gly Ile Phe Arg Lys Lys Ser Ser Phe Gln Asn Pro 100 105 110 Phe His Gln Asn Tyr Lys His Ile Lys Ala Ile Glu Trp Leu Ile Glu 115 120 125 Gln Gln Leu Pro Cys Ile Ser Met Ala Ala Phe His Pro Lys Cys Ser 130 135 140 Leu Lys Arg Val Asn Val His Ser Lys Glu Lys His Val Leu Tyr Tyr 145 150 155 160 Asn Asp Leu Gln Lys Cys Ile Glu Ser Tyr Thr Asp Val Gln Leu Thr 165 170 175 Asn Asp Glu Val Gln His Ile Tyr His Thr Ile Leu Arg Ala Asn Ile 180 185 190 Met Asp Lys Asp Ile Glu Lys Lys His Val Lys Tyr Leu His Asn Lys 195 200 205 Phe Ala Lys Gln 210 <210> 1154 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 1154 Arg Arg Arg Arg Arg Arg Arg Arg Arg 1 5

Claims (60)

  1. 핵의 부재하에서 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2)에 대한 백신의 합성 또는 분비를 위한 하나 이상의 세포내 세포소기관을 포함하는 핵이 없는 세포.
  2. 제1항에 있어서, 하나 이상의 세포내 세포소기관이 소포체 또는 골지체인 핵이 없는 세포.
  3. 제1항에 있어서, 핵이 없는 세포의 표면에 백신이 커플링된 것인 핵이 없는 세포.
  4. 제3항에 있어서, 백신이 핵이 없는 세포의 표면에 백신을 커플링시키는 막횡단 도메인을 포함하는 것인 핵이 없는 세포.
  5. 제1항에 있어서, 과립구-대식세포 콜로니 자극 인자를 포함하는 면역조정제를 추가로 포함하는 핵이 없는 세포.
  6. 제1항에 있어서,
    (a) 류코시아린;
    (b) L-셀렉틴, 림프구 기능 연관 항원 1;
    (c) 초후기 항원-4;
    (d) (a) 내지 (c) 중 어느 하나의 일부; 또는
    (e) (a) 내지 (d)의 임의의 조합
    을 포함하는 귀소 수용체를 추가로 포함하는 핵이 없는 세포.
  7. 제1항에 있어서, 직경이 약 1 마이크로미터(㎛) 내지 100 ㎛인 핵이 없는 세포.
  8. 제7항에 있어서, 직경이 약 8 ㎛인 핵이 없는 세포.
  9. 제1항에 있어서,
    (a) 현탁액 중에서 복수의 핵이 없는 세포의 분취량을 원심분리하여 세포 펠릿을 생성하는 단계;
    (b) 무혈청 배지 중에 세포 펠릿을 재현탁시켜 무혈청 세포 현탁액을 생성하는 단계;
    (c) 1부 트리판 블루 염료 및 1부의 무혈청 세포 현탁액을 혼합하하는 단계;
    (d) (c)의 3-5분 이내에 복수의 핵이 없는 세포를 계수하는 단계로서, 복수의 핵이 없는 세포 중 적어도 일부는 트리판 블루 염료로 염색되지 않고, 이는 생존능을 시사하는 것인 단계
    에 의해 생존능을 측정할 때, 핵이 없는 세포는 적어도 24시간 동안 냉동동면 후 생존가능한 것인 핵이 없는 세포.
  10. 제1항에 있어서, 생존능이
    (a) 현탁액 중에서 복수의 핵이 없는 세포의 분취량을 원심분리하여 세포 펠릿을 생성하는 단계;
    (b) 무혈청 배지 중에 세포 펠릿을 재현탁시켜 무혈청 세포 현탁액을 생성하는 단계;
    (c) 1부 트리판 블루 염료 및 1부의 무혈청 세포 현탁액을 혼합하는 단계;
    (d) (c)의 3-5분 이내에 복수의 핵이 없는 세포를 계수하는 단계로서, 복수의 핵이 없는 세포 중 적어도 일부는 트리판 블루 염료로 염색되지 않고, 이는 생존능을 시사하는 것인 단계
    에 의해 생존능을 측정할 때, 핵이 없는 세포는 적어도 24시간 동안 동결보존 후 생존가능한 것인 핵이 없는 세포.
  11. 제1항에 있어서, 동결보존, 냉동동면, 또는 동결건조된 것인 핵이 없는 세포.
  12. 제1항에 있어서, 단리 또는 정제된 것인 핵이 없는 세포.
  13. (a) 제1항의 핵이 없는 세포 또는 복수의 제1항의 핵이 없는 세포; 및
    (b) 약학적으로 허용되는 부형제, 희석제, 또는 담체
    를 포함하는 약학적 제제.
  14. (a) 세포로부터 핵을 제거하여, 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2)에 대한 백신의 합성 또는 분비를 위한 하나 이상의 세포내 세포소기관을 포함하는 제핵 세포를 생성하는 단계; 및
    (b) 백신을 코딩하는 외인성 mRNA를 제핵 세포에 도입하는 단계로서, 제핵 세포는 핵의 부재하에서 백신을 발현하는 것인 단계
    를 포함하는 백신 제조 방법.
  15. 제14항에 있어서, 제핵 세포를 4℃ 이하에서 보관하여 제핵 세포의 생물학적 활성을 가역적으로 저속화 또는 정지시킨 후, 이어서, (b)에서의 도입 전에 해동시키는 것인 방법.
  16. 제14항에 있어서, 핵이 없는 세포를 동결건조시킨 후, 이어서, (b)에서의 도입 전에 재수화시키는 것인 방법.
  17. 제14항에 있어서, 제핵 세포를 -120℃ 이하에서 보관하여 제핵 세포의 생물학적 활성을 가역적으로 저속화 또는 정지시킨 후, 이어서, (b)에서의 도입 전에 해동시키는 것인 방법.
  18. 제14항에 있어서, (a)에서 세포로부터 핵을 제거하는 단계가 세포 분화 없이 수행되는 것인 방법.
  19. 제14항에 있어서, 하나 이상의 세포내 세포소기관이 소포체 또는 골지체인 방법.
  20. 제14항에 있어서, 핵이 없는 세포의 직경이 약 1 마이크로미터(㎛) 내지 100 ㎛인 방법.
  21. 제20항에 있어서, 직경이 약 8 ㎛인 방법.
  22. 제14항에 있어서, (a)에서 핵을 제거하기 전에 과립구-대식세포 콜로니 자극 인자를 포함하는 면역조정제를 코딩하는 핵산 서열을 포함하는 외인성 핵산 분자를 세포에 도입하는 단계를 추가로 포함하는 방법.
  23. 제14항에 있어서, (a)에서 핵을 제거하기 전에
    a) 류코시아린;
    b) L-셀렉틴, 림프구 기능 연관 항원 1;
    c) 초후기 항원-4;
    d) C-X-C 케모카인 수용체 타입 3;
    e) CD44 항원;
    f) C-C 케모카인 수용체 타입 7;
    g) (a) 내지 (f) 중 어느 하나의 일부; 또는
    h) (a) 내지 (g)의 임의의 조합
    을 포함하는 귀소 수용체를 코딩하는 핵산 서열을 갖는 외인성 핵산 분자를 세포에 도입하는 단계를 추가로 포함하는 방법.
  24. 제14항에 있어서, 과립구-대식세포 콜로니 자극 인자를 포함하는 면역조정제를 코딩하는 서열을 포함하는 외인성 mRNA 분자를 핵이 없는 세포에 도입하는 단계를 추가로 포함하는 방법.
  25. 제14항에 있어서,
    (a) 류코시아린;
    (b) L-셀렉틴, 림프구 기능 연관 항원 1;
    (c) 초후기 항원-4;
    (d) C-X-C 케모카인 수용체 타입 3;
    (e) CD44 항원;
    (f) C-C 케모카인 수용체 타입 7;
    (g) (a) 내지 (f) 중 어느 하나의 일부; 또는
    (h) (a) 내지 (g)의 임의의 조합
    을 포함하는 귀소 수용체를 코딩하는 서열을 포함하는 외인성 mRNA 분자를 핵이 없는 세포에 도입하는 단계를 추가로 포함하는 방법.
  26. 핵의 부재하에서 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2)에 대한 백신의 합성 또는 분비를 위한 하나 이상의 세포내 세포소기관을 포함하는 핵이 없는 세포를 피험체에게 투여하는 단계를 포함하는, 피험체에게 SARS-CoV-2에 대한 백신을 전달하는 방법.
  27. 제26항에 있어서, 하나 이상의 세포내 세포소기관이 소포체 또는 골지체인 것인 방법.
  28. 제26항에 있어서, 핵이 없는 세포가 과립구-대식세포 콜로니 자극 인자를 포함하는 면역조정제를 추가로 포함하는 것인 방법.
  29. 제26항에 있어서, 핵이 없는 세포가
    (a) 류코시아린;
    (b) L-셀렉틴, 림프구 기능 연관 항원 1;
    (c) 초후기 항원-4;
    (d) (a) 내지 (c) 중 어느 하나의 일부; 또는
    (e) (a) 내지 (d)의 임의의 조합
    을 포함하는 귀소 수용체를 추가로 포함하는 것인 방법.
  30. 제26항에 있어서, 핵이 없는 세포의 직경이 약 1 마이크로미터(㎛) 내지 100 ㎛인 방법.
  31. 제30항에 있어서, 직경이 약 8 ㎛인 방법.
  32. 제26항에 있어서, 투여 단계가 전신 투여를 포함하는 것인 방법.
  33. 제26항에 있어서, 핵이 없는 세포가 약 103개의 세포/kg(체중) 내지 약 1012 개의 세포/kg(체중)의 투여량으로 투여되는 것인 방법.
  34. 제26항에 있어서, 핵이 없는 세포가 피험체에게 적어도 1시간, 2시간, 4시간, 6시간, 8시간, 12시간, 1일, 2일, 1주, 2주, 3주, 1개월, 2개월, 3개월, 4개월, 5개월, 6개월, 7개월, 8개월, 9개월, 10개월, 11개월, 1년, 2년, 3년, 또는 4년 이내에 2회 투여되는 것인 방법.
  35. 제26항에 있어서, 피험체가 인간인 방법.
  36. 제26항에 있어서, 애주번트를 투여하는 단계를 추가로 포함하는 방법.
  37. (a) 실질적으로 핵이 없는 복수의 세포로서, 이 중 적어도 하나의 핵이 없는 세포는 핵의 부재하에서 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2)에 대한 백신의 합성 또는 분비를 위한 하나 이상의 세포내 세포소기관을 포함하는 것인 실질적으로 핵이 없는 복수의 세포; 및
    (b) 실질적으로 핵이 없는 복수의 세포를 피험체에게 투여하는 것에 관한 사용설명서
    를 포함하는 키트.
  38. 제37항에 있어서, 실질적으로 핵이 없는 복수의 세포가 동결보존, 냉동동면, 또는 동결건조된 것인 키트.
  39. 제38항에 있어서, 피험체에게 실질적으로 핵이 없는 복수의 세포를 투여하기 전 실질적으로 핵이 없는 복수의 세포의 생물학적 활성을 회복시키는 것에 관한 사용설명서를 추가로 포함하는 키트.
  40. 제37항에 있어서, 백신을 코딩하는 외인성 mRNA를 제핵 세포에 도입하는 것에 관한 사용설명서를 추가로 포함하는 키트.
  41. 핵의 부재하에서 병원체 항원에 대한 수용체 또는 그의 병원체 항원 결합 단편의 합성을 위한 하나 이상의 세포내 세포소기관을 포함하는 핵이 없는 세포로서, 수용체 또는 수용체의 발현 수준은 핵이 없는 세포에 대해 외인성인 것인 핵이 없는 세포.
  42. 제41항에 있어서, 하나 이상의 세포내 세포소기관이 소포체 또는 골지체인 핵이 없는 세포.
  43. 제41항에 있어서, 병원체 항원에 대한 수용체 또는 그의 병원체 항원 결합 단편이 핵이 없는 세포의 표면에 커플링된 것인 핵이 없는 세포.
  44. 제41항에 있어서, 병원체 항원에 대한 수용체 또는 그의 병원체 항원 결합 단편이 핵이 없는 세포의 세포막 내에 막횡단 도메인을 포함하는 것인 핵이 없는 세포.
  45. 제41항에 있어서, 핵이 없는 세포가 과립구-대식세포 콜로니 자극 인자를 포함하는 면역조정제를 코딩하는 서열 또는 그의 일부를 갖는 외인성 mRNA 분자를 추가로 포함하는 것인 핵이 없는 세포.
  46. 제41항에 있어서, 핵이 없는 세포의 직경이 약 1 마이크로미터(㎛) 내지 100 ㎛인 핵이 없는 세포.
  47. 제46항에 있어서, 직경이 약 8 ㎛인 핵이 없는 세포.
  48. 제41항에 있어서, 생존능이
    (a) 현탁액 중에서 복수의 핵이 없는 세포의 분취량을 원심분리하여 세포 펠릿을 생성하는 단계;
    (b) 무혈청 배지 중에 세포 펠릿을 재현탁시켜 무혈청 세포 현탁액을 생성하는 단계;
    (c) 1부 트리판 블루 염료 및 1부의 무혈청 세포 현탁액을 혼합하는 단계;
    (d) (c)의 3-5분 이내에 복수의 핵이 없는 세포를 계수하는 단계로서, 복수의 핵이 없는 세포 중 적어도 일부는 트리판 블루 염료로 염색되지 않고, 이는 생존능을 시사하는 것인 단계
    에 의해 생존능을 측정할 때, 핵이 없는 세포는 적어도 24시간 동안 냉동동면 또는 동결보존 후 생존가능한 것인 핵이 없는 세포.
  49. 제41항에 있어서, 동결보존, 냉동동면, 또는 동결건조된 것인 핵이 없는 세포.
  50. 제41항에 있어서, 단리 또는 정제된 것인 핵이 없는 세포.
  51. 제41항에 있어서, 병원체 항원과 숙주 세포에 의해 생산된 그의 천연 수용체 사이의 결합을 차단하는 중화 항체를 추가로 포함하는 핵이 없는 세포.
  52. 제51항에 있어서, 중화 항체가 핵이 없는 세포의 하나 이상의 세포내 세포소기관에 의해 합성되는 것인 핵이 없는 세포.
  53. 제41항에 있어서,
    (a) 류코시아린;
    (b) L-셀렉틴, 림프구 기능 연관 항원 1;
    (c) 초후기 항원-4;
    (d) C-X-C 케모카인 수용체 타입 3;
    (e) CD44 항원;
    (f) C-C 케모카인 수용체 타입 7;
    (g) (a) 내지 (f) 중 어느 하나의 일부; 또는
    (h) (a) 내지 (g)의 임의의 조합
    을 포함하는 귀소 수용체를 추가로 포함하는 핵이 없는 세포.
  54. (a) 제41항 내지 제53항 중 어느 한 항의 핵이 없는 세포 또는 제41항 내지 제53항 중 어느 한 항의 복수의 핵이 없는 세포; 및
    (b) 약학적으로 허용되는 부형제, 희석제, 또는 담체
    를 포함하는 약학적 제제.
  55. 피험체에게 제1항 내지 제53항 중 어느 한 항의 핵이 없는 세포 또는 제54항의 약학적 제제를 투여하여 세포에 병원체 항원을 갖는 병원체를 포획하는 단계 및 병원체가 세포 내에서 증식하지 못하게 방해하는 단계를 포함하는, 피험체를 감염시키는 프로세스에서 병원체를 감소시키거나 또는 피험체에서 병원체에 의한 감염을 감소시키는 방법.
  56. 제55항에 있어서, 병원체가 투여 후 약 14일 이하인 기간 내에 피험체로부터 제거되는 것인 방법.
  57. 제55항에 있어서, 핵이 없는 세포가 중화 항체 또는 나노바디를 방출하여 병원체의 병원체 항원과 숙주 세포에 의해 생산된 그의 천연 수용체 사이의 결합을 차단하는 것인 방법.
  58. 제55항에 있어서, 투여 단계가 전신 투여를 포함하는 것인 방법.
  59. 제55항에 있어서, 핵이 없는 세포가 약 103 개의 세포/kg(체중) 내지 약 1012 개의 세포/kg(체중)의 투여량으로 투여되는 것인 방법.
  60. 제55항에 있어서, 핵이 없는 세포가 피험체에게 적어도 1시간, 2시간, 4시간, 6시간, 8시간, 12시간, 1일, 2일, 1주, 2주, 3주, 1개월, 2개월, 3개월, 4개월, 5개월, 6개월, 7개월, 8개월, 9개월, 10개월, 11개월, 1년, 2년, 3년, 또는 4년 이내에 2회 투여되는 것인 방법.
KR1020227031285A 2020-02-11 2021-02-10 신속한 백신 플랫폼 KR20220152226A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202062975044P 2020-02-11 2020-02-11
US62/975,044 2020-02-11
US202063014002P 2020-04-22 2020-04-22
US63/014,002 2020-04-22
PCT/US2021/017506 WO2021163222A1 (en) 2020-02-11 2021-02-10 Rapid vaccine platform

Publications (1)

Publication Number Publication Date
KR20220152226A true KR20220152226A (ko) 2022-11-15

Family

ID=77291860

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227031285A KR20220152226A (ko) 2020-02-11 2021-02-10 신속한 백신 플랫폼

Country Status (8)

Country Link
US (1) US20230218733A1 (ko)
EP (1) EP4103722A4 (ko)
JP (1) JP2023515355A (ko)
KR (1) KR20220152226A (ko)
CN (1) CN116113424A (ko)
AU (1) AU2021220188A1 (ko)
CA (1) CA3170538A1 (ko)
WO (1) WO2021163222A1 (ko)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2018316166A1 (en) * 2017-08-07 2020-02-06 The Regents Of The University Of California Platform for generating safe cell therapeutics
US11241493B2 (en) 2020-02-04 2022-02-08 Curevac Ag Coronavirus vaccine
US20240277830A1 (en) 2020-02-04 2024-08-22 CureVac SE Coronavirus vaccine
JP2024502210A (ja) 2020-12-22 2024-01-17 キュアバック エスイー SARS-CoV-2バリアントに対するRNAワクチン
GB2606693A (en) * 2021-04-08 2022-11-23 Exosis Inc Fusion protein
EP4322995A1 (en) * 2021-04-12 2024-02-21 La Jolla Institute for Immunology Coronavirus t cell epitopes and uses thereof
WO2023056293A1 (en) * 2021-09-28 2023-04-06 The Johns Hopkins University Polymeric nanoparticle genetic vaccines

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1995010291A1 (en) * 1993-10-08 1995-04-20 Cellpro Ii Methods for collection and cryopreservation of human granulocytes
CA2401117C (en) * 2000-03-03 2010-06-29 Juridical Foundation The Chemo-Sero-Therapeutic Research Institute Cell usable in serum-free culture and suspension culture and process for producing virus for vaccine by using the cell
CN101405026B (zh) * 2006-02-02 2015-04-22 全球免疫股份有限公司 用于诱导免疫应答的基于酵母的疫苗
CA2798616A1 (en) * 2010-05-07 2011-11-10 Baylor Research Institute Dendritic cell immunoreceptors (dcir)-mediated crosspriming of human cd8+ t cells
AU2018316166A1 (en) * 2017-08-07 2020-02-06 The Regents Of The University Of California Platform for generating safe cell therapeutics

Also Published As

Publication number Publication date
CA3170538A1 (en) 2021-08-19
US20230218733A1 (en) 2023-07-13
AU2021220188A1 (en) 2022-09-08
EP4103722A4 (en) 2024-05-22
JP2023515355A (ja) 2023-04-13
CN116113424A (zh) 2023-05-12
WO2021163222A1 (en) 2021-08-19
EP4103722A1 (en) 2022-12-21

Similar Documents

Publication Publication Date Title
KR20220152226A (ko) 신속한 백신 플랫폼
AU2017272721B2 (en) Novel genetically engineered vaccinia viruses
CN112673092B (zh) 工程化的免疫刺激性细菌菌株及其用途
KR102557818B1 (ko) 키메라 폭스바이러스 조성물 및 이의 용도
KR20230057487A (ko) 게놈 조정을 위한 방법 및 조성물
AU2024216517A1 (en) Enhanced systems for cell-mediated oncolytic viral therapy
RU2725726C2 (ru) Бактериофаги, фаговые пептиды и способы их применения
KR20230053735A (ko) 게놈의 조정을 위한 개선된 방법 및 조성물
KR101234062B1 (ko) 림프구 내 유전자 도입용 재조합 바이러스 벡터
KR20230111189A (ko) 재프로그램 가능한 iscb 뉴클레아제 및 이의 용도
AU2021201338A1 (en) Complete genome sequence of the methanogen methanobrevibacter ruminantium
KR20240019791A (ko) 원형 rna 조성물 및 방법
KR102531695B1 (ko) 프로바이오틱으로서 사용하기 위한 락토바실러스, 및 프로바이오틱을 비롯한 제제에 대한 면역 반응을 평가하기 위해 사용되는 혈액 세포 집단
KR20210132003A (ko) 변형된 오르토폭스 바이러스 벡터
KR20220165731A (ko) Sars-cov-2 바이러스에 대한 재조합 폭스바이러스 기반 백신
KR20230012583A (ko) 합성 변형된 백시니아 앙카라 (sMVA) 기반 코로나바이러스 백신
CN112543806A (zh) 合成嵌合痘苗病毒
CN112243377A (zh) 用于治疗和预防细菌相关的癌症的噬菌体
FR3055339A1 (fr) Methode de detection et d&#39;identification in vitro d&#39;un ou plusieurs pathogenes cibles presents dans un echantillon biologique
KR20240052720A (ko) 신규한 omni 117, 140, 150-158, 160-165, 167-177, 180-188, 191-198, 200, 201, 203, 205-209, 211-217, 219, 220, 222, 223, 226, 227, 229, 231-236, 238-245, 247, 250, 254, 256, 257, 260 및 262 crispr 뉴클레아제
KR20230160823A (ko) 치료 전달을 위한 조성물 및 방법
KR20230038205A (ko) 키메라 rsv 및 코로나바이러스 단백질, 면역원성 조성물, 및 사용 방법
KR20240032184A (ko) Sos 유전자 발현을 조절하기 위한 조성물 및 방법
KR20240006496A (ko) Omni 90-99, 101, 104-110, 114, 116, 118-123, 125, 126, 128, 129, 및 131-138 crispr 뉴클레아제
KR20220082033A (ko) 레트로바이러스의 계내 생성을 위한 생산자 바이러스