KR20190031266A - 알파바이러스 백신접종을 위한 조성물 및 방법 - Google Patents
알파바이러스 백신접종을 위한 조성물 및 방법 Download PDFInfo
- Publication number
- KR20190031266A KR20190031266A KR1020197004334A KR20197004334A KR20190031266A KR 20190031266 A KR20190031266 A KR 20190031266A KR 1020197004334 A KR1020197004334 A KR 1020197004334A KR 20197004334 A KR20197004334 A KR 20197004334A KR 20190031266 A KR20190031266 A KR 20190031266A
- Authority
- KR
- South Korea
- Prior art keywords
- ala
- val
- leu
- thr
- ser
- Prior art date
Links
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
- C12N15/861—Adenoviral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N7/00—Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/51—Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
- A61K2039/525—Virus
- A61K2039/5256—Virus expressing foreign proteins
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/51—Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
- A61K2039/53—DNA (RNA) vaccination
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/545—Medicinal preparations containing antigens or antibodies characterised by the dose, timing or administration schedule
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/57—Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2
- A61K2039/572—Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2 cytotoxic response
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/10011—Adenoviridae
- C12N2710/10311—Mastadenovirus, e.g. human or simian adenoviruses
- C12N2710/10341—Use of virus, viral particle or viral elements as a vector
- C12N2710/10343—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/36011—Togaviridae
- C12N2770/36111—Alphavirus, e.g. Sindbis virus, VEE, EEE, WEE, Semliki
- C12N2770/36122—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/36011—Togaviridae
- C12N2770/36111—Alphavirus, e.g. Sindbis virus, VEE, EEE, WEE, Semliki
- C12N2770/36134—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Virology (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medicinal Chemistry (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Public Health (AREA)
- Pharmacology & Pharmacy (AREA)
- Veterinary Medicine (AREA)
- Animal Behavior & Ethology (AREA)
- Immunology (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Epidemiology (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Oncology (AREA)
- Communicable Diseases (AREA)
- Physics & Mathematics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Mycology (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
하나 이상의 알파바이러스 항원 유전자를 함유하는 재조합 아데노바이러스 기반 벡터 백신의 조성물이 본원에 개시되어 있다. 그러한 백신의 구축 및 생산 방법 및 이들 백신을 사용하여 알파바이러스에 대해 광범위한 면역 반응을 생성하는 방법이 또한 기재되어 있다. 본원에 기재된 조성물은 아데노바이러스에 대해 기존 면역성을 갖는 개체에서 백신접종을 허용한다.
Description
교차 참조
본 출원은 2016 년 7 월 15 일에 제출된 미국 가 특허 출원 제 62/363,136 호의 유익을 주장하며, 상기의 공개는 그것의 전문이 참조로 포함된다.
서열 목록
본 출원은 ASCII 포맷으로 전자적으로 제출되며 그 전체가 참조로 포함되는 서열 목록을 포함한다. 2017 년 7 월 7 일에 생성된 상기 ASCII 카피는 39891-725_601_SL.txt 의 명칭을 가지며 크기가 460,196 바이트이다.
백신은 유해한 물질 및 질환에 걸린 세포를 인식하고 파괴하도록 면역계를 훈련시켜 신체가 질환과 싸우는 것을 돕는다.
현재 바이러스 백신은 감염성 질환을 예방하고 기존 암을 치료하도록 개발되고 있다. 이들 바이러스 백신은 숙주 세포 내에서 질환과 연관된 유전자의 소부분 또는 완전한 유전자의 발현을 유도시켜 작용하며, 이는 그 다음으로 질환에 걸린 세포를 식별하고 파괴하도록 숙주의 면역계를 증강시킨다. 이와 같이, 바이러스 백신으로 인한 임상 반응은 고수준 면역원성을 유도하고 장기간 발현을 지속하는 백신의 능력에 따라 좌우될 수 있다.
따라서, 복합 질환 및 특히 새로이 생겨나는 질환의 위협에 대한 증강된 보호적 또는 암 치료적 반응을 위한 신규 조성물 및 방법을 발견하려는 요구가 남아 있다.
발명의 개요
다양한 양태에서, 본 개시물은 알파바이러스 표적 항원을 인코딩하는 서열을 포함하는 복제 결함성 바이러스 벡터를 포함하는 조성물을 제공한다. 일부 양태에서, 알파바이러스 표적 항원을 인코딩하는 서열은 복수의 알파바이러스 표적 항원을 인코딩하는 서열을 포함한다. 일부 양태에서, 복수의 알파바이러스 표적 항원을 인코딩하는 서열은 표적 항원에 각각 상응하는 복수의 유전자 삽입물을 포함하고, 각각의 유전자 삽입물은 자가-절단 2A 펩티드를 인코딩하는 핵산 서열에 의해 분리되어 있다. 일부 양태에서, 자가-절단 2A 펩티드는 돼지 테스코바이러스-1 (Porcine teschovirus-1) 또는 토세아 아시그나 바이러스 (Thosea asigna virus) 에서 유래한다.
일부 양태에서, 복제 결함성 바이러스 벡터는 아데노바이러스 벡터이다. 추가의 양태에서, 복제 결함성 바이러스 벡터는 아데노바이러스 5 (Ad5) 벡터이다. 일부 양태에서, 복제 결함성 바이러스 벡터는 E1 유전자 부위, E2b 유전자 부위, E3 유전자 부위, E4 유전자 부위, 또는 그의 임의의 조합에서 결실을 갖는 아데노바이러스 벡터를 포함한다. 추가의 양태에서, E2b 유전자 부위에서의 결실은 E2b 부위에서의 복수의 결실을 포함한다. 일부 양태에서, E1 유전자 부위, E2b 유전자 부위, E3 유전자 부위, E4 유전자 부위, 또는 그의 임의의 조합에서의 결실은 각각 적어도 하나의 염기쌍을 포함한다.
다른 양태에서, E1 유전자 부위, E2b 유전자 부위, E3 유전자 부위, E4 유전자 부위, 또는 그의 임의의 조합에서의 결실은 둘 이상의 염기쌍의 전좌로 인한 것이다. 일부 양태에서, E1 유전자 부위, E2b 유전자 부위, E3 유전자 부위, E4 유전자 부위, 또는 그의 임의의 조합에서의 결실은 각각 적어도 20 개, 적어도 30 개, 적어도 40 개, 적어도 50 개, 적어도 60 개, 적어도 70 개, 적어도 80 개, 적어도 90 개, 적어도 100 개, 적어도 110 개, 적어도 120 개, 적어도 130 개, 적어도 140 개, 또는 적어도 150 개의 염기쌍을 포함한다.
다른 양태에서, E1 유전자 부위, E2b 유전자 부위, E3 유전자 부위, E4 유전자 부위, 또는 그의 임의의 조합에서의 결실은 각각 150 개 초과, 160 개 초과, 170 개 초과, 180 개 초과, 190 개 초과, 200 개 초과, 250 개 초과, 또는 300 개 초과의 염기쌍을 포함한다.
일부 양태에서, 알파바이러스 표적 항원은 치쿤구니아 바이러스 (CHIKV), 오니옹니옹 바이러스 (ONNV), 로스 리버 바이러스 (RRV), 마야로 열 바이러스 (MAYV), 베네수엘라 말 뇌염 바이러스 (VEEV), 서부 말 뇌척수염 바이러스 (WEEV), 및 동부 말 뇌염 바이러스 (EEEV), 또는 그의 임의의 조합으로 이루어지는 군으로부터 선택되는 바이러스의 항원을 포함한다. 일부 양태에서, 알파바이러스 표적 항원은 CHIKV, ONNV, RRV, 및 MAYV, 또는 그의 임의의 조합으로 이루어지는 군으로부터 선택되는 바이러스의 항원을 포함한다. 추가의 양태에서, 알파바이러스 표적 항원은 CHIKV 의 항원을 포함한다.
일부 양태에서, 알파바이러스 표적 항원은 C, E3ALPHA, E2ALPHA, 6K, E1ALPHA, nsP1, nsP2, nsP3, 및 nsP4, 또는 그의 임의의 조합으로 이루어지는 군으로부터 선택되는 항원을 포함한다. 일부 양태에서, 알파바이러스 표적 항원은 C, E3ALPHA, E2ALPHA, 및 6K, E1ALPHA, 또는 그의 임의의 조합으로 이루어지는 군으로부터 선택되는 항원을 포함한다. 일부 양태에서, 알파바이러스 표적 항원은 E1ALPHA 및 E2ALPHA, 또는 그의 임의의 조합으로 이루어지는 군으로부터 선택되는 항원을 포함한다.
일부 양태에서, 알파바이러스 표적 항원을 인코딩하는 서열은 SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 20, 및 SEQ ID NO: 21, 또는 그의 임의의 조합으로 이루어지는 군으로부터 선택되는 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 92%, 적어도 95%, 적어도 97%, 또는 적어도 99% 서열 동일성을 포함한다.
다른 양태에서, 알파바이러스 표적 항원을 인코딩하는 서열은 아미노산 서열이고, 아미노산 서열은 SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 11, 및 SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 20, 및 SEQ ID NO: 21 또는 그의 임의의 조합으로 이루어지는 군으로부터 선택되는 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 92%, 적어도 95%, 적어도 97%, 또는 적어도 99% 서열 동일성을 포함한다.
일부 양태에서, 알파바이러스 표적 항원을 인코딩하는 서열은 뉴클레오티드 서열이고, 뉴클레오티드 서열은 SEQ ID NO: 1, SEQ ID NO: 4, SEQ ID NO: 7, SEQ ID NO: 10, SEQ ID NO: 13, SEQ ID NO: 16, 및 SEQ ID NO: 19, 또는 그의 임의의 조합으로 이루어지는 군으로부터 선택되는 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 92%, 적어도 95%, 적어도 97%, 또는 적어도 99% 서열 동일성을 포함한다. 일부 양태에서, 알파바이러스 표적 항원을 인코딩하는 서열은 SEQ ID NO: 1, SEQ ID NO: 2, 및 SEQ ID NO: 3, 또는 그의 임의의 조합으로 이루어지는 군으로부터 선택되는 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 92%, 적어도 95%, 적어도 97%, 또는 적어도 99% 서열 동일성을 포함한다.
일부 양태에서, 복제 결함성 바이러스 벡터는 알파바이러스 표적 항원의 발현을 증가시키기 위한 요소를 추가로 포함한다. 일부 양태에서, 요소는 적어도 1 개의 요소, 적어도 2 개의 요소, 적어도 3 개의 요소, 적어도 4 개의 요소, 또는 적어도 5 개의 요소를 포함한다.
다른 양태에서, 요소는 내부 리보솜 결합 부위를 포함한다. 다른 양태에서, 요소는 구성적 프로모터를 포함한다. 일부 양태에서, 요소는 유도성 프로모터를 포함한다. 일부 양태에서, 요소는 전사 인핸서를 포함한다. 추가의 양태에서, 전사 인핸서는 라우스 육종 바이러스 (RSV) 인핸서이다. 일부 양태에서, 요소는 팔린드롬성 (palindromic) 서열을 함유하지 않는다.
일부 양태에서, 복제 결함성 바이러스 벡터는 알파바이러스 표적 항원 면역원성을 증가시키는 단백질을 인코딩하는 핵산 서열을 추가로 포함한다. 일부 양태에서, 복제 결함성 바이러스 벡터는 거트 (gutted) 벡터가 아니다. 일부 양태에서, 조성물 또는 복제 결함성 바이러스 벡터는 공동자극 분자 또는 면역학적 융합 파트너를 인코딩하는 서열을 추가로 포함한다. 일부 양태에서, 공동자극 분자는 B7, ICAM-1, LFA-3, 또는 그의 임의의 조합을 포함한다.
다양한 양태에서, 본 개시물은 청구항 1 내지 34 중 어느 한 항의 조성물 및 약학적으로 허용가능한 담체를 포함하는 약학 조성물을 제공한다.
다양한 양태에서, 본 개시물은 상기 조성물 중 어느 하나를 포함하는 세포를 제공한다. 일부 양태에서, 세포는 숙주 세포이다. 추가의 양태에서, 세포는 수지상 세포 (DC) 이다.
다양한 양태에서, 본 개시물은 상기 조성물 또는 상기 기재된 약학 조성물 중 어느 하나를 제조하는 것을 포함하는 백신의 제조 방법을 제공한다.
다양한 양태에서, 본 개시물은 하기 단계를 포함하는, 대상에서 알파바이러스 표적 항원에 대한 면역 반응을 생성하는 방법을 제공한다: 상기 조성물 또는 상기 기재된 약학 조성물 중 어느 하나를 대상에게 투여하는 단계. 일부 양태에서, 대상은 알파바이러스로 감염되지 않았다.
일부 양태에서, 알파바이러스 표적 항원은 알파바이러스로부터의 것이며, 알파바이러스는 치쿤구니아 바이러스 (CHIKV), 오니옹니옹 바이러스 (ONNV), 로스 리버 바이러스 (RRV), 마야로 열 바이러스 (MAYV), 베네수엘라 말 뇌염 바이러스 (VEEV), 서부 말 뇌척수염 바이러스 (WEEV), 동부 말 뇌염 바이러스 (EEEV), 또는 그의 임의의 조합을 포함한다.
다양한 양태에서, 본 개시물은 대상에서 치쿤구니아 바이러스 감염을 예방하는 방법으로서, 하기를 포함하는 조성물을 대상에게 투여하는 단계를 포함하는 방법을 제공한다: E2b 유전자 부위에서의 결실을 포함하는 복제 결함성 바이러스 벡터; 및 적어도 하나의 치쿤구니아 표적 항원을 인코딩하는 핵산 서열.
일부 양태에서, 대상은 아데노바이러스 또는 아데노바이러스 벡터에 대해 기존 면역성을 갖는다. 일부 양태에서, 대상은 인간 또는 비-인간 동물이다. 일부 양태에서, 투여는 정맥내, 피하, 림프선내, 종양내, 피부내, 근육내, 복강내, 직장내, 질내, 비강내, 경구, 방광 점적주입, 또는 난절법 (scarification) 을 통한 것이다.
일부 양태에서, 대상에게 조성물을 투여하는 것은 적어도 1 회이거나, 적어도 2 회 반복되거나, 또는 적어도 3 회 반복된다. 일부 양태에서, 대상에게 투여하는 것은 용량 당 1x109 내지 5x1012 바이러스 입자를 포함한다. 일부 양태에서, 대상에게 투여하는 것은 용량 당 적어도 109 바이러스 입자, 적어도 1010 바이러스 입자, 또는 적어도 1011 바이러스 입자를 포함한다. 일부 양태에서, 복제 결함성 바이러스 벡터는 아데노바이러스 벡터이다. 추가의 양태에서, 복제 결함성 바이러스 벡터는 아데노바이러스 5 (Ad5) 벡터이다.
참고문헌의 포함
본 명세서에 언급된 모든 공개물, 특허 및 특허 출원은 각각의 개별적 공개물, 특허 또는 특허 출원이 본원에 참조로 포함되는 것으로 구체적이고 개별적으로 표시되는 것과 동일한 정도로 본원에 참조로 포함된다.
도 1 은 알파바이러스 게놈의 하나의 구조를 예시한다.
도 2 는 생성된 SEQ ID NO: 1 의 뉴클레오티드 위치 7567 내지 11313 에서 유래하는 Ad5 [E1-, E2b-]-CHIKVstr 백신을 예시한다.
도 3 은 Ad5 [E1-, E2b-]-CHIKVstr 백신으로 감염된 HEK 293, 또는 모의 감염에서의 CHIKV 구조 단백질 발현을 예시한다. CHIKV 단백질 발현은 웨스턴 블롯에 의해 검출되었다.
도 4 는 Ad5 [E1-, E2b-]-CHIKVstr 백신을 사용하여 수행된 챌린지 연구의 결과를 예시한다. 마우스를 제 -14 일 및 제 -7 일에 2 회 백신접종하고, 그 후 제 0 일에 발바닥 내에 주입된 치사량의 CHIKV 으로 챌린지했다.
도 4A 는 Ad5 [E1-, E2b-]-CHIKVstr 백신으로 백신접종된 마우스가 CHIKV 감염에서 살아남는 것을 예시한다.
도 4B 는 Ad5 [E1-, E2b-]-CHIKVstr 백신으로 백신접종된 마우스가 그들의 챌린지 전 중량을 유지하는 것을 예시한다.
도 4C 는 Ad5 [E1-, E2b-]-CHIKVstr 백신으로 백신접종된 마우스가 백신접종되지 않은 대조군 마우스보다 더 빠르게 CHIKV-유도 발바닥 염증을 해결한 것을 예시한다.
도 5 는 본 개시물의 치쿤구니아 백신에 관한 예시적 유전자 구축물을 나타낸다.
도 5A 는 Ad5 [E1-, E2b-] 내로의 삽입에 사용될 3 개의 치쿤구니아 유전자 (C, E3, E2, 6K, 및 E1 유전자 (SEQ ID NO: 1 의 뉴클레오티드 767-11313); NS 유전자 1; NS 유전자 2) 를 함유하는 다중 유전자 구축물의 도식 표현을 나타낸다.
도 5B 는 도 5A 의 유전자 구축물의 번역 산물 및 각각의 산물의 화학량론적 풍도를 나타낸다.
도 6 은 ELISpot 어세이를 사용하는 면역화된 또는 대조군 마우스로부터의 비장세포에서의 세포-매개 면역 (CMI) 반응 (IFN-γ) 및 세포용해 T 림프구 (CTL) 반응 및 그랜자임 B 반응을 나타낸다. C57BL/6 마우스를 1x1010 바이러스 입자 (virus particles) (VP) 의 SEQ ID NO: 1 을 포함하는 Ad5 [E1-, E2b-]-CHIK 백신으로 또는 1x1010 VP 의 Ad5 [E1-, E2b-]-null (빈 (empty) 벡터 대조군) 으로 2-주 간격으로 2 회 면역화했다. 마지막 면역화 후 1 주에, 개별 마우스로부터의 비장세포를 치쿤구니아 바이러스 펩티드에 세포를 노출시킨 후의 면역 반응의 유도에 관해 시험했다. 데이타는 치쿤구니아 바이러스 펩티드의 3 개의 별개의 풀에 노출시킨 후의 106 개 비장세포 당 스팟 형성 세포 (SFC) 의 누적수를 보여준다 (치쿤구니아에 관한 펩티드 수는 어세이에서 사용하는 3 개의 별개의 풀로 분배할 수 있을 정도로 충분히 컸다 - CHIKV 펩티드 풀 1 은 펩티드 1-103 을 포함하고, CHIKV 펩티드 풀 2 는 펩티드 104-207 을 포함하고, 펩티드 풀 3 은 펩티드 208-310 을 포함한다). 부가적 비장세포를 어세이 측정 전에 음성 대조군으로서의 SIV-nef 펩티드 풀에 별개로 노출시켰다.
도 6A 는 ELISpot 어세이를 사용하여 IFN-γ 분비 SFC 에 의해 측정되는 Ad5 [E1-, E2b-]-CHIK 면역화된 및 대조군 C57BL/6 마우스에서의 CMI 반응을 나타낸다.
도 6B 는 ELISpot 어세이를 사용하여 그랜자임 B (GR-B) 분비 SFC 에 의해 측정되는 Ad5 [E1-, E2b-]-CHIK 면역화된 및 대조군 C57BL/6 마우스에서의 CTL 반응을 나타낸다.
도 7 은 흐름 세포측정법에 의해 분석되는 IFN-γ 또는 IFN-γ/TNF-α 의 세포내 발현에 의해 측정되는 면역화된 또는 대조군 C57BL/6 마우스로부터의 비장세포에서의 림프구 활성화를 나타낸다. C57BL/6 마우스를 1x1010 VP 의 SEQ ID NO: 1 을 포함하는 Ad5 [E1-, E2b-]-CHIK 백신으로 또는 1x1010 VP 의 Ad5 [E1-, E2b-]-null (빈 벡터 대조군) 으로 2-주 간격으로 2 회 면역화했다. 마지막 면역화 후 1 주에, 개별 마우스로부터의 비장세포를 치쿤구니아 바이러스 펩티드의 3 개의 별개의 풀에 노출시켰고 (치쿤구니아에 관한 펩티드 수는 어세이에서 사용하는 3 개의 별개의 풀로 분배할 수 있을 정도로 충분히 컸다 - CHIKV 펩티드 풀 1 은 펩티드 1-103 을 포함하고, CHIKV 펩티드 풀 2 는 펩티드 104-207 을 포함하고, 펩티드 풀 3 은 펩티드 208-310 을 포함한다), 세포내 사이토카인 발현의 유도에 관해 흐름 세포측정법에 의해 분석했다.
도 7A 는 면역화된 마우스 및 대조군 마우스로부터의 비장세포를 치쿤구니아 바이러스 펩티드의 3 개의 별개의 풀 및 대조군 (배지 및 SIV-nef 펩티드 풀) 에 노출시킨 후에 CD8+ 비장세포에서의 IFN-γ 의 세포내 발현의 흐름 세포측정법 분석에 의해 측정되는 림프구 활성화를 나타낸다.
도 7B 는 면역화된 마우스 및 대조군 마우스로부터의 비장세포를 치쿤구니아 바이러스 펩티드의 3 개의 별개의 풀 및 대조군 (배지 및 SIV-nef 펩티드 풀) 에 노출시킨 후에 CD4+ 비장세포에서의 IFN-γ 의 세포내 발현의 흐름 세포측정법 분석에 의해 측정되는 림프구 활성화를 나타낸다.
도 7C 는 면역화된 마우스 및 대조군 마우스로부터의 비장세포를 치쿤구니아 바이러스 펩티드의 3 개의 별개의 풀 및 대조군 (배지 및 SIV-nef 펩티드 풀) 에 노출시킨 후에 CD8+ 비장세포에서의 IFN-γ 및 TNF-α 의 세포내 발현의 흐름 세포측정법 분석에 의해 측정되는 림프구 활성화를 나타낸다.
도 7D 는 면역화된 마우스 및 대조군 마우스로부터의 비장세포를 치쿤구니아 바이러스 펩티드의 3 개의 별개의 풀 및 대조군 (배지 및 SIV-nef 펩티드 풀) 에 노출시킨 후에 CD4+ 비장세포에서의 IFN-γ 및 TNF-α 의 세포내 발현의 흐름 세포측정법 분석에 의해 측정되는 림프구 활성화를 나타낸다.
도 8 은 정량적 효소 결합 면역흡착 어세이 (ELISA) 에 의해 측정되는 대조군 마우스와 비교하여 면역화된 마우스에서의 항-치쿤구니아 외피 단백질-2 항체 반응을 나타낸다. C57BL/6 마우스를 1x1010 VP 의 SEQ ID NO: 1 을 포함하는 Ad5 [E1-, E2b-]-CHIK 백신으로 또는 1x1010 VP 의 Ad5 [E1-, E2b-]-null (빈 벡터 대조군) 으로 2-주 간격으로 2 회 면역화했다. 마지막 면역화 후 1 주에, 마우스로부터의 혈청을 항체 반응의 유도에 관해 평가했다. 혈액을 마취 하에 볼살 열상에 의해 수집했다.
도 2 는 생성된 SEQ ID NO: 1 의 뉴클레오티드 위치 7567 내지 11313 에서 유래하는 Ad5 [E1-, E2b-]-CHIKVstr 백신을 예시한다.
도 3 은 Ad5 [E1-, E2b-]-CHIKVstr 백신으로 감염된 HEK 293, 또는 모의 감염에서의 CHIKV 구조 단백질 발현을 예시한다. CHIKV 단백질 발현은 웨스턴 블롯에 의해 검출되었다.
도 4 는 Ad5 [E1-, E2b-]-CHIKVstr 백신을 사용하여 수행된 챌린지 연구의 결과를 예시한다. 마우스를 제 -14 일 및 제 -7 일에 2 회 백신접종하고, 그 후 제 0 일에 발바닥 내에 주입된 치사량의 CHIKV 으로 챌린지했다.
도 4A 는 Ad5 [E1-, E2b-]-CHIKVstr 백신으로 백신접종된 마우스가 CHIKV 감염에서 살아남는 것을 예시한다.
도 4B 는 Ad5 [E1-, E2b-]-CHIKVstr 백신으로 백신접종된 마우스가 그들의 챌린지 전 중량을 유지하는 것을 예시한다.
도 4C 는 Ad5 [E1-, E2b-]-CHIKVstr 백신으로 백신접종된 마우스가 백신접종되지 않은 대조군 마우스보다 더 빠르게 CHIKV-유도 발바닥 염증을 해결한 것을 예시한다.
도 5 는 본 개시물의 치쿤구니아 백신에 관한 예시적 유전자 구축물을 나타낸다.
도 5A 는 Ad5 [E1-, E2b-] 내로의 삽입에 사용될 3 개의 치쿤구니아 유전자 (C, E3, E2, 6K, 및 E1 유전자 (SEQ ID NO: 1 의 뉴클레오티드 767-11313); NS 유전자 1; NS 유전자 2) 를 함유하는 다중 유전자 구축물의 도식 표현을 나타낸다.
도 5B 는 도 5A 의 유전자 구축물의 번역 산물 및 각각의 산물의 화학량론적 풍도를 나타낸다.
도 6 은 ELISpot 어세이를 사용하는 면역화된 또는 대조군 마우스로부터의 비장세포에서의 세포-매개 면역 (CMI) 반응 (IFN-γ) 및 세포용해 T 림프구 (CTL) 반응 및 그랜자임 B 반응을 나타낸다. C57BL/6 마우스를 1x1010 바이러스 입자 (virus particles) (VP) 의 SEQ ID NO: 1 을 포함하는 Ad5 [E1-, E2b-]-CHIK 백신으로 또는 1x1010 VP 의 Ad5 [E1-, E2b-]-null (빈 (empty) 벡터 대조군) 으로 2-주 간격으로 2 회 면역화했다. 마지막 면역화 후 1 주에, 개별 마우스로부터의 비장세포를 치쿤구니아 바이러스 펩티드에 세포를 노출시킨 후의 면역 반응의 유도에 관해 시험했다. 데이타는 치쿤구니아 바이러스 펩티드의 3 개의 별개의 풀에 노출시킨 후의 106 개 비장세포 당 스팟 형성 세포 (SFC) 의 누적수를 보여준다 (치쿤구니아에 관한 펩티드 수는 어세이에서 사용하는 3 개의 별개의 풀로 분배할 수 있을 정도로 충분히 컸다 - CHIKV 펩티드 풀 1 은 펩티드 1-103 을 포함하고, CHIKV 펩티드 풀 2 는 펩티드 104-207 을 포함하고, 펩티드 풀 3 은 펩티드 208-310 을 포함한다). 부가적 비장세포를 어세이 측정 전에 음성 대조군으로서의 SIV-nef 펩티드 풀에 별개로 노출시켰다.
도 6A 는 ELISpot 어세이를 사용하여 IFN-γ 분비 SFC 에 의해 측정되는 Ad5 [E1-, E2b-]-CHIK 면역화된 및 대조군 C57BL/6 마우스에서의 CMI 반응을 나타낸다.
도 6B 는 ELISpot 어세이를 사용하여 그랜자임 B (GR-B) 분비 SFC 에 의해 측정되는 Ad5 [E1-, E2b-]-CHIK 면역화된 및 대조군 C57BL/6 마우스에서의 CTL 반응을 나타낸다.
도 7 은 흐름 세포측정법에 의해 분석되는 IFN-γ 또는 IFN-γ/TNF-α 의 세포내 발현에 의해 측정되는 면역화된 또는 대조군 C57BL/6 마우스로부터의 비장세포에서의 림프구 활성화를 나타낸다. C57BL/6 마우스를 1x1010 VP 의 SEQ ID NO: 1 을 포함하는 Ad5 [E1-, E2b-]-CHIK 백신으로 또는 1x1010 VP 의 Ad5 [E1-, E2b-]-null (빈 벡터 대조군) 으로 2-주 간격으로 2 회 면역화했다. 마지막 면역화 후 1 주에, 개별 마우스로부터의 비장세포를 치쿤구니아 바이러스 펩티드의 3 개의 별개의 풀에 노출시켰고 (치쿤구니아에 관한 펩티드 수는 어세이에서 사용하는 3 개의 별개의 풀로 분배할 수 있을 정도로 충분히 컸다 - CHIKV 펩티드 풀 1 은 펩티드 1-103 을 포함하고, CHIKV 펩티드 풀 2 는 펩티드 104-207 을 포함하고, 펩티드 풀 3 은 펩티드 208-310 을 포함한다), 세포내 사이토카인 발현의 유도에 관해 흐름 세포측정법에 의해 분석했다.
도 7A 는 면역화된 마우스 및 대조군 마우스로부터의 비장세포를 치쿤구니아 바이러스 펩티드의 3 개의 별개의 풀 및 대조군 (배지 및 SIV-nef 펩티드 풀) 에 노출시킨 후에 CD8+ 비장세포에서의 IFN-γ 의 세포내 발현의 흐름 세포측정법 분석에 의해 측정되는 림프구 활성화를 나타낸다.
도 7B 는 면역화된 마우스 및 대조군 마우스로부터의 비장세포를 치쿤구니아 바이러스 펩티드의 3 개의 별개의 풀 및 대조군 (배지 및 SIV-nef 펩티드 풀) 에 노출시킨 후에 CD4+ 비장세포에서의 IFN-γ 의 세포내 발현의 흐름 세포측정법 분석에 의해 측정되는 림프구 활성화를 나타낸다.
도 7C 는 면역화된 마우스 및 대조군 마우스로부터의 비장세포를 치쿤구니아 바이러스 펩티드의 3 개의 별개의 풀 및 대조군 (배지 및 SIV-nef 펩티드 풀) 에 노출시킨 후에 CD8+ 비장세포에서의 IFN-γ 및 TNF-α 의 세포내 발현의 흐름 세포측정법 분석에 의해 측정되는 림프구 활성화를 나타낸다.
도 7D 는 면역화된 마우스 및 대조군 마우스로부터의 비장세포를 치쿤구니아 바이러스 펩티드의 3 개의 별개의 풀 및 대조군 (배지 및 SIV-nef 펩티드 풀) 에 노출시킨 후에 CD4+ 비장세포에서의 IFN-γ 및 TNF-α 의 세포내 발현의 흐름 세포측정법 분석에 의해 측정되는 림프구 활성화를 나타낸다.
도 8 은 정량적 효소 결합 면역흡착 어세이 (ELISA) 에 의해 측정되는 대조군 마우스와 비교하여 면역화된 마우스에서의 항-치쿤구니아 외피 단백질-2 항체 반응을 나타낸다. C57BL/6 마우스를 1x1010 VP 의 SEQ ID NO: 1 을 포함하는 Ad5 [E1-, E2b-]-CHIK 백신으로 또는 1x1010 VP 의 Ad5 [E1-, E2b-]-null (빈 벡터 대조군) 으로 2-주 간격으로 2 회 면역화했다. 마지막 면역화 후 1 주에, 마우스로부터의 혈청을 항체 반응의 유도에 관해 평가했다. 혈액을 마취 하에 볼살 열상에 의해 수집했다.
상세한 설명
하기 구절은 상이한 양태를 보다 상세히 설명한다. 반대로 명백히 나타내지 않는 한, 각각의 양태는 임의의 다른 양태(들) 와 조합될 수 있다. 특히, 바람직하거나 유리한 것으로 나타내는 임의의 특질은 바람직하거나 유리한 것으로 나타내는 임의의 다른 특질과 조합될 수 있다.
특정 구현예에서, 알파바이러스 항원 예컨대 캡시드, E3ALPHA, E2ALPHA, 6K, 및 E1ALPHA 및 비구조 단백질 예컨대, nsP1, nsP2, nsP3, 및 nsP4 가, 예를 들어, 백신 조성물 또는 아데노바이러스 벡터를 포함하는 조성물에서 사용될 수 있다.
예를 들어, E2ALPHA 및 E1ALPHA 항원이 사용될 수 있다. 보호의 임상 상관관계가 알파바이러스 백신에 관해 확립되지 않았지만, 중화 항체 역가와 보호 사이의 상관관계를 지지하는 데이타가 존재한다. (Smalley, L., et al. Vaccine. (2016): 34(26): 2976-2981; Garca-Arriaza, J. et al. Journal of Virology (2014): 88(6):3527-47).
비-구조 알파바이러스 항원이 특정 양태에서 또한 사용될 수 있다. 연구는 게놈의 복제에 관여되는 비-구조 단백질이 보존된 부위를 함유하여, Ad5 벡터를 이용하는 것을 포함하는, 실험 백신에서 사용될 때 더 넓은 범위의 알파바이러스 보호를 제공할 수 있다는 것을 밝혔다.
본원에서 사용하는 바와 같이, 다르게 나타내지 않는 한, 단수형 관사는 명백히 다르게 제공되지 않는 한 하나 이상의 것을 의미한다.
본원에서 사용하는 바와 같이, 다르게 나타내지 않는 한, "함유하다", "함유하는", "비롯하다", "비롯하는" 등과 같은 용어는 "포함하는" 을 의미한다.
본원에서 사용하는 바와 같이, 다르게 나타내지 않는 한, 용어 "또는" 은 접속사 (conjunctive) 또는 이접적 접속사 (disjunctive) 일 수 있다.
본원에서 이용하는 바와 같이, 다르게 나타내지 않는 한, 임의의 구현예는 임의의 다른 구현예와 조합될 수 있다.
본원에서 사용하는 바와 같이, 다르게 나타내지 않는 한, 본원의 일부 발명 구현예는 수치 범위를 고려한다. 본 발명의 양태의 다양성은 범위 형식으로 제시될 수 있다. 범위 형식의 설명은 단지 편의성 및 간결성을 위한 것이며 본 발명의 범주에 대한 확고한 제한으로 해석해서는 안된다는 것을 이해해야 한다. 따라서, 범위의 설명은 명확하게 기재된 바와 같이 그 범위 내 개별 수치 값 뿐만 아니라 모든 가능한 하위범위를 특별히 개시하는 것으로 간주되어야 한다. 예를 들어, 1 내지 6 과 같은 범위의 설명은 그 범위 내 개별 수치, 예를 들어 1, 2, 3, 4, 5 및 6 뿐만 아니라 특별히 개시된 하위범위 예컨대 1 내지 3, 1 내지 4, 1 내지 5, 2 내지 4, 2 내지 6, 3 내지 6 등을 갖는 것으로 간주되어야 한다. 이것은 범위의 폭과 무관하게 적용된다. 범위가 존재할 때, 그 범위는 범위 종결점을 포함한다.
용어 "아데노바이러스" 또는 "Ad" 는 아데노바이러스과 (family Adenoviridae) 로부터의 비-외피 DNA 바이러스의 군을 나타낼 수 있다. 인간 숙주에 추가로, 이러한 바이러스는 비제한적으로, 조류, 소, 돼지 및 개 종에서 발견될 수 있다. 아데노바이러스과의 4 개 속 (예를 들어, 아비아데노바이러스, 매스트아데노바이러스, 앳아데노바이러스 및 시아데노바이러스) 중 임의의 것으로부터의 임의의 아데노바이러스의 사용은 E2b 결실된 바이러스 벡터, 또는 본원에 기재된 바와 같은 다른 결실을 함유하는 벡터를 기반으로 고려될 수 있다. 추가로, 여러 혈청형 (serotype) 이 각각의 종에서 발견된다. Ad 는 또한 상동 또는 이종 DNA 서열의 유전적 돌연변이, 결실 또는 전위를 비제한적으로 포함하는 이러한 바이러스 혈청형 중 임의의 것의 유전적 유도체와 관련된다.
"헬퍼 아데노바이러스" 또는 "헬퍼 바이러스" 는 특정 숙주 세포가 할 수 없는 (상기 숙주는 Ad 유전자 산물, 예컨대 E1 단백질을 제공할 수 있음) 바이러스 기능을 공급할 수 있는 Ad 를 나타낸다. 이러한 바이러스는 두 번째 바이러스, 또는 헬퍼 의존적 바이러스 (예를 들어, 거트 (gutted) 또는 거트리스 (gutless) 바이러스, 또는 특정 부위 예컨대 E2b 또는 본원에 기재된 다른 부위가 결실된 바이러스) 에서 결여되는 기능 (예를 들어, 단백질) 을 도중에 공급하는데 사용될 수 있고; 첫 번째 복제-무능 바이러스는 두 번째, 헬퍼 의존적 바이러스를 "도와", 그로써 세포에서 두 번째 바이러스 게놈의 생산이 허용되는 것으로 언급될 수 있다.
본원에서 사용하는 바와 같이, 용어 "아데노바이러스5 null (Ad5null)" 은 발현을 위해 임의의 이종 핵산 서열을 함유하지 않는 비-복제 Ad 를 나타낼 수 있다.
본원에서 사용하는 바와 같이, 용어 "제 1 세대 아데노바이러스" 는 초기 부위 1 (E1) 이 결실된 Ad 를 나타낼 수 있다. 추가적인 경우, 비필수 초기 부위 3 (E3) 이 또한 결실될 수 있다.
본원에서 사용하는 바와 같이, 용어 "거트 (gutted)" 또는 "거트리스 (gutless)" 는 모든 바이러스 코딩 부위가 결실된 아데노바이러스 벡터를 나타낼 수 있다.
본원에서 사용하는 바와 같이 용어 "트랜스펙션" 은 외래 핵산의 진핵세포 내로의 도입을 나타낼 수 있다. 트랜스펙션은 인산칼슘-DNA 공-침전, DEAE-덱스트란-매개 트랜스펙션, 폴리브렌-매개 트랜스펙션, 전기천공, 마이크로주사, 리포좀 융합, 리포펙션, 원형질체 융합, 레트로바이러스 감염 및 유전자총법 (biolistics) 을 포함하는 당업계에 공지된 다양한 수단에 의해 달성될 수 있다.
용어 "안정한 트랜스펙션" 또는 "안정하게 트랜스펙션된" 은 외래 핵산, DNA 또는 RNA 의, 트랜스펙션된 세포의 게놈 내로의 도입 및 통합을 나타낼 수 있다. 용어 "안정한 트랜스펙션체" 는 게놈 DNA 내로 안정하게 통합된 외래 DNA 를 갖는 세포를 나타낼 수 있다.
용어 "리포터 유전자" 는 리포터 분자 (효소 포함) 를 인코딩하는 뉴클레오티드 서열을 나타낼 수 있다. "리포터 분자" 는 비제한적으로, 효소-기반 검출 검정 (예를 들어, ELISA 뿐만 아니라 효소-기반 조직화학 검정), 형광, 방사능 및 발광 시스템을 포함하는, 다양한 검출 시스템 중 임의의 것에서 검출가능할 수 있다.
한 구현예에서, 대장균 (E. coli) β-갈락토시다아제 유전자 (Pharmacia Biotech, Pistacataway, N.J. 에서 이용가능), 녹색 형광 단백질 (GFP) (Clontech, Palo Alto, Calif. 에서 시판), 인간 태반 알칼리 포스파타아제 유전자, 클로람페니콜 아세틸트랜스퍼라아제 (CAT) 유전자 또는 당업계에 공지되는 기타 리포터 유전자가 이용될 수 있다.
본원에 사용되는 바와 같이, 용어 "~를 인코딩하는 핵산 분자", "~를 인코딩하는 DNA 서열" 및 "~를 인코딩하는 DNA" 는 데옥시리보핵산의 가닥을 따르는 데옥시리보뉴클레오티드의 순서 또는 서열을 나타낼 수 있다. 이러한 데옥시리보뉴클레오티드의 순서는 폴리펩티드 (단백질) 사슬을 따르는 아미노산의 순서를 결정할 수 있다. 따라서 핵산 서열은 아미노산 서열을 코딩할 수 있다.
본원에 사용되는 바와 같이, 용어 "이종 핵산 서열" 은 자연에서 라이게이션되지 않는, 또는 자연에서 상이한 위치에서 라이게이션되는 핵산 서열에, 라이게이션되는, 또는 라이게이션되도록 조작되는 뉴클레오티드 서열을 나타낼 수 있다. 이종 핵산은 그것이 도입되는 세포 내에서 자연적으로 발견되는 뉴클레오티드 서열을 포함할 수 있거나, 이종 핵산은 자연 발생 서열에 관하여 일부 변형을 함유할 수 있다.
용어 "이식유전자" 는 시험 대상의 세포 또는 게놈 내로 도입되는, 천연 또는 이종 핵산 서열 또는 융합된 상동 또는 이종 핵산 서열인, 임의의 유전자 코딩 부위를 나타낼 수 있다. 본 발명에서, 이식유전자는 이식유전자를 대상의 세포에 도입하는데 사용되는 임의의 바이러스 벡터에 탑재될 수 있다.
본원에 사용되는 바와 같이, 용어 "제 2 세대 아데노바이러스" 는 바이러스로부터 결실된 (제거된) E1, E2, E3, 및 특정 구현예에서 E4 DNA 유전자 서열의 전부 또는 일부를 갖는 Ad 를 나타낼 수 있다.
본원에서 사용하는 바와 같이, 용어 "대상" 또는 "개체" 는 임의의 동물, 예를 들어, 포유동물 또는 유대동물을 나타낼 수 있다. 대상은 비제한적으로, 인간, 비-인간 영장류 (예를 들어, 레수스 (rhesus) 또는 기타 유형의 마카크 (macaques)), 마우스, 돼지, 말, 당나귀, 소, 양, 랫트 및 가금류의 임의의 종류를 포함한다.
특정 양태에서, 알파바이러스에 대한 광범위한 반응성의 면역 반응이 생성되도록 백신접종을 허용하는, 아데노바이러스 벡터를 사용하여 다양한 알파바이러스에 대한 면역 반응을 생성시키는 백신의 제조 방법 및 조성물을 제공할 수 있다.
하나의 양태는 개체에서 하나 이상의 알파바이러스 표적 항원에 대한 면역 반응을 생성하는 방법으로서, 하기를 포함하는 방법을 제공한다: 개체에게 a) 복제 결함성 아데노바이러스 벡터로서, E2b 부위에 결실을 갖는 아데노바이러스 벡터, 및 b) 하나 이상의 알파바이러스 표적 항원을 인코딩하는 핵산을 포함하는 아데노바이러스 벡터를 투여하는 것; 및 아데노바이러스 벡터를 적어도 1 회 이상 개체에게 재투여하는 것; 그에 의해 알파바이러스 표적 항원에 대해 면역 반응을 생성하는 것.
또다른 양태는 아데노바이러스에 대해 기존 면역성을 갖는 개체에서 여러 알파바이러스 표적 항원에 대해 면역 반응을 생성하는 방법으로서, 하기를 포함하는 방법을 제공한다: 개체에게 a) 복제 결함성 아데노바이러스 벡터로서, E2b 부위에 결실을 갖는 아데노바이러스 벡터, 및 b) 다중 알파바이러스 표적 항원을 인코딩하는 핵산을 포함하는 아데노바이러스 벡터를 투여하는 것; 및 아데노바이러스 벡터를 적어도 1 회 이상 개체에게 재투여하는 것; 그에 의해 알파바이러스 표적 항원에 대해 면역 반응을 생성하는 것.
I.
표적 항원
특정 양태에서, 표적 항원은 다양한 알파바이러스 단백질에서 유래하는 항원으로 구성된다. 이와 관련하여, 알파바이러스 단백질은 치쿤구니아 바이러스 (CHIKV), 오니옹니옹 바이러스 (ONNV), 로스 리버 바이러스 (RRV), 마야로 열 바이러스 (MAYV), 베네수엘라 말 뇌염 바이러스 (VEEV), 서부 말 뇌척수염 바이러스 (WEEV), 및 동부 말 뇌염 바이러스 (EEEV) 를 포함하나 그에 제한되지 않는 임의의 알파바이러스에서 유래할 수 있다. 특정 구현예에서, 적어도 하나의 알파바이러스 바이러스 단백질은 E3ALPHA, E2ALPHA, 6K, E1ALPHA, nsP1, nsP2, nsP3, 또는 nsP4 를 포함하는 알파바이러스 단백질, 또는 그의 임의의 조합일 수 있다. 특정 구현예에서, 적어도 하나의 알파바이러스 바이러스 단백질은 E3ALPHA, E2ALPHA, 6K, 또는 E1ALPHA 를 포함하는 군으로부터의 구조 단백질, 또는 그의 임의의 조합을 포함할 수 있다. 특정 구현예에서, 적어도 하나의 알파바이러스 바이러스 단백질은 nsP1, nsP2, nsP3, 또는 nsP4 를 포함하는 군으로부터의 비-구조 단백질, 또는 그의 임의의 조합을 포함할 수 있다. 특정 구현예에서, 적어도 하나의 알파바이러스 바이러스 단백질은 E3ALPHA, E2ALPHA, 6K, 또는 E1ALPHA 를 포함하는 군으로부터의 구조 단백질, nsP1, nsP2, nsP3, 또는 nsP4 를 포함하는 군으로부터의 비-구조 단백질, 또는 그의 조합을 포함할 수 있다. 특정 구현예에서, 적어도 하나의 알파바이러스 바이러스 단백질은 E3ALPHA, E2ALPHA, 6K, E1ALPHA, nsP1, nsP2, nsP3, 및 nsP4 로 이루어지는 군으로부터 선택되는 알파바이러스 단백질일 수 있다. 특정 구현예에서, 적어도 하나의 알파바이러스 바이러스 단백질은 E3ALPHA, E2ALPHA, 6K, 및 E1ALPHA 로 이루어지는 군으로부터 선택되는 구조 단백질을 포함할 수 있다. 특정 구현예에서, 적어도 하나의 알파바이러스 바이러스 단백질은 nsP1, nsP2, nsP3, 및 nsP4 로 이루어지는 군으로부터 선택되는 비-구조 단백질을 포함할 수 있다. 특정 구현예에서, 적어도 하나의 알파바이러스 바이러스 단백질은 E3ALPHA, E2ALPHA, 6K, 또는 E1ALPHA 로 이루어지는 군으로부터 선택되는 구조 단백질, nsP1, nsP2, nsP3, 및 nsP4 로 이루어지는 군으로부터 선택되는 비-구조 단백질, 또는 그의 조합을 포함할 수 있다.
외피 당단백질 E1ALPHA 및 E2ALPHA 는 이질이량체를 형성할 수 있으며, 이러한 이질이량체는 연관되어 비리온의 표면 상에서 삼량체 스파이크를 형성한다. 알파바이러스 복제 주기는 삼량체 스파이크가 숙주 세포 수용체에 결합할 때 시작할 수 있고, 비리온의 세포내섭취를 야기할 수 있다. 엔도솜의 낮은 pH 는 바이러스의 융합을 유도할 수 있고, 엔도솜 막은 그에 의해 바이러스 게놈을 세포의 시토졸 내로 방출시킨다.
알파바이러스의 게놈 RNA 는, 세포성 mRNA 처럼, 7-메틸구아노신으로 캡핑될 수 있고 폴리아데닐화될 수 있는 mRNA 로서의 역할을 할 수 있다. 첫번째 대략 7 kB 의 게놈은 바이러스 레플리카아제 및 전사효소를 포함하는 비-구조 단백질을 인코딩할 수 있다. 마지막 대략 5 kB 의 게놈은 구조 단백질을 인코딩할 수 있다. 바이러스 레플리카아제 단백질, nsP1, nsP2, nsP3, 및 nsP4 는 안티-게놈을 생산하고, 안티-게놈은 그 후 게놈 및 2 개의 mRNA (비-구조 단백질에 대한 하나 및 구조 단백질에 대한 하나) 의 생산을 위한 주형으로서의 역할을 할 수 있다.
비-구조 단백질은 다단백질로서 번역될 수 있고, 다단백질은 후속적으로 nsP2 에 의해 가공될 수 있다. 다단백질의 분화 가공은 안티-게놈과 게놈 합성/서브게놈 mRNA 합성 사이의 스위칭에 필수적일 수 있다고 여겨진다.
구조 단백질은 다단백질로서 번역될 수 있고, 다단백질은 캡시드 단백질에 대한 세린 프로테아제 활성과 분비계에서의 세포성 효소 (예를 들어, 신호 펩티다아제 및 푸린) 의 조합에 의해 가공될 수 있다. 외피 당단백질, E1ALPHA 및 E2ALPHA 는 분비계로부터 원형질막으로 수송될 수 있으며, 원형질막에서 그들은 완전히 가공된, 성숙한 형태로 발견될 수 있다. E1ALPHA 및 E2ALPHA 는 뉴클레오캡시드 (내부에 게놈 RNA 가 있는 캡시드 단백질 껍질) 를 동원하고, 원형질막으로부터의 출아에 의해 비리온이 형성될 수 있다.
표적 항원은 C, E3ALPHA, E2ALPHA, 6K, E1ALPHA, nsP1, nsP2, nsP3, 및 nsP4 와 같은 알파바이러스와 연관되는 단백질, 또는 변이체 또는 그의 단편을 포함할 수 있다.
일부 구현예에서, 적어도 하나의 표적 항원은 알파바이러스의 구조 및/또는 비-구조 항원이다. 특정 구현예에서, 적어도 하나의 표적 항원은 알파바이러스의 다단백질 또는 단백질의 임의의 단편이다. 예를 들어, 본원에서 사용되는 적어도 하나의 표적 항원은 SEQ ID NO: 2 에 제시된 아미노산 서열을 갖는 CHIKV 구조 항원, SEQ ID NO: 3 에 제시된 아미노산 서열을 갖는 CHIKV 비-구조 항원, 또는 그의 조합이다. 일부 구현예에서, 적어도 하나의 표적 항원은 SEQ ID NO: 1 에 제시된 뉴클레오티드 서열에 의해 인코딩되는 CHIKV 항원이다. 일부 구현예에서, 본원에 기재된 조성물 내의 핵산 서열은 유전자 기호 CHIKVgp2 를 갖고 C, E3, E2, 6K, 및 E1 단백질을 함유하는 다단백질을 인코딩하는 유전자 ID 956308 을 갖는 CHIKV 유전자 (SEQ ID NO: 1 의 뉴클레오티드 7567-11313) 를 포함한다. 일부 구현예에서, 본원에 기재된 조성물 내의 핵산 서열은 유전자 기호 CHIKVgp1 를 갖는 (nsp1, nsp2, nsp3, 및 nsp4 단백질을 함유하는 다단백질을 인코딩하는) 유전자 ID 953609 을 갖는 CHIKV 유전자 (SEQ ID NO: 1 의 뉴클레오티드 77-7501) 를 포함한다. 일부 구현예에서, 본원에 기재된 조성물 내의 핵산 서열은 치쿤구니아 바이러스 구조 다단백질 (예를 들어, NP_690589) 또는 그의 단편을 인코딩하는 핵산 서열을 포함한다. 일부 구현예에서, 본원에 기재된 조성물 내의 핵산 서열은 치쿤구니아 바이러스 비구조 다단백질 (예를 들어, NP_690588) 또는 그의 단편을 인코딩하는 핵산 서열을 포함한다. 일부 구현예에서, 적어도 하나의 표적 항원은 SEQ ID NO: 1 에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 92%, 적어도 95%, 적어도 97%, 또는 적어도 99% 서열 동일성을 갖는 서열에 의해 인코딩되는 CHIKV 항원이다. 일부 구현예에서, 적어도 하나의 표적 항원은 SEQ ID NO: 2, SEQ ID NO: 3, 또는 그의 임의의 조합에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 92%, 적어도 95%, 적어도 97%, 또는 적어도 99% 서열 동일성을 갖는 서열에 의해 인코딩되는 CHIKV 항원이다.
예를 들어, 일부 구현예에서, 적어도 하나의 표적 항원은 SEQ ID NO: 4 에 제시된 뉴클레오티드 서열에 의해 인코딩되는 ONNV 항원이다. 일부 구현예에서, 본원에서 사용되는 적어도 하나의 표적 항원은 SEQ ID NO: 5 에 제시된 아미노산 서열을 갖는 ONNV 구조 항원, SEQ ID NO: 6 에 제시된 아미노산 서열을 갖는 ONNV 비-구조 항원, 또는 그의 조합이다. 일부 구현예에서, 적어도 하나의 표적 항원은 SEQ ID NO: 4 에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 92%, 적어도 95%, 적어도 97%, 또는 적어도 99% 서열 동일성을 갖는 서열에 의해 인코딩되는 ONNV 항원이다. 일부 구현예에서, 적어도 하나의 표적 항원은 SEQ ID NO: 5, SEQ ID NO: 6, 또는 그의 임의의 조합에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 92%, 적어도 95%, 적어도 97%, 또는 적어도 99% 서열 동일성을 갖는 서열에 의해 인코딩되는 ONNV 항원이다. 일부 구현예에서, 적어도 하나의 표적 항원은 SEQ ID NO: 7 에 제시된 서열에 의해 인코딩되는 MAYV 항원이다. 기타 구현예에서, 본원에서 사용되는 적어도 하나의 표적 항원은 SEQ ID NO: 8 에 제시된 아미노산 서열을 갖는 MAYV 구조 항원, SEQ ID NO: 9 에 제시된 아미노산 서열을 갖는 MAYV 비-구조 항원, 또는 그의 조합이다. 일부 구현예에서, 적어도 하나의 표적 항원은 SEQ ID NO: 7 에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 92%, 적어도 95%, 적어도 97%, 또는 적어도 99% 서열 동일성을 갖는 서열에 의해 인코딩되는 MAYV 항원이다. 일부 구현예에서, 적어도 하나의 표적 항원은 SEQ ID NO: 8, SEQ ID NO: 9, 또는 그의 임의의 조합에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 92%, 적어도 95%, 적어도 97%, 또는 적어도 99% 서열 동일성을 갖는 서열에 의해 인코딩되는 MAYV 항원이다. 기타 구현예에서, 적어도 하나의 표적 항원은 SEQ ID NO: 10 에 제시된 서열에 의해 인코딩되는 RRV 항원이다. 일부 구현예에서, 본원에서 사용되는 적어도 하나의 표적 항원은 SEQ ID NO: 11 에 제시된 아미노산 서열을 갖는 RRV 구조 항원, SEQ ID NO: 12 에 제시된 아미노산 서열을 갖는 RRV 비-구조 항원, 또는 그의 조합이다. 일부 구현예에서, 적어도 하나의 표적 항원은 SEQ ID NO: 10 에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 92%, 적어도 95%, 적어도 97%, 또는 적어도 99% 서열 동일성을 갖는 서열에 의해 인코딩되는 RRV 항원이다. 일부 구현예에서, 적어도 하나의 표적 항원은 SEQ ID NO: 11, SEQ ID NO: 12, 또는 그의 임의의 조합에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 92%, 적어도 95%, 적어도 97%, 또는 적어도 99% 서열 동일성을 갖는 서열에 의해 인코딩되는 RRV 항원이다. 기타 구현예에서, 적어도 하나의 표적 항원은 SEQ ID NO: 13 에 제시된 서열에 의해 인코딩되는 VEEV 항원이다. 기타 구현예에서, 본원에서 사용되는 적어도 하나의 표적 항원은 SEQ ID NO: 14 에 제시된 아미노산 서열을 갖는 VEEV 구조 항원, SEQ ID NO: 15 에 제시된 아미노산 서열을 갖는 VEEV 비-구조 항원, 또는 그의 조합이다. 일부 구현예에서, 적어도 하나의 표적 항원은 SEQ ID NO: 13 에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 92%, 적어도 95%, 적어도 97%, 또는 적어도 99% 서열 동일성을 갖는 서열에 의해 인코딩되는 VEEV 항원이다. 일부 구현예에서, 적어도 하나의 표적 항원은 SEQ ID NO: 14, SEQ ID NO: 15, 또는 그의 임의의 조합에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 92%, 적어도 95%, 적어도 97%, 또는 적어도 99% 서열 동일성을 갖는 서열에 의해 인코딩되는 VEEV 항원이다. 기타 구현예에서, 적어도 하나의 표적 항원은 SEQ ID NO: 16 에 제시된 서열에 의해 인코딩되는 EEEV 항원이다. 일부 구현예에서, 본원에서 사용되는 적어도 하나의 표적 항원은 SEQ ID NO: 17 에 제시된 아미노산 서열을 갖는 EEEV 구조 항원, SEQ ID NO: 18 에 제시된 아미노산 서열을 갖는 EEEV 비-구조 항원, 또는 그의 조합이다. 일부 구현예에서, 적어도 하나의 표적 항원은 SEQ ID NO: 16 에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 92%, 적어도 95%, 적어도 97%, 또는 적어도 99% 서열 동일성을 갖는 서열에 의해 인코딩되는 EEEV 항원이다. 일부 구현예에서, 적어도 하나의 표적 항원은 SEQ ID NO: 17, SEQ ID NO: 18, 또는 그의 임의의 조합에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 92%, 적어도 95%, 적어도 97%, 또는 적어도 99% 서열 동일성을 갖는 서열에 의해 인코딩되는 EEEV 항원이다. 일부 구현예에서, 적어도 하나의 표적 항원은 SEQ ID NO: 19 에 제시된 서열에 의해 인코딩되는 WEEV 항원이다. 기타 구현예에서, 본원에서 사용되는 적어도 하나의 표적 항원은 SEQ ID NO: 20 에 제시된 아미노산 서열을 갖는 WEEV 구조 항원, SEQ ID NO: 21 에 제시된 아미노산 서열을 갖는 WEEV 비-구조 항원, 또는 그의 조합이다. 일부 구현예에서, 적어도 하나의 표적 항원은 SEQ ID NO: 19 에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 92%, 적어도 95%, 적어도 97%, 또는 적어도 99% 서열 동일성을 갖는 서열에 의해 인코딩되는 WEEV 항원이다. 일부 구현예에서, 적어도 하나의 표적 항원은 SEQ ID NO: 20, SEQ ID NO: 21, 또는 그의 임의의 조합에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 92%, 적어도 95%, 적어도 97%, 또는 적어도 99% 서열 동일성을 갖는 서열에 의해 인코딩되는 WEEV 항원이다.
II.
아데노바이러스 벡터
특정 양태에서, 아데노바이러스 벡터는 알파바이러스 항원의 전달을 위한 조성물 및 방법에서 사용될 수 있다.
재조합 Ad5 [E1-, E2b-] 벡터 백신 플랫폼은, 바이러스 DNA 폴리머라아제 (pol) 및/또는 pre-말단 단백질 (pTP) 유전자를 제거하는 초기 유전자 2b (E2b) 부위에서 추가적인 결실을 가질 수 있고, E.C7 인간 세포주에서 전파될 수 있다 (Amalfitano A, Begy CR, Chamberlain JS Proc Natl Acad Sci U S A. 1996 93:3352-6; Amalfitano A, Chamberlain JS Gene Ther. 1997 4:258-63; Amalfitano A et al. J Virol. 1998 72:926-33; Seregin SS and Amalfitano A Expert Opin Biol Ther. 2009 9:1521-31). 벡터는 다수 유전자의 포함을 허용하기에 충분할 수 있는, 현재 Ad5 [E1-] 벡터의 7 kb 능력에 비해 12 kb 까지의 확장된 유전자-운반/클로닝 능력을 가질 수 있다 (Amalfitano A et al. J Virol. 1998 72:926-33; Seregin SS and Amalfitano A Expert Opin Biol Ther. 2009 9:1521-31). E2b 부위의 추가적인 결실은, Ad5 바이러스 단백질에 대한 면역 반응을 최소화하면서 특정 항원에 대한 강력한 면역 반응을 이끌어내는 것과 같은 유리한 면역 특성을 부여할 수 있다.
동물에서의 전임상 연구 및 암에서의 임상 연구는, Ad5 면역력의 존재 하에서도 Ad5 [E1-, E2b-]-기반 벡터가 벡터형 항원에 대한 강력한 CMI 및 항체 (Ab) 반응을 유도할 수 있다는 것을 입증한다.
진보된 재조합 아데노바이러스 혈청형 5 (Ad5) 벡터 플랫폼은 알파바이러스에 대한 신규한 광범위하게 교차 반응성인 백신을 개발하는 기회를 제공할 수 있다. 이러한 벡터는 강력한 면역 반응을 유도하는 항원-제시 세포 (APC) 에 규정된 알파바이러스 항원을 노출시키기 위한 피하 주사에 의해 직접 전달될 수 있다. 중요하게, Ad5 재조합 벡터는 에피솜 복제할 수 있으며 게놈을 숙주 세포 게놈에 삽입하지 않을 수 있어, 그에 따라 필수적 세포 유전자 기능의 파괴 또는 유전자 통합이 없음을 보장한다 (Imler JL Vaccine. 1995 13:1143-51; Ertl HC, Xiang Z J Immunol. 1996 156:3579-82; Amalfitano, A Curr Opin Mol Ther. 2003 5:362-6).
불행히도, 현재 Ad5-기반 벡터에 대면하는 주요 도전과제는 Ad5 에 대한 기존 면역력의 존재이다. 대부분의 사람들은 Ad5 에 대해 중화 Ab 를 나타내는데, 이는 인간 백신에 대해 가장 광범위하게 사용되는 하위유형이며, 연구된 사람들의 ⅔ 가 Ad5 에 대한 림프-증식성 반응을 갖는다 (Chirmule N et al. Gene Ther. 1999 6:1574-83). 이러한 면역력은 알파바이러스 백신에 대한 플랫폼으로서 현재 초기 유전자 1 (E1) 부위-결실 Ad5 벡터 (Ad5 [E1-]) 의 사용을 방지할 수 있다. Ad5 면역력은 면역화, 특히 재조합 Ad5 벡터로의 재면역화를 저해하며, 제 2 질환 항원에 대한 백신의 면역화 역시 불가능하게 할 수 있다. 기존 Ad5 벡터 면역력의 문제점을 극복하는 것은 강도높은 조사의 주제가 되어 왔다. 그러나, 다른 Ad 혈청형 또는 심지어 Ad 의 비-인간 형태의 사용은 중요한 케모카인 및 사이토카인의 변형된 생산, 유전자 조절장애를 직접적으로 일으킬 수 있으며, 상당히 상이한 생물학적 분배 (biodistribution) 및 조직 독성을 가질 수 있다 (Appledorn DM et al. Gene Ther. 2008 15:885-901; Hartman ZC et al. Virus Res. 2008 132:1-14). 이러한 접근방식이 초기 면역화에서 성공한다 해도, 후속 백신화는 Ad 하위유형에 대한 유도된 면역 반응으로 인해 문제가 있을 수 있다. Ad 면역화 장벽을 막고 현재 Ad5 [E1-] 벡터에 대한 불리한 조건을 피하는 것을 돕기 위해, 상기 기재한 개선된 Ad5 벡터 플랫폼을 구축하였다.
또한, Ad5 [E1-, E2b-] 벡터는 현재 Ad5 [E1-] 벡터와 비교하여 주사 후 첫 24 내지 72 시간 동안 감소된 염증을 나타낼 수 있다 (Nazir SA, Metcalf JP J Investig Med. 2005 53:292-304; Schaack J Proc Natl Acad Sci U S A. 2004 101:3124-9; Schaack J Viral Immunol. 2005 18:79-88). Ad5 [E1-, E2b-] 후기 유전자 발현의 결여는 감염된 세포가 항-Ad5 활성에 덜 취약하게 만들 수 있으며, 이들이 연장된 시간 동안 이식유전자를 생산하고 발현하는 것을 가능하게 할 수 있다 (Gabitzsch ES, Jones FR J Clin Cell Immunol. 2011 S4:001. doi:10.4172/2155-9899. S4-001; Hodges BL J Gene Med. 2000 2:250-9). Ad5 [E1-, E2b-] 바이러스 단백질에 대한 감소한 염증 반응 및 그로 인한 기존 Ad5 면역력의 회피는 APC 세포를 감염시키는 Ad5 [E1-, E2b-] 의 능력을 증가시켜, 접종자의 더 큰 면역화를 초래할 수 있다. 추가로, 다른 세포 유형의 증가한 감염은 강력한 CD4+ 및 CD8+ T 세포 반응에 필요한 높은 수준의 항원 제시를 제공하여, 기억 T 세포 발달을 일으킬 수 있다. 따라서 E2b 부위의 결실이, 기존 Ad5 면역력의 존재 하에서도 Ad5 단백질에 대한 면역 반응을 최소화하면서 특정 항원에 대한 강력한 면역 반응을 이끌어내는 것과 같은 유리한 면역 특성을 부여할 수 있다는 것이 나타난다.
결과는, 기존 및/또는 Ad5 벡터-유도 면역력을 극복하고 유의한 보호성 면역 반응을 유도하는 재조합 Ad5 [E1-, E2b-] 플랫폼-기반 백신의 능력을 입증하였다. 이러한 연구는 새로운 Ad5 [E1-, E2b-] 벡터-기반 백신이 1) 현재 Ad5 [E1-] 벡터에 비교하여 상당히 더 높은 CMI 반응을 유도할 수 있고, 2) 강력한 CMI 반응을 유도하도록 설계된 다수 면역화 용법에 이용될 수 있고, 3) 기존 Ad5 면역력을 갖는 동물에서 유의한 항원-특이적 CMI 반응을 유도할 수 있고, 4) 높은 수준의 기존 Ad5 면역력을 갖는 동물에서 감염성 질환에 대해 유의한 항-종양 반응 또는 보호를 유도할 수 있다는 것을 확립하였다.
특정 양태는 알파바이러스 표적 항원에 대한 면역 반응을 생성시키기 위한 방법 및 아데노바이러스 벡터에 관한 것이다. 특히, 특정 양태는 개선된 Ad-기반 백신을 제공할 수 있어, 하나 초과의 항원성 표적 독립체에 대한 다수 백신화가 달성될 수 있다. 중요하게는, 백신화는 Ad 에 대한 기존 면역력의 존재 하에 수행될 수 있고/있거나 본원에 기재된 바와 같은 아데노바이러스 벡터 또는 다른 아데노바이러스 벡터로 이전에 다수회 면역화된 대상에게 투여될 수 있다. 아데노바이러스 벡터는, 다발관절염 또는 뇌염을 일으키는 알파바이러스에 대한 광범위한 항체 및 세포-매개 면역 반응의 생산을 비제한적으로 포함하는 다양한 알파바이러스 항원에 대한 면역 반응이 유도되도록 대상에게 다수회 투여될 수 있다.
특정 양태는 미국 특허 번호 6,063,622; 6,451,596; 6,057,158 및 6,083,750 (모두 그 전체가 본원에 참조로 포함됨) 에서 기재된 것들과 같은 E2b 결실 아데노바이러스 벡터의 용도를 제공한다. '622 특허에서 기재된 바와 같이, 바이러스 단백질 발현을 더 손상시키기 위해, 그리고 또한 복제 적격 Ad (RCA) 의 생성 빈도를 감소시키기 위해, E2b 부위에서 결실을 함유하는 아데노바이러스 벡터를 특정 양태에서 제공할 수 있다. 이러한 E2b 결실 아데노바이러스 벡터의 전파는 결실된 E2b 유전자 산물을 발현할 수 있는 세포주를 필요로 한다.
추가 양태에서, 패키징 세포주가 제공될 수 있다; 예를 들어 HEK-203 세포주에서 유래한 E.C7 (공식적으로 C-7 로 지칭) (Amalfitano A et al. Proc Natl Acad Sci USA 1996 93:3352-56; Amalfitano A et al. Gene Ther 1997 4:258-63).
또한, E2b 유전자 산물, DNA 폴리머라아제 및 말단전 (preterminal) 단백질은 E.C7, 또는 유사한 세포에서 E1 유전자 산물과 함께 구성적으로 발현될 수 있다. Ad 게놈으로부터 생산 세포주로의 유전자 세그먼트의 전달은 즉각적인 이득을 가질 수 있다: (1) 이론적으로 결실될 수 있는 DNA 폴리머라아제 및 말단전 단백질의 조합된 코딩 서열이 4.6 kb 에 이르므로, 재조합 DNA 폴리머라아제 및 말단전 단백질-결실 아데노바이러스 벡터의 증가한 운반 능력; 및, (2) 둘 이상의 독립적 재조합 이벤트가 RCA 를 생성시키는데 필요하므로, RCA 생성의 감소한 가능성.
따라서, E1, Ad DNA 폴리머라아제 및 말단전 단백질 발현 세포주는 오손 헬퍼 바이러스에 대한 필요성 없이 13 kb 에 이르는 운반 능력을 갖는 아데노바이러스 벡터를 전파시킬 수 있다 (Mitani et al. Proc. Natl. Acad. Sci. USA 1995 92:3854; Hodges et al. J Gene Med 2000 2:250-259; Amalfitano and Parks Curr Gene Ther 2002 2:111-133).
또한, 바이러스 생활 주기에 중요한 유전자가 결실되는 경우 (예를 들어, E2b 유전자), 다른 바이러스 유전자 단백질을 복제 또는 발현하기 위한 Ad 의 추가 손상이 발생할 수 있다. 이는 바이러스로 감염된 세포의 면역 인지를 감소시킬 수 있고, 외래 이식유전자 발현의 연장된 지속기간을 가능하게 할 수 있다.
그러나 E1, DNA 폴리머라아제 및 말단전 단백질 결실된 벡터의 중요한 속성은 그의 E1 및 E2b 부위로부터 각각의 단백질의 발현 불능 뿐만 아니라 대부분의 바이러스 구조 단백질의 예측된 발현 결여를 포함한다. 예를 들어, Ad 의 주요 후기 프로모터 (MLP) 는 후기 구조 단백질 L1 ~ L5 의 전사를 담당한다 (Doerfler, In Adenovirus DNA, The Viral Genome and Its Expression (Martinus Nijhoff Publishing Boston, 1986)). MLP 가 Ad 게놈 복제 전에 최소한으로 활성이지만, 고도로 독성인 Ad 후기 유전자는 바이러스 게놈 복제가 발생한 후에만 MLP 로부터 주로 전사 및 번역된다 (Thomas and Mathews Cell 1980 22:523). 이러한 후기 유전자 전사의 시스 (cis)-의존적 활성화는 일반적으로, 폴리오마 및 SV-40 의 성장에 있어서와 같이, DNA 바이러스의 특질이다. DNA 폴리머라아제 및 말단전 단백질은 Ad 복제에 완전히 필요하며 (E4 단백질 또는 IX 단백질과는 달리), 따라서 그의 결실은 아데노바이러스 벡터 후기 유전자 발현에 극히 해로우며 APC 와 같은 세포에서의 발현의 독성 효과가 있다.
특정 구현예에서, 사용을 위해 고려되는 아데노바이러스 벡터는, E1 부위 및 Ad 게놈의 E2b 부위에서의 결실을 갖지만 결실된 Ad 게놈의 임의의 다른 부위는 갖지 않는 E2b 결실 아데노바이러스 벡터를 포함한다. 또 다른 구현예에서, 사용을 위해 고려되는 아데노바이러스 벡터는, Ad 게놈의 E2b 부위에서의 결실 및 E1 과 E3 부위에서의 결실을 갖지만 다른 부위는 결실되지 않는 E2b 결실 아데노바이러스 벡터를 포함할 수 있다. 추가 구현예에서, 사용을 위해 고려되는 아데노바이러스 벡터는 Ad 게놈의 E2b 부위에서의 결실 및 E1, E3 에서의 결실 및 E4 부위의 부분적 또는 완전 제거를 갖지만 다른 결실은 갖지 않는 아데노바이러스 벡터를 포함할 수 있다.
또 다른 구현예에서, 사용을 위해 고려되는 아데노바이러스 벡터는, Ad 게놈의 E2b 부위에서의 결실 및 E1 과 E4 부위에서의 결실을 갖지만 다른 결실은 갖지 않는 아데노바이러스 벡터를 포함한다. 추가적인 구현예에서, 사용을 위해 고려되는 아데노바이러스 벡터는, Ad 게놈의 E2a, E2b 및 E4 부위에서의 결실을 갖지만 다른 결실은 갖지 않는 아데노바이러스 벡터를 포함할 수 있다.
한 구현예에서, 본원에서 사용하기 위한 아데노바이러스 벡터는, 결실된 E2b 부위의 DNA 폴리머라아제 기능 및 E1 을 갖지만 다른 결실은 갖지 않는 벡터를 포함한다. 추가 구현예에서, 본원에서 사용하기 위한 아데노바이러스 벡터는, 결실된 E2b 부위의 말단전 단백질 기능 및 E1 을 갖지만 다른 결실은 갖지 않는다.
또 다른 구현예에서, 본원에서 사용하기 위한 아데노바이러스 벡터는 결실된 말단전 단백질 기능, DNA 폴리머라아제 기능 및 E1 을 갖지만 다른 결실은 갖지 않는다. 한 특정 구현예에서, 본원에서의 사용을 위해 고려되는 아데노바이러스 벡터는 적어도 일부의 E2b 부위 및 E1 부위에 대해 결실되지만, "거트" 아데노바이러스 벡터는 그렇지 않다. 이와 관련하여, 벡터는 E2b 부위의 말단전 단백질 기능 및 DNA 폴리머라아제 기능 둘 모두에 대해 결실될 수 있다.
본원에서 사용하는 바와 같이, 용어 "E2b 결실" 은 적어도 하나의 E2b 유전자 산물의 발현 및/또는 기능을 방지하도록 하는 방식으로 돌연변이되는 특정한 DNA 서열을 나타낼 수 있다. 따라서 특정 구현예에서, "E2b 결실" 은 Ad 게놈으로부터 결실 (제거) 되는 특정한 DNA 서열을 나타낼 수 있다. E2b 결실 또는 "E2b 부위 내에 결실을 함유하는" 은 Ad 게놈의 E2b 부위 내의 적어도 하나의 염기쌍의 결실을 나타낼 수 있다. 따라서 특정 구현예에서 하나 초과의 염기쌍이 결실되며, 추가 구현예에서 적어도 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 또는 150 개의 염기쌍이 결실된다. 또 다른 구현예에서, 결실은 Ad 게놈의 E2b 부위 내의 150, 160, 170, 180, 190, 200, 250 또는 300 개 초과 염기쌍의 결실이다. E2b 결실은 적어도 하나의 E2b 유전자 산물의 발현 및/또는 기능을 방지하는 결실일 수 있으며, 따라서 E2b-특이적 단백질 일부분을 인코딩하는 엑손 내의 결실 뿐만 아니라 프로모터 및 리더 서열 내의 결실을 포함할 수 있다. 특정 구현예에서, E2b 결실은 E2b 부위의 말단전 단백질 및 DNA 폴리머라아제 중 하나 또는 둘 모두의 발현 및/또는 기능을 방지하는 결실이다. 추가 구현예에서 "E2b 결실" 은, 하나 이상의 인코딩된 단백질이 비-기능적이도록 Ad 게놈의 이 부위의 DNA 서열에서의 하나 이상의 점 돌연변이를 나타낼 수 있다. 이러한 돌연변이는 비-기능적 단백질을 초래하는 아미노산 서열에서의 변화를 일으키는 상이한 잔기로 대체되는 잔기를 포함할 수 있다.
본 개시물 판독시 당업자에 의해 이해되는 바와 같이, Ad 게놈의 다른 부위가 결실될 수 있다. 따라서 본원에서 사용하는 바와 같이, Ad 게놈의 특정 부위에서 "결실되는" 것은, 그 부위에 의해 인코딩되는 적어도 하나의 유전자 산물의 발현 및/또는 기능이 방지되도록 하는 방식으로 돌연변이되는 특정 DNA 서열을 나타낼 수 있다. 특정 구현예에서 특정 부위에서 "결실되는" 것은, 그 부위에 의해 인코딩되는 유전자 산물의 발현 및/또는 기능 (예를 들어, 말단전 단백질 기능 또는 DNA 폴리머라아제의 E2b 기능) 이 방지되도록 하는 방식으로 Ad 게놈으로부터 결실 (제거) 되는 특정 DNA 서열을 나타낼 수 있다. 특정 부위 내의 "결실" 또는 "결실을 함유하는" 은 Ad 게놈의 그 부위 내의 적어도 하나의 염기쌍의 결실을 나타낼 수 있다. 따라서 특정 구현예에서 하나 초과의 염기쌍이 결실되며, 추가 구현예에서 적어도 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 또는 150 개의 염기쌍이 특정 부위로부터 결실된다. 또 다른 구현예에서, 결실은 Ad 게놈의 특정 부위 내의 150, 160, 170, 180, 190, 200, 250 또는 300 개 초과 염기쌍의 결실이다. 일부 구현예에서, 상기 기재된 결실 중 임의의 하나는 또한 둘 이상의 염기쌍의 전좌의 결과일 수 있다.
이러한 결실은 그 부위에 의해 인코딩되는 유전자 산물의 발현 및/또는 기능이 방지될 수 있도록 하는 것이다. 따라서 결실은 단백질 일부분을 인코딩하는 엑손 내의 결실 뿐만 아니라 프로모터 및 리더 서열 내의 결실을 포함할 수 있다. 추가 구현예에서 Ad 게놈의 특정 부위에서의 "결실" 은, 하나 이상의 인코딩된 단백질이 비-기능적이도록 Ad 게놈의 이 부위의 DNA 서열에서의 하나 이상의 점 돌연변이를 나타낼 수 있다. 이러한 돌연변이는 비-기능적 단백질을 초래하는 아미노산 서열에서의 변화를 일으키는 상이한 잔기로 대체되는 잔기를 포함할 수 있다.
하나 이상의 결실을 포함하는 아데노바이러스 벡터는 당업계에 공지된 재조합 기법을 사용하여 생성될 수 있다 (예를 들어, Amalfitano et al. J. Virol. 1998 72:926-33; Hodges, et al., J Gene Med 2000 2:250-59 참조). 당업자에 의해 인지되는 바와 같이, 사용하기 위한 아데노바이러스 벡터는 결실되었을 수 있는 임의의 필요 유전자의 산물 및 E2b 유전자 산물을 구성적으로 발현하는 적절한 패키징 세포주를 사용하여 높은 역가로 성공적으로 성장시킬 수 있다. 특정 구현예에서, E1 및 DNA 폴리머라아제 단백질 뿐만 아니라 Ad-말단전 단백질을 구성적으로 발현하는 HEK-293-유래 세포를 사용할 수 있다. 한 구현예에서, E.C7 세포는 아데노바이러스 벡터의 고역가 스톡 (stock) 을 성공적으로 성장시키는데 사용된다 (예를 들어, Amalfitano et al. J. Virol. 1998 72:926-33; Hodges et al. J Gene Med 2000 2:250-59 참조).
자가-전파 아데노바이러스로부터 중요한 유전자를 결실시키기 위해서, 표적화된 유전자에 의해 인코딩되는 단백질은 먼저 HEK-293 세포에서, 또는 유사하게, E1 단백질과 함께 동시발현되어야 한다. 따라서, 오직 구성적으로 동시발현시 비-독성인 단백질 (또는 유도적으로 발현되는 독성 단백질) 만이 이용될 수 있다. E1 및 E4 유전자의 HEK-293 세포에서의 동시발현이 입증되었다 (구성적 프로모터가 아닌 유도성 프로모터 이용) (Yeh et al. J. Virol. 1996 70:559; Wang et al. Gene Therapy 1995 2:775; 및 Gorziglia et al. J. Virol. 1996 70:4173). E1 및 단백질 IX 유전자 (비리온 구조 단백질) 가 동시발현되었으며 (Caravokyri and Leppard J. Virol. 1995 69:6627), E1, E4 및 단백질 IX 유전자의 동시발현이 또한 설명된 바 있다 (Krougliak and Graham Hum. Gene Ther. 1995 6:1575). E1 및 100k 유전자는 E1 및 프로테아제 유전자를 가지므로, 트랜스상보성 세포주에서 성공적으로 발현되었다 (Oualikene et al. Hum Gene Ther 2000 11:1341-53; Hodges et al. J. Virol 2001 75:5913-20).
E2b 결실 Ad 입자의 고역가 성장에 사용하기 위한 E1 및 E2b 유전자 산물을 동시발현하는 세포주가 미국 특허 번호 6,063,622 에 기재되어 있다. E2b 부위는 Ad 게놈 복제에 절대적으로 요구되는 바이러스 복제 단백질을 인코딩할 수 있다 (Doerfler (전술한 것), 및 Pronk et al. Chromosoma 1992 102:S39-S45). 유용한 세포주는 구성적으로 대략 140 kDa Ad-DNA 폴리머라아제 및/또는 대략 90 kDa 말단전 단백질을 발현한다. 특히, 독성 없이, E1, DNA 폴리머라아제 및 말단전 단백질의 고수준, 구성적 동시발현을 갖는 세포주 (예를 들어, E.C7) 가 다수 백신화에 사용하기 위한 Ad 의 전파에 사용하기에 바람직할 수 있다. 이들 세포주는 E1, DNA 폴리머라아제 및 말단전 단백질에 대해 결실된 아데노바이러스 벡터의 전파를 가능하게 할 수 있다.
재조합 Ad 는 당업계에서 공지된 기법을 사용하여 전파될 수 있다. 예를 들어 특정 구현예에서, E.C7 세포를 함유하는 세포 조직 플레이트를 적절한 MOI (예를 들어, 5) 에서 아데노바이러스 벡터 바이러스 스톡으로 감염시키고 37.0℃ 에서 40-96 시간 동안 인큐베이션한다. 감염된 세포를 수확하고, 10 mM Tris-Cl (pH 8.0) 에 재현탁하고, 초음파처리할 수 있고, 바이러스를 2 회 염화세슘 밀도 원심분리를 통해 정제할 수 있다. 특정 기법에서, 바이러스 함유 밴드를 Sephadex CL-6B 컬럼 (Pharmacia Biotech, Piscataway, N.J.) 상에서 탈염시키고, 수크로스 또는 글리세롤을 첨가하고, 분취액을 -80℃ 에서 저장한다. 일부 구현예에서, 바이러스는 이의 안정성을 증강시키기 위해 설계된 용액, 예컨대 A195 에 위치될 수 있다 (Evans et al. J Pharm Sci 2004 93:2458-75). 스톡의 역가를 평가할 수 있다 (예를 들어, SDS 용해 후 바이러스 분취액의 260 nm 에서의 광학 밀도 측정에 의함). 또 다른 구현예에서, 전체 재조합 E2b 결실 아데노바이러스 벡터를 포함하는 선형 또는 원형인 플라스미드 DNA 를 E.C7, 또는 유사한 세포에 트랜스펙션시킬 수 있고, 바이러스 생산 증거가 존재할 때까지 (예를 들어, 세포변성 효과) 37.0℃ 에서 인큐베이션할 수 있다. 그런 다음, 이들 세포로부터의 조건화 배지를 사용하여 더 많은 E.C7, 또는 유사한 세포를 감염시켜, 정제 전에 생산된 바이러스의 양을 확장시킬 수 있다.
정제는 2 회의 염화세슘 밀도 원심분리 또는 선택적 여과에 의해 수행될 수 있다. 특정 구현예에서, 바이러스는 시판 제품 (예를 들어, Puresyn, Inc., Malvem, PA 로부터의 Adenopure) 또는 주문제작 크로마토그래피 컬럼을 사용하는 컬럼 크로마토그래피에 의해 정제될 수 있다.
특정 구현예에서, 재조합 Ad 는 감염될 세포가 일정 수의 바이러스와 마주하는 것을 보장하기 위해 충분한 바이러스를 포함할 수 있다. 따라서, 재조합 Ad 의 스톡, 특히 재조합 Ad 의 RCA-무함유 스톡을 제공할 수 있다. Ad 스톡의 제조 및 분석은 당업계에 널리 공지되어 있다. 바이러스 스톡은 대체로 그들을 제조하는데 사용된 바이러스 유전자형 및 프로토콜 및 세포주에 따라, 역가가 상당히 가변적일 수 있다. 바이러스 스톡은 적어도 약 106, 107 또는 108 바이러스 입자 (VP)/㎖ 의 역가를 가질 수 있고, 이러한 많은 스톡은 더 높은 역가, 예컨대 적어도 약 109, 1010, 1011 또는 1012 VP/㎖ 을 가질 수 있다.
III.
이종 핵산
특정 구현예에서, 본원에 기재된 아데노바이러스 벡터는 그에 대해 면역 반응을 생성시키는 것이 바람직한, 하나 이상의 관심 표적 항원 예컨대 알파바이러스 표적 항원, 이의 단편 또는 융합물을 인코딩하는 이종 핵산 서열을 포함한다. 일부 구현예에서, 아데노바이러스 벡터는 면역 반응을 조절할 수 있는, 여러 단백질, 이의 융합물 또는 단편을 인코딩하는 이종 핵산 서열을 포함한다. 특정 양태는 이종 핵산 서열 예컨대 알파바이러스 표적 항원을 포함하는 제 2 세대 E2b 결실 아데노바이러스 벡터를 제공한다.
이와 같이 특정 양태는, 여러 관심 알파바이러스 표적 항원을 인코딩하는 폴리뉴클레오티드로서 본원에서 또한 나타낼 수 있는 핵산 서열을 제공한다. 이와 같이 특정 양태는, 본원에서 추가로 기재한 바와 같은 임의의 공급원으로부터의 표적 항원을 인코딩하는 폴리뉴클레오티드, 이러한 폴리뉴클레오티드를 포함하는 벡터, 및 이러한 발현 벡터로 형질전환 또는 트랜스펙션된 숙주 세포를 제공한다. 용어 "핵산" 및 "폴리뉴클레오티드" 는 본원에서 본질적으로 상호교환가능하게 사용된다. 또한 당업자에게 인식되는 바와 같이, 폴리뉴클레오티드는 단일-가닥 (코딩 또는 안티센스) 또는 이중-가닥일 수 있고, DNA (게놈, cDNA 또는 합성) 또는 RNA 분자일 수 있다. RNA 분자는, 인트론을 함유하며 1:1 방식으로 DNA 분자에 상응하는 hnRNA 분자, 및 인트론을 함유하지 않는 mRNA 분자를 포함할 수 있다. 추가적인 코딩 또는 비-코딩 서열은 폴리뉴클레오티드 내에 존재할 수 있으나 존재하지 않아도 되고, 폴리뉴클레오티드는 다른 분자 및/또는 지지체 물질에 연결될 수 있으나 연결되지 않아도 된다. 본원에서 사용하는 바와 같이, 단리된 폴리뉴클레오티드는 폴리뉴클레오티드가 다른 코딩 서열로부터 실질적으로 떨어져 있다는 것을 의미할 수 있다. 예를 들어, 본원에서 사용하는 바와 같은 단리된 DNA 분자는 큰 부분의 미관련 코딩 DNA, 예컨대 대형 염색체 단편 또는 다른 기능적 유전자 또는 폴리펩티드 코딩 부위를 함유하지 않는다. 물론, 이는 본래 단리된 바와 같은 DNA 분자를 나타낼 수 있으며, 실험실에서 재조합적으로 세그먼트에 이후 첨가되는 유전자 또는 코딩 부위를 배제하지 않는다.
당업자에 의해 이해될 바와 같이, 폴리뉴클레오티드는 본원에 기재된 표적 항원, 항원의 단편, 펩티드 등을 발현하거나, 발현하도록 조정될 수 있는 게놈 서열, 게놈외 및 플라스미드-인코딩된 서열 및 더 작은 조작된 유전자 세그먼트를 포함할 수 있다. 이러한 세그먼트는 자연적으로 단리되거나, 사람의 손에 의해 합성적으로 변형될 수 있다.
폴리뉴클레오티드는 고유 (native) 서열 (즉, 표적 항원 폴리펩티드/단백질/에피토프 또는 이의 일부분을 인코딩하는 내인성 서열) 을 포함할 수 있거나, 이러한 서열의 변이체 또는 유도체를 인코딩하는 서열을 포함할 수 있다. 특정 구현예에서, 본원에서 나타내는 폴리뉴클레오티드 서열은 본원에 기재한 바와 같은 표적 항원 단백질을 인코딩한다. 일부 구현예에서, 폴리뉴클레오티드는 고유의 뉴클레오티드 서열 또는 변이체로부터 실질적으로 가변적일 수 있으나 유사한 단백질 항원을 인코딩하는 특정 세포 유형 (즉, 인간 세포주) 에서의 발현에 최적화된 신규한 유전자 서열을 나타낸다.
다른 관련 구현예에서, 본원에 기재하는 바와 같은 단백질 (예를 들어, 관심 표적 항원) 을 인코딩하는 고유 서열에 대해 실질적 동일성을 갖는 폴리뉴클레오티드 변이체, 예를 들어 본원에 기재한 방법 (예를 들어, 하기 기재한 바와 같은 표준 매개변수를 사용하는 BLAST 분석) 을 사용하여 폴리펩티드를 인코딩하는 고유 폴리뉴클레오티드 서열과 비교하여 적어도 70% 서열 동일성, 특히 적어도 75% 에서 99% 까지, 또는 그 이상의 서열 동일성을 포함하는 것들이 제공될 수 있다. 당업자는 이들 값이 코돈 퇴보성 (codon degeneracy), 아미노산 유사성, 판독 프레임 위치선정 등을 고려하여 2 개의 뉴클레오티드 서열에 의해 인코딩되는 단백질의 상응하는 동일성을 측정하기 위해 적절하게 조정될 수 있다는 것을 인식할 것이다.
특정 양태에서, 폴리뉴클레오티드 변이체는, 특히 변이체 폴리뉴클레오티드에 의해 인코딩되는 폴리펩티드의 에피토프의 면역원성 또는 이종 표적 단백질의 면역원성이 고유 폴리뉴클레오티드 서열에 의해 인코딩되는 폴리펩티드에 비해 실질적으로 약화되지 않을 수 있도록 하나 이상의 치환, 부가, 결실 및/또는 삽입을 함유할 수 있다. 본원의 다른 곳에서 기재되는 바와 같이, 폴리뉴클레오티드 변이체는 표적 항원 또는 이의 단편 (예를 들어, 에피토프) 의 변이체를 인코딩할 수 있으며, 여기서 변이체 폴리펩티드 또는 이의 단편 (예를 들어, 에피토프) 이 항원-특이적 항혈청 및/또는 T-세포주 또는 클론과 반응하는 성향은 고유 폴리펩티드에 관하여 실질적으로 약화되지 않을 수 있다. 용어 "변이체" 는 또한 이종발생 기원의 상동 유전자를 포함할 수 있다.
특정 양태는, 본원에 기재하는 바와 같은, 표적 단백질 항원을 포함하는 폴리펩티드를 인코딩하는 적어도 약 5 에서 1000 개까지 또는 그 이상의 인접 뉴클레오티드 뿐만 아니라, 그 사이의 모든 중간 길이를 포함하거나 이것으로 이루어지는 폴리뉴클레오티드를 제공한다. 이러한 문맥에서 "중간 길이" 는 인용된 값 사이의 임의의 길이, 예컨대, 200-500; 500-1,000 등의 모든 정수를 비롯하여, 16, 17, 18, 19 등; 21, 22, 23 등; 30, 31, 32 등; 50, 51, 52, 53 등; 100, 101, 102, 103 등; 150, 151, 152, 153 등을 의미할 수 있다는 것이 용이하게 이해될 것이다. 본원에 기재하는 바와 같은 폴리뉴클레오티드 서열은 본원에 기재하는 바와 같은 폴리펩티드, 예컨대 에피토프 또는 이종 표적 단백질을 인코딩하는 고유 서열에서 발견되지 않는 추가적인 뉴클레오티드에 의해 하나 또는 양 말단에서 확장될 수 있다. 이러한 추가적인 서열은 개시된 서열의 하나의 말단에서 또는 개시된 서열의 양 말단에서, 1 에서 20 개까지의 뉴클레오티드 또는 그 이상으로 이루어질 수 있다.
특정 구현예에서, 폴리뉴클레오티드 또는 이의 단편은, 코딩 서열 그 자체의 길이와는 관계없이, 그들의 전체 길이가 상당히 가변적일 수 있도록, 다른 DNA 서열, 예컨대 프로모터, 발현 조절 서열, 폴리아데닐화 신호, 추가적인 제한 효소 위치, 다중 클로닝 위치, 기타 코딩 세그먼트 등과 조합될 수 있다. 따라서 거의 모든 길이의 핵산 단편이 이용될 수 있으며, 총 길이는 의도된 재조합 DNA 프로토콜에서의 제조 및 사용의 용이성에 의해 제한될 수 있다는 것이 고려된다. 예를 들어, 약 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10,000, 약 500, 약 200, 약 100, 약 50 개 염기쌍 등의 총 길이 (모든 중간 길이 포함) 의 예시적 폴리뉴클레오티드 세그먼트가 많은 실행에 있어서 유용한 것으로 고려된다.
폴리뉴클레오티드 서열을 비교하는 경우, 2 개 서열 중의 뉴클레오티드의 서열이 하기 기재되는 바와 같이 최대 대응 (correspondence) 으로 정렬되었을 때 동일하다면, 2 개 서열은 "동일한" 것으로 언급될 수 있다. 2 개 서열 사이의 비교는 서열 유사성의 국부적 부위를 확인하고 비교하기 위해 비교 윈도우 (comparison window) 에 대해 서열을 비교함으로써 수행될 수 있다. 본원에서 사용하는 바와 같이, "비교 윈도우" 는 적어도 약 20 개의 인접 위치, 통상 30 내지 약 75, 40 내지 약 50 개의 세그먼트를 나타내며, 여기서 서열은 2 개 서열을 최적으로 정렬한 후 동일한 수의 인접 위치의 참조 서열에 대해 비교될 수 있다.
비교를 위한 서열의 최적 정렬은 디폴트 매개변수를 사용하여 생물정보학 소프트웨어 (DNASTAR, Inc., Madison, WI) 의 Lasergene suite 에서의 Megalign 프로그램을 사용하여 수행될 수 있다. 이 프로그램은 하기 참고문헌에 기재된 여러 정렬 도식을 구현한다: Dayhoff MO (1978) A model of evolutionary change in proteins - Matrices for detecting distant relationships. In Dayhoff MO (ed.) Atlas of Protein Sequence and Structure, National Biomedical Research Foundation, Washington DC Vol. 5, Suppl. 3, pp. 345- 358; Hein J Unified Approach to Alignment and Phylogenes, pp. 626-645 (1990); Methods in Enzymology vol.183, Academic Press, Inc., San Diego, CA; Higgins DG and Sharp PM CABIOS 1989 5:151-53; Myers EW and Muller W CABIOS 1988 4:11-17; Robinson ED Comb. Theor 1971 11A 05; Saitou N, Nei M MoI. Biol. Evol. 1987 4:406-25; Sneath PHA and Sokal RR Numerical Taxonomy - the Principles and Practice of Numerical Taxonomy, Freeman Press, San Francisco, CA (1973); Wilbur WJ and Lipman DJ Proc. Natl. Acad., Sci. USA 1983 80:726-30.
대안적으로, 비교를 위한 서열의 최적 정렬은 [Smith and Waterman, Add. APL. Math 1981 2:482] 의 국부적 동일성 알고리즘에 의해, [Needleman and Wunsch J. MoI. Biol. 1970 48:443] 의 동일성 정렬 알고리즘에 의해, [Pearson and Lipman, Proc. Natl. Acad. Sci. USA 1988 85:2444] 의 유사성 방법 조사에 의해, 이들 알고리즘의 컴퓨터화된 실행에 의해 (GAP, BESTFIT, BLAST, FASTA 및 TFASTA (Wisconsin Genetics Software Package, Genetics Computer Group (GCG), 575 Science Dr., Madison, WI)), 또는 검사 (inspection) 에 의해 수행될 수 있다.
서열 동일성 백분율 및 서열 유사성을 측정하는데 적합한 알고리즘의 한 예는 BLAST 및 BLAST 2.0 알고리즘이며, 이는 각각 [Altschul et al., Nucl. Acids Res. 1977 25:3389-3402] 및 [Altschul et al. J. MoI. Biol. 1990 215:403-10] 에 기재되어 있다. BLAST 및 BLAST 2.0 는, 예를 들어 폴리뉴클레오티드에 대한 서열 동일성 백분율을 측정하기 위해, 본원에 기재된 매개면수로, 사용될 수 있다. BLAST 분석을 수행하기 위한 소프트웨어는 생물정보센터 (National Center for Biotechnology Information) 를 통해 공개적으로 이용가능하다. 한 예시적 예에서, 누적 점수는 뉴클레오티드 서열에 대해, 매개변수 M (매칭 잔기 쌍에 대한 리워드 점수; 항상 >0 임) 및 N (미스매칭 잔기에 대한 패널티 점수; 항상 <0 임) 을 사용하여 계산될 수 있다. 각 방향에서의 단어 히트 (word hit) 의 확장은 다음과 같은 경우에 중단될 수 있다: 누적 정렬 점수가 이의 최대 달성된 값으로부터 양 X 만큼 떨어지는 경우; 누적 점수가 하나 이상의 음 (negative)-득점 잔기 정렬의 축적으로 인해, 0 이하로 되는 경우; 또는 한쪽 서열의 말단에 도달하는 경우. BLAST 알고리즘 매개변수 W, T 및 X 는 정렬의 민감성 및 속도를 결정한다. BLASTN 프로그램 (뉴클레오티드 서열에 대한) 은 디폴트로서 11 의 단어 길이 (W) 및 10 의 예상값 I 를 사용하고, BLOSUM62 득점 매트릭스 (Henikoff and Henikoff, Proc. Natl. Acad. Sci. USA 1989 89:10915 참조) 정렬은, 50 의 (B), 10 의 예상값 I, M=5, N=-4 및 둘 모두의 가닥의 비교를 사용한다.
특정 양태에서, "서열 동일성의 백분율" 은 적어도 20 개 위치의 비교 윈도우에 대해 2 개의 최적으로 정렬된 서열을 비교함으로써 결정되며, 이때 비교 윈도우에서의 폴리뉴클레오티드 서열의 일부분은 2 개 서열의 최적 정렬을 위해, 참조 서열 (부가 또는 결실을 포함하지 않음) 과 비교하여, 20% 이하, 통상 5 내지 15%, 또는 10 내지 12% 의 부가 또는 결실 (즉, 갭) 을 포함할 수 있다. 백분율은, 동일한 핵산 염기가 둘 모두의 서열에서 발생하는 위치의 수를 측정하여 매칭된 위치의 수를 산출하고, 매칭된 위치의 수를 참조 서열 중의 위치의 총 수로 나누고 (즉, 윈도우 크기), 결과에 100 을 곱하여 서열 동일성의 백분율을 산출함으로써 계산될 수 있다.
유전 코드의 퇴보성의 결과로서, 본원에 기재하는 바와 같은 관심 특정 항원 또는 이의 단편을 인코딩하는 많은 뉴클레오티드 서열이 존재할 수 있다는 것이 당업자에 의해 이해될 것이다. 이러한 폴리뉴클레오티드 중 일부는 임의의 고유 유전자의 뉴클레오티드 서열에 대해 최소의 상동성을 가질 수 있다. 그럼에도 불구하고, 코돈 사용 빈도에서의 차이로 인해 가변적인 폴리뉴클레오티드가 특정 양태에서 구체적으로 고려된다. 또한, 본원에서 제공되는 폴리뉴클레오티드 서열을 포함하는 유전자의 대립유전자가 또한 고려된다. 대립유전자는 뉴클레오티드의 하나 이상의 돌연변이, 예컨대 결실, 부가 및/또는 치환의 결과로서 변형될 수 있는 내인성 유전자일 수 있다. 생성 mRNA 및 단백질은 변경된 구조 또는 기능을 가질 수 있으나 갖지 않을 수 있다. 대립유전자는 표준 기법 (예컨대 하이브리드화, 증폭 및/또는 데이터베이스 서열 비교) 을 사용하여 확인될 수 있다.
따라서 또 다른 구현예에서, 돌연변이유발 접근방식, 예컨대 위치-특이적 돌연변이유발은, 본원에 기재되는 바와 같은 표적 항원 서열 또는 이의 단편의 변이체 및/또는 유도체의 제조에 이용된다. 이러한 접근방식에 의해, 폴리펩티드 서열에서의 특정 변형은 이들을 인코딩하는 근원 폴리뉴클레오티드의 돌연변이유발을 통해 이루어질 수 있다. 이들 기법은 예를 들어, 하나 이상의 뉴클레오티드 서열 변화를 폴리뉴클레오티드에 도입함으로써, 전술한 고려사항 중 하나 이상을 포함시키는, 서열 변이체를 제조 및 시험하는 간단한 접근방식을 제공할 수 있다.
위치-특이적 돌연변이유발은 횡단되는 결실 접합부의 양 측 상에 안정한 듀플렉스가 형성되도록 충분한 크기의 프라이머 서열 및 서열 복잡성을 제공하기 위한, 원하는 돌연변이의 DNA 서열을 인코딩할 수 있는 특정 올리고뉴클레오티드 서열 뿐만 아니라 충분한 수의 인접 뉴클레오티드의 사용을 통한 돌연변이체의 생산을 허용할 수 있다. 돌연변이는 폴리뉴클레오티드 그 자체의 특성을 개선, 변경, 감소, 변형 또는 다르게는 변화시키기 위해, 및/또는 인코딩된 폴리펩티드의 특성, 활성, 조성, 안정성 또는 일차 서열을 변경시키기 위해, 선택된 폴리뉴클레오티드 서열에서 이용될 수 있다.
폴리펩티드를 인코딩하는 폴리뉴클레오티드 세그먼트 또는 단편은 자동화 올리고뉴클레오티드 합성기를 사용하여 통상 실시되는 바와 같이, 예를 들어, 화학적 수단에 의해 단편을 직접 합성함으로써 용이하게 제조될 수 있다. 또한, 단편은 핵산 재생산 기술, 예컨대 미국 특허 번호 4,683,202 의 PCR™ 기술의 적용에 의해, 재조합체 생산을 위해 재조합 벡터에 선택된 서열을 도입함으로써, 그리고 분자 생물학 분야의 당업자에게 일반적으로 공지된 다른 재조합 DNA 기술에 의해 수득될 수 있다 (예를 들어, Current Protocols in Molecular Biology, John Wiley and Sons, NY, NY 참조).
본원에 기재되는 바와 같은, 원하는 표적 항원 폴리펩티드 또는 이의 단편, 또는 상기 임의의 것을 포함하는 융합 단백질을 발현하기 위해, 폴리펩티드, 또는 기능적 등가물을 인코딩하는 뉴클레오티드 서열을, 당업계에 공지된 재조합 기법을 사용하여 본원의 다른 곳에서 기재되는 바와 같은 적절한 Ad 에 삽입할 수 있다. 적절한 아데노바이러스 벡터는 삽입된 코딩 서열의 전사 및 번역을 위한 필요 요소 및 임의의 원하는 링커를 함유할 수 있다. 당업자에게 널리 공지되어 있는 방법은 관심 폴리펩티드를 인코딩하는 서열 및 적절한 전사 및 번역 제어 요소를 함유하는 이러한 아데노바이러스 벡터를 구축하는데 사용될 수 있다. 이러한 방법은 시험관내 재조합 DNA 기법, 합성 기법 및 생체내 유전자 재조합을 포함할 수 있다. 이러한 기법은 예를 들어, [Amalfitano et al. J. Virol. 1998 72:926-33; Hodges et al. J Gene Med 2000 2:250-259; Sambrook J et al. (1989) Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Press, Plainview, N.Y., 및 Ausubel FM et al. (1989) Current Protocols in Molecular Biology, John Wiley & Sons, New York. N.Y] 에 기재되어 있다.
다양한 벡터/숙주 시스템이 폴리뉴클레오티드 서열을 함유하고 생산하는데 이용될 수 있다. 이들은 비제한적으로, 미생물 예컨대 재조합 박테리오파지, 플라스미드 또는 코스미드 DNA 벡터로 형질전환된 박테리아; 효모 벡터로 형질전환된 효모; 바이러스 벡터 (예를 들어, 배큘로바이러스) 로 감염된 곤충 세포 시스템; 바이러스 벡터 (예를 들어, 꽃양배추 모자이크 바이러스, CaMV; 담배 모자이크 바이러스, TMV) 또는 박테리아 벡터 (예를 들어, Ti 또는 pBR322 플라스미드) 로 형질전환된 식물 세포 시스템; 또는 동물 세포 시스템을 포함할 수 있다.
아데노바이러스 벡터에 존재하는 "제어 요소" 또는 "조절 서열" 은, 전사 및 번역을 수행하기 위해 숙주 세포 단백질과 상호작용할 수 있는 벡터의 이들 비-번역 부위 - 인핸서, 프로모터, 5' 및 3' 미번역 부위 - 일 수 있다. 이러한 요소는 그들의 강도 및 특이성이 가변적일 수 있다. 이용되는 벡터 시스템 및 숙주에 따라, 구성적 및 유도성 프로모터를 포함하는 임의의 수의 적합한 전사 및 번역 요소가 사용될 수 있다. 예를 들어, 관심 폴리펩티드를 인코딩하는 서열은 후기 프로모터 및 삼부 (tripartite) 리더 서열로 이루어지는 Ad 전사/번역 복합체에 라이게이션될 수 있다. 바이러스 게놈의 비-필수 E1 또는 E3 부위 내 삽입은 감염된 숙주 세포에서 폴리펩티드를 발현할 수 있는 생존가능 바이러스를 수득하는데 사용될 수 있다 (Logan J and Shenk T (1984) Proc. Natl. Acad. Sci 1984 87:3655-59). 추가로, 전사 인핸서, 예컨대 라우스 육종 바이러스 (RSV) 인핸서가, 포유동물 숙주 세포에서 발현을 증가시키는데 사용될 수 있다. 전사 인핸서는 1 개의 요소, 적어도 2 개의 요소, 적어도 3 개의 요소, 적어도 4 개의 요소, 적어도 5 개의 요소 또는 적어도 6 개의 요소를 포함할 수 있다.
특정 개시 신호는 또한 관심 폴리펩티드를 인코딩하는 서열의 보다 효과적인 번역을 달성하는데 사용될 수 있다. 이러한 신호는 ATG 개시 코돈 및 인접 서열을 포함할 수 있다. 폴리펩티드를 인코딩하는 서열, 그의 개시 코돈 및 업스트림 서열이 적절한 발현 벡터에 삽입되는 경우, 추가적인 전사 또는 번역 제어 신호는 필요하지 않을 수 있다. 그러나, 오직 코딩 서열 또는 이의 일부분만 삽입되는 경우, ATG 개시 코돈을 포함하는 외인성 번역 제어 신호가 제공될 수 있다. 또한, 개시 코돈은 전체 삽입물의 번역이 보장되도록 올바른 판독 프레임 내에 있을 수 있다. 외인성 번역 요소 및 개시 코돈은 천연 및 합성 둘 모두의, 다양한 기원의 것일 수 있다. 발현 효율은 사용되는 특정 세포 시스템에 대해 적절한 인핸서, 예컨대 문헌에 기재된 것들 (Scharf D. et al. Results Probl. Cell Differ. 1994 20:125-62) 의 포함에 의해 증강될 수 있다. 전사 또는 번역에 대한 특정 종결 서열은 또한 선택된 폴리펩티드를 인코딩하는 서열의 효과적인 번역을 달성하기 위해 통합될 수 있다.
생성물에 특이적인 폴리클로날 또는 모노클로날 항체를 사용하는, 폴리뉴클레오티드-인코딩된 생성물 (예를 들어, 관심 표적 항원) 의 발현을 검출 및 측정하기 위한 다양한 프로토콜은 당업계에 공지되어 있다. 그 예는 효소 결합 면역흡착 검정 (ELISA), 방사능면역검정 (RIA) 및 형광 활성화 세포 분류 (FACS) 를 포함한다. 제공된 폴리펩티드 상의 2 개의 비-간섭 에피토프에 대해 반응성인 모노클로날 항체를 이용하는 2 개 위치, 모노클로날-기반 면역검정이 일부 적용에 사용될 수 있으나, 경쟁적 결합 검정이 또한 이용될 수 있다. 이들 검정 및 다른 검정은, 다른 곳 중에서도, [Hampton R et al. 1990; Serological Methods, a Laboratory Manual, APS Press, St Paul. Minn.] 및 [Maddox DE et al. J. Exp. Med. 1983 758:1211-16] 에 기재되어 있다. 아데노바이러스 벡터는 여러 관심 알파바이러스 항원을 인코딩하는 핵산 서열을 포함할 수 있다.
특정 구현예에서, 원하는 표적 항원의 발현을 증가시키는 요소가 본원에 기재된 아데노바이러스 벡터의 핵산 서열에 통합된다. 이러한 요소는 내부 리보솜 결합 위치를 포함한다 (IRES; Wang and Siddiqui Curr. Top. Microbiol. Immunol 1995 203:99; Ehrenfeld and Semler Curr. Top. Microbiol. Immunol. 1995 203:65; Rees et al., Biotechniques 1996 20:102; Sugimoto et al. Biotechnology 1994 2:694). IRES 는 번역 효율을 증가시킬 수 있다. 다른 서열은 또한 발현을 증강시킬 수 있다. 일부 유전자에 대해, 특히 5' 말단에 있는 서열은 전사 및/또는 번역을 저해할 수 있다. 이러한 서열은 헤어핀 구조를 형성할 수 있는 팔린드롬 (palindrome) 일 수 있다. 전달되는 핵산 중 임의의 이러한 서열은 결실될 수 있거나 결실되지 않을 수 있다.
전사체 또는 전사된 산물의 발현 수준은 발현에 영향을 주는 서열을 확인하거나 알아내기 위해 검정될 수 있다. 전사체 수준은, 노던 블롯 하이브리드화, RNase 프로브 보호 등을 포함하는 임의의 공지된 방법에 의해 검정될 수 있다. 단백질 수준은, ELISA 를 포함하는 임의의 공지된 방법에 의해 검정될 수 있다. 당업자에 의해 인식되는 바와 같이, 이종 핵산 서열을 포함하는 아데노바이러스 벡터는 당업계에 공지된 재조합 기법, 예컨대 [Maione et al. Proc Natl Acad Sci USA 2001 98:5986-91; Maione et al. Hum Gene Ther 2000 1:859-68; Sandig et al. Proc Natl Acad Sci USA, 2000 97:1002-07; Harui et al. Gene Therapy 2004 11:1617-26; Parks et al. Proc Natl Acad Sci USA 1996 93:13565-570; Dello Russo et al. Proc Natl Acad Sci USA 2002 99:12979-984; Current Protocols in Molecular Biology, John Wiley and Sons, NY, NY] 에 기재된 기법을 사용하여 생성될 수 있다.
상기 주목한 바와 같이, 아데노바이러스 벡터는 여러 알파바이러스 표적 단백질 또는 관심 항원을 인코딩할 수 있는 핵산 서열을 포함할 수 있다. 이와 관련하여, 벡터는 1 내지 4 개 또는 그 이상의 상이한 관심 표적 항원을 인코딩하는 핵산을 함유할 수 있다. 표적 항원은 전장 단백질일 수 있거나, 이의 단편 (예를 들어, 에피토프) 일 수 있다. 아데노바이러스 벡터는 하나의 관심 표적 단백질로부터의 다수의 단편 또는 에피토프를 인코딩하는 핵산 서열을 함유할 수 있거나, 수많은 상이한 관심 표적 알파바이러스 항원 단백질로부터의 하나 이상의 단편 또는 에피토프를 함유할 수 있다.
일부 양태에서, 핵산 서열은 복수의 알파바이러스 표적 항원을 인코딩한다. 복수의 알파바이러스 표적 항원을 인코딩하는 핵산 서열은 각각 표적 항원에 상응하는 복수의 유전자 삽입물을 포함할 수 있으며, 이때 각각의 유전자 삽입물은 자가-절단 2A 펩티드를 인코딩하는 핵산 서열에 의해 분리된다. 일부 양태에서, 자가-절단 2A 펩티드 (즉, 절단가능 링커) 는 돼지 테스코바이러스-1 또는 토세아 아시그나 바이러스 등에서 유래된다.
절단가능 링커의 예는 2A 링커 (예를 들어, T2A), 2A-유사 링커 또는 이의 기능적 등가물 및 이의 조합을 포함할 수 있다. 일부 구현예에서, 링커는 피코르나바이러스 2A-유사 링커, 돼지 테스코바이러스 (P2A), 토세아 아시그나 바이러스 (T2A) 의 CHYSEL 서열, 또는 이의 조합, 변이체 및 기능적 등가물을 포함한다.
특정 구현예에서, 면역원성 단편은 MHC 클래스 I 또는 클래스 II 분자에 결합한다. 본원에서 사용하는 바와 같이, 면역원성 단편은, 이러한 결합이 당업계에 공지된 임의의 검정을 사용하여 검출가능하다면, MHC 클래스 I 또는 클래스 II 분자에 "결합" 할 수 있다. 예를 들어, 폴리펩티드가 MHC 클래스 I 에 결합하는 능력은 125I 표지된 β2-마이크로글로불린 (β2m) 의 MHC 클래스 I/β2m/펩티드 이종삼량체성 복합체 내로의 통합을 촉진시키는 능력을 모니터링함으로써 간접적으로 평가될 수 있다 (Parker et al., J. Immunol. 752:163, 1994 참조). 대안적으로, 당업계에 공지되어 있는 기능적 펩티드 경쟁 검정을 이용할 수 있다. 폴리펩티드의 면역원성 단편은 일반적으로 널리 공지된 기법, 예컨대 [Paul, Fundamental Immunology, 3rd ed., 243-247 (Raven Press, 1993)] 및 이에 인용된 참고문헌에 요약된 기법을 사용하여 확인될 수 있다. 면역원성 단편을 확인하기 위한 대표적 기법은, 항원-특이적 항혈청 및/또는 T-세포주 또는 클론과 반응하는 능력에 대한 폴리펩티드의 스크리닝을 포함할 수 있다. 특정 표적 폴리펩티드의 면역원성 단편은 (예를 들어, ELISA 및/또는 T-세포 반응성 검정에서) 전장 표적 폴리펩티드의 반응성보다 실질적으로 낮지 않은 수준에서 이러한 항혈청 및/또는 T-세포와 반응할 수 있는 단편일 수 있다. 즉, 면역원성 단편은 전장 폴리펩티드의 반응성과 유사하거나 더 큰 수준에서 이러한 검정 내에서 반응할 수 있다. 이러한 스크리닝은 일반적으로, 당업자에게 널리 공지된 방법, 예컨대 [Harlow and Lane, Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory, 1988] 에서 기재된 방법을 사용하여 수행될 수 있다.
표적 항원은 임의의 알파바이러스에서 유래하는 항원을 포함할 수 있으나 이에 제한되지는 않는다. 표적 항원은 본원에 기재된 임의의 감염성 알파바이러스에 의해 생산된 단백질, 예컨대 C, E3ALPHA, E2ALPHA, 6K, E1ALPHA, nsP1, nsP2, nsP3, 및 nsP4 를 포함할 수 있다. 본원에서 사용하는 바와 같이, "감염원" 은 숙주를 감염시킬 수 있는 임의의 종일 수 있다. 감염원은 예를 들어, 알파바이러스 속 내의 임의의 바이러스를 포함할 수 있다.
아데노바이러스 벡터는 또한 표적 항원의 면역원성을 증가시키는 단백질을 인코딩하는 핵산 서열을 포함할 수 있다. 이와 관련하여, 이러한 단백질을 함유하는 아데노바이러스 벡터로의 면역화 후 생산된 단백질은, 관심 표적 항원의 면역원성을 증가시키는 단백질에 융합된 관심 표적 항원을 포함하는 융합 단백질일 수 있다.
IV.
병용 요법
특정 구현예는 감염성 질환의 치료 및 예방을 위한 병용 면역요법 및 백신 조성물을 제공한다. 일부 구현예는 감염성 질환과 같은 복합 질환에 대한 증강된 치료 반응을 위한 병용 다중-표적화 백신, 면역요법 및 방법을 제공한다. 병용 요법의 각 성분은 치쿤구니아 감염 또는 임의의 알파바이러스에 의한 감염의 예방을 위한 백신 조성물에 독립적으로 포함될 수 있다.
"치료" 는 본 개시물의 백신의 치료학적 유효 용량을 대상에게 투여하는 것을 나타낼 수 있다. 치료는 약학 조성물로 대상에게 투여될 수 있다. 대상은 또한 치료시에 건강하거나 질환이 없을 수 있으며, 이 경우, 치료는 예방적 백신화로서 나타낼 수 있다. 대상은 치료시에 질환 상태로 고통을 겪을 수 있으며, 이 경우, 치료는 치료적 백신화로서 나타낼 수 있다.
"대상" 은 인간, 비-인간 영장류 (예를 들어, 레수스 또는 기타 유형의 마카크), 마우스, 돼지, 말, 당나귀, 소, 양, 랫트 및 가금류를 비제한적으로 포함하는 임의의 동물을 나타낼 수 있다. "대상" 은 본원에서 "개체" 또는 "환자" 와 상호교환가능하게 사용될 수 있다.
일부 양태에서, 벡터는 적어도 하나의 항원을 포함한다. 일부 양태에서, 벡터는 적어도 2 개의 항원을 포함한다. 일부 양태에서, 백신 제형은 1:1 비의 벡터 대 항원을 포함한다. 일부 양태에서, 백신은 1:2 비의 벡터 대 항원을 포함한다. 일부 양태에서, 백신은 1:3 비의 벡터 대 항원을 포함한다. 일부 양태에서, 백신은 1:4 비의 벡터 대 항원을 포함한다. 일부 양태에서, 백신은 1:5 비의 벡터 대 항원을 포함한다. 일부 양태에서, 백신은 1:6 비의 벡터 대 항원을 포함한다. 일부 양태에서, 백신은 1:7 비의 벡터 대 항원을 포함한다. 일부 양태에서, 백신은 1:8 비의 벡터 대 항원을 포함한다. 일부 양태에서, 백신은 1:9 비의 벡터 대 항원을 포함한다. 일부 양태에서, 백신은 1:10 비의 벡터 대 항원을 포함한다.
일부 양태에서, 백신은 병용 백신이며, 여기서 백신은 적어도 단일한 항원을 각각 함유하는 적어도 2 개의 벡터를 포함한다.
상이한 항원의 혼합물이 대상에서 동일하거나 상이한 벡터로부터 동시에 투여 또는 발현되는 경우, 이들은 서로 경쟁할 수 있다. 그 결과, 병용 면역요법 또는 백신 중 상이한 농도 및 비의 발현된 항원을 포함하는 제형이 평가되고 대상 또는 대상의 군에 대해 맞추어져, 투여 후 발생하는 효과적이고 지속된 면역 반응이 보장되어야 한다.
다수의 항원을 포함하는 조성물은 다양한 비로 존재할 수 있다. 예를 들어, 하나 초과의 벡터를 갖는 제형은 다양한 비를 가질 수 있다. 예를 들어, 면역요법 또는 백신은 1:1, 1:2, 1:3, 1:4, 1:5, 1:6, 1:7, 1:8, 1:9, 1:10, 1:15, 1:20, 1:30, 2:1, 2:3, 2:4, 2:5, 2:6, 2:7, 2:8, 3:1, 3:3, 3:4, 3:5, 3:6, 3:7, 3:8, 3:1, 3:3, 3:4, 3:5, 3:6, 3:7, 3:8, 4:1, 4:3, 4:5, 4:6, 4:7, 4:8, 5:1, 5:3, 5:4, 5:6, 5:7, 5:8, 6:1, 6:3, 6:4, 6:5, 6:7, 6:8, 7:1, 7:3, 7:4, 7:5, 7:6, 7:8, 8:1, 8:3, 8:4, 8:5, 8:6 또는 8:7 의 화학량론으로 2 개의 상이한 벡터를 가질 수 있다.
일부 구현예에서, 재조합 핵산 벡터 중 적어도 하나는 첫 번째 동일성 값을 포함하는 복제 결함성 아데노바이러스 5 벡터를 포함하는 복제 결함성 바이러스 벡터이다. 일부 구현예에서, 복제 결함성 아데노바이러스 벡터는 E2b 유전자 부위에서 결실을 포함한다. 일부 구현예에서, 복제 결함성 아데노바이러스 벡터는 E1 유전자 부위에서 결실을 추가로 포함한다. 일부 구현예에서, 복제 결함성 아데노바이러스 벡터는 E1 유전자 부위, 및 E2b 유전자 부위, E3 유전자 부위, E4 유전자 부위, 또는 이의 임의의 조합에서 결실을 포함한다.
본 개시물의 임의의 Ad5 [E1-, E2b-] 백신과 병용으로 사용될 수 있는 특정 요법을 하기에 보다 상세히 기재한다.
A.
공동자극 분자
표적 항원 예컨대 알파바이러스 표적 항원, 특히 치쿤구니아 항원을 함유하는 재조합 아데노바이러스-기반 벡터 백신의 사용에 추가로, 공동자극 분자가 상기 백신에 통합되어 면역원성을 증가시킬 수 있다.
면역 반응의 개시는 APC에 의한 I T 세포의 활성화를 위해 적어도 2 가지 신호를 필요로 할 수 있다 (Damle, et al. J Immunol 148:1985-92 (1992); Guinan, et al. Blood 84:3261-82 (1994); Hellstrom, et al. Cancer Chemother Pharmacol 38:S40-44 (1996); Hodge, et al. Cancer Res 39:5800-07 (1999)). 항원 특이적 제 1 신호는 펩티드/주요 조직적합성 복합체 (MHC) 를 통해 T 세포 수용체 (TCR) 를 통하여 전달될 수 있으며 T 세포가 세포 주기에 진입하도록 할 수 있다. 제 2, 또는 공동자극 신호는 사이토카인 생산 및 증식을 위해 전달될 수 있다.
전문적인 항원 제시 세포 (APC) 의 표면 상에서 보통 발견되는 적어도 3 개의 별개 분자가 T 세포 활성화에 중요한 제 2 신호를 제공할 수 있다: B7-1 (CD80), ICAM-1 (CD54) 및 LFA-3 (인간 CD58) (Damle, et al. J Immunol 148:1985-92 (1992); Guinan, et al. Blood 84: 3261-82 (1994); Wingren, et al. Crit Rev Immunol 15: 235-53 (1995); Parra, et al. Scand. J Immunol 38: 508-14 (1993); Hellstrom, et al. Ann NY Acad Sci 690: 225-30 (1993); Parra, et al. J Immunol 158: 637-42 (1997); Sperling, et al. J Immunol 157: 3909-17 (1996); Dubey, et al. J Immunol 155: 45-57 (1995); Cavallo, et al. Eur J Immunol 25: 1154-62 (1995)).
이러한 공동자극 분자는 별개의 T 세포 리간드를 가질 수 있다. B7-1 은 CD28 및 CTLA-4 분자와 상호작용할 수 있고, ICAM-1 은 CD11a/CD18 (LFA-1/베타-2 인테그린) 복합체와 상호작용할 수 있고, LFA-3 은 CD2 (LFA-2) 분자와 상호작용할 수 있다. 따라서 특정 구현예에서, 각각 B7-1, ICAM-1 및 LFA-3 을 함유하는 재조합 아데노바이러스 벡터를 갖는 것이 바람직할 수 있는데, 이는 표적 항원, 예컨대 알파바이러스 항원을 인코딩하는 하나 이상의 핵산을 함유하는 재조합 아데노바이러스-기반 벡터 백신과 병용시, 특정 표적 항원에 대해 유도된 항-알파바이러스 면역 반응을 더 증가/증강시킬 수 있다.
V.
면역학적 융합 파트너
본원에 기재된 바이러스 벡터 또는 조성물은 표적 항원, 예컨대 치쿤구니아 바이러스 항원, 또는 본 개시물의 임의의 표적 항원의 면역원성을 증가시킬 수 있는 단백질, 또는 "면역학적 융합 파트너" 를 인코딩하는 핵산 서열을 추가로 포함할 수 있다. 이와 관련하여, 이러한 단백질을 함유하는 바이러스 벡터로의 면역화 후 생산되는 단백질은 관심 표적 항원의 면역원성을 증가시키는 단백질에 융합된 관심 표적 항원을 포함하는 융합 단백질일 수 있다. 또한, 치쿤구니아 바이러스 항원 및 면역학적 융합 파트너를 인코딩하는 Ad5 [E1-, E2b-] 벡터로의 병용 요법은, 면역 반응의 부스트 (boost) 를 초래할 수 있어, 두 치료 모이어티의 조합은 치쿤구니아 바이러스 항원 단독, 또는 면역학적 융합 파트너 단독을 인코딩하는 Ad5 [E1-, E2b-] 벡터보다 더 면역 반응을 상승작용적으로 부스트하는 작용을 한다. 예를 들어, 치쿤구니아 바이러스 항원 및 면역학적 융합 파트너를 인코딩하는 Ad5 [E1-, E2b-] 벡터로의 병용 요법은 항원-특이적 효과기 CD4+ 및 CD8+ T 세포의 자극, 감염된 세포 살해에 대해 유도된 NK 세포 반응의 자극, 항체 의존적 세포-매개 세포독성 (ADCC), 항체 의존적 세포 식균작용 (ADCP) 메커니즘을 통한 감염된 세포 살해에 대해 유도된 호중구 또는 단핵구 세포 반응의 자극, 또는 이의 임의의 조합의 상승작용적 증강을 초래할 수 있다. 이러한 상승작용적 부스트는 이를 필요로 하는 대상에 투여 후 생존 결과를 크게 개선시킬 수 있다. 특정 구현예에서, 치쿤구니아 바이러스 항원 및 면역학적 융합 파트너를 인코딩하는 Ad5 [E1-, E2b-] 벡터로의 병용 요법은 대조군과 비교하여 아데노바이러스 벡터가 투여된 대상에서 약 1.5 내지 20 배, 또는 그 이상의 표적 항원-특이적 CTL 활성의 증가를 포함하는 면역 반응 생성을 초래할 수 있다. 또 다른 구현예에서, 면역 반응 생성은 대조군과 비교하여 치쿤구니아 바이러스 항원 및 면역학적 융합 파트너를 인코딩하는 Ad5 [E1-, E2b-] 벡터가 투여된 대상에서 약 1.5 내지 20 배, 또는 그 이상의 표적-특이적 CTL 활성의 증가를 포함한다. 추가 구현예에서, 면역 반응 생성은 대조군과 비교하여 약 1.5 내지 20 배, 또는 그 이상의, 사이토카인 분비, 예컨대 인터페론-감마 (IFN-γ), 인터류킨-2 (IL-2), 종양 괴사 인자-알파 (TNF-α), 또는 기타 사이토카인을 측정하는 ELISpot 검정에 의해 측정된 바와 같이, 표적 항원-특이적 세포-매개 면역력 활성의 증가를 포함한다. 추가 구현예에서, 면역 반응 생성은 적절한 대조군과 비교하여 본원에 기재한 바와 같은 치쿤구니아 바이러스 항원 및 면역학적 융합 파트너를 인코딩하는 Ad5 [E1-, E2b-] 벡터를 투여한 대상에서 1.5 내지 5 배의 표적-특이적 항체 생산의 증가를 포함한다. 또 다른 구현예에서, 면역 반응 생성은 대조군과 비교하여 아데노바이러스 벡터를 투여한 대상에서 약 1.5 내지 20 배, 또는 그 이상, 표적-특이적 항체 생산의 증가를 포함한다.
추가적인 예로서, 표적 에피토프 항원 및 면역학적 융합 파트너를 인코딩하는 Ad5 [E1-, E2b-] 벡터로의 병용 요법은 항원-특이적 효과기 CD4+ 및 CD8+ T 세포의 자극, 감염된 세포 살해에 대해 유도된 NK 세포 반응의 자극, 항체 의존적 세포-매개 세포독성 (ADCC), 항체 의존적 세포 식균작용 (ADCP) 메커니즘을 통한 감염된 세포 살해에 대해 유도된 호중구 또는 단핵구 세포 반응의 자극, 또는 이의 임의의 조합의 상승작용적 증강을 초래할 수 있다. 이러한 상승작용적 부스트는 이를 필요로 하는 대상에 대한 투여 후 생존 결과를 크게 개선시킬 수 있다. 특정 구현예에서, 표적 에피토프 항원 및 면역학적 융합 파트너를 인코딩하는 Ad5 [E1-, E2b-] 벡터와의 병용 요법은 대조군과 비교하여 아데노바이러스 벡터가 투여된 대상에서 약 1.5 내지 20 배, 또는 그 이상의 표적 항원-특이적 CTL 활성의 증가를 포함하는 면역 반응 생성을 초래할 수 있다. 또 다른 구현예에서, 면역 반응 생성은 대조군과 비교하여 표적 에피토프 항원 및 면역학적 융합 파트너를 인코딩하는 Ad5 [E1-, E2b-] 벡터가 투여된 대상에서 약 1.5 내지 20 배, 또는 그 이상의 표적-특이적 CTL 활성의 증가를 포함한다. 추가 구현예에서, 면역 반응 생성은 대조군과 비교하여 약 1.5 내지 20 배, 또는 그 이상의, 사이토카인 분비, 예컨대 인터페론-감마 (IFN-γ), 인터류킨-2 (IL-2), 종양 괴사 인자-알파 (TNF-α), 또는 기타 사이토카인을 측정하는 ELISpot 검정에 의해 측정된 바와 같이, 표적 항원-특이적 세포-매개 면역력 활성의 증가를 포함한다. 추가 구현예에서, 면역 반응 생성은 적절한 대조군과 비교하여 본원에 기재한 바와 같은 아데노바이러스 벡터를 투여한 대상에서 1.5 내지 5 배의 표적-특이적 항체 생산의 증가를 포함한다. 또 다른 구현예에서, 면역 반응 생성은 대조군과 비교하여 아데노바이러스 벡터를 투여한 대상에서 약 1.5 내지 20 배, 또는 그 이상, 표적-특이적 항체 생산의 증가를 포함한다.
한 구현예에서, 이러한 면역학적 융합 파트너는 마이코박테리움 종 (Mycobacterium sp.) 으로부터 유래된다 (예컨대 마이코박테리움 투베르쿨로시스 (Mycobacterium tuberculosis)-유래된 Ra12 단편). 마이코박테리움 종으로부터 유래된 면역학적 융합 파트너는 SEQ ID NO: 22 - SEQ ID NO: 30 및 SEQ ID NO: 93 - SEQ ID NO: 98 에서 나타내는 서열 중 임의의 하나일 수 있다. 올리고뉴클레오티드, Met-His 태그 및 엔테로키나아제 인식 위치 (이러한 마이코박테리움 종-유래 Ra12 서열을 구축하는데 사용될 수 있음) 를 SEQ ID NO: 99 - SEQ ID NO: 106 중 임의의 하나에서 나타낸다 (표 2 에 제시됨). 이종 폴리뉴클레오티드/폴리펩티드 서열의 발현 및/또는 면역원성을 증강시키는데 사용하기 위한 Ra12 조성물 및 방법이 그 전체가 본원에 참조로 포함되는 미국 특허 번호 7,009,042 에서 기재되어 있다. 간략하게, Ra12 는 마이코박테리움 투베르쿨로시스 MTB32A 핵산의 하위서열인 폴리뉴클레오티드 부위를 나타낸다. MTB32A 는 M.투베르쿨로시스 (M. tuberculosis) 의 독성 및 무독성 균주에서의 유전자에 의해 인코딩된 32 kDa 의 세린 프로테아제이다. MTB32A 의 뉴클레오티드 서열 및 아미노산 서열이 기재되어 있다 (예를 들어, 본원에 그 전체가 참조로 포함되는 미국 특허 번호 7,009,042; Skeiky et al., Infection and Immun. 67:3998-4007 (1999) 참조). MTB32A 코딩 서열의 C-말단 단편은 높은 수준으로 발현될 수 있으며 정제 과정 전체에 걸쳐 가용성 폴리펩티드로서 남아 있다. 더욱이, Ra12 는 융합되는 이종 면역원성 폴리펩티드의 면역원성을 증강시킬 수 있다. Ra12 융합 폴리펩티드는 MTB32A 의 아미노산 잔기 192 ~ 323 에 상응하는 14 kDa C-말단 단편을 포함할 수 있다. 다른 Ra12 폴리뉴클레오티드는 일반적으로, Ra12 폴리펩티드의 일부분을 인코딩하는 적어도 약 15, 30, 60, 100, 200, 300 개 또는 그 이상의 뉴클레오티드를 포함할 수 있다. Ra12 폴리뉴클레오티드는 고유 서열 (즉, Ra12 폴리펩티드 또는 그의 일부분을 인코딩하는 내인성 서열) 을 포함할 수 있거나, 이러한 서열의 변이체를 포함할 수 있다. Ra12 폴리뉴클레오티드 변이체는 하나 이상의 치환, 부가, 결실 및/또는 삽입을 함유할 수 있는데, 인코딩된 융합 폴리펩티드의 생물학적 활성은 고유 Ra12 폴리펩티드를 포함하는 융합 폴리펩티드에 관하여 실질적으로 약화되지 않는다. 변이체는 고유 Ra12 폴리펩티드 또는 그의 일부분을 인코딩하는 폴리뉴클레오티드 서열에 대해 적어도 약 70%, 80% 또는 90% 동일성, 또는 그 이상의 동일성을 가질 수 있다.
특정 양태에서, 면역학적 융합 파트너는 그람-음성 박테리아 헤모필루스 인플루엔자 B (Haemophilus influenzae B) 의 표면 단백질인 단백질 D 로부터 유래될 수 있다. 단백질 D 로부터 유래되는 면역학적 융합 파트너는 SEQ ID NO: 47 에서 나타내는 서열일 수 있다. 일부 경우, 단백질 D 유도체는 대략 단백질의 첫 번째 3 분의 1 (예를 들어, 첫 번째 N-말단 100-110 아미노산) 을 포함한다. 단백질 D 유도체는 지질화될 수 있다. 특정 구현예에서, 지질단백질 D 융합 파트너의 첫 번째 109 개 잔기가 N-말단 상에 포함되어 추가적인 외인성 T-세포 에피토프를 가진 폴리펩티드가 제공되며, 이는 대장균에서의 발현 수준을 증가시킬 수 있고, 발현 인핸서로서 기능할 수 있다. 지질 꼬리는 항원 제시 세포에 대한 항원의 최적의 제시를 보장할 수 있다. 다른 융합 파트너는 인플루엔자 바이러스로부터의 비-구조 단백질, NS1 (헤마글루티닌) 을 포함할 수 있다. 전형적으로, N-말단 81 개 아미노산이 사용되지만, T-헬퍼 에피토프를 포함하는 상이한 단편이 사용될 수 있다.
특정 양태에서, 면역학적 융합 파트너는 LYTA 로서 공지된 단백질, 또는 이의 일부분 (특히 C-말단 부분) 일 수 있다. LYTA 로부터 유래된 면역학적 융합 파트너는 SEQ ID NO: 32 에서 나타내는 서열일 수 있다. LYTA 는 스트렙토코쿠스 뉴모니에 (Streptococcus pneumoniae) 로부터 유래되고, 이는 아미다아제 LYTA (LytA 유전자에 의해 인코딩됨) 로서 공지된 N-아세틸-L-알라닌 아미다아제를 합성한다. LYTA 는 펩티도글리칸 백본 중의 특정 결합을 특이적으로 분해하는 오토라이신이다. LYTA 단백질의 C-말단 도메인은 콜린 또는 일부 콜린 유사체, 예컨대 DEAE 에 대한 친화성을 담당할 수 있다. 이러한 특성은 융합 단백질의 발현에 유용한 대장균 C-LYTA 발현 플라스미드의 개발에 이용될 수 있다. 아미노 말단에서 C-LYTA 단편을 함유하는 하이브리드 단백질의 정제가 이용될 수 있다. 또 다른 구현예에서, LYTA 의 반복 부분은 융합 폴리펩티드 내에 통합될 수 있다. 반복 부분은 예를 들어, 잔기 178 에서 출발하는 C-말단 부위에서 발견될 수 있다. 하나의 특정 반복 부분은 잔기 188-305 를 포함할 수 있다.
일부 구현예에서, 표적 항원은 IFN-γ, TNFα, IL-2, IL-8, IL-12, IL-18, IL-7, IL-3, IL-4, IL-5, IL-6, IL-9, IL-10, IL-13, IL-15, IL-16, IL-17, IL-23, IL-32, M-CSF (CSF-1), IFN-α, IFN-β, IL-1α, IL-1β, IL-1RA, IL-11, IL-17A, IL-17F, IL-19, IL-20, IL-21, IL-22, IL-24, IL-25, IL-26, IL-27, IL-28A, B, IL-29, IL-30, IL-31, IL-33, IL-34, IL-35, IL-36α,β,γ, IL-36Ra, IL-37, TSLP, LIF, OSM, LT-α, LT-β, CD40 리간드, Fas 리간드, CD27 리간드, CD30 리간드, 4-1BBL, Trail, OPG-L, APRIL, LIGHT, TWEAK, BAFF, TGF-β1 및 MIF 의 군에서 선택되는 사이토카인을 포함하는, "면역원성 성분"으로서 본원에서 또한 나타낼 수 있는 면역학적 융합 파트너에 융합된다. 표적 항원 융합물은 IFN-γ, TNFα, IL-2, IL-8, IL-12, IL-18, IL-7, IL-3, IL-4, IL-5, IL-6, IL-9, IL-10, IL-13, IL-15, IL-16, IL-17, IL-23, IL-32, M-CSF (CSF-1), IFN-α, IFN-β, IL-1α, IL-1β, IL-1RA, IL-11, IL-17A, IL-17F, IL-19, IL-20, IL-21, IL-22, IL-24, IL-25, IL-26, IL-27, IL-28A, B, IL-29, IL-30, IL-31, IL-33, IL-34, IL-35, IL-36α,β,γ, IL-36Ra, IL-37, TSLP, LIF, OSM, LT-α, LT-β, CD40 리간드, Fas 리간드, CD27 리간드, CD30 리간드, 4-1BBL, Trail, OPG-L, APRIL, LIGHT, TWEAK, BAFF, TGF-β1 및 MIF 중 하나 이상에 대해 실질적인 동일성을 갖는 단백질을 생산할 수 있다. 표적 항원 융합물은 IFN-γ, TNFα, IL-2, IL-8, IL-12, IL-18, IL-7, IL-3, IL-4, IL-5, IL-6, IL-9, IL-10, IL-13, IL-15, IL-16, IL-17, IL-23, IL-32, M-CSF (CSF-1), IFN-α, IFN-β, IL-1α, IL-1β, IL-1RA, IL-11, IL-17A, IL-17F, IL-19, IL-20, IL-21, IL-22, IL-24, IL-25, IL-26, IL-27, IL-28A, B, IL-29, IL-30, IL-31, IL-33, IL-34, IL-35, IL-36α,β,γ, IL-36Ra, IL-37, TSLP, LIF, OSM, LT-α, LT-β, CD40 리간드, Fas 리간드, CD27 리간드, CD30 리간드, 4-1BBL, Trail, OPG-L, APRIL, LIGHT, TWEAK, BAFF, TGF-β1 및 MIF 중 하나 이상에 대해 실질적인 동일성을 갖는 단백질을 인코딩하는 핵산을 인코딩할 수 있다. 일부 구현예에서, 표적 항원 융합물은 IFN-γ, TNFα, IL-2, IL-8, IL-12, IL-18, IL-7, IL-3, IL-4, IL-5, IL-6, IL-9, IL-10, IL-13, IL-15, IL-16, IL-17, IL-23, IL-32, M-CSF (CSF-1), IFN-α, IFN-β, IL-1α, IL-1β, IL-1RA, IL-11, IL-17A, IL-17F, IL-19, IL-20, IL-21, IL-22, IL-24, IL-25, IL-26, IL-27, IL-28A, B, IL-29, IL-30, IL-31, IL-33, IL-34, IL-35, IL-36α,β,γ, IL-36Ra, IL-37, TSLP, LIF, OSM, LT-α, LT-β, CD40 리간드, Fas 리간드, CD27 리간드, CD30 리간드, 4-1BBL, Trail, OPG-L, APRIL, LIGHT, TWEAK, BAFF, TGF-β1 및 MIF 의 군에서 선택되는 사이토카인을 포함하는, "면역원성 성분" 으로서 또한 본원에서 나타낼 수 있는, 하나 이상의 면역학적 융합 파트너를 추가로 포함한다. IFN-γ 의 서열은 SEQ ID NO: 33 에서 나타내는 바와 같은 서열일 수 있으나 이에 제한되는 것은 아니다. TNFα 의 서열은 SEQ ID NO: 34 에서 나타내는 바와 같은 서열일 수 있으나 이에 제한되는 것은 아니다. IL-2 의 서열은 SEQ ID NO: 35 에서 나타내는 바와 같은 서열일 수 있으나 이에 제한되는 것은 아니다. IL-8 의 서열은 SEQ ID NO: 36 에서 나타내는 바와 같은 서열일 수 있으나 이에 제한되는 것은 아니다. IL-12 의 서열은 SEQ ID NO: 37 에서 나타내는 바와 같은 서열일 수 있으나 이에 제한되는 것은 아니다. IL-18 의 서열은 SEQ ID NO: 38 에서 나타내는 바와 같은 서열일 수 있으나 이에 제한되는 것은 아니다. IL-7 의 서열은 SEQ ID NO: 39 에서 나타내는 바와 같은 서열일 수 있으나 이에 제한되는 것은 아니다. IL-3 의 서열은 SEQ ID NO: 40 에서 나타내는 바와 같은 서열일 수 있으나 이에 제한되는 것은 아니다. IL-4 의 서열은 SEQ ID NO: 41 에서 나타내는 바와 같은 서열일 수 있으나 이에 제한되는 것은 아니다. IL-5 의 서열은 SEQ ID NO: 42 에서 나타내는 바와 같은 서열일 수 있으나 이에 제한되는 것은 아니다. IL-6 의 서열은 SEQ ID NO: 43 에서 나타내는 바와 같은 서열일 수 있으나 이에 제한되는 것은 아니다. IL-9 의 서열은 SEQ ID NO: 44 에서 나타내는 바와 같은 서열일 수 있으나 이에 제한되는 것은 아니다. IL-10 의 서열은 SEQ ID NO: 45 에서 나타내는 바와 같은 서열일 수 있으나 이에 제한되는 것은 아니다. IL-13 의 서열은 SEQ ID NO: 46 에서 나타내는 바와 같은 서열일 수 있으나 이에 제한되는 것은 아니다. IL-15 의 서열은 SEQ ID NO: 47 에서 나타내는 바와 같은 서열일 수 있으나 이에 제한되는 것은 아니다. IL-16 의 서열은 SEQ ID NO: 74 에서 나타내는 바와 같은 서열일 수 있으나 이에 제한되는 것은 아니다. IL-17 의 서열은 SEQ ID NO: 75 에서 나타내는 바와 같은 서열일 수 있으나 이에 제한되는 것은 아니다. IL-23 의 서열은 SEQ ID NO: 76 에서 나타내는 바와 같은 서열일 수 있으나 이에 제한되는 것은 아니다. IL-32 의 서열은 SEQ ID NO: 77 에서 나타내는 바와 같은 서열일 수 있으나 이에 제한되는 것은 아니다.
일부 구현예에서, 표적 항원은 IFN-γ, TNFα, IL-2, IL-8, IL-12, IL-18, IL-7, IL-3, IL-4, IL-5, IL-6, IL-9, IL-10, IL-13, IL-15, , IL-16, IL-17, IL-23, IL-32, M-CSF (CSF-1), IFN-α, IFN-β, IL-1α, IL-1β, IL-1RA, IL-11, IL-17A, IL-17F, IL-19, IL-20, IL-21, IL-22, IL-24, IL-25, IL-26, IL-27, IL-28A, B, IL-29, IL-30, IL-31, IL-33, IL-34, IL-35, IL-36α,β,γ, IL-36Ra, IL-37, TSLP, LIF, OSM, LT-α, LT-β, CD40 리간드, Fas 리간드, CD27 리간드, CD30 리간드, 4-1BBL, Trail, OPG-L, APRIL, LIGHT, TWEAK, BAFF, TGF-β1 및 MIF 의 군에서 선택되는 사이토카인을 포함하는, "면역원성 성분" 으로서 또한 본원에서 나타내는 면역학적 융합 파트너에 융합되거나 연결된다. 일부 구현예에서, 표적 항원은 IFN-γ, TNFα, IL-2, IL-8, IL-12, IL-18, IL-7, IL-3, IL-4, IL-5, IL-6, IL-9, IL-10, IL-13, IL-15, IL-16, IL-17, IL-23, IL-32, M-CSF (CSF-1), IFN-α IFN-β, IL-1α, IL-1β, IL-1RA, IL-11, IL-17A, IL-17F, IL-19, IL-20, IL-21, IL-22, IL-24, IL-25, IL-26, IL-27, IL-28A, B, IL-29, IL-30, IL-31, IL-33, IL-34, IL-35, IL-36α,β,γ, IL-36Ra, IL-37, TSLP, LIF, OSM, LT-α, LT-β, CD40 리간드, Fas 리간드, CD27 리간드, CD30 리간드, 4-1BBL, Trail, OPG-L, APRIL, LIGHT, TWEAK, BAFF, TGF-β1 및 MIF 의 군에서 선택되는 사이토카인을 포함하는, "면역원성 성분" 으로서 또한 본원에서 나타내는 면역학적 융합 파트너와 세포 내에서 동시발현된다.
일부 구현예에서, 표적 항원은, CpG ODN (예를 들어, 클래스 A, B 또는 C CpG ODN; 비제한적 예시 서열을 SEQ ID NO: 108 - SEQ ID NO: 119 에 나타내며, 여기서 포스포디에스테르 염기는 대문자이고, 포스포로티오에이트 염기는 소문자이고, 팔린드롬은 밑줄그어지며 콜론은 반사점을 나타냄), 콜레라 독소 (비제한적 예시 서열은 SEQ ID NO: 49 에 제시되어 있다), 박테리아 ADP-리보실화 엑소톡신에서 유래된 절두형 A 서브유닛 코딩 부위 (비제한적 예시 서열은 SEQ ID NO: 50 에 제시되어 있다), 박테리아 ADP-리보실화 엑소톡신에서 유래된 절두형 B 서브유닛 코딩 부위 (비제한적 예시 서열은 SEQ ID NO: 51 에 제시되어 있다), Hp91 (비제한적 예시 서열은 SEQ ID NO: 52 에 제시되어 있다), CCL20 (비제한적 예시 서열은 SEQ ID NO: 53 및 SEQ ID NO: 107 에 제시되어 있다), CCL3 (비제한적 예시 서열은 SEQ ID NO: 54 에 제시되어 있다), GM-CSF (비제한적 예시 서열은 SEQ ID NO: 55 에 제시되어 있다), G-CSF (비제한적 예시 서열은 SEQ ID NO: 56 에 제시되어 있다), LPS 펩티드 모방체 (비제한적 예시 서열은 SEQ ID NO: 57 - SEQ ID NO: 68 에 제시되어 있다), 시가 독소 (비제한적 예시 서열은 SEQ ID NO: 69 에 제시되어 있다), 디프테리아 독소 (비제한적 예시 서열은 SEQ ID NO: 70 에 제시되어 있다) 또는 CRM197 (비제한적 예시 서열은 SEQ ID NO: 73 에 제시되어 있다) 을 포함하는 면역학적 융합 파트너에 융합되거나 연결된다.
일부 구현예에서, 표적 항원은 IL-15 과작동제를 포함하는, 면역학적 융합 파트너에 융합되거나 연결된다. 인터류킨 15 (IL-15) 는 바이러스 감염 후 분비되는 자연 발생 염증성 사이토카인이다. 분비된 IL-15 는 효과기 면역 세포 상의 이의 동족 (cognate) 수용체를 통해 신호를 전달함으로써 그의 기능을 수행할 수 있으며, 따라서 효과기 면역 세포 활성의 전반적인 증강을 초래할 수 있다.
세포 면역 반응을 자극하고 유지하는 IL-15 의 광범위한 능력을 기반으로, 이는 유망한 면역요법 약물인 것으로 여겨진다. 그러나, IL-15 의 임상적 개발에 있어서의 주요 한계는 표준 포유동물 세포 발현 시스템에서의 낮은 생산 수율 및 짧은 혈청 반감기를 포함할 수 있다. 게다가, 자유 IL-15 사이토카인보다는 동일한 세포에 의해 동시발현되는 단백질을 포함하는 IL-15:IL-15Rα 복합체는, IL-15 βγc 수용체를 가지고 있는 면역 효과기 세포를 자극하는 것을 담당할 수 있다.
이들 단점을 극복하기 위해, 신규한 IL-15 과작동제 돌연변이체 (IL-15N72D) 는 증가된 IL-15Rβγc 에 결합하는 능력 및 증강된 생물학적 활성을 갖는 것으로 확인되었다. 마우스 또는 인간 IL-15Rα 및 Fc 융합 단백질 (면역글로불린의 Fc 부위) 의 등몰 농도의 IL-15N72D 에 대한 첨가는 IL-15 생물학적 활성에 있어서 추가 증가를 제공할 수 있어, IL-15N72D:IL-15Rα/Fc 과작동제 복합체가 자유 IL-15 사이토카인보다 10 배 초과로 더 낮은 IL-15-의존적 세포 성장을 지지하기 위한 중간 유효 농도 (EC50) 를 나타낸다.
일부 구현예에서, IL-15 과작동제는 신규한 IL-15 과작동제 돌연변이체 (IL-15N72D) 일 수 있다. 특정 구현예에서, 마우스 또는 인간 IL-15Rα 및 Fc 융합 단백질 (면역글로불린의 Fc 부위) 의 등몰 농도의 IL-15N72D 에 대한 첨가는 IL-15 생물학적 활성에 있어서 추가 증가를 제공할 수 있어, IL-15N72D:IL-15Rα/Fc 과작동제 복합체가 자유 IL-15 사이토카인보다 10 배 초과로 더 낮을 수 있는 IL-15-의존적 세포 성장을 지지하기 위한 중간 유효 농도 (EC50) 를 나타낸다.
따라서 일부 구현예에서, 본 개시물은 자유 IL-15 사이토카인보다 2-배 초과로 더 낮은, 3-배 초과로 더 낮은, 4-배 초과로 더 낮은, 5-배 초과로 더 낮은, 6-배 초과로 더 낮은, 7-배 초과로 더 낮은, 8-배 초과로 더 낮은, 9-배 초과로 더 낮은, 10-배 초과로 더 낮은, 15-배 초과로 더 낮은, 20-배 초과로 더 낮은, 25-배 초과로 더 낮은, 30-배 초과로 더 낮은, 35-배 초과로 더 낮은, 40-배 초과로 더 낮은, 45-배 초과로 더 낮은, 50-배 초과로 더 낮은, 55-배 초과로 더 낮은, 60-배 초과로 더 낮은, 65-배 초과로 더 낮은, 70-배 초과로 더 낮은, 75-배 초과로 더 낮은, 80-배 초과로 더 낮은, 85-배 초과로 더 낮은, 90-배 초과로 더 낮은, 95-배 초과로 더 낮은 또는 100-배 초과로 더 낮은 IL-15-의존적 세포 성장을 지지하기 위한 EC50 을 갖는 IL-15N72D:IL-15Rα/Fc 과작동제 복합체를 제공한다.
일부 구현예에서, IL-15 과작동제는 또한 ALT-803 으로서 알려진, 가용성 IL-15Rα/Fc 융합 단백질의 이량체 및 2 개의 IL-15N72D 분자의 생물학적 활성 단백질 복합체이다. ALT-803 의 조성물 및 ALT-803 의 생산 및 사용 방법은, 본원에 참조로 포함되는 미국 특허 출원 공개 번호 2015/0374790 에 기재되어 있다. N 말단에 소위 "스시" 도메인 (Su) 을 함유하는 가용성 IL-15Rα 단편이, 높은 친화성 사이토카인 결합을 담당하는 구조 요소 대부분을 가질 수 있는 것으로 알려져 있다. 가용성 융합 단백질은 인간 IL-15RαSu 도메인 (성숙 인간 IL-15Rα 단백질의 아미노산 1-65) 을 Fc 도메인을 함유하는 인간 IgG1 CH2-CH3 부위 (232 개 아미노산) 과 연결시킴으로써 생성될 수 있다. 이러한 IL-15RαSu/IgG1 Fc 융합 단백질은 IgG1 도메인을 통한 디술피드 결합을 통한 이량체 형성 및 표준 단백질 A 친화성 크로마토그래피 방법을 사용하는 정제의 용이성의 장점을 가질 수 있다.
일부 구현예에서, ALT-803 은 이량체성 IL-15Rα 스시 도메인/인간 IgG1 Fc 융합 단백질에 높은 친화성으로 연관되는 인간 IL-15 변이체의 2 개 단백질 서브유닛으로 이루어지는 가용성 복합체를 가질 수 있다. IL-15 변이체는 헬릭스 C 의 위치 72 에서의 Asn 에서 Asp 로의 치환 (N72D) 을 가진 성숙 인간 IL-15 사이토카인 서열을 포함하는 114 개 아미노산 폴리펩티드이다. 인간 IL-15R 스시 도메인/인간 IgG1 Fc 융합 단백질은 Fc 도메인을 함유하는 인간 IgG1 CH2-CH3 부위 (232 개 아미노산) 에 연결된 IL-15R 서브유닛의 스시 도메인 (성숙 인간 IL-15Rα 단백질의 아미노산 1-65) 을 포함한다. N72D 치환 이외에도, 모든 단백질 서열은 인간이다. 서브유닛의 아미노산 서열을 기반으로, 2 개 IL-15N72D 폴리펩티드 (예로서, IL-15N72D 서열은 SEQ ID NO: 71 에 표시된다) 및 디술피드 연결된 동종이량체 IL-l5RαSu/IgG1 Fc 단백질 (예로서, IL-15RαSu/Fc 도메인은 SEQ ID NO: 72 에 표시됨) 를 포함하는 복합체의 계산된 분자량은 92.4 kDa 이다. 일부 구현예에서, 표적 항원 및 ALT-803 을 인코딩하는 재조합 벡터는 표적 항원을 인코딩하는 본원에 기재된 임의 서열을 가질 수 있고, ALT-803 을 인코딩하기 위해 SEQ ID NO: 71, SEQ ID NO: 71, SEQ ID NO: 72, 및 SEQ ID NO: 72 을 임의 순서로 가질 수 있다.
각각의 IL-15N720 폴리펩티드는 대략 12.8 kDa 의 계산된 분자량을 가질 수 있고, IL-15RαSu/IgG 1 Fc 융합 단백질은 대략 33.4 kDa 의 계산된 분자량을 가질 수 있다. IL-15N72D 및 IL-15RαSu/IgG 1 Fc 단백질 둘 모두는 당화되어서 크기 배제 크로마토그래피에 의해 대략 114 kDa 의 ALT-803 의 겉보기 분자량을 초래할 수 있다. ALT-803 에 대해 측정된 등전점 (pI) 은 대략 5.6 내지 6.5 의 범위일 수 있다. 따라서, 융합 단백질은 pH 7 에서 음으로 하전될 수 있다.
치쿤구니아 바이러스 항원 및 ALT-803 을 인코딩하는 Ad5[E1-, E2b-] 벡터의 병용 요법은 그 결과로 면역 반응을 부스팅시킬 수 있어서, 양쪽 치료적 모이어티의 조합이 요법 단독보다 더 많이 면역 반응을 상승적으로 부스팅시키는 작용을 한다. 예를 들어, 치쿤구니아 바이러스 항원 및 ALT-803 을 인코딩하는 Ad5[E1-, E2b-] 벡터의 병용 요법은 항원-특이적 이펙터 CD4+ 및 CD8+ T 세포의 자극, 감염된 세포를 살해하는 쪽으로 NK 세포 반응의 자극, 항체 의존적 세포-매개 세포독성 (ADCC) 또는 항체 의존적 세포 식균작용 (ADCP) 기전을 통해 감염된 세포를 살해하는 쪽으로 호중구 또는 단핵구 세포 반응의 자극의 상승적 증강을 일으킬 수 있다. 치쿤구니아 바이러스 항원 및 ALT-803 을 인코딩하는 Ad5[E1-, E2b-] 벡터의 병용 요법은 상기 반응 중 어느 하나, 또는 상기 반응의 조합을 상승적으로 부스팅하여, 이를 필요로 하는 대상에게 투여 이후에 생존 결과를 상당히 개선시킬 수 있다.
본원에 기재된 임의의 면역원성 증강제는 본원에 기재된 임의의 재조합 벡터를 사용하여, 동일한 재조합 벡터에서 면역원성 증강제 및 표적 항원을 발현시킴으로써 표적 항원과 융합되거나 또는 연결될 수 있다.
이러한 면역원성 증강제를 인코딩하는 핵산 서열은 SEQ ID NO: 22 - SEQ ID NO: 47, SEQ ID NO: 49 - SEQ ID NO: 77, 및 SEQ ID NO: 93 - SEQ ID NO: 119 중 어느 하나일 수 있고 표 1 에 요약한다.
표 1 - 면역학적 융합 파트너의 서열
표 2 - 마이코박테리아 종-유래 Ra12 서열을 구축하기 위한 도구
일부 구현예에서, 표적 항원 및 면역학적 융합 파트너를 위한 핵산 서열은 임의의 핵산에 의해 분리되지 않는다. 다른 구현예에서, 링커를 인코딩하는 핵산 서열이 본원에 기재된 임의의 표적 항원을 인코딩하는 핵산 서열 및 본원에 기재된 임의의 면역학적 융합 파트너를 인코딩하는 핵산 서열 사이에 삽입될 수 있다. 따라서, 일정 구현예에서, 표적 항원, 링커, 및 면역학적 융합 파트너를 함유하는 바이러스 벡터로 면역화 이후에 생산되는 단백질은 관심 표적 항원과 그에 후속된 링커를 포함하고 면역학적 융합 파트너로 종결되는 융합 단백질일 수 있고, 따라서 링커를 통해서 관심 표적 항원의 면역원성을 증가시키는 면역학적 융합 파트너에 표적 항원이 연결된다. 일부 구현예에서, 링커 핵산의 서열은 약 1 내지 약 150 개 핵산 길이, 약 5 내지 약 100 개 핵산 길이, 또는 약 10 내지 약 50 개 핵산 길이일 수 있다. 일부 구현예에서, 핵산 서열은 하나 이상의 아미노산 잔기를 인코딩할 수 있다. 일부 구현예에서, 링커의 아미노산 서열은 약 1 내지 약 50 개, 또는 약 5 내지 약 25 개 아미노산 잔기의 길이일 수 있다. 일부 구현예에서, 링커의 서열은 10 개 미만의 아미노산을 포함한다. 일부 구현예에서, 링커는 폴리알라닌 링커, 폴리글리신 링커, 또는 알라닌과 글리신 둘 모두를 갖는 링커일 수 있다.
이러한 링커를 인코딩하는 핵산 서열은 SEQ ID NO: 78 - SEQ ID NO: 92 중 어느 하나일 수 있고 표 3 에 요약한다.
표 3 - 링커의 서열
VI.
사용 방법
아데노바이러스 벡터는 본원에 기재된 바와 같은 하나 이상의 알파바이러스 표적 항원, 특히 치쿤구니아 바이러스 표적 항원에 대한 면역 반응을 생성시키기 위해 다수의 백신 상황에서 사용될 수 있다. 아데노바이러스 벡터는 그들이 아데노바이러스 또는 아데노바이러스 벡터에 대해 기존 면역성을 갖는 대상에서 면역 반응을 생성시키는데 사용될 수 있고 이전 세대 아데노바이러스 벡터를 사용하는 용법으로는 불가능한, 아데노바이러스 벡터를 사용하는 다수회의 면역화를 포함하는 백신접종 용법에서 사용될 수 있다는 발견으로 인해 특히 중요하다.
일반적으로, 면역 반응의 생성은 체액성 반응 및/또는 세포-매개 반응의 유도를 포함할 수 있다. 특정 구현예에서, 관심 표적 항원에 대한 면역 반응을 증가시키는 것이 바람직하다. 그와 같이 "면역 반응의 생성" 또는 "면역 반응의 유도" 는 임의의 통계적으로 유의한 변화, 예를 들어, 하나 이상의 면역 세포 (T 세포, B 세포, 항원-제시 세포, 수지상 세포, 호중구 등) 의 수 또는 이들 면역 세포 중 하나 이상의 활성 (CTL 활성, HTL 활성, 사이토카인 분비, 사이토카인 분비 프로파일의 변화 등) 의 증가를 포함할 수 있다.
당업자는 면역 반응의 변경이 일어났는지 여부를 확인하기 위한 다수의 방법이 이용가능하다는 것을 쉽게 인식할 것이다. 면역 반응 (예를 들어, 세포 수, 사이토카인 발현, 세포 활성) 의 변경을 검출하기 위한 여러 가지 방법이 당해 기술분야에 알려져 있고 본 발명의 문맥에서 유용하다. 예시적인 방법이 Current Protocols in Immunology, Edited by: John E. Coligan, Ada M. Kruisbeek, David H. Margulies, Ethan M. Shevach, Warren Strober (2001 John Wiley & Sons, NY, NY); Ausubel et al. (2001 Current Protocols in Molecular Biology, Greene Publ. Assoc. Inc. & John Wiley & Sons, Inc., NY, NY); Sambrook et al. (1989 Molecular Cloning, Second Ed., Cold Spring Harbor Laboratory, Plainview, NY); Maniatis et al. (1982 Molecular Cloning, Cold Spring Harbor Laboratory, Plainview, NY) 및 다른 곳에 기재되어 있다. 이러한 문맥에서 유용한 예시적인 방법은 세포내 사이토카인 염색 (ICS), ELISpot, 증식 어세이, 크롬 방출을 포함하는 세포독성 T 세포 어세이 또는 균등한 어세이, 및 임의의 수의 중합효소 연쇄 반응 (PCR) 을 사용하는 유전자 발현 분석 또는 RT-PCR 기반 어세이를 포함할 수 있다.
특정 구현예에서, 면역 반응의 생성은 대조군과 비교하여 아데노바이러스 벡터가 투여된 대상에서의 약 1.5 내지 20 배 또는 그 이상, 적어도, 약, 또는 최대 1.5, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 그로부터 유래하는 임의의 범위 또는 수의 표적 항원-특이적 CTL 활성의 증가를 포함한다. 또다른 구현예에서, 면역 반응의 생성은 대조군과 비교하여 아데노바이러스 벡터가 투여된 대상에서의 약 1.5 내지 20 배, 또는 그 이상의 표적-특이적 CTL 활성의 증가를 포함한다. 추가 구현예에서, 면역 반응의 생성은 대조군과 비교하여 약 1.5 내지 20 배, 또는 그 이상의, 사이토카인 분비, 예컨대 인터페론-감마 (IFN-γ), 인터류킨-2 (IL-2), 종양 괴사 인자-알파 (TNF-α), 그랜자임, 또는 기타 사이토카인을 측정하는 ELISpot 어세이에 의해 측정되는 표적 항원-특이적 세포 매개 면역성 활성의 증가를 포함한다.
추가 구현예에서, 면역 반응의 생성은 적당한 대조군과 비교하여 아데노바이러스 벡터가 투여된 대상에서 1.5 내지 5 배의 표적-특이적 항체 생산의 증가를 포함한다. 또다른 구현예에서, 면역 반응의 생성은 대조군과 비교하여 아데노바이러스 벡터가 투여된 대상에서 약 1.5 내지 20 배, 또는 그 이상의 표적-특이적 항체 생산의 증가를 포함한다.
따라서, 특정 양태는 관심의 알파바이러스 표적 항원에 대한 면역 반응의 생성 방법으로서, a) 복제 결함성 아데노바이러스 벡터로서, E2b 부위에 결실을 갖는 아데노바이러스 벡터, 및 b) 표적 항원을 인코딩하는 핵산을 포함하는 아데노바이러스 벡터를 대상에게 투여하는 것; 및 아데노바이러스 벡터를 적어도 1 회 대상에게 재투여하는 것; 그에 의해 표적 항원에 대한 면역 반응을 생성하는 것을 포함하는 방법을 제공할 수 있다. 특정 기타 양태는 관심의 알파바이러스 표적 항원들에 대한 면역 반응의 생성 방법으로서, a) 복제 결함성 아데노바이러스 벡터로서, E2b 부위에 결실을 갖는 아데노바이러스 벡터, 및 b) 표적 항원들을 인코딩하는 핵산을 포함하는 아데노바이러스 벡터를 대상에게 투여하는 것; 및 아데노바이러스 벡터를 적어도 1 회 대상에게 재투여하는 것; 그에 의해 표적 항원들에 대한 면역 반응을 생성하는 것을 포함하는 방법을 제공할 수 있다. 특정 구현예에서, 투여되는 벡터가 거트 벡터가 아닌 방법이 제공될 수 있다.
추가의 구현예에서, 대상에서 알파바이러스 바이러스 표적 항원에 대한 면역 반응을 생성하는 방법으로서, 대상이 Ad 에 대해 기존 면역성을 갖고, 방법이 a) 복제 결함성 아데노바이러스 벡터로서, E2b 부위에 결실을 갖는 아데노바이러스 벡터, 및 b) 표적 항원을 인코딩하는 핵산을 포함하는 아데노바이러스 벡터를 대상에게 투여하는 것; 및 아데노바이러스 벡터를 적어도 1 회 대상에게 재투여하는 것; 그에 의해 알파바이러스 바이러스 표적 항원에 대한 면역 반응을 생성하는 것에 의하는 방법이 제공될 수 있다. 추가 구현예에서, 대상에서 알파바이러스 바이러스 표적 항원들에 대한 면역 반응을 생성하는 방법으로서, 개체가 Ad 에 대해 기존 면역성을 갖고, 방법이 a) 복제 결함성 아데노바이러스 벡터로서, E2b 부위에 결실을 갖는 아데노바이러스 벡터, 및 b) 표적 항원들을 인코딩하는 핵산을 포함하는 아데노바이러스 벡터를 대상에게 투여하는 것; 및 아데노바이러스 벡터를 적어도 1 회 대상에게 재투여하는 것; 그에 의해 알파바이러스 바이러스 표적 항원들에 대한 면역 반응을 생성하는 것에 의하는 방법이 제공될 수 있다.
Ad 에 대해 기존 면역성에 관하여, 이는 당해 기술분야에 알려진 방법, 예컨대 Ad 항체의 존재에 대해 시험하는 항체-기반 어세이를 사용하여 확인될 수 있다. 또한, 특정 구현예에서, 상기 방법은 먼저 개체가 Ad 에 대해 기존 면역성을 갖는지 여부를 확인하고, 그 후 본원에 기재된 바와 같은 E2b 결실된 아데노바이러스 벡터를 투여하는 것을 포함할 수 있다.
특정 양태에서, 본원의 다른 곳에 기술된 것들과 같은 알파바이러스 표적 항원에 대한 면역 반응의 생성 방법이 제공될 수 있다.
특정 양태에서, 본원의 다른 곳에 기술된 것들과 같은 알파바이러스에 대한 면역 반응의 생성 방법이 제공될 수 있다.
VII.
약학 조성물
본원의 다른 곳에 언급된 바와 같이, 아데노바이러스 벡터는 감염원 (이에 대해 면역 반응이 생성될 것임) 중 임의의 하나 또는 그 이상으로부터의 하나 이상의 관심의 표적 항원을 인코딩하는 핵산 서열을 포함할 수 있다. 예를 들어, 표적 항원은 바이러스 항원 단백질, 예컨대 E3ALPHA, E2ALPHA, 6K, E1ALPHA, nsP1, nsP2, nsP3, 및 nsP4 를 포함할 수 있으나 그에 제한되지 않는다.
투여를 위해, 아데노바이러스 벡터 스톡 (stock) 이 적당한 완충제, 생리적으로 허용가능한 담체, 부형제 등과 조합될 수 있다. 특정 구현예에서, 적당한 수의 아데노바이러스 벡터 입자가 적당한 완충제, 예컨대, 멸균 PBS 중에 투여된다.
특정 상황에서, 본원에 개시된 아데노바이러스 벡터 조성물을 비경구, 정맥내, 근육내, 또는 심지어는 복강내 전달하는 것이 바람직할 수 있다. 특정 구현예에서, 자유 염기 또는 약물학적으로 허용가능한 염으로서의 활성 화합물의 용액은 계면활성제, 예컨대 히드록시프로필셀룰로오스와 적합하게 혼합된 물 중에 제조될 수 있다. 분산물은 또한 글리세롤, 액체 폴리에틸렌 글리콜, 및 그의 혼합물 중에 및 오일 중에 제조될 수 있다. 기타 구현예에서, E2b 결실된 아데노바이러스 벡터는 삼켜서 또는 좌제에 의해 전달되는 알약 형태로 전달될 수 있다.
주사용 용도에 적합한 예시적인 약학 형태는 멸균 주사용 용액 또는 분산물의 즉석 제조를 위한 멸균 분말 및 멸균 수성 용액 또는 분산물을 포함한다 (예를 들어, 미국 특허 제 5,466,468 호 참조). 그 형태는 멸균될 수 있고, 용이한 시린지이용성이 존재하는 정도로 유동성일 수 있다. 그것은 제조 및 저장 조건 하에서 안정적일 수 있고, 미생물, 예컨대 박테리아, 곰팡이, 및 진균의 오염 작용에 대해 보존될 수 있다. 담체는 예를 들어, 물, 에탄올, 폴리올 (예를 들어, 글리세롤, 프로필렌 글리콜, 및 액상 폴리에틸렌 글리콜 등), 이의 적합한 혼합물 및/또는 식물성 오일을 함유하는 용매 또는 분산 매질일 수 있다. 적절한 유동성은 예를 들어, 코팅, 예컨대 레시틴의 사용에 의해서, 분산물의 경우 요구되는 입자 크기의 유지에 의해서 및/또는 계면활성제의 사용에 의해서 유지될 수 있다. 미생물 작용의 예방은 다양한 항박테리아제 및 항진균제, 예를 들어 파라벤, 클로로부탄올, 페놀, 솔브산, 티머로살 등에 의해 촉진될 수 있다. 많은 경우에서, 그것은 등장화제, 예를 들어 당류 또는 염화나트륨을 포함할 수 있다. 주사용 조성물의 장기간 흡수는 조성물에 흡수를 지연시키는 작용제, 예를 들어 알루미늄 모노스테아레이트 및 젤라틴의 사용을 통해 일어날 수 있다.
일 구현예에서, 수성 용액 중 비경구 투여를 위해서, 용액은 필요하면 적합하게 완충될 것이고, 액체 희석제는 먼저 충분한 염류 또는 포도당으로 등장성이 될 수 있다. 이들 특정한 수성 용액은 특히 정맥내, 근육내, 피하 및 복강내 투여에 적합할 수 있다. 이와 관련하여, 이용될 수 있는 멸균 수성 매질이 본 개시물의 관점에서 당업자에게 공지될 것이다. 예를 들어, 1 투여량을 1 mL 의 등장성 NaCl 용액에 용해시킬 수 있고 1000 mL 의 피하주입 유체에 첨가하거나 또는 제안된 주입 부위에 주사할 수 있다 (예를 들어, 문헌 ["Remington's Pharmaceutical Sciences" 15th Edition, 페이지 1035-1038 및 1570-1580] 참조). 투여량 중 일부 변동은 치료하려는 대상의 병태에 따라서 필수적으로 일어날 것이다. 게다가, 인간 투여의 경우, 조제물은 FDA 생물학 표준 사무국이 요구하는 멸균성, 발열원성, 및 일반 안정성 및 순도 표준을 충족시킬 필요가 있을 수 있다.
담체는 임의의 모든 용매, 분산 매질, 비히클, 코팅, 희석제, 항박테리아제 및 항진균제, 등장화제 및 흡수 지연제, 완충제, 담체 용액, 현탁액, 콜로이드 등을 추가로 포함할 수 있다. 약학적 활성 물질을 위한 이러한 매질 및 작용제의 사용은 당분야에 충분히 공지되어 있다. 통상의 매질 또는 작용제가 활성 성분과 상용성이 아닌 경우를 제외하고, 치료적 조성물에서 이의 사용이 고려된다. 보충적인 활성 성분이 또한 조성물에 도입될 수 있다. 어구 "약학적으로 허용가능한" 은 인간에게 투여될 때 알레르기 또는 유사하게 곤란한 반응을 일으키지 않는 분자 독립체 및 조성물을 의미할 수 있다.
본원에 기재된 치료적 조성물의 투여의 경로 및 빈도를 비롯하여 투여량은 개체 마다, 질환마다 다양할 것이고, 표준 기술을 사용해 쉽게 확립할 수 있다. 일반적으로, 약학 조성물 및 백신은 주사 (예를 들어, 피내, 복강내, 근육내, 정맥내 또는 피하), 비내 (예를 들어, 흡입), 알약 형태 (예를 들어, 삼킴, 질 또는 직장 전달용 좌제) 로 투여될 수 있다. 일정 구현예에서, 1 내지 3 용량이 6주 기간 동안 투여될 수 있고 추가의 부스터 백신접종은 그 이후에 주기적으로 제공될 수 있다.
다양한 구현예에서, 복제 결함성 아데노바이러스는 본원에 기재된 면역 반응을 생성하는데 적합한 용량으로 투여된다. 일부 구현예에서, 복제 결함성 아데노바이러스는 면역화 당 약 1x108 바이러스 입자 내지 약 5x1013 바이러스 입자의 용량으로 투여된다. 일부 경우에서, 복제 결함성 아데노바이러스는 면역화 당 약 1x109 내지 약 5x1012 바이러스 입자의 용량으로 투여된다. 일부 구현예에서, 복제 결함성 아데노바이러스는 면역화 당 약 1x108 바이러스 입자 내지 약 5x108 바이러스 입자의 용량으로 투여된다. 일부 구현예에서, 복제 결함성 아데노바이러스는 면역화 당 약 5x108 바이러스 입자 내지 약 1x109 바이러스 입자의 용량으로 투여된다. 일부 구현예에서, 복제 결함성 아데노바이러스는 면역화 당 약 1x109 바이러스 입자 내지 약 5x109 바이러스 입자의 용량으로 투여된다. 일부 구현예에서, 복제 결함성 아데노바이러스는 면역화 당 약 5x109 바이러스 입자 내지 약 1x1010 바이러스 입자의 용량으로 투여된다. 일부 구현예에서, 복제 결함성 아데노바이러스는 면역화 당 약 1x1010 바이러스 입자 내지 약 5x1010 바이러스 입자의 용량으로 투여된다. 일부 구현예에서, 복제 결함성 아데노바이러스는 면역화 당 약 5x1010 바이러스 입자 내지 약 1x1011 바이러스 입자의 용량으로 투여된다. 일부 구현예에서, 복제 결함성 아데노바이러스는 면역화 당 약 1x1011 바이러스 입자 내지 약 5x1011 바이러스 입자의 용량으로 투여된다. 일부 구현예에서, 복제 결함성 아데노바이러스는 면역화 당 약 5x1011 바이러스 입자 내지 약 1x1012 바이러스 입자의 용량으로 투여된다. 일부 구현예에서, 복제 결함성 아데노바이러스는 면역화 당 약 1x1012 바이러스 입자 내지 약 5x1012 바이러스 입자의 용량으로 투여된다. 일부 구현예에서, 복제 결함성 아데노바이러스는 면역화 당 약 5x1012 바이러스 입자 내지 약 1x1013 바이러스 입자의 용량으로 투여된다. 일부 구현예에서, 복제 결함성 아데노바이러스는 면역화 당 약 1x1013 바이러스 입자 내지 약 5x1013 바이러스 입자의 용량으로 투여된다. 일부 구현예에서, 복제 결함성 아데노바이러스는 면역화 당 약 1x108 바이러스 입자 내지 약 5x1010 바이러스 입자의 용량으로 투여된다. 일부 구현예에서, 복제 결함성 아데노바이러스는 면역화 당 약 1x1010 바이러스 입자 내지 약 5x1012 바이러스 입자의 용량으로 투여된다. 일부 구현예에서, 복제 결함성 아데노바이러스는 면역화 당 약 1x1011 바이러스 입자 내지 약 5x1013 바이러스 입자의 용량으로 투여된다. 일부 구현예에서, 복제 결함성 아데노바이러스는 면역화 당 약 1x108 바이러스 입자 내지 약 1x1010 바이러스 입자의 용량으로 투여된다. 일부 구현예에서, 복제 결함성 아데노바이러스는 면역화 당 약 1x1010 바이러스 입자 내지 약 1x1012 바이러스 입자의 용량으로 투여된다. 일부 구현예에서, 복제 결함성 아데노바이러스는 면역화 당 약 1x1011 바이러스 입자 내지 약 5x1013 바이러스 입자의 용량으로 투여된다. 일부 경우에서, 복제 결함성 아데노바이러스는 면역화 당 1x109, 2x109, 3x109, 4x109, 5x109, 6x109, 7x109, 8x109, 9x109, 1x1010, 2x1010, 3x1010, 4x1010, 5x1010, 6x1010, 7x1010, 8x1010, 9x1010, 1x1011, 2x1011, 3x1011, 4x1011, 5x1011, 6x1011, 7x1011, 8x1011, 9x1011, 1x1012, 1.5x1012, 2x1012, 3x1012, 또는 그 이상의 바이러스 입자 (VP) 와 동일하거나 또는 그를 초과하는 용량으로 투여된다. 일부 경우에서, 복제 결함성 아데노바이러스는 면역화 당 1x109, 2x109, 3x109, 4x109, 5x109, 6x109, 7x109, 8x109, 9x109, 1x1010, 2x1010, 3x1010, 4x1010, 5x1010, 6x1010, 7x1010, 8x1010, 9x1010, 1x1011, 2x1011, 3x1011, 4x1011, 5x1011, 6x1011, 7x1011, 8x1011, 9x1011, 1x1012, 1.5x1012, 2x1012, 3x1012, 또는 그 이상의 바이러스 입자와 같거나 또는 그 미만인 용량으로 투여된다. 다양한 구현예에서, 본 명세서에서 바람직한 용량은 제제 완충액의 적합한 부피, 예를 들어 약 0.1-10 mL, 0.2-8mL, 0.3-7mL, 0.4-6 mL, 0.5-5 mL, 0.6-4 mL, 0.7-3 mL, 0.8-2 mL, 0.9-1.5 mL, 0.95-1.2 mL, 또는 1.0-1.1 mL 의 부피로 투여된다. 당업자는 부피가 임의의 이들 값에 의해 제한되는 임의 범위 내에 속할 수 있다는 것을 이해한다 (예를 들어, 약 0.5 mL 내지 약 1.1 mL)
적합한 용량은 상기 기술된 바와 같이 투여시, 본 명세서의 다른 곳에 기술된 바와 같이 표적 항원 면역 반응을 촉진할 수 있는 아데노바이러스 벡터의 양일 수 있다. 일정 구현예에서, 면역 반응은 기준 (즉, 미처리) 수준보다 적어도 10-50% 초과이다. 이러한 반응은 환자에서 표적 항원 항체를 측정하거나 또는 시험관내에서 알파바이러스 감염된 세포를 사멸시킬 수 있는 세포용해성 이펙터 세포의 백신-의존적 생성에 의해서, 또는 면역 반응을 모니터링하기 위해 당분야에 공지된 다른 방법에 의해서 모니터링될 수 있다.
일반적으로, 적절한 투여량 용법은 예방적 이득을 제공하기에 충분한 양으로 아데노바이러스 벡터를 제공한다. 보호성 면역 반응은 일반적으로 면역화 (백신접종) 이전 및 이후에 환자로부터 수득된 샘플을 사용하여 수행될 수 있는 표준 증식, 세포독성 또는 사이토카인 어세이를 사용하여 평가될 수 있다.
하나의 장점이 특히 Ad 에 대한 기존 면역성을 갖는 개체에서, 동일한 아데노바이러스 벡터로 다수의 백신접종을 투여하는 능력인 한편, 아데노바이러스 백신은 또한 프라임 및 부스트 용법의 일부로서 투여될 수도 있다. 혼합 양식 프라임 및 부스터 접종 계획은 증강된 면역 반응을 야기할 수 있다.
따라서, 일 양상은 관심의 표적 항원을 포함하는 플라스미드 벡터와 같은 플라스미드 백신을 사용하여, 적어도 1회 플라스미드 백신을 투여함으로써, 대상을 프라이밍시키고, 사전정해진 시간 길이가 지나게 하고 나서, 아데노바이러스 벡터를 투여하여 부스팅시키는 방법이다. 다중 프라이밍, 예를 들어, 1-3 회가 이용될 수 있지만, 그 이상이 사용될 수 있다. 프라이밍과 부스트 사이의 시간 길이는 약 6 개월 내지 1 년으로 다를 수 있지만, 다른 시간 기간이 사용될 수도 있다.
VIII.
키트
본원에 기재된 조성물, 면역요법 또는 백신은 키트의 형태로 공급될 수 있다. 본 개시물의 키트는 용량 및 또는 투여 용법 정보에 관한 지시서를 추가로 포함할 수 있다.
일부 구현예에서, 키트는 본원에 기술된 백신을 제공하기 위한 방법 및 조성물을 포함한다. 일부 구현예에서 키트는 키트 성분을 투여하는데 유용한 성분 및 성분을 제조하는 방법에 관한 지시서를 추가로 포함할 수 있다. 일부 구현예에서, 키트는 적절한 실험실 검사에 의한 백신접종 이전 및 이후에 환자의 모니터링을 수행하거나, 또는 결과 및 환자 데이타를 의료진과 통신하기 위한 소프트웨어를 추가로 포함할 수 있다.
키트의 성분은 건조 형태이거나 또는 액체 형태일 수 있다. 그들이 건조 형태인 경우, 키트는 건조된 재료를 용해시키기 위한 용액을 포함할 수 있다. 키트는 또한 액체 또는 건조 형태의 전달 인자를 포함할 수 있다. 전달 인자가 건조 형태인 경우에, 키트는 전달 인자를 용해시키기 위한 용액을 포함한다. 키트는 또한 성분을 혼합하고 제조하기 위한 용기를 포함할 수 있다. 키트는 또한 예를 들어 바늘, 튜빙, 도포기, 흡입기, 시린지, 파이펫, 포셉, 계량 스푼, 점안기 또는 임의의 이러한 의학적으로 승인된 전달 비히클과 같은 투여의 보조를 위한 장비를 포함할 수 있다. 본 명세서에 기술되는 키트 또는 약물 전달 시스템은 또한 상업적 판매 및 유통을 위해 밀폐된 구획에 본 개시물의 조성물을 함유하기 위한 수단을 포함할 수 있다.
상기에 기술된 다양한 구현예는 추가 구현예를 제공하도록 조합될 수 있다. 본 명세서에서 인용되고/되거나 출원 데이타 시트에서 열거된 모든 미국 특허, 미국 특허 출원 공개물, 미국 특허 출원, 외국 특허, 외국 특허 출원 및 비특허 공개물은 각각의 개별 공개물, 특허 또는 특허 출원이 특별히 개별적으로 참조로 편입된다고 표시된 바와 동일한 정도로 그들 전문이 참조로 본 명세서에 편입된다.
구현예의 양상은 필요하다면 추가의 구현예를 제공하기 위해 다양한 특허, 출원 및 공개물의 개념을 적용하도록 변형될 수 있다.
이들 및 다른 변화는 상기 상술한 설명의 관점에서 구현예에 대해 이루어질 수 있다. 대체로, 하기 청구항에서, 사용된 용어는 명세서 및 청구항에 개시된 특별한 구현예로 청구항을 제한하는 것으로 해석되어서는 안되지만, 이러한 청구항이 부여하는 균등물의 전체 범위와 함께 모든 가능한 구현예를 포함하는 것으로 해석되어야 한다. 따라서, 청구항은 본 개시물에 의해 한정되지 않는다.
실시예
하기 실시예는 본 개시물의 일부 양태를 추가로 설명하기 위해 포함되고, 본 개시물의 범위를 제한하기 위해 사용되어서는 안된다.
실시예 1
단일-표적화 Ad5 [E1-, E2b-]-CHIKV 백신의 생산
이 실시예는 CHIKV 항원을 함유하는 Ad5 [E1-, E2b-] 벡터의 구축 및 발현의 결과를 설명한다.
Ad5 [E1-, E2b-]-CHIKV 백신은 E1, E2b, 및 E3 유전자 부위의 제거, 및 CHIKV 유전자의 삽입에 의해 변형된 아데노바이러스 혈청형 5 (Ad5) 벡터이다.
이 실시예에서, 상동 재조합-기반 접근법을 사용하여 CHIKV 구조 단백질 C, E3, E2, 6K, 및 E1 을 포함하는 CHIKV 구조 다단백질을 인코딩하는 핵산 서열 (아미노산 서열은 SEQ ID NO: 2 에 제시되어 있다) 을 Ad5 [E1-, E2b-]-기반 플랫폼 내로 클로닝하여 Ad5 [E1-, E2b-]-CHIKVstr 를 생산했다.
Ad5 [E1-, E2b-]-CHIKVstr 를 E.C7 세포에서 생산했다 (도 2). 복제-결핍성 바이러스를 E.C7 패키징 세포주에서 증식시키고, 초원심분리 또는 이온 교환 칼럼 정제에 의해 정제하고, 적정했다. 바이러스 감염 역가를 E.C7 세포 단층 상에서 플라크-형성 단위 (PFU) 로서 확인했다. VP 농도를 소듐 도데실 설페이트 (SDS) 파괴 및 260 nm 및 280 nm 에서의 분광광도측정법에 의해 확인했다.
Ad5 [E1-, E2b-]-CHIKVstr 에 의한 E.C7 세포의 감염은 CHIKV 구조 단백질의 발현을 초래했다. CHIKV 구조 단백질 발현은 항-CHIKV 항체를 이용하는 웨스턴 블롯에 의해 검출가능했다 (도 3).
실시예 2
Ad5 [E1-, E2b-]- CHIKV
str
의 다중 주입은 CHIKV-감염에 대해 보호성 면역성을 생성했다
이 실시예는 CHIKV 감염에 대해 보호성 면역성을 생성하기 위한 Ad5 [E1-, E2b-]-CHIKVstr 의 주입의 결과를 설명한다.
열 마리 (10) 마우스의 군을 각각 1 주 간격으로 2 회 109 VP 의 Ad5 [E1-, E2b-]-CHIKVstr 의 용량으로 피하 면역화했다. 대조군 마우스에게 PBS 를 주입했다. 마우스를 그 후 발바닥 내로 바이러스의 주입에 의해 치사 용량의 CHIKV 로 챌린지했다. 대조군 마우스는 7 일 내에 감염에 굴복했고 (도 4A), 중량을 손실했고 (도 4B), 발바닥에서 지속된 염증을 보였다 (도 4C). 이와 대조적으로, 백신접종된 마우스는 CHIKV 감염에서 살아남았고 (도 4A), 중량을 손실하지 않았고 (도 4B), 발바닥 염증의 신속한 해결을 보였다 (도 4C).
실시예 3
다중-표적화 Ad5 [E1-, E2b-]-CHIKV 항원 삽입물의 생산
이 실시예는 다중 CHIKV 항원을 함유하는 Ad5 [E1-, E2b-] 벡터의 구축을 설명한다.
다중 CHIKV 유전자를 함유하는 Ad5 [E1-, E2b-] 를 생산하기 위해서, 3 개의 개별 알파바이러스 항원 유전자 서열 ((1) C, E3, E2, 6K, 및 E1 유전자 ((SEQ ID NO: 1 의 뉴클레오티드 7567-11313); (2) NS 유전자 1; (3) NS 유전자 2) 을 각각 돼지 테스코바이러스-1 및 토세아 아시그나 바이러스에서 유래하는 "자가-절단" 2A 펩티드에 의해 분리한다 (도 5A) (de Felipe P and Ryan M Traffic 2004 5(8), 616-26; Holst J et al. Nature Immunol. 2008 9 :658-66 ; Kim JH et al. PloS One, 2011 6(4), e18556. Doi :10.1371/journal.pone.0018556). 2A 펩티드는 리보솜에서 번역되므로, 2A 펩티드의 마지막 2 개의 잔기 사이의 펩티드 결합은 절대로 형성되지 않아서, 1 회의 리보솜 통과 (one ribosomal pass) 에서 구별되게 발현되는 단백질을 초래한다 (도 5B). 3 개의 유전자를 분리하는 2 개의 2A 펩티드 서열의 사용은 3 개의 단백질의 근사 화학량론적 발현에서 발견된다 (도 5B).
실시예 4
단일-표적화 Ad5 [E1-, E2b-]-ONNV 백신의 생산 및 시험
이 실시예는 ONNV 항원을 함유하는 Ad5 [E1-, E2b-] 벡터의 구축, 및 벡터의 다중 주입에 의한 발현 및 보호성 면역성에 관한 시험을 설명한다.
Ad5 [E1-, E2b-]-ONNVstr 백신은 E1, E2b, 및 E3 유전자 부위의 제거, 및 상동 재조합-기반 접근법을 사용하는 ONNV 구조 다단백질을 인코딩하는 핵산 서열 (아미노산 서열은 SEQ ID NO: 5 에 제시되어 있다) 의 삽입에 의해 변형된 아데노바이러스 혈청형 5 (Ad5) 벡터이다.
Ad5 [E1-, E2b-]-ONNVstr 를 E.C7 세포에서 생산한다. 복제-결핍성 바이러스를 E.C7 패키징 세포주에서 증식시키고, 초원심분리 또는 이온 교환 칼럼 정제에 의해 정제하고, 적정한다. 바이러스 감염 역가를 E.C7 세포 단층 상에서 플라크-형성 단위 (PFU) 로서 확인한다. VP 농도를 소듐 도데실 설페이트 (SDS) 파괴 및 260 nm 및 280 nm 에서의 분광광도측정법에 의해 확인한다.
Ad5 [E1-, E2b-]-ONNVstr 에 의한 E.C7 세포의 감염의 결과로서 ONNV 구조 단백질이 발현된다. ONNV 구조 단백질 발현을 항-ONNV 항체를 이용하는 웨스턴 블롯에 의해 검출한다.
열 마리 (10) 마우스의 군을 각각 1 주 간격으로 2 회 109 VP 의 Ad5 [E1-, E2b-]-ONNVstr 의 용량으로 피하 면역화한다. 대조군 마우스에게 PBS 또는 109 VP 의 Ad5-null 을 주입한다. 마우스를 그 후 바이러스의 주입에 의해 치사 용량의 ONNV 로 챌린지한다. 백신을 주입한 마우스와 대조군 사이에서 생존율, 면역 반응, 및 중량을 비교한다.
실시예 5
단일-표적화 Ad5 [E1-, E2b-]-MAYV 백신의 생산 및 시험
이 실시예는 MAYV 항원을 함유하는 Ad5 [E1-, E2b-] 벡터의 구축 및 벡터의 다중 주입에 의한 발현 및 보호성 면역성에 관한 시험을 설명한다.
Ad5 [E1-, E2b-]-MAYVstr 백신은 E1, E2b, 및 E3 유전자 부위의 제거, 및 상동 재조합-기반 접근법을 사용하는 MAYV 구조 다단백질을 인코딩하는 핵산 서열 (아미노산 서열은 SEQ ID NO: 8 에 제시되어 있다) 의 삽입에 의해 변형된 아데노바이러스 혈청형 5 (Ad5) 벡터이다.
Ad5 [E1-, E2b-]-MAYVstr 를 E.C7 세포에서 생산한다. 복제-결핍성 바이러스를 E.C7 패키징 세포주에서 증식시키고, 초원심분리 또는 이온 교환 칼럼 정제에 의해 정제하고, 적정한다. 바이러스 감염 역가를 E.C7 세포 단층 상에서 플라크-형성 단위 (PFU) 로서 확인한다. VP 농도를 소듐 도데실 설페이트 (SDS) 파괴 및 260 nm 및 280 nm 에서의 분광광도측정법에 의해 확인한다.
Ad5 [E1-, E2b-]-MAYVstr 에 의한 E.C7 세포의 감염의 결과로서 MAYV 구조 단백질이 발현된다. MAYV 구조 단백질 발현을 항-MAYV 항체를 이용하는 웨스턴 블롯에 의해 검출한다.
열 마리 (10) 마우스의 군을 각각 1 주 간격으로 2 회 109 VP 의 Ad5 [E1-, E2b-]-MAYVstr 의 용량으로 피하 면역화한다. 대조군 마우스에게 PBS 또는 109 VP 의 Ad5-null 을 주입한다. 마우스를 그 후 바이러스의 주입에 의해 치사 용량의 MAYV 로 챌린지한다. 백신을 주입한 마우스와 대조군 사이에서 생존율, 면역 반응, 및 중량을 비교한다.
실시예 6
단일-표적화 Ad5 [E1-, E2b-]-RRV 백신의 생산 및 시험
이 실시예는 RRV 항원을 함유하는 Ad5 [E1-, E2b-] 벡터의 구축 및 벡터의 다중 주입에 의한 발현 및 보호성 면역성에 관한 시험을 설명한다.
Ad5 [E1-, E2b-]-RRVstr 백신은 E1, E2b, 및 E3 유전자 부위의 제거, 및 상동 재조합-기반 접근법을 사용하는 RRV 구조 다단백질을 인코딩하는 핵산 서열 (아미노산 서열은 SEQ ID NO: 11 에 제시되어 있다) 의 삽입에 의해 변형된 아데노바이러스 혈청형 5 (Ad5) 벡터이다.
Ad5 [E1-, E2b-]-RRVstr 를 E.C7 세포에서 생산한다. 복제-결핍성 바이러스를 E.C7 패키징 세포주에서 증식시키고, 초원심분리 또는 이온 교환 칼럼 정제에 의해 정제하고, 적정한다. 바이러스 감염 역가를 E.C7 세포 단층 상에서 플라크-형성 단위 (PFU) 로서 확인한다. VP 농도를 소듐 도데실 설페이트 (SDS) 파괴 및 260 nm 및 280 nm 에서의 분광광도측정법에 의해 확인한다.
Ad5 [E1-, E2b-]-RRVstr 에 의한 E.C7 세포의 감염의 결과로서 RRV 구조 단백질이 발현된다. RRV 구조 단백질 발현을 항-RRV 항체를 이용하는 웨스턴 블롯에 의해 검출한다.
열 마리 (10) 마우스의 군을 각각 1 주 간격으로 2 회 109 VP 의 Ad5 [E1-, E2b-]-RRVstr 의 용량으로 피하 면역화한다. 대조군 마우스에게 PBS 또는 109 VP 의 Ad5-null 을 주입한다. 마우스를 그 후 바이러스의 주입에 의해 치사 용량의 RRV 로 챌린지한다. 백신을 주입한 마우스와 대조군 사이에서 생존율, 면역 반응, 및 중량을 비교한다.
실시예 7
단일-표적화 Ad5 [E1-, E2b-]-VEEV 백신의 생산 및 시험
이 실시예는 VEEV 항원을 함유하는 Ad5 [E1-, E2b-] 벡터의 구축 및 벡터의 다중 주입에 의한 발현 및 보호성 면역성에 관한 시험을 설명한다.
Ad5 [E1-, E2b-]-VEEVstr 백신은 E1, E2b, 및 E3 유전자 부위의 제거, 및 상동 재조합-기반 접근법을 사용하는 VEEV 구조 다단백질을 인코딩하는 핵산 서열 (아미노산 서열은 SEQ ID NO: 14 에 제시되어 있다) 의 삽입에 의해 변형된 아데노바이러스 혈청형 5 (Ad5) 벡터이다.
Ad5 [E1-, E2b-]-VEEVstr 를 E.C7 세포에서 생산한다. 복제-결핍성 바이러스를 E.C7 패키징 세포주에서 증식시키고, 초원심분리 또는 이온 교환 칼럼 정제에 의해 정제하고, 적정한다. 바이러스 감염 역가를 E.C7 세포 단층 상에서 플라크-형성 단위 (PFU) 로서 확인한다. VP 농도를 소듐 도데실 설페이트 (SDS) 파괴 및 260 nm 및 280 nm 에서의 분광광도측정법에 의해 확인한다.
Ad5 [E1-, E2b-]-VEEVstr 에 의한 E.C7 세포의 감염의 결과로서 VEEV 구조 단백질이 발현된다. VEEV 구조 단백질 발현을 항-VEEV 항체를 이용하는 웨스턴 블롯에 의해 검출한다.
열 마리 (10) 마우스의 군을 각각 1 주 간격으로 2 회 109 VP 의 Ad5 [E1-, E2b-]-VEEVstr 의 용량으로 피하 면역화한다. 대조군 마우스에게 PBS 또는 109 VP 의 Ad5-null 을 주입한다. 마우스를 그 후 바이러스의 주입에 의해 치사 용량의 VEEV 로 챌린지한다. 백신을 주입한 마우스와 대조군 사이에서 생존율, 면역 반응, 및 중량을 비교한다.
실시예 8
단일-표적화 Ad5 [E1-, E2b-]-EEEV 백신의 생산 및 시험
이 실시예는 EEEV 항원을 함유하는 Ad5 [E1-, E2b-] 벡터의 구축 및 벡터의 다중 주입에 의한 발현 및 보호성 면역성에 관한 시험을 설명한다.
Ad5 [E1-, E2b-]-EEEVstr 백신은 E1, E2b, 및 E3 유전자 부위의 제거, 및 상동 재조합-기반 접근법을 사용하는 EEEV 구조 다단백질을 인코딩하는 핵산 서열 (아미노산 서열은 SEQ ID NO: 17 에 제시되어 있다) 의 삽입에 의해 변형된 아데노바이러스 혈청형 5 (Ad5) 벡터이다.
Ad5 [E1-, E2b-]-EEEVstr 를 E.C7 세포에서 생산한다. 복제-결핍성 바이러스를 E.C7 패키징 세포주에서 증식시키고, 초원심분리 또는 이온 교환 칼럼 정제에 의해 정제하고, 적정한다. 바이러스 감염 역가를 E.C7 세포 단층 상에서 플라크-형성 단위 (PFU) 로서 확인한다. VP 농도를 소듐 도데실 설페이트 (SDS) 파괴 및 260 nm 및 280 nm 에서의 분광광도측정법에 의해 확인한다.
Ad5 [E1-, E2b-]-EEEVstr 에 의한 E.C7 세포의 감염의 결과로서 EEEV 구조 단백질이 발현된다. EEEV 구조 단백질 발현을 항-EEEV 항체를 이용하는 웨스턴 블롯에 의해 검출한다.
열 마리 (10) 마우스의 군을 각각 1 주 간격으로 2 회 109 VP 의 Ad5 [E1-, E2b-]-EEEVstr 의 용량으로 피하 면역화한다. 대조군 마우스에게 PBS 또는 109 VP 의 Ad5-null 을 주입한다. 마우스를 그 후 바이러스의 주입에 의해 치사 용량의 EEEV 로 챌린지한다. 백신을 주입한 마우스와 대조군 사이에서 생존율, 면역 반응, 및 중량을 비교한다.
실시예 9
단일-표적화 Ad5 [E1-, E2b-]-WEEV 백신의 생산 및 시험
이 실시예는 WEEV 항원을 함유하는 Ad5 [E1-, E2b-] 벡터의 구축 및 벡터의 다중 주입에 의한 발현 및 보호성 면역성에 관한 시험을 설명한다.
Ad5 [E1-, E2b-]-WEEVstr 백신은 E1, E2b, 및 E3 유전자 부위의 제거, 및 상동 재조합-기반 접근법을 사용하는 WEEV 구조 다단백질을 인코딩하는 핵산 서열 (아미노산 서열은 SEQ ID NO: 20 에 제시되어 있다) 의 삽입에 의해 변형된 아데노바이러스 혈청형 5 (Ad5) 벡터이다.
Ad5 [E1-, E2b-]-WEEVstr 를 E.C7 세포에서 생산한다. 복제-결핍성 바이러스를 E.C7 패키징 세포주에서 증식시키고, 초원심분리 또는 이온 교환 칼럼 정제에 의해 정제하고, 적정한다. 바이러스 감염 역가를 E.C7 세포 단층 상에서 플라크-형성 단위 (PFU) 로서 확인한다. VP 농도를 소듐 도데실 설페이트 (SDS) 파괴 및 260 nm 및 280 nm 에서의 분광광도측정법에 의해 확인한다.
Ad5 [E1-, E2b-]-WEEVstr 에 의한 E.C7 세포의 감염의 결과로서 WEEV 구조 단백질이 발현된다. WEEV 구조 단백질 발현을 항-WEEV 항체를 이용하는 웨스턴 블롯에 의해 검출한다.
열 마리 (10) 마우스의 군을 각각 1 주 간격으로 2 회 109 VP 의 Ad5 [E1-, E2b-]-WEEVstr 의 용량으로 피하 면역화한다. 대조군 마우스에게 PBS 또는 109 VP 의 Ad5-null 을 주입한다. 마우스를 그 후 바이러스의 주입에 의해 치사 용량의 WEEV 로 챌린지한다. 백신을 주입한 마우스와 대조군 사이에서 생존율, 면역 반응, 및 중량을 비교한다.
실시예 10
마우스에서의 Ad5 [E1-, E2b-]-치쿤구니아 백신의 전임상 연구
이 실시예는 세포 매개 면역 (CMI) 반응, 세포용해 T 림프구 (CTL) 반응, 세포내 사이토카인 발현, 및 항체 분비의 평가를 포함하는, 마우스에서의 Ad5 [E1-, E2b-]-치쿤구니아 백신의 전임상 연구를 설명한다. 전임상 연구는 마우스에서의 Ad5 [E1-, E2b-]-치쿤구니아 백신의 투여, 대조군과의 비교, 및 면역 반응의 평가를 포함했다.
Ad5 [E1-, E2b-]-치쿤구니아 백신의 전임상 평가
CMI 및 CTL 반응. 마우스에서의 CMI 및 CTL 반응을 효소 결합 면역점 (ELISPOT) 어세이에 의해 평가했다. 도 6 은 ELISpot 어세이를 사용하는 면역화된 또는 대조군 마우스로부터의 비장세포에서의 CMI 반응 (IFN-γ) 및 CTL 반응 및 그랜자임 B 반응을 설명한다. C57BL/6 마우스를 1x1010 VP 의 SEQ ID NO: 1 을 포함하는 Ad5 [E1-, E2b-]-CHIK 백신으로 또는 1X1010 VP 의 Ad5 [E1-, E2b-]-null (빈 벡터 대조군) 으로 2-주 간격으로 2 회 면역화했다. 마지막 면역화 후 1 주에, 개별 마우스로부터의 비장세포를 치쿤구니아 바이러스 펩티드에 세포를 노출시킨 후의 면역 반응의 유도에 관해 시험했다. 데이타는 치쿤구니아 바이러스 펩티드의 3 개의 별개의 풀에 노출시킨 후에 106 개 비장세포 당 스팟 형성 세포 (SFC) 의 누적수를 보여준다 (치쿤구니아에 관한 펩티드 수는 어세이에서 사용하는 3 개의 별개의 풀로 분배할 수 있을 정도로 충분히 컸다 - CHIKV 펩티드 풀 1 은 펩티드 1-103 을 포함하고, CHIKV 펩티드 풀 2 는 펩티드 104-207 을 포함하고, 펩티드 풀 3 은 펩티드 208-310 을 포함한다). 부가적 비장세포를 어세이 측정 전에 음성 대조군으로서의 SIV-nef 펩티드 풀에 별개로 노출시켰다. 도 6A 는 ELISpot 어세이를 사용하여 IFN-γ 분비 SFC 에 의해 측정되는 Ad5 [E1-, E2b-]-CHIK 면역화된 및 대조군 C57BL/6 마우스에서의 CMI 반응을 설명한다. 반응의 특이성은 음성 대조군 SIV-nef 펩티드 풀에 대한 비장세포의 반응성의 결여에 의해 입증된다. 대조군 마우스와 비교하여 많은 수의 IFN-γ 분비 SFC 가 Ad5 [E1-, E2b-]-CHIK 면역화된 마우스에서 유도되었다. 도 6B 는 ELISpot 어세이를 사용하여 그랜자임 B (GR-B) 분비 SFC 에 의해 측정되는 Ad5 [E1-, E2b-]-CHIK 면역화된 및 대조군 C57BL/6 마우스에서의 CTL 반응을 설명한다. 반응의 특이성은 음성 대조군 SIV-nef 펩티드 풀에 대한 비장세포의 반응성의 결여에 의해 입증된다. 대조군 마우스와 비교하여 많은 수의 그랜자임 B 분비 SFC 가 Ad5 [E1-, E2b-]-CHIK 면역화된 마우스에서 유도되었다.
세포내 사이토카인 발현. 흐름 세포측정법 분석은 세포내 사이토카인 발현을 평가하여 측정되는 림프구 활성화의 수준을 드러냈다. 도 7 은 흐름 세포측정법에 의해 분석되는 IFN-γ 또는 IFN-γ/TNF-α 의 세포내 발현에 의해 측정되는 면역화된 또는 대조군 C57BL/6 마우스로부터의 비장세포에서의 림프구 활성화를 설명한다. C57BL/6 마우스를 1x1010 VP 의 SEQ ID NO: 1 을 포함하는 Ad5 [E1-, E2b-]-CHIK 백신으로 또는 1x1010 VP 의 Ad5 [E1-, E2b-]-null (빈 벡터 대조군) 으로 2-주 간격으로 2 회 면역화했다. 마지막 면역화 후 1 주에, 개별 마우스로부터의 비장세포를 치쿤구니아 바이러스 펩티드의 3 개의 별개의 풀에 노출시켰고 (치쿤구니아에 관한 펩티드 수는 어세이에서 사용하는 3 개의 별개의 풀로 분배할 수 있을 정도로 충분히 컸다 - CHIKV 펩티드 풀 1 은 펩티드 1-103 을 포함하고, CHIKV 펩티드 풀 2 는 펩티드 104-207 을 포함하고, 펩티드 풀 3 은 펩티드 208-310 을 포함한다), 세포내 사이토카인 발현의 유도에 관해 흐름 세포측정법에 의해 분석했다. 도 7A 는 면역화된 마우스 및 대조군 마우스로부터의 비장세포를 치쿤구니아 바이러스 펩티드의 3 개의 별개의 풀 및 대조군 (배지 및 SIV-nef 펩티드 풀) 에 노출시킨 후에 CD8+ 비장세포에서의 IFN-γ 의 세포내 발현의 흐름 세포측정법 분석에 의해 측정되는 림프구 활성화를 설명한다. 음성 대조군과 비교할 때 더 높은 백분율의 면역화된 마우스로부터의 CD8+ 비장세포가 IFN-γ 를 세포내 발현했다. 도 7B 는 면역화된 마우스 및 대조군 마우스로부터의 비장세포를 치쿤구니아 바이러스 펩티드의 3 개의 별개의 풀 및 대조군 (배지 및 SIV-nef 펩티드 풀) 에 노출시킨 후에 CD4+ 비장세포에서의 IFN-γ 의 세포내 발현의 흐름 세포측정법 분석에 의해 측정되는 림프구 활성화를 설명한다. 음성 대조군과 비교할 때 더 높은 백분율의 면역화된 마우스로부터의 CD4+ 비장세포가 IFN-γ 를 세포내 발현했다. 도 7C 는 면역화된 마우스 및 대조군 마우스로부터의 비장세포를 치쿤구니아 바이러스 펩티드의 3 개의 별개의 풀 및 대조군 (배지 및 SIV-nef 펩티드 풀) 에 노출시킨 후에 CD8+ 비장세포에서의 IFN-γ 및 TNF-α 의 세포내 발현의 흐름 세포측정법 분석에 의해 측정되는 림프구 활성화를 설명한다. 음성 대조군과 비교할 때 더 높은 백분율의 면역화된 마우스로부터의 CD8+ 비장세포가 IFN-γ 및 TNF-α 를 세포내 발현했다. 도 7D 는 면역화된 마우스 및 대조군 마우스로부터의 비장세포를 치쿤구니아 바이러스 펩티드의 3 개의 별개의 풀 및 대조군 (배지 및 SIV-nef 펩티드 풀) 에 노출시킨 후에 CD4+ 비장세포에서의 IFN-γ 및 TNF-α 의 세포내 발현의 흐름 세포측정법 분석에 의해 측정되는 림프구 활성화를 설명한다. 음성 대조군과 비교할 때 더 높은 백분율의 면역화된 마우스로부터의 CD4+ 비장세포가 IFN-γ 및 TNF-α 를 세포내 발현했다.
항원-특이적 항체 생산. 면역화된 마우스의 혈청에서 효소 결합 면역흡착 어세이 (ELISA) 에 의해 치쿤구니아-특이적 IgG 항체를 측정했다. 도 8 은 정량적 효소 결합 면역흡착 어세이 (ELISA) 에 의해 측정되는 대조군 마우스와 비교하여 면역화된 마우스에서의 항-치쿤구니아 외피 단백질-2 항체 반응을 설명한다. C57BL/6 마우스를 1x1010 VP 의 SEQ ID NO: 1 을 포함하는 Ad5 [E1-, E2b-]-CHIK 백신으로 또는 1x1010 VP 의 Ad5 [E1-, E2b-]-null (빈 벡터 대조군) 으로 2-주 간격으로 2 회 면역화했다. 마지막 면역화 후 1 주에, 마우스로부터의 혈청을 항체 반응의 유도에 관해 평가했다. 혈액을 마취 하에 볼살 열상에 의해 수집했다. 대조군 마우스와 비교하여 면역화된 마우스에서 항-치쿤구니아 특이적 항체 반응이 더 높은 수준으로 유도되었다.
실시예 11
Ad5 [E1-, E2b-]-치쿤구니아 백신에 의한 치쿤구니아 감염의 방지
이 실시예는 치쿤구니아 항원 (예를 들어, SEQ ID NO: 1 - SEQ ID NO: 3) 중 어느 하나, 또는 그의 임의의 조합이 아데노바이러스 벡터 내에 삽입된 Ad5 [E1-, E2b-] 을 포함하는 본 개시물의 임의의 Ad5 [E1-, E2b-]-치쿤구니아 백신에 의한 예방에 의하는 치쿤구니아 감염의 방지를 설명한다. Ad5 [E1-, E2b-]-치쿤구니아 백신을 단일-표적화 치쿤구니아 백신의 경우에 실시예 1 에 기재된 바와 같이 구축하거나 또는 다중-표적화 치쿤구니아 백신의 경우에 실시예 3 에 기재된 바와 같이 구축한다. Ad5 [E1-, E2b-]-치쿤구니아 백신을 대상에게 피하, 피부내, 또는 근육내 1 회 또는 2 주 마다 총 2 회 면역화로 투여한다. Ad5 [E1-, E2b-]-치쿤구니아 백신에 의한 대상의 면역화 후에 치쿤구니아 바이러스에 대한 세포성 및 체액성 면역 반응 및 치쿤구니아 바이러스에 의한 감염에 대한 보호가 유도된다. 다시 말하면, Ad5 [E1-, E2b-]-치쿤구니아 백신에 의한 예방에 의하는 면역성이 대상에게 부여된다. 대상은 인간, 비-인간 영장류, 또는 임의의 기타 비-인간 동물을 포함하는 임의의 동물이다.
실시예 12
Ad5 [E1-, E2b-]-치쿤구니아 백신 및 공동자극 분자에 의한 치쿤구니아 감염의 방지
이 실시예는 본원에 기재된 임의의 공동자극 분자와의 조합으로 치쿤구니아 항원 (예를 들어, SEQ ID NO: 1 - SEQ ID NO: 3) 중 어느 하나, 또는 그의 임의의 조합이 아데노바이러스 벡터 내에 삽입된 Ad5 [E1-, E2b-] 을 포함하는 본 개시물의 임의의 Ad5 [E1-, E2b-]-치쿤구니아 백신에 의한 예방에 의하는 치쿤구니아 감염의 방지를 설명한다. Ad5 [E1-, E2b-]-치쿤구니아 백신을 단일-표적화 치쿤구니아 백신의 경우에 실시예 1 에 기재된 바와 같이 구축하거나 또는 다중-표적화 치쿤구니아 백신의 경우에 실시예 3 에 기재된 바와 같이 구축한다. Ad5 [E1-, E2b-]-치쿤구니아 백신을 대상에게 피하, 피부내, 또는 근육내 1 회 또는 2 주 마다 총 2 회 면역화로 투여한다. Ad 백신을 백신 제형과 혼합된 톨-유사 수용체 (TLR) 작동제와 같은 공동자극 분자와 동시투여한다. Ad5 [E1-, E2b-]-치쿤구니아 백신 및 공동자극 분자의 조합에 의한 대상의 면역화 후에 치쿤구니아 바이러스에 대한 세포성 및 체액성 면역 반응 및 치쿤구니아 바이러스에 의한 감염에 대한 보호가 유도된다. 다시 말하면, Ad5 [E1-, E2b-]-치쿤구니아 백신 및 공동자극 분자에 의한 예방에 의하는 면역성이 대상에게 부여된다.
실시예 13
Ad5 [E1-, E2b-]-치쿤구니아 백신 및 면역학적 융합 파트너에 의한 치쿤구니아 감염의 방지
이 실시예는 치쿤구니아 항원 (예를 들어, SEQ ID NO: 1 - SEQ ID NO: 3) 중 어느 하나, 또는 그의 임의의 조합이 아데노바이러스 벡터 내에 삽입된 뿐만 아니라 또한 본원에 기재된 임의의 면역학적 융합 파트너가 아데노바이러스 벡터에 의해 인코딩되는 Ad5 [E1-, E2b-] 을 포함하는 본 개시물의 임의의 Ad5 [E1-, E2b-]-CHIK 백신에 의한 예방에 의하는 치쿤구니아 감염의 방지를 설명한다. Ad5 [E1-, E2b-]-CHIK 백신을 단일-표적화 치쿤구니아 백신의 경우에 실시예 1 에 기재된 바와 같이 구축하거나 또는 다중-표적화 치쿤구니아 백신의 경우에 실시예 3 에 기재된 바와 같이 구축하며 Ad 벡터가 본원에 개시된 임의의 면역학적 융합 파트너에 대해 부가적으로 인코딩하도록 한다. Ad5 [E1-, E2b-]-치쿤구니아 백신을 대상에게 피하, 피부내, 또는 근육내 1 회 또는 2 주 마다 총 2 회 면역화로 투여한다. 면역학적 융합 파트너를 포함하는 백신을 피하, 피부내, 또는 근육내 투여한다. Ad5 [E1-, E2b-]-치쿤구니아 백신-면역학적 융합 파트너 및 공동자극 분자에 의한 대상의 면역화 후에 치쿤구니아 바이러스에 대한 세포성 및 체액성 면역 반응 및 치쿤구니아 바이러스에 의한 감염에 대한 보호가 유도된다. 다시 말하면, Ad5 [E1-, E2b-]-치쿤구니아 백신-면역학적 융합 파트너에 의한 예방에 의하는 면역성이 대상에게 부여된다. 대상은 인간, 비-인간 영장류, 또는 임의의 기타 비-인간 동물을 포함하는 임의의 동물이다.
실시예 14
Ad5 [E1-, E2b-]-오니옹니옹 바이러스 (ONNV) 백신에 의한 오니옹니옹 바이러스 감염의 방지
이 실시예는 ONNV 항원 (예를 들어, SEQ ID NO: 4 - SEQ ID NO: 6) 중 어느 하나, 또는 그의 임의의 조합이 아데노바이러스 벡터 내에 삽입된 Ad5 [E1-, E2b-] 을 포함하는 본 개시물의 임의의 Ad5 [E1-, E2b-]- ONNV 백신에 의한 예방에 의하는 오니옹니옹 바이러스 (ONNV) 감염의 방지를 설명한다. Ad5 [E1-, E2b-]-ONNV 백신을 단일-표적화 ONNV 백신의 경우에 실시예 1 로부터 적합하게 조정하여 또는 실시예 4 에 기재된 바와 같이 구축하거나 또는 다중-표적화 ONNV 백신의 경우에 실시예 3 으로부터 적합하게 조정하여 구축한다. Ad5 [E1-, E2b-]-ONNV 백신을 대상에게 피하, 피부내, 또는 근육내 1 회 또는 2 주 마다 총 2 회 면역화로 투여한다. Ad5 [E1-, E2b-]-ONNV 백신에 의한 대상의 면역화 후에 ONNV 바이러스에 대한 세포성 및 체액성 면역 반응 및 ONNV 바이러스에 의한 감염에 대한 보호가 유도된다. 다시 말하면, Ad5 [E1-, E2b-]-ONNV 백신에 의한 예방에 의하는 면역성이 대상에게 부여된다. 대상은 인간, 비-인간 영장류, 또는 임의의 기타 비-인간 동물을 포함하는 임의의 동물이다.
실시예 15
Ad5 [E1-, E2b-]-로스 리버 바이러스 (RRV) 백신에 의한 로스 리버 바이러스 감염의 방지
이 실시예는 RRV 항원 (예를 들어, SEQ ID NO: 10 - SEQ ID NO: 12) 중 어느 하나, 또는 그의 임의의 조합이 아데노바이러스 벡터 내에 삽입된 Ad5 [E1-, E2b-] 을 포함하는 본 개시물의 임의의 Ad5 [E1-, E2b-]-RRV 백신에 의한 예방에 의하는 로스 리버 바이러스 (RRV) 감염의 방지를 설명한다. Ad5 [E1-, E2b-]-RRV 백신을 단일-표적화 RRV 백신의 경우에 실시예 1 로부터 적합하게 조정하여 또는 실시예 6 에 기재된 바와 같이 구축하거나 또는 다중-표적화 RRV 백신의 경우에 실시예 3 으로부터 적합하게 조정하여 구축한다. Ad5 [E1-, E2b-]-RRV 백신을 대상에게 피하, 피부내, 또는 근육내 1 회 또는 2 주 마다 총 2 회 면역화로 투여한다. Ad5 [E1-, E2b-]-RRV 백신에 의한 대상의 면역화 후에 RRV 바이러스에 대한 세포성 및 체액성 면역 반응 및 RRV 바이러스에 의한 감염에 대한 보호가 유도된다. 다시 말하면, Ad5 [E1-, E2b-]-RRV 백신에 의한 예방에 의하는 면역성이 대상에게 부여된다. 대상은 인간, 비-인간 영장류, 또는 임의의 기타 비-인간 동물을 포함하는 임의의 동물이다.
실시예 16
Ad5 [E1-, E2b-]-마야로 열 바이러스 (MAYV) 백신에 의한 마야로 열 바이러스 감염의 방지
이 실시예는 MAYV 항원 (예를 들어, SEQ ID NO: 7 - SEQ ID NO: 9) 중 어느 하나, 또는 그의 임의의 조합이 아데노바이러스 벡터 내에 삽입된 Ad5 [E1-, E2b-] 을 포함하는 본 개시물의 임의의 Ad5 [E1-, E2b-]-MAYV 백신에 의한 예방에 의하는 마야로 열 바이러스 (MAYV) 감염의 방지를 설명한다. Ad5 [E1-, E2b-]-MAYV 백신을 단일-표적화 MAYV 백신의 경우에 실시예 1 로부터 적합하게 조정하여 또는 실시예 5 에 기재된 바와 같이 구축하거나 또는 다중-표적화 MAYV 백신의 경우에 실시예 3 으로부터 적합하게 조정하여 구축한다. Ad5 [E1-, E2b-]-MAYV 백신을 대상에게 피하, 피부내, 또는 근육내 1 회 또는 2 주 마다 총 2 회 면역화로 투여한다. Ad5 [E1-, E2b-]-MAYV 백신에 의한 대상의 면역화 후에 MAYV 바이러스에 대한 세포성 및 체액성 면역 반응 및 MAYV 바이러스에 의한 감염에 대한 보호가 유도된다. 다시 말하면, Ad5 [E1-, E2b-]-MAYV 백신에 의한 예방에 의하는 면역성이 대상에게 부여된다. 대상은 인간, 비-인간 영장류, 또는 임의의 기타 비-인간 동물을 포함하는 임의의 동물이다.
실시예 17
Ad5 [E1-, E2b-]-베네수엘라 말 뇌염 바이러스 (VEEV) 백신에 의한 베네수엘라 말 뇌염 바이러스 감염의 방지
이 실시예는 VEEV 항원 (예를 들어, SEQ ID NO: 13 - SEQ ID NO: 15) 중 어느 하나, 또는 그의 임의의 조합이 아데노바이러스 벡터 내에 삽입된 Ad5 [E1-, E2b-] 을 포함하는 본 개시물의 임의의 Ad5 [E1-, E2b-]-VEEV 백신에 의한 예방에 의하는 베네수엘라 말 뇌염 바이러스 (VEEV) 감염의 방지를 설명한다. Ad5 [E1-, E2b-]-VEEV 백신을 단일-표적화 VEEV 백신의 경우에 실시예 1 로부터 적합하게 조정하여 또는 실시예 7 에 기재된 바와 같이 구축하거나 또는 다중-표적화 VEEV 백신의 경우에 실시예 3 으로부터 적합하게 조정하여 구축한다. Ad5 [E1-, E2b-]-VEEV 백신을 대상에게 피하, 피부내, 또는 근육내 1 회 또는 2 주 마다 총 2 회 면역화로 투여한다. Ad5 [E1-, E2b-]-VEEV 백신에 의한 대상의 면역화 후에 VEEV 바이러스에 대한 세포성 및 체액성 면역 반응 및 VEEV 바이러스에 의한 감염에 대한 보호가 유도된다. 다시 말하면, Ad5 [E1-, E2b-]-VEEV 백신에 의한 예방에 의하는 면역성이 대상에게 부여된다. 대상은 인간, 비-인간 영장류, 또는 임의의 기타 비-인간 동물을 포함하는 임의의 동물이다.
실시예 18
Ad5 [E1-, E2b-]- 서부 말 뇌척수염 바이러스 (WEEV) 백신에 의한 서부 말 뇌척수염 바이러스 감염의 방지
이 실시예는 WEEV 항원 (예를 들어, SEQ ID NO: 19 - SEQ ID NO: 21) 중 어느 하나, 또는 그의 임의의 조합이 아데노바이러스 벡터 내에 삽입된 Ad5 [E1-, E2b-] 을 포함하는 본 개시물의 임의의 Ad5 [E1-, E2b-]-WEEV 백신에 의한 예방에 의하는 서부 말 뇌척수염 바이러스 (WEEV) 감염의 방지를 설명한다. Ad5 [E1-, E2b-]-WEEV 백신을 단일-표적화 WEEV 백신의 경우에 실시예 1 로부터 적합하게 조정하여 또는 실시예 9 에 기재된 바와 같이 구축하거나 또는 다중-표적화 WEEV 백신의 경우에 실시예 3 으로부터 적합하게 조정하여 구축한다. Ad5 [E1-, E2b-]-WEEV 백신을 대상에게 피하, 피부내, 또는 근육내 1 회 또는 2 주 마다 총 2 회 면역화로 투여한다. Ad5 [E1-, E2b-]-WEEV 백신에 의한 대상의 면역화 후에 WEEV 바이러스에 대한 세포성 및 체액성 면역 반응 및 WEEV 바이러스에 의한 감염에 대한 보호가 유도된다. 다시 말하면, Ad5 [E1-, E2b-]-WEEV 백신에 의한 예방에 의하는 면역성이 대상에게 부여된다. 대상은 인간, 비-인간 영장류, 또는 임의의 기타 비-인간 동물을 포함하는 임의의 동물이다.
실시예 19
Ad5 [E1-, E2b-]-동부 말 뇌염 바이러스 (EEEV) 백신에 의한 동부 말 뇌염 바이러스 감염의 방지
이 실시예는 EEEV 항원 (예를 들어, SEQ ID NO: 16 - SEQ ID NO: 18) 중 어느 하나, 또는 그의 임의의 조합이 아데노바이러스 벡터 내에 삽입된 Ad5 [E1-, E2b-] 을 포함하는 본 개시물의 임의의 Ad5 [E1-, E2b-]-EEEV 백신에 의한 예방에 의하는 동부 말 뇌염 바이러스 (EEEV) 감염의 방지를 설명한다. Ad5 [E1-, E2b-]-EEEV 백신을 단일-표적화 EEEV 백신의 경우에 실시예 1 로부터 적합하게 조정하여 또는 실시예 8 에 기재된 바와 같이 구축하거나 또는 다중-표적화 EEEV 백신의 경우에 실시예 3 으로부터 적합하게 조정하여 구축한다. Ad5 [E1-, E2b-]-EEEV 백신을 대상에게 피하, 피부내, 또는 근육내 1 회 또는 2 주 마다 총 2 회 면역화로 투여한다. Ad5 [E1-, E2b-]- EEEV 백신에 의한 대상의 면역화 후에 EEEV 바이러스에 대한 세포성 및 체액성 면역 반응 및 EEEV 바이러스에 의한 감염에 대한 보호가 유도된다. 다시 말하면, Ad5 [E1-, E2b-]-EEEV 백신에 의한 예방에 의하는 면역성이 대상에게 부여된다. 대상은 인간, 비-인간 영장류, 또는 임의의 기타 비-인간 동물을 포함하는 임의의 동물이다.
실시예 20
Ad5 [E1-, E2b-]-알파바이러스 백신에 의한 알파바이러스 감염의 방지
이 실시예는 임의의 Ad5 [E1-, E2b-]-알파바이러스 백신에 의한 예방에 의하는 알파바이러스 감염의 방지를 설명한다. Ad5 [E1-, E2b-]-알파바이러스 백신은 하기의 임의의 조합으로 구성된다: 실시예 15 에 기재된 바와 같은 단일-표적화 또는 다중-표적화 Ad5 [E1, E2b]-ONNV 벡터, 실시예 11 에 기재된 바와 같은 단일-표적화 또는 다중-표적화 Ad5 [E1, E2b]-CHIK 벡터, 실시예 16 에 기재된 바와 같은 단일-표적화 또는 다중-표적화 Ad5 [E1, E2b]-RRV 벡터, 실시예 17 에 기재된 바와 같은 단일-표적화 또는 다중-표적화 Ad5 [E1, E2b]-MAYV 벡터, 실시예 18 에 기재된 바와 같은 단일-표적화 또는 다중-표적화 Ad5 [E1, E2b]-VEEV 벡터, 실시예 19 에 기재된 바와 같은 단일-표적화 또는 다중-표적화 Ad5 [E1, E2b]-WEEV 벡터, 실시예 20 에 기재된 바와 같은 단일-표적화 또는 다중-표적화 Ad5 [E1, E2b]-RRV 벡터. 대안적으로, Ad5 [E1-, E2b-]-알파바이러스 백신은 상이한 알파바이러스로부터의 적어도 2 개의 항원의 임의의 조합이 아데노바이러스 벡터 내에 삽입된 Ad5 [E1-, E2b-] 로 구성된다. 예를 들어, 적어도 2 개의 항원은 ONNV 항원 (예를 들어, SEQ ID NO: 4 - SEQ ID NO: 6 중 어느 하나), CHIK 항원 (예를 들어, SEQ ID NO: 1 - SEQ ID NO: 3 중 어느 하나), EEEV 항원 (예를 들어, SEQ ID NO: 16 - SEQ ID NO: 18 중 어느 하나), WEEV 항원 (예를 들어, SEQ ID NO: 19 - SEQ ID NO: 21 중 어느 하나), VEEV 항원 (예를 들어, SEQ ID NO: 13 - SEQ ID NO: 15 중 어느 하나), MAYV 항원 (예를 들어, SEQ ID NO: 7 - SEQ ID NO: 9 중 어느 하나), 및/또는 RRV 항원 (예를 들어, SEQ ID NO: 10 - SEQ ID NO: 12 중 어느 하나) 의 임의의 조합으로 구성된다. Ad5 [E1-, E2b-]-알파바이러스 백신을 대상에게 피하, 피부내, 또는 근육내 1 회 또는 2 주 마다 총 2 회 면역화로 투여한다. Ad5 [E1-, E2b-]-알파바이러스 백신에 의한 대상의 면역화 후에 알파바이러스에 대한 세포성 및 체액성 면역 반응 및 알파바이러스에 의한 감염에 대한 보호가 유도된다. 다시 말하면, Ad5 [E1-, E2b-]-알파바이러스 백신에 의한 예방에 의하는 면역성이 대상에게 부여된다. 대상은 인간, 비-인간 영장류, 또는 임의의 기타 비-인간 동물을 포함하는 임의의 동물이다.
본 발명의 바람직한 구현예가 본 명세서에 표시되고 기술되었지만, 이러한 구현예는 단지 예로서 제공된다는 것은 당업자에게 자명할 것이다. 수많은 변이, 변화, 및 교체가 이제 본 발명을 벗어나지 않고 당업자에게 일어날 수 있다. 본원에 기재된 본 발명의 구현예의 다양한 대안이 본 발명을 실시하는데 적용될 수 있다는 것을 이해해야 한다. 하기 청구항은 본 발명의 범주를 정의하며 이들 청구항 및 그들 균등물의 범주 내인 방법 및 구조를 그에 의해 포괄하고자 한다.
SEQUENCE LISTING
<110> ETUBICS CORPORATION
<120> COMPOSITIONS AND METHODS FOR ALPHAVIRUS VACCINATION
<130> 39891-725.601
<140>
<141>
<150> 62/363,136
<151> 2016-07-15
<160> 119
<170> PatentIn version 3.5
<210> 1
<211> 11826
<212> DNA
<213> Chikungunya virus
<400> 1
atggctgcgt gagacacacg tagcctacca gtttcttact gctctactct gcaaagcaag 60
agattaagaa cccatcatgg atcctgtgta cgtggacata gacgctgaca gcgccttttt 120
gaaggccctg caacgtgcgt accccatgtt tgaggtggaa cctaggcagg tcacaccgaa 180
tgaccatgct aatgctagag cgttctcgca tctagctata aaactaatag agcaggaaat 240
tgatcccgac tcaaccatcc tggatattgg tagtgcgcca gcaaggagga tgatgtcgga 300
caggaagtac cactgcgttt gcccgatgcg cagtgcagaa gatcccgaga gactcgccaa 360
ttatgcgaga aagctagcat ctgccgcagg aaaagtcctg gacagaaaca tctctggaaa 420
gatcggggac ttacaagcag taatggccgt gccagacacg gagacgccaa cattctgctt 480
acacacagat gtatcatgta gacagagagc agacgtcgcg atataccaag acgtctatgc 540
tgtacacgca cccacgtcgc tataccacca ggcgattaaa ggggtccgat tggcgtactg 600
ggtagggttt gacacaaccc cgttcatgta caatgccatg gcgggtgcct acccctcata 660
ctcgacaaat tgggcagatg agcaggtact gaaggctaag aacataggat tatgttcaac 720
agacctgacg gaaggtagac gaggcaaatt gtctattatg agaggaaaaa agctagaacc 780
gtgcgaccgt gtgctgttct cagtagggtc aacgctctac ccggaaagcc gtaagctact 840
taagagctgg cacctaccat cggtgttcca tttaaagggc aagctcagct tcacatgccg 900
ctgtgataca gtggtttcgt gcgaaggcta cgtcgttaag agaataacga tgagcccagg 960
cctttacgga aaaaccacag ggtatgcggt aacccaccac gcagacggat tcctgatgtg 1020
caagaccacc gacacggttg acggcgaaag agtgtcattc tcggtgtgca cgtacgtgcc 1080
ggcgaccatt tgtgatcaaa tgaccggcat ccttgctaca gaagtcacgc cggaggatgc 1140
acagaagctg ttggtggggc tgaaccagag aatagtggtt aacggcagaa cgcaacggaa 1200
tacgaacacc atgaaaaact atatgattcc cgtggtcgcc caagccttca gtaagtgggc 1260
aaaggagtgc cggaaagaca tggaagatga aaaactcctg ggggtcagag aaagaacact 1320
gacctgctgc tgtctatggg catttaagaa gcagaaaaca cacacggtct acaagaggcc 1380
tgatacccag tcaattcaga aggttcaggc cgagtttgac agctttgtgg taccgagcct 1440
gtggtcgtcc gggttgtcaa tcccgttgag gactagaatc aaatggttgt taagcaaggt 1500
gccaaaaacc gacctgaccc catacagcgg ggacgcccaa gaagcccggg acgcagaaaa 1560
agaagcagag gaagaacgag aagcagaact gactcttgaa gccctaccac cccttcaggc 1620
agcacaggaa gatgttcagg tcgaaatcga cgtggaacag cttgaggaca gagcgggtgc 1680
aggaataata gagactccga gaggagctat caaagttact gcccaaccaa cagaccacgt 1740
cgtgggagag tacttggttc tttccccgca gaccgtacta cgtagccaaa agcttagcct 1800
gattcacgct ttggcggagc aagtgaagac gtgcacgcac agcggacgag cagggaggta 1860
tgcggtcgaa gcgtacgacg gcagagtcct agtgccctca ggctacgcaa tctcgcctga 1920
agacttccag agcctaagcg aaagcgcaac gatggtgtac aacgaaagag agttcgtaaa 1980
cagaaagcta caccatattg cgatgcatgg accagccctg aacaccgacg aagagtcgta 2040
tgagctggtg agggcagaga ggacagaaca cgagtacgtc tacgacgtgg accagagaag 2100
atgctgtaag aaggaagaag ctgcaggact ggtactggtg ggcgacttga ctaatccgcc 2160
ctaccacgaa ttcgcatatg aagggctaaa aatccgccct gcctgcccat acaaaattgc 2220
agtcatagga gtcttcggag taccaggatc tggcaagtca gctattatca agaacctagt 2280
taccaggcaa gacctggtga ctagcggaaa gaaagaaaac tgccaagaaa tcaccaccga 2340
cgtgatgaga cagagaggtc tagagatatc tgcacgtacg gttgactcgc tgctcttgaa 2400
tggatgtaac agaccagtcg acgtgttgta cgtagacgag gcgtttgcgt gccactctgg 2460
aacgttactt gcattgatcg ccttggtgag accaagacag aaagttgtac tttgtggtga 2520
cccgaagcag tgcggcttct tcaatatgat gcagatgaaa gtcaactata atcacaacat 2580
ctgcacccaa gtgtaccaca aaagtatctc caggcggtgt acactgcctg tgactgccat 2640
tgtgtcatcg ttgcattacg aaggcaaaat gcgcactacg aatgagtaca acaagccgat 2700
tgtagtggac actacaggct caacaaaacc tgaccctgga gatctcgtgt taacgtgctt 2760
cagaggatgg gttaaacaac tgcaaattga ctatcgtgga cacgaggtca tgacagcagc 2820
cgcatcccaa gggttaacca gaaaaggagt ttacgcagtt aggcaaaaag ttaacgaaaa 2880
cccgctttat gcatcaacgt cagagcacgt caacgtactc ctaacgcgta cggaaggtaa 2940
actggtatgg aagacactct ccggtgaccc gtggataaag acgctgcaga acccaccgaa 3000
aggaaacttc aaagcaacta ttaaggagtg ggaggtggag catgcatcaa taatggcggg 3060
catctgcagt caccaaatga cctttgatac attccaaaac aaagccaacg tttgttgggc 3120
taagagtttg gtccctatcc tcgaaacagc ggggataaaa ctaaacgaca ggcagtggtc 3180
ccagataatt caagccttca aagaagacaa agcatattca cccgaagtag ccctgaatga 3240
aatatgcacg cgcatgtatg gggtggatct agacagcggg ctattttcta aaccgttggt 3300
gtctgtgtat tacgcggata accactggga taataggcct ggagggaaga tgttcggatt 3360
caaccccgag gcagcatcca ttctagaaag aaagtatcca tttacaaaag ggaagtggaa 3420
catcaacaag cagatctgcg tgactaccag gaggatagaa gacttcaacc ctaccaccaa 3480
cattataccg gccaacagga gactaccaca ctcattagtg gccgaacacc gcccagtaaa 3540
aggggaaaga atggaatggc tggttaacaa gataaacggc caccacgtgc tcctggtcag 3600
tggctgtagc cttgcactgc ctactaagag agtcacttgg gtagcgccac taggtgtccg 3660
cggagcggac tatacataca acctagagtt gggtctgcca gcaacgcttg gtaggtatga 3720
cctagtggtc ataaacatcc acacaccttt tcgcatacac cattatcaac agtgcgtaga 3780
ccacgcaatg aaactgcaaa tgctcggggg tgactcattg agactgctca aaccgggtgg 3840
ctctctattg atcagagcat atggttacgc agatagaacc agtgaacgag tcatctgcgt 3900
attgggacgc aagtttagat catctagagc gttgaaacca ccatgtgtca ccagcaacac 3960
tgagatgttt tttctattca gcaactttga caatggcaga aggaatttca caactcatgt 4020
catgaacaat caactgaatg cagcctttgt aggacaggcc acccgagcag gatgtgcacc 4080
gtcgtaccgg gtaaaacgca tggatatcgc gaagaacgat gaagagtgcg tagtcaacgc 4140
cgccaaccct cgcgggttac caggtgacgg tgtttgcaag gcagtataca aaaaatggcc 4200
ggagtccttt aagaacagtg caacaccagt gggaaccgca aaaacagtca tgtgcggtac 4260
gtatccagta atccacgccg ttggaccaaa cttctctaat tattcggagt ctgaagggga 4320
ccgagaattg gcggctgcct atcgagaagt cgcaaaggag gtaactagac tgggagtaaa 4380
tagtgtagct atacctctcc tctccacagg tgtatactca ggagggaaag acaggctgac 4440
ccagtcactg aaccacctct ttacagccat ggactcgacg gatgcagacg tggtcatcta 4500
ctgccgcgac aaagaatggg agaagaaaat atctgaggcc atacagatgc ggacccaagt 4560
ggagctgctg gatgagcaca tctccataga ctgcgatgtt gttcgcgtgc accctgacag 4620
cagcttggca ggcagaaaag gatacagcac cacggaaggc gcactgtact catatctaga 4680
agggacccgt tttcaccaaa cggcagtgga tatggcagag atatatacta tgtggccaaa 4740
gcaaacagag gccaacgagc aagtttgcct atatgccctg ggggaaagta ttgaatcgat 4800
caggcagaaa tgcccggtgg atgatgcaga tgcatcatct cccccgaaaa ctgtcccgtg 4860
cctctgccgt tacgccatga caccagaacg cgttacccga cttcgcatga accatgtcac 4920
aagcataatt gtgtgttctt cgtttcccct tccaaagtac aaaatagaag gagtgcaaaa 4980
agtcaaatgc tccaaggtaa tgctatttga ccacaacgtg ccatcgcgcg taagtccaag 5040
ggaatacaga ccttcccagg agtctgtaca ggaagcgagt acgaccacgt cactgacgca 5100
tagccaattc gatctaagcg ttgacggcaa gatactgccc gtcccgtcag acctggatgc 5160
tgacgcccca gccctagaac cagcccttga cgacggggcg atacacacgt tgccatctgc 5220
aaccggaaac cttgcggccg tgtctgactg ggtaatgagc accgtacctg tcgcgccgcc 5280
cagaagaagg cgagggagaa acctgactgt gacatgcgac gagagagaag ggaatataac 5340
acccatggct agcgtccgat tctttagggc agagctgtgt ccagtcgtac aagaaacagc 5400
ggagacgcgt gacacagcta tgtctcttca ggcaccgccg agtaccgcca cggaactgag 5460
tcacccgccg atctccttcg gtgcaccaag cgagacgttc cccatcacat ttggggactt 5520
caacgaagga gaaatcgaaa gcttgtcttc tgagctacta actttcggag acttcctacc 5580
cggagaagtg gatgatttga cagatagcga ctggtccacg tgctcagaca cggacgacga 5640
gttacgacta gacagggcag gtgggtatat attctcgtcg gacactggtc caggtcattt 5700
acaacagaag tcagtacgcc agtcagtgct gccggtgaac accctggagg aagtccacga 5760
ggagaagtgt tacccaccta agctggatga agcaaaggag caactactac ttaagaaact 5820
ccaggagagt gcatccatgg ccaacagaag caggtatcag tcgcgcaaag tagaaaacat 5880
gaaagcaaca atcatccaga gactaaagag aggctgtaga ttatacttaa tgtcagagac 5940
cccaaaagtc cctacctacc ggaccacata tccggcgcct gtgtactcgc ctccgattaa 6000
cgtccgactg tccaaccccg agtccgcagt ggcagcatgc aatgagttct tggctagaaa 6060
ctatccaact gtttcatcat accaaatcac cgacgagtat gatgcatatc tagacatggt 6120
ggacgggtcg gagagttgtc tggaccgagc gacattcaat ccgtcaaaac ttaggagcta 6180
cccaaaacag cacgcttacc acgcgccctc catcagaagc gctgtaccgt ccccattcca 6240
gaacacacta cagaatgtac tggcagcagc cacgaaaaga aactgcaacg tcacacagat 6300
gagggaatta cccactttgg actcagcagt attcaacgtg gagtgtttca aaaaattcgc 6360
atgcaaccaa gaatactggg aagaatttgc tgccagccct atcaggataa caactgagaa 6420
tttaacaacc tatgttacta aactaaaggg gccaaaagca gcagcgctat ttgcaaaaac 6480
ccataatctg ctgccactgc aggaagtgcc aatggatagg ttcacagtag acatgaaaag 6540
ggatgtgaag gtgactcctg gtacaaagca cacagaggaa agacctaagg tacaggttat 6600
acaggcggct gaacccttgg caacagcata cctatgtggg attcacagag agctggttag 6660
gaggctgaac gccgtcctcc tacccaatgt acatacacta tttgacatgt ctgccgagga 6720
tttcgatgcc atcatagccg cacactttaa gccaggagac actgttttag aaacggacat 6780
agcctccttt gataagagcc aagatgattc acttgcgctt actgctttaa tgctgttaga 6840
ggatttaggg gtggatcact ccctgttgga cttgatagag gctgctttcg gagagatttc 6900
cagctgtcat ctaccgacag gtacgcgctt caagttcggc gccatgatga aatctggtat 6960
gttcctaact ctgttcgtca acacactgct aaatatcacc atcgccagcc gagtgctgga 7020
agatcgtctg acaaaatccg cgtgcgcagc cttcatcggc gacgacaaca taatacatgg 7080
agtcgtctcc gatgaattga tggcagccag atgcgccact tggatgaaca tggaagtgaa 7140
gatcatagat gcagttgtat cccagaaagc cccttacttt tgtggagggt ttatactgca 7200
cgatatcgtg acaggaacag cttgcagagt ggcagacccg ctaaaaaggc tatttaaact 7260
gggcaaaccg ctagcggcag gtgacgaaca agatgaggat agaagacgag cgctggctga 7320
cgaagtggtc agatggcaac gaacagggct aattgatgag ttggagaaag cggtatactc 7380
taggtatgaa gtgcagggta tatcagttgt ggtaatgtcc atggccacct ttgcaagctc 7440
cagatccaac ttcgagaagc tcagaggacc cgtcgtaact ttgtacggcg gtcctaaata 7500
ggtacgcact acagctacct attttgcaga agccgacagt aagtacctaa acactaatca 7560
gctacaatgg agttcatccc aacccaaact ttttacaaca ggaggtacca gcctcgaccc 7620
tggactccgc gccctactat ccaagtcatc aggcccagac cgcgcccgca gaggcaagct 7680
gggcaacttg cccagctgat ctcagcagtt aataaactga caatgcgcgc ggtaccccaa 7740
cagaagccac gcaagaatcg gaagaataag aagcaaaagc aaaagcagca ggcgccacaa 7800
aacaacacaa accaaaagaa gcagccacct aaaaagaaac cagctcaaaa gaaaaagaag 7860
ccgggccgca gagagaggat gtgcatgaaa atcgaaaatg actgtatttt cgaagtcaag 7920
cacgaaggta aggtaacagg ttacgcgtgc ttggtggggg acaaagtaat gaaaccagca 7980
cacgtaaagg ggaccatcga taacgcggac ctggccaaat tggcctttaa gcggtcatct 8040
aagtacgacc ttgaatgcgc gcagataccc gtgcacatga agtccgacgc ttcgaagttc 8100
acccatgaga aaccggaggg gtactacaac tggcaccacg gagcagtaca gtactcagga 8160
ggccggttca ccatccctac aggtgcgggc aaaccagggg acagcggtag accgatcttc 8220
gacaacaagg gacgcgtggt ggccatagtc ttaggaggag ctaatgaagg agcccgtaca 8280
gccctctcag tggtgacctg gaataaagac attgtcacta aaatcacccc tgagggagcc 8340
gaagagtgga gtcttgccat cccagttatg tgcctgttgg caaataccac gttcccctgc 8400
tcccagcccc cttgcatacc ctgctgctac gaaaaggaac cggaggaaac cctacgcatg 8460
cttgaggaca acgtcatgag acctgggtac tatcagctgc tacaagcatc attaacatgt 8520
tctccccacc gccagcgacg cagcaccaag gacaacttca atgtctataa agccacaaga 8580
ccatacctag ctcactgtcc cgactgtgga gaagggcact cgtgccatag tcccgtagca 8640
ctagaacgca tcagaaatga agcgacagac gggacgctga aaatccaggt ctccttgcaa 8700
attggaatag ggacggatga tagccatgat tggaccaagc tgcgttacat ggacaatcac 8760
ataccagcag acgcagggag ggccgggcta tttgtaagaa catcagcacc atgcacgatt 8820
actggaacaa tgggacactt catcctggcc cgatgtccga aaggagaaac tctgacggtg 8880
ggattcactg acagtaggaa gattagtcac tcatgtacgc acccatttca ccacgaccct 8940
cctgtgatag gccgggaaaa attccattcc cgaccgcagc acggtaaaga gctaccttgc 9000
agcacgtacg tgcagagcaa cgccgcaact gccgaggaga tagaggtaca catgccccca 9060
gacacccctg atcgcacatt gctgtcacaa cagtccggca acgtaaagat cacagtcaat 9120
agtcagacgg tgcggtataa gtgtaattgc ggtggctcaa atgaaggact aataactaca 9180
gataaagtga ttaataactg caaggttgat caatgtcatg ccgcggtcac caatcacaaa 9240
aagtggcagt ataactcccc tctggtcccg cgtaacgctg aactcgggga ccgaaaagga 9300
aaaattcaca tcccgtttcc gctggcaaat gtaacatgca tggtgcctaa agcaaggaac 9360
cccaccgtga cgtacgggaa aaaccaagtc atcatgctac tgtatcctga ccacccaaca 9420
ctcctgtcct accggagtat gggagaagaa ccaaactatc aagaagagtg ggtgacgcac 9480
aagaaggagg tcgtgctaac cgtgccgact gaagggctcg aggttacgtg gggcaacaac 9540
gagccgtata agtattggcc gcagttatct gcaaacggta cagcccacgg ccacccgcat 9600
gagataatct tgtactatta tgagctgtac cctactatga ctgtagtagt tgtgtcagtg 9660
gcctcgttca tactcctgtc gatggtgggt atggcagtgg ggatgtgcat gtgtgcacga 9720
cgcagatgca tcacaccata cgaactgaca ccaggagcta ccgtcccttt cctgcttagc 9780
ctaatatgct gcatcagaac agctaaagcg gccacatacc aagaggctgc ggtatacctg 9840
tggaacgagc agcaaccttt gttttggcta caagccctta ttccgctggc agccctgatt 9900
gtcctatgca actgtctgag actcttacca tgctgttgta aaacgttggc ttttttagcc 9960
gtaatgagca tcggtgccca cactgtgagc gcgtacgaac acgtaacagt gatcccgaac 10020
acggtgggag taccgtataa gactctagtc aacagaccgg gctacagccc catggtactg 10080
gagatggagc tactgtcagt cactttggag ccaacgctat cgcttgatta catcacgtgc 10140
gaatacaaaa ccgtcatccc gtctccgtac gtgaaatgct gcggtacagc agagtgcaag 10200
gacaaaaacc tacctgacta cagctgtaag gtcttcaccg gcgtctaccc atttatgtgg 10260
ggcggcgcct actgcttctg cgacgctgaa aacacgcaat tgagcgaagc acatgtggag 10320
aagtccgaat catgcaaaac agaatttgca tcagcataca gggctcatac cgcatccgca 10380
tcagctaagc tccgcgtcct ttaccaagga aataacatca ctgtaactgc ctatgcaaac 10440
ggcgaccatg ccgtcacagt taaggacgcc aaattcattg tggggccaat gtcttcagcc 10500
tggacacctt ttgacaacaa aatcgtggtg tacaaaggtg acgtttacaa catggactac 10560
ccgccctttg gcgcaggaag accaggacaa tttggcgata tccaaagtcg cacgcctgag 10620
agcaaagacg tctatgctaa cacacaactg gtactgcaga gaccggctgc gggtacggta 10680
cacgtgccat actctcaggc accatctggc tttaagtatt ggttaaaaga acgaggggcg 10740
tcgctacagc acacagcacc atttggctgc caaatagcaa caaacccggt aagagcgatg 10800
aactgcgccg tagggaacat gcccatctcc atcgacatac cggatgcggc cttcactagg 10860
gtcgtcgacg cgccctcttt aacggacatg tcatgcgagg taccagcctg cacccattcc 10920
tcagactttg ggggcgtcgc cattattaaa tatgcagtca gcaagaaagg caagtgtgcg 10980
gtgcattcga tgaccaacgc cgtcactatc cgggaagctg agatagaagt tgaagggaat 11040
tctcagctgc aaatctcttt ctcgacggcc ttggccagcg ccgaattccg cgtacaagtc 11100
tgttctacac aagtacactg tgcagccgag tgccaccctc cgaaggacca catagtcaac 11160
tacccggcgt cacataccac cctcggggtc caggacattt ccgctacggc gatgtcatgg 11220
gtgcagaaga tcacgggagg tgtgggactg gttgtcgctg ttgcagcact gattctaatc 11280
gtggtgctat gcgtgtcgtt cagcaggcac taacttgacg actaagcatg aaggtatatg 11340
tgtcccctaa gagacacacc gtatatagct aataatctgt agatcaaagg gctatataac 11400
ccctgaatag taacaaaata caaaatcact aaaaattata aaaaaaaaaa aaaaaaaaca 11460
gaaaaatata taaataggta tacgtgtccc ctaagagaca cattgtatgt aggtgataag 11520
tatagatcaa agggccgaac aacccctgaa tagtaacaaa atataaaaat taataaaaat 11580
cataaaatag aaaaaccata aacagaagta gttcaaaggg ctataaaaac ccctgaatag 11640
taacaaaaca taaaactaat aaaaatcaaa tgaataccat aattggcaaa cggaagagat 11700
gtaggtactt aagcttccta aaagcagccg aactcacttt gagatgtagg catagcatac 11760
cgaactcttc cacgattctc cgaacccaca gggacgtagg agatgttatt ttgtttttaa 11820
tatttc 11826
<210> 2
<211> 1248
<212> PRT
<213> Chikungunya virus
<400> 2
Met Glu Phe Ile Pro Thr Gln Thr Phe Tyr Asn Arg Arg Tyr Gln Pro
1 5 10 15
Arg Pro Trp Thr Pro Arg Pro Thr Ile Gln Val Ile Arg Pro Arg Pro
20 25 30
Arg Pro Gln Arg Gln Ala Gly Gln Leu Ala Gln Leu Ile Ser Ala Val
35 40 45
Asn Lys Leu Thr Met Arg Ala Val Pro Gln Gln Lys Pro Arg Lys Asn
50 55 60
Arg Lys Asn Lys Lys Gln Lys Gln Lys Gln Gln Ala Pro Gln Asn Asn
65 70 75 80
Thr Asn Gln Lys Lys Gln Pro Pro Lys Lys Lys Pro Ala Gln Lys Lys
85 90 95
Lys Lys Pro Gly Arg Arg Glu Arg Met Cys Met Lys Ile Glu Asn Asp
100 105 110
Cys Ile Phe Glu Val Lys His Glu Gly Lys Val Thr Gly Tyr Ala Cys
115 120 125
Leu Val Gly Asp Lys Val Met Lys Pro Ala His Val Lys Gly Thr Ile
130 135 140
Asp Asn Ala Asp Leu Ala Lys Leu Ala Phe Lys Arg Ser Ser Lys Tyr
145 150 155 160
Asp Leu Glu Cys Ala Gln Ile Pro Val His Met Lys Ser Asp Ala Ser
165 170 175
Lys Phe Thr His Glu Lys Pro Glu Gly Tyr Tyr Asn Trp His His Gly
180 185 190
Ala Val Gln Tyr Ser Gly Gly Arg Phe Thr Ile Pro Thr Gly Ala Gly
195 200 205
Lys Pro Gly Asp Ser Gly Arg Pro Ile Phe Asp Asn Lys Gly Arg Val
210 215 220
Val Ala Ile Val Leu Gly Gly Ala Asn Glu Gly Ala Arg Thr Ala Leu
225 230 235 240
Ser Val Val Thr Trp Asn Lys Asp Ile Val Thr Lys Ile Thr Pro Glu
245 250 255
Gly Ala Glu Glu Trp Ser Leu Ala Ile Pro Val Met Cys Leu Leu Ala
260 265 270
Asn Thr Thr Phe Pro Cys Ser Gln Pro Pro Cys Ile Pro Cys Cys Tyr
275 280 285
Glu Lys Glu Pro Glu Glu Thr Leu Arg Met Leu Glu Asp Asn Val Met
290 295 300
Arg Pro Gly Tyr Tyr Gln Leu Leu Gln Ala Ser Leu Thr Cys Ser Pro
305 310 315 320
His Arg Gln Arg Arg Ser Thr Lys Asp Asn Phe Asn Val Tyr Lys Ala
325 330 335
Thr Arg Pro Tyr Leu Ala His Cys Pro Asp Cys Gly Glu Gly His Ser
340 345 350
Cys His Ser Pro Val Ala Leu Glu Arg Ile Arg Asn Glu Ala Thr Asp
355 360 365
Gly Thr Leu Lys Ile Gln Val Ser Leu Gln Ile Gly Ile Gly Thr Asp
370 375 380
Asp Ser His Asp Trp Thr Lys Leu Arg Tyr Met Asp Asn His Ile Pro
385 390 395 400
Ala Asp Ala Gly Arg Ala Gly Leu Phe Val Arg Thr Ser Ala Pro Cys
405 410 415
Thr Ile Thr Gly Thr Met Gly His Phe Ile Leu Ala Arg Cys Pro Lys
420 425 430
Gly Glu Thr Leu Thr Val Gly Phe Thr Asp Ser Arg Lys Ile Ser His
435 440 445
Ser Cys Thr His Pro Phe His His Asp Pro Pro Val Ile Gly Arg Glu
450 455 460
Lys Phe His Ser Arg Pro Gln His Gly Lys Glu Leu Pro Cys Ser Thr
465 470 475 480
Tyr Val Gln Ser Asn Ala Ala Thr Ala Glu Glu Ile Glu Val His Met
485 490 495
Pro Pro Asp Thr Pro Asp Arg Thr Leu Leu Ser Gln Gln Ser Gly Asn
500 505 510
Val Lys Ile Thr Val Asn Ser Gln Thr Val Arg Tyr Lys Cys Asn Cys
515 520 525
Gly Gly Ser Asn Glu Gly Leu Ile Thr Thr Asp Lys Val Ile Asn Asn
530 535 540
Cys Lys Val Asp Gln Cys His Ala Ala Val Thr Asn His Lys Lys Trp
545 550 555 560
Gln Tyr Asn Ser Pro Leu Val Pro Arg Asn Ala Glu Leu Gly Asp Arg
565 570 575
Lys Gly Lys Ile His Ile Pro Phe Pro Leu Ala Asn Val Thr Cys Met
580 585 590
Val Pro Lys Ala Arg Asn Pro Thr Val Thr Tyr Gly Lys Asn Gln Val
595 600 605
Ile Met Leu Leu Tyr Pro Asp His Pro Thr Leu Leu Ser Tyr Arg Ser
610 615 620
Met Gly Glu Glu Pro Asn Tyr Gln Glu Glu Trp Val Thr His Lys Lys
625 630 635 640
Glu Val Val Leu Thr Val Pro Thr Glu Gly Leu Glu Val Thr Trp Gly
645 650 655
Asn Asn Glu Pro Tyr Lys Tyr Trp Pro Gln Leu Ser Ala Asn Gly Thr
660 665 670
Ala His Gly His Pro His Glu Ile Ile Leu Tyr Tyr Tyr Glu Leu Tyr
675 680 685
Pro Thr Met Thr Val Val Val Val Ser Val Ala Ser Phe Ile Leu Leu
690 695 700
Ser Met Val Gly Met Ala Val Gly Met Cys Met Cys Ala Arg Arg Arg
705 710 715 720
Cys Ile Thr Pro Tyr Glu Leu Thr Pro Gly Ala Thr Val Pro Phe Leu
725 730 735
Leu Ser Leu Ile Cys Cys Ile Arg Thr Ala Lys Ala Ala Thr Tyr Gln
740 745 750
Glu Ala Ala Val Tyr Leu Trp Asn Glu Gln Gln Pro Leu Phe Trp Leu
755 760 765
Gln Ala Leu Ile Pro Leu Ala Ala Leu Ile Val Leu Cys Asn Cys Leu
770 775 780
Arg Leu Leu Pro Cys Cys Cys Lys Thr Leu Ala Phe Leu Ala Val Met
785 790 795 800
Ser Ile Gly Ala His Thr Val Ser Ala Tyr Glu His Val Thr Val Ile
805 810 815
Pro Asn Thr Val Gly Val Pro Tyr Lys Thr Leu Val Asn Arg Pro Gly
820 825 830
Tyr Ser Pro Met Val Leu Glu Met Glu Leu Leu Ser Val Thr Leu Glu
835 840 845
Pro Thr Leu Ser Leu Asp Tyr Ile Thr Cys Glu Tyr Lys Thr Val Ile
850 855 860
Pro Ser Pro Tyr Val Lys Cys Cys Gly Thr Ala Glu Cys Lys Asp Lys
865 870 875 880
Asn Leu Pro Asp Tyr Ser Cys Lys Val Phe Thr Gly Val Tyr Pro Phe
885 890 895
Met Trp Gly Gly Ala Tyr Cys Phe Cys Asp Ala Glu Asn Thr Gln Leu
900 905 910
Ser Glu Ala His Val Glu Lys Ser Glu Ser Cys Lys Thr Glu Phe Ala
915 920 925
Ser Ala Tyr Arg Ala His Thr Ala Ser Ala Ser Ala Lys Leu Arg Val
930 935 940
Leu Tyr Gln Gly Asn Asn Ile Thr Val Thr Ala Tyr Ala Asn Gly Asp
945 950 955 960
His Ala Val Thr Val Lys Asp Ala Lys Phe Ile Val Gly Pro Met Ser
965 970 975
Ser Ala Trp Thr Pro Phe Asp Asn Lys Ile Val Val Tyr Lys Gly Asp
980 985 990
Val Tyr Asn Met Asp Tyr Pro Pro Phe Gly Ala Gly Arg Pro Gly Gln
995 1000 1005
Phe Gly Asp Ile Gln Ser Arg Thr Pro Glu Ser Lys Asp Val Tyr
1010 1015 1020
Ala Asn Thr Gln Leu Val Leu Gln Arg Pro Ala Ala Gly Thr Val
1025 1030 1035
His Val Pro Tyr Ser Gln Ala Pro Ser Gly Phe Lys Tyr Trp Leu
1040 1045 1050
Lys Glu Arg Gly Ala Ser Leu Gln His Thr Ala Pro Phe Gly Cys
1055 1060 1065
Gln Ile Ala Thr Asn Pro Val Arg Ala Met Asn Cys Ala Val Gly
1070 1075 1080
Asn Met Pro Ile Ser Ile Asp Ile Pro Asp Ala Ala Phe Thr Arg
1085 1090 1095
Val Val Asp Ala Pro Ser Leu Thr Asp Met Ser Cys Glu Val Pro
1100 1105 1110
Ala Cys Thr His Ser Ser Asp Phe Gly Gly Val Ala Ile Ile Lys
1115 1120 1125
Tyr Ala Val Ser Lys Lys Gly Lys Cys Ala Val His Ser Met Thr
1130 1135 1140
Asn Ala Val Thr Ile Arg Glu Ala Glu Ile Glu Val Glu Gly Asn
1145 1150 1155
Ser Gln Leu Gln Ile Ser Phe Ser Thr Ala Leu Ala Ser Ala Glu
1160 1165 1170
Phe Arg Val Gln Val Cys Ser Thr Gln Val His Cys Ala Ala Glu
1175 1180 1185
Cys His Pro Pro Lys Asp His Ile Val Asn Tyr Pro Ala Ser His
1190 1195 1200
Thr Thr Leu Gly Val Gln Asp Ile Ser Ala Thr Ala Met Ser Trp
1205 1210 1215
Val Gln Lys Ile Thr Gly Gly Val Gly Leu Val Val Ala Val Ala
1220 1225 1230
Ala Leu Ile Leu Ile Val Val Leu Cys Val Ser Phe Ser Arg His
1235 1240 1245
<210> 3
<211> 2474
<212> PRT
<213> Chikungunya virus
<400> 3
Met Asp Pro Val Tyr Val Asp Ile Asp Ala Asp Ser Ala Phe Leu Lys
1 5 10 15
Ala Leu Gln Arg Ala Tyr Pro Met Phe Glu Val Glu Pro Arg Gln Val
20 25 30
Thr Pro Asn Asp His Ala Asn Ala Arg Ala Phe Ser His Leu Ala Ile
35 40 45
Lys Leu Ile Glu Gln Glu Ile Asp Pro Asp Ser Thr Ile Leu Asp Ile
50 55 60
Gly Ser Ala Pro Ala Arg Arg Met Met Ser Asp Arg Lys Tyr His Cys
65 70 75 80
Val Cys Pro Met Arg Ser Ala Glu Asp Pro Glu Arg Leu Ala Asn Tyr
85 90 95
Ala Arg Lys Leu Ala Ser Ala Ala Gly Lys Val Leu Asp Arg Asn Ile
100 105 110
Ser Gly Lys Ile Gly Asp Leu Gln Ala Val Met Ala Val Pro Asp Thr
115 120 125
Glu Thr Pro Thr Phe Cys Leu His Thr Asp Val Ser Cys Arg Gln Arg
130 135 140
Ala Asp Val Ala Ile Tyr Gln Asp Val Tyr Ala Val His Ala Pro Thr
145 150 155 160
Ser Leu Tyr His Gln Ala Ile Lys Gly Val Arg Leu Ala Tyr Trp Val
165 170 175
Gly Phe Asp Thr Thr Pro Phe Met Tyr Asn Ala Met Ala Gly Ala Tyr
180 185 190
Pro Ser Tyr Ser Thr Asn Trp Ala Asp Glu Gln Val Leu Lys Ala Lys
195 200 205
Asn Ile Gly Leu Cys Ser Thr Asp Leu Thr Glu Gly Arg Arg Gly Lys
210 215 220
Leu Ser Ile Met Arg Gly Lys Lys Leu Glu Pro Cys Asp Arg Val Leu
225 230 235 240
Phe Ser Val Gly Ser Thr Leu Tyr Pro Glu Ser Arg Lys Leu Leu Lys
245 250 255
Ser Trp His Leu Pro Ser Val Phe His Leu Lys Gly Lys Leu Ser Phe
260 265 270
Thr Cys Arg Cys Asp Thr Val Val Ser Cys Glu Gly Tyr Val Val Lys
275 280 285
Arg Ile Thr Met Ser Pro Gly Leu Tyr Gly Lys Thr Thr Gly Tyr Ala
290 295 300
Val Thr His His Ala Asp Gly Phe Leu Met Cys Lys Thr Thr Asp Thr
305 310 315 320
Val Asp Gly Glu Arg Val Ser Phe Ser Val Cys Thr Tyr Val Pro Ala
325 330 335
Thr Ile Cys Asp Gln Met Thr Gly Ile Leu Ala Thr Glu Val Thr Pro
340 345 350
Glu Asp Ala Gln Lys Leu Leu Val Gly Leu Asn Gln Arg Ile Val Val
355 360 365
Asn Gly Arg Thr Gln Arg Asn Thr Asn Thr Met Lys Asn Tyr Met Ile
370 375 380
Pro Val Val Ala Gln Ala Phe Ser Lys Trp Ala Lys Glu Cys Arg Lys
385 390 395 400
Asp Met Glu Asp Glu Lys Leu Leu Gly Val Arg Glu Arg Thr Leu Thr
405 410 415
Cys Cys Cys Leu Trp Ala Phe Lys Lys Gln Lys Thr His Thr Val Tyr
420 425 430
Lys Arg Pro Asp Thr Gln Ser Ile Gln Lys Val Gln Ala Glu Phe Asp
435 440 445
Ser Phe Val Val Pro Ser Leu Trp Ser Ser Gly Leu Ser Ile Pro Leu
450 455 460
Arg Thr Arg Ile Lys Trp Leu Leu Ser Lys Val Pro Lys Thr Asp Leu
465 470 475 480
Thr Pro Tyr Ser Gly Asp Ala Gln Glu Ala Arg Asp Ala Glu Lys Glu
485 490 495
Ala Glu Glu Glu Arg Glu Ala Glu Leu Thr Leu Glu Ala Leu Pro Pro
500 505 510
Leu Gln Ala Ala Gln Glu Asp Val Gln Val Glu Ile Asp Val Glu Gln
515 520 525
Leu Glu Asp Arg Ala Gly Ala Gly Ile Ile Glu Thr Pro Arg Gly Ala
530 535 540
Ile Lys Val Thr Ala Gln Pro Thr Asp His Val Val Gly Glu Tyr Leu
545 550 555 560
Val Leu Ser Pro Gln Thr Val Leu Arg Ser Gln Lys Leu Ser Leu Ile
565 570 575
His Ala Leu Ala Glu Gln Val Lys Thr Cys Thr His Ser Gly Arg Ala
580 585 590
Gly Arg Tyr Ala Val Glu Ala Tyr Asp Gly Arg Val Leu Val Pro Ser
595 600 605
Gly Tyr Ala Ile Ser Pro Glu Asp Phe Gln Ser Leu Ser Glu Ser Ala
610 615 620
Thr Met Val Tyr Asn Glu Arg Glu Phe Val Asn Arg Lys Leu His His
625 630 635 640
Ile Ala Met His Gly Pro Ala Leu Asn Thr Asp Glu Glu Ser Tyr Glu
645 650 655
Leu Val Arg Ala Glu Arg Thr Glu His Glu Tyr Val Tyr Asp Val Asp
660 665 670
Gln Arg Arg Cys Cys Lys Lys Glu Glu Ala Ala Gly Leu Val Leu Val
675 680 685
Gly Asp Leu Thr Asn Pro Pro Tyr His Glu Phe Ala Tyr Glu Gly Leu
690 695 700
Lys Ile Arg Pro Ala Cys Pro Tyr Lys Ile Ala Val Ile Gly Val Phe
705 710 715 720
Gly Val Pro Gly Ser Gly Lys Ser Ala Ile Ile Lys Asn Leu Val Thr
725 730 735
Arg Gln Asp Leu Val Thr Ser Gly Lys Lys Glu Asn Cys Gln Glu Ile
740 745 750
Thr Thr Asp Val Met Arg Gln Arg Gly Leu Glu Ile Ser Ala Arg Thr
755 760 765
Val Asp Ser Leu Leu Leu Asn Gly Cys Asn Arg Pro Val Asp Val Leu
770 775 780
Tyr Val Asp Glu Ala Phe Ala Cys His Ser Gly Thr Leu Leu Ala Leu
785 790 795 800
Ile Ala Leu Val Arg Pro Arg Gln Lys Val Val Leu Cys Gly Asp Pro
805 810 815
Lys Gln Cys Gly Phe Phe Asn Met Met Gln Met Lys Val Asn Tyr Asn
820 825 830
His Asn Ile Cys Thr Gln Val Tyr His Lys Ser Ile Ser Arg Arg Cys
835 840 845
Thr Leu Pro Val Thr Ala Ile Val Ser Ser Leu His Tyr Glu Gly Lys
850 855 860
Met Arg Thr Thr Asn Glu Tyr Asn Lys Pro Ile Val Val Asp Thr Thr
865 870 875 880
Gly Ser Thr Lys Pro Asp Pro Gly Asp Leu Val Leu Thr Cys Phe Arg
885 890 895
Gly Trp Val Lys Gln Leu Gln Ile Asp Tyr Arg Gly His Glu Val Met
900 905 910
Thr Ala Ala Ala Ser Gln Gly Leu Thr Arg Lys Gly Val Tyr Ala Val
915 920 925
Arg Gln Lys Val Asn Glu Asn Pro Leu Tyr Ala Ser Thr Ser Glu His
930 935 940
Val Asn Val Leu Leu Thr Arg Thr Glu Gly Lys Leu Val Trp Lys Thr
945 950 955 960
Leu Ser Gly Asp Pro Trp Ile Lys Thr Leu Gln Asn Pro Pro Lys Gly
965 970 975
Asn Phe Lys Ala Thr Ile Lys Glu Trp Glu Val Glu His Ala Ser Ile
980 985 990
Met Ala Gly Ile Cys Ser His Gln Met Thr Phe Asp Thr Phe Gln Asn
995 1000 1005
Lys Ala Asn Val Cys Trp Ala Lys Ser Leu Val Pro Ile Leu Glu
1010 1015 1020
Thr Ala Gly Ile Lys Leu Asn Asp Arg Gln Trp Ser Gln Ile Ile
1025 1030 1035
Gln Ala Phe Lys Glu Asp Lys Ala Tyr Ser Pro Glu Val Ala Leu
1040 1045 1050
Asn Glu Ile Cys Thr Arg Met Tyr Gly Val Asp Leu Asp Ser Gly
1055 1060 1065
Leu Phe Ser Lys Pro Leu Val Ser Val Tyr Tyr Ala Asp Asn His
1070 1075 1080
Trp Asp Asn Arg Pro Gly Gly Lys Met Phe Gly Phe Asn Pro Glu
1085 1090 1095
Ala Ala Ser Ile Leu Glu Arg Lys Tyr Pro Phe Thr Lys Gly Lys
1100 1105 1110
Trp Asn Ile Asn Lys Gln Ile Cys Val Thr Thr Arg Arg Ile Glu
1115 1120 1125
Asp Phe Asn Pro Thr Thr Asn Ile Ile Pro Ala Asn Arg Arg Leu
1130 1135 1140
Pro His Ser Leu Val Ala Glu His Arg Pro Val Lys Gly Glu Arg
1145 1150 1155
Met Glu Trp Leu Val Asn Lys Ile Asn Gly His His Val Leu Leu
1160 1165 1170
Val Ser Gly Cys Ser Leu Ala Leu Pro Thr Lys Arg Val Thr Trp
1175 1180 1185
Val Ala Pro Leu Gly Val Arg Gly Ala Asp Tyr Thr Tyr Asn Leu
1190 1195 1200
Glu Leu Gly Leu Pro Ala Thr Leu Gly Arg Tyr Asp Leu Val Val
1205 1210 1215
Ile Asn Ile His Thr Pro Phe Arg Ile His His Tyr Gln Gln Cys
1220 1225 1230
Val Asp His Ala Met Lys Leu Gln Met Leu Gly Gly Asp Ser Leu
1235 1240 1245
Arg Leu Leu Lys Pro Gly Gly Ser Leu Leu Ile Arg Ala Tyr Gly
1250 1255 1260
Tyr Ala Asp Arg Thr Ser Glu Arg Val Ile Cys Val Leu Gly Arg
1265 1270 1275
Lys Phe Arg Ser Ser Arg Ala Leu Lys Pro Pro Cys Val Thr Ser
1280 1285 1290
Asn Thr Glu Met Phe Phe Leu Phe Ser Asn Phe Asp Asn Gly Arg
1295 1300 1305
Arg Asn Phe Thr Thr His Val Met Asn Asn Gln Leu Asn Ala Ala
1310 1315 1320
Phe Val Gly Gln Ala Thr Arg Ala Gly Cys Ala Pro Ser Tyr Arg
1325 1330 1335
Val Lys Arg Met Asp Ile Ala Lys Asn Asp Glu Glu Cys Val Val
1340 1345 1350
Asn Ala Ala Asn Pro Arg Gly Leu Pro Gly Asp Gly Val Cys Lys
1355 1360 1365
Ala Val Tyr Lys Lys Trp Pro Glu Ser Phe Lys Asn Ser Ala Thr
1370 1375 1380
Pro Val Gly Thr Ala Lys Thr Val Met Cys Gly Thr Tyr Pro Val
1385 1390 1395
Ile His Ala Val Gly Pro Asn Phe Ser Asn Tyr Ser Glu Ser Glu
1400 1405 1410
Gly Asp Arg Glu Leu Ala Ala Ala Tyr Arg Glu Val Ala Lys Glu
1415 1420 1425
Val Thr Arg Leu Gly Val Asn Ser Val Ala Ile Pro Leu Leu Ser
1430 1435 1440
Thr Gly Val Tyr Ser Gly Gly Lys Asp Arg Leu Thr Gln Ser Leu
1445 1450 1455
Asn His Leu Phe Thr Ala Met Asp Ser Thr Asp Ala Asp Val Val
1460 1465 1470
Ile Tyr Cys Arg Asp Lys Glu Trp Glu Lys Lys Ile Ser Glu Ala
1475 1480 1485
Ile Gln Met Arg Thr Gln Val Glu Leu Leu Asp Glu His Ile Ser
1490 1495 1500
Ile Asp Cys Asp Val Val Arg Val His Pro Asp Ser Ser Leu Ala
1505 1510 1515
Gly Arg Lys Gly Tyr Ser Thr Thr Glu Gly Ala Leu Tyr Ser Tyr
1520 1525 1530
Leu Glu Gly Thr Arg Phe His Gln Thr Ala Val Asp Met Ala Glu
1535 1540 1545
Ile Tyr Thr Met Trp Pro Lys Gln Thr Glu Ala Asn Glu Gln Val
1550 1555 1560
Cys Leu Tyr Ala Leu Gly Glu Ser Ile Glu Ser Ile Arg Gln Lys
1565 1570 1575
Cys Pro Val Asp Asp Ala Asp Ala Ser Ser Pro Pro Lys Thr Val
1580 1585 1590
Pro Cys Leu Cys Arg Tyr Ala Met Thr Pro Glu Arg Val Thr Arg
1595 1600 1605
Leu Arg Met Asn His Val Thr Ser Ile Ile Val Cys Ser Ser Phe
1610 1615 1620
Pro Leu Pro Lys Tyr Lys Ile Glu Gly Val Gln Lys Val Lys Cys
1625 1630 1635
Ser Lys Val Met Leu Phe Asp His Asn Val Pro Ser Arg Val Ser
1640 1645 1650
Pro Arg Glu Tyr Arg Pro Ser Gln Glu Ser Val Gln Glu Ala Ser
1655 1660 1665
Thr Thr Thr Ser Leu Thr His Ser Gln Phe Asp Leu Ser Val Asp
1670 1675 1680
Gly Lys Ile Leu Pro Val Pro Ser Asp Leu Asp Ala Asp Ala Pro
1685 1690 1695
Ala Leu Glu Pro Ala Leu Asp Asp Gly Ala Ile His Thr Leu Pro
1700 1705 1710
Ser Ala Thr Gly Asn Leu Ala Ala Val Ser Asp Trp Val Met Ser
1715 1720 1725
Thr Val Pro Val Ala Pro Pro Arg Arg Arg Arg Gly Arg Asn Leu
1730 1735 1740
Thr Val Thr Cys Asp Glu Arg Glu Gly Asn Ile Thr Pro Met Ala
1745 1750 1755
Ser Val Arg Phe Phe Arg Ala Glu Leu Cys Pro Val Val Gln Glu
1760 1765 1770
Thr Ala Glu Thr Arg Asp Thr Ala Met Ser Leu Gln Ala Pro Pro
1775 1780 1785
Ser Thr Ala Thr Glu Leu Ser His Pro Pro Ile Ser Phe Gly Ala
1790 1795 1800
Pro Ser Glu Thr Phe Pro Ile Thr Phe Gly Asp Phe Asn Glu Gly
1805 1810 1815
Glu Ile Glu Ser Leu Ser Ser Glu Leu Leu Thr Phe Gly Asp Phe
1820 1825 1830
Leu Pro Gly Glu Val Asp Asp Leu Thr Asp Ser Asp Trp Ser Thr
1835 1840 1845
Cys Ser Asp Thr Asp Asp Glu Leu Arg Leu Asp Arg Ala Gly Gly
1850 1855 1860
Tyr Ile Phe Ser Ser Asp Thr Gly Pro Gly His Leu Gln Gln Lys
1865 1870 1875
Ser Val Arg Gln Ser Val Leu Pro Val Asn Thr Leu Glu Glu Val
1880 1885 1890
His Glu Glu Lys Cys Tyr Pro Pro Lys Leu Asp Glu Ala Lys Glu
1895 1900 1905
Gln Leu Leu Leu Lys Lys Leu Gln Glu Ser Ala Ser Met Ala Asn
1910 1915 1920
Arg Ser Arg Tyr Gln Ser Arg Lys Val Glu Asn Met Lys Ala Thr
1925 1930 1935
Ile Ile Gln Arg Leu Lys Arg Gly Cys Arg Leu Tyr Leu Met Ser
1940 1945 1950
Glu Thr Pro Lys Val Pro Thr Tyr Arg Thr Thr Tyr Pro Ala Pro
1955 1960 1965
Val Tyr Ser Pro Pro Ile Asn Val Arg Leu Ser Asn Pro Glu Ser
1970 1975 1980
Ala Val Ala Ala Cys Asn Glu Phe Leu Ala Arg Asn Tyr Pro Thr
1985 1990 1995
Val Ser Ser Tyr Gln Ile Thr Asp Glu Tyr Asp Ala Tyr Leu Asp
2000 2005 2010
Met Val Asp Gly Ser Glu Ser Cys Leu Asp Arg Ala Thr Phe Asn
2015 2020 2025
Pro Ser Lys Leu Arg Ser Tyr Pro Lys Gln His Ala Tyr His Ala
2030 2035 2040
Pro Ser Ile Arg Ser Ala Val Pro Ser Pro Phe Gln Asn Thr Leu
2045 2050 2055
Gln Asn Val Leu Ala Ala Ala Thr Lys Arg Asn Cys Asn Val Thr
2060 2065 2070
Gln Met Arg Glu Leu Pro Thr Leu Asp Ser Ala Val Phe Asn Val
2075 2080 2085
Glu Cys Phe Lys Lys Phe Ala Cys Asn Gln Glu Tyr Trp Glu Glu
2090 2095 2100
Phe Ala Ala Ser Pro Ile Arg Ile Thr Thr Glu Asn Leu Thr Thr
2105 2110 2115
Tyr Val Thr Lys Leu Lys Gly Pro Lys Ala Ala Ala Leu Phe Ala
2120 2125 2130
Lys Thr His Asn Leu Leu Pro Leu Gln Glu Val Pro Met Asp Arg
2135 2140 2145
Phe Thr Val Asp Met Lys Arg Asp Val Lys Val Thr Pro Gly Thr
2150 2155 2160
Lys His Thr Glu Glu Arg Pro Lys Val Gln Val Ile Gln Ala Ala
2165 2170 2175
Glu Pro Leu Ala Thr Ala Tyr Leu Cys Gly Ile His Arg Glu Leu
2180 2185 2190
Val Arg Arg Leu Asn Ala Val Leu Leu Pro Asn Val His Thr Leu
2195 2200 2205
Phe Asp Met Ser Ala Glu Asp Phe Asp Ala Ile Ile Ala Ala His
2210 2215 2220
Phe Lys Pro Gly Asp Thr Val Leu Glu Thr Asp Ile Ala Ser Phe
2225 2230 2235
Asp Lys Ser Gln Asp Asp Ser Leu Ala Leu Thr Ala Leu Met Leu
2240 2245 2250
Leu Glu Asp Leu Gly Val Asp His Ser Leu Leu Asp Leu Ile Glu
2255 2260 2265
Ala Ala Phe Gly Glu Ile Ser Ser Cys His Leu Pro Thr Gly Thr
2270 2275 2280
Arg Phe Lys Phe Gly Ala Met Met Lys Ser Gly Met Phe Leu Thr
2285 2290 2295
Leu Phe Val Asn Thr Leu Leu Asn Ile Thr Ile Ala Ser Arg Val
2300 2305 2310
Leu Glu Asp Arg Leu Thr Lys Ser Ala Cys Ala Ala Phe Ile Gly
2315 2320 2325
Asp Asp Asn Ile Ile His Gly Val Val Ser Asp Glu Leu Met Ala
2330 2335 2340
Ala Arg Cys Ala Thr Trp Met Asn Met Glu Val Lys Ile Ile Asp
2345 2350 2355
Ala Val Val Ser Gln Lys Ala Pro Tyr Phe Cys Gly Gly Phe Ile
2360 2365 2370
Leu His Asp Ile Val Thr Gly Thr Ala Cys Arg Val Ala Asp Pro
2375 2380 2385
Leu Lys Arg Leu Phe Lys Leu Gly Lys Pro Leu Ala Ala Gly Asp
2390 2395 2400
Glu Gln Asp Glu Asp Arg Arg Arg Ala Leu Ala Asp Glu Val Val
2405 2410 2415
Arg Trp Gln Arg Thr Gly Leu Ile Asp Glu Leu Glu Lys Ala Val
2420 2425 2430
Tyr Ser Arg Tyr Glu Val Gln Gly Ile Ser Val Val Val Met Ser
2435 2440 2445
Met Ala Thr Phe Ala Ser Ser Arg Ser Asn Phe Glu Lys Leu Arg
2450 2455 2460
Gly Pro Val Val Thr Leu Tyr Gly Gly Pro Lys
2465 2470
<210> 4
<211> 11881
<212> DNA
<213> O'nyong nyong virus
<400> 4
atggctgcgt gagacacacg tagcctacca gtttcttact gctctactct gcttagcaag 60
agacttgaga acccatcatg gatcccgtgt acgtggacat agacgccgac agcgcctttt 120
taaaggccct gcagcgtgcg taccccatgt ttgaggtgga accaaggcag gtcacaccga 180
atgaccatgc caatgctaga gcattctcgc atctagctat aaaactaata gagcaggaaa 240
ttgatcccga ctcaaccatc ctggacatag gcagcgcgcc agcaaggagg atgatgtcgg 300
ataggaagta ccactgcgtt tgccctatgc gcagcgcaga agaccctgag agactcgcca 360
actacgcgag aaaactagca tctgccgcag gaaaagtctt ggacagaaac atctccgaaa 420
aaattggaga tctacaagca gtaatggctg taccagacgc agaaacgccc acattctgct 480
tgcacactga cgtctcatgt agacaaaggg cggacgtcgc tatataccag gatgtctacg 540
ccgtgcatgc accaacatcg ctgtaccacc aggcgattaa aggagtccgt gtagcatact 600
ggatagggtt tgatacaacc ccgttcatgt ataatgccat ggcaggtgca tacccctcgt 660
actcgacaaa ctgggcagat gagcaggtgc tgaaggcaaa gaacatagga ttatgttcaa 720
cagacctgac ggaaggtaga cgaggtaaat tgtctatcat gagaggaaaa aagatgaagc 780
catgtgaccg cgtactgttc tcagtcgggt caacgcttta cccggagagc cgtaagcttc 840
ttaagagttg gcacttacct tcagtgttcc atctaaaagg gaagctcagc ttcacgtgcc 900
gctgtgatac agtggtttcg tgtgaaggct atgtcgttaa gagaataacg attagcccgg 960
gcctctacgg taaaaccaca gggtacgcag taacccacca tgcagacgga ttcctaatgt 1020
gcaaaacaac cgatacggta gatggcgaga gagtgtcatt ttcggtatgc acgtacgtac 1080
ccgcaaccat ttgtgatcaa atgacaggta ttcttgccac ggaggttaca ccggaggatg 1140
cacagaagct gctggtggga ctgaaccaga ggatagtggt caatggcaga acgcagagga 1200
acacgaacac aatgaagaat tacttgcttc ctgtagttgc ccaagccttc agtaagtggg 1260
caaaggaatg ccggaaagat atggaagatg aaaaactttt gggcatcaga gaaaggacac 1320
tgacatgctg ctgcctttgg gcgttcaaga agcagaagac acacacggtc tacaagaggc 1380
ctgacactca gtcaattcag aaagtcccag ccgaatttga cagctttgtg gtaccaagtc 1440
tgtggtcatc tggactgtcg atcccgctac ggaccagaat caagtggctg ctaagcaaag 1500
tgccaaagac tgatttgatc ccttacagcg gtgacgccaa agaagcccgc gacgctgaaa 1560
aagaagcaga agaagaacga gaagcggagc taactcgcga ggcactacca ccactacagg 1620
cggcacagga cgacgtccag gtcgaaattg acgtggaaca gctcgaagac agagctgggg 1680
caggaataat tgaaactcca agaggagcta tcaaagtcac tgcccaacca acagaccacg 1740
tcgtgggaga gtacttggta ctttccccgc agaccgtgtt acgaagccag aagctcagcc 1800
tgatccacgc attggcggaa caagtgaaga catgcacaca cagcggacgg gcaggaaggt 1860
acgcggtcga agcatatgac ggcagaatcc ttgtgccctc aggctatgca atatcacctg 1920
aagacttcca gagcctgagc gaaagtgcga cgatggtgta caacgaaagg gagttcgtaa 1980
ataggaaatt acaccatatc gcgttgcacg gaccagccct gaacactgac gaggagtcgt 2040
acgagctggt aagggcagaa aggacagagc atgagtacgt ctatgatgtg gaccaaagaa 2100
ggtgctgcaa gaaagaggag gcagccgggc tggtactggt cggcgacttg accaacccgc 2160
cctaccatga gttcgcatat gaagggctga gaatccgccc cgcctgccca tacaagaccg 2220
cagtaatagg ggtctttgga gtgccaggat ccggcaaatc agcaatcatt aagaacctag 2280
ttaccaggca agacctagtg accagtggaa agaaagaaaa ctgccaagaa atctccaccg 2340
acgtgatgcg acagaggaac ctggagatat ctgcacgcac ggtcgactca ctgctcttga 2400
acggatgcaa tagaccagtc gacgtgttgt acgtcgacga agcttttgcg tgccattctg 2460
gcacgctact tgctctgata gccttggtga gaccgaggca gaaagtcgtg ctatgcggtg 2520
atccgaaaca gtgcggcttc ttcaatatga tgcagatgaa agttaactac aaccataaca 2580
tctgcaccca agtgtaccat aaaagtattt ccaggcggtg tacactgcct gtgactgcca 2640
ttgtgtcctc gttgcattac gaaggcaaaa tgcgcacaac aaatgagtac aacaagccaa 2700
ttgtagtgga tactacaggc tcgacaaaac ccgaccccgg agaccttgtg ctaacatgtt 2760
tcagagggtg ggttaagcaa ctgcaaattg actatcgtgg acacgaggtc atgacagcag 2820
ctgcatctca ggggctaacc agaaaagggg tctatgccgt caggcaaaaa gttaatgaaa 2880
acccccttta cgcatcaaca tcagagcacg tgaacgtgct actgacgcgt acggaaggca 2940
aactagtatg gaagacactt tctggagacc catggataaa gacactgcag aacccgccga 3000
aaggaaattt taaagcaaca attaaggaat gggaagtgga acatgcttca ataatggcgg 3060
gtatctgtaa ccaccaagtg acctttgaca cgttccagaa taaagccaat gtctgctggg 3120
cgaagagctt agtccccatc ctagaaacag cagggataaa attaaacgac aggcagtggt 3180
cccagataat ccaggctttt aaagaagaca gagcatactc acccgaggtg gccctgaatg 3240
agatatgcac gcgcatgtac ggggtagacc tggacagcgg actgttctct aaaccactgg 3300
tgtccgtgca ttatgcggat aatcactggg acaacaggcc gggagggaag atgttcggat 3360
tcaaccccga agcggcgtcc atactggaga ggaaataccc gtttacaaaa gggaagtgga 3420
ataccaacaa gcaaatctgt gtgactacta ggaggattga agattttaac ccgaacacca 3480
acattatacc tgccaacagg agattaccgc attcattggt ggccgaacat cgcccggtaa 3540
aaggggagag gatggaatgg ttggtcaaca aaataaatgg ccaccatgtg ctcctggtca 3600
gcggctacaa cctcgttctg cccactaaga gagtcacctg ggtggcgccg ctgggcattc 3660
ggggagctga ctacacatac aacctagagt taggcctacc agcaacgctc ggtagatatg 3720
acctagtgat tataaacatc cacacaccct ttcgcataca tcattaccaa cagtgcgtgg 3780
atcacgcaat gaagctgcag atgctcggag gagactccct gagactgctc aagccgggtg 3840
gttcattact gatcagggca tacggctacg cagacagaac aagcgaacga gtagtctgcg 3900
tattgggacg caagtttcga tcatccagag cgttgaaacc gccgtgcgtc actagcaaca 3960
ccgagatgtt tttcttgttc agcaactttg ataacggcag aaggaacttt acgacgcacg 4020
taatgaacaa ccagctgaat gctgcttttg ttggtcaggc cacccgagca gggtgcgcac 4080
cgtcgtaccg ggttaaacgc atggacatcg caaagaacga tgaagagtgt gtagtcaacg 4140
ccgccaaccc tcgtgggcta ccaggcgatg gcgtctgtaa agcagtatac aaaaaatggc 4200
cggagtcctt caagaacagt gcaacaccag tgggaaccgc aaagacagtc atgtgcggta 4260
catacccggt aatccatgca gtaggaccta atttctcaaa ttactctgag tccgaaggag 4320
accgggaatt ggcagctgct taccgagaag tcgctaagga ggtgactaga ctaggagtaa 4380
acagcgtagc tataccgctc ctttccaccg gtgtgtactc tggagggaaa gacaggctga 4440
ctcagtcact aaaccacctt tttacagcat tagactcaac tgatgcagat gtggttatct 4500
actgccgcga caaggagtgg gagaagaaaa tagctgaggc catacaaatg aggacccaag 4560
tggaattact agacgaacac atctctgtag actgcgatat catccgagtg caccctgaca 4620
gcagtttggc aggtagaaaa gggtacagca ctacagaagg ttcactgtac tcctacttgg 4680
aagggacacg gttccatcag acggcagtgg acatggcaga agtatacacc atgtggccaa 4740
agcagacgga ggctaatgaa caagtttgct tgtacgcatt gggggaaagt atagaatcaa 4800
tcaggcaaaa gtgcccagtg gatgacgcag atgcatcgtc gcccccaaaa accgtcccgt 4860
gcctctgccg ttatgccatg acacccgaac gagtcaccag gcttcgtatg aaccatgtca 4920
caagcataat agtatgctca tcattccccc ttccaaagta taaaatagaa ggagtgcaga 4980
aagtcaagtg ttctaaagtg atgctgttcg accataacgt gccatcacgc gttagtccaa 5040
gggaatataa atcgcctcag gagaccgcac aagaagtaag ttcgaccacg tcactgacgc 5100
acagccaatt cgaccttagc gttgacggtg aggaactgcc cgctccgtct gacttggaag 5160
ctgacgctcc gattccggaa ccaacaccag acgacagagc ggtacttact ttgcctccca 5220
cgattgataa tttttcggct gtgtcagact gggtaatgaa taccgcgcca gtcgcaccac 5280
ccagaagaag acgtgggaaa aacttgaatg tcacctgcga cgagagagaa gggaacgtac 5340
ttcccatggc tagcgttcgg ttcttcagag cggatctgca ctccatcgta caggaaacgg 5400
cagagatacg cgatacggcc gcgtccctcc aggcgcccct gagtgtcgct acagaaccga 5460
atcaactgcc gatctcattt ggagcaccaa acgagacttt ccccataacg ttcggggatt 5520
ttgatgaagg ggagattgaa agcttgtcct ctgagttact gacctttggg gacttctcgc 5580
cgggcgaagt ggatgacctg acagacagcg actggtccac gtgttcagac acggacgacg 5640
aattatgact agatagggca ggtgggtaca tattctcatc tgacaccggc cccggccacc 5700
tgcaacagag gtctgtccgt cagacagtac tgccggtaaa taccttggag gaagttcagg 5760
aggagaaatg ttacccacct aagttggatg aagtgaaaga gcagttgtta cttaagaaac 5820
tccaggaaag tgcgtccatg gctaacagaa gcaggtacca atcccgcaaa gtagagaaca 5880
tgaaagcaac aatagtccaa aggctgaagg gtggttgcaa actttattta atgtcggaga 5940
ccccgaaagt tcctacctac cgaactacat atccggcacc agtgtactca cccccaatca 6000
atatccgact gtccaacccc gagtctgctg tggcagcgtg caatgagttc ctagcaagga 6060
actatccgac agttgcgtcg taccaaatca ccgatgagta cgatgcatac ctagacatgg 6120
tggacgggtc ggaaagttgc cttgaccggg cgacgttcaa cccatcaaag cttagaagtt 6180
atccaaaaca gcactcctac catgcaccca caatcagaag tgccgtacct tccccgttcc 6240
agaacacgct gcagaacgta ctggctgctg ccacgaaaag aaattgcaac gtcacacaga 6300
tgagagaact gcctactttg gattcagcgg tatttaatgt tgagtgcttt aaaaaatttg 6360
cgtgcaatca agaatactgg aaggaatttg ccgccagccc tattaggata acgactgaga 6420
acttgacaac ttatgtcaca aaactaaaag gaccaaaagc agcagcactg tttgccaaga 6480
cacataacct gctaccactg caggaggtgc cgatggacag gtttactgta gacatgaaaa 6540
gggacgtgaa ggtgactccg gggacgaagc acactgagga aagacctaaa gtgcaggtca 6600
tacaggcagc cgaacctttg gcaacagcat atctgtgtgg gatccacaga gagttggtca 6660
gaaggctgaa tgcagtcctt ctacctaatg tacacacgct gtttgacatg tctgccgagg 6720
actttgacgc cattattgcc gcgcacttca agccggggga cgccgtattg gaaaccgata 6780
tagcctcctt tgacaagagc caagacgact cattggcgct cactgctcta atgttgctag 6840
aggatttggg ggtggatcat cccctgttgg acttgataga ggctgccttc ggggagatct 6900
ccagctgcca cctaccgacg ggcacccgtt ttaagttcgg cgccatgatg aagtctggta 6960
tgttcctaac cctgttcgtc aacacactgc taaacatcac catagccagc cgagtgctgg 7020
aggaccgctt gacaaggtct gcgtgcgcgg ccttcatcgg cgacgacaat ataatacatg 7080
gggttgtctc tgacgaactg atggcagcaa ggtgtgctac atggatgaac atggaagtga 7140
agatcataga tgcggtcgtg tctcagaaag ccccgtactt ctgcggaggg tttatactgt 7200
atgacacagt agcaggcacg gcctgcagag tggcagaccc gctaaagcgg ctgttcaagc 7260
tgggcaaacc gctggcagcg ggagatgaac aagacgacga cagaagacgt gcactggctg 7320
acgaagtggt tagatggcaa cgaacaggac taactgatga gctagaaaaa gcggtacact 7380
ccaggtatga agtgcagggc atatctgtcg tggtaatgtc tatggccacc tttgcaagct 7440
ctagatctaa ctttgagaag ctcagaggac ccgtcgtaac cctgtacggt ggtcctaaat 7500
aggtacgcac tacagctacc tatttcgtca gaaaccaatc gcagctactt gcatacctac 7560
cagctacaat ggagttcatc ccgacgcaaa ctttctataa cagaaggtac caaccccgac 7620
cctgggcccc acgccctaca attcaagtaa ttagacctag accacgtcca cagaggcagg 7680
ctgggcaact cgcccagctg atctccgcag tcaacaaatt gaccatgcgc gcggtacctc 7740
aacagaagcc tcgcagaaat cggaaaaaca agaagcaaag gcagaagaag caggcgccgc 7800
aaaacgaccc aaagcaaaag aagcaaccac cacaaaagaa gccggctcaa aagaagaaga 7860
aaccaggccg tagggagaga atgtgcatga aaattgaaaa tgattgcatc ttcgaagtca 7920
agcatgaagg caaagtgatg ggctacgcat gcctggtggg ggataaagta atgaaaccag 7980
cacatgtgaa gggaactatc gacaatgccg atctggctaa actggccttt aagcggtcgt 8040
ctaaatacga tcttgaatgt gcacagatac cggtgcacat gaagtctgat gcctcgaagt 8100
ttacccacga gaaacccgag gggtactata actggcatca cggagcagtg cagtattcag 8160
gaggccggtt cactatcccg acgggtgcag gcaagccggg agacagcggc agaccgatct 8220
tcgacaacaa aggacgggtg gtggccatcg tcctaggagg ggccaacgaa ggtgcccgca 8280
cggccctctc cgtggtgacg tggaacaaag acatcgtcac aaaaattacc cctgagggag 8340
ccgaagagtg gagcctcgcc ctcccggtct tgtgcctgtt ggcaaacact acattcccct 8400
gctctcagcc gccttgcaca ccctgctgct acgaaaagga accggaaagc accttgcgca 8460
tgcttgagga caacgtgatg agacccggat actaccagct actaaaagca tcgctgactt 8520
gctctcccca ccgccaaaga cgcagtacta aggacaattt taatgtctat aaagccacaa 8580
gaccatatct agctcattgt cctgactgcg gagaagggca ttcgtgccac agccctatcg 8640
cattggagcg catcagaaat gaagcaacgg acggaacgct gaaaatccag gtctctttgc 8700
agatcgggat aaagacagat gacagccacg attggaccaa gctgcgctat atggatagcc 8760
atacgccagc ggacgcggag cgagccggat tgcttgtaag gacttcagca ccgtgcacga 8820
tcaccgggac catgggacac tttattctcg cccgatgccc gaaaggagag acgctgacag 8880
tgggatttac ggacagcaga aagatcagcc acacatgcac acacccgttc catcatgaac 8940
cacctgtgat aggtagggag aggttccact ctcgaccaca acatggtaaa gagttacctt 9000
gcagcacgta cgtgcagagc accgctgcca ctgctgagga gatagaggtg catatgcccc 9060
cagatactcc tgaccgcacg ctgatgacgc agcagtctgg caacgtgaag atcacagtta 9120
atgggcagac ggtgcggtac aagtgcaact gcggtggctc aaacgaggga ctgacaacca 9180
cagacaaagt gatcaataac tgcaaaattg atcagtgcca tgctgcagtc actaatcaca 9240
agaattggca atacaactcc cctttagtcc cgcgcaacgc tgaactcggg gaccgtaaag 9300
gaaagatcca catcccattc ccattggcaa acgtgacttg cagagtgcca aaagcaagaa 9360
accctacagt aacttacgga aaaaaccaag tcaccatgct gctgtatcct gaccatccga 9420
cactcttgtc ttaccgtaac atgggacagg aaccaaatta ccacgaggag tgggtgacac 9480
acaagaagga ggttaccttg accgtgccta ctgagggtct ggaggtcact tggggcaaca 9540
acgaaccata caagtactgg ccgcagatgt ctacgaacgg tactgctcat ggtcacccac 9600
atgagataat cttgtactat tatgagctgt accccactat gactgtagtc attgtgtcgg 9660
tggcctcgtt cgtgcttctg tcgatggtgg gcacagcagt gggaatgtgt gtgtgcgcac 9720
ggcgcagatg cattacacca tatgaattaa caccaggagc cactgttccc ttcctgctca 9780
gcctgctatg ctgcgtcaga acgaccaagg cggccacata ttacgaggct gcggcatatc 9840
tatggaacga acagcagccc ctgttctggt tgcaggctct tatcccgctg gccgccttga 9900
tcgtcctgtg caactgtctg aaactcttgc catgctgctg taagaccctg gcttttttag 9960
ccgtaatgag catcggtgcc cacactgtga gcgcgtacga acacgtaaca gtgatcccga 10020
acacggtggg agtaccgtat aagactcttg tcaacagacc gggttacagc cccatggtgt 10080
tggagatgga gctacaatca gtcaccttgg aaccaacact gtcacttgac tacatcacgt 10140
gcgagtacaa aactgtcatc ccctccccgt acgtgaagtg ctgtggtaca gcagagtgca 10200
aggacaagag cctaccagac tacagctgca aggtctttac tggagtctac ccatttatgt 10260
ggggcggcgc ctactgcttt tgcgacgccg aaaatacgca attgagcgag gcacatgtag 10320
agaaatctga atcttgcaaa acagagtttg catcggccta cagagcccac accgcatcgg 10380
cgtcggcgaa gctccgcgtc ctttaccaag gaaacaacat taccgtagct gcctacgcta 10440
acggtgacca tgccgtcaca gtaaaggacg ccaagtttgt cgtgggccca atgtcctccg 10500
cctggacacc ttttgacaac aaaatcgtgg tgtacaaagg cgacgtctac aacatggact 10560
acccaccttt tggcgcagga agaccaggac aatttggtga cattcaaagt cgtacaccgg 10620
aaagtaaaga cgtttatgcc aacactcagt tggtactaca gaggccagca gcaggcacgg 10680
tacatgtacc atactctcag gcaccatctg gcttcaagta ttggctgaag gaacgaggag 10740
catcgctaca gcacacggca ccgttcggtt gccagattgc gacaaacccg gtaagagctg 10800
taaattgcgc tgtggggaac ataccaattt ccatcgacat accggatgcg gcctttacta 10860
gggttgtcga tgcaccctct gtaacggaca tgtcatgcga agtaccagcc tgcactcact 10920
cctccgactt tgggggcgtc gccatcatca aatacacagc tagcaagaaa ggtaaatgtg 10980
cagtacattc gatgaccaac gccgttacca ttcgagaagc cgacgtagaa gtagagggga 11040
actcccagct gcaaatatcc ttctcaacag ccctggcaag cgccgagttt cgcgtgcaag 11100
tgtgctccac acaagtacac tgcgcagccg catgccaccc tccaaaggac cacatagtca 11160
attacccagc atcacacacc acccttgggg tccaggatat atccacaacg gcaatgtctt 11220
gggtgcagaa gattacggga ggagtaggat taattgttgc tgttgctgcc ttaattttaa 11280
ttgtggtgct atgcgtgtcg tttagcaggc actaaaccga tgataaggca cgaaataact 11340
aaatagcaaa agtagaaagt acataaccag gtatatgtgc cccttaagag gcacaatata 11400
tatagctaag cactattaga tcaaagggct atacaacccc tgaatagtaa caaaacacaa 11460
aaaccaataa aaatcataaa aagaaaaatc tcataaacag gtataagtgt cccctaagag 11520
acacattgta tgtaggtagt aagtatagat caaagggcta tattaacccc tgaatagtaa 11580
caaaacacaa aaacaataaa aactacaaaa tagaaaatct ataaacaaaa gtagttcaaa 11640
gggctacaaa acccctgaat agtaacaaaa cataaaatgt aataaaaatt aagtgtgtac 11700
ccaaaagagg tacagtaaga atcagtgaat atcacaattg gcaacgagaa gagacgtagg 11760
tatttaagct tcctaaaagc agccgaactc actttgagac gtaggcatag cataccgaac 11820
tcttccacta ttctccgaac ccacagggac gtaggagatg ttattttgtt tttaatattt 11880
c 11881
<210> 5
<211> 1248
<212> PRT
<213> O'nyong nyong virus
<400> 5
Met Glu Phe Ile Pro Thr Gln Thr Phe Tyr Asn Arg Arg Tyr Gln Pro
1 5 10 15
Arg Pro Trp Ala Pro Arg Pro Thr Ile Gln Val Ile Arg Pro Arg Pro
20 25 30
Arg Pro Gln Arg Gln Ala Gly Gln Leu Ala Gln Leu Ile Ser Ala Val
35 40 45
Asn Lys Leu Thr Met Arg Ala Val Pro Gln Gln Lys Pro Arg Arg Asn
50 55 60
Arg Lys Asn Lys Lys Gln Arg Gln Lys Lys Gln Ala Pro Gln Asn Asp
65 70 75 80
Pro Lys Gln Lys Lys Gln Pro Pro Gln Lys Lys Pro Ala Gln Lys Lys
85 90 95
Lys Lys Pro Gly Arg Arg Glu Arg Met Cys Met Lys Ile Glu Asn Asp
100 105 110
Cys Ile Phe Glu Val Lys His Glu Gly Lys Val Met Gly Tyr Ala Cys
115 120 125
Leu Val Gly Asp Lys Val Met Lys Pro Ala His Val Lys Gly Thr Ile
130 135 140
Asp Asn Ala Asp Leu Ala Lys Leu Ala Phe Lys Arg Ser Ser Lys Tyr
145 150 155 160
Asp Leu Glu Cys Ala Gln Ile Pro Val His Met Lys Ser Asp Ala Ser
165 170 175
Lys Phe Thr His Glu Lys Pro Glu Gly Tyr Tyr Asn Trp His His Gly
180 185 190
Ala Val Gln Tyr Ser Gly Gly Arg Phe Thr Ile Pro Thr Gly Ala Gly
195 200 205
Lys Pro Gly Asp Ser Gly Arg Pro Ile Phe Asp Asn Lys Gly Arg Val
210 215 220
Val Ala Ile Val Leu Gly Gly Ala Asn Glu Gly Ala Arg Thr Ala Leu
225 230 235 240
Ser Val Val Thr Trp Asn Lys Asp Ile Val Thr Lys Ile Thr Pro Glu
245 250 255
Gly Ala Glu Glu Trp Ser Leu Ala Leu Pro Val Leu Cys Leu Leu Ala
260 265 270
Asn Thr Thr Phe Pro Cys Ser Gln Pro Pro Cys Thr Pro Cys Cys Tyr
275 280 285
Glu Lys Glu Pro Glu Ser Thr Leu Arg Met Leu Glu Asp Asn Val Met
290 295 300
Arg Pro Gly Tyr Tyr Gln Leu Leu Lys Ala Ser Leu Thr Cys Ser Pro
305 310 315 320
His Arg Gln Arg Arg Ser Thr Lys Asp Asn Phe Asn Val Tyr Lys Ala
325 330 335
Thr Arg Pro Tyr Leu Ala His Cys Pro Asp Cys Gly Glu Gly His Ser
340 345 350
Cys His Ser Pro Ile Ala Leu Glu Arg Ile Arg Asn Glu Ala Thr Asp
355 360 365
Gly Thr Leu Lys Ile Gln Val Ser Leu Gln Ile Gly Ile Lys Thr Asp
370 375 380
Asp Ser His Asp Trp Thr Lys Leu Arg Tyr Met Asp Ser His Thr Pro
385 390 395 400
Ala Asp Ala Glu Arg Ala Gly Leu Leu Val Arg Thr Ser Ala Pro Cys
405 410 415
Thr Ile Thr Gly Thr Met Gly His Phe Ile Leu Ala Arg Cys Pro Lys
420 425 430
Gly Glu Thr Leu Thr Val Gly Phe Thr Asp Ser Arg Lys Ile Ser His
435 440 445
Thr Cys Thr His Pro Phe His His Glu Pro Pro Val Ile Gly Arg Glu
450 455 460
Arg Phe His Ser Arg Pro Gln His Gly Lys Glu Leu Pro Cys Ser Thr
465 470 475 480
Tyr Val Gln Ser Thr Ala Ala Thr Ala Glu Glu Ile Glu Val His Met
485 490 495
Pro Pro Asp Thr Pro Asp Arg Thr Leu Met Thr Gln Gln Ser Gly Asn
500 505 510
Val Lys Ile Thr Val Asn Gly Gln Thr Val Arg Tyr Lys Cys Asn Cys
515 520 525
Gly Gly Ser Asn Glu Gly Leu Thr Thr Thr Asp Lys Val Ile Asn Asn
530 535 540
Cys Lys Ile Asp Gln Cys His Ala Ala Val Thr Asn His Lys Asn Trp
545 550 555 560
Gln Tyr Asn Ser Pro Leu Val Pro Arg Asn Ala Glu Leu Gly Asp Arg
565 570 575
Lys Gly Lys Ile His Ile Pro Phe Pro Leu Ala Asn Val Thr Cys Arg
580 585 590
Val Pro Lys Ala Arg Asn Pro Thr Val Thr Tyr Gly Lys Asn Gln Val
595 600 605
Thr Met Leu Leu Tyr Pro Asp His Pro Thr Leu Leu Ser Tyr Arg Asn
610 615 620
Met Gly Gln Glu Pro Asn Tyr His Glu Glu Trp Val Thr His Lys Lys
625 630 635 640
Glu Val Thr Leu Thr Val Pro Thr Glu Gly Leu Glu Val Thr Trp Gly
645 650 655
Asn Asn Glu Pro Tyr Lys Tyr Trp Pro Gln Met Ser Thr Asn Gly Thr
660 665 670
Ala His Gly His Pro His Glu Ile Ile Leu Tyr Tyr Tyr Glu Leu Tyr
675 680 685
Pro Thr Met Thr Val Val Ile Val Ser Val Ala Ser Phe Val Leu Leu
690 695 700
Ser Met Val Gly Thr Ala Val Gly Met Cys Val Cys Ala Arg Arg Arg
705 710 715 720
Cys Ile Thr Pro Tyr Glu Leu Thr Pro Gly Ala Thr Val Pro Phe Leu
725 730 735
Leu Ser Leu Leu Cys Cys Val Arg Thr Thr Lys Ala Ala Thr Tyr Tyr
740 745 750
Glu Ala Ala Ala Tyr Leu Trp Asn Glu Gln Gln Pro Leu Phe Trp Leu
755 760 765
Gln Ala Leu Ile Pro Leu Ala Ala Leu Ile Val Leu Cys Asn Cys Leu
770 775 780
Lys Leu Leu Pro Cys Cys Cys Lys Thr Leu Ala Phe Leu Ala Val Met
785 790 795 800
Ser Ile Gly Ala His Thr Val Ser Ala Tyr Glu His Val Thr Val Ile
805 810 815
Pro Asn Thr Val Gly Val Pro Tyr Lys Thr Leu Val Asn Arg Pro Gly
820 825 830
Tyr Ser Pro Met Val Leu Glu Met Glu Leu Gln Ser Val Thr Leu Glu
835 840 845
Pro Thr Leu Ser Leu Asp Tyr Ile Thr Cys Glu Tyr Lys Thr Val Ile
850 855 860
Pro Ser Pro Tyr Val Lys Cys Cys Gly Thr Ala Glu Cys Lys Asp Lys
865 870 875 880
Ser Leu Pro Asp Tyr Ser Cys Lys Val Phe Thr Gly Val Tyr Pro Phe
885 890 895
Met Trp Gly Gly Ala Tyr Cys Phe Cys Asp Ala Glu Asn Thr Gln Leu
900 905 910
Ser Glu Ala His Val Glu Lys Ser Glu Ser Cys Lys Thr Glu Phe Ala
915 920 925
Ser Ala Tyr Arg Ala His Thr Ala Ser Ala Ser Ala Lys Leu Arg Val
930 935 940
Leu Tyr Gln Gly Asn Asn Ile Thr Val Ala Ala Tyr Ala Asn Gly Asp
945 950 955 960
His Ala Val Thr Val Lys Asp Ala Lys Phe Val Val Gly Pro Met Ser
965 970 975
Ser Ala Trp Thr Pro Phe Asp Asn Lys Ile Val Val Tyr Lys Gly Asp
980 985 990
Val Tyr Asn Met Asp Tyr Pro Pro Phe Gly Ala Gly Arg Pro Gly Gln
995 1000 1005
Phe Gly Asp Ile Gln Ser Arg Thr Pro Glu Ser Lys Asp Val Tyr
1010 1015 1020
Ala Asn Thr Gln Leu Val Leu Gln Arg Pro Ala Ala Gly Thr Val
1025 1030 1035
His Val Pro Tyr Ser Gln Ala Pro Ser Gly Phe Lys Tyr Trp Leu
1040 1045 1050
Lys Glu Arg Gly Ala Ser Leu Gln His Thr Ala Pro Phe Gly Cys
1055 1060 1065
Gln Ile Ala Thr Asn Pro Val Arg Ala Val Asn Cys Ala Val Gly
1070 1075 1080
Asn Ile Pro Ile Ser Ile Asp Ile Pro Asp Ala Ala Phe Thr Arg
1085 1090 1095
Val Val Asp Ala Pro Ser Val Thr Asp Met Ser Cys Glu Val Pro
1100 1105 1110
Ala Cys Thr His Ser Ser Asp Phe Gly Gly Val Ala Ile Ile Lys
1115 1120 1125
Tyr Thr Ala Ser Lys Lys Gly Lys Cys Ala Val His Ser Met Thr
1130 1135 1140
Asn Ala Val Thr Ile Arg Glu Ala Asp Val Glu Val Glu Gly Asn
1145 1150 1155
Ser Gln Leu Gln Ile Ser Phe Ser Thr Ala Leu Ala Ser Ala Glu
1160 1165 1170
Phe Arg Val Gln Val Cys Ser Thr Gln Val His Cys Ala Ala Ala
1175 1180 1185
Cys His Pro Pro Lys Asp His Ile Val Asn Tyr Pro Ala Ser His
1190 1195 1200
Thr Thr Leu Gly Val Gln Asp Ile Ser Thr Thr Ala Met Ser Trp
1205 1210 1215
Val Gln Lys Ile Thr Gly Gly Val Gly Leu Ile Val Ala Val Ala
1220 1225 1230
Ala Leu Ile Leu Ile Val Val Leu Cys Val Ser Phe Ser Arg His
1235 1240 1245
<210> 6
<211> 2473
<212> PRT
<213> O'nyong nyong virus
<400> 6
Met Asp Pro Val Tyr Val Asp Ile Asp Ala Asp Ser Ala Phe Leu Lys
1 5 10 15
Ala Leu Gln Arg Ala Tyr Pro Met Phe Glu Val Glu Pro Arg Gln Val
20 25 30
Thr Pro Asn Asp His Ala Asn Ala Arg Ala Phe Ser His Leu Ala Ile
35 40 45
Lys Leu Ile Glu Gln Glu Ile Asp Pro Asp Ser Thr Ile Leu Asp Ile
50 55 60
Gly Ser Ala Pro Ala Arg Arg Met Met Ser Asp Arg Lys Tyr His Cys
65 70 75 80
Val Cys Pro Met Arg Ser Ala Glu Asp Pro Glu Arg Leu Ala Asn Tyr
85 90 95
Ala Arg Lys Leu Ala Ser Ala Ala Gly Lys Val Leu Asp Arg Asn Ile
100 105 110
Ser Glu Lys Ile Gly Asp Leu Gln Ala Val Met Ala Val Pro Asp Ala
115 120 125
Glu Thr Pro Thr Phe Cys Leu His Thr Asp Val Ser Cys Arg Gln Arg
130 135 140
Ala Asp Val Ala Ile Tyr Gln Asp Val Tyr Ala Val His Ala Pro Thr
145 150 155 160
Ser Leu Tyr His Gln Ala Ile Lys Gly Val Arg Val Ala Tyr Trp Ile
165 170 175
Gly Phe Asp Thr Thr Pro Phe Met Tyr Asn Ala Met Ala Gly Ala Tyr
180 185 190
Pro Ser Tyr Ser Thr Asn Trp Ala Asp Glu Gln Val Leu Lys Ala Lys
195 200 205
Asn Ile Gly Leu Cys Ser Thr Asp Leu Thr Glu Gly Arg Arg Gly Lys
210 215 220
Leu Ser Ile Met Arg Gly Lys Lys Met Lys Pro Cys Asp Arg Val Leu
225 230 235 240
Phe Ser Val Gly Ser Thr Leu Tyr Pro Glu Ser Arg Lys Leu Leu Lys
245 250 255
Ser Trp His Leu Pro Ser Val Phe His Leu Lys Gly Lys Leu Ser Phe
260 265 270
Thr Cys Arg Cys Asp Thr Val Val Ser Cys Glu Gly Tyr Val Val Lys
275 280 285
Arg Ile Thr Ile Ser Pro Gly Leu Tyr Gly Lys Thr Thr Gly Tyr Ala
290 295 300
Val Thr His His Ala Asp Gly Phe Leu Met Cys Lys Thr Thr Asp Thr
305 310 315 320
Val Asp Gly Glu Arg Val Ser Phe Ser Val Cys Thr Tyr Val Pro Ala
325 330 335
Thr Ile Cys Asp Gln Met Thr Gly Ile Leu Ala Thr Glu Val Thr Pro
340 345 350
Glu Asp Ala Gln Lys Leu Leu Val Gly Leu Asn Gln Arg Ile Val Val
355 360 365
Asn Gly Arg Thr Gln Arg Asn Thr Asn Thr Met Lys Asn Tyr Leu Leu
370 375 380
Pro Val Val Ala Gln Ala Phe Ser Lys Trp Ala Lys Glu Cys Arg Lys
385 390 395 400
Asp Met Glu Asp Glu Lys Leu Leu Gly Ile Arg Glu Arg Thr Leu Thr
405 410 415
Cys Cys Cys Leu Trp Ala Phe Lys Lys Gln Lys Thr His Thr Val Tyr
420 425 430
Lys Arg Pro Asp Thr Gln Ser Ile Gln Lys Val Pro Ala Glu Phe Asp
435 440 445
Ser Phe Val Val Pro Ser Leu Trp Ser Ser Gly Leu Ser Ile Pro Leu
450 455 460
Arg Thr Arg Ile Lys Trp Leu Leu Ser Lys Val Pro Lys Thr Asp Leu
465 470 475 480
Ile Pro Tyr Ser Gly Asp Ala Lys Glu Ala Arg Asp Ala Glu Lys Glu
485 490 495
Ala Glu Glu Glu Arg Glu Ala Glu Leu Thr Arg Glu Ala Leu Pro Pro
500 505 510
Leu Gln Ala Ala Gln Asp Asp Val Gln Val Glu Ile Asp Val Glu Gln
515 520 525
Leu Glu Asp Arg Ala Gly Ala Gly Ile Ile Glu Thr Pro Arg Gly Ala
530 535 540
Ile Lys Val Thr Ala Gln Pro Thr Asp His Val Val Gly Glu Tyr Leu
545 550 555 560
Val Leu Ser Pro Gln Thr Val Leu Arg Ser Gln Lys Leu Ser Leu Ile
565 570 575
His Ala Leu Ala Glu Gln Val Lys Thr Cys Thr His Ser Gly Arg Ala
580 585 590
Gly Arg Tyr Ala Val Glu Ala Tyr Asp Gly Arg Ile Leu Val Pro Ser
595 600 605
Gly Tyr Ala Ile Ser Pro Glu Asp Phe Gln Ser Leu Ser Glu Ser Ala
610 615 620
Thr Met Val Tyr Asn Glu Arg Glu Phe Val Asn Arg Lys Leu His His
625 630 635 640
Ile Ala Leu His Gly Pro Ala Leu Asn Thr Asp Glu Glu Ser Tyr Glu
645 650 655
Leu Val Arg Ala Glu Arg Thr Glu His Glu Tyr Val Tyr Asp Val Asp
660 665 670
Gln Arg Arg Cys Cys Lys Lys Glu Glu Ala Ala Gly Leu Val Leu Val
675 680 685
Gly Asp Leu Thr Asn Pro Pro Tyr His Glu Phe Ala Tyr Glu Gly Leu
690 695 700
Arg Ile Arg Pro Ala Cys Pro Tyr Lys Thr Ala Val Ile Gly Val Phe
705 710 715 720
Gly Val Pro Gly Ser Gly Lys Ser Ala Ile Ile Lys Asn Leu Val Thr
725 730 735
Arg Gln Asp Leu Val Thr Ser Gly Lys Lys Glu Asn Cys Gln Glu Ile
740 745 750
Ser Thr Asp Val Met Arg Gln Arg Asn Leu Glu Ile Ser Ala Arg Thr
755 760 765
Val Asp Ser Leu Leu Leu Asn Gly Cys Asn Arg Pro Val Asp Val Leu
770 775 780
Tyr Val Asp Glu Ala Phe Ala Cys His Ser Gly Thr Leu Leu Ala Leu
785 790 795 800
Ile Ala Leu Val Arg Pro Arg Gln Lys Val Val Leu Cys Gly Asp Pro
805 810 815
Lys Gln Cys Gly Phe Phe Asn Met Met Gln Met Lys Val Asn Tyr Asn
820 825 830
His Asn Ile Cys Thr Gln Val Tyr His Lys Ser Ile Ser Arg Arg Cys
835 840 845
Thr Leu Pro Val Thr Ala Ile Val Ser Ser Leu His Tyr Glu Gly Lys
850 855 860
Met Arg Thr Thr Asn Glu Tyr Asn Lys Pro Ile Val Val Asp Thr Thr
865 870 875 880
Gly Ser Thr Lys Pro Asp Pro Gly Asp Leu Val Leu Thr Cys Phe Arg
885 890 895
Gly Trp Val Lys Gln Leu Gln Ile Asp Tyr Arg Gly His Glu Val Met
900 905 910
Thr Ala Ala Ala Ser Gln Gly Leu Thr Arg Lys Gly Val Tyr Ala Val
915 920 925
Arg Gln Lys Val Asn Glu Asn Pro Leu Tyr Ala Ser Thr Ser Glu His
930 935 940
Val Asn Val Leu Leu Thr Arg Thr Glu Gly Lys Leu Val Trp Lys Thr
945 950 955 960
Leu Ser Gly Asp Pro Trp Ile Lys Thr Leu Gln Asn Pro Pro Lys Gly
965 970 975
Asn Phe Lys Ala Thr Ile Lys Glu Trp Glu Val Glu His Ala Ser Ile
980 985 990
Met Ala Gly Ile Cys Asn His Gln Val Thr Phe Asp Thr Phe Gln Asn
995 1000 1005
Lys Ala Asn Val Cys Trp Ala Lys Ser Leu Val Pro Ile Leu Glu
1010 1015 1020
Thr Ala Gly Ile Lys Leu Asn Asp Arg Gln Trp Ser Gln Ile Ile
1025 1030 1035
Gln Ala Phe Lys Glu Asp Arg Ala Tyr Ser Pro Glu Val Ala Leu
1040 1045 1050
Asn Glu Ile Cys Thr Arg Met Tyr Gly Val Asp Leu Asp Ser Gly
1055 1060 1065
Leu Phe Ser Lys Pro Leu Val Ser Val His Tyr Ala Asp Asn His
1070 1075 1080
Trp Asp Asn Arg Pro Gly Gly Lys Met Phe Gly Phe Asn Pro Glu
1085 1090 1095
Ala Ala Ser Ile Leu Glu Arg Lys Tyr Pro Phe Thr Lys Gly Lys
1100 1105 1110
Trp Asn Thr Asn Lys Gln Ile Cys Val Thr Thr Arg Arg Ile Glu
1115 1120 1125
Asp Phe Asn Pro Asn Thr Asn Ile Ile Pro Ala Asn Arg Arg Leu
1130 1135 1140
Pro His Ser Leu Val Ala Glu His Arg Pro Val Lys Gly Glu Arg
1145 1150 1155
Met Glu Trp Leu Val Asn Lys Ile Asn Gly His His Val Leu Leu
1160 1165 1170
Val Ser Gly Tyr Asn Leu Val Leu Pro Thr Lys Arg Val Thr Trp
1175 1180 1185
Val Ala Pro Leu Gly Ile Arg Gly Ala Asp Tyr Thr Tyr Asn Leu
1190 1195 1200
Glu Leu Gly Leu Pro Ala Thr Leu Gly Arg Tyr Asp Leu Val Ile
1205 1210 1215
Ile Asn Ile His Thr Pro Phe Arg Ile His His Tyr Gln Gln Cys
1220 1225 1230
Val Asp His Ala Met Lys Leu Gln Met Leu Gly Gly Asp Ser Leu
1235 1240 1245
Arg Leu Leu Lys Pro Gly Gly Ser Leu Leu Ile Arg Ala Tyr Gly
1250 1255 1260
Tyr Ala Asp Arg Thr Ser Glu Arg Val Val Cys Val Leu Gly Arg
1265 1270 1275
Lys Phe Arg Ser Ser Arg Ala Leu Lys Pro Pro Cys Val Thr Ser
1280 1285 1290
Asn Thr Glu Met Phe Phe Leu Phe Ser Asn Phe Asp Asn Gly Arg
1295 1300 1305
Arg Asn Phe Thr Thr His Val Met Asn Asn Gln Leu Asn Ala Ala
1310 1315 1320
Phe Val Gly Gln Ala Thr Arg Ala Gly Cys Ala Pro Ser Tyr Arg
1325 1330 1335
Val Lys Arg Met Asp Ile Ala Lys Asn Asp Glu Glu Cys Val Val
1340 1345 1350
Asn Ala Ala Asn Pro Arg Gly Leu Pro Gly Asp Gly Val Cys Lys
1355 1360 1365
Ala Val Tyr Lys Lys Trp Pro Glu Ser Phe Lys Asn Ser Ala Thr
1370 1375 1380
Pro Val Gly Thr Ala Lys Thr Val Met Cys Gly Thr Tyr Pro Val
1385 1390 1395
Ile His Ala Val Gly Pro Asn Phe Ser Asn Tyr Ser Glu Ser Glu
1400 1405 1410
Gly Asp Arg Glu Leu Ala Ala Ala Tyr Arg Glu Val Ala Lys Glu
1415 1420 1425
Val Thr Arg Leu Gly Val Asn Ser Val Ala Ile Pro Leu Leu Ser
1430 1435 1440
Thr Gly Val Tyr Ser Gly Gly Lys Asp Arg Leu Thr Gln Ser Leu
1445 1450 1455
Asn His Leu Phe Thr Ala Leu Asp Ser Thr Asp Ala Asp Val Val
1460 1465 1470
Ile Tyr Cys Arg Asp Lys Glu Trp Glu Lys Lys Ile Ala Glu Ala
1475 1480 1485
Ile Gln Met Arg Thr Gln Val Glu Leu Leu Asp Glu His Ile Ser
1490 1495 1500
Val Asp Cys Asp Ile Ile Arg Val His Pro Asp Ser Ser Leu Ala
1505 1510 1515
Gly Arg Lys Gly Tyr Ser Thr Thr Glu Gly Ser Leu Tyr Ser Tyr
1520 1525 1530
Leu Glu Gly Thr Arg Phe His Gln Thr Ala Val Asp Met Ala Glu
1535 1540 1545
Val Tyr Thr Met Trp Pro Lys Gln Thr Glu Ala Asn Glu Gln Val
1550 1555 1560
Cys Leu Tyr Ala Leu Gly Glu Ser Ile Glu Ser Ile Arg Gln Lys
1565 1570 1575
Cys Pro Val Asp Asp Ala Asp Ala Ser Ser Pro Pro Lys Thr Val
1580 1585 1590
Pro Cys Leu Cys Arg Tyr Ala Met Thr Pro Glu Arg Val Thr Arg
1595 1600 1605
Leu Arg Met Asn His Val Thr Ser Ile Ile Val Cys Ser Ser Phe
1610 1615 1620
Pro Leu Pro Lys Tyr Lys Ile Glu Gly Val Gln Lys Val Lys Cys
1625 1630 1635
Ser Lys Val Met Leu Phe Asp His Asn Val Pro Ser Arg Val Ser
1640 1645 1650
Pro Arg Glu Tyr Lys Ser Pro Gln Glu Thr Ala Gln Glu Val Ser
1655 1660 1665
Ser Thr Thr Ser Leu Thr His Ser Gln Phe Asp Leu Ser Val Asp
1670 1675 1680
Gly Glu Glu Leu Pro Ala Pro Ser Asp Leu Glu Ala Asp Ala Pro
1685 1690 1695
Ile Pro Glu Pro Thr Pro Asp Asp Arg Ala Val Leu Thr Leu Pro
1700 1705 1710
Pro Thr Ile Asp Asn Phe Ser Ala Val Ser Asp Trp Val Met Asn
1715 1720 1725
Thr Ala Pro Val Ala Pro Pro Arg Arg Arg Arg Gly Lys Asn Leu
1730 1735 1740
Asn Val Thr Cys Asp Glu Arg Glu Gly Asn Val Leu Pro Met Ala
1745 1750 1755
Ser Val Arg Phe Phe Arg Ala Asp Leu His Ser Ile Val Gln Glu
1760 1765 1770
Thr Ala Glu Ile Arg Asp Thr Ala Ala Ser Leu Gln Ala Pro Leu
1775 1780 1785
Ser Val Ala Thr Glu Pro Asn Gln Leu Pro Ile Ser Phe Gly Ala
1790 1795 1800
Pro Asn Glu Thr Phe Pro Ile Thr Phe Gly Asp Phe Asp Glu Gly
1805 1810 1815
Glu Ile Glu Ser Leu Ser Ser Glu Leu Leu Thr Phe Gly Asp Phe
1820 1825 1830
Ser Pro Gly Glu Val Asp Asp Leu Thr Asp Ser Asp Trp Ser Thr
1835 1840 1845
Cys Ser Asp Thr Asp Asp Glu Leu Leu Asp Arg Ala Gly Gly Tyr
1850 1855 1860
Ile Phe Ser Ser Asp Thr Gly Pro Gly His Leu Gln Gln Arg Ser
1865 1870 1875
Val Arg Gln Thr Val Leu Pro Val Asn Thr Leu Glu Glu Val Gln
1880 1885 1890
Glu Glu Lys Cys Tyr Pro Pro Lys Leu Asp Glu Val Lys Glu Gln
1895 1900 1905
Leu Leu Leu Lys Lys Leu Gln Glu Ser Ala Ser Met Ala Asn Arg
1910 1915 1920
Ser Arg Tyr Gln Ser Arg Lys Val Glu Asn Met Lys Ala Thr Ile
1925 1930 1935
Val Gln Arg Leu Lys Gly Gly Cys Lys Leu Tyr Leu Met Ser Glu
1940 1945 1950
Thr Pro Lys Val Pro Thr Tyr Arg Thr Thr Tyr Pro Ala Pro Val
1955 1960 1965
Tyr Ser Pro Pro Ile Asn Ile Arg Leu Ser Asn Pro Glu Ser Ala
1970 1975 1980
Val Ala Ala Cys Asn Glu Phe Leu Ala Arg Asn Tyr Pro Thr Val
1985 1990 1995
Ala Ser Tyr Gln Ile Thr Asp Glu Tyr Asp Ala Tyr Leu Asp Met
2000 2005 2010
Val Asp Gly Ser Glu Ser Cys Leu Asp Arg Ala Thr Phe Asn Pro
2015 2020 2025
Ser Lys Leu Arg Ser Tyr Pro Lys Gln His Ser Tyr His Ala Pro
2030 2035 2040
Thr Ile Arg Ser Ala Val Pro Ser Pro Phe Gln Asn Thr Leu Gln
2045 2050 2055
Asn Val Leu Ala Ala Ala Thr Lys Arg Asn Cys Asn Val Thr Gln
2060 2065 2070
Met Arg Glu Leu Pro Thr Leu Asp Ser Ala Val Phe Asn Val Glu
2075 2080 2085
Cys Phe Lys Lys Phe Ala Cys Asn Gln Glu Tyr Trp Lys Glu Phe
2090 2095 2100
Ala Ala Ser Pro Ile Arg Ile Thr Thr Glu Asn Leu Thr Thr Tyr
2105 2110 2115
Val Thr Lys Leu Lys Gly Pro Lys Ala Ala Ala Leu Phe Ala Lys
2120 2125 2130
Thr His Asn Leu Leu Pro Leu Gln Glu Val Pro Met Asp Arg Phe
2135 2140 2145
Thr Val Asp Met Lys Arg Asp Val Lys Val Thr Pro Gly Thr Lys
2150 2155 2160
His Thr Glu Glu Arg Pro Lys Val Gln Val Ile Gln Ala Ala Glu
2165 2170 2175
Pro Leu Ala Thr Ala Tyr Leu Cys Gly Ile His Arg Glu Leu Val
2180 2185 2190
Arg Arg Leu Asn Ala Val Leu Leu Pro Asn Val His Thr Leu Phe
2195 2200 2205
Asp Met Ser Ala Glu Asp Phe Asp Ala Ile Ile Ala Ala His Phe
2210 2215 2220
Lys Pro Gly Asp Ala Val Leu Glu Thr Asp Ile Ala Ser Phe Asp
2225 2230 2235
Lys Ser Gln Asp Asp Ser Leu Ala Leu Thr Ala Leu Met Leu Leu
2240 2245 2250
Glu Asp Leu Gly Val Asp His Pro Leu Leu Asp Leu Ile Glu Ala
2255 2260 2265
Ala Phe Gly Glu Ile Ser Ser Cys His Leu Pro Thr Gly Thr Arg
2270 2275 2280
Phe Lys Phe Gly Ala Met Met Lys Ser Gly Met Phe Leu Thr Leu
2285 2290 2295
Phe Val Asn Thr Leu Leu Asn Ile Thr Ile Ala Ser Arg Val Leu
2300 2305 2310
Glu Asp Arg Leu Thr Arg Ser Ala Cys Ala Ala Phe Ile Gly Asp
2315 2320 2325
Asp Asn Ile Ile His Gly Val Val Ser Asp Glu Leu Met Ala Ala
2330 2335 2340
Arg Cys Ala Thr Trp Met Asn Met Glu Val Lys Ile Ile Asp Ala
2345 2350 2355
Val Val Ser Gln Lys Ala Pro Tyr Phe Cys Gly Gly Phe Ile Leu
2360 2365 2370
Tyr Asp Thr Val Ala Gly Thr Ala Cys Arg Val Ala Asp Pro Leu
2375 2380 2385
Lys Arg Leu Phe Lys Leu Gly Lys Pro Leu Ala Ala Gly Asp Glu
2390 2395 2400
Gln Asp Asp Asp Arg Arg Arg Ala Leu Ala Asp Glu Val Val Arg
2405 2410 2415
Trp Gln Arg Thr Gly Leu Thr Asp Glu Leu Glu Lys Ala Val His
2420 2425 2430
Ser Arg Tyr Glu Val Gln Gly Ile Ser Val Val Val Met Ser Met
2435 2440 2445
Ala Thr Phe Ala Ser Ser Arg Ser Asn Phe Glu Lys Leu Arg Gly
2450 2455 2460
Pro Val Val Thr Leu Tyr Gly Gly Pro Lys
2465 2470
<210> 7
<211> 11429
<212> DNA
<213> Mayaro virus
<400> 7
atggcgggca agtgacactt gttccgccgg acgtctctaa gctcttcctc tgcattgcaa 60
gagtttacca ctcagtatgt cgaaagtctt tgtagatatc gaggccgaga gcccgttttt 120
aaaatcacta cagagagcgt ttccagcatt tgaagtggaa gcacagcagg ttacaccaaa 180
tgaccatgct aacgccagag cattctcgca tctggctact aaattgatag agcaagagac 240
cgaaaaagac acactcatcc tggatatcgg cagtgcgcct gccaggagaa tgatgtctga 300
gcacacgtac cattgtgtgt gcccaatgcg cagcgctgag gacccagagc gtctgctgta 360
ttatgccagg aagttagcca aggcatcagg tgaagtcgtt gacagaaata ttgcagcgaa 420
gatagacgac ctgcagtcag tgatggcgac cccggacaat gagtcacgga cattttgcct 480
tcacacagat cagacatgca ggactccagc tgaggtggca gtctatcagg atgtctatgc 540
agttcacgca ccgacttctt tgtacttcca ggcaatgaaa ggagtacgca cagcgtactg 600
gattgggttc gacactaccc cattcatgtt cgatacaatg gccggggctt atccaacata 660
tgcaaccaac tgggccgacg aacaggtgtt gaaagccagg aacataggac tgtgctccgc 720
ggcactgact gagggacacc ttggcaagct atcaataatg aggaagaaga gaatgaaacc 780
gagtgaccag ataatgttct cggtaggttc cacattgtat acggaaagcc gacgtctgct 840
aaagagttgg catctgccgt cagtgtttca tctgaaagga cgacaatcat atacgtgccg 900
gtgcgataca atagtgtcat gtgagggcta cgttgttaag aagataacga tgagcccagg 960
ggtattcgga aaaacgtcag ggtacgccgt cacacatcac gcagaaggat ttctggtatg 1020
taaaaccact gacactatcg caggagaacg agtttcgttc cccgtttgca cgtatgtgcc 1080
gtcgacgatc tgtgaccaaa tgacaggcat tctggcgact gaggtcacgc ccgaggatgc 1140
gcaaaaattg cttgtcggat taaaccagag gatcgtcgtg aatgggagga cccagagaaa 1200
cactaataca atgaagaact acctgctccc agtggtgtca caagcattta gtaagtgggc 1260
gaaagagtat cggcttgacc aagacgatga gaaaaacatg ggtatgcgcg aacgcaccct 1320
gacttgctgc tgcctgtggg cctttaagac ccataagaat cacaccatgt ataagaagcc 1380
agacacacag acgatcgtca gtgtcccgtc ggagttcaac tccttcgtga tccctagcct 1440
gtggtcagcg gggttgtcga tcggaattag acacaggatc aggcttcttt tgcagtcaag 1500
acgtgccgag ccgctcgttc catttatgga tgctagtgaa gccagagcag cagagaagga 1560
ggctgcagaa gctaaggagg cagaagagac actggcagcc ctaccacctc tgatcccgac 1620
cgctccgctg ctcgatgaca tccctgaagt tgatgtagag gagctggagt ttcgagcagg 1680
agccggtgtt gtcgaaacgc ctcggaacgc cctcaaagtt acaccacaag acagagacac 1740
tatggtaggt agctatctcg ttctgtctcc ccagacagtc ctgaaaagtg ttaaactgca 1800
ggtactgcac tccttggcag agcaagtaag aatcattacc cacaaaggcc gtgcagggcg 1860
ctaccaagtg gatgcctatg acggccgtgt tttaatcccg acaggcgcgg ctatcccggt 1920
acccgatttc caggctctaa gtgagagtgc gactatggtg tacaacgaac gtgagtttat 1980
caatcgcaaa ttgtaccaca tagccgtaca tggggcagcc ctgaacaccg atgaggaggg 2040
ttacgagaaa gtgcgggccg aaaggacaga tgccgagtac gtttttgacg tggatcgcaa 2100
acagtgcgtt aagagggagg atgccgaggg tctcgtgatg atcggagacc tggtcaaccc 2160
accattccac gaatttgcgt atgaaggact gaaacgaaga ccagcggctc catacaaaac 2220
aactgtagtc ggagtcttcg gcgtgcctgg atctggaaaa tcgggtataa tcaaaagcct 2280
ggtcacacgt gcggacttgg tcaccagtgg aaagagagag aactgtcagg agatcatgca 2340
cgacgtcaag agatacagag acctggacat cactgcaaaa acggtggatt ccgtactgtt 2400
gaatggcgtt aagcagactg tcgacgtctt gtacgtcgat gaggctttcg cttgccatgc 2460
agggacattg ctagcgctta tcgccacggt gcgaccacgt aagaaggttg tgctttgcgg 2520
cgacccgaaa cagtgcggtt tcttcaactt gatgcaacta caggttaact ttaaccacaa 2580
catctgcacc gaggtacacc ataagagcat ttccagaaga tgcacgctac cagtcaccgc 2640
cattgtctca acactacact atgagggcaa aatgcgcacc actaacccat acaataaacc 2700
cgttgtcatt gacaccacag gccagactaa accaaaccgc gaggacattg tgttaacatg 2760
tttccgcggt tgggttaagc agctgcaact tgactatcgt ggacacgaag tcatgacagc 2820
cgctgcatcc caggggttga cccgaaaggg cgtgtacgcc gtccgaatga aggtcaacga 2880
aaacccactg tacgcacaat catcggagca tgttaatgtt ctactgacac gcacagaggg 2940
cagactagtg tggaagacac tgtcaggaga tccctggatc aaaactttga gcaacatccc 3000
aaaagggaat ttcacagcaa ctttggaaga ttggcaacaa gagcacgacg ccattatgag 3060
ggcaataaca caagaagcag cccctttgga cgtgttccaa aataaggcta aggtgtgttg 3120
ggccaagtgc ttggtacccg ttttggaaac cgcggggatc aagttgtcag ccgccgattg 3180
gagctcaatc attttggctt tcaaagaaga cagagcttat tcaccagagg ttgcactgaa 3240
tgagatttgc actaaaatct acggggcgga tttggacagc ggcctgtttt cggctccacg 3300
cgtgtcgcta cactatacta caaatcattg ggataactcg cctggaggaa ggatgtacgg 3360
gttttccgtc gaggccgcca accgcctaga acaacggcac ccgttctaca ggggacggtg 3420
ggcttctggg caggtgttgg tcgcagaacg aagaactcag ccgattgaca tcacttgcaa 3480
cctaatcccc ttcaaccgga gactcccaca cgcgctggtc acggaatatc atccagttaa 3540
gggagaaaga gtggagtggc ttgtgaataa gatcccaggc tatcacttgc tactggttag 3600
cgagtataac ctcatactgc ctagaaggaa ggtaacgtgg attgccccgc cgactgtgac 3660
aggagccgat ttaacccacg acttggattt aggactaccg cctaatgctg gcaggtatga 3720
cctagtcttc gtcaacatgc atacaccgta taggctccat cactaccaac aatgcgtcga 3780
tcacgccatg aaattacaga tgctgggcgg cgacgcactc tacctgttga aacccggggg 3840
aagcctcctt ttgagagcct acggttatgc cgatagaacg agcgaggctg tggtgacggc 3900
tctcgctcgt cggttctcgt ccttcagagc ggtcagacct ccatgtgtga ctagtaacac 3960
cgaggtgttc ttactgttca cgaactttga caacggtaga agaacagtaa ccctgcatcc 4020
tacaaatggt aaattatcat caatttatgc aggtacagtg ctgcaggcgg ccggctgcgc 4080
tcccgcttat actgtcaaaa gggcagacat cgcgaccgcc attgaggatg cggtggtcaa 4140
tgcagctaac caccgtggac aagtgggcga cggagtctgc agggcagtag cacggaaatg 4200
gcctcaagcc ttccgcaacg cagcgacacc tgtcggaacc gcaaaaaccg tcaagtgcga 4260
cgagacttac atcatccacg cggtgggtcc aaattttaac aatacatctg aggctgaagg 4320
ggatcgtgac ttggcggcgg catacagggc cgtagcagcg gagattaacc gactgtctat 4380
aagtagtgtg gcgattccac tgctttccac aggtatattc agtgcaggaa aagatagagt 4440
gcatcagtcg ctttcgcacc ttctagcggc aatggacacc actgaagcac gggttactat 4500
ctactgccgc gataaaacgt gggagcaaaa gatcaaaaca gttctgcaga atcgctgcgc 4560
cactgaactg gtgtctgatg tgctacagct tgaagtcaat ttgaccagag tccatccgga 4620
cagcagcctg gtgggacgtc cagggtatag caccactgat gggaccttat attcctatat 4680
ggaaggtact aagttccacc aagcggctct tgacatggct gagatcacga ccttgtggcc 4740
gagagttcag gatgcaaatg aacacatctg catgtatgca ctgggcgaga cgatggacaa 4800
catccgctct agatgcccag ttgaggatag tgactcatcg actccaccga agacagtccc 4860
atgtctctgt cggtacgcta tgacaccaga gagagtcaca agactacgaa tgcatcacac 4920
aaaagatttt gtggtctgct cgtctttcca gctaccgaag taccgcatag ctggtgtgca 4980
gcgagtaaag tgcgaaaaag tgatgctttt tgatgcaact ccaccggcct ctgttagtcc 5040
tgtgcaatac ctgacgagtc acagtgaaac tactgtaagc ttgagctcgt tctcaattac 5100
atctgacagc agctccctaa gcaccttccc ggatctggag tcactagaag aactgggcaa 5160
tgatccacag tccatgcgga tggacgagtc tgacaaccgg caacccatat caacggtaga 5220
accggttgtt cgacccgtac cacctccgcg tcctaaacgt gccaggcgac tagcggctgc 5280
acgtatgcag gtccaggcgg aagtgcacca cccacccgtc gtccaaagga cgaaaccggt 5340
cccagcaccg cgcaccagtt tgcgtcccgt ccccgcgccc agaaggtgta tgccaagacc 5400
agcagtagag ctgccctggc cgcaggaggc cgtcgacata gagttcgggg cgccgaccga 5460
agaggagagt gaaatcacat tcggagactt ttctgcttcg gagtgggaga ccatcagcaa 5520
ctcatcctga ctaggccgag cgggggctta tatcttctca tcagacgtcg gtccagggca 5580
tctgcaacag aaatcagtga gacagcacga tctagaggtg ccgattatgg atcgcgtagt 5640
cgaggagaaa gtctacccgc cgaaactaga tgaggcaaaa gagaaacagc tgctcctaaa 5700
actgcagatg catgccacag acgccaaccg gagccggtac caatcaagga aagttgagaa 5760
cataaaagca acgatcattg accggctgaa acaaggcagc gcatcctaca tctcggctga 5820
ggccaataaa gcaatcacat accatgtcaa atatgctaag cctcggtact ctgtgccggt 5880
gatgcaaaga cttagcagtg caaccaccgc agttgccgct tgcaatgaat tcctggcccg 5940
gaactaccct acagtggcgt catatcagat caccgatgag tacgacgctt atttagatat 6000
ggtggacggg tcagaaagct gcctagacag agcaaacttc tgcccggcga agttgcgctg 6060
ctatccaaaa caccatgcat accatgtacc ccagattaga agtgctgttc cttcgccatt 6120
ccaaaacacg ttgcagaatg tattagcggc cgccactaag cgtaattgca acgtcaccca 6180
gatgcgtgaa ctaccaaccc tggattcagc cgtgtacaac gtggaatgtt tccgcaagta 6240
cgcctgtaac aacgaatatt gggaagagtt tgctgctaaa cctatcagaa ttacaacaga 6300
gaatttgacc acttatgtga ccaaattaaa aggtggaaag gcagccgccc tgtttgcaaa 6360
gacgcataac ttagttccac tgcaggaggt tccaatggat agattcgtca tggacatgaa 6420
gcgcgatgtg aaggttacac cagggacgaa gcacacagag gaacgaccaa aggtccaagt 6480
gattcaagct gccgagcctc tggctaccgc ctacctgtgt ggaattcaca gagaactggt 6540
tcgccggctc aatgctgtgt tgctacctaa catccatacc ctgtttgaca tgtctgctga 6600
agattttgat gccatcatat cagagcactt caagccaggg gaccatgtct tggaaacgga 6660
catcgcttct tttgacaaaa gccaggacga ttcactggca ctaacggggc taatgatact 6720
ggaagacttg ggcgtcgata accagttatt ggatcttatc gaggctgcat ttggtcagat 6780
taccagctgc cacctgccta cagggactag gtttaaattt ggggctatga tgaagtcagg 6840
catgtttctt acattgttca ttaacaccgt tttgaacatt accattgcca gtagagtgct 6900
ggaagccaga ttaactaact cagcctgtgc cgcatttatc ggcgacgaca acgtggttca 6960
cggagtcgtc tccgataaac tgatggcaga tagatgtgcc acttgggtta acatggaggt 7020
taaaataata gatgcagtca tgtgtgcaaa gccaccgtat ttctgtggag gctttttggt 7080
ctatgatcat gtcacaagga cgtcatgtcg aatagcggat ccattaaaaa ggttattcaa 7140
attgggcaaa cccctgccgg cagacgactg ccaagatgaa gaccgccgta gggcattgca 7200
cgacgaggtt aaaaaatggt ttagatcagg cttgggttcg gagattgagg tcgccctcgc 7260
caccagatac gaggtggaag ggggtcacaa cctactgctg gctatgtcca cctttgcaca 7320
cagcatgaag aatttttctg cattgagggg acccgtcata cacttgtacg gcggtcctaa 7380
ataggtgctc tacacgacac ctataccacc atggatttcc taccaacaca agtgttttat 7440
ggcaggcgat ggagaccacg aatgccgcca cgcccttgga ggccacgccc acctacaatt 7500
caaagaccag atcaacaggc ccgacaaatg cagcagctga ttgctgcggt cagtacgctt 7560
gcccttaggc aaaacgctgc tgcccctcag cgtggaagaa agaagcaacc acgtagaaag 7620
aaaccaaaac cacaacccga gaaacctaag aagcaagagc agaaaccgaa gcaaaagaag 7680
acccctaaga agaagcccgg gagaagggag cgcatgtgca tgaagattga gcacgattgc 7740
atctttgagg tcaagcacga aggaaaggtc acaggctatg cttgccttgt cggtgacaaa 7800
gtaatgaagc cggcacacgt ccctggagtg atagacaaca tcgatctcgc acgtctatcg 7860
tataagaaat ctagtaagta tgacctggaa tgtgcacaga taccggtggc tatgaagtca 7920
gatgcatcga aatacaccca tgaaaaaccc gaaggtcact ataactggca ctatggggcc 7980
gtccagtaca caggaggcag attcacggtg cccacaggag tgggtaagcc tggcgacagc 8040
ggccggccca tctttgataa caagggccgc gttgtcgcaa tagtgctagg aggagctaat 8100
gaaggtgcca gaaccgcgct ctctgtcgtg acgtggaata aagacatggt caccaagatc 8160
acaccggagg gcacagagga gtgggcagct ccgacagtga cagctatgtg ccttctggcg 8220
aatgtatcct tcccatgttt ccaaccgagc tgctctccat gctgttatga aaaggggcct 8280
gagccgacgc tgagaatgct ggaagagaac gtaaactcag agggatacta tgaattgttg 8340
catgctgccg tgtactgcaa aaacagctcg aggtcgaaga ggagcactgc aaatcacttt 8400
aacgcataca aattgactcg tccatacgta gcctactgtg cagactgtgg catgggccat 8460
tcttgccaca gtcccgccat gattgaaaat gtgcaggcgg atgctacaga tggcacgtta 8520
aagattcaat tcgcttctca aattggccta acgaaagcgg acacgcatga tcatacaaag 8580
attagatatg cagaagggca tgatatagcg gaggctgcca ggtcaactct taaggtccat 8640
agcagcagtg agtgcgcggt gacaggaacg atgggacact ttatcttggc caaatgtcca 8700
ccaggcgaag tcattagtgt ctcatttgtt gattcaaaaa atgaacagcg gacctgtcgg 8760
atagcctacc accatgaaca gaggctaata gggcgtgaaa gattcacggt acgaccacat 8820
catgggattg agctaccctg caccacttac cagctaacga ccgccgaaac ctctgaagag 8880
atagacatgc acatgccgcc ggacattccg gacagaacta tcctttccca gcaatcagga 8940
aatgtcaaga taacggtcaa cgggcggacc gtcaagtata gctgctcatg tggttctaaa 9000
ccatcaggca caacaactac agacaagact atcaatagct gcaccgttga caaatgccag 9060
gcatatgtca cgagccatac gaaatggcaa tttaattcac ctttcgttcc gcgcgcggag 9120
caagcggagc gtaagggcaa ggtgcacatt ccctttccac ttatcaacac cacctgccga 9180
gtaccattgg ctcccgaagc cctagtcagg agcggtaaac gagaagctac gctctcactg 9240
cacccgatac atcccacatt gctaagttac agaacactgg gacgcgagcc agtttttgat 9300
gaacagtgga tcaccaccca gacggaggta acaatcccag taccagtgga gggagtggag 9360
tatcggtggg gcaaccacaa accacaacgc ttgtggtcac agctaacaac tgatggcaga 9420
gcacatggct ggccccatga aattatcgag tactactacg ggctgcatcc tacgacaacc 9480
attgtcgtgg tggttgctgt ctcagtagtg gtgctcttgt cagttgctgc atctgtttat 9540
atgtgtgtag tggcacgcaa caagtgcctg acaccatatg cactcacccc gggggccgtt 9600
gtccctgtta ctatcggggt attatgctgt gcaccgaaag cgcacgcagc tagctttgct 9660
gaaggcatgg cctacctgtg ggataataac cagtcaatgt tctggatgga gttgactgga 9720
cctttggctc ttcttatcct gactacatgt tgcgcccgat cactactttc ctgctgcaag 9780
ggatcttttt tagtcgcagt gagcgtcggg agtgccgttg ccagtgctta cgagcacacg 9840
gcagtcattc caaatcaagt gggattcccg tataaggctc atgttgcacg tgaaggatac 9900
agcccgctga cactgcagat gcaggtggtt gaaaccagtc tagagccaac gctcaacctg 9960
gagtatatca cttgcgacta caaaacaaag gttccatccc cgtacgtaaa gtgctgtggc 10020
acagctgaat gccgcacgca ggacaagccc gaatacaagt gtgcggtgtt cacgggcgtg 10080
taccctttta tgtggggagg tgcatactgt ttttgtgact cggaaaacac acagatgagt 10140
gaggcctacg tggagcgcgc tgacgtgtgc aaacacgact acgcagccgc ctaccgcgcc 10200
cacactgctt ccctcagagc caaaatcaag gtaacatatg gcaccgtaaa tcagactgtc 10260
gaggcgtatg tgaacggtga ccatgccgta acgattgccg ggacgaagtt tatctttggt 10320
ccggtgtcaa cggcctggac accgttcgat actaaaatcg tggtctataa aggggaggta 10380
tacaaccagg actttccccc ttatggtgcc gggcagcctg gaagattcgg agacatccag 10440
agtaggacgt tggacagtaa ggacctatat gcaaacacgg gccttaagct ggcaagacca 10500
gcagccggca acatccacgt cccctatacc cagacaccat ctggttttaa aacatggcaa 10560
aaagacaggg actcaccgtt aaacgctaag gcaccctttg gatgcacaat ccagacaaat 10620
ccggtcagag cgatgaattg cgctgtcggc aacatacccg tttcgatgga tatcgccgac 10680
agcgcattca ctagactgac tgatgcgcct ataatatcag agctgctgtg cactgtatct 10740
acatgcacgc attcttcaga cttcggtgga gtcgctgtac tttcttacaa ggtggaaaaa 10800
gcaggcaggt gcgacgtcca ttcgcactcg aatgtcgcgg tactccagga agtttccatc 10860
gaggcagaag gtcgatcagt gatccacttt tcgaccgcat cagccgcccc ttccttcata 10920
gtatccgtct gcagctcgcg tgccacgtgc acagctaaat gtgaaccacc gaaagaccat 10980
gtggtcactt acccggcaaa tcacaacggg ataactttgc cggacttatc cagcactgca 11040
atgacttggg cgcaacatct tgccggtgga gtcgggctat tgatagcact ggcagtgcta 11100
attctagtaa tagttacttg cataactttg agaaggtgaa tcataagtac catgtataat 11160
gcgggctggc atatatgtaa ccattattat atattttaac catattaaca ttcgaatatc 11220
aaattaggtg ccgtgcatga tgcggaccga tttattattc acatatgtaa cctttatcat 11280
attacatcat atattcaatt ttaaaatttc tatacgcgtc tctaatggcg catataataa 11340
ccacctacaa ttttcttcat tttctttatt tgtgccacta tagggcactt actaaccata 11400
gaagtaattc attttgtttt taatatttc 11429
<210> 8
<211> 1242
<212> PRT
<213> Mayaro virus
<400> 8
Met Asp Phe Leu Pro Thr Gln Val Phe Tyr Gly Arg Arg Trp Arg Pro
1 5 10 15
Arg Met Pro Pro Arg Pro Trp Arg Pro Arg Pro Pro Thr Ile Gln Arg
20 25 30
Pro Asp Gln Gln Ala Arg Gln Met Gln Gln Leu Ile Ala Ala Val Ser
35 40 45
Thr Leu Ala Leu Arg Gln Asn Ala Ala Ala Pro Gln Arg Gly Arg Lys
50 55 60
Lys Gln Pro Arg Arg Lys Lys Pro Lys Pro Gln Pro Glu Lys Pro Lys
65 70 75 80
Lys Gln Glu Gln Lys Pro Lys Gln Lys Lys Thr Pro Lys Lys Lys Pro
85 90 95
Gly Arg Arg Glu Arg Met Cys Met Lys Ile Glu His Asp Cys Ile Phe
100 105 110
Glu Val Lys His Glu Gly Lys Val Thr Gly Tyr Ala Cys Leu Val Gly
115 120 125
Asp Lys Val Met Lys Pro Ala His Val Pro Gly Val Ile Asp Asn Ile
130 135 140
Asp Leu Ala Arg Leu Ser Tyr Lys Lys Ser Ser Lys Tyr Asp Leu Glu
145 150 155 160
Cys Ala Gln Ile Pro Val Ala Met Lys Ser Asp Ala Ser Lys Tyr Thr
165 170 175
His Glu Lys Pro Glu Gly His Tyr Asn Trp His Tyr Gly Ala Val Gln
180 185 190
Tyr Thr Gly Gly Arg Phe Thr Val Pro Thr Gly Val Gly Lys Pro Gly
195 200 205
Asp Ser Gly Arg Pro Ile Phe Asp Asn Lys Gly Arg Val Val Ala Ile
210 215 220
Val Leu Gly Gly Ala Asn Glu Gly Ala Arg Thr Ala Leu Ser Val Val
225 230 235 240
Thr Trp Asn Lys Asp Met Val Thr Lys Ile Thr Pro Glu Gly Thr Glu
245 250 255
Glu Trp Ala Ala Pro Thr Val Thr Ala Met Cys Leu Leu Ala Asn Val
260 265 270
Ser Phe Pro Cys Phe Gln Pro Ser Cys Ser Pro Cys Cys Tyr Glu Lys
275 280 285
Gly Pro Glu Pro Thr Leu Arg Met Leu Glu Glu Asn Val Asn Ser Glu
290 295 300
Gly Tyr Tyr Glu Leu Leu His Ala Ala Val Tyr Cys Lys Asn Ser Ser
305 310 315 320
Arg Ser Lys Arg Ser Thr Ala Asn His Phe Asn Ala Tyr Lys Leu Thr
325 330 335
Arg Pro Tyr Val Ala Tyr Cys Ala Asp Cys Gly Met Gly His Ser Cys
340 345 350
His Ser Pro Ala Met Ile Glu Asn Val Gln Ala Asp Ala Thr Asp Gly
355 360 365
Thr Leu Lys Ile Gln Phe Ala Ser Gln Ile Gly Leu Thr Lys Ala Asp
370 375 380
Thr His Asp His Thr Lys Ile Arg Tyr Ala Glu Gly His Asp Ile Ala
385 390 395 400
Glu Ala Ala Arg Ser Thr Leu Lys Val His Ser Ser Ser Glu Cys Ala
405 410 415
Val Thr Gly Thr Met Gly His Phe Ile Leu Ala Lys Cys Pro Pro Gly
420 425 430
Glu Val Ile Ser Val Ser Phe Val Asp Ser Lys Asn Glu Gln Arg Thr
435 440 445
Cys Arg Ile Ala Tyr His His Glu Gln Arg Leu Ile Gly Arg Glu Arg
450 455 460
Phe Thr Val Arg Pro His His Gly Ile Glu Leu Pro Cys Thr Thr Tyr
465 470 475 480
Gln Leu Thr Thr Ala Glu Thr Ser Glu Glu Ile Asp Met His Met Pro
485 490 495
Pro Asp Ile Pro Asp Arg Thr Ile Leu Ser Gln Gln Ser Gly Asn Val
500 505 510
Lys Ile Thr Val Asn Gly Arg Thr Val Lys Tyr Ser Cys Ser Cys Gly
515 520 525
Ser Lys Pro Ser Gly Thr Thr Thr Thr Asp Lys Thr Ile Asn Ser Cys
530 535 540
Thr Val Asp Lys Cys Gln Ala Tyr Val Thr Ser His Thr Lys Trp Gln
545 550 555 560
Phe Asn Ser Pro Phe Val Pro Arg Ala Glu Gln Ala Glu Arg Lys Gly
565 570 575
Lys Val His Ile Pro Phe Pro Leu Ile Asn Thr Thr Cys Arg Val Pro
580 585 590
Leu Ala Pro Glu Ala Leu Val Arg Ser Gly Lys Arg Glu Ala Thr Leu
595 600 605
Ser Leu His Pro Ile His Pro Thr Leu Leu Ser Tyr Arg Thr Leu Gly
610 615 620
Arg Glu Pro Val Phe Asp Glu Gln Trp Ile Thr Thr Gln Thr Glu Val
625 630 635 640
Thr Ile Pro Val Pro Val Glu Gly Val Glu Tyr Arg Trp Gly Asn His
645 650 655
Lys Pro Gln Arg Leu Trp Ser Gln Leu Thr Thr Asp Gly Arg Ala His
660 665 670
Gly Trp Pro His Glu Ile Ile Glu Tyr Tyr Tyr Gly Leu His Pro Thr
675 680 685
Thr Thr Ile Val Val Val Val Ala Val Ser Val Val Val Leu Leu Ser
690 695 700
Val Ala Ala Ser Val Tyr Met Cys Val Val Ala Arg Asn Lys Cys Leu
705 710 715 720
Thr Pro Tyr Ala Leu Thr Pro Gly Ala Val Val Pro Val Thr Ile Gly
725 730 735
Val Leu Cys Cys Ala Pro Lys Ala His Ala Ala Ser Phe Ala Glu Gly
740 745 750
Met Ala Tyr Leu Trp Asp Asn Asn Gln Ser Met Phe Trp Met Glu Leu
755 760 765
Thr Gly Pro Leu Ala Leu Leu Ile Leu Thr Thr Cys Cys Ala Arg Ser
770 775 780
Leu Leu Ser Cys Cys Lys Gly Ser Phe Leu Val Ala Val Ser Val Gly
785 790 795 800
Ser Ala Val Ala Ser Ala Tyr Glu His Thr Ala Val Ile Pro Asn Gln
805 810 815
Val Gly Phe Pro Tyr Lys Ala His Val Ala Arg Glu Gly Tyr Ser Pro
820 825 830
Leu Thr Leu Gln Met Gln Val Val Glu Thr Ser Leu Glu Pro Thr Leu
835 840 845
Asn Leu Glu Tyr Ile Thr Cys Asp Tyr Lys Thr Lys Val Pro Ser Pro
850 855 860
Tyr Val Lys Cys Cys Gly Thr Ala Glu Cys Arg Thr Gln Asp Lys Pro
865 870 875 880
Glu Tyr Lys Cys Ala Val Phe Thr Gly Val Tyr Pro Phe Met Trp Gly
885 890 895
Gly Ala Tyr Cys Phe Cys Asp Ser Glu Asn Thr Gln Met Ser Glu Ala
900 905 910
Tyr Val Glu Arg Ala Asp Val Cys Lys His Asp Tyr Ala Ala Ala Tyr
915 920 925
Arg Ala His Thr Ala Ser Leu Arg Ala Lys Ile Lys Val Thr Tyr Gly
930 935 940
Thr Val Asn Gln Thr Val Glu Ala Tyr Val Asn Gly Asp His Ala Val
945 950 955 960
Thr Ile Ala Gly Thr Lys Phe Ile Phe Gly Pro Val Ser Thr Ala Trp
965 970 975
Thr Pro Phe Asp Thr Lys Ile Val Val Tyr Lys Gly Glu Val Tyr Asn
980 985 990
Gln Asp Phe Pro Pro Tyr Gly Ala Gly Gln Pro Gly Arg Phe Gly Asp
995 1000 1005
Ile Gln Ser Arg Thr Leu Asp Ser Lys Asp Leu Tyr Ala Asn Thr
1010 1015 1020
Gly Leu Lys Leu Ala Arg Pro Ala Ala Gly Asn Ile His Val Pro
1025 1030 1035
Tyr Thr Gln Thr Pro Ser Gly Phe Lys Thr Trp Gln Lys Asp Arg
1040 1045 1050
Asp Ser Pro Leu Asn Ala Lys Ala Pro Phe Gly Cys Thr Ile Gln
1055 1060 1065
Thr Asn Pro Val Arg Ala Met Asn Cys Ala Val Gly Asn Ile Pro
1070 1075 1080
Val Ser Met Asp Ile Ala Asp Ser Ala Phe Thr Arg Leu Thr Asp
1085 1090 1095
Ala Pro Ile Ile Ser Glu Leu Leu Cys Thr Val Ser Thr Cys Thr
1100 1105 1110
His Ser Ser Asp Phe Gly Gly Val Ala Val Leu Ser Tyr Lys Val
1115 1120 1125
Glu Lys Ala Gly Arg Cys Asp Val His Ser His Ser Asn Val Ala
1130 1135 1140
Val Leu Gln Glu Val Ser Ile Glu Ala Glu Gly Arg Ser Val Ile
1145 1150 1155
His Phe Ser Thr Ala Ser Ala Ala Pro Ser Phe Ile Val Ser Val
1160 1165 1170
Cys Ser Ser Arg Ala Thr Cys Thr Ala Lys Cys Glu Pro Pro Lys
1175 1180 1185
Asp His Val Val Thr Tyr Pro Ala Asn His Asn Gly Ile Thr Leu
1190 1195 1200
Pro Asp Leu Ser Ser Thr Ala Met Thr Trp Ala Gln His Leu Ala
1205 1210 1215
Gly Gly Val Gly Leu Leu Ile Ala Leu Ala Val Leu Ile Leu Val
1220 1225 1230
Ile Val Thr Cys Ile Thr Leu Arg Arg
1235 1240
<210> 9
<211> 2434
<212> PRT
<213> Mayaro virus
<400> 9
Met Ser Lys Val Phe Val Asp Ile Glu Ala Glu Ser Pro Phe Leu Lys
1 5 10 15
Ser Leu Gln Arg Ala Phe Pro Ala Phe Glu Val Glu Ala Gln Gln Val
20 25 30
Thr Pro Asn Asp His Ala Asn Ala Arg Ala Phe Ser His Leu Ala Thr
35 40 45
Lys Leu Ile Glu Gln Glu Thr Glu Lys Asp Thr Leu Ile Leu Asp Ile
50 55 60
Gly Ser Ala Pro Ala Arg Arg Met Met Ser Glu His Thr Tyr His Cys
65 70 75 80
Val Cys Pro Met Arg Ser Ala Glu Asp Pro Glu Arg Leu Leu Tyr Tyr
85 90 95
Ala Arg Lys Leu Ala Lys Ala Ser Gly Glu Val Val Asp Arg Asn Ile
100 105 110
Ala Ala Lys Ile Asp Asp Leu Gln Ser Val Met Ala Thr Pro Asp Asn
115 120 125
Glu Ser Arg Thr Phe Cys Leu His Thr Asp Gln Thr Cys Arg Thr Pro
130 135 140
Ala Glu Val Ala Val Tyr Gln Asp Val Tyr Ala Val His Ala Pro Thr
145 150 155 160
Ser Leu Tyr Phe Gln Ala Met Lys Gly Val Arg Thr Ala Tyr Trp Ile
165 170 175
Gly Phe Asp Thr Thr Pro Phe Met Phe Asp Thr Met Ala Gly Ala Tyr
180 185 190
Pro Thr Tyr Ala Thr Asn Trp Ala Asp Glu Gln Val Leu Lys Ala Arg
195 200 205
Asn Ile Gly Leu Cys Ser Ala Ala Leu Thr Glu Gly His Leu Gly Lys
210 215 220
Leu Ser Ile Met Arg Lys Lys Arg Met Lys Pro Ser Asp Gln Ile Met
225 230 235 240
Phe Ser Val Gly Ser Thr Leu Tyr Thr Glu Ser Arg Arg Leu Leu Lys
245 250 255
Ser Trp His Leu Pro Ser Val Phe His Leu Lys Gly Arg Gln Ser Tyr
260 265 270
Thr Cys Arg Cys Asp Thr Ile Val Ser Cys Glu Gly Tyr Val Val Lys
275 280 285
Lys Ile Thr Met Ser Pro Gly Val Phe Gly Lys Thr Ser Gly Tyr Ala
290 295 300
Val Thr His His Ala Glu Gly Phe Leu Val Cys Lys Thr Thr Asp Thr
305 310 315 320
Ile Ala Gly Glu Arg Val Ser Phe Pro Val Cys Thr Tyr Val Pro Ser
325 330 335
Thr Ile Cys Asp Gln Met Thr Gly Ile Leu Ala Thr Glu Val Thr Pro
340 345 350
Glu Asp Ala Gln Lys Leu Leu Val Gly Leu Asn Gln Arg Ile Val Val
355 360 365
Asn Gly Arg Thr Gln Arg Asn Thr Asn Thr Met Lys Asn Tyr Leu Leu
370 375 380
Pro Val Val Ser Gln Ala Phe Ser Lys Trp Ala Lys Glu Tyr Arg Leu
385 390 395 400
Asp Gln Asp Asp Glu Lys Asn Met Gly Met Arg Glu Arg Thr Leu Thr
405 410 415
Cys Cys Cys Leu Trp Ala Phe Lys Thr His Lys Asn His Thr Met Tyr
420 425 430
Lys Lys Pro Asp Thr Gln Thr Ile Val Ser Val Pro Ser Glu Phe Asn
435 440 445
Ser Phe Val Ile Pro Ser Leu Trp Ser Ala Gly Leu Ser Ile Gly Ile
450 455 460
Arg His Arg Ile Arg Leu Leu Leu Gln Ser Arg Arg Ala Glu Pro Leu
465 470 475 480
Val Pro Phe Met Asp Ala Ser Glu Ala Arg Ala Ala Glu Lys Glu Ala
485 490 495
Ala Glu Ala Lys Glu Ala Glu Glu Thr Leu Ala Ala Leu Pro Pro Leu
500 505 510
Ile Pro Thr Ala Pro Leu Leu Asp Asp Ile Pro Glu Val Asp Val Glu
515 520 525
Glu Leu Glu Phe Arg Ala Gly Ala Gly Val Val Glu Thr Pro Arg Asn
530 535 540
Ala Leu Lys Val Thr Pro Gln Asp Arg Asp Thr Met Val Gly Ser Tyr
545 550 555 560
Leu Val Leu Ser Pro Gln Thr Val Leu Lys Ser Val Lys Leu Gln Val
565 570 575
Leu His Ser Leu Ala Glu Gln Val Arg Ile Ile Thr His Lys Gly Arg
580 585 590
Ala Gly Arg Tyr Gln Val Asp Ala Tyr Asp Gly Arg Val Leu Ile Pro
595 600 605
Thr Gly Ala Ala Ile Pro Val Pro Asp Phe Gln Ala Leu Ser Glu Ser
610 615 620
Ala Thr Met Val Tyr Asn Glu Arg Glu Phe Ile Asn Arg Lys Leu Tyr
625 630 635 640
His Ile Ala Val His Gly Ala Ala Leu Asn Thr Asp Glu Glu Gly Tyr
645 650 655
Glu Lys Val Arg Ala Glu Arg Thr Asp Ala Glu Tyr Val Phe Asp Val
660 665 670
Asp Arg Lys Gln Cys Val Lys Arg Glu Asp Ala Glu Gly Leu Val Met
675 680 685
Ile Gly Asp Leu Val Asn Pro Pro Phe His Glu Phe Ala Tyr Glu Gly
690 695 700
Leu Lys Arg Arg Pro Ala Ala Pro Tyr Lys Thr Thr Val Val Gly Val
705 710 715 720
Phe Gly Val Pro Gly Ser Gly Lys Ser Gly Ile Ile Lys Ser Leu Val
725 730 735
Thr Arg Ala Asp Leu Val Thr Ser Gly Lys Arg Glu Asn Cys Gln Glu
740 745 750
Ile Met His Asp Val Lys Arg Tyr Arg Asp Leu Asp Ile Thr Ala Lys
755 760 765
Thr Val Asp Ser Val Leu Leu Asn Gly Val Lys Gln Thr Val Asp Val
770 775 780
Leu Tyr Val Asp Glu Ala Phe Ala Cys His Ala Gly Thr Leu Leu Ala
785 790 795 800
Leu Ile Ala Thr Val Arg Pro Arg Lys Lys Val Val Leu Cys Gly Asp
805 810 815
Pro Lys Gln Cys Gly Phe Phe Asn Leu Met Gln Leu Gln Val Asn Phe
820 825 830
Asn His Asn Ile Cys Thr Glu Val His His Lys Ser Ile Ser Arg Arg
835 840 845
Cys Thr Leu Pro Val Thr Ala Ile Val Ser Thr Leu His Tyr Glu Gly
850 855 860
Lys Met Arg Thr Thr Asn Pro Tyr Asn Lys Pro Val Val Ile Asp Thr
865 870 875 880
Thr Gly Gln Thr Lys Pro Asn Arg Glu Asp Ile Val Leu Thr Cys Phe
885 890 895
Arg Gly Trp Val Lys Gln Leu Gln Leu Asp Tyr Arg Gly His Glu Val
900 905 910
Met Thr Ala Ala Ala Ser Gln Gly Leu Thr Arg Lys Gly Val Tyr Ala
915 920 925
Val Arg Met Lys Val Asn Glu Asn Pro Leu Tyr Ala Gln Ser Ser Glu
930 935 940
His Val Asn Val Leu Leu Thr Arg Thr Glu Gly Arg Leu Val Trp Lys
945 950 955 960
Thr Leu Ser Gly Asp Pro Trp Ile Lys Thr Leu Ser Asn Ile Pro Lys
965 970 975
Gly Asn Phe Thr Ala Thr Leu Glu Asp Trp Gln Gln Glu His Asp Ala
980 985 990
Ile Met Arg Ala Ile Thr Gln Glu Ala Ala Pro Leu Asp Val Phe Gln
995 1000 1005
Asn Lys Ala Lys Val Cys Trp Ala Lys Cys Leu Val Pro Val Leu
1010 1015 1020
Glu Thr Ala Gly Ile Lys Leu Ser Ala Ala Asp Trp Ser Ser Ile
1025 1030 1035
Ile Leu Ala Phe Lys Glu Asp Arg Ala Tyr Ser Pro Glu Val Ala
1040 1045 1050
Leu Asn Glu Ile Cys Thr Lys Ile Tyr Gly Ala Asp Leu Asp Ser
1055 1060 1065
Gly Leu Phe Ser Ala Pro Arg Val Ser Leu His Tyr Thr Thr Asn
1070 1075 1080
His Trp Asp Asn Ser Pro Gly Gly Arg Met Tyr Gly Phe Ser Val
1085 1090 1095
Glu Ala Ala Asn Arg Leu Glu Gln Arg His Pro Phe Tyr Arg Gly
1100 1105 1110
Arg Trp Ala Ser Gly Gln Val Leu Val Ala Glu Arg Arg Thr Gln
1115 1120 1125
Pro Ile Asp Ile Thr Cys Asn Leu Ile Pro Phe Asn Arg Arg Leu
1130 1135 1140
Pro His Ala Leu Val Thr Glu Tyr His Pro Val Lys Gly Glu Arg
1145 1150 1155
Val Glu Trp Leu Val Asn Lys Ile Pro Gly Tyr His Leu Leu Leu
1160 1165 1170
Val Ser Glu Tyr Asn Leu Ile Leu Pro Arg Arg Lys Val Thr Trp
1175 1180 1185
Ile Ala Pro Pro Thr Val Thr Gly Ala Asp Leu Thr His Asp Leu
1190 1195 1200
Asp Leu Gly Leu Pro Pro Asn Ala Gly Arg Tyr Asp Leu Val Phe
1205 1210 1215
Val Asn Met His Thr Pro Tyr Arg Leu His His Tyr Gln Gln Cys
1220 1225 1230
Val Asp His Ala Met Lys Leu Gln Met Leu Gly Gly Asp Ala Leu
1235 1240 1245
Tyr Leu Leu Lys Pro Gly Gly Ser Leu Leu Leu Arg Ala Tyr Gly
1250 1255 1260
Tyr Ala Asp Arg Thr Ser Glu Ala Val Val Thr Ala Leu Ala Arg
1265 1270 1275
Arg Phe Ser Ser Phe Arg Ala Val Arg Pro Pro Cys Val Thr Ser
1280 1285 1290
Asn Thr Glu Val Phe Leu Leu Phe Thr Asn Phe Asp Asn Gly Arg
1295 1300 1305
Arg Thr Val Thr Leu His Pro Thr Asn Gly Lys Leu Ser Ser Ile
1310 1315 1320
Tyr Ala Gly Thr Val Leu Gln Ala Ala Gly Cys Ala Pro Ala Tyr
1325 1330 1335
Thr Val Lys Arg Ala Asp Ile Ala Thr Ala Ile Glu Asp Ala Val
1340 1345 1350
Val Asn Ala Ala Asn His Arg Gly Gln Val Gly Asp Gly Val Cys
1355 1360 1365
Arg Ala Val Ala Arg Lys Trp Pro Gln Ala Phe Arg Asn Ala Ala
1370 1375 1380
Thr Pro Val Gly Thr Ala Lys Thr Val Lys Cys Asp Glu Thr Tyr
1385 1390 1395
Ile Ile His Ala Val Gly Pro Asn Phe Asn Asn Thr Ser Glu Ala
1400 1405 1410
Glu Gly Asp Arg Asp Leu Ala Ala Ala Tyr Arg Ala Val Ala Ala
1415 1420 1425
Glu Ile Asn Arg Leu Ser Ile Ser Ser Val Ala Ile Pro Leu Leu
1430 1435 1440
Ser Thr Gly Ile Phe Ser Ala Gly Lys Asp Arg Val His Gln Ser
1445 1450 1455
Leu Ser His Leu Leu Ala Ala Met Asp Thr Thr Glu Ala Arg Val
1460 1465 1470
Thr Ile Tyr Cys Arg Asp Lys Thr Trp Glu Gln Lys Ile Lys Thr
1475 1480 1485
Val Leu Gln Asn Arg Cys Ala Thr Glu Leu Val Ser Asp Val Leu
1490 1495 1500
Gln Leu Glu Val Asn Leu Thr Arg Val His Pro Asp Ser Ser Leu
1505 1510 1515
Val Gly Arg Pro Gly Tyr Ser Thr Thr Asp Gly Thr Leu Tyr Ser
1520 1525 1530
Tyr Met Glu Gly Thr Lys Phe His Gln Ala Ala Leu Asp Met Ala
1535 1540 1545
Glu Ile Thr Thr Leu Trp Pro Arg Val Gln Asp Ala Asn Glu His
1550 1555 1560
Ile Cys Met Tyr Ala Leu Gly Glu Thr Met Asp Asn Ile Arg Ser
1565 1570 1575
Arg Cys Pro Val Glu Asp Ser Asp Ser Ser Thr Pro Pro Lys Thr
1580 1585 1590
Val Pro Cys Leu Cys Arg Tyr Ala Met Thr Pro Glu Arg Val Thr
1595 1600 1605
Arg Leu Arg Met His His Thr Lys Asp Phe Val Val Cys Ser Ser
1610 1615 1620
Phe Gln Leu Pro Lys Tyr Arg Ile Ala Gly Val Gln Arg Val Lys
1625 1630 1635
Cys Glu Lys Val Met Leu Phe Asp Ala Thr Pro Pro Ala Ser Val
1640 1645 1650
Ser Pro Val Gln Tyr Leu Thr Ser His Ser Glu Thr Thr Val Ser
1655 1660 1665
Leu Ser Ser Phe Ser Ile Thr Ser Asp Ser Ser Ser Leu Ser Thr
1670 1675 1680
Phe Pro Asp Leu Glu Ser Leu Glu Glu Leu Gly Asn Asp Pro Gln
1685 1690 1695
Ser Met Arg Met Asp Glu Ser Asp Asn Arg Gln Pro Ile Ser Thr
1700 1705 1710
Val Glu Pro Val Val Arg Pro Val Pro Pro Pro Arg Pro Lys Arg
1715 1720 1725
Ala Arg Arg Leu Ala Ala Ala Arg Met Gln Val Gln Ala Glu Val
1730 1735 1740
His His Pro Pro Val Val Gln Arg Thr Lys Pro Val Pro Ala Pro
1745 1750 1755
Arg Thr Ser Leu Arg Pro Val Pro Ala Pro Arg Arg Cys Met Pro
1760 1765 1770
Arg Pro Ala Val Glu Leu Pro Trp Pro Gln Glu Ala Val Asp Ile
1775 1780 1785
Glu Phe Gly Ala Pro Thr Glu Glu Glu Ser Glu Ile Thr Phe Gly
1790 1795 1800
Asp Phe Ser Ala Ser Glu Trp Glu Thr Ile Ser Asn Ser Ser Leu
1805 1810 1815
Gly Arg Ala Gly Ala Tyr Ile Phe Ser Ser Asp Val Gly Pro Gly
1820 1825 1830
His Leu Gln Gln Lys Ser Val Arg Gln His Asp Leu Glu Val Pro
1835 1840 1845
Ile Met Asp Arg Val Val Glu Glu Lys Val Tyr Pro Pro Lys Leu
1850 1855 1860
Asp Glu Ala Lys Glu Lys Gln Leu Leu Leu Lys Leu Gln Met His
1865 1870 1875
Ala Thr Asp Ala Asn Arg Ser Arg Tyr Gln Ser Arg Lys Val Glu
1880 1885 1890
Asn Ile Lys Ala Thr Ile Ile Asp Arg Leu Lys Gln Gly Ser Ala
1895 1900 1905
Ser Tyr Ile Ser Ala Glu Ala Asn Lys Ala Ile Thr Tyr His Val
1910 1915 1920
Lys Tyr Ala Lys Pro Arg Tyr Ser Val Pro Val Met Gln Arg Leu
1925 1930 1935
Ser Ser Ala Thr Thr Ala Val Ala Ala Cys Asn Glu Phe Leu Ala
1940 1945 1950
Arg Asn Tyr Pro Thr Val Ala Ser Tyr Gln Ile Thr Asp Glu Tyr
1955 1960 1965
Asp Ala Tyr Leu Asp Met Val Asp Gly Ser Glu Ser Cys Leu Asp
1970 1975 1980
Arg Ala Asn Phe Cys Pro Ala Lys Leu Arg Cys Tyr Pro Lys His
1985 1990 1995
His Ala Tyr His Val Pro Gln Ile Arg Ser Ala Val Pro Ser Pro
2000 2005 2010
Phe Gln Asn Thr Leu Gln Asn Val Leu Ala Ala Ala Thr Lys Arg
2015 2020 2025
Asn Cys Asn Val Thr Gln Met Arg Glu Leu Pro Thr Leu Asp Ser
2030 2035 2040
Ala Val Tyr Asn Val Glu Cys Phe Arg Lys Tyr Ala Cys Asn Asn
2045 2050 2055
Glu Tyr Trp Glu Glu Phe Ala Ala Lys Pro Ile Arg Ile Thr Thr
2060 2065 2070
Glu Asn Leu Thr Thr Tyr Val Thr Lys Leu Lys Gly Gly Lys Ala
2075 2080 2085
Ala Ala Leu Phe Ala Lys Thr His Asn Leu Val Pro Leu Gln Glu
2090 2095 2100
Val Pro Met Asp Arg Phe Val Met Asp Met Lys Arg Asp Val Lys
2105 2110 2115
Val Thr Pro Gly Thr Lys His Thr Glu Glu Arg Pro Lys Val Gln
2120 2125 2130
Val Ile Gln Ala Ala Glu Pro Leu Ala Thr Ala Tyr Leu Cys Gly
2135 2140 2145
Ile His Arg Glu Leu Val Arg Arg Leu Asn Ala Val Leu Leu Pro
2150 2155 2160
Asn Ile His Thr Leu Phe Asp Met Ser Ala Glu Asp Phe Asp Ala
2165 2170 2175
Ile Ile Ser Glu His Phe Lys Pro Gly Asp His Val Leu Glu Thr
2180 2185 2190
Asp Ile Ala Ser Phe Asp Lys Ser Gln Asp Asp Ser Leu Ala Leu
2195 2200 2205
Thr Gly Leu Met Ile Leu Glu Asp Leu Gly Val Asp Asn Gln Leu
2210 2215 2220
Leu Asp Leu Ile Glu Ala Ala Phe Gly Gln Ile Thr Ser Cys His
2225 2230 2235
Leu Pro Thr Gly Thr Arg Phe Lys Phe Gly Ala Met Met Lys Ser
2240 2245 2250
Gly Met Phe Leu Thr Leu Phe Ile Asn Thr Val Leu Asn Ile Thr
2255 2260 2265
Ile Ala Ser Arg Val Leu Glu Ala Arg Leu Thr Asn Ser Ala Cys
2270 2275 2280
Ala Ala Phe Ile Gly Asp Asp Asn Val Val His Gly Val Val Ser
2285 2290 2295
Asp Lys Leu Met Ala Asp Arg Cys Ala Thr Trp Val Asn Met Glu
2300 2305 2310
Val Lys Ile Ile Asp Ala Val Met Cys Ala Lys Pro Pro Tyr Phe
2315 2320 2325
Cys Gly Gly Phe Leu Val Tyr Asp His Val Thr Arg Thr Ser Cys
2330 2335 2340
Arg Ile Ala Asp Pro Leu Lys Arg Leu Phe Lys Leu Gly Lys Pro
2345 2350 2355
Leu Pro Ala Asp Asp Cys Gln Asp Glu Asp Arg Arg Arg Ala Leu
2360 2365 2370
His Asp Glu Val Lys Lys Trp Phe Arg Ser Gly Leu Gly Ser Glu
2375 2380 2385
Ile Glu Val Ala Leu Ala Thr Arg Tyr Glu Val Glu Gly Gly His
2390 2395 2400
Asn Leu Leu Leu Ala Met Ser Thr Phe Ala His Ser Met Lys Asn
2405 2410 2415
Phe Ser Ala Leu Arg Gly Pro Val Ile His Leu Tyr Gly Gly Pro
2420 2425 2430
Lys
<210> 10
<211> 11883
<212> DNA
<213> Ross river virus
<400> 10
tggcggacgt gtgacatcac cgttcgcctt tcttggatcc cttgttactc cacgtagtga 60
gagataaaca acccagaatg aaggtcactg tagatgttga ggctgatagc ccatttttga 120
aggcccttca gaaagcattc ccggcttttg aggttgaatc acagcaggtc acacccaatg 180
accatgctaa tgccagagct ttttcgcatc tggccacaaa gttaattgaa caagaggttc 240
caaccaacat caccatcctg gatgtgggca gcgcgcccgc aaggaggttg atgtctgatc 300
acagctacca ctgcatttgt cccatgaaga gtgcggaaga cccagagaga ttagcgaact 360
atgcccggaa actggcaaaa gcagcagggg aagtgctaga caaaaatgtg tccggtaaga 420
tcacggacct gcaggacgtc atggcaaccc ccgatctgga atctccaacg ttctgtctcc 480
acaccgacga gacgtgtcgc actagagctg aagtagctgt gtaccaggac gtgtacgcgg 540
tgcacgcacc gacctcgctt tatcatcaag cgatgaaagg ggtcaggaca gtatactgga 600
taggatttga caccacccca ttcatgttcg aggttttggc tggcgcatac ccaacgtatt 660
ccacgaattg ggcggacgag caggtcctgc aggcacgtaa catcggccta tgtgcgacca 720
gtctcagcga aggacatcga ggaaaactct ctattatgag gaagaaacgc ctaaggccaa 780
gcgacagggt catgttctcg gttgggtcaa cgctatatat agaaagtaga cgccttctta 840
agagttggca tcttccctcc gtgttccacc tgaaaggcaa gaatagcttt acttgcaggt 900
gcgacacaat agtttcatgc gagggctacg ttgttaaaaa gatcacaatg agcccaggga 960
cgtacgggaa gacggtcgga tacgccgtta cgcatcatgc agaaggtttc ctaatgtgca 1020
aggtgacgga cactgtgcgc ggggagagag tatcattccc ggtatgcact tatgtgcctg 1080
caaccatttg cgatcagatg acaggaatcc tggctaccga cgtcacaccc gaagatgcgc 1140
agaaactcct ggtggggttg aaccaacgta tagttgtgaa cggcagaacc caaagaaata 1200
ccaacacaat gaaaaactac ctattgccgg tagtggccca agctttcagc aagtgggcac 1260
gagaagcaaa agcagacatg gaggatgaga aacctctggg aaccagagaa agaaccctga 1320
cgtgctgttg cctgtgggca ttcaagagcc acaagacaca caccatgtac aaaaggccgg 1380
atacccaaac tatagtcaag gtgccatcta cttttgactc gtttgtgatt ccaagcctgt 1440
ggtcatccag cctatccata ggcctacggc aaagaataaa actgctatta ggcccaaaac 1500
tctcgcggga cctcccgtac tctggagacc gaaacgaagc gcgagaagca gagaaggaag 1560
ccgaagagac caaggaagca gaattgacac gggaagcact gccaccattg gtgggaagca 1620
actgcgctga tgacgtcgat cgggtagatg tggaagagct gacgtaccgc gccggagcag 1680
gggtagtgga gacacccagg aatgcgctca gagtgacacc acaagagcgc gatcagctga 1740
tcggcgcgta cctgatcttg tctccgcaag cagtactgaa gagtgaaaaa ctcacaccga 1800
tacatccact ggctgagcaa gtgacaatca tgacgcactc tggaagatct ggcagatacc 1860
cggttgaccg ctacgacgga cgggtgttgg tcccgacggg cgcagcgatc cccgtcagcg 1920
aatttcaagc actcagtgag agtgctacta tggtctacaa cgaacgtgag ttcatcaatc 1980
gcaagttgca ccatatagca ctctacggcc ccgccctaaa cactgaggag gagaactacg 2040
aaaaagtaag ggcagagaga gccgaagctg aatacgtgtt tgacgttgac aagaggatgt 2100
gcgtgaagag agaagaagca tcaggccttg tactggttgg tgacttaatc aacccaccct 2160
tccatgagtt cgcgtatgaa ggactgaaga tacggcccgc aacgcctttc caaaccacgg 2220
tcattggcgt cttcggggta cctggttcgg gcaagtcagc cataatcaag agtgtggtga 2280
ctacgaggga cctggtcgcc agtgggaaga aggagaactg ccaggagata gttaatgatg 2340
tcaaaaagca gagaggactg gatgtaacag ccaggactgt tgactctatc ctgttgaacg 2400
ggtgcagaag aggagtagag aacctatacg tggacgaagc atttgcctgt cattcaggta 2460
cactgttggc tcttattgcc atggtgaaac caactggcaa ggtgatccta tgcggagacc 2520
caaaacagtg tggatttttt aacctgatgc aactgaaggt gaacttcaac cacgatatct 2580
gcacacaagt gctccacaaa agcatatcca gaagatgcac cctcccgatc acggctatcg 2640
tctcgaccct acactatcag ggtaagatga gaaccacgaa cttatgtagt gcacccatcc 2700
agatagacac aacaggtacc actaaaccag ccaaaggaga catcgtgtta acatgcttcc 2760
gcggttgggt aaagcaactg cagatagact accgtggaca cgaagtcatg acagcagctg 2820
catcacaagg actgactaga aaaggggtat acgccgttag gcagaaagtg aatgaaaacc 2880
cgctttatgc cccttcatca gaacatgtca acgtattgct gactagaact gaaaaccggc 2940
tggtgtggaa aacactgtcg ggagacccgt ggataaaggt gttaaccaat atccccaagg 3000
gcgatttcag cgctacgttg gaggagtggc aagaggagca tgacaacatc atgaacgccc 3060
ttcgcgagag gtcgacagca gtagacccgt tccagaacaa agccaaagtc tgctgggcaa 3120
agtgcctcgt gcaggtccta gaaacggctg ggatacgcat gacggcagag gagtgggata 3180
cagtgttggc tttccgcgaa gacagggcgt actcacccga agtggctctg aacgagatct 3240
gtaccaagta ttacggcgtt gacttagaca gcggattgtt ctccgcccaa tcggtctcat 3300
tgtactatga aaacaaccac tgggacaata gaccgggcgg ccggatgtat ggattcaacc 3360
gcgaagtcgc ccgtaagttt gagcaacgct acccattcct gagaggcaag atggactcgg 3420
ggctacaagt taatgttcca gagagaaaag tacagccatt caatgcggaa tgtaatatat 3480
taccatcaaa caggcgactt ccgcacgccc tcgtcaccag ctaccagcag tgccagggcg 3540
agagggtaga atggcttttg aagaagcttc ccggatacca tttattgctg gtaagcgagt 3600
acaatctggc gctgccccat aaaagagtct tttggattgc accaccccat gtgtctggtg 3660
cagatcgtat ttatgatctt gacctaggat tacccctgaa tgcaggccgt tacgacttgg 3720
tatttgtgaa catacacact gagtacagga cgcaccacta ccaacagtgc gtcgaccact 3780
ctatgaagtt acagatgttg ggcggtgact ccttacatct attgaaacca ggcggctcac 3840
tgcttatccg tgcttacggg tacgccgaca gagtcagcga aatggtggtc actgcattag 3900
ctaggaagtt ttccgccttc agagtcttga gaccagcatg tgtaacaagt aacactgaag 3960
tctttctgtt gttcaccaat tttgataacg gcagaagggc tgtgactctt caccaggcca 4020
atcagaggct cagctccatg tttgcatgca acgggctaca cacagccgga tgcgcaccct 4080
cataccgtgt gcgtaggacc gacatttccg ggcacgctga agaggcggtt gttaatgccg 4140
ccaacgcgaa gggcacagtc ggcgatgggg tttgcagagc ggtggcgaga aaatggccag 4200
actccttcaa aggtgccgcg actcccgtgg gtacggctaa gttggtacag gccaacggta 4260
tgaatgtcat ccacgcggta ggcccgaatt tctccacggt gaccgaggca gagggcgaca 4320
gagagttggc cgccgcatac cgtgccgtgg cgggtattat caatgctagt aacattaaga 4380
gtgtagccat ccctctgttg tcgacgggag tgttctccgg aggtaaagat agagtcatgc 4440
agtcactaaa tcacctgttt accgcaatgg acaccacgga cgctgacgta gtcatctatt 4500
gccgcgacaa agcctgggag aagaaaatcc aggaggctat cgatcgccgc accgccgtgg 4560
aattggtatc tgaagacatc tcactcgagt ctgacttgat acgggtacac ccagatagtt 4620
gcttggtagg cagaaaaggt tacagcataa cagatgggaa gctgcattca tacctggaag 4680
gtacccgctt tcatcagact gcggtggaca tggctgagat atctaccttg tggccgaaac 4740
ttcaggacgc aaacgaacaa atatgcttgt atgcattggg tgagagtatg gacagcatca 4800
gaacgaaatg ccctgttgag gacgccgatt cgtccacgcc tccgaaaaca gttccgtgtc 4860
tgtgtaggta cgctatgact gctgagagag tggcaagact tcggatgaac aacactaagg 4920
ccataattgt gtgctcctcc ttccctttac cgaagtacag gattgaaggc gtccagaagg 4980
tcaagtgcga ccgagtgctg atttttgacc agacggtgcc atctctggtt agtccaagga 5040
agtacatacc agccgccgcc tctacgcacg cagataccgt gagcttggat tctacagtat 5100
ccacaggatc cgcgtggtca ttcccatctg aggccacgta tgagaccatg gaagtagtag 5160
cagaggtgca ccactcggaa ccaccagtcc cgccaccgcg caggcgtcgt gcgcaggtga 5220
cgatgcacca ccaggagctg ttggaagtct ctgacatgca caccccgatt gcggcaaggg 5280
tcgagatccc cgtgtacgat accgctgttg tagtggagag agtggcaatt ccttgcacaa 5340
gcgagtatgc aaaacccata ccagcaccac gggcagcaag ggtcgtaccc gtgccggcac 5400
cacgcattca gcgagcgtcg acgtacagag tctctcctac acccacgcct cgcgttctga 5460
gagcctcggt atgcagtgtg accactagcg ctggggtaga gttcccttgg gcgcctgaag 5520
atctggaggt actcaccgag cctgtgcact gcaaaatgcg cgagccggtt gagttaccgt 5580
gggagcctga ggacgttgat atccagttcg gagattttga aacatccgac aaaatccaat 5640
tcggcgatat tgattttgac caattctgac taggcagagc gggggcgtac atcttctcgt 5700
ctgataccgg accagggcac ttacaacaga agtcagtacg gcaacacgca ctaccgtgcg 5760
aaatgctata cgtccacgag gaagaacgga cgtacccccc cgcactggat gaggccaggg 5820
agaaactgct gcaggcaaaa atgcagatgg cacctacgga agcaaacaag agcaggtacc 5880
aatcaaggaa ggttgaaaac atgaaggcag tgatcataga taggctgaag gatggagcaa 5940
gaacctacct gacagaacag tcagagaaga ttccaaccta tgttagtaag tacccgcggc 6000
cagtttactc gccgtcggta gaggatagct tgcagaatcc cgaggtcgct gtggcggcct 6060
gcaatgcttt cctggaagcc aattacccga cagtggctag ttaccagatc acggacgagt 6120
atgatgccta cttggatatg gttgatgggt cagagagttg tttagaccgg gcaaccttct 6180
gcccggcaaa attacgctgc tacccaaagc atcatgctta ccaccaaccg caggttagga 6240
gcgcggtccc atcaccattt caaaacaccc tgcagaatgt gctagcagca gccacgaaga 6300
gaaactgcaa tgttacacag atgagagagc tacccactct agactcagcc gtgcttaacg 6360
tggaatgctt caaaaaattc gcatgcaacg gagaatactg gcaggaattc aaagacaacc 6420
caataagaat aactacagag aacataacaa cttatgttac taggcttaag ggccctaaag 6480
cagcggcgct gtttgcaaag actcacaatc tagtcccgct gcaggaggtg cccatggacc 6540
ggtttgtggt agatatgaag agagacgtga aagttacccc tggcaccaaa cataccgagg 6600
aacgcccaaa ggtgcaagtc atccaggccg ccgaaccttt agctacagct tatttatgtg 6660
gcattcacag ggagttagtc cgccgcctga aggccgtcct ggccccgaac atacatacat 6720
tgttcgatat gtcggcagaa gattttgatg ccatcatagc tgcacatttc caaccaggcg 6780
acgcagtttt ggaaacggac atagcctcct ttgacaagag ccaagatgac tctctggcgt 6840
tgacggcact gatgctgttg gaagacctcg gggttgacca agaactacta gacttgatag 6900
aggcagcgtt cggggaaatt accagcgtcc acctgccaac aggtacgcgg ttcaagtttg 6960
gcgccatgat gaagtccgga atgttcctga cactgtttgt aaataccctg ttaaacattg 7020
tcatagcatg ccgtgtactg cgtgagaagc tgacaaactc cgtctgcgcc gcgtttatcg 7080
gggatgacaa catagtgcac ggggtaagat ccgacccgtt gatggctgaa aggtgcgcca 7140
gctgggttaa tatggaggta aagataattg acgctaccat gtgcgagaaa ccaccatatt 7200
tctgcggcgg gtttatattg tatgacaaag tcaccggatc ggcgtgccga gtggccgacc 7260
ctctgaaaag gttatttaaa ctaggtaaac ctttacccgc cggagacacc caagatgaag 7320
atcgtaggcg tgcattgaag gatgagacgg ataggtgggc acgagtaggg ctgaagtctg 7380
aactggaaat agcactaagt tctcggtatg aggtgaacgg gaccggcaac atagtgcgag 7440
caatggccac actggccaag agcctgaaga attttaaaaa gctgcgtgga cccatcgtac 7500
acctctacgg cggtcctaaa tagatgcaga gacacacctt catctaatac agctcacaac 7560
agtaaacatg aattacatac caacccagac tttttacgga cgccgttggc ggcctcgccc 7620
ggcgttccgt ccatggcagg tgccgatgca gccgacacct actatggtta cacccatgct 7680
gcaagcacca gacctacagg cccaacagat gcaacaactg atcagcgctg tctctgcatt 7740
aaccaccaaa cagaatgtaa aagcaccaaa agggcaacgg aagaagaaac agcagaaacc 7800
aaaggaaaag aaggaaaacc agaagaaaaa gccgacgcaa aagaagaagc agcagcagaa 7860
accaaaacca caggctaaga agaagaaacc agggagaaga gaaagaatgt gcatgaagat 7920
cgagaatgac tgcatattcg aggtcaaact ggatggcaag gttaccggtt atgcgtgcct 7980
agtcggagac aaggtcatga agccggctca cgttaaaggc acaattgata acccagacct 8040
tgcgaagctg acttacaaga aatccagtaa gtatgacctc gaatgcgccc agataccagt 8100
gcacatgaag tccgacgcct ccaagtacac acatgaaaaa cccgaaggtc attacaattg 8160
gcaccatgga gcagtgcagt acagcggagg aaggtttacc atccccacag gcgccggcaa 8220
accgggagat agcggtaggc ctatttttga caacaaaggg cgagtagtgg ccatcgtgtt 8280
aggcggggcc aacgaaggtg ctcgcactgc gctgtctgtg gtgacgtgga caaaagacat 8340
ggtcactcgg gtaacgccag aaggaactga agagtggtct gccgcgctga tgatgtgtat 8400
ccttgccaac acctctttcc cctgctcatc acctccctgc tacccctgct gctacgaaaa 8460
acagccagaa cagacactgc ggatgctgga agacaatgtg aatagaccag ggtactatga 8520
gctactggaa gcgtccatga catgcagaaa cagatcacgc caccgccgta gtgtaacaga 8580
gcacttcaat gtgtataagg ctactagacc gtacttagcg tattgcgctg actgtgggga 8640
cgggtacttc tgctatagcc cagttgctat cgagaagatc cgagatgagg cgtctgacgg 8700
catgctcaag atccaagtct ccgcccaaat aggtctggac aaggcaggta cccacgccca 8760
cacgaagatc cgatatatgg ctggtcatga tgttcaggaa tctaagagag attccttgag 8820
ggtgtacacg tccgcagcgt gctctataca tgggacgatg ggacacttca tcgtcgcaca 8880
ttgtccgcca ggcgactacc tcaaggtttc gttcgaggac gcagaytcac acgtgaaggc 8940
atgtaaggtc caatacaagc acgacccatt gccggtgggt agagagaagt tcgtggttag 9000
accccacttt ggcgtagagc tgccatgcac ctcataccag ctgacaacag ctcccaccga 9060
cgaggagatc gacatgcaca caccgccaga tataccggat cgcaccctgc tatcacagac 9120
ggcgggcaac gtcaaaataa cagcaggcgg caggactatc aggtacaatt gtacctgtgg 9180
ccgtgacaac gtaggcacta ccagtactga caagaccatc aacacatgca agattgacca 9240
atgccatgct gccgttacca gccatgacaa atggcaattt acctctccat ttgttcccag 9300
ggctgatcag acagctagga ggggcaaagt gcatgttcca ttccctttga ctaacgtcac 9360
ctgccgagtg ccgttggctc gagcgccgga tgtcacctat ggtaagaagg aggtgaccct 9420
gagattacac ccagatcatc cgacgctctt ctcctatagg agtttaggag ccgaaccgca 9480
cccgtacgag gagtgggttg acaagttctc tgagcgcatc atcccagtga cggaagaagg 9540
gattgagtac cagtggggca acaacccgcc ggtccgccta tgggcgcaac tgacgaccga 9600
gggcaaaccc catggctggc cacatgaaat cattcagtac tattatggac tataccccgc 9660
cgccaccatt gccgcagtat ccggggcgag tctgatggcc ctcctaactc tagcggccac 9720
atgctgcatg ctggccaccg cgaggagaaa gtgcctaaca ccatacgcct tgacgccagg 9780
agcggtggta ccgttgacac tggggctgct ttgctgcgca ccgagggcga acgcagcatc 9840
attcgctgag actatggcat atctgtggga cgagaacaaa accctctttt ggatggaatt 9900
cgcggcccca gccgcagcgc ttgctttgct ggcatgctgt atcaaaagcc tgatctgctg 9960
ttgtaagcca ttttcttttt tagtgttact gagcctggga gcctccgcaa aagcttacga 10020
gcacacagcc acaattccga atgtggtggg gttcccgtat aaggctcaca ttgaaaggaa 10080
tggcttctcg cccatgactc tgcagcttga agtggtggag acaagcttgg aacccacact 10140
taacctggag tacattacct gcgaatacaa gacggtggtc ccttcgccat tcatcaaatg 10200
ttgcggaaca tcagaatgct catccaagga gcagccagac taccaatgca aggtgtacac 10260
gggtgtatac ccattcatgt ggggtggagc ctactgtttc tgcgactccg agaacacgca 10320
gctcagcgag gcctatgtcg acaggtcaga cgtttgcaaa catgatcacg catcggccta 10380
caaggcacac acggcctctc taaaagcaac aatcaggatc agttatggca ccatcaacca 10440
gaccaccgag gccttcgtta atggtgaaca cgcggtcaac gtgggcggaa gcaagttcat 10500
ctttggaccg atctcaacag cttggtcacc gttcgacaat aaaattgtcg tgtataaaga 10560
tgatgtctac aaccaggact tcccacccta cggatcaggc cagccgggta gattcggaga 10620
cattcagagc aggacagtgg agagcaaaga cttgtatgcc aacacggccc taaaactctc 10680
aagaccatca cccggggttg tgcatgtgcc atacacgcag acaccatccg gatttaaata 10740
ttggctgaag gagaaaggat cttcattgaa tacaaaggcc ccttttggct gcaagataaa 10800
gaccaatcca gtcagagcca tggattgtgc agttggcagt atacctgtgt cgatggacat 10860
acctgacagt gcattcacac gagtggtaga tgccccggct gtaacagacc tgagctgcca 10920
ggtagtggtc tgtacacact cctccgattt cggaggagtt gccacattgt cttacaaaac 10980
ggacaaaccc ggcaagtgcg ctgtccactc acattccaac gtcgcaacgt tgcaagaggc 11040
gacggtggat gtcaaggagg atggcaaggt cacagtgcac ttttccacgg cgtccgcctc 11100
cccggccttc aaagtgtccg tctgtgacgc aaaaacaacg tgcacggcgg cgtgcgagcc 11160
tccaaaagac cacatcgtcc cttatggggc gagccataac aaccaggtct ttccggacat 11220
gtcaggaact gcgatgacgt gggtgcagag gctggccagt gggttaggtg ggctggctct 11280
catcgcggtg gttgtgctgg tcttggtaac ctgcataaca atgcgtcggt aagctttagt 11340
tcaaagggcc atataaaccc ctgaatagta acaaaatata aaaattacaa aatatgtagt 11400
tcaaagggct atactacccc tgattagtaa caaaatagaa aaccacaaaa tatgtagtta 11460
agtattataa gatgtgtagt tcaaagggct atatcacccc tgattagtaa caaaatataa 11520
aaacaaaaat atgtagttaa gtactaacca acaagtagac aaatagatgc taaccatata 11580
tataaccagc tatagtatac tatatttagc taagcagttg cagtagtaag aatgtagttc 11640
aaagggctat acaacccctg aatagtaaca aaatacaaaa atactaataa aaatttaaaa 11700
atcactagaa atccaatcat taaattatta attggctagc cgaactctaa ggagatgtag 11760
gcgtccgaac tctgcggaga tgtaggacta aattctgccg aaccccataa caccggggac 11820
gtaggcgtct aatttgtttt ttaatatttt acaaaaaaaa aaaaaaaaaa aaaaaaaaaa 11880
aaa 11883
<210> 11
<211> 1254
<212> PRT
<213> Ross river virus
<400> 11
Met Asn Tyr Ile Pro Thr Gln Thr Phe Tyr Gly Arg Arg Trp Arg Pro
1 5 10 15
Arg Pro Ala Phe Arg Pro Trp Gln Val Pro Met Gln Pro Thr Pro Thr
20 25 30
Met Val Thr Pro Met Leu Gln Ala Pro Asp Leu Gln Ala Gln Gln Met
35 40 45
Gln Gln Leu Ile Ser Ala Val Ser Ala Leu Thr Thr Lys Gln Asn Val
50 55 60
Lys Ala Pro Lys Gly Gln Arg Lys Lys Lys Gln Gln Lys Pro Lys Glu
65 70 75 80
Lys Lys Glu Asn Gln Lys Lys Lys Pro Thr Gln Lys Lys Lys Gln Gln
85 90 95
Gln Lys Pro Lys Pro Gln Ala Lys Lys Lys Lys Pro Gly Arg Arg Glu
100 105 110
Arg Met Cys Met Lys Ile Glu Asn Asp Cys Ile Phe Glu Val Lys Leu
115 120 125
Asp Gly Lys Val Thr Gly Tyr Ala Cys Leu Val Gly Asp Lys Val Met
130 135 140
Lys Pro Ala His Val Lys Gly Thr Ile Asp Asn Pro Asp Leu Ala Lys
145 150 155 160
Leu Thr Tyr Lys Lys Ser Ser Lys Tyr Asp Leu Glu Cys Ala Gln Ile
165 170 175
Pro Val His Met Lys Ser Asp Ala Ser Lys Tyr Thr His Glu Lys Pro
180 185 190
Glu Gly His Tyr Asn Trp His His Gly Ala Val Gln Tyr Ser Gly Gly
195 200 205
Arg Phe Thr Ile Pro Thr Gly Ala Gly Lys Pro Gly Asp Ser Gly Arg
210 215 220
Pro Ile Phe Asp Asn Lys Gly Arg Val Val Ala Ile Val Leu Gly Gly
225 230 235 240
Ala Asn Glu Gly Ala Arg Thr Ala Leu Ser Val Val Thr Trp Thr Lys
245 250 255
Asp Met Val Thr Arg Val Thr Pro Glu Gly Thr Glu Glu Trp Ser Ala
260 265 270
Ala Leu Met Met Cys Ile Leu Ala Asn Thr Ser Phe Pro Cys Ser Ser
275 280 285
Pro Pro Cys Tyr Pro Cys Cys Tyr Glu Lys Gln Pro Glu Gln Thr Leu
290 295 300
Arg Met Leu Glu Asp Asn Val Asn Arg Pro Gly Tyr Tyr Glu Leu Leu
305 310 315 320
Glu Ala Ser Met Thr Cys Arg Asn Arg Ser Arg His Arg Arg Ser Val
325 330 335
Thr Glu His Phe Asn Val Tyr Lys Ala Thr Arg Pro Tyr Leu Ala Tyr
340 345 350
Cys Ala Asp Cys Gly Asp Gly Tyr Phe Cys Tyr Ser Pro Val Ala Ile
355 360 365
Glu Lys Ile Arg Asp Glu Ala Ser Asp Gly Met Leu Lys Ile Gln Val
370 375 380
Ser Ala Gln Ile Gly Leu Asp Lys Ala Gly Thr His Ala His Thr Lys
385 390 395 400
Ile Arg Tyr Met Ala Gly His Asp Val Gln Glu Ser Lys Arg Asp Ser
405 410 415
Leu Arg Val Tyr Thr Ser Ala Ala Cys Ser Ile His Gly Thr Met Gly
420 425 430
His Phe Ile Val Ala His Cys Pro Pro Gly Asp Tyr Leu Lys Val Ser
435 440 445
Phe Glu Asp Ala Asp Ser His Val Lys Ala Cys Lys Val Gln Tyr Lys
450 455 460
His Asp Pro Leu Pro Val Gly Arg Glu Lys Phe Val Val Arg Pro His
465 470 475 480
Phe Gly Val Glu Leu Pro Cys Thr Ser Tyr Gln Leu Thr Thr Ala Pro
485 490 495
Thr Asp Glu Glu Ile Asp Met His Thr Pro Pro Asp Ile Pro Asp Arg
500 505 510
Thr Leu Leu Ser Gln Thr Ala Gly Asn Val Lys Ile Thr Ala Gly Gly
515 520 525
Arg Thr Ile Arg Tyr Asn Cys Thr Cys Gly Arg Asp Asn Val Gly Thr
530 535 540
Thr Ser Thr Asp Lys Thr Ile Asn Thr Cys Lys Ile Asp Gln Cys His
545 550 555 560
Ala Ala Val Thr Ser His Asp Lys Trp Gln Phe Thr Ser Pro Phe Val
565 570 575
Pro Arg Ala Asp Gln Thr Ala Arg Arg Gly Lys Val His Val Pro Phe
580 585 590
Pro Leu Thr Asn Val Thr Cys Arg Val Pro Leu Ala Arg Ala Pro Asp
595 600 605
Val Thr Tyr Gly Lys Lys Glu Val Thr Leu Arg Leu His Pro Asp His
610 615 620
Pro Thr Leu Phe Ser Tyr Arg Ser Leu Gly Ala Glu Pro His Pro Tyr
625 630 635 640
Glu Glu Trp Val Asp Lys Phe Ser Glu Arg Ile Ile Pro Val Thr Glu
645 650 655
Glu Gly Ile Glu Tyr Gln Trp Gly Asn Asn Pro Pro Val Arg Leu Trp
660 665 670
Ala Gln Leu Thr Thr Glu Gly Lys Pro His Gly Trp Pro His Glu Ile
675 680 685
Ile Gln Tyr Tyr Tyr Gly Leu Tyr Pro Ala Ala Thr Ile Ala Ala Val
690 695 700
Ser Gly Ala Ser Leu Met Ala Leu Leu Thr Leu Ala Ala Thr Cys Cys
705 710 715 720
Met Leu Ala Thr Ala Arg Arg Lys Cys Leu Thr Pro Tyr Ala Leu Thr
725 730 735
Pro Gly Ala Val Val Pro Leu Thr Leu Gly Leu Leu Cys Cys Ala Pro
740 745 750
Arg Ala Asn Ala Ala Ser Phe Ala Glu Thr Met Ala Tyr Leu Trp Asp
755 760 765
Glu Asn Lys Thr Leu Phe Trp Met Glu Phe Ala Ala Pro Ala Ala Ala
770 775 780
Leu Ala Leu Leu Ala Cys Cys Ile Lys Ser Leu Ile Cys Cys Cys Lys
785 790 795 800
Pro Phe Ser Phe Leu Val Leu Leu Ser Leu Gly Ala Ser Ala Lys Ala
805 810 815
Tyr Glu His Thr Ala Thr Ile Pro Asn Val Val Gly Phe Pro Tyr Lys
820 825 830
Ala His Ile Glu Arg Asn Gly Phe Ser Pro Met Thr Leu Gln Leu Glu
835 840 845
Val Val Glu Thr Ser Leu Glu Pro Thr Leu Asn Leu Glu Tyr Ile Thr
850 855 860
Cys Glu Tyr Lys Thr Val Val Pro Ser Pro Phe Ile Lys Cys Cys Gly
865 870 875 880
Thr Ser Glu Cys Ser Ser Lys Glu Gln Pro Asp Tyr Gln Cys Lys Val
885 890 895
Tyr Thr Gly Val Tyr Pro Phe Met Trp Gly Gly Ala Tyr Cys Phe Cys
900 905 910
Asp Ser Glu Asn Thr Gln Leu Ser Glu Ala Tyr Val Asp Arg Ser Asp
915 920 925
Val Cys Lys His Asp His Ala Ser Ala Tyr Lys Ala His Thr Ala Ser
930 935 940
Leu Lys Ala Thr Ile Arg Ile Ser Tyr Gly Thr Ile Asn Gln Thr Thr
945 950 955 960
Glu Ala Phe Val Asn Gly Glu His Ala Val Asn Val Gly Gly Ser Lys
965 970 975
Phe Ile Phe Gly Pro Ile Ser Thr Ala Trp Ser Pro Phe Asp Asn Lys
980 985 990
Ile Val Val Tyr Lys Asp Asp Val Tyr Asn Gln Asp Phe Pro Pro Tyr
995 1000 1005
Gly Ser Gly Gln Pro Gly Arg Phe Gly Asp Ile Gln Ser Arg Thr
1010 1015 1020
Val Glu Ser Lys Asp Leu Tyr Ala Asn Thr Ala Leu Lys Leu Ser
1025 1030 1035
Arg Pro Ser Pro Gly Val Val His Val Pro Tyr Thr Gln Thr Pro
1040 1045 1050
Ser Gly Phe Lys Tyr Trp Leu Lys Glu Lys Gly Ser Ser Leu Asn
1055 1060 1065
Thr Lys Ala Pro Phe Gly Cys Lys Ile Lys Thr Asn Pro Val Arg
1070 1075 1080
Ala Met Asp Cys Ala Val Gly Ser Ile Pro Val Ser Met Asp Ile
1085 1090 1095
Pro Asp Ser Ala Phe Thr Arg Val Val Asp Ala Pro Ala Val Thr
1100 1105 1110
Asp Leu Ser Cys Gln Val Val Val Cys Thr His Ser Ser Asp Phe
1115 1120 1125
Gly Gly Val Ala Thr Leu Ser Tyr Lys Thr Asp Lys Pro Gly Lys
1130 1135 1140
Cys Ala Val His Ser His Ser Asn Val Ala Thr Leu Gln Glu Ala
1145 1150 1155
Thr Val Asp Val Lys Glu Asp Gly Lys Val Thr Val His Phe Ser
1160 1165 1170
Thr Ala Ser Ala Ser Pro Ala Phe Lys Val Ser Val Cys Asp Ala
1175 1180 1185
Lys Thr Thr Cys Thr Ala Ala Cys Glu Pro Pro Lys Asp His Ile
1190 1195 1200
Val Pro Tyr Gly Ala Ser His Asn Asn Gln Val Phe Pro Asp Met
1205 1210 1215
Ser Gly Thr Ala Met Thr Trp Val Gln Arg Leu Ala Ser Gly Leu
1220 1225 1230
Gly Gly Leu Ala Leu Ile Ala Val Val Val Leu Val Leu Val Thr
1235 1240 1245
Cys Ile Thr Met Arg Arg
1250
<210> 12
<211> 2480
<212> PRT
<213> Ross river virus
<400> 12
Met Lys Val Thr Val Asp Val Glu Ala Asp Ser Pro Phe Leu Lys Ala
1 5 10 15
Leu Gln Lys Ala Phe Pro Ala Phe Glu Val Glu Ser Gln Gln Val Thr
20 25 30
Pro Asn Asp His Ala Asn Ala Arg Ala Phe Ser His Leu Ala Thr Lys
35 40 45
Leu Ile Glu Gln Glu Val Pro Thr Asn Ile Thr Ile Leu Asp Val Gly
50 55 60
Ser Ala Pro Ala Arg Arg Leu Met Ser Asp His Ser Tyr His Cys Ile
65 70 75 80
Cys Pro Met Lys Ser Ala Glu Asp Pro Glu Arg Leu Ala Asn Tyr Ala
85 90 95
Arg Lys Leu Ala Lys Ala Ala Gly Glu Val Leu Asp Lys Asn Val Ser
100 105 110
Gly Lys Ile Thr Asp Leu Gln Asp Val Met Ala Thr Pro Asp Leu Glu
115 120 125
Ser Pro Thr Phe Cys Leu His Thr Asp Glu Thr Cys Arg Thr Arg Ala
130 135 140
Glu Val Ala Val Tyr Gln Asp Val Tyr Ala Val His Ala Pro Thr Ser
145 150 155 160
Leu Tyr His Gln Ala Met Lys Gly Val Arg Thr Val Tyr Trp Ile Gly
165 170 175
Phe Asp Thr Thr Pro Phe Met Phe Glu Val Leu Ala Gly Ala Tyr Pro
180 185 190
Thr Tyr Ser Thr Asn Trp Ala Asp Glu Gln Val Leu Gln Ala Arg Asn
195 200 205
Ile Gly Leu Cys Ala Thr Ser Leu Ser Glu Gly His Arg Gly Lys Leu
210 215 220
Ser Ile Met Arg Lys Lys Arg Leu Arg Pro Ser Asp Arg Val Met Phe
225 230 235 240
Ser Val Gly Ser Thr Leu Tyr Ile Glu Ser Arg Arg Leu Leu Lys Ser
245 250 255
Trp His Leu Pro Ser Val Phe His Leu Lys Gly Lys Asn Ser Phe Thr
260 265 270
Cys Arg Cys Asp Thr Ile Val Ser Cys Glu Gly Tyr Val Val Lys Lys
275 280 285
Ile Thr Met Ser Pro Gly Thr Tyr Gly Lys Thr Val Gly Tyr Ala Val
290 295 300
Thr His His Ala Glu Gly Phe Leu Met Cys Lys Val Thr Asp Thr Val
305 310 315 320
Arg Gly Glu Arg Val Ser Phe Pro Val Cys Thr Tyr Val Pro Ala Thr
325 330 335
Ile Cys Asp Gln Met Thr Gly Ile Leu Ala Thr Asp Val Thr Pro Glu
340 345 350
Asp Ala Gln Lys Leu Leu Val Gly Leu Asn Gln Arg Ile Val Val Asn
355 360 365
Gly Arg Thr Gln Arg Asn Thr Asn Thr Met Lys Asn Tyr Leu Leu Pro
370 375 380
Val Val Ala Gln Ala Phe Ser Lys Trp Ala Arg Glu Ala Lys Ala Asp
385 390 395 400
Met Glu Asp Glu Lys Pro Leu Gly Thr Arg Glu Arg Thr Leu Thr Cys
405 410 415
Cys Cys Leu Trp Ala Phe Lys Ser His Lys Thr His Thr Met Tyr Lys
420 425 430
Arg Pro Asp Thr Gln Thr Ile Val Lys Val Pro Ser Thr Phe Asp Ser
435 440 445
Phe Val Ile Pro Ser Leu Trp Ser Ser Ser Leu Ser Ile Gly Leu Arg
450 455 460
Gln Arg Ile Lys Leu Leu Leu Gly Pro Lys Leu Ser Arg Asp Leu Pro
465 470 475 480
Tyr Ser Gly Asp Arg Asn Glu Ala Arg Glu Ala Glu Lys Glu Ala Glu
485 490 495
Glu Thr Lys Glu Ala Glu Leu Thr Arg Glu Ala Leu Pro Pro Leu Val
500 505 510
Gly Ser Asn Cys Ala Asp Asp Val Asp Arg Val Asp Val Glu Glu Leu
515 520 525
Thr Tyr Arg Ala Gly Ala Gly Val Val Glu Thr Pro Arg Asn Ala Leu
530 535 540
Arg Val Thr Pro Gln Glu Arg Asp Gln Leu Ile Gly Ala Tyr Leu Ile
545 550 555 560
Leu Ser Pro Gln Ala Val Leu Lys Ser Glu Lys Leu Thr Pro Ile His
565 570 575
Pro Leu Ala Glu Gln Val Thr Ile Met Thr His Ser Gly Arg Ser Gly
580 585 590
Arg Tyr Pro Val Asp Arg Tyr Asp Gly Arg Val Leu Val Pro Thr Gly
595 600 605
Ala Ala Ile Pro Val Ser Glu Phe Gln Ala Leu Ser Glu Ser Ala Thr
610 615 620
Met Val Tyr Asn Glu Arg Glu Phe Ile Asn Arg Lys Leu His His Ile
625 630 635 640
Ala Leu Tyr Gly Pro Ala Leu Asn Thr Glu Glu Glu Asn Tyr Glu Lys
645 650 655
Val Arg Ala Glu Arg Ala Glu Ala Glu Tyr Val Phe Asp Val Asp Lys
660 665 670
Arg Met Cys Val Lys Arg Glu Glu Ala Ser Gly Leu Val Leu Val Gly
675 680 685
Asp Leu Ile Asn Pro Pro Phe His Glu Phe Ala Tyr Glu Gly Leu Lys
690 695 700
Ile Arg Pro Ala Thr Pro Phe Gln Thr Thr Val Ile Gly Val Phe Gly
705 710 715 720
Val Pro Gly Ser Gly Lys Ser Ala Ile Ile Lys Ser Val Val Thr Thr
725 730 735
Arg Asp Leu Val Ala Ser Gly Lys Lys Glu Asn Cys Gln Glu Ile Val
740 745 750
Asn Asp Val Lys Lys Gln Arg Gly Leu Asp Val Thr Ala Arg Thr Val
755 760 765
Asp Ser Ile Leu Leu Asn Gly Cys Arg Arg Gly Val Glu Asn Leu Tyr
770 775 780
Val Asp Glu Ala Phe Ala Cys His Ser Gly Thr Leu Leu Ala Leu Ile
785 790 795 800
Ala Met Val Lys Pro Thr Gly Lys Val Ile Leu Cys Gly Asp Pro Lys
805 810 815
Gln Cys Gly Phe Phe Asn Leu Met Gln Leu Lys Val Asn Phe Asn His
820 825 830
Asp Ile Cys Thr Gln Val Leu His Lys Ser Ile Ser Arg Arg Cys Thr
835 840 845
Leu Pro Ile Thr Ala Ile Val Ser Thr Leu His Tyr Gln Gly Lys Met
850 855 860
Arg Thr Thr Asn Leu Cys Ser Ala Pro Ile Gln Ile Asp Thr Thr Gly
865 870 875 880
Thr Thr Lys Pro Ala Lys Gly Asp Ile Val Leu Thr Cys Phe Arg Gly
885 890 895
Trp Val Lys Gln Leu Gln Ile Asp Tyr Arg Gly His Glu Val Met Thr
900 905 910
Ala Ala Ala Ser Gln Gly Leu Thr Arg Lys Gly Val Tyr Ala Val Arg
915 920 925
Gln Lys Val Asn Glu Asn Pro Leu Tyr Ala Pro Ser Ser Glu His Val
930 935 940
Asn Val Leu Leu Thr Arg Thr Glu Asn Arg Leu Val Trp Lys Thr Leu
945 950 955 960
Ser Gly Asp Pro Trp Ile Lys Val Leu Thr Asn Ile Pro Lys Gly Asp
965 970 975
Phe Ser Ala Thr Leu Glu Glu Trp Gln Glu Glu His Asp Asn Ile Met
980 985 990
Asn Ala Leu Arg Glu Arg Ser Thr Ala Val Asp Pro Phe Gln Asn Lys
995 1000 1005
Ala Lys Val Cys Trp Ala Lys Cys Leu Val Gln Val Leu Glu Thr
1010 1015 1020
Ala Gly Ile Arg Met Thr Ala Glu Glu Trp Asp Thr Val Leu Ala
1025 1030 1035
Phe Arg Glu Asp Arg Ala Tyr Ser Pro Glu Val Ala Leu Asn Glu
1040 1045 1050
Ile Cys Thr Lys Tyr Tyr Gly Val Asp Leu Asp Ser Gly Leu Phe
1055 1060 1065
Ser Ala Gln Ser Val Ser Leu Tyr Tyr Glu Asn Asn His Trp Asp
1070 1075 1080
Asn Arg Pro Gly Gly Arg Met Tyr Gly Phe Asn Arg Glu Val Ala
1085 1090 1095
Arg Lys Phe Glu Gln Arg Tyr Pro Phe Leu Arg Gly Lys Met Asp
1100 1105 1110
Ser Gly Leu Gln Val Asn Val Pro Glu Arg Lys Val Gln Pro Phe
1115 1120 1125
Asn Ala Glu Cys Asn Ile Leu Pro Ser Asn Arg Arg Leu Pro His
1130 1135 1140
Ala Leu Val Thr Ser Tyr Gln Gln Cys Gln Gly Glu Arg Val Glu
1145 1150 1155
Trp Leu Leu Lys Lys Leu Pro Gly Tyr His Leu Leu Leu Val Ser
1160 1165 1170
Glu Tyr Asn Leu Ala Leu Pro His Lys Arg Val Phe Trp Ile Ala
1175 1180 1185
Pro Pro His Val Ser Gly Ala Asp Arg Ile Tyr Asp Leu Asp Leu
1190 1195 1200
Gly Leu Pro Leu Asn Ala Gly Arg Tyr Asp Leu Val Phe Val Asn
1205 1210 1215
Ile His Thr Glu Tyr Arg Thr His His Tyr Gln Gln Cys Val Asp
1220 1225 1230
His Ser Met Lys Leu Gln Met Leu Gly Gly Asp Ser Leu His Leu
1235 1240 1245
Leu Lys Pro Gly Gly Ser Leu Leu Ile Arg Ala Tyr Gly Tyr Ala
1250 1255 1260
Asp Arg Val Ser Glu Met Val Val Thr Ala Leu Ala Arg Lys Phe
1265 1270 1275
Ser Ala Phe Arg Val Leu Arg Pro Ala Cys Val Thr Ser Asn Thr
1280 1285 1290
Glu Val Phe Leu Leu Phe Thr Asn Phe Asp Asn Gly Arg Arg Ala
1295 1300 1305
Val Thr Leu His Gln Ala Asn Gln Arg Leu Ser Ser Met Phe Ala
1310 1315 1320
Cys Asn Gly Leu His Thr Ala Gly Cys Ala Pro Ser Tyr Arg Val
1325 1330 1335
Arg Arg Thr Asp Ile Ser Gly His Ala Glu Glu Ala Val Val Asn
1340 1345 1350
Ala Ala Asn Ala Lys Gly Thr Val Gly Asp Gly Val Cys Arg Ala
1355 1360 1365
Val Ala Arg Lys Trp Pro Asp Ser Phe Lys Gly Ala Ala Thr Pro
1370 1375 1380
Val Gly Thr Ala Lys Leu Val Gln Ala Asn Gly Met Asn Val Ile
1385 1390 1395
His Ala Val Gly Pro Asn Phe Ser Thr Val Thr Glu Ala Glu Gly
1400 1405 1410
Asp Arg Glu Leu Ala Ala Ala Tyr Arg Ala Val Ala Gly Ile Ile
1415 1420 1425
Asn Ala Ser Asn Ile Lys Ser Val Ala Ile Pro Leu Leu Ser Thr
1430 1435 1440
Gly Val Phe Ser Gly Gly Lys Asp Arg Val Met Gln Ser Leu Asn
1445 1450 1455
His Leu Phe Thr Ala Met Asp Thr Thr Asp Ala Asp Val Val Ile
1460 1465 1470
Tyr Cys Arg Asp Lys Ala Trp Glu Lys Lys Ile Gln Glu Ala Ile
1475 1480 1485
Asp Arg Arg Thr Ala Val Glu Leu Val Ser Glu Asp Ile Ser Leu
1490 1495 1500
Glu Ser Asp Leu Ile Arg Val His Pro Asp Ser Cys Leu Val Gly
1505 1510 1515
Arg Lys Gly Tyr Ser Ile Thr Asp Gly Lys Leu His Ser Tyr Leu
1520 1525 1530
Glu Gly Thr Arg Phe His Gln Thr Ala Val Asp Met Ala Glu Ile
1535 1540 1545
Ser Thr Leu Trp Pro Lys Leu Gln Asp Ala Asn Glu Gln Ile Cys
1550 1555 1560
Leu Tyr Ala Leu Gly Glu Ser Met Asp Ser Ile Arg Thr Lys Cys
1565 1570 1575
Pro Val Glu Asp Ala Asp Ser Ser Thr Pro Pro Lys Thr Val Pro
1580 1585 1590
Cys Leu Cys Arg Tyr Ala Met Thr Ala Glu Arg Val Ala Arg Leu
1595 1600 1605
Arg Met Asn Asn Thr Lys Ala Ile Ile Val Cys Ser Ser Phe Pro
1610 1615 1620
Leu Pro Lys Tyr Arg Ile Glu Gly Val Gln Lys Val Lys Cys Asp
1625 1630 1635
Arg Val Leu Ile Phe Asp Gln Thr Val Pro Ser Leu Val Ser Pro
1640 1645 1650
Arg Lys Tyr Ile Pro Ala Ala Ala Ser Thr His Ala Asp Thr Val
1655 1660 1665
Ser Leu Asp Ser Thr Val Ser Thr Gly Ser Ala Trp Ser Phe Pro
1670 1675 1680
Ser Glu Ala Thr Tyr Glu Thr Met Glu Val Val Ala Glu Val His
1685 1690 1695
His Ser Glu Pro Pro Val Pro Pro Pro Arg Arg Arg Arg Ala Gln
1700 1705 1710
Val Thr Met His His Gln Glu Leu Leu Glu Val Ser Asp Met His
1715 1720 1725
Thr Pro Ile Ala Ala Arg Val Glu Ile Pro Val Tyr Asp Thr Ala
1730 1735 1740
Val Val Val Glu Arg Val Ala Ile Pro Cys Thr Ser Glu Tyr Ala
1745 1750 1755
Lys Pro Ile Pro Ala Pro Arg Ala Ala Arg Val Val Pro Val Pro
1760 1765 1770
Ala Pro Arg Ile Gln Arg Ala Ser Thr Tyr Arg Val Ser Pro Thr
1775 1780 1785
Pro Thr Pro Arg Val Leu Arg Ala Ser Val Cys Ser Val Thr Thr
1790 1795 1800
Ser Ala Gly Val Glu Phe Pro Trp Ala Pro Glu Asp Leu Glu Val
1805 1810 1815
Leu Thr Glu Pro Val His Cys Lys Met Arg Glu Pro Val Glu Leu
1820 1825 1830
Pro Trp Glu Pro Glu Asp Val Asp Ile Gln Phe Gly Asp Phe Glu
1835 1840 1845
Thr Ser Asp Lys Ile Gln Phe Gly Asp Ile Asp Phe Asp Gln Phe
1850 1855 1860
Leu Gly Arg Ala Gly Ala Tyr Ile Phe Ser Ser Asp Thr Gly Pro
1865 1870 1875
Gly His Leu Gln Gln Lys Ser Val Arg Gln His Ala Leu Pro Cys
1880 1885 1890
Glu Met Leu Tyr Val His Glu Glu Glu Arg Thr Tyr Pro Pro Ala
1895 1900 1905
Leu Asp Glu Ala Arg Glu Lys Leu Leu Gln Ala Lys Met Gln Met
1910 1915 1920
Ala Pro Thr Glu Ala Asn Lys Ser Arg Tyr Gln Ser Arg Lys Val
1925 1930 1935
Glu Asn Met Lys Ala Val Ile Ile Asp Arg Leu Lys Asp Gly Ala
1940 1945 1950
Arg Thr Tyr Leu Thr Glu Gln Ser Glu Lys Ile Pro Thr Tyr Val
1955 1960 1965
Ser Lys Tyr Pro Arg Pro Val Tyr Ser Pro Ser Val Glu Asp Ser
1970 1975 1980
Leu Gln Asn Pro Glu Val Ala Val Ala Ala Cys Asn Ala Phe Leu
1985 1990 1995
Glu Ala Asn Tyr Pro Thr Val Ala Ser Tyr Gln Ile Thr Asp Glu
2000 2005 2010
Tyr Asp Ala Tyr Leu Asp Met Val Asp Gly Ser Glu Ser Cys Leu
2015 2020 2025
Asp Arg Ala Thr Phe Cys Pro Ala Lys Leu Arg Cys Tyr Pro Lys
2030 2035 2040
His His Ala Tyr His Gln Pro Gln Val Arg Ser Ala Val Pro Ser
2045 2050 2055
Pro Phe Gln Asn Thr Leu Gln Asn Val Leu Ala Ala Ala Thr Lys
2060 2065 2070
Arg Asn Cys Asn Val Thr Gln Met Arg Glu Leu Pro Thr Leu Asp
2075 2080 2085
Ser Ala Val Leu Asn Val Glu Cys Phe Lys Lys Phe Ala Cys Asn
2090 2095 2100
Gly Glu Tyr Trp Gln Glu Phe Lys Asp Asn Pro Ile Arg Ile Thr
2105 2110 2115
Thr Glu Asn Ile Thr Thr Tyr Val Thr Arg Leu Lys Gly Pro Lys
2120 2125 2130
Ala Ala Ala Leu Phe Ala Lys Thr His Asn Leu Val Pro Leu Gln
2135 2140 2145
Glu Val Pro Met Asp Arg Phe Val Val Asp Met Lys Arg Asp Val
2150 2155 2160
Lys Val Thr Pro Gly Thr Lys His Thr Glu Glu Arg Pro Lys Val
2165 2170 2175
Gln Val Ile Gln Ala Ala Glu Pro Leu Ala Thr Ala Tyr Leu Cys
2180 2185 2190
Gly Ile His Arg Glu Leu Val Arg Arg Leu Lys Ala Val Leu Ala
2195 2200 2205
Pro Asn Ile His Thr Leu Phe Asp Met Ser Ala Glu Asp Phe Asp
2210 2215 2220
Ala Ile Ile Ala Ala His Phe Gln Pro Gly Asp Ala Val Leu Glu
2225 2230 2235
Thr Asp Ile Ala Ser Phe Asp Lys Ser Gln Asp Asp Ser Leu Ala
2240 2245 2250
Leu Thr Ala Leu Met Leu Leu Glu Asp Leu Gly Val Asp Gln Glu
2255 2260 2265
Leu Leu Asp Leu Ile Glu Ala Ala Phe Gly Glu Ile Thr Ser Val
2270 2275 2280
His Leu Pro Thr Gly Thr Arg Phe Lys Phe Gly Ala Met Met Lys
2285 2290 2295
Ser Gly Met Phe Leu Thr Leu Phe Val Asn Thr Leu Leu Asn Ile
2300 2305 2310
Val Ile Ala Cys Arg Val Leu Arg Glu Lys Leu Thr Asn Ser Val
2315 2320 2325
Cys Ala Ala Phe Ile Gly Asp Asp Asn Ile Val His Gly Val Arg
2330 2335 2340
Ser Asp Pro Leu Met Ala Glu Arg Cys Ala Ser Trp Val Asn Met
2345 2350 2355
Glu Val Lys Ile Ile Asp Ala Thr Met Cys Glu Lys Pro Pro Tyr
2360 2365 2370
Phe Cys Gly Gly Phe Ile Leu Tyr Asp Lys Val Thr Gly Ser Ala
2375 2380 2385
Cys Arg Val Ala Asp Pro Leu Lys Arg Leu Phe Lys Leu Gly Lys
2390 2395 2400
Pro Leu Pro Ala Gly Asp Thr Gln Asp Glu Asp Arg Arg Arg Ala
2405 2410 2415
Leu Lys Asp Glu Thr Asp Arg Trp Ala Arg Val Gly Leu Lys Ser
2420 2425 2430
Glu Leu Glu Ile Ala Leu Ser Ser Arg Tyr Glu Val Asn Gly Thr
2435 2440 2445
Gly Asn Ile Val Arg Ala Met Ala Thr Leu Ala Lys Ser Leu Lys
2450 2455 2460
Asn Phe Lys Lys Leu Arg Gly Pro Ile Val His Leu Tyr Gly Gly
2465 2470 2475
Pro Lys
2480
<210> 13
<211> 11412
<212> DNA
<213> Venezualan equine encephalitis virus
<400> 13
atgggcggcg catgagagaa gcccacacca attacctacc caaaaatgga gagagttcac 60
gttgacatcg aggaagacag cccattcctc agagctttgc aacggagctt cccgcagttt 120
gaggtagaag ccaagcaggt cactgataat gaccatgcta atgccagagc gttttcgcat 180
ctggcttcaa aattgatcga aacggaggtg gacccatccg acacgatcct tgacattgga 240
agtgcgcccg cccgcagaat gtattctaag cataagtatc attgcatctg tccgatgaga 300
tgcgcggaag atccggacag attgtacaag tatgcaacta agctgaagaa aaattgcaag 360
gaaataactg acaaggaatt ggacaagaaa atgaaggagc tcgccgccgt catgagcgac 420
cctgacctgg aaactgagac tatgtgcctc cacgacgatg agtcgtgtcg ctacgaaggg 480
caagtcgctg tttaccagga tgtatacgca gttgacggac cgacaagtct ctatcaccaa 540
gccaacaagg gagttagagt cgcctattgg ataggctttg acaccacccc ttttatgttt 600
aagaacttgg ctggagcata tccatcatac tctactaact gggccgacga aaccgtgtta 660
acggctcgta atataggcct atgcagctcc gacgttatgg agcggtcacg cagaggaatg 720
tccattctta ggaagaagta tttgaaacca tccaataatg tcttattctc tgttggctcg 780
accatctacc acgagaagag ggacttactg aggagctggc acctgccgtc tgtatttcac 840
ttacgtggca agcaaaatta cacatgtcgg tgtgagacta tagttagttg cgacgggtac 900
gtcgttaaaa gaatagctat cagtccaggc ctgtatggga agccttcagg ctatgctgct 960
acgatgcacc gcgagggatt cttgtgctgc aaagtgacag acacattgaa cggggagagg 1020
gtctcttttc ccgtgtgcac gtatgtgcca gctacattgt gtgaccaaat gactggcata 1080
ctggcaacag atgtcagtgc ggacgacgcg caaaaactgc tggttgggct caaccagcgc 1140
atagtcgtca acggtcgcac ccaaagaaat accaatacca tgaagaatta tcttttgccc 1200
gtagtggccc aggcatttgc taggtgggca aaggaatata aggaagatca agaagatgag 1260
aggccactag gactacgaga tagacagtta gtcatggggt gctgctgggc ttttagaagg 1320
cataagataa catctattta taagcgccca gatacccaaa ccatcatcaa agtgaacagc 1380
gatttccact cattcgtgct gcccaggata ggcagtaaca cattggagat cgggctgaga 1440
acaagaatca ggaaaatgct agaagagcac aaggagccgt cacctctcat tactgccgag 1500
gacatacaag aagctaagtg cgcagccgat gaggctaagg aggtgcgtga agccgaggag 1560
ttgcgcgccg cactaccacc tttggcagct gatgttgagg agcccactct ggaagccgat 1620
gttgacttga tgttacaaga ggctggggcc ggctcagtgg agacacctcg tggcttgata 1680
aaggttacca gctatgccgg cgaggacaag atcggctctt acgcagtgct ttctccgcag 1740
gctgtactta agagtgagaa actatcttgc attcaccctc tcgctgaaca agtcatagtg 1800
ataacacact ctggccgaaa agggcgttac gccgtggaac cctaccatgg aaaagtagtg 1860
gtgccagagg gacatgcaat acccgtccag gactttcaag ctctgagtga aagtgctacc 1920
attgtgtaca acgaacgaga gttcgtaaac aggtatctgc accatattgc cacacatgga 1980
ggagcgctga acacagatga agaatattac aaaactgtca agcccagcga gcacgatggc 2040
gaatacctgt atgacatcga caggaaacag tgcgtcaaga aagaactagt cactgggcta 2100
gggcttacag gcgagctggt ggaccctccc ttccatgaat tcgcctacga gagtctgaga 2160
acacgaccgg ccgctcctta ccaagtacca accatagggg tgtatggcgt gccgggatca 2220
ggcaagtctg gcatcatcaa aagcgcagtc accaaaaaag atctggtggt gagcgccaag 2280
aaagaaaact gcgcagaaat aataagggac gtcaagaaaa tgagagggct ggacgtcaat 2340
gccagaactg tggactcagt gctcttgaat ggatgcaaac accccgtaga gaccctgtat 2400
attgacgaag cttttgcttg tcatgcaggc actctcagag cgctcatagc catcataaga 2460
cctaaaaagg cagtgctctg cggggatcca aaacagtgcg gctttttcaa tatgatgtgt 2520
ctgaaagtgc attttaacca cgagatttgc acgcaggtct tccacaaaag catctctcgt 2580
cgttgcacta aatctgtgac ttcggtcgtc tcaaccttgt tttacgacaa aagaatgaga 2640
acgacgaacc cgaaagagac taagattgag attgacacta ctggcagtac caaaccaaag 2700
caggacgatc tcattctcac ttgttttaga gggtgggtga agcagttgca aatagattac 2760
aaaggcaacg agataatgac ggcagctgcc tctcaagggc tgacccgtaa aggcgtgtat 2820
gccgttcggt acaaggtgaa tgaaaacccc ctgtacgcac ccacctcaga acacgtgaac 2880
gtcctactga cccgcacgga ggaccgtatc gtgtggaaaa cactagccgg cgatccatgg 2940
ataaaaacac tgacggccaa gtatcctggg aatttcactg ccacgataga ggaatggcaa 3000
gcagagcatg atgccatcat gaggcacatc ttggagagac cggaccctac cgatgttttc 3060
caaaataagg cgaacgtgtg ttgggccaag gctttggtgc cggtactgaa gactgcaggc 3120
atagacatga ccactgaaca atggaacact gtggattatt tcgaaacgga caaagctcac 3180
tcagcagaga tagtgttgaa ccaactatgc gtgaggttct ttggactcga cctggactcc 3240
ggtctatttt ctgcacccac tgttccgctg tccattagga ataatcactg ggataattcc 3300
ccgtcgccta acatgtacgg gctgaataaa gaagtggtcc gtcagctctc ccgccggtac 3360
ccacaactgc ctcgagcagt tgccactgga agagtctatg acatgaacac tggtacactg 3420
cgcaattatg atccgcgcat aaatctagta cctgtgaaca gaagactgcc tcatgcttta 3480
gtcctccacc ataatgaaca cccgcagagt gatttttctt cattcgtcag caaactgaag 3540
ggcagaactg tcttggtggt cggggagaag ttgtccgtcc caggcaaaac ggttgattgg 3600
ttgtcagaca agcctgaggc taccttcaga gctcggctgg atttaggtat cccaggtgac 3660
gtgcccaaat acgacattat atttattaac gtgaggactc catataaata ccatcattat 3720
cagcagtgtg aagaccacgc cattaagctt agtatgttga ccaagaaagc ttgtctgcat 3780
ctgaatcccg gcggaacctg cgtcagcata ggttatggtt acgctgacag ggccagcgaa 3840
agcatcattg gtgctatagc gcggcagttc aagttctccc gggtatgcaa acctaaatcc 3900
tcacttgaag agacagaagt tctgtttgta ttcattgggt acgatcgcaa ggcccgtacg 3960
cataatcctt acaagctttc atctaccttg accaacatct atacaggttc cagactccac 4020
gaagccggat gcgcaccctc atatcatgtg gtgcgagggg atattgccat ggccaccgaa 4080
ggagtgatca taaatgccgc taacagcaaa ggacaacctg gcggaggggt gtgcggagcg 4140
ctgtataaga aattcccgga aagcttcgat ttacagccaa tcgaagtggg aaaagcgcga 4200
ctggtcaaag gtgcagctaa acacatcatt catgccgtag ggcccaactt caacaaagtt 4260
tcggaagttg aaggtgacaa acagttggca gaggcttatg agtccatcgc taaaattgtc 4320
aacgataaca attacaagtc agtagcgatt ccactgttgt ctaccggcat cttttctggt 4380
aacaaagatc gactaaccca atcattgaac catttgctga cagctttaga caccactgat 4440
gcagatgtag ccatatactg cagggacaag aaatgggaaa tgactctcaa ggaagcagtg 4500
gctaggagag aagcagtgga ggagatatgc atatccgacg actcttcggt gacagaaccg 4560
gatgcagagc tggtgagggt acatccgaag agttctttgg ctggcaggaa gggctacagc 4620
acaagtgatg gcaagacttt ctcatatttg gaagggacta aattccacca ggcggccaag 4680
gatatagcag aaattaatgc catgtggcct gttgcaacgg aggccaatga gcaagtatgc 4740
atgtatatcc tcggtgaaag catgagcagc attaggtcaa aatgccccgt cgaagaatcg 4800
gaagcctcca caccacctag cacgctgcct tgcttgtgca tccatgctat gactccagaa 4860
agagtacaac gcctaaaagc ctcgcgtcca gaacaaatta ctgtgtgctc atcctttcca 4920
ttgccgaagt atagaatcac tggtgtgcag aagatccagt gctcccagcc tatactgttc 4980
tcaccgaagg tgcctgcgta cattcatcca cggaagtacc tcgtggaaac accaccggtg 5040
gaagagattc cggagctgcc ggcggagaac caatccacag aggggacatc tgaacaacca 5100
gcaccaaacg tggatgcaac caggactaga acgcctgaac cgatcatcat tgaagaggaa 5160
gaagaggata gtataagttt gctgtcagac ggcccgaccc accaggtgct gcaagtcgag 5220
gcagacatcc acgggccgcc ttctgtatcc agctcatcct ggtccattcc tcacgcatcc 5280
gactttgatg tggacagttt atccatcctt gccctggagg gagctagcgt gactagcgag 5340
gcagcgtcag ccgagactaa ctcatacttc gcaaggagca tggagtttct ggcgcgaccg 5400
gtgcctgcgc ctcgaacagt attcaggaac cctccacatc ccgctccacg cacaagaaca 5460
ccgtcacttg cacccagcag ggccagctcg agaactagcc tggtttccac cccgccaggc 5520
gtgaataggg tgattactag agaggagctc gaggcgctta ccccgtcccg cgctcctagc 5580
aggtcggcct caagaactag tctggtctct aacccgccag gcgtaaatag ggtgattaca 5640
agagaggagt ttgaggcgtt cgtggcacaa caacaatgac ggtttgacgc gggtgcatac 5700
atcttttcct ccgataccgg tcaagggcat ttacaacaaa aatcagtaag gcaaacggtg 5760
ctatccgaag tggttttgga gaggaccgaa ttggagattt cgtatgcccc gcgcctcgac 5820
caagaaaaag aagaactact acgcaagaaa ttacagctga atcccacacc tgctaacaga 5880
agcagatacc agtccagaag ggtggagaac atgaaagcca taacagctag acgtattctg 5940
caaggcctag gacattattt gaaggcagaa ggaaaagtgg agtgctatcg aaccctgcat 6000
cctgttcctt tgtattcatc tagtgtgaat cgtgcttttt caagccccaa ggtcgcagtg 6060
gaagcctgca atgccatgct gaaagaaaac tttccgactg tagcttctta ctgtataatt 6120
ccagagtacg atgcctatct ggacatggtt gacggcgctt cttgttgctt agacactgcc 6180
agtttttgcc ctgcgaagct gcgcagtttt ccaaagaaac actcttactt ggaacccaca 6240
atacggtcgg cagtgccatc ggcgattcag aacacgctcc agaatgtcct ggcagctgcc 6300
acaaaaagaa attgcaacgt cacgcaaatg agagaattgc ccgtattgga ctcggctgcc 6360
tttaatgtgg aatgcttcaa gaaatatgcg tgcaataatg aatattggga aacgtttaaa 6420
gaaaacccca tcaggcttac tgaagaaaat gtggtaaatt acattactaa attaaaagga 6480
ccaaaagctg ctgctctttt tgcgaagaca cataatttaa atatgttaca ggacatacca 6540
atggacaggt ttgtaatgga cttaaagagg gacgtgaaag tgactccagg aacaaaacat 6600
actgaagaac gacccaaggt acaggtgatc caggccgccg atccgctagc gacagcgtat 6660
ctgtgcggaa tccaccggga gttggttagg agattaaatg ctgtcctgct tccgaacatc 6720
catacactgt ttgacatgtc ggctgaagac tttgacgcta ttattgccga gcatttccag 6780
cctggggact gtgttctgga aactgacatt gcgtcgtttg ataaaagtga ggacgacgcc 6840
atggctctga ccgcgttgat gattctggaa gatctaggag tggacgcaga gctgttgacg 6900
ctgattgagg cggctttcgg cgaaatatca tcaatacatt tgcccaccaa aactaaattt 6960
aaattcggag ccatgatgaa atccggaatg ttcctcacac tgtttgtgaa cacagtcatt 7020
aacatcgtaa tcgcaagcag agtgttaaga gagcggctaa ccggatcacc atgtgcagca 7080
ttcattggag atgacaatat cgtgaaagga gtcaaatctg acaaattaat ggcagacagg 7140
tgcgccactt ggttgaacat ggaagtcaag atcatagacg ccgtggtggg cgagaaagcg 7200
ccctatttct gtggagggtt tattttgtgt gactccgtga ccggcacagc gtgccgtgtg 7260
gcagaccccc taaaaaggct gtttaagctt ggcaaacctc tggcagcaga cgatgaacat 7320
gacgatgaca ggagaagggc attatacgaa gagtcaacac gctggaatcg agtgggaatt 7380
cttccagagc tgtgtaaggc agtagaatca aggtatgaaa ccgtaggaac ttccatcata 7440
gttatggcca tgactactct agctagcagt gttaagtcgt tcagctacct gagaggggcc 7500
cctataactc tctacggcta acctgaatgg actacgacat agtctagtcc gccaagatgt 7560
tcccgttcca accaatgtat ccgatgcagc caatgcccta tcgtaacccg ttcgcggccc 7620
cgcgcaggcc ctggttcccc agaaccgatc cttttctggc gatgcaggtg caggaattaa 7680
cccgctcgat ggctaacctg acgttcaagc aacgccggga tgcgccacct gaagggccac 7740
ccgctaagaa accgaagcgg gaggccccgc aaaaacaaaa agggggaggc caagggaaga 7800
agaagaagaa tcaggggaag aagaaggcta agacggggcc acctaatccg aaggcacaga 7860
gtggaaacaa gaagaagacc aacaagaaac caggcaagag acagcgcatg gtcatgaaat 7920
tggaatctga caagacattc ccaattatgc tggaagggaa gattaacggc tacgcttgcg 7980
tggtcggagg gaagttattc aggccgatgc acgtggaagg caagatcgac aatgacgttc 8040
tggccgcact taagacgaag aaagcatcca aatatgatct tgagtatgca gatgtgccac 8100
agaacatgcg ggccgataca ttcaagtaca cccacgagaa gccccaaggc tattatagct 8160
ggcatcatgg agcagtccaa tatgaaaatg ggcgtttcac ggtgccaaaa ggagttgggg 8220
ccaagggaga cagcggacga cccattctgg acaatcaggg acgggtggtc gctattgtgc 8280
tgggaggtgt gaatgaagga tctaggacag ccctttcagt cgtcatgtgg aacgagaagg 8340
gagtaactgt gaagtatact ccggagaact gcgagcaatg gtcactagtg accaccctgt 8400
gtctgctcgc caatgtgacg ttcccatgtg cccaaccacc aatttgctac gacagaaaac 8460
cagcagagac cttggccatg ctcagcgtta acgttgacaa cccgggctac gatgagctgc 8520
tggaagcagc tgttaggtgc cccggaagaa aaaggagatc taccgaggag ctgtttaagg 8580
agtataagct aacgcgccct tacatggcca gatgcatcag atgtgccgtt gggagctgcc 8640
atagtccaat agcaattgag gcagtgaaga gcgacgggca cgacggctat gttagacttc 8700
agacttcctc gcagtacggc ctggattcct ctggcaactt aaagggaagg accatgcggt 8760
atgacatgca cggaaccatt gaagagatac cgctacatca agtgtcactc cacacatctc 8820
gcccgtgtca cattgtggat gggcatggtt attttctgct tgctaggtgc ccggcagggg 8880
actccatcac tatggaattt aagaaagatt cagtcacaca ctcctgctca gtgccgtatg 8940
aagtgaaatt taatcctgta ggcagagaac tctacactca tcccccagaa cacggagcag 9000
agcaagcgtg ccaagtctac gcgcatgatg cacagaacag aggagcttat gtcgagatgc 9060
acctcccggg ctcagaagtg gacagcagtt tggtttcctt gagcggcagt tcagtcaccg 9120
tgacacctcc tgctgggact agcgccctgg tggaatgcga gtgcggcggc acaaagatct 9180
ccgagaccat caacacggca aaacagttca gccagtgcac aaagaaggag caatgcagag 9240
catatcgact gcagaatgac aaatgggtgt ataattctga caaactgccc aaagcagcgg 9300
gagccaccct aaaaggaaaa ctacacgtcc catttttgct ggcagacggc aaatgcaccg 9360
tgcctctagc accggaacct atgataacct tcggtttccg atcagtgtca ctgaaactgc 9420
accctaagaa tcccacatat ctgaccactc gccaacttgc tgatgagcct cattacacgc 9480
acgagctcat atctgaacca gctgttagga attttaccgt cactgaaaag gggtgggagt 9540
ttgtatgggg aaaccacccg ccgaaaaggt tttgggcaca ggaaacagca cccggaaatc 9600
cacatgggct gccacacgag gtgataactc attattacca cagataccct atgtccacca 9660
tcctgggttt atcaatttgc gccgccattg taaccgtttc cgttgcagcg tctacctggc 9720
tgttctgcaa atccagagtt tcgtgcctaa ctccttaccg gctaacacct aacgccagga 9780
tgccgctttg cctggctgtg ctttgctgcg ctcgcactgc ccgggccgag accacctggg 9840
agtccttgga tcacctatgg aacaataacc agcagatgtt ctggattcaa ttgctgatcc 9900
ccctggccgc cttgattgta gtgactcgcc tgctcaagtg cgtgtgctgt gtagtgcctt 9960
ttttagtcgt ggccggcgcc gcaggcgccg gcgcctacga gcacgcgacc acgatgccga 10020
gccaagtggg aatctcgtat aacaccatag tcaacagagc aggctacgcg ccactcccta 10080
tcagcataac accaacaaag atcaagctga tacctacagt gaacttggag tacatcacct 10140
gccactacaa aacaggaatg gattcaccag ccattaagtg ctgcggatct caggaatgta 10200
ctccaactta caggcctgat gaacagtgca aagtcttcac tggggtttac ccgttcatgt 10260
ggggaggcgc atattgcttt tgcgacactg agaacaccca agtcagcaag gcctacgtaa 10320
tgaaatctga cgactgcctt gctgatcacg ctgaagcata caaagcgcac acagcctcag 10380
tgcaggcgtt cctcaacatc acagtgggag aacactctat tgtgaccacc gtgtatgtga 10440
atggagaaac tcctgtgaac ttcaatgggg tcaaattaac tgcaggtcca ctttccacag 10500
cttggacacc ctttgaccgc aaaatcgtgc agtatgccgg ggagatctat aattacgatt 10560
ttcctgagta cggggcagga caaccaggag catttggaga catacaatcc agaacagtct 10620
cgagctcaga tctgtatgcc aataccaacc tagtgctgca gagacccaaa gcaggagcga 10680
tccatgtgcc atacactcag gcaccatcgg gttttgagca atggaagaaa gataaagctc 10740
cgtcattgaa attcaccgcc cctttcggat gcgaaatata tacaaacccc attcgcgccg 10800
aaaattgtgc cgtagggtca attccattag cctttgacat ccccgacgcc ttgttcacca 10860
gggtgtcaga cacaccgaca ctttcagcgg ccgaatgcac tcttaacgag tgcgtgtatt 10920
catccgactt tggcgggatc gccacggtca agtattcggc cagcaagtca ggcaagtgcg 10980
cagtccatgt gccatcaggg actgctaccc taaaagaagc agcagtcgag ttaaccgagc 11040
aagggtcggt gaccattcat ttctcgaccg caaatatcca cccggagttc aggctccaaa 11100
tatgcacatc atatgtcatg tgcaaaggtg attgtcaccc cccgaaagac cacattgtga 11160
cacacccaca gtatcacgcc caaacattta cagccgcggt gtcaaaaacc gcgtggacgt 11220
ggttaacatc cctgctggga ggatcggccg taattattat aattggctta gtgctggcta 11280
ctattgtggc catgtacgtg ctgaccaacc agaaacataa ttgaacatag cagcaattgg 11340
caagctgctt atatagaact cgcggcgatt ggcatgccgc tttaaaattt tattttattt 11400
tcttttcttt tc 11412
<210> 14
<211> 1255
<212> PRT
<213> Venezualan equine encephalitis virus
<400> 14
Met Phe Pro Phe Gln Pro Met Tyr Pro Met Gln Pro Met Pro Tyr Arg
1 5 10 15
Asn Pro Phe Ala Ala Pro Arg Arg Pro Trp Phe Pro Arg Thr Asp Pro
20 25 30
Phe Leu Ala Met Gln Val Gln Glu Leu Thr Arg Ser Met Ala Asn Leu
35 40 45
Thr Phe Lys Gln Arg Arg Asp Ala Pro Pro Glu Gly Pro Pro Ala Lys
50 55 60
Lys Pro Lys Arg Glu Ala Pro Gln Lys Gln Lys Gly Gly Gly Gln Gly
65 70 75 80
Lys Lys Lys Lys Asn Gln Gly Lys Lys Lys Ala Lys Thr Gly Pro Pro
85 90 95
Asn Pro Lys Ala Gln Ser Gly Asn Lys Lys Lys Thr Asn Lys Lys Pro
100 105 110
Gly Lys Arg Gln Arg Met Val Met Lys Leu Glu Ser Asp Lys Thr Phe
115 120 125
Pro Ile Met Leu Glu Gly Lys Ile Asn Gly Tyr Ala Cys Val Val Gly
130 135 140
Gly Lys Leu Phe Arg Pro Met His Val Glu Gly Lys Ile Asp Asn Asp
145 150 155 160
Val Leu Ala Ala Leu Lys Thr Lys Lys Ala Ser Lys Tyr Asp Leu Glu
165 170 175
Tyr Ala Asp Val Pro Gln Asn Met Arg Ala Asp Thr Phe Lys Tyr Thr
180 185 190
His Glu Lys Pro Gln Gly Tyr Tyr Ser Trp His His Gly Ala Val Gln
195 200 205
Tyr Glu Asn Gly Arg Phe Thr Val Pro Lys Gly Val Gly Ala Lys Gly
210 215 220
Asp Ser Gly Arg Pro Ile Leu Asp Asn Gln Gly Arg Val Val Ala Ile
225 230 235 240
Val Leu Gly Gly Val Asn Glu Gly Ser Arg Thr Ala Leu Ser Val Val
245 250 255
Met Trp Asn Glu Lys Gly Val Thr Val Lys Tyr Thr Pro Glu Asn Cys
260 265 270
Glu Gln Trp Ser Leu Val Thr Thr Leu Cys Leu Leu Ala Asn Val Thr
275 280 285
Phe Pro Cys Ala Gln Pro Pro Ile Cys Tyr Asp Arg Lys Pro Ala Glu
290 295 300
Thr Leu Ala Met Leu Ser Val Asn Val Asp Asn Pro Gly Tyr Asp Glu
305 310 315 320
Leu Leu Glu Ala Ala Val Arg Cys Pro Gly Arg Lys Arg Arg Ser Thr
325 330 335
Glu Glu Leu Phe Lys Glu Tyr Lys Leu Thr Arg Pro Tyr Met Ala Arg
340 345 350
Cys Ile Arg Cys Ala Val Gly Ser Cys His Ser Pro Ile Ala Ile Glu
355 360 365
Ala Val Lys Ser Asp Gly His Asp Gly Tyr Val Arg Leu Gln Thr Ser
370 375 380
Ser Gln Tyr Gly Leu Asp Ser Ser Gly Asn Leu Lys Gly Arg Thr Met
385 390 395 400
Arg Tyr Asp Met His Gly Thr Ile Glu Glu Ile Pro Leu His Gln Val
405 410 415
Ser Leu His Thr Ser Arg Pro Cys His Ile Val Asp Gly His Gly Tyr
420 425 430
Phe Leu Leu Ala Arg Cys Pro Ala Gly Asp Ser Ile Thr Met Glu Phe
435 440 445
Lys Lys Asp Ser Val Thr His Ser Cys Ser Val Pro Tyr Glu Val Lys
450 455 460
Phe Asn Pro Val Gly Arg Glu Leu Tyr Thr His Pro Pro Glu His Gly
465 470 475 480
Ala Glu Gln Ala Cys Gln Val Tyr Ala His Asp Ala Gln Asn Arg Gly
485 490 495
Ala Tyr Val Glu Met His Leu Pro Gly Ser Glu Val Asp Ser Ser Leu
500 505 510
Val Ser Leu Ser Gly Ser Ser Val Thr Val Thr Pro Pro Ala Gly Thr
515 520 525
Ser Ala Leu Val Glu Cys Glu Cys Gly Gly Thr Lys Ile Ser Glu Thr
530 535 540
Ile Asn Thr Ala Lys Gln Phe Ser Gln Cys Thr Lys Lys Glu Gln Cys
545 550 555 560
Arg Ala Tyr Arg Leu Gln Asn Asp Lys Trp Val Tyr Asn Ser Asp Lys
565 570 575
Leu Pro Lys Ala Ala Gly Ala Thr Leu Lys Gly Lys Leu His Val Pro
580 585 590
Phe Leu Leu Ala Asp Gly Lys Cys Thr Val Pro Leu Ala Pro Glu Pro
595 600 605
Met Ile Thr Phe Gly Phe Arg Ser Val Ser Leu Lys Leu His Pro Lys
610 615 620
Asn Pro Thr Tyr Leu Thr Thr Arg Gln Leu Ala Asp Glu Pro His Tyr
625 630 635 640
Thr His Glu Leu Ile Ser Glu Pro Ala Val Arg Asn Phe Thr Val Thr
645 650 655
Glu Lys Gly Trp Glu Phe Val Trp Gly Asn His Pro Pro Lys Arg Phe
660 665 670
Trp Ala Gln Glu Thr Ala Pro Gly Asn Pro His Gly Leu Pro His Glu
675 680 685
Val Ile Thr His Tyr Tyr His Arg Tyr Pro Met Ser Thr Ile Leu Gly
690 695 700
Leu Ser Ile Cys Ala Ala Ile Val Thr Val Ser Val Ala Ala Ser Thr
705 710 715 720
Trp Leu Phe Cys Lys Ser Arg Val Ser Cys Leu Thr Pro Tyr Arg Leu
725 730 735
Thr Pro Asn Ala Arg Met Pro Leu Cys Leu Ala Val Leu Cys Cys Ala
740 745 750
Arg Thr Ala Arg Ala Glu Thr Thr Trp Glu Ser Leu Asp His Leu Trp
755 760 765
Asn Asn Asn Gln Gln Met Phe Trp Ile Gln Leu Leu Ile Pro Leu Ala
770 775 780
Ala Leu Ile Val Val Thr Arg Leu Leu Lys Cys Val Cys Cys Val Val
785 790 795 800
Pro Phe Leu Val Val Ala Gly Ala Ala Gly Ala Gly Ala Tyr Glu His
805 810 815
Ala Thr Thr Met Pro Ser Gln Val Gly Ile Ser Tyr Asn Thr Ile Val
820 825 830
Asn Arg Ala Gly Tyr Ala Pro Leu Pro Ile Ser Ile Thr Pro Thr Lys
835 840 845
Ile Lys Leu Ile Pro Thr Val Asn Leu Glu Tyr Ile Thr Cys His Tyr
850 855 860
Lys Thr Gly Met Asp Ser Pro Ala Ile Lys Cys Cys Gly Ser Gln Glu
865 870 875 880
Cys Thr Pro Thr Tyr Arg Pro Asp Glu Gln Cys Lys Val Phe Thr Gly
885 890 895
Val Tyr Pro Phe Met Trp Gly Gly Ala Tyr Cys Phe Cys Asp Thr Glu
900 905 910
Asn Thr Gln Val Ser Lys Ala Tyr Val Met Lys Ser Asp Asp Cys Leu
915 920 925
Ala Asp His Ala Glu Ala Tyr Lys Ala His Thr Ala Ser Val Gln Ala
930 935 940
Phe Leu Asn Ile Thr Val Gly Glu His Ser Ile Val Thr Thr Val Tyr
945 950 955 960
Val Asn Gly Glu Thr Pro Val Asn Phe Asn Gly Val Lys Leu Thr Ala
965 970 975
Gly Pro Leu Ser Thr Ala Trp Thr Pro Phe Asp Arg Lys Ile Val Gln
980 985 990
Tyr Ala Gly Glu Ile Tyr Asn Tyr Asp Phe Pro Glu Tyr Gly Ala Gly
995 1000 1005
Gln Pro Gly Ala Phe Gly Asp Ile Gln Ser Arg Thr Val Ser Ser
1010 1015 1020
Ser Asp Leu Tyr Ala Asn Thr Asn Leu Val Leu Gln Arg Pro Lys
1025 1030 1035
Ala Gly Ala Ile His Val Pro Tyr Thr Gln Ala Pro Ser Gly Phe
1040 1045 1050
Glu Gln Trp Lys Lys Asp Lys Ala Pro Ser Leu Lys Phe Thr Ala
1055 1060 1065
Pro Phe Gly Cys Glu Ile Tyr Thr Asn Pro Ile Arg Ala Glu Asn
1070 1075 1080
Cys Ala Val Gly Ser Ile Pro Leu Ala Phe Asp Ile Pro Asp Ala
1085 1090 1095
Leu Phe Thr Arg Val Ser Asp Thr Pro Thr Leu Ser Ala Ala Glu
1100 1105 1110
Cys Thr Leu Asn Glu Cys Val Tyr Ser Ser Asp Phe Gly Gly Ile
1115 1120 1125
Ala Thr Val Lys Tyr Ser Ala Ser Lys Ser Gly Lys Cys Ala Val
1130 1135 1140
His Val Pro Ser Gly Thr Ala Thr Leu Lys Glu Ala Ala Val Glu
1145 1150 1155
Leu Thr Glu Gln Gly Ser Val Thr Ile His Phe Ser Thr Ala Asn
1160 1165 1170
Ile His Pro Glu Phe Arg Leu Gln Ile Cys Thr Ser Tyr Val Met
1175 1180 1185
Cys Lys Gly Asp Cys His Pro Pro Lys Asp His Ile Val Thr His
1190 1195 1200
Pro Gln Tyr His Ala Gln Thr Phe Thr Ala Ala Val Ser Lys Thr
1205 1210 1215
Ala Trp Thr Trp Leu Thr Ser Leu Leu Gly Gly Ser Ala Val Ile
1220 1225 1230
Ile Ile Ile Gly Leu Val Leu Ala Thr Ile Val Ala Met Tyr Val
1235 1240 1245
Leu Thr Asn Gln Lys His Asn
1250 1255
<210> 15
<211> 2491
<212> PRT
<213> Venezualan equine encephalitis virus
<400> 15
Met Glu Arg Val His Val Asp Ile Glu Glu Asp Ser Pro Phe Leu Arg
1 5 10 15
Ala Leu Gln Arg Ser Phe Pro Gln Phe Glu Val Glu Ala Lys Gln Val
20 25 30
Thr Asp Asn Asp His Ala Asn Ala Arg Ala Phe Ser His Leu Ala Ser
35 40 45
Lys Leu Ile Glu Thr Glu Val Asp Pro Ser Asp Thr Ile Leu Asp Ile
50 55 60
Gly Ser Ala Pro Ala Arg Arg Met Tyr Ser Lys His Lys Tyr His Cys
65 70 75 80
Ile Cys Pro Met Arg Cys Ala Glu Asp Pro Asp Arg Leu Tyr Lys Tyr
85 90 95
Ala Thr Lys Leu Lys Lys Asn Cys Lys Glu Ile Thr Asp Lys Glu Leu
100 105 110
Asp Lys Lys Met Lys Glu Leu Ala Ala Val Met Ser Asp Pro Asp Leu
115 120 125
Glu Thr Glu Thr Met Cys Leu His Asp Asp Glu Ser Cys Arg Tyr Glu
130 135 140
Gly Gln Val Ala Val Tyr Gln Asp Val Tyr Ala Val Asp Gly Pro Thr
145 150 155 160
Ser Leu Tyr His Gln Ala Asn Lys Gly Val Arg Val Ala Tyr Trp Ile
165 170 175
Gly Phe Asp Thr Thr Pro Phe Met Phe Lys Asn Leu Ala Gly Ala Tyr
180 185 190
Pro Ser Tyr Ser Thr Asn Trp Ala Asp Glu Thr Val Leu Thr Ala Arg
195 200 205
Asn Ile Gly Leu Cys Ser Ser Asp Val Met Glu Arg Ser Arg Arg Gly
210 215 220
Met Ser Ile Leu Arg Lys Lys Tyr Leu Lys Pro Ser Asn Asn Val Leu
225 230 235 240
Phe Ser Val Gly Ser Thr Ile Tyr His Glu Lys Arg Asp Leu Leu Arg
245 250 255
Ser Trp His Leu Pro Ser Val Phe His Leu Arg Gly Lys Gln Asn Tyr
260 265 270
Thr Cys Arg Cys Glu Thr Ile Val Ser Cys Asp Gly Tyr Val Val Lys
275 280 285
Arg Ile Ala Ile Ser Pro Gly Leu Tyr Gly Lys Pro Ser Gly Tyr Ala
290 295 300
Ala Thr Met His Arg Glu Gly Phe Leu Cys Cys Lys Val Thr Asp Thr
305 310 315 320
Leu Asn Gly Glu Arg Val Ser Phe Pro Val Cys Thr Tyr Val Pro Ala
325 330 335
Thr Leu Cys Asp Gln Met Thr Gly Ile Leu Ala Thr Asp Val Ser Ala
340 345 350
Asp Asp Ala Gln Lys Leu Leu Val Gly Leu Asn Gln Arg Ile Val Val
355 360 365
Asn Gly Arg Thr Gln Arg Asn Thr Asn Thr Met Lys Asn Tyr Leu Leu
370 375 380
Pro Val Val Ala Gln Ala Phe Ala Arg Trp Ala Lys Glu Tyr Lys Glu
385 390 395 400
Asp Gln Glu Asp Glu Arg Pro Leu Gly Leu Arg Asp Arg Gln Leu Val
405 410 415
Met Gly Cys Cys Trp Ala Phe Arg Arg His Lys Ile Thr Ser Ile Tyr
420 425 430
Lys Arg Pro Asp Thr Gln Thr Ile Ile Lys Val Asn Ser Asp Phe His
435 440 445
Ser Phe Val Leu Pro Arg Ile Gly Ser Asn Thr Leu Glu Ile Gly Leu
450 455 460
Arg Thr Arg Ile Arg Lys Met Leu Glu Glu His Lys Glu Pro Ser Pro
465 470 475 480
Leu Ile Thr Ala Glu Asp Ile Gln Glu Ala Lys Cys Ala Ala Asp Glu
485 490 495
Ala Lys Glu Val Arg Glu Ala Glu Glu Leu Arg Ala Ala Leu Pro Pro
500 505 510
Leu Ala Ala Asp Val Glu Glu Pro Thr Leu Glu Ala Asp Val Asp Leu
515 520 525
Met Leu Gln Glu Ala Gly Ala Gly Ser Val Glu Thr Pro Arg Gly Leu
530 535 540
Ile Lys Val Thr Ser Tyr Ala Gly Glu Asp Lys Ile Gly Ser Tyr Ala
545 550 555 560
Val Leu Ser Pro Gln Ala Val Leu Lys Ser Glu Lys Leu Ser Cys Ile
565 570 575
His Pro Leu Ala Glu Gln Val Ile Val Ile Thr His Ser Gly Arg Lys
580 585 590
Gly Arg Tyr Ala Val Glu Pro Tyr His Gly Lys Val Val Val Pro Glu
595 600 605
Gly His Ala Ile Pro Val Gln Asp Phe Gln Ala Leu Ser Glu Ser Ala
610 615 620
Thr Ile Val Tyr Asn Glu Arg Glu Phe Val Asn Arg Tyr Leu His His
625 630 635 640
Ile Ala Thr His Gly Gly Ala Leu Asn Thr Asp Glu Glu Tyr Tyr Lys
645 650 655
Thr Val Lys Pro Ser Glu His Asp Gly Glu Tyr Leu Tyr Asp Ile Asp
660 665 670
Arg Lys Gln Cys Val Lys Lys Glu Leu Val Thr Gly Leu Gly Leu Thr
675 680 685
Gly Glu Leu Val Asp Pro Pro Phe His Glu Phe Ala Tyr Glu Ser Leu
690 695 700
Arg Thr Arg Pro Ala Ala Pro Tyr Gln Val Pro Thr Ile Gly Val Tyr
705 710 715 720
Gly Val Pro Gly Ser Gly Lys Ser Gly Ile Ile Lys Ser Ala Val Thr
725 730 735
Lys Lys Asp Leu Val Val Ser Ala Lys Lys Glu Asn Cys Ala Glu Ile
740 745 750
Ile Arg Asp Val Lys Lys Met Arg Gly Leu Asp Val Asn Ala Arg Thr
755 760 765
Val Asp Ser Val Leu Leu Asn Gly Cys Lys His Pro Val Glu Thr Leu
770 775 780
Tyr Ile Asp Glu Ala Phe Ala Cys His Ala Gly Thr Leu Arg Ala Leu
785 790 795 800
Ile Ala Ile Ile Arg Pro Lys Lys Ala Val Leu Cys Gly Asp Pro Lys
805 810 815
Gln Cys Gly Phe Phe Asn Met Met Cys Leu Lys Val His Phe Asn His
820 825 830
Glu Ile Cys Thr Gln Val Phe His Lys Ser Ile Ser Arg Arg Cys Thr
835 840 845
Lys Ser Val Thr Ser Val Val Ser Thr Leu Phe Tyr Asp Lys Arg Met
850 855 860
Arg Thr Thr Asn Pro Lys Glu Thr Lys Ile Glu Ile Asp Thr Thr Gly
865 870 875 880
Ser Thr Lys Pro Lys Gln Asp Asp Leu Ile Leu Thr Cys Phe Arg Gly
885 890 895
Trp Val Lys Gln Leu Gln Ile Asp Tyr Lys Gly Asn Glu Ile Met Thr
900 905 910
Ala Ala Ala Ser Gln Gly Leu Thr Arg Lys Gly Val Tyr Ala Val Arg
915 920 925
Tyr Lys Val Asn Glu Asn Pro Leu Tyr Ala Pro Thr Ser Glu His Val
930 935 940
Asn Val Leu Leu Thr Arg Thr Glu Asp Arg Ile Val Trp Lys Thr Leu
945 950 955 960
Ala Gly Asp Pro Trp Ile Lys Thr Leu Thr Ala Lys Tyr Pro Gly Asn
965 970 975
Phe Thr Ala Thr Ile Glu Glu Trp Gln Ala Glu His Asp Ala Ile Met
980 985 990
Arg His Ile Leu Glu Arg Pro Asp Pro Thr Asp Val Phe Gln Asn Lys
995 1000 1005
Ala Asn Val Cys Trp Ala Lys Ala Leu Val Pro Val Leu Lys Thr
1010 1015 1020
Ala Gly Ile Asp Met Thr Thr Glu Gln Trp Asn Thr Val Asp Tyr
1025 1030 1035
Phe Glu Thr Asp Lys Ala His Ser Ala Glu Ile Val Leu Asn Gln
1040 1045 1050
Leu Cys Val Arg Phe Phe Gly Leu Asp Leu Asp Ser Gly Leu Phe
1055 1060 1065
Ser Ala Pro Thr Val Pro Leu Ser Ile Arg Asn Asn His Trp Asp
1070 1075 1080
Asn Ser Pro Ser Pro Asn Met Tyr Gly Leu Asn Lys Glu Val Val
1085 1090 1095
Arg Gln Leu Ser Arg Arg Tyr Pro Gln Leu Pro Arg Ala Val Ala
1100 1105 1110
Thr Gly Arg Val Tyr Asp Met Asn Thr Gly Thr Leu Arg Asn Tyr
1115 1120 1125
Asp Pro Arg Ile Asn Leu Val Pro Val Asn Arg Arg Leu Pro His
1130 1135 1140
Ala Leu Val Leu His His Asn Glu His Pro Gln Ser Asp Phe Ser
1145 1150 1155
Ser Phe Val Ser Lys Leu Lys Gly Arg Thr Val Leu Val Val Gly
1160 1165 1170
Glu Lys Leu Ser Val Pro Gly Lys Thr Val Asp Trp Leu Ser Asp
1175 1180 1185
Lys Pro Glu Ala Thr Phe Arg Ala Arg Leu Asp Leu Gly Ile Pro
1190 1195 1200
Gly Asp Val Pro Lys Tyr Asp Ile Ile Phe Ile Asn Val Arg Thr
1205 1210 1215
Pro Tyr Lys Tyr His His Tyr Gln Gln Cys Glu Asp His Ala Ile
1220 1225 1230
Lys Leu Ser Met Leu Thr Lys Lys Ala Cys Leu His Leu Asn Pro
1235 1240 1245
Gly Gly Thr Cys Val Ser Ile Gly Tyr Gly Tyr Ala Asp Arg Ala
1250 1255 1260
Ser Glu Ser Ile Ile Gly Ala Ile Ala Arg Gln Phe Lys Phe Ser
1265 1270 1275
Arg Val Cys Lys Pro Lys Ser Ser Leu Glu Glu Thr Glu Val Leu
1280 1285 1290
Phe Val Phe Ile Gly Tyr Asp Arg Lys Ala Arg Thr His Asn Pro
1295 1300 1305
Tyr Lys Leu Ser Ser Thr Leu Thr Asn Ile Tyr Thr Gly Ser Arg
1310 1315 1320
Leu His Glu Ala Gly Cys Ala Pro Ser Tyr His Val Val Arg Gly
1325 1330 1335
Asp Ile Ala Met Ala Thr Glu Gly Val Ile Ile Asn Ala Ala Asn
1340 1345 1350
Ser Lys Gly Gln Pro Gly Gly Gly Val Cys Gly Ala Leu Tyr Lys
1355 1360 1365
Lys Phe Pro Glu Ser Phe Asp Leu Gln Pro Ile Glu Val Gly Lys
1370 1375 1380
Ala Arg Leu Val Lys Gly Ala Ala Lys His Ile Ile His Ala Val
1385 1390 1395
Gly Pro Asn Phe Asn Lys Val Ser Glu Val Glu Gly Asp Lys Gln
1400 1405 1410
Leu Ala Glu Ala Tyr Glu Ser Ile Ala Lys Ile Val Asn Asp Asn
1415 1420 1425
Asn Tyr Lys Ser Val Ala Ile Pro Leu Leu Ser Thr Gly Ile Phe
1430 1435 1440
Ser Gly Asn Lys Asp Arg Leu Thr Gln Ser Leu Asn His Leu Leu
1445 1450 1455
Thr Ala Leu Asp Thr Thr Asp Ala Asp Val Ala Ile Tyr Cys Arg
1460 1465 1470
Asp Lys Lys Trp Glu Met Thr Leu Lys Glu Ala Val Ala Arg Arg
1475 1480 1485
Glu Ala Val Glu Glu Ile Cys Ile Ser Asp Asp Ser Ser Val Thr
1490 1495 1500
Glu Pro Asp Ala Glu Leu Val Arg Val His Pro Lys Ser Ser Leu
1505 1510 1515
Ala Gly Arg Lys Gly Tyr Ser Thr Ser Asp Gly Lys Thr Phe Ser
1520 1525 1530
Tyr Leu Glu Gly Thr Lys Phe His Gln Ala Ala Lys Asp Ile Ala
1535 1540 1545
Glu Ile Asn Ala Met Trp Pro Val Ala Thr Glu Ala Asn Glu Gln
1550 1555 1560
Val Cys Met Tyr Ile Leu Gly Glu Ser Met Ser Ser Ile Arg Ser
1565 1570 1575
Lys Cys Pro Val Glu Glu Ser Glu Ala Ser Thr Pro Pro Ser Thr
1580 1585 1590
Leu Pro Cys Leu Cys Ile His Ala Met Thr Pro Glu Arg Val Gln
1595 1600 1605
Arg Leu Lys Ala Ser Arg Pro Glu Gln Ile Thr Val Cys Ser Ser
1610 1615 1620
Phe Pro Leu Pro Lys Tyr Arg Ile Thr Gly Val Gln Lys Ile Gln
1625 1630 1635
Cys Ser Gln Pro Ile Leu Phe Ser Pro Lys Val Pro Ala Tyr Ile
1640 1645 1650
His Pro Arg Lys Tyr Leu Val Glu Thr Pro Pro Val Glu Glu Ile
1655 1660 1665
Pro Glu Leu Pro Ala Glu Asn Gln Ser Thr Glu Gly Thr Ser Glu
1670 1675 1680
Gln Pro Ala Pro Asn Val Asp Ala Thr Arg Thr Arg Thr Pro Glu
1685 1690 1695
Pro Ile Ile Ile Glu Glu Glu Glu Glu Asp Ser Ile Ser Leu Leu
1700 1705 1710
Ser Asp Gly Pro Thr His Gln Val Leu Gln Val Glu Ala Asp Ile
1715 1720 1725
His Gly Pro Pro Ser Val Ser Ser Ser Ser Trp Ser Ile Pro His
1730 1735 1740
Ala Ser Asp Phe Asp Val Asp Ser Leu Ser Ile Leu Ala Leu Glu
1745 1750 1755
Gly Ala Ser Val Thr Ser Glu Ala Ala Ser Ala Glu Thr Asn Ser
1760 1765 1770
Tyr Phe Ala Arg Ser Met Glu Phe Leu Ala Arg Pro Val Pro Ala
1775 1780 1785
Pro Arg Thr Val Phe Arg Asn Pro Pro His Pro Ala Pro Arg Thr
1790 1795 1800
Arg Thr Pro Ser Leu Ala Pro Ser Arg Ala Ser Ser Arg Thr Ser
1805 1810 1815
Leu Val Ser Thr Pro Pro Gly Val Asn Arg Val Ile Thr Arg Glu
1820 1825 1830
Glu Leu Glu Ala Leu Thr Pro Ser Arg Ala Pro Ser Arg Ser Ala
1835 1840 1845
Ser Arg Thr Ser Leu Val Ser Asn Pro Pro Gly Val Asn Arg Val
1850 1855 1860
Ile Thr Arg Glu Glu Phe Glu Ala Phe Val Ala Gln Gln Gln Arg
1865 1870 1875
Arg Phe Asp Ala Gly Ala Tyr Ile Phe Ser Ser Asp Thr Gly Gln
1880 1885 1890
Gly His Leu Gln Gln Lys Ser Val Arg Gln Thr Val Leu Ser Glu
1895 1900 1905
Val Val Leu Glu Arg Thr Glu Leu Glu Ile Ser Tyr Ala Pro Arg
1910 1915 1920
Leu Asp Gln Glu Lys Glu Glu Leu Leu Arg Lys Lys Leu Gln Leu
1925 1930 1935
Asn Pro Thr Pro Ala Asn Arg Ser Arg Tyr Gln Ser Arg Arg Val
1940 1945 1950
Glu Asn Met Lys Ala Ile Thr Ala Arg Arg Ile Leu Gln Gly Leu
1955 1960 1965
Gly His Tyr Leu Lys Ala Glu Gly Lys Val Glu Cys Tyr Arg Thr
1970 1975 1980
Leu His Pro Val Pro Leu Tyr Ser Ser Ser Val Asn Arg Ala Phe
1985 1990 1995
Ser Ser Pro Lys Val Ala Val Glu Ala Cys Asn Ala Met Leu Lys
2000 2005 2010
Glu Asn Phe Pro Thr Val Ala Ser Tyr Cys Ile Ile Pro Glu Tyr
2015 2020 2025
Asp Ala Tyr Leu Asp Met Val Asp Gly Ala Ser Cys Cys Leu Asp
2030 2035 2040
Thr Ala Ser Phe Cys Pro Ala Lys Leu Arg Ser Phe Pro Lys Lys
2045 2050 2055
His Ser Tyr Leu Glu Pro Thr Ile Arg Ser Ala Val Pro Ser Ala
2060 2065 2070
Ile Gln Asn Thr Leu Gln Asn Val Leu Ala Ala Ala Thr Lys Arg
2075 2080 2085
Asn Cys Asn Val Thr Gln Met Arg Glu Leu Pro Val Leu Asp Ser
2090 2095 2100
Ala Ala Phe Asn Val Glu Cys Phe Lys Lys Tyr Ala Cys Asn Asn
2105 2110 2115
Glu Tyr Trp Glu Thr Phe Lys Glu Asn Pro Ile Arg Leu Thr Glu
2120 2125 2130
Glu Asn Val Val Asn Tyr Ile Thr Lys Leu Lys Gly Pro Lys Ala
2135 2140 2145
Ala Ala Leu Phe Ala Lys Thr His Asn Leu Asn Met Leu Gln Asp
2150 2155 2160
Ile Pro Met Asp Arg Phe Val Met Asp Leu Lys Arg Asp Val Lys
2165 2170 2175
Val Thr Pro Gly Thr Lys His Thr Glu Glu Arg Pro Lys Val Gln
2180 2185 2190
Val Ile Gln Ala Ala Asp Pro Leu Ala Thr Ala Tyr Leu Cys Gly
2195 2200 2205
Ile His Arg Glu Leu Val Arg Arg Leu Asn Ala Val Leu Leu Pro
2210 2215 2220
Asn Ile His Thr Leu Phe Asp Met Ser Ala Glu Asp Phe Asp Ala
2225 2230 2235
Ile Ile Ala Glu His Phe Gln Pro Gly Asp Cys Val Leu Glu Thr
2240 2245 2250
Asp Ile Ala Ser Phe Asp Lys Ser Glu Asp Asp Ala Met Ala Leu
2255 2260 2265
Thr Ala Leu Met Ile Leu Glu Asp Leu Gly Val Asp Ala Glu Leu
2270 2275 2280
Leu Thr Leu Ile Glu Ala Ala Phe Gly Glu Ile Ser Ser Ile His
2285 2290 2295
Leu Pro Thr Lys Thr Lys Phe Lys Phe Gly Ala Met Met Lys Ser
2300 2305 2310
Gly Met Phe Leu Thr Leu Phe Val Asn Thr Val Ile Asn Ile Val
2315 2320 2325
Ile Ala Ser Arg Val Leu Arg Glu Arg Leu Thr Gly Ser Pro Cys
2330 2335 2340
Ala Ala Phe Ile Gly Asp Asp Asn Ile Val Lys Gly Val Lys Ser
2345 2350 2355
Asp Lys Leu Met Ala Asp Arg Cys Ala Thr Trp Leu Asn Met Glu
2360 2365 2370
Val Lys Ile Ile Asp Ala Val Val Gly Glu Lys Ala Pro Tyr Phe
2375 2380 2385
Cys Gly Gly Phe Ile Leu Cys Asp Ser Val Thr Gly Thr Ala Cys
2390 2395 2400
Arg Val Ala Asp Pro Leu Lys Arg Leu Phe Lys Leu Gly Lys Pro
2405 2410 2415
Leu Ala Ala Asp Asp Glu His Asp Asp Asp Arg Arg Arg Ala Leu
2420 2425 2430
Tyr Glu Glu Ser Thr Arg Trp Asn Arg Val Gly Ile Leu Pro Glu
2435 2440 2445
Leu Cys Lys Ala Val Glu Ser Arg Tyr Glu Thr Val Gly Thr Ser
2450 2455 2460
Ile Ile Val Met Ala Met Thr Thr Leu Ala Ser Ser Val Lys Ser
2465 2470 2475
Phe Ser Tyr Leu Arg Gly Ala Pro Ile Thr Leu Tyr Gly
2480 2485 2490
<210> 16
<211> 11628
<212> DNA
<213> Eastern equine encephalitis virus
<400> 16
tagaggcaac caccctattt ccacctatcc aaaatggaga aagttcatgt tgacttagac 60
gcagacagcc cattcgtcaa gtcactgcaa agatgctttc cacattttga gatagaagca 120
acgcaggtca ctgacaatga ccatgctaat gctagggcgt tttcgcacct agctactaag 180
ctcattgagg gagaagtgga tacagaccag gtgatcctgg atattgggag cgcgcctgta 240
aggcacacgc attccaaaca taagtaccac tgtatttgcc caatgaagag cgcagaagac 300
cctgacagac tctaccgcta cgcagacaag cttagaaaga gtgatgtcac tgacaaatgt 360
attgcctcta aggccgcgga cctgctaaca gtaatgtcga cgcctgacgc tgagacaccc 420
tcgttatgca tgcacactga ctcaacttgc aggtaccacg gctccgtggc cgtatatcag 480
gatgtatatg cagtgcatgc accgacttcc atttactacc aggcgctgaa aggtgtacga 540
actatctatt ggatcgggtt cgatactaca ccgttcatgt ataagaacat ggcaggcgcc 600
taccctacat acaacactaa ttgggccgat gaaagtgtgt tggaagccag aaatataggg 660
ctgggtagtt cagacttgca cgaaaagagt ttcggaaaag tatccattat gaggaagaag 720
aaattacaac ccaccaataa agtaatattt tctgtggggt caactattta tactgaagag 780
agaatactgt tacgcagttg gcatctacct aatgtttttc atctaaaagg taaaactagc 840
tttacaggca gatgtaatac tatcgtcagc tgcgaaggtt acgttgtcaa gaagattacg 900
ctcagtcctg ggatttacgg gaaagtggat aatcttgctt cgaccatgca ccgagaggga 960
ttcttaagtt gcaaggttac agatacgtta agaggggaga gggtctcttt tcccgtgtgt 1020
acgtacgtgc cagcgacact gtgcgaccag atgaccggga tactggcgac tgacgtcagt 1080
gtcgatgacg cccagaagct gctggttggg ctcaaccagc gaattgtcgt caatggcaga 1140
acacaacgta acacaaatac catgcagaat tatctattac cagtggtcgc ccaggcgttc 1200
tcgcggtggg cgcgggaaca ccgcgcagac ctggaggacg aaaaagggct aggggtacgg 1260
gaacgttccc tagtcatggg ctgctgctgg gctttcaaaa ctcacaagat cacatccatt 1320
tacaagagac ctgggactca aactatcaag aaggtgcccg ccgtattcaa ttcctttgtc 1380
atcccacaac caaccagcta tgggcttgat atagggttgc gtcgccgcat taagatgcta 1440
ttcgacgcaa agaaggcacc cgctccaatt attactgagg ccgacgttgc acaccttaaa 1500
ggcctgcagg atgaagctga agccgtggca gaggctgaag ccgtacgtgc agcactacca 1560
ccacttctgc cggaggtcga caaggagacc gtagaggctg acatcgacct gatcatgcag 1620
gaggcaggag caggtagcgt ggagacacct agacgacaca tcaaggtcac gacgtaccca 1680
ggagaagaaa tgatcggctc gtacgcagtg ctttcaccac aagcggtcct taacagcgag 1740
aagctcgctt gtattcaccc gttagctgag caagtgctcg tgatgactca caaggggcgc 1800
gcaggacgat acaaggtaga gccataccac ggtagagtta tcgtccctag tggtacagct 1860
ataccaatcc ccgatttcca ggctctgagt gaaagtgcaa ccatagtatt taacgaacgg 1920
gagttcgtta accgttactt acaccacatt gccgttaacg gaggggcact gaatacagat 1980
gaagagtact acaaggttgt gaaaagcact gagacagact ctgagtacgt atttgacatc 2040
gacgcaaaga agtgcgtgaa gaaaggggat gccggaccaa tgtgcctggt cggcgaatta 2100
gtagacccgc cattccacga attcgcgtac gagagtttaa aaacacgtcc tgctgcacca 2160
cacaaagtgc ctaccatcgg agtttatgga gtcccaggtt ccggaaagtc tggtataatc 2220
aaaagcgctg ttaccaaacg tgatctggtg gtcagtgcaa agaaagaaaa ttgcatggaa 2280
atcattaaag acgtcaaacg tatgcgcggc atggacatcg ccgcccgcac agtggattcg 2340
gtgctgctaa atggggtaaa acactccgtc gacacactgt acatagacga ggcattcgct 2400
tgccatgcag ggaccctgct agcacttatt gccatcgtca agccaaagaa agttgtattg 2460
tgtggagatc cgaaacaatg cggcttcttt aacatgatgt gtctaaaagt gcattttaac 2520
cacgagatat gcacagaagt gtatcacaag agtatttctc ggcgatgcac taagacagtg 2580
acatccatcg tttccaccct gttctatgat aaacgcatga gaactgtcaa cccatgcaat 2640
gataagatca taatagatac caccagtact accaaacctt taaaggatga cataatatta 2700
acctgcttta gagggtgggt taaacaactg cagattgact acaagaacca cgagatcatg 2760
actgcagcgg cctcacaggg gcttactaga aaaggggtat acgcagtgcg ctacaaggtc 2820
aatgagaacc cactatacgc acagacatct gagcatgtga atgtattact tacacgcact 2880
gaaaaacgta tagtatggaa gactttggcc ggtgaccctt ggatcaagac gttgacagca 2940
tcgtatccgg gtaatttcac cgccacactg gaagaatggc aagctgagca tgacgctatc 3000
atggcgaaaa tacttgagac accagctagc agcgacgttt tccaaaataa agtgaacgtc 3060
tgctgggcca aagcgctaga acctgtgttg gccaccgcca atattacgct gacccgctcg 3120
cagtgggaga ccattccagc gttcaaggat gacaaagcgt attcgcctga gatggcctta 3180
aactttttct gcaccagatt ctttggcgtc gacatcgaca gcgggttgtt ctccgcgcca 3240
actgttccgc tgacttacac caatgaacac tgggataata gcccaggtcc aaacatgtat 3300
ggtttgtgca tgcgcactgc taaagaactt gcacgtcggt atccttgtat tctgaaagcc 3360
gtggatacag gtagagtggc tgacgttcgc acagacacta tcaaagacta taacccgcta 3420
ataaatgtgg tacccttgaa tagaagactc ccacactcat tggttgtcac acatagatac 3480
actgggaacg gtgattactc ccagctagtg accaagatga ccggaaagac cgtactagta 3540
gtgggtacac ctatgaacat accaggaaag agagtcgaga cactaggccc aagcccacaa 3600
tgtacatata aagcggaact ggacctgggc attcctgccg ctttaggcaa atatgacatc 3660
atttttatta acgtgaggac tccctaccga caccaccatt accaacagtg cgaggaccat 3720
gcgatccacc acagcatgct taccagaaaa gcagtggacc atttgaacaa aggcggtacg 3780
tgcatcgcat tgggctatgg gactgcggac agagccaccg agaacattat ctctgcagtc 3840
gcccgctcat tcaggttctc acgtgtgtgc cagccgaagt gtgcctggga aaacactgag 3900
gtcgcgttcg tgtttttcgg caaggacaac ggcaaccatc tccaagatca agataggctg 3960
agtgttgtgc taaacaacat ataccaaggg tcaactcaac atgaagctgg cagagcacct 4020
gcgtacagag tggtgcgcgg cgacataaca aagagcaatg atgaggttat tgttaacgcg 4080
gcgaacaaca aagggcaacc cggtggcggt gtgtgtggcg ccctttacag gaagtggcct 4140
ggagcttttg ataagcagcc ggtagcaact ggtaaagcgc acctcgtcaa gcattctccg 4200
aacgtcatcc atgctgttgg tcctaatttc tctcggctat cagaaaacga aggagaccag 4260
aaattgtctg aagtgtacat ggacattgcc agaattatca acaacgagag gtttactaaa 4320
gtctccattc cgttgttatc taccggcatc tacgcaggtg gtaaggacag ggttatgcaa 4380
tcgctgaacc atttatttac agccatggat actaccgacg cagacattac tatttactgt 4440
ctagataagc aatgggagtc aagaataaag gaagctatca ctcggaagga aagcgttgaa 4500
gagcttactg aggatgacag accagttgac attgaactgg tacgggtgca cccgttgagc 4560
agcttggcag gtagacctgg ttattcaacc accgagggca aggtgtattc gtatctagag 4620
gggactaggt ttcatcaaac tgccaaagac atagctgaaa tttacgctat gtggcctaac 4680
aagcaagaag caaacgagca gatttgctta tacgtgttgg gagagagtat gaacagcatc 4740
cgctctaagt gtccagttga agagtcggag gcctcttccc cccctcacac catcccgtgt 4800
ctgtgcaact atgcaatgac tgcagagcga gtttacagat tacgtatggc aaagaatgaa 4860
caattcgcag tttgttcgtc ctttcagtta ccgaaataca ggattacagg ggttcagaaa 4920
attcaatgca gtaaacctgt gatattctct ggcactgtac ccccggccat acatccaaga 4980
aaattcgcat ccgtgacagt ggaagacact ccgatggtcc aacctgaaag gttggtgcct 5040
aggcgacctg caccgcctgt gcccgtacct gcaagaatcc ccagccctcc atgtacatcg 5100
accaatggat cgacgaccag tatacaatca ctgggggagg atcaaagcgc atctgcttct 5160
agcggagctg aaatctctgt agaccaggtt tcgctatgga gcatacccag cgctaccggg 5220
ttcgatgtgc gtacctcctc atcgttgagc ctagagcagc ctacctttcc gacaatggtt 5280
gtcgaagcag agattcacgc cagtcaagga tcactgtgga gcatacccag tatcaccgga 5340
tctgaaaccc gtgctccgtc acctccaagt caggatagta gaccttccac cccatctgca 5400
agtggttcac acacgtccgt ggacttaatc acgtttgaca gcgttgcaga gattttggag 5460
gatttcagtc gttcgccgtt tcaatttttg tctgaaatca aacctattcc tgcacctcgt 5520
acccgagtta ctaacatgag ccgcagcgca gacacgatca aaccaattcc aaagccgcgt 5580
aaatgccagg tgaagtacac gcagccacct ggcgtcgcca gggccatatc ggcagcggaa 5640
tttgacgagt ttgtgcggag gcactcgaat tgacggtacg aagcgggtgc gtacattttc 5700
tcatccgaga cgggacaagg gcacctgcaa caaaaatcta cgcggcaatg caaactccag 5760
tatccaatcc tggagcgttc cgtccatgag aaattttacg ccccgcgcct cgatctcgag 5820
cgtgagaagc tgttgcagaa gaaactacaa ttgtgtgctt ctgaaggtaa tcggagcagg 5880
tatcagtctc gtaaagtaga gaacatgaag gcaatcaccg ttgagcgtct actgcagggg 5940
ataggctcat acctctctgc agaaccgcaa ccagttgaat gctacaaagt cacctatcct 6000
gctcccatgt attcaagtac tgcaagcaac agcttttcat cagcagaagt ggccgtcaaa 6060
gtctgcaacc tagtactgca agagaatttt cccaccgtag ccagctataa cataacggat 6120
gagtatgatg cctatcttga tatggtggac ggagcatcct gctgtttaga tactgccacc 6180
ttttgcccag ccaaattaag gagctttcca aagaagcaca gttatttgcg gcctgagata 6240
cggtcagcag tgccatcacc gattcaaaac acgctccaga atgtactagc agcagccacg 6300
aaacggaatt gcaatgtcac tcaaatgagg gaacttccag tgttggattc agctgccttc 6360
aacgtggagt gtttcaaaaa gtacgcctgt aacgatgagt actgggactt ctacaagaca 6420
aacccgataa gactcaccgc agaaaatgtt actcagtatg ttactaagtt aaagggaccc 6480
aaagcagctg ccctttttgc gaaaacgcat aacttacagc cattgcatga gataccaatg 6540
gatagattcg tgatggacct taaacgggat gttaaggtta cacccgggac aaaacatact 6600
gaagaaagac caaaagttca ggtgatacag gcagctgatc cacttgcaac cgcctaccta 6660
tgtggtatac atcgagagct tgtgcgcagg ttgaacgcag tgctgctacc gaacatccac 6720
actttgtttg acatgtctgc agaagatttt gatgctatca ttgccgaaca ctttcaattc 6780
ggcgactcgg tgttagagac agacatagct tcttttgata aaagcgagga cgatgctatc 6840
gccatgtctg ctctaatgat tcttgaagac ctaggagttg atcaggcact gttaaaccta 6900
attgaagcag cctttgggaa cataacatct gtgcacttac caacaggcac ccgatttaag 6960
ttcggggcaa tgatgaaatc cgggatgttt ttgacactct ttattaatac tgttgtcaat 7020
atcatgatcg ctagccgcgt gctccgcgag cggttgacca cttccccctg cgcagcattt 7080
atcggcgacg acaacatcgt gaaaggggtt acatctgacg agctgatggc agagcggtgc 7140
gccacgtggt tgaacatgga agtgaagatc atcgatgcag tagtcggagt aaaggcaccg 7200
tacttttgcg gagggttcat cgtagtcgat cagatcacag gaactgcgtg cagagtcgcc 7260
gaccccctga agagactgtt taagctaggt aagccgcttc cattggacga tgaccaagac 7320
gtcgacaggc gcagagctct gcatgatgaa gcggcacgtt ggaacagaat tggcatcact 7380
gaagagctgg tgaaagcagt tgaatcacgc tacgaggtga actacgtgtc actaatcatt 7440
acagcgttga ctacattagc atctacagtt agcaacttta aacacataag aggtcacccc 7500
ataaccctct acggctgacc taaataggtt gtgcattagt acctaaccta tttatattat 7560
attgctatct aaatatcaga gatgttccca taccctacac ttaactaccc gcctatggcg 7620
ccgattaacc cgatggccta ccgggatcct aatccgccta ggcgcaggtg gcggcccttt 7680
aggccaccac ttgcagctca aattgaggac ctgagacgtt ccattgctaa cctgactttg 7740
aaacaacgag cacctaaccc tccagcagga ccgcccgcca aacgcaagaa gcctgcgccc 7800
aagcctaagc ctgcgcaggc gaaaaagaag cgaccaccac cacctgccaa gaaacaaaaa 7860
cgtaaaccta aaccaggcaa acgacagcga atgtgtatga agctagagtc agataaaacg 7920
tttccgatca tgttgaacgg acaggtgaat ggttacgcgt gcgtcgtggg tggacgagtg 7980
tttaaaccgc tgcacgtaga aggcagaata gacaatgagc aactggccgc tatcaagctg 8040
aagaaggcca gcatatatga ccttgagtac ggtgatgtgc cacaatgcat gaaatcagat 8100
accctccagt acaccagtga caagcctcct ggcttttata actggcatca tggagctgtg 8160
cagtatgaga acaacaggtt caccgtacca cgaggggtag gtggaaaggg cgacagcggg 8220
agacctattc ttgacaacaa aggtagagtc gtcgcaattg tcctgggtgg agtcaacgaa 8280
ggatccagga cggctctatc agtggtgaca tggaaccaaa agggggttac agtcaaagat 8340
acaccagagg ggtcagagcc atggtcgctc gccactgtca tgtgcgtcct ggccaatatc 8400
acgtttccat gtgatcaacc accctgcatg ccatgctgtt atgaaaagaa tccacacgaa 8460
acactcacca tgctggaaca gaattacgac agccgagcct atgatcagct gctcgatgcc 8520
gctgtgaaat gtaatgctag gagaaccagg agagatttgg acactcattt cacccagtat 8580
aagttggcac gcccgtatat tgctgattgc cctaactgtg ggcatagtcg gtgcgacagc 8640
cctatagcta tagaagaagt cagaggggat gcgcatgcag gagtcatccg catccagaca 8700
tcagctatgt ttggtctgaa gacggatgga gtcgatttgg cctacatgag tttcatgaac 8760
ggcaaaacgc agaaatcaat aaagatcgac aacctgcatg tgcgcacctc agccccttgt 8820
tccctcgtgt cgcaccacgg ctattacatc ttggctcaat gcccaccagg ggacacggtt 8880
acagttgggt ttcacgacgg gcctaaccgc catacgtgca cagttgccca taaggtagaa 8940
ttcaggccag tgggtagaga gaaataccgt cacccacctg aacatggagt tgaattaccg 9000
tgtaaccgtt acactcacaa gcgtgcagac caaggacact atgttgagat gcatcaacca 9060
gggctagttg ccgaccactc tctccttagc atccacagtg ccaaggtgaa aattacggta 9120
ccgagcggcg cccaagtgaa atactactgc aagtgtccag atgtacgaga gggaattacc 9180
agcagcgacc atacaaccac ctgcacggat gtcaaacaat gcagggctta cctgattgac 9240
aacaagaaat gggtgtacaa ctctggaaga ctgcctcgag gagagggcga cacttttaaa 9300
ggaaaacttc atgtgccctt tgtgcctgtt aaggccaagt gcatcgccac gctggcaccg 9360
gagcctctag ttgagcacaa acaccgcacc ctgattttac acctgcaccc ggaccacccg 9420
accttgctga cgaccaggtc acttggaagt gatgcaaatc caactcgaca atggattgag 9480
cgaccaacaa ctgtcaattt cacagtcacc ggagaagggt tggagtatac ctggggaaac 9540
catccaccaa aaagagtatg ggctcaagag tcaggagaag ggaacccaca tggatggccg 9600
cacgaagtgg tagtctatta ctacaacaga tacccgctaa ccacaattat cgggttatgc 9660
acctgtgtgg ctatcatcat ggtctcttgt gtcacatccg tgtggctcct ttgcaggact 9720
cgcaatcttt gcataacccc gtataaacta gccccgaacg ctcaagtccc aatactcctg 9780
gcgttacttt gctgcattaa gccgacgagg gcagacgaca ccttgcaagt gctgaattat 9840
ctgtggaaca acaatcaaaa ctttttctgg atgcagacgc ttatcccact tgcagcgctt 9900
atcgtatgca tgcgcatgct gcgttgctta ttttgctgtg ggccggcttt tttacttgtc 9960
tgcggcgcct tgggcgccgc agcgtacgaa cacacagcag tgatgccgaa caaggtgggg 10020
atcccgtata aagctttagt cgaacgccca gggtatgcac ccgttcacct acagatacag 10080
ctggttaata ccaggataat tccatcaact aacctggagt acatcacctg caagtacaag 10140
acaaaagtgc cgtctccagt agtgaaatgc tgcggtgcca ctcaatgtac ctctaaaccc 10200
catcctgact atcagtgtca ggtgtttaca ggtgtttacc cattcatgtg gggaggagcc 10260
tactgcttct gcgacaccga aaacacccag atgagcgagg cgtatgtaga gcgctcggaa 10320
gagtgctcta tcgaccacgc aaaagcttat aaagtacaca caggcactgt tcaggcaatg 10380
gtgaacataa cttatgggag cgtcagctgg agatctgcag atgtctacgt caatggtgaa 10440
actcccgcga aaataggaga tgccaaactc atcataggtc cactgtcatc tgcgtggtcc 10500
ccattcgata acaaggtggt ggtttatggg catgaagtgt ataattacga ctttcctgag 10560
tacagcaccg gcaaagcagg ctctttcgga gacctgcaat cacgcacatc aaccagcaac 10620
gatctgtacg caaataccaa cttgaagcta caacgacccc aggctggtat cgtgcacaca 10680
cctttcaccc aggcgccctc tggcttcgaa cgatggaaaa gggacaaagg ggcaccgttg 10740
aacgacgtag ccccgtttgg ctgttcaatt gccctggagc cgctccgtgc agaaaattgt 10800
gcagtgggaa gcatccctat atctatagat atacccgatg cggctttcac cagaatatct 10860
gaaacaccga cagtctcaga cctggaatgc aaaattacgg agtgtactta tgcctccgat 10920
ttcggtggta tagccaccgt tgcctacaaa tccagtaaag caggaaactg tccaattcat 10980
tctccatcgg gtgttgcagt tattaaagag aatgacgtca cccttgctga gagcggatca 11040
tttacattcc acttctccac tgcaaacatc catcctgctt ttaagctgca ggtctgcacc 11100
agtgcagtta cctgcaaagg agattgcaag ccaccgaaag atcatatcgt cgattatcca 11160
gcacaacata ccgaatcctt tacgtcggcg atatccgcca ccgcgtggtc gtggctaaaa 11220
gtgctggtag gaggaacatc agcatttatt gttctggggc ttattgctac agcagtggtt 11280
gccctagttc tgttcttcca tagacattaa catcttgtca accacataac actacaggca 11340
gtgtataagg ctgtcttact aaacactaaa atcaccctag ttcgatgtac ttccgagcta 11400
tggtgacggt ggtgcataat gccgccgatg cagtgcataa ggctgctata ttaccaaatt 11460
ataacactaa gggcagtgca taatgctgct cctaagtaat tttatacaca ctttataatc 11520
aggcataatt gccgtatata caattacact acaggtaata taccgcctct tataaacact 11580
acaggcagcg cataatgctg tcttttatat caatttacaa aatcatat 11628
<210> 17
<211> 1242
<212> PRT
<213> Eastern equine encephalitis virus
<400> 17
Met Phe Pro Tyr Pro Thr Leu Asn Tyr Pro Pro Met Ala Pro Ile Asn
1 5 10 15
Pro Met Ala Tyr Arg Asp Pro Asn Pro Pro Arg Arg Arg Trp Arg Pro
20 25 30
Phe Arg Pro Pro Leu Ala Ala Gln Ile Glu Asp Leu Arg Arg Ser Ile
35 40 45
Ala Asn Leu Thr Leu Lys Gln Arg Ala Pro Asn Pro Pro Ala Gly Pro
50 55 60
Pro Ala Lys Arg Lys Lys Pro Ala Pro Lys Pro Lys Pro Ala Gln Ala
65 70 75 80
Lys Lys Lys Arg Pro Pro Pro Pro Ala Lys Lys Gln Lys Arg Lys Pro
85 90 95
Lys Pro Gly Lys Arg Gln Arg Met Cys Met Lys Leu Glu Ser Asp Lys
100 105 110
Thr Phe Pro Ile Met Leu Asn Gly Gln Val Asn Gly Tyr Ala Cys Val
115 120 125
Val Gly Gly Arg Val Phe Lys Pro Leu His Val Glu Gly Arg Ile Asp
130 135 140
Asn Glu Gln Leu Ala Ala Ile Lys Leu Lys Lys Ala Ser Ile Tyr Asp
145 150 155 160
Leu Glu Tyr Gly Asp Val Pro Gln Cys Met Lys Ser Asp Thr Leu Gln
165 170 175
Tyr Thr Ser Asp Lys Pro Pro Gly Phe Tyr Asn Trp His His Gly Ala
180 185 190
Val Gln Tyr Glu Asn Asn Arg Phe Thr Val Pro Arg Gly Val Gly Gly
195 200 205
Lys Gly Asp Ser Gly Arg Pro Ile Leu Asp Asn Lys Gly Arg Val Val
210 215 220
Ala Ile Val Leu Gly Gly Val Asn Glu Gly Ser Arg Thr Ala Leu Ser
225 230 235 240
Val Val Thr Trp Asn Gln Lys Gly Val Thr Val Lys Asp Thr Pro Glu
245 250 255
Gly Ser Glu Pro Trp Ser Leu Ala Thr Val Met Cys Val Leu Ala Asn
260 265 270
Ile Thr Phe Pro Cys Asp Gln Pro Pro Cys Met Pro Cys Cys Tyr Glu
275 280 285
Lys Asn Pro His Glu Thr Leu Thr Met Leu Glu Gln Asn Tyr Asp Ser
290 295 300
Arg Ala Tyr Asp Gln Leu Leu Asp Ala Ala Val Lys Cys Asn Ala Arg
305 310 315 320
Arg Thr Arg Arg Asp Leu Asp Thr His Phe Thr Gln Tyr Lys Leu Ala
325 330 335
Arg Pro Tyr Ile Ala Asp Cys Pro Asn Cys Gly His Ser Arg Cys Asp
340 345 350
Ser Pro Ile Ala Ile Glu Glu Val Arg Gly Asp Ala His Ala Gly Val
355 360 365
Ile Arg Ile Gln Thr Ser Ala Met Phe Gly Leu Lys Thr Asp Gly Val
370 375 380
Asp Leu Ala Tyr Met Ser Phe Met Asn Gly Lys Thr Gln Lys Ser Ile
385 390 395 400
Lys Ile Asp Asn Leu His Val Arg Thr Ser Ala Pro Cys Ser Leu Val
405 410 415
Ser His His Gly Tyr Tyr Ile Leu Ala Gln Cys Pro Pro Gly Asp Thr
420 425 430
Val Thr Val Gly Phe His Asp Gly Pro Asn Arg His Thr Cys Thr Val
435 440 445
Ala His Lys Val Glu Phe Arg Pro Val Gly Arg Glu Lys Tyr Arg His
450 455 460
Pro Pro Glu His Gly Val Glu Leu Pro Cys Asn Arg Tyr Thr His Lys
465 470 475 480
Arg Ala Asp Gln Gly His Tyr Val Glu Met His Gln Pro Gly Leu Val
485 490 495
Ala Asp His Ser Leu Leu Ser Ile His Ser Ala Lys Val Lys Ile Thr
500 505 510
Val Pro Ser Gly Ala Gln Val Lys Tyr Tyr Cys Lys Cys Pro Asp Val
515 520 525
Arg Glu Gly Ile Thr Ser Ser Asp His Thr Thr Thr Cys Thr Asp Val
530 535 540
Lys Gln Cys Arg Ala Tyr Leu Ile Asp Asn Lys Lys Trp Val Tyr Asn
545 550 555 560
Ser Gly Arg Leu Pro Arg Gly Glu Gly Asp Thr Phe Lys Gly Lys Leu
565 570 575
His Val Pro Phe Val Pro Val Lys Ala Lys Cys Ile Ala Thr Leu Ala
580 585 590
Pro Glu Pro Leu Val Glu His Lys His Arg Thr Leu Ile Leu His Leu
595 600 605
His Pro Asp His Pro Thr Leu Leu Thr Thr Arg Ser Leu Gly Ser Asp
610 615 620
Ala Asn Pro Thr Arg Gln Trp Ile Glu Arg Pro Thr Thr Val Asn Phe
625 630 635 640
Thr Val Thr Gly Glu Gly Leu Glu Tyr Thr Trp Gly Asn His Pro Pro
645 650 655
Lys Arg Val Trp Ala Gln Glu Ser Gly Glu Gly Asn Pro His Gly Trp
660 665 670
Pro His Glu Val Val Val Tyr Tyr Tyr Asn Arg Tyr Pro Leu Thr Thr
675 680 685
Ile Ile Gly Leu Cys Thr Cys Val Ala Ile Ile Met Val Ser Cys Val
690 695 700
Thr Ser Val Trp Leu Leu Cys Arg Thr Arg Asn Leu Cys Ile Thr Pro
705 710 715 720
Tyr Lys Leu Ala Pro Asn Ala Gln Val Pro Ile Leu Leu Ala Leu Leu
725 730 735
Cys Cys Ile Lys Pro Thr Arg Ala Asp Asp Thr Leu Gln Val Leu Asn
740 745 750
Tyr Leu Trp Asn Asn Asn Gln Asn Phe Phe Trp Met Gln Thr Leu Ile
755 760 765
Pro Leu Ala Ala Leu Ile Val Cys Met Arg Met Leu Arg Cys Leu Phe
770 775 780
Cys Cys Gly Pro Ala Phe Leu Leu Val Cys Gly Ala Leu Gly Ala Ala
785 790 795 800
Ala Tyr Glu His Thr Ala Val Met Pro Asn Lys Val Gly Ile Pro Tyr
805 810 815
Lys Ala Leu Val Glu Arg Pro Gly Tyr Ala Pro Val His Leu Gln Ile
820 825 830
Gln Leu Val Asn Thr Arg Ile Ile Pro Ser Thr Asn Leu Glu Tyr Ile
835 840 845
Thr Cys Lys Tyr Lys Thr Lys Val Pro Ser Pro Val Val Lys Cys Cys
850 855 860
Gly Ala Thr Gln Cys Thr Ser Lys Pro His Pro Asp Tyr Gln Cys Gln
865 870 875 880
Val Phe Thr Gly Val Tyr Pro Phe Met Trp Gly Gly Ala Tyr Cys Phe
885 890 895
Cys Asp Thr Glu Asn Thr Gln Met Ser Glu Ala Tyr Val Glu Arg Ser
900 905 910
Glu Glu Cys Ser Ile Asp His Ala Lys Ala Tyr Lys Val His Thr Gly
915 920 925
Thr Val Gln Ala Met Val Asn Ile Thr Tyr Gly Ser Val Ser Trp Arg
930 935 940
Ser Ala Asp Val Tyr Val Asn Gly Glu Thr Pro Ala Lys Ile Gly Asp
945 950 955 960
Ala Lys Leu Ile Ile Gly Pro Leu Ser Ser Ala Trp Ser Pro Phe Asp
965 970 975
Asn Lys Val Val Val Tyr Gly His Glu Val Tyr Asn Tyr Asp Phe Pro
980 985 990
Glu Tyr Ser Thr Gly Lys Ala Gly Ser Phe Gly Asp Leu Gln Ser Arg
995 1000 1005
Thr Ser Thr Ser Asn Asp Leu Tyr Ala Asn Thr Asn Leu Lys Leu
1010 1015 1020
Gln Arg Pro Gln Ala Gly Ile Val His Thr Pro Phe Thr Gln Ala
1025 1030 1035
Pro Ser Gly Phe Glu Arg Trp Lys Arg Asp Lys Gly Ala Pro Leu
1040 1045 1050
Asn Asp Val Ala Pro Phe Gly Cys Ser Ile Ala Leu Glu Pro Leu
1055 1060 1065
Arg Ala Glu Asn Cys Ala Val Gly Ser Ile Pro Ile Ser Ile Asp
1070 1075 1080
Ile Pro Asp Ala Ala Phe Thr Arg Ile Ser Glu Thr Pro Thr Val
1085 1090 1095
Ser Asp Leu Glu Cys Lys Ile Thr Glu Cys Thr Tyr Ala Ser Asp
1100 1105 1110
Phe Gly Gly Ile Ala Thr Val Ala Tyr Lys Ser Ser Lys Ala Gly
1115 1120 1125
Asn Cys Pro Ile His Ser Pro Ser Gly Val Ala Val Ile Lys Glu
1130 1135 1140
Asn Asp Val Thr Leu Ala Glu Ser Gly Ser Phe Thr Phe His Phe
1145 1150 1155
Ser Thr Ala Asn Ile His Pro Ala Phe Lys Leu Gln Val Cys Thr
1160 1165 1170
Ser Ala Val Thr Cys Lys Gly Asp Cys Lys Pro Pro Lys Asp His
1175 1180 1185
Ile Val Asp Tyr Pro Ala Gln His Thr Glu Ser Phe Thr Ser Ala
1190 1195 1200
Ile Ser Ala Thr Ala Trp Ser Trp Leu Lys Val Leu Val Gly Gly
1205 1210 1215
Thr Ser Ala Phe Ile Val Leu Gly Leu Ile Ala Thr Ala Val Val
1220 1225 1230
Ala Leu Val Leu Phe Phe His Arg His
1235 1240
<210> 18
<211> 2494
<212> PRT
<213> Eastern equine encephalitis virus
<400> 18
Met Glu Lys Val His Val Asp Leu Asp Ala Asp Ser Pro Phe Val Lys
1 5 10 15
Ser Leu Gln Arg Cys Phe Pro His Phe Glu Ile Glu Ala Thr Gln Val
20 25 30
Thr Asp Asn Asp His Ala Asn Ala Arg Ala Phe Ser His Leu Ala Thr
35 40 45
Lys Leu Ile Glu Gly Glu Val Asp Thr Asp Gln Val Ile Leu Asp Ile
50 55 60
Gly Ser Ala Pro Val Arg His Thr His Ser Lys His Lys Tyr His Cys
65 70 75 80
Ile Cys Pro Met Lys Ser Ala Glu Asp Pro Asp Arg Leu Tyr Arg Tyr
85 90 95
Ala Asp Lys Leu Arg Lys Ser Asp Val Thr Asp Lys Cys Ile Ala Ser
100 105 110
Lys Ala Ala Asp Leu Leu Thr Val Met Ser Thr Pro Asp Ala Glu Thr
115 120 125
Pro Ser Leu Cys Met His Thr Asp Ser Thr Cys Arg Tyr His Gly Ser
130 135 140
Val Ala Val Tyr Gln Asp Val Tyr Ala Val His Ala Pro Thr Ser Ile
145 150 155 160
Tyr Tyr Gln Ala Leu Lys Gly Val Arg Thr Ile Tyr Trp Ile Gly Phe
165 170 175
Asp Thr Thr Pro Phe Met Tyr Lys Asn Met Ala Gly Ala Tyr Pro Thr
180 185 190
Tyr Asn Thr Asn Trp Ala Asp Glu Ser Val Leu Glu Ala Arg Asn Ile
195 200 205
Gly Leu Gly Ser Ser Asp Leu His Glu Lys Ser Phe Gly Lys Val Ser
210 215 220
Ile Met Arg Lys Lys Lys Leu Gln Pro Thr Asn Lys Val Ile Phe Ser
225 230 235 240
Val Gly Ser Thr Ile Tyr Thr Glu Glu Arg Ile Leu Leu Arg Ser Trp
245 250 255
His Leu Pro Asn Val Phe His Leu Lys Gly Lys Thr Ser Phe Thr Gly
260 265 270
Arg Cys Asn Thr Ile Val Ser Cys Glu Gly Tyr Val Val Lys Lys Ile
275 280 285
Thr Leu Ser Pro Gly Ile Tyr Gly Lys Val Asp Asn Leu Ala Ser Thr
290 295 300
Met His Arg Glu Gly Phe Leu Ser Cys Lys Val Thr Asp Thr Leu Arg
305 310 315 320
Gly Glu Arg Val Ser Phe Pro Val Cys Thr Tyr Val Pro Ala Thr Leu
325 330 335
Cys Asp Gln Met Thr Gly Ile Leu Ala Thr Asp Val Ser Val Asp Asp
340 345 350
Ala Gln Lys Leu Leu Val Gly Leu Asn Gln Arg Ile Val Val Asn Gly
355 360 365
Arg Thr Gln Arg Asn Thr Asn Thr Met Gln Asn Tyr Leu Leu Pro Val
370 375 380
Val Ala Gln Ala Phe Ser Arg Trp Ala Arg Glu His Arg Ala Asp Leu
385 390 395 400
Glu Asp Glu Lys Gly Leu Gly Val Arg Glu Arg Ser Leu Val Met Gly
405 410 415
Cys Cys Trp Ala Phe Lys Thr His Lys Ile Thr Ser Ile Tyr Lys Arg
420 425 430
Pro Gly Thr Gln Thr Ile Lys Lys Val Pro Ala Val Phe Asn Ser Phe
435 440 445
Val Ile Pro Gln Pro Thr Ser Tyr Gly Leu Asp Ile Gly Leu Arg Arg
450 455 460
Arg Ile Lys Met Leu Phe Asp Ala Lys Lys Ala Pro Ala Pro Ile Ile
465 470 475 480
Thr Glu Ala Asp Val Ala His Leu Lys Gly Leu Gln Asp Glu Ala Glu
485 490 495
Ala Val Ala Glu Ala Glu Ala Val Arg Ala Ala Leu Pro Pro Leu Leu
500 505 510
Pro Glu Val Asp Lys Glu Thr Val Glu Ala Asp Ile Asp Leu Ile Met
515 520 525
Gln Glu Ala Gly Ala Gly Ser Val Glu Thr Pro Arg Arg His Ile Lys
530 535 540
Val Thr Thr Tyr Pro Gly Glu Glu Met Ile Gly Ser Tyr Ala Val Leu
545 550 555 560
Ser Pro Gln Ala Val Leu Asn Ser Glu Lys Leu Ala Cys Ile His Pro
565 570 575
Leu Ala Glu Gln Val Leu Val Met Thr His Lys Gly Arg Ala Gly Arg
580 585 590
Tyr Lys Val Glu Pro Tyr His Gly Arg Val Ile Val Pro Ser Gly Thr
595 600 605
Ala Ile Pro Ile Pro Asp Phe Gln Ala Leu Ser Glu Ser Ala Thr Ile
610 615 620
Val Phe Asn Glu Arg Glu Phe Val Asn Arg Tyr Leu His His Ile Ala
625 630 635 640
Val Asn Gly Gly Ala Leu Asn Thr Asp Glu Glu Tyr Tyr Lys Val Val
645 650 655
Lys Ser Thr Glu Thr Asp Ser Glu Tyr Val Phe Asp Ile Asp Ala Lys
660 665 670
Lys Cys Val Lys Lys Gly Asp Ala Gly Pro Met Cys Leu Val Gly Glu
675 680 685
Leu Val Asp Pro Pro Phe His Glu Phe Ala Tyr Glu Ser Leu Lys Thr
690 695 700
Arg Pro Ala Ala Pro His Lys Val Pro Thr Ile Gly Val Tyr Gly Val
705 710 715 720
Pro Gly Ser Gly Lys Ser Gly Ile Ile Lys Ser Ala Val Thr Lys Arg
725 730 735
Asp Leu Val Val Ser Ala Lys Lys Glu Asn Cys Met Glu Ile Ile Lys
740 745 750
Asp Val Lys Arg Met Arg Gly Met Asp Ile Ala Ala Arg Thr Val Asp
755 760 765
Ser Val Leu Leu Asn Gly Val Lys His Ser Val Asp Thr Leu Tyr Ile
770 775 780
Asp Glu Ala Phe Ala Cys His Ala Gly Thr Leu Leu Ala Leu Ile Ala
785 790 795 800
Ile Val Lys Pro Lys Lys Val Val Leu Cys Gly Asp Pro Lys Gln Cys
805 810 815
Gly Phe Phe Asn Met Met Cys Leu Lys Val His Phe Asn His Glu Ile
820 825 830
Cys Thr Glu Val Tyr His Lys Ser Ile Ser Arg Arg Cys Thr Lys Thr
835 840 845
Val Thr Ser Ile Val Ser Thr Leu Phe Tyr Asp Lys Arg Met Arg Thr
850 855 860
Val Asn Pro Cys Asn Asp Lys Ile Ile Ile Asp Thr Thr Ser Thr Thr
865 870 875 880
Lys Pro Leu Lys Asp Asp Ile Ile Leu Thr Cys Phe Arg Gly Trp Val
885 890 895
Lys Gln Leu Gln Ile Asp Tyr Lys Asn His Glu Ile Met Thr Ala Ala
900 905 910
Ala Ser Gln Gly Leu Thr Arg Lys Gly Val Tyr Ala Val Arg Tyr Lys
915 920 925
Val Asn Glu Asn Pro Leu Tyr Ala Gln Thr Ser Glu His Val Asn Val
930 935 940
Leu Leu Thr Arg Thr Glu Lys Arg Ile Val Trp Lys Thr Leu Ala Gly
945 950 955 960
Asp Pro Trp Ile Lys Thr Leu Thr Ala Ser Tyr Pro Gly Asn Phe Thr
965 970 975
Ala Thr Leu Glu Glu Trp Gln Ala Glu His Asp Ala Ile Met Ala Lys
980 985 990
Ile Leu Glu Thr Pro Ala Ser Ser Asp Val Phe Gln Asn Lys Val Asn
995 1000 1005
Val Cys Trp Ala Lys Ala Leu Glu Pro Val Leu Ala Thr Ala Asn
1010 1015 1020
Ile Thr Leu Thr Arg Ser Gln Trp Glu Thr Ile Pro Ala Phe Lys
1025 1030 1035
Asp Asp Lys Ala Tyr Ser Pro Glu Met Ala Leu Asn Phe Phe Cys
1040 1045 1050
Thr Arg Phe Phe Gly Val Asp Ile Asp Ser Gly Leu Phe Ser Ala
1055 1060 1065
Pro Thr Val Pro Leu Thr Tyr Thr Asn Glu His Trp Asp Asn Ser
1070 1075 1080
Pro Gly Pro Asn Met Tyr Gly Leu Cys Met Arg Thr Ala Lys Glu
1085 1090 1095
Leu Ala Arg Arg Tyr Pro Cys Ile Leu Lys Ala Val Asp Thr Gly
1100 1105 1110
Arg Val Ala Asp Val Arg Thr Asp Thr Ile Lys Asp Tyr Asn Pro
1115 1120 1125
Leu Ile Asn Val Val Pro Leu Asn Arg Arg Leu Pro His Ser Leu
1130 1135 1140
Val Val Thr His Arg Tyr Thr Gly Asn Gly Asp Tyr Ser Gln Leu
1145 1150 1155
Val Thr Lys Met Thr Gly Lys Thr Val Leu Val Val Gly Thr Pro
1160 1165 1170
Met Asn Ile Pro Gly Lys Arg Val Glu Thr Leu Gly Pro Ser Pro
1175 1180 1185
Gln Cys Thr Tyr Lys Ala Glu Leu Asp Leu Gly Ile Pro Ala Ala
1190 1195 1200
Leu Gly Lys Tyr Asp Ile Ile Phe Ile Asn Val Arg Thr Pro Tyr
1205 1210 1215
Arg His His His Tyr Gln Gln Cys Glu Asp His Ala Ile His His
1220 1225 1230
Ser Met Leu Thr Arg Lys Ala Val Asp His Leu Asn Lys Gly Gly
1235 1240 1245
Thr Cys Ile Ala Leu Gly Tyr Gly Thr Ala Asp Arg Ala Thr Glu
1250 1255 1260
Asn Ile Ile Ser Ala Val Ala Arg Ser Phe Arg Phe Ser Arg Val
1265 1270 1275
Cys Gln Pro Lys Cys Ala Trp Glu Asn Thr Glu Val Ala Phe Val
1280 1285 1290
Phe Phe Gly Lys Asp Asn Gly Asn His Leu Gln Asp Gln Asp Arg
1295 1300 1305
Leu Ser Val Val Leu Asn Asn Ile Tyr Gln Gly Ser Thr Gln His
1310 1315 1320
Glu Ala Gly Arg Ala Pro Ala Tyr Arg Val Val Arg Gly Asp Ile
1325 1330 1335
Thr Lys Ser Asn Asp Glu Val Ile Val Asn Ala Ala Asn Asn Lys
1340 1345 1350
Gly Gln Pro Gly Gly Gly Val Cys Gly Ala Leu Tyr Arg Lys Trp
1355 1360 1365
Pro Gly Ala Phe Asp Lys Gln Pro Val Ala Thr Gly Lys Ala His
1370 1375 1380
Leu Val Lys His Ser Pro Asn Val Ile His Ala Val Gly Pro Asn
1385 1390 1395
Phe Ser Arg Leu Ser Glu Asn Glu Gly Asp Gln Lys Leu Ser Glu
1400 1405 1410
Val Tyr Met Asp Ile Ala Arg Ile Ile Asn Asn Glu Arg Phe Thr
1415 1420 1425
Lys Val Ser Ile Pro Leu Leu Ser Thr Gly Ile Tyr Ala Gly Gly
1430 1435 1440
Lys Asp Arg Val Met Gln Ser Leu Asn His Leu Phe Thr Ala Met
1445 1450 1455
Asp Thr Thr Asp Ala Asp Ile Thr Ile Tyr Cys Leu Asp Lys Gln
1460 1465 1470
Trp Glu Ser Arg Ile Lys Glu Ala Ile Thr Arg Lys Glu Ser Val
1475 1480 1485
Glu Glu Leu Thr Glu Asp Asp Arg Pro Val Asp Ile Glu Leu Val
1490 1495 1500
Arg Val His Pro Leu Ser Ser Leu Ala Gly Arg Pro Gly Tyr Ser
1505 1510 1515
Thr Thr Glu Gly Lys Val Tyr Ser Tyr Leu Glu Gly Thr Arg Phe
1520 1525 1530
His Gln Thr Ala Lys Asp Ile Ala Glu Ile Tyr Ala Met Trp Pro
1535 1540 1545
Asn Lys Gln Glu Ala Asn Glu Gln Ile Cys Leu Tyr Val Leu Gly
1550 1555 1560
Glu Ser Met Asn Ser Ile Arg Ser Lys Cys Pro Val Glu Glu Ser
1565 1570 1575
Glu Ala Ser Ser Pro Pro His Thr Ile Pro Cys Leu Cys Asn Tyr
1580 1585 1590
Ala Met Thr Ala Glu Arg Val Tyr Arg Leu Arg Met Ala Lys Asn
1595 1600 1605
Glu Gln Phe Ala Val Cys Ser Ser Phe Gln Leu Pro Lys Tyr Arg
1610 1615 1620
Ile Thr Gly Val Gln Lys Ile Gln Cys Ser Lys Pro Val Ile Phe
1625 1630 1635
Ser Gly Thr Val Pro Pro Ala Ile His Pro Arg Lys Phe Ala Ser
1640 1645 1650
Val Thr Val Glu Asp Thr Pro Met Val Gln Pro Glu Arg Leu Val
1655 1660 1665
Pro Arg Arg Pro Ala Pro Pro Val Pro Val Pro Ala Arg Ile Pro
1670 1675 1680
Ser Pro Pro Cys Thr Ser Thr Asn Gly Ser Thr Thr Ser Ile Gln
1685 1690 1695
Ser Leu Gly Glu Asp Gln Ser Ala Ser Ala Ser Ser Gly Ala Glu
1700 1705 1710
Ile Ser Val Asp Gln Val Ser Leu Trp Ser Ile Pro Ser Ala Thr
1715 1720 1725
Gly Phe Asp Val Arg Thr Ser Ser Ser Leu Ser Leu Glu Gln Pro
1730 1735 1740
Thr Phe Pro Thr Met Val Val Glu Ala Glu Ile His Ala Ser Gln
1745 1750 1755
Gly Ser Leu Trp Ser Ile Pro Ser Ile Thr Gly Ser Glu Thr Arg
1760 1765 1770
Ala Pro Ser Pro Pro Ser Gln Asp Ser Arg Pro Ser Thr Pro Ser
1775 1780 1785
Ala Ser Gly Ser His Thr Ser Val Asp Leu Ile Thr Phe Asp Ser
1790 1795 1800
Val Ala Glu Ile Leu Glu Asp Phe Ser Arg Ser Pro Phe Gln Phe
1805 1810 1815
Leu Ser Glu Ile Lys Pro Ile Pro Ala Pro Arg Thr Arg Val Thr
1820 1825 1830
Asn Met Ser Arg Ser Ala Asp Thr Ile Lys Pro Ile Pro Lys Pro
1835 1840 1845
Arg Lys Cys Gln Val Lys Tyr Thr Gln Pro Pro Gly Val Ala Arg
1850 1855 1860
Ala Ile Ser Ala Ala Glu Phe Asp Glu Phe Val Arg Arg His Ser
1865 1870 1875
Asn Arg Arg Tyr Glu Ala Gly Ala Tyr Ile Phe Ser Ser Glu Thr
1880 1885 1890
Gly Gln Gly His Leu Gln Gln Lys Ser Thr Arg Gln Cys Lys Leu
1895 1900 1905
Gln Tyr Pro Ile Leu Glu Arg Ser Val His Glu Lys Phe Tyr Ala
1910 1915 1920
Pro Arg Leu Asp Leu Glu Arg Glu Lys Leu Leu Gln Lys Lys Leu
1925 1930 1935
Gln Leu Cys Ala Ser Glu Gly Asn Arg Ser Arg Tyr Gln Ser Arg
1940 1945 1950
Lys Val Glu Asn Met Lys Ala Ile Thr Val Glu Arg Leu Leu Gln
1955 1960 1965
Gly Ile Gly Ser Tyr Leu Ser Ala Glu Pro Gln Pro Val Glu Cys
1970 1975 1980
Tyr Lys Val Thr Tyr Pro Ala Pro Met Tyr Ser Ser Thr Ala Ser
1985 1990 1995
Asn Ser Phe Ser Ser Ala Glu Val Ala Val Lys Val Cys Asn Leu
2000 2005 2010
Val Leu Gln Glu Asn Phe Pro Thr Val Ala Ser Tyr Asn Ile Thr
2015 2020 2025
Asp Glu Tyr Asp Ala Tyr Leu Asp Met Val Asp Gly Ala Ser Cys
2030 2035 2040
Cys Leu Asp Thr Ala Thr Phe Cys Pro Ala Lys Leu Arg Ser Phe
2045 2050 2055
Pro Lys Lys His Ser Tyr Leu Arg Pro Glu Ile Arg Ser Ala Val
2060 2065 2070
Pro Ser Pro Ile Gln Asn Thr Leu Gln Asn Val Leu Ala Ala Ala
2075 2080 2085
Thr Lys Arg Asn Cys Asn Val Thr Gln Met Arg Glu Leu Pro Val
2090 2095 2100
Leu Asp Ser Ala Ala Phe Asn Val Glu Cys Phe Lys Lys Tyr Ala
2105 2110 2115
Cys Asn Asp Glu Tyr Trp Asp Phe Tyr Lys Thr Asn Pro Ile Arg
2120 2125 2130
Leu Thr Ala Glu Asn Val Thr Gln Tyr Val Thr Lys Leu Lys Gly
2135 2140 2145
Pro Lys Ala Ala Ala Leu Phe Ala Lys Thr His Asn Leu Gln Pro
2150 2155 2160
Leu His Glu Ile Pro Met Asp Arg Phe Val Met Asp Leu Lys Arg
2165 2170 2175
Asp Val Lys Val Thr Pro Gly Thr Lys His Thr Glu Glu Arg Pro
2180 2185 2190
Lys Val Gln Val Ile Gln Ala Ala Asp Pro Leu Ala Thr Ala Tyr
2195 2200 2205
Leu Cys Gly Ile His Arg Glu Leu Val Arg Arg Leu Asn Ala Val
2210 2215 2220
Leu Leu Pro Asn Ile His Thr Leu Phe Asp Met Ser Ala Glu Asp
2225 2230 2235
Phe Asp Ala Ile Ile Ala Glu His Phe Gln Phe Gly Asp Ser Val
2240 2245 2250
Leu Glu Thr Asp Ile Ala Ser Phe Asp Lys Ser Glu Asp Asp Ala
2255 2260 2265
Ile Ala Met Ser Ala Leu Met Ile Leu Glu Asp Leu Gly Val Asp
2270 2275 2280
Gln Ala Leu Leu Asn Leu Ile Glu Ala Ala Phe Gly Asn Ile Thr
2285 2290 2295
Ser Val His Leu Pro Thr Gly Thr Arg Phe Lys Phe Gly Ala Met
2300 2305 2310
Met Lys Ser Gly Met Phe Leu Thr Leu Phe Ile Asn Thr Val Val
2315 2320 2325
Asn Ile Met Ile Ala Ser Arg Val Leu Arg Glu Arg Leu Thr Thr
2330 2335 2340
Ser Pro Cys Ala Ala Phe Ile Gly Asp Asp Asn Ile Val Lys Gly
2345 2350 2355
Val Thr Ser Asp Glu Leu Met Ala Glu Arg Cys Ala Thr Trp Leu
2360 2365 2370
Asn Met Glu Val Lys Ile Ile Asp Ala Val Val Gly Val Lys Ala
2375 2380 2385
Pro Tyr Phe Cys Gly Gly Phe Ile Val Val Asp Gln Ile Thr Gly
2390 2395 2400
Thr Ala Cys Arg Val Ala Asp Pro Leu Lys Arg Leu Phe Lys Leu
2405 2410 2415
Gly Lys Pro Leu Pro Leu Asp Asp Asp Gln Asp Val Asp Arg Arg
2420 2425 2430
Arg Ala Leu His Asp Glu Ala Ala Arg Trp Asn Arg Ile Gly Ile
2435 2440 2445
Thr Glu Glu Leu Val Lys Ala Val Glu Ser Arg Tyr Glu Val Asn
2450 2455 2460
Tyr Val Ser Leu Ile Ile Thr Ala Leu Thr Thr Leu Ala Ser Thr
2465 2470 2475
Val Ser Asn Phe Lys His Ile Arg Gly His Pro Ile Thr Leu Tyr
2480 2485 2490
Gly
<210> 19
<211> 11476
<212> DNA
<213> Western equine encephalitis virus
<400> 19
aactaatcga tccaatatgg aaagaattca cgttgactta gatgctgaca gcccgtatgt 60
caagtcgtta cagcggagct ttccacaatt tgagatcgaa gcaaggcagg tcactgacaa 120
tgaccatgcc aatgccagag cgttttcgca tgtggcaaca aagctcattg agagcgaagt 180
cgaccgggac caagttatct tggacattgg aagtgcgccc gtcagacatg cacattccaa 240
tcaccgctat cattgtatct gccctatgat aagcgctgaa gacccggaca gactacaacg 300
gtatgcagaa agacttaaga aaagtgacat taccgacaag aacatagcct ctaaggcggc 360
agacctgctg gaagtcatgt caacaccaga cgcagagact ccatctctgt gtatgcacac 420
agacgccacg tgtaggtact ttggaagtgt agcagtatac caagatgtgt acgcagtcca 480
tgcaccgaca tcaatctacc accaggcgct taaaggagtt aggacaattt actggatagg 540
ctttgacacg acccctttta tgtacaaaaa catggcaggt tcttacccta cttacaacac 600
gaactgggct gacgagagag tattggaagc acgtaacatt ggcctcggta actcagatct 660
tcaggagagc aggcttggaa acctctcaat ccttaggaag aagaggctcc aacctactaa 720
taagatcata ttctcggttg gttcaacaat ctacacagaa gatagatcac tgttacgtag 780
ctggcatctt ccaaacgtgt tccacttgaa aggaaagtct aacttcacag gtagatgtgg 840
gaccattgtc agctgtgaag ggtacgtcat aaaaaaaatt acaatcagcc caggactata 900
cggtaaagtt gagaacttgg cgtccacaat gcatcgcgag ggtttcttga gttgcaaagt 960
cacagatacg ttgcgcggcg agagggtttc ttttgctgtg tgtacgtatg taccagccac 1020
actttgcgat cagatgacag ggattctggc aactgacgtt agtgtggatg acgcacaaaa 1080
actattggtt gggctcaacc aaaggattgt cgtcaatggt aggacgcaaa gaaatactaa 1140
cacaatgcag aactatctat taccagtggt cgcccaggcg ttttccaggt gggcgcgtga 1200
acatcgtgcc gacttggacg acgagaaaga actaggggtg cgggagcgca ctcttactat 1260
gggctgctgc tgggctttca agacccagaa aatcacatcc atctacaaga agcctggtac 1320
gcaaacaatt aagaaagtac ctgccgtctt tgactcattt gtgtttccac gccttaccag 1380
ccacgggctc gatatgggct tccgccgtag gctcaagctg ctgcttgaac caactgtcaa 1440
acccgcaccg gctattacaa tggccgatgt ggagcatctg cgtggcttac agcaagaagc 1500
tgaagaagtg gctgcagcgg aagagatcag agaagccctg ccgcccttgc tccctgaaat 1560
agaaaaagag accgtagagg cagaagtaga cctcattatg caagaggcag gagcaggtag 1620
cgtggagaca ccacgaggac acatcagggt gacaagttac ccaggcgaag agaagattgg 1680
gtcttacgct gtactttcac cccaggcggt attgaatagt gaaaaactgg cgtgtatcca 1740
cccattggcg gaacaagtac tggtaatgac tcacaaaggt agggctggga gatacaaggt 1800
cgagccatac cacggtaagg tcattgtacc agaagggacg gcggtccctg ttcaggactt 1860
ccaggcattg agtgagagcg ctacgatcgt tttcaacgag agggagttcg taaacagata 1920
cctgcatcac atcgcaatca acggaggagc gctaaacact gacgaagagt actataagac 1980
tgtaaagact caggacacag actcagaata cgtcttcgac gttgacgcac gaaagtgtgt 2040
taagcgagaa gacgcaggtc cgttgtgcct aaccggtgat ctggtagatc cgccatttca 2100
cgagtttgcg tacgagagtc ttaggacgcg accagcagca cctcacaaag tcccaaccat 2160
tggagtctat ggagtgccag gttcgggtaa atctggaatc atcaaaagcg ctgtgaccaa 2220
gaaagatctg gttgtgagtg cgaagaagga aaactgcgca gaaatcatca gggatgtaag 2280
gaggatgaga tgtatggatg ttgctgctag gactgtagat tctgtgctgc tgaatggggt 2340
taagcacccc gttaacactc tgtacattga tgaggcattt gcctgccatg cagggacgct 2400
gctggcactg attgccatcg tcaaacctaa gaaagtggta ttgtgcgggg acccaaaaca 2460
atgcggcttc tttaacatga tgtgcctgaa agtacatttt aaccatgaca tatgcactga 2520
agtgtaccat aaaagcatct ctaggaggtg cacacagact gtaaccgcta tcgtctccac 2580
gctcttttac gacaagcgaa tgaagacggt taacccatgt gctgacaaaa tcatcataga 2640
taccacaggg accacaaagc cgcacaaaga tgatctgatt ctaacctgtt tcagaggatg 2700
ggtgaaacag ctacagattg actataaaaa tcatgaaatc atgactgcgg ctgcatcgca 2760
aggacttacg cggaaaggcg tttatgctgt caggtacaaa gtcaacgaga atccactcta 2820
ctcgcagact tctgagcacg tgaacgtgtt acttacacgc acagaaaaac gcattgtctg 2880
gaagacgcta gctggtgatc cctggataaa gatacttaca gctaaatatt ccggggattt 2940
cacggcttca ttggacgact ggcagcgaga acatgatgcc attatggcac gcgttcttga 3000
taagccgcag acagctgatg tgttccagaa taaggtgaac gtctgctggg cgaaggctct 3060
agagccagtc ttggccacgg ccaacattgt gctgacgaga cagcagtggg agacgttgca 3120
cccattcaag catgacagag cgtactcacc tgaaatggca ctgaacttct tttgcaccag 3180
gttctttgga gtagacctgg acagtgggtt gttttccgct cctaccgtcg cacttactta 3240
tagggatcag cactgggata actcgccagg gaagaacatg tatgggctta atagagaggt 3300
agcaaaggag ttgtcacggc gatatccgtg catcacaaaa gcggttgaca caggcagggt 3360
agctgatata aggaataata ccatcaagga ctactctcca acaattaatg tggttccatt 3420
aaatcgtcgg ttaccccact cgttgatcgt tgaccacaaa ggacagggta caactgatca 3480
cagcggattc ctatctaaga tgaagggcaa atctgtgttg gtgatcggcg atcctatcag 3540
cattccaggg aagaaagtag agtccatggg tccattgccc actaatacca tcaggtgtga 3600
tctagatttg ggaataccta gccatgtcgg taaatatgac attatatttg tcaatgttag 3660
gaccccgtat aagaaccatc actaccaaca gtgcgaggat cacgctatcc accacagcat 3720
gttaacgtgt aaggctgtcc accacctgaa cactggcgga acatgtgtgg ctatagggta 3780
tgggcttgct gatcgcgcaa ccgagaatat catcactgcg gtagcgcgct catttaggtt 3840
tacccgtgtc tgtcagccta agaacactgc cgaaaatact gaggttctct tcgtgttctt 3900
cggcaaggac aacggcaacc acacacatga ccaggacaga ctcgctgtag tgcttgacaa 3960
catctaccaa gggtcaacca ggtacgaggc agggagagct ccagcgtaca gagtgatcag 4020
aggtgacatt agcaagagcg ctgaccaagc tatcgttaat gctgctaata gcaaaggtca 4080
accaggttcc ggagtgtgcg gtgcactgta ccgaaaatgg ccggctgctt ttgatagaca 4140
gccaatagct gtcgggacgg ctagacttgt gaagcacgaa ccgctcatca tacatgctgt 4200
aggacccaat ttttctaaga tgccggaacc ggagggcgac cttaagctcg cagctgccta 4260
catgagcata gcgtcaatcg tcaacgctga acggattact aaaatatcag taccgctact 4320
gtcaaccggc atctattctg gtggcaaaga tcgagtgatg caatcattgc atcacctgtt 4380
cactgctttc gacactacgg atgccgatgt caccatatat tgcttggata aacaatggga 4440
gaccaggata atcgaggcca ttcaccgcaa agaaagcgtc gaaatactgg atgatgacaa 4500
gccagtagac attgacttgg ttagggtcca tccaaacagc gctttggcag gcagacctgg 4560
ttactccgtc aatgagggca agctgtattc atacctggaa ggtacacgat tccatcagac 4620
cgccaaggac attgccgaaa tccatgcaat gtggcccaac aaatctgagg ctaatgagca 4680
gatttgcttg tacatcctgg gtgagagtat gtccagcatc cgctccaaat gcccagtaga 4740
ggagtcagag gcgtctgctc cacctcacac actgccgtgc ctgtgtaatt acgctatgac 4800
ggctgagcgc gtatacaggt tgcgctctgc gaagaaagaa cagttcgccg tatgctcatc 4860
attcctgttg ccgaagtaca ggatcacagg cgtgcagaag ctacaatgca gcaaaccagt 4920
cctgttttca ggcgtcgtac cgccggctgt acaccccagg aagtacgcgg aaataattct 4980
agaaacgcca ccaccgccag taacgacaac cgtaatatgt gaacccactg tgccagaacg 5040
tatacccagt ccggcgattt ctagagcacc aagtgcggaa tcactgctat cttttagcgg 5100
cgtctcgttc tctagctctg ccacacgctc gtcaaccgcc tggagcgact atgacaggcg 5160
gtttgtggtt acagctgacg tgcatcaagc gaacatatct acgtggagca tccctagtgc 5220
tcctggcttg gacgtccaaa taccttctga cgtcagtgat tcccactgga gtgttccgag 5280
tgcatcaggc ttcgaagtga gaacaccatc tgtacaggac ctaactgcgg agtgtgcaaa 5340
gcctcgtggg ctggccgaaa taatgcaaga cttcaatact gcccctttcc agtttctttc 5400
ggaccacaga ccagtaccgg caccacggag acgccccatc ccatcaccta gatcgacggt 5460
ttccgcacct ccagttccaa agccacgcag gactaagtac caacaaccac caggagtcgc 5520
tagagcgatc tcagaagcgg agctggacga gtacatccgt caacactcca attgacggta 5580
tgaagcggga gcgtatattt tctcatcgga aacaggccaa ggtcaccttc aacagaaatc 5640
agtacgtcaa tgtaaactac aagaacctat attggaccgg gccgtccatg agaagtatta 5700
cgccccgcgc ctcgatctcg aaagagagaa aatgttacag aagaaattgc aattatgtgc 5760
ctctgaagga aatagaagca ggtatcaatc acgaaaagta gaaaatatga aagcaattac 5820
agcggagcga ctcatttctg gattgggcac atacctatca tcagaagtga atcctgtcga 5880
gtgttacaga gtcaactatc ctgtaccaat ctactcgtca acggtaatta acaggtttac 5940
atctgcagag gtcgcggtta aaacgtgcaa cttagttatc caagagaatt accctacagt 6000
agccagttat tgtataacag atgaatacga tgcgtatctt gacatggtgg acggcgcatc 6060
gtgctgtcta gatacagcca ctttttgtcc ggctaaactg agaagctacc caaagaagca 6120
tagctatttg cagccagaga taagatcagc cgtcccatcg cctatacaga atacattaca 6180
aaatgtattg gctgcagcta ctaaaaggaa ttgcaacgtt acccaaatgc gagaattacc 6240
tgtcttagat tcggcggcat ttaacgttga ttgtttcaag aaatacgcat gcaatgatga 6300
gtactgggat acctttcgcg ataaccctat tcggctaact acagagaacg ttacgcaata 6360
tgtgacaaag ctgaaagggc cgaaagcagc agcattgttt gcgaaaactc acaatctaaa 6420
accgttgcag gagataccaa tggatcaatt cgtcatggat ctaaaaagag atgtcaaagt 6480
tactcccggc acgaaacata cagaggagcg gcctaaggtg caggttattc aggctgcaga 6540
cccccttgct accgcttacc tttgcgggat ccaccgggaa ttagtccgta gactgaacgc 6600
tgtgcttctg ccgaatatcc atactctctt cgacatgtca gcggaagatt ttgatgcgat 6660
tattgctgga catttccacc acggcgaccc agtattggaa acggacatcg cgtcgtttga 6720
taaaagcgaa gacgacgcta tcgccatttc ggcgatgatg atccttgagg acttaggcgt 6780
cgaccaaccg ctcttagatt tgatagaggc ggcgttcggc aatatcacat ctgtgcacct 6840
acctacagga acgaggttta aatttggtgc catgatgaaa tccggcatgt tcttaacgct 6900
gtttgtcaac acactagtca atatcatgat tgctagcaga gtactacgtg aacggttaac 6960
cacgtcagcg tgcgcggcct ttatcggcga cgataacata gtgcatggtg tcgtctccga 7020
caccttgatg gcggagagat gcgccacttg gctgaacatg gaagtaaaaa ttattgatgc 7080
agtcattggt atcaaagcac cctacttctg cgggggattt atcctggtgg accagataac 7140
aggcacagcc tgcagggtcg cagaccctct aaaaaggctt tttaagcttg gaaaaccgtt 7200
gtcagttgaa gacacccaag actgcgaccg ccgccgggca ctgcatgatg aagcaatgcg 7260
atggaacaga atcggaatta cggacgagtt ggtgaaggcc gtagaatcca gatacgagat 7320
catactggca ggcctgatca tcacgtctct gtccacgtta gccgaaagcg ttaagaactt 7380
caagagcata agagggagcc caatcaccct ctacggctga cctaaatagg tgacgtagta 7440
gacacgcacc tacccatcgc cataatgttt ccataccctc agctgaactt tccaccagtt 7500
taccctacaa atccgatggc ttaccgagat ccaaaccctc ctaggcgccg ctggaggccg 7560
ttccggcccc cgctggctgc tcaaatcgaa gatcttagga ggtcgatagc taacttgact 7620
ttcaaacaac gatcacctaa tccgccgcca ggtccaccgc caaagaagaa gaagagtgct 7680
cctaagccaa aacctactca gcctaaaaag aagaagcagc aagccaagag gacgaaacgt 7740
aagcctaaac cagggaaacg acagcgtatg tgtatgaagt tggagtcgga caagacattt 7800
ccgatcatgc tgaacggcca agtgaatgga tacgcttgcg ttgtcggagg aaggctgatg 7860
aaaccactcc acgttgaagg aaaaattgat aatgagcaat tagcggccgt gaaattgaag 7920
aaggctagca agtacgactt agagtatggc gacgttcccc agaatatgaa atcagacacg 7980
ctgcagtaca ccagtgacaa accaccgggc ttctacaact ggcaccatgg cgcagtccag 8040
tatgagaatg ggagattcac cgtaccgaga ggagtgggcg ggaaaggcga cagcggaaga 8100
ccgatcctgg acaacagagg cagagttgtg gctattgttc taggaggtgc aaatgagggc 8160
acgcgtacgg cgctttcagt ggtcacttgg aaccagaaag gggtgaccgt ttgggatccc 8220
cccgaaggtt ctgaaccgtg gtcactagtt acagcgctgt gcgtgctttc gaatgtcact 8280
ttcccatgtg acaaaccacc cgtgtgctat tcactggcgc cagaacgaac actcgacgtg 8340
ctcgaagaga acgtcgacaa tccaaattac gacacgctgc tggagaacgt cttgaaatgt 8400
ccatcacacc ggcccaaacg aagcattacc gatgacttca cactgaccag tccctacttg 8460
gggttctgcc cgtattgcag acactcaacg ccgtgtttca gcccaataaa aattgagaac 8520
gtgtgggacg aatctgatga tggatcgatt agaatccagg tctcggcaca attcggttac 8580
aatcaggcag gcactgcaga tgtcactaaa ttccgttaca tgtctttcga ccacgaccat 8640
gacatcaagg aagacagtat ggagaaaata gccatcagca catccggacc ctgccgtcgt 8700
cttggccaca aagggtattt cctgttagct caatgtcctc caggtgacag tgtaaccgtc 8760
agtatcacga gcggaactgc tgagaactca tgcaccgtgg agagaaagat caggaggaag 8820
tttgtcggta gagaggagta cttgctccca cccatccatg gaaagcaggt aaagtgccac 8880
gtttacgatc acttgaaaga gacgtctgcc gggtatataa ccatgcacag gccaggccca 8940
cacgcgtata agtcctatct ggaggaagcg tcaggcgaag tgtatattaa accaccttct 9000
ggcaagaacg tcacctacga atgtaagtgt ggcgactaca gcacaggtat cgtgagcacg 9060
cgaacgaaga taaacggctg cactaaagca aaacagtgca ttgcctacaa gagcgaccaa 9120
acgaaatggg tcttcaactc gccggatctt attaggcaca cagaccactc agtgcaaggt 9180
aaactgcata ttccattccg cttgacaccg acagtctgcc cggttccgtt agctcacacg 9240
cctacagtca tgaagtggtt caaaggcatc accctccacc tgactgcaac gcgaccaaca 9300
ttgctgacaa cgagaaaatt ggggctgcga gcagacgcaa cagcagaatg gattacaggg 9360
actacatcca ggaatttttc tgtggggcga gaagggctgg agtacgtatg gggcaaccat 9420
gaaccggtca gagtctgggc ccaggagtcg gcaccaggcg acccacatgg atggccgcat 9480
gagattatca ttcactatta tcatcggcat ccagtctaca ccgtcattgt gctgtgtggt 9540
gtcgctcttg ctatcctggt aggcactgca tcgtcagcag cttgtatctc caaagcaaga 9600
agagactgcc tgacgccata cgcgcttgca ccgaacgcga cggtacccac agcattagtg 9660
gttttgtgct gcattcggcc aaccaacgct gaaacacttg gagaaacttt gaaccatctg 9720
tggtttaaca accaaccgtt tctctgggca cagttgtgca ttcctctggc ggctcttatt 9780
attctgttcc gctgcttttc atgctgcatg ccttttttat tggttgcagg cgtctgcctg 9840
gggaaggtag acgccttcga acatgcgacc actgtgccaa atgttccggg gatcccgtat 9900
aaggcgttgg tcgaacgtgc aggttacgcg ccacttaacc tggagatcac tgttgtctca 9960
tcggaattaa caccctcaac taataaggag tacgtgacct gcaaattcca cacagtcatt 10020
ccttcaccac aagttaaatg ctgcgggtcc ctcgagtgta aggcatcctc aagggcggat 10080
tacacatgcc gcgtttttgg cggtgtgtac cctttcatgt ggggaggcgc acaatgcttc 10140
tgtgacagtg agaacacaca actgagtgag gcatacgtcg agttcgctcc ggactgcact 10200
atagatcacg cagtcgcact aaaagttcat acagctgctc tgaaagtcgg cctgcgtata 10260
gtgtacggta ataccaccgc gcacctggat acgttcgtca acggcgtcac accaggttcc 10320
tcacgggacc tgaaggtcat agcagggccg atatcagccg ctttttcacc ctttgaccat 10380
aaggtcgtca tcagaaaggg gtttgtttac aactacgact tccctgagta tggtgctatg 10440
aaaccaggag cgttcggcga tattcaagca tcctctcttg atgctacaga catagtagcc 10500
cgcactgaca tacggctgct gaagccttct gtcaagaaca tccacgtccc ctacacccaa 10560
gcagtatcag ggtatgaaat gtggaagaac aactcaggac gacccctgca agaaacagca 10620
ccatttggat gtaaaattga agtggagcct ctgcgagcgt ctaactgtgc ttacgggcac 10680
attcctatct cgattgacat ccctgatgca gctttcgtga gatcatcaga atcaccaaca 10740
attttagaag ttagctgcac agtagcagac tgcatttatt ctgcagactt tggtggttct 10800
ctaacattac agtacaaagc tgatagggag ggacattgtc cagttcactc ccactccacg 10860
acagctgttt tgaaggaagc gaccacacat gtgactgccg taggcagcat aacactacat 10920
tttagcacat cgagcccaca agcaaatttt atagtttcgc tatgcggcaa gaagtccacc 10980
tgcaatgctg aatgtaaacc accggccgac cacataattg gagaaccgca taaagtcgac 11040
caagaattcc aagcggcagt ttccacaaca tcttggaact ggctgcttgc actgtttggg 11100
ggagcatcat ccctcattgt tgtaggactt atagtgttgg tctgcagctc tatgcttata 11160
aacacacgta gatgactgag cgcggacact gacatagcgg taaaaactcg atgtacttcc 11220
gaggaagcgt ggtgcataat gccacgcgcc gcttgacact aaaactcgat gtatttccga 11280
ggaagcacag tgcataatgc tgtgcagtgt cacattaatc gcatatcaca ctatatatta 11340
acaacactat atcactttta taagactcac tatgggtctc taatatacac tacacatatt 11400
ttacttaaaa acactataca cactttataa gttcttttat aatttttctt ttgtttttat 11460
tttgttttta aaattt 11476
<210> 20
<211> 1236
<212> PRT
<213> Western equine encephalitis virus
<400> 20
Met Phe Pro Tyr Pro Gln Leu Asn Phe Pro Pro Val Tyr Pro Thr Asn
1 5 10 15
Pro Met Ala Tyr Arg Asp Pro Asn Pro Pro Arg Arg Arg Trp Arg Pro
20 25 30
Phe Arg Pro Pro Leu Ala Ala Gln Ile Glu Asp Leu Arg Arg Ser Ile
35 40 45
Ala Asn Leu Thr Phe Lys Gln Arg Ser Pro Asn Pro Pro Pro Gly Pro
50 55 60
Pro Pro Lys Lys Lys Lys Ser Ala Pro Lys Pro Lys Pro Thr Gln Pro
65 70 75 80
Lys Lys Lys Lys Gln Gln Ala Lys Arg Thr Lys Arg Lys Pro Lys Pro
85 90 95
Gly Lys Arg Gln Arg Met Cys Met Lys Leu Glu Ser Asp Lys Thr Phe
100 105 110
Pro Ile Met Leu Asn Gly Gln Val Asn Gly Tyr Ala Cys Val Val Gly
115 120 125
Gly Arg Leu Met Lys Pro Leu His Val Glu Gly Lys Ile Asp Asn Glu
130 135 140
Gln Leu Ala Ala Val Lys Leu Lys Lys Ala Ser Lys Tyr Asp Leu Glu
145 150 155 160
Tyr Gly Asp Val Pro Gln Asn Met Lys Ser Asp Thr Leu Gln Tyr Thr
165 170 175
Ser Asp Lys Pro Pro Gly Phe Tyr Asn Trp His His Gly Ala Val Gln
180 185 190
Tyr Glu Asn Gly Arg Phe Thr Val Pro Arg Gly Val Gly Gly Lys Gly
195 200 205
Asp Ser Gly Arg Pro Ile Leu Asp Asn Arg Gly Arg Val Val Ala Ile
210 215 220
Val Leu Gly Gly Ala Asn Glu Gly Thr Arg Thr Ala Leu Ser Val Val
225 230 235 240
Thr Trp Asn Gln Lys Gly Val Thr Val Trp Asp Pro Pro Glu Gly Ser
245 250 255
Glu Pro Trp Ser Leu Val Thr Ala Leu Cys Val Leu Ser Asn Val Thr
260 265 270
Phe Pro Cys Asp Lys Pro Pro Val Cys Tyr Ser Leu Ala Pro Glu Arg
275 280 285
Thr Leu Asp Val Leu Glu Glu Asn Val Asp Asn Pro Asn Tyr Asp Thr
290 295 300
Leu Leu Glu Asn Val Leu Lys Cys Pro Ser His Arg Pro Lys Arg Ser
305 310 315 320
Ile Thr Asp Asp Phe Thr Leu Thr Ser Pro Tyr Leu Gly Phe Cys Pro
325 330 335
Tyr Cys Arg His Ser Thr Pro Cys Phe Ser Pro Ile Lys Ile Glu Asn
340 345 350
Val Trp Asp Glu Ser Asp Asp Gly Ser Ile Arg Ile Gln Val Ser Ala
355 360 365
Gln Phe Gly Tyr Asn Gln Ala Gly Thr Ala Asp Val Thr Lys Phe Arg
370 375 380
Tyr Met Ser Phe Asp His Asp His Asp Ile Lys Glu Asp Ser Met Glu
385 390 395 400
Lys Ile Ala Ile Ser Thr Ser Gly Pro Cys Arg Arg Leu Gly His Lys
405 410 415
Gly Tyr Phe Leu Leu Ala Gln Cys Pro Pro Gly Asp Ser Val Thr Val
420 425 430
Ser Ile Thr Ser Gly Thr Ala Glu Asn Ser Cys Thr Val Glu Arg Lys
435 440 445
Ile Arg Arg Lys Phe Val Gly Arg Glu Glu Tyr Leu Leu Pro Pro Ile
450 455 460
His Gly Lys Gln Val Lys Cys His Val Tyr Asp His Leu Lys Glu Thr
465 470 475 480
Ser Ala Gly Tyr Ile Thr Met His Arg Pro Gly Pro His Ala Tyr Lys
485 490 495
Ser Tyr Leu Glu Glu Ala Ser Gly Glu Val Tyr Ile Lys Pro Pro Ser
500 505 510
Gly Lys Asn Val Thr Tyr Glu Cys Lys Cys Gly Asp Tyr Ser Thr Gly
515 520 525
Ile Val Ser Thr Arg Thr Lys Ile Asn Gly Cys Thr Lys Ala Lys Gln
530 535 540
Cys Ile Ala Tyr Lys Ser Asp Gln Thr Lys Trp Val Phe Asn Ser Pro
545 550 555 560
Asp Leu Ile Arg His Thr Asp His Ser Val Gln Gly Lys Leu His Ile
565 570 575
Pro Phe Arg Leu Thr Pro Thr Val Cys Pro Val Pro Leu Ala His Thr
580 585 590
Pro Thr Val Met Lys Trp Phe Lys Gly Ile Thr Leu His Leu Thr Ala
595 600 605
Thr Arg Pro Thr Leu Leu Thr Thr Arg Lys Leu Gly Leu Arg Ala Asp
610 615 620
Ala Thr Ala Glu Trp Ile Thr Gly Thr Thr Ser Arg Asn Phe Ser Val
625 630 635 640
Gly Arg Glu Gly Leu Glu Tyr Val Trp Gly Asn His Glu Pro Val Arg
645 650 655
Val Trp Ala Gln Glu Ser Ala Pro Gly Asp Pro His Gly Trp Pro His
660 665 670
Glu Ile Ile Ile His Tyr Tyr His Arg His Pro Val Tyr Thr Val Ile
675 680 685
Val Leu Cys Gly Val Ala Leu Ala Ile Leu Val Gly Thr Ala Ser Ser
690 695 700
Ala Ala Cys Ile Ser Lys Ala Arg Arg Asp Cys Leu Thr Pro Tyr Ala
705 710 715 720
Leu Ala Pro Asn Ala Thr Val Pro Thr Ala Leu Val Val Leu Cys Cys
725 730 735
Ile Arg Pro Thr Asn Ala Glu Thr Leu Gly Glu Thr Leu Asn His Leu
740 745 750
Trp Phe Asn Asn Gln Pro Phe Leu Trp Ala Gln Leu Cys Ile Pro Leu
755 760 765
Ala Ala Leu Ile Ile Leu Phe Arg Cys Phe Ser Cys Cys Met Pro Phe
770 775 780
Leu Leu Val Ala Gly Val Cys Leu Gly Lys Val Asp Ala Phe Glu His
785 790 795 800
Ala Thr Thr Val Pro Asn Val Pro Gly Ile Pro Tyr Lys Ala Leu Val
805 810 815
Glu Arg Ala Gly Tyr Ala Pro Leu Asn Leu Glu Ile Thr Val Val Ser
820 825 830
Ser Glu Leu Thr Pro Ser Thr Asn Lys Glu Tyr Val Thr Cys Lys Phe
835 840 845
His Thr Val Ile Pro Ser Pro Gln Val Lys Cys Cys Gly Ser Leu Glu
850 855 860
Cys Lys Ala Ser Ser Arg Ala Asp Tyr Thr Cys Arg Val Phe Gly Gly
865 870 875 880
Val Tyr Pro Phe Met Trp Gly Gly Ala Gln Cys Phe Cys Asp Ser Glu
885 890 895
Asn Thr Gln Leu Ser Glu Ala Tyr Val Glu Phe Ala Pro Asp Cys Thr
900 905 910
Ile Asp His Ala Val Ala Leu Lys Val His Thr Ala Ala Leu Lys Val
915 920 925
Gly Leu Arg Ile Val Tyr Gly Asn Thr Thr Ala His Leu Asp Thr Phe
930 935 940
Val Asn Gly Val Thr Pro Gly Ser Ser Arg Asp Leu Lys Val Ile Ala
945 950 955 960
Gly Pro Ile Ser Ala Ala Phe Ser Pro Phe Asp His Lys Val Val Ile
965 970 975
Arg Lys Gly Phe Val Tyr Asn Tyr Asp Phe Pro Glu Tyr Gly Ala Met
980 985 990
Lys Pro Gly Ala Phe Gly Asp Ile Gln Ala Ser Ser Leu Asp Ala Thr
995 1000 1005
Asp Ile Val Ala Arg Thr Asp Ile Arg Leu Leu Lys Pro Ser Val
1010 1015 1020
Lys Asn Ile His Val Pro Tyr Thr Gln Ala Val Ser Gly Tyr Glu
1025 1030 1035
Met Trp Lys Asn Asn Ser Gly Arg Pro Leu Gln Glu Thr Ala Pro
1040 1045 1050
Phe Gly Cys Lys Ile Glu Val Glu Pro Leu Arg Ala Ser Asn Cys
1055 1060 1065
Ala Tyr Gly His Ile Pro Ile Ser Ile Asp Ile Pro Asp Ala Ala
1070 1075 1080
Phe Val Arg Ser Ser Glu Ser Pro Thr Ile Leu Glu Val Ser Cys
1085 1090 1095
Thr Val Ala Asp Cys Ile Tyr Ser Ala Asp Phe Gly Gly Ser Leu
1100 1105 1110
Thr Leu Gln Tyr Lys Ala Asp Arg Glu Gly His Cys Pro Val His
1115 1120 1125
Ser His Ser Thr Thr Ala Val Leu Lys Glu Ala Thr Thr His Val
1130 1135 1140
Thr Ala Val Gly Ser Ile Thr Leu His Phe Ser Thr Ser Ser Pro
1145 1150 1155
Gln Ala Asn Phe Ile Val Ser Leu Cys Gly Lys Lys Ser Thr Cys
1160 1165 1170
Asn Ala Glu Cys Lys Pro Pro Ala Asp His Ile Ile Gly Glu Pro
1175 1180 1185
His Lys Val Asp Gln Glu Phe Gln Ala Ala Val Ser Thr Thr Ser
1190 1195 1200
Trp Asn Trp Leu Leu Ala Leu Phe Gly Gly Ala Ser Ser Leu Ile
1205 1210 1215
Val Val Gly Leu Ile Val Leu Val Cys Ser Ser Met Leu Ile Asn
1220 1225 1230
Thr Arg Arg
1235
<210> 21
<211> 2466
<212> PRT
<213> Western equine encephalitis virus
<400> 21
Met Glu Arg Ile His Val Asp Leu Asp Ala Asp Ser Pro Tyr Val Lys
1 5 10 15
Ser Leu Gln Arg Ser Phe Pro Gln Phe Glu Ile Glu Ala Arg Gln Val
20 25 30
Thr Asp Asn Asp His Ala Asn Ala Arg Ala Phe Ser His Val Ala Thr
35 40 45
Lys Leu Ile Glu Ser Glu Val Asp Arg Asp Gln Val Ile Leu Asp Ile
50 55 60
Gly Ser Ala Pro Val Arg His Ala His Ser Asn His Arg Tyr His Cys
65 70 75 80
Ile Cys Pro Met Ile Ser Ala Glu Asp Pro Asp Arg Leu Gln Arg Tyr
85 90 95
Ala Glu Arg Leu Lys Lys Ser Asp Ile Thr Asp Lys Asn Ile Ala Ser
100 105 110
Lys Ala Ala Asp Leu Leu Glu Val Met Ser Thr Pro Asp Ala Glu Thr
115 120 125
Pro Ser Leu Cys Met His Thr Asp Ala Thr Cys Arg Tyr Phe Gly Ser
130 135 140
Val Ala Val Tyr Gln Asp Val Tyr Ala Val His Ala Pro Thr Ser Ile
145 150 155 160
Tyr His Gln Ala Leu Lys Gly Val Arg Thr Ile Tyr Trp Ile Gly Phe
165 170 175
Asp Thr Thr Pro Phe Met Tyr Lys Asn Met Ala Gly Ser Tyr Pro Thr
180 185 190
Tyr Asn Thr Asn Trp Ala Asp Glu Arg Val Leu Glu Ala Arg Asn Ile
195 200 205
Gly Leu Gly Asn Ser Asp Leu Gln Glu Ser Arg Leu Gly Asn Leu Ser
210 215 220
Ile Leu Arg Lys Lys Arg Leu Gln Pro Thr Asn Lys Ile Ile Phe Ser
225 230 235 240
Val Gly Ser Thr Ile Tyr Thr Glu Asp Arg Ser Leu Leu Arg Ser Trp
245 250 255
His Leu Pro Asn Val Phe His Leu Lys Gly Lys Ser Asn Phe Thr Gly
260 265 270
Arg Cys Gly Thr Ile Val Ser Cys Glu Gly Tyr Val Ile Lys Lys Ile
275 280 285
Thr Ile Ser Pro Gly Leu Tyr Gly Lys Val Glu Asn Leu Ala Ser Thr
290 295 300
Met His Arg Glu Gly Phe Leu Ser Cys Lys Val Thr Asp Thr Leu Arg
305 310 315 320
Gly Glu Arg Val Ser Phe Ala Val Cys Thr Tyr Val Pro Ala Thr Leu
325 330 335
Cys Asp Gln Met Thr Gly Ile Leu Ala Thr Asp Val Ser Val Asp Asp
340 345 350
Ala Gln Lys Leu Leu Val Gly Leu Asn Gln Arg Ile Val Val Asn Gly
355 360 365
Arg Thr Gln Arg Asn Thr Asn Thr Met Gln Asn Tyr Leu Leu Pro Val
370 375 380
Val Ala Gln Ala Phe Ser Arg Trp Ala Arg Glu His Arg Ala Asp Leu
385 390 395 400
Asp Asp Glu Lys Glu Leu Gly Val Arg Glu Arg Thr Leu Thr Met Gly
405 410 415
Cys Cys Trp Ala Phe Lys Thr Gln Lys Ile Thr Ser Ile Tyr Lys Lys
420 425 430
Pro Gly Thr Gln Thr Ile Lys Lys Val Pro Ala Val Phe Asp Ser Phe
435 440 445
Val Phe Pro Arg Leu Thr Ser His Gly Leu Asp Met Gly Phe Arg Arg
450 455 460
Arg Leu Lys Leu Leu Leu Glu Pro Thr Val Lys Pro Ala Pro Ala Ile
465 470 475 480
Thr Met Ala Asp Val Glu His Leu Arg Gly Leu Gln Gln Glu Ala Glu
485 490 495
Glu Val Ala Ala Ala Glu Glu Ile Arg Glu Ala Leu Pro Pro Leu Leu
500 505 510
Pro Glu Ile Glu Lys Glu Thr Val Glu Ala Glu Val Asp Leu Ile Met
515 520 525
Gln Glu Ala Gly Ala Gly Ser Val Glu Thr Pro Arg Gly His Ile Arg
530 535 540
Val Thr Ser Tyr Pro Gly Glu Glu Lys Ile Gly Ser Tyr Ala Val Leu
545 550 555 560
Ser Pro Gln Ala Val Leu Asn Ser Glu Lys Leu Ala Cys Ile His Pro
565 570 575
Leu Ala Glu Gln Val Leu Val Met Thr His Lys Gly Arg Ala Gly Arg
580 585 590
Tyr Lys Val Glu Pro Tyr His Gly Lys Val Ile Val Pro Glu Gly Thr
595 600 605
Ala Val Pro Val Gln Asp Phe Gln Ala Leu Ser Glu Ser Ala Thr Ile
610 615 620
Val Phe Asn Glu Arg Glu Phe Val Asn Arg Tyr Leu His His Ile Ala
625 630 635 640
Ile Asn Gly Gly Ala Leu Asn Thr Asp Glu Glu Tyr Tyr Lys Thr Val
645 650 655
Lys Thr Gln Asp Thr Asp Ser Glu Tyr Val Phe Asp Val Asp Ala Arg
660 665 670
Lys Cys Val Lys Arg Glu Asp Ala Gly Pro Leu Cys Leu Thr Gly Asp
675 680 685
Leu Val Asp Pro Pro Phe His Glu Phe Ala Tyr Glu Ser Leu Arg Thr
690 695 700
Arg Pro Ala Ala Pro His Lys Val Pro Thr Ile Gly Val Tyr Gly Val
705 710 715 720
Pro Gly Ser Gly Lys Ser Gly Ile Ile Lys Ser Ala Val Thr Lys Lys
725 730 735
Asp Leu Val Val Ser Ala Lys Lys Glu Asn Cys Ala Glu Ile Ile Arg
740 745 750
Asp Val Arg Arg Met Arg Cys Met Asp Val Ala Ala Arg Thr Val Asp
755 760 765
Ser Val Leu Leu Asn Gly Val Lys His Pro Val Asn Thr Leu Tyr Ile
770 775 780
Asp Glu Ala Phe Ala Cys His Ala Gly Thr Leu Leu Ala Leu Ile Ala
785 790 795 800
Ile Val Lys Pro Lys Lys Val Val Leu Cys Gly Asp Pro Lys Gln Cys
805 810 815
Gly Phe Phe Asn Met Met Cys Leu Lys Val His Phe Asn His Asp Ile
820 825 830
Cys Thr Glu Val Tyr His Lys Ser Ile Ser Arg Arg Cys Thr Gln Thr
835 840 845
Val Thr Ala Ile Val Ser Thr Leu Phe Tyr Asp Lys Arg Met Lys Thr
850 855 860
Val Asn Pro Cys Ala Asp Lys Ile Ile Ile Asp Thr Thr Gly Thr Thr
865 870 875 880
Lys Pro His Lys Asp Asp Leu Ile Leu Thr Cys Phe Arg Gly Trp Val
885 890 895
Lys Gln Leu Gln Ile Asp Tyr Lys Asn His Glu Ile Met Thr Ala Ala
900 905 910
Ala Ser Gln Gly Leu Thr Arg Lys Gly Val Tyr Ala Val Arg Tyr Lys
915 920 925
Val Asn Glu Asn Pro Leu Tyr Ser Gln Thr Ser Glu His Val Asn Val
930 935 940
Leu Leu Thr Arg Thr Glu Lys Arg Ile Val Trp Lys Thr Leu Ala Gly
945 950 955 960
Asp Pro Trp Ile Lys Ile Leu Thr Ala Lys Tyr Ser Gly Asp Phe Thr
965 970 975
Ala Ser Leu Asp Asp Trp Gln Arg Glu His Asp Ala Ile Met Ala Arg
980 985 990
Val Leu Asp Lys Pro Gln Thr Ala Asp Val Phe Gln Asn Lys Val Asn
995 1000 1005
Val Cys Trp Ala Lys Ala Leu Glu Pro Val Leu Ala Thr Ala Asn
1010 1015 1020
Ile Val Leu Thr Arg Gln Gln Trp Glu Thr Leu His Pro Phe Lys
1025 1030 1035
His Asp Arg Ala Tyr Ser Pro Glu Met Ala Leu Asn Phe Phe Cys
1040 1045 1050
Thr Arg Phe Phe Gly Val Asp Leu Asp Ser Gly Leu Phe Ser Ala
1055 1060 1065
Pro Thr Val Ala Leu Thr Tyr Arg Asp Gln His Trp Asp Asn Ser
1070 1075 1080
Pro Gly Lys Asn Met Tyr Gly Leu Asn Arg Glu Val Ala Lys Glu
1085 1090 1095
Leu Ser Arg Arg Tyr Pro Cys Ile Thr Lys Ala Val Asp Thr Gly
1100 1105 1110
Arg Val Ala Asp Ile Arg Asn Asn Thr Ile Lys Asp Tyr Ser Pro
1115 1120 1125
Thr Ile Asn Val Val Pro Leu Asn Arg Arg Leu Pro His Ser Leu
1130 1135 1140
Ile Val Asp His Lys Gly Gln Gly Thr Thr Asp His Ser Gly Phe
1145 1150 1155
Leu Ser Lys Met Lys Gly Lys Ser Val Leu Val Ile Gly Asp Pro
1160 1165 1170
Ile Ser Ile Pro Gly Lys Lys Val Glu Ser Met Gly Pro Leu Pro
1175 1180 1185
Thr Asn Thr Ile Arg Cys Asp Leu Asp Leu Gly Ile Pro Ser His
1190 1195 1200
Val Gly Lys Tyr Asp Ile Ile Phe Val Asn Val Arg Thr Pro Tyr
1205 1210 1215
Lys Asn His His Tyr Gln Gln Cys Glu Asp His Ala Ile His His
1220 1225 1230
Ser Met Leu Thr Cys Lys Ala Val His His Leu Asn Thr Gly Gly
1235 1240 1245
Thr Cys Val Ala Ile Gly Tyr Gly Leu Ala Asp Arg Ala Thr Glu
1250 1255 1260
Asn Ile Ile Thr Ala Val Ala Arg Ser Phe Arg Phe Thr Arg Val
1265 1270 1275
Cys Gln Pro Lys Asn Thr Ala Glu Asn Thr Glu Val Leu Phe Val
1280 1285 1290
Phe Phe Gly Lys Asp Asn Gly Asn His Thr His Asp Gln Asp Arg
1295 1300 1305
Leu Ala Val Val Leu Asp Asn Ile Tyr Gln Gly Ser Thr Arg Tyr
1310 1315 1320
Glu Ala Gly Arg Ala Pro Ala Tyr Arg Val Ile Arg Gly Asp Ile
1325 1330 1335
Ser Lys Ser Ala Asp Gln Ala Ile Val Asn Ala Ala Asn Ser Lys
1340 1345 1350
Gly Gln Pro Gly Ser Gly Val Cys Gly Ala Leu Tyr Arg Lys Trp
1355 1360 1365
Pro Ala Ala Phe Asp Arg Gln Pro Ile Ala Val Gly Thr Ala Arg
1370 1375 1380
Leu Val Lys His Glu Pro Leu Ile Ile His Ala Val Gly Pro Asn
1385 1390 1395
Phe Ser Lys Met Pro Glu Pro Glu Gly Asp Leu Lys Leu Ala Ala
1400 1405 1410
Ala Tyr Met Ser Ile Ala Ser Ile Val Asn Ala Glu Arg Ile Thr
1415 1420 1425
Lys Ile Ser Val Pro Leu Leu Ser Thr Gly Ile Tyr Ser Gly Gly
1430 1435 1440
Lys Asp Arg Val Met Gln Ser Leu His His Leu Phe Thr Ala Phe
1445 1450 1455
Asp Thr Thr Asp Ala Asp Val Thr Ile Tyr Cys Leu Asp Lys Gln
1460 1465 1470
Trp Glu Thr Arg Ile Ile Glu Ala Ile His Arg Lys Glu Ser Val
1475 1480 1485
Glu Ile Leu Asp Asp Asp Lys Pro Val Asp Ile Asp Leu Val Arg
1490 1495 1500
Val His Pro Asn Ser Ala Leu Ala Gly Arg Pro Gly Tyr Ser Val
1505 1510 1515
Asn Glu Gly Lys Leu Tyr Ser Tyr Leu Glu Gly Thr Arg Phe His
1520 1525 1530
Gln Thr Ala Lys Asp Ile Ala Glu Ile His Ala Met Trp Pro Asn
1535 1540 1545
Lys Ser Glu Ala Asn Glu Gln Ile Cys Leu Tyr Ile Leu Gly Glu
1550 1555 1560
Ser Met Ser Ser Ile Arg Ser Lys Cys Pro Val Glu Glu Ser Glu
1565 1570 1575
Ala Ser Ala Pro Pro His Thr Leu Pro Cys Leu Cys Asn Tyr Ala
1580 1585 1590
Met Thr Ala Glu Arg Val Tyr Arg Leu Arg Ser Ala Lys Lys Glu
1595 1600 1605
Gln Phe Ala Val Cys Ser Ser Phe Leu Leu Pro Lys Tyr Arg Ile
1610 1615 1620
Thr Gly Val Gln Lys Leu Gln Cys Ser Lys Pro Val Leu Phe Ser
1625 1630 1635
Gly Val Val Pro Pro Ala Val His Pro Arg Lys Tyr Ala Glu Ile
1640 1645 1650
Ile Leu Glu Thr Pro Pro Pro Pro Val Thr Thr Thr Val Ile Cys
1655 1660 1665
Glu Pro Thr Val Pro Glu Arg Ile Pro Ser Pro Ala Ile Ser Arg
1670 1675 1680
Ala Pro Ser Ala Glu Ser Leu Leu Ser Phe Ser Gly Val Ser Phe
1685 1690 1695
Ser Ser Ser Ala Thr Arg Ser Ser Thr Ala Trp Ser Asp Tyr Asp
1700 1705 1710
Arg Arg Phe Val Val Thr Ala Asp Val His Gln Ala Asn Ile Ser
1715 1720 1725
Thr Trp Ser Ile Pro Ser Ala Pro Gly Leu Asp Val Gln Ile Pro
1730 1735 1740
Ser Asp Val Ser Asp Ser His Trp Ser Val Pro Ser Ala Ser Gly
1745 1750 1755
Phe Glu Val Arg Thr Pro Ser Val Gln Asp Leu Thr Ala Glu Cys
1760 1765 1770
Ala Lys Pro Arg Gly Leu Ala Glu Ile Met Gln Asp Phe Asn Thr
1775 1780 1785
Ala Pro Phe Gln Phe Leu Ser Asp His Arg Pro Val Pro Ala Pro
1790 1795 1800
Arg Arg Arg Pro Ile Pro Ser Pro Arg Ser Thr Val Ser Ala Pro
1805 1810 1815
Pro Val Pro Lys Pro Arg Arg Thr Lys Tyr Gln Gln Pro Pro Gly
1820 1825 1830
Val Ala Arg Ala Ile Ser Glu Ala Glu Leu Asp Glu Tyr Ile Arg
1835 1840 1845
Gln His Ser Asn Arg Tyr Glu Ala Gly Ala Tyr Ile Phe Ser Ser
1850 1855 1860
Glu Thr Gly Gln Gly His Leu Gln Gln Lys Ser Val Arg Gln Cys
1865 1870 1875
Lys Leu Gln Glu Pro Ile Leu Asp Arg Ala Val His Glu Lys Tyr
1880 1885 1890
Tyr Ala Pro Arg Leu Asp Leu Glu Arg Glu Lys Met Leu Gln Lys
1895 1900 1905
Lys Leu Gln Leu Cys Ala Ser Glu Gly Asn Arg Ser Arg Tyr Gln
1910 1915 1920
Ser Arg Lys Val Glu Asn Met Lys Ala Ile Thr Ala Glu Arg Leu
1925 1930 1935
Ile Ser Gly Leu Gly Thr Tyr Leu Ser Ser Glu Val Asn Pro Val
1940 1945 1950
Glu Cys Tyr Arg Val Asn Tyr Pro Val Pro Ile Tyr Ser Ser Thr
1955 1960 1965
Val Ile Asn Arg Phe Thr Ser Ala Glu Val Ala Val Lys Thr Cys
1970 1975 1980
Asn Leu Val Ile Gln Glu Asn Tyr Pro Thr Val Ala Ser Tyr Cys
1985 1990 1995
Ile Thr Asp Glu Tyr Asp Ala Tyr Leu Asp Met Val Asp Gly Ala
2000 2005 2010
Ser Cys Cys Leu Asp Thr Ala Thr Phe Cys Pro Ala Lys Leu Arg
2015 2020 2025
Ser Tyr Pro Lys Lys His Ser Tyr Leu Gln Pro Glu Ile Arg Ser
2030 2035 2040
Ala Val Pro Ser Pro Ile Gln Asn Thr Leu Gln Asn Val Leu Ala
2045 2050 2055
Ala Ala Thr Lys Arg Asn Cys Asn Val Thr Gln Met Arg Glu Leu
2060 2065 2070
Pro Val Leu Asp Ser Ala Ala Phe Asn Val Asp Cys Phe Lys Lys
2075 2080 2085
Tyr Ala Cys Asn Asp Glu Tyr Trp Asp Thr Phe Arg Asp Asn Pro
2090 2095 2100
Ile Arg Leu Thr Thr Glu Asn Val Thr Gln Tyr Val Thr Lys Leu
2105 2110 2115
Lys Gly Pro Lys Ala Ala Ala Leu Phe Ala Lys Thr His Asn Leu
2120 2125 2130
Lys Pro Leu Gln Glu Ile Pro Met Asp Gln Phe Val Met Asp Leu
2135 2140 2145
Lys Arg Asp Val Lys Val Thr Pro Gly Thr Lys His Thr Glu Glu
2150 2155 2160
Arg Pro Lys Val Gln Val Ile Gln Ala Ala Asp Pro Leu Ala Thr
2165 2170 2175
Ala Tyr Leu Cys Gly Ile His Arg Glu Leu Val Arg Arg Leu Asn
2180 2185 2190
Ala Val Leu Leu Pro Asn Ile His Thr Leu Phe Asp Met Ser Ala
2195 2200 2205
Glu Asp Phe Asp Ala Ile Ile Ala Gly His Phe His His Gly Asp
2210 2215 2220
Pro Val Leu Glu Thr Asp Ile Ala Ser Phe Asp Lys Ser Glu Asp
2225 2230 2235
Asp Ala Ile Ala Ile Ser Ala Met Met Ile Leu Glu Asp Leu Gly
2240 2245 2250
Val Asp Gln Pro Leu Leu Asp Leu Ile Glu Ala Ala Phe Gly Asn
2255 2260 2265
Ile Thr Ser Val His Leu Pro Thr Gly Thr Arg Phe Lys Phe Gly
2270 2275 2280
Ala Met Met Lys Ser Gly Met Phe Leu Thr Leu Phe Val Asn Thr
2285 2290 2295
Leu Val Asn Ile Met Ile Ala Ser Arg Val Leu Arg Glu Arg Leu
2300 2305 2310
Thr Thr Ser Ala Cys Ala Ala Phe Ile Gly Asp Asp Asn Ile Val
2315 2320 2325
His Gly Val Val Ser Asp Thr Leu Met Ala Glu Arg Cys Ala Thr
2330 2335 2340
Trp Leu Asn Met Glu Val Lys Ile Ile Asp Ala Val Ile Gly Ile
2345 2350 2355
Lys Ala Pro Tyr Phe Cys Gly Gly Phe Ile Leu Val Asp Gln Ile
2360 2365 2370
Thr Gly Thr Ala Cys Arg Val Ala Asp Pro Leu Lys Arg Leu Phe
2375 2380 2385
Lys Leu Gly Lys Pro Leu Ser Val Glu Asp Thr Gln Asp Cys Asp
2390 2395 2400
Arg Arg Arg Ala Leu His Asp Glu Ala Met Arg Trp Asn Arg Ile
2405 2410 2415
Gly Ile Thr Asp Glu Leu Val Lys Ala Val Glu Ser Arg Tyr Glu
2420 2425 2430
Ile Ile Leu Ala Gly Leu Ile Ile Thr Ser Leu Ser Thr Leu Ala
2435 2440 2445
Glu Ser Val Lys Asn Phe Lys Ser Ile Arg Gly Ser Pro Ile Thr
2450 2455 2460
Leu Tyr Gly
2465
<210> 22
<211> 132
<212> PRT
<213> Mycobacterium tuberculosis
<400> 22
Thr Ala Ala Ser Asp Asn Phe Gln Leu Ser Gln Gly Gly Gln Gly Phe
1 5 10 15
Ala Ile Pro Ile Gly Gln Ala Met Ala Ile Ala Gly Gln Ile Arg Ser
20 25 30
Gly Gly Gly Ser Pro Thr Val His Ile Gly Pro Thr Ala Phe Leu Gly
35 40 45
Leu Gly Val Val Asp Asn Asn Gly Asn Gly Ala Arg Val Gln Arg Val
50 55 60
Val Gly Ser Ala Pro Ala Ala Ser Leu Gly Ile Ser Thr Gly Asp Val
65 70 75 80
Ile Thr Ala Val Asp Gly Ala Pro Ile Asn Ser Ala Thr Ala Met Ala
85 90 95
Asp Ala Leu Asn Gly His His Pro Gly Asp Val Ile Ser Val Thr Trp
100 105 110
Gln Thr Lys Ser Gly Gly Thr Arg Thr Gly Asn Val Thr Leu Ala Glu
115 120 125
Gly Pro Pro Ala
130
<210> 23
<211> 230
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 23
Met His His His His His His Thr Ala Ala Ser Asp Asn Phe Gln Leu
1 5 10 15
Ser Gln Gly Gly Gln Gly Phe Ala Ile Pro Ile Gly Gln Ala Met Ala
20 25 30
Ile Ala Gly Gln Ile Arg Ser Gly Gly Gly Ser Pro Thr Val His Ile
35 40 45
Gly Pro Thr Ala Phe Leu Gly Leu Gly Val Val Asp Asn Asn Gly Asn
50 55 60
Gly Ala Arg Val Gln Arg Val Val Gly Ser Ala Pro Ala Ala Ser Leu
65 70 75 80
Gly Ile Ser Thr Gly Asp Val Ile Thr Ala Val Asp Gly Ala Pro Ile
85 90 95
Asn Ser Ala Thr Ala Met Ala Asp Ala Leu Asn Gly His His Pro Gly
100 105 110
Asp Val Ile Ser Val Thr Trp Gln Thr Lys Ser Gly Gly Thr Arg Thr
115 120 125
Gly Asn Val Thr Leu Ala Glu Gly Pro Pro Ala Glu Phe Asp Asp Asp
130 135 140
Asp Lys Asp Pro Pro Asp Pro His Gln Pro Asp Met Thr Lys Gly Tyr
145 150 155 160
Cys Pro Gly Gly Arg Trp Gly Phe Gly Asp Leu Ala Val Cys Asp Gly
165 170 175
Glu Lys Tyr Pro Asp Gly Ser Phe Trp His Gln Trp Met Gln Thr Trp
180 185 190
Phe Thr Gly Pro Gln Phe Tyr Phe Asp Cys Val Ser Gly Gly Glu Pro
195 200 205
Leu Pro Gly Pro Pro Pro Pro Gly Gly Cys Gly Gly Ala Ile Pro Ser
210 215 220
Glu Gln Pro Asn Ala Pro
225 230
<210> 24
<211> 578
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 24
Met His His His His His His Thr Ala Ala Ser Asp Asn Phe Gln Leu
1 5 10 15
Ser Gln Gly Gly Gln Gly Phe Ala Ile Pro Ile Gly Gln Ala Met Ala
20 25 30
Ile Ala Gly Gln Ile Arg Ser Gly Gly Gly Ser Pro Thr Val His Ile
35 40 45
Gly Pro Thr Ala Phe Leu Gly Leu Gly Val Val Asp Asn Asn Gly Asn
50 55 60
Gly Ala Arg Val Gln Arg Val Val Gly Ser Ala Pro Ala Ala Ser Leu
65 70 75 80
Gly Ile Ser Thr Gly Asp Val Ile Thr Ala Val Asp Gly Ala Pro Ile
85 90 95
Asn Ser Ala Thr Ala Met Ala Asp Ala Leu Asn Gly His His Pro Gly
100 105 110
Asp Val Ile Ser Val Thr Trp Gln Thr Lys Ser Gly Gly Thr Arg Thr
115 120 125
Gly Asn Val Thr Leu Ala Glu Gly Pro Pro Ala Glu Phe Pro Leu Val
130 135 140
Pro Arg Gly Ser Pro Met Gly Ser Asp Val Arg Asp Leu Asn Ala Leu
145 150 155 160
Leu Pro Ala Val Pro Ser Leu Gly Gly Gly Gly Gly Cys Ala Leu Pro
165 170 175
Val Ser Gly Ala Ala Gln Trp Ala Pro Val Leu Asp Phe Ala Pro Pro
180 185 190
Gly Ala Ser Ala Tyr Gly Ser Leu Gly Gly Pro Ala Pro Pro Pro Ala
195 200 205
Pro Pro Pro Pro Pro Pro Pro Pro Pro His Ser Phe Ile Lys Gln Glu
210 215 220
Pro Ser Trp Gly Gly Ala Glu Pro His Glu Glu Gln Cys Leu Ser Ala
225 230 235 240
Phe Thr Val His Phe Ser Gly Gln Phe Thr Gly Thr Ala Gly Ala Cys
245 250 255
Arg Tyr Gly Pro Phe Gly Pro Pro Pro Pro Ser Gln Ala Ser Ser Gly
260 265 270
Gln Ala Arg Met Phe Pro Asn Ala Pro Tyr Leu Pro Ser Cys Leu Glu
275 280 285
Ser Gln Pro Ala Ile Arg Asn Gln Gly Tyr Ser Thr Val Thr Phe Asp
290 295 300
Gly Thr Pro Ser Tyr Gly His Thr Pro Ser His His Ala Ala Gln Phe
305 310 315 320
Pro Asn His Ser Phe Lys His Glu Asp Pro Met Gly Gln Gln Gly Ser
325 330 335
Leu Gly Glu Gln Gln Tyr Ser Val Pro Pro Pro Val Tyr Gly Cys His
340 345 350
Thr Pro Thr Asp Ser Cys Thr Gly Ser Gln Ala Leu Leu Leu Arg Thr
355 360 365
Pro Tyr Ser Ser Asp Asn Leu Tyr Gln Met Thr Ser Gln Leu Glu Cys
370 375 380
Met Thr Trp Asn Gln Met Asn Leu Gly Ala Thr Leu Lys Gly His Ser
385 390 395 400
Thr Gly Tyr Glu Ser Asp Asn His Thr Thr Pro Ile Leu Cys Gly Ala
405 410 415
Gln Tyr Arg Ile His Thr His Gly Val Phe Arg Gly Ile Gln Asp Val
420 425 430
Arg Arg Val Pro Gly Val Ala Pro Thr Leu Val Arg Ser Ala Ser Glu
435 440 445
Thr Ser Glu Lys Arg Pro Phe Met Cys Ala Tyr Ser Gly Cys Asn Lys
450 455 460
Arg Tyr Phe Lys Leu Ser His Leu Gln Met His Ser Arg Lys His Thr
465 470 475 480
Gly Glu Lys Pro Tyr Gln Cys Asp Phe Lys Asp Cys Glu Arg Arg Phe
485 490 495
Phe Arg Ser Asp Gln Leu Lys Arg His Gln Arg Arg His Thr Gly Val
500 505 510
Lys Pro Phe Gln Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp
515 520 525
His Leu Lys Thr His Thr Arg Thr His Thr Gly Glu Lys Pro Phe Ser
530 535 540
Cys Arg Trp Pro Ser Cys Gln Lys Lys Phe Ala Arg Ser Asp Glu Leu
545 550 555 560
Val Arg His His Asn Met His Gln Arg Asn Met Thr Lys Leu Gln Leu
565 570 575
Ala Leu
<210> 25
<211> 220
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 25
Met His His His His His His Thr Ala Ala Ser Asp Asn Phe Gln Leu
1 5 10 15
Ser Gln Gly Gly Gln Gly Phe Ala Ile Pro Ile Gly Gln Ala Met Ala
20 25 30
Ile Ala Gly Gln Ile Arg Ser Gly Gly Gly Ser Pro Thr Val His Ile
35 40 45
Gly Pro Thr Ala Phe Leu Gly Leu Gly Val Val Asp Asn Asn Gly Asn
50 55 60
Gly Ala Arg Val Gln Arg Val Val Gly Ser Ala Pro Ala Ala Ser Leu
65 70 75 80
Gly Ile Ser Thr Gly Asp Val Ile Thr Ala Val Asp Gly Ala Pro Ile
85 90 95
Asn Ser Ala Thr Ala Met Ala Asp Ala Leu Asn Gly His His Pro Gly
100 105 110
Asp Val Ile Ser Val Thr Trp Gln Thr Lys Ser Gly Gly Thr Arg Thr
115 120 125
Gly Asn Val Thr Leu Ala Glu Gly Pro Pro Ala Glu Phe Ile Glu Gly
130 135 140
Arg Gly Ser Gly Cys Pro Leu Leu Glu Asn Val Ile Ser Lys Thr Ile
145 150 155 160
Asn Pro Gln Val Ser Lys Thr Glu Tyr Lys Glu Leu Leu Gln Glu Phe
165 170 175
Ile Asp Asp Asn Ala Thr Thr Asn Ala Ile Asp Glu Leu Lys Glu Cys
180 185 190
Phe Leu Asn Gln Thr Asp Glu Thr Leu Ser Asn Val Glu Val Phe Met
195 200 205
Gln Leu Ile Tyr Asp Ser Ser Leu Cys Asp Leu Phe
210 215 220
<210> 26
<211> 729
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 26
Met His His His His His His Thr Ala Ala Ser Asp Asn Phe Gln Leu
1 5 10 15
Ser Gln Gly Gly Gln Gly Phe Ala Ile Pro Ile Gly Gln Ala Met Ala
20 25 30
Ile Ala Gly Gln Ile Arg Ser Gly Gly Gly Ser Pro Thr Val His Ile
35 40 45
Gly Pro Thr Ala Phe Leu Gly Leu Gly Val Val Asp Asn Asn Gly Asn
50 55 60
Gly Ala Arg Val Gln Arg Val Val Gly Ser Ala Pro Ala Ala Ser Leu
65 70 75 80
Gly Ile Ser Thr Gly Asp Val Ile Thr Ala Val Asp Gly Ala Pro Ile
85 90 95
Asn Ser Ala Thr Ala Met Ala Asp Ala Leu Asn Gly His His Pro Gly
100 105 110
Asp Val Ile Ser Val Thr Trp Gln Thr Lys Ser Gly Gly Thr Arg Thr
115 120 125
Gly Asn Val Thr Leu Ala Glu Gly Pro Pro Ala Glu Phe Met Val Asp
130 135 140
Phe Gly Ala Leu Pro Pro Glu Ile Asn Ser Ala Arg Met Tyr Ala Gly
145 150 155 160
Pro Gly Ser Ala Ser Leu Val Ala Ala Ala Gln Met Trp Asp Ser Val
165 170 175
Ala Ser Asp Leu Phe Ser Ala Ala Ser Ala Phe Gln Ser Val Val Trp
180 185 190
Gly Leu Thr Val Gly Ser Trp Ile Gly Ser Ser Ala Gly Leu Met Val
195 200 205
Ala Ala Ala Ser Pro Tyr Val Ala Trp Met Ser Val Thr Ala Gly Gln
210 215 220
Ala Glu Leu Thr Ala Ala Gln Val Arg Val Ala Ala Ala Ala Tyr Glu
225 230 235 240
Thr Ala Tyr Gly Leu Thr Val Pro Pro Pro Val Ile Ala Glu Asn Arg
245 250 255
Ala Glu Leu Met Ile Leu Ile Ala Thr Asn Leu Leu Gly Gln Asn Thr
260 265 270
Pro Ala Ile Ala Val Asn Glu Ala Glu Tyr Gly Glu Met Trp Ala Gln
275 280 285
Asp Ala Ala Ala Met Phe Gly Tyr Ala Ala Ala Thr Ala Thr Ala Thr
290 295 300
Ala Thr Leu Leu Pro Phe Glu Glu Ala Pro Glu Met Thr Ser Ala Gly
305 310 315 320
Gly Leu Leu Glu Gln Ala Ala Ala Val Glu Glu Ala Ser Asp Thr Ala
325 330 335
Ala Ala Asn Gln Leu Met Asn Asn Val Pro Gln Ala Leu Gln Gln Leu
340 345 350
Ala Gln Pro Thr Gln Gly Thr Thr Pro Ser Ser Lys Leu Gly Gly Leu
355 360 365
Trp Lys Thr Val Ser Pro His Arg Ser Pro Ile Ser Asn Met Val Ser
370 375 380
Met Ala Asn Asn His Met Ser Met Thr Asn Ser Gly Val Ser Met Thr
385 390 395 400
Asn Thr Leu Ser Ser Met Leu Lys Gly Phe Ala Pro Ala Ala Ala Ala
405 410 415
Gln Ala Val Gln Thr Ala Ala Gln Asn Gly Val Arg Ala Met Ser Ser
420 425 430
Leu Gly Ser Ser Leu Gly Ser Ser Gly Leu Gly Gly Gly Val Ala Ala
435 440 445
Asn Leu Gly Arg Ala Ala Ser Val Gly Ser Leu Ser Val Pro Gln Ala
450 455 460
Trp Ala Ala Ala Asn Gln Ala Val Thr Pro Ala Ala Arg Ala Leu Pro
465 470 475 480
Leu Thr Ser Leu Thr Ser Ala Ala Glu Arg Gly Pro Gly Gln Met Leu
485 490 495
Gly Gly Leu Pro Val Gly Gln Met Gly Ala Arg Ala Gly Gly Gly Leu
500 505 510
Ser Gly Val Leu Arg Val Pro Pro Arg Pro Tyr Val Met Pro His Ser
515 520 525
Pro Ala Ala Gly Asp Ile Ala Pro Pro Ala Leu Ser Gln Asp Arg Phe
530 535 540
Ala Asp Phe Pro Ala Leu Pro Leu Asp Pro Ser Ala Met Val Ala Gln
545 550 555 560
Val Gly Pro Gln Val Val Asn Ile Asn Thr Lys Leu Gly Tyr Asn Asn
565 570 575
Ala Val Gly Ala Gly Thr Gly Ile Val Ile Asp Pro Asn Gly Val Val
580 585 590
Leu Thr Asn Asn His Val Ile Ala Gly Ala Thr Asp Ile Asn Ala Phe
595 600 605
Ser Val Gly Ser Gly Gln Thr Tyr Gly Val Asp Val Val Gly Tyr Asp
610 615 620
Arg Thr Gln Asp Val Ala Val Leu Gln Leu Arg Gly Ala Gly Gly Leu
625 630 635 640
Pro Ser Ala Ala Ile Gly Gly Gly Val Ala Val Gly Glu Pro Val Val
645 650 655
Ala Met Gly Asn Ser Gly Gly Gln Gly Gly Thr Pro Arg Ala Val Pro
660 665 670
Gly Arg Val Val Ala Leu Gly Gln Thr Val Gln Ala Ser Asp Ser Leu
675 680 685
Thr Gly Ala Glu Glu Thr Leu Asn Gly Leu Ile Gln Phe Asp Ala Ala
690 695 700
Ile Gln Pro Gly Asp Ser Gly Gly Pro Val Val Asn Gly Leu Gly Gln
705 710 715 720
Val Val Gly Met Asn Thr Ala Ala Ser
725
<210> 27
<211> 30
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 27
Thr Ala Ala Ser Asp Asn Phe Gln Leu Ser Gln Gly Gly Gln Gly Phe
1 5 10 15
Ala Ile Pro Ile Gly Gln Ala Met Ala Ile Ala Gly Gln Ile
20 25 30
<210> 28
<211> 128
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 28
Thr Ala Ala Ser Asp Asn Phe Gln Leu Ser Gln Gly Gly Gln Gly Phe
1 5 10 15
Ala Ile Pro Ile Gly Gln Ala Met Ala Ile Ala Gly Gln Ile Lys Leu
20 25 30
Pro Thr Val His Ile Gly Pro Thr Ala Phe Leu Gly Leu Gly Val Val
35 40 45
Asp Asn Asn Gly Asn Gly Ala Arg Val Gln Arg Val Val Gly Ser Ala
50 55 60
Pro Ala Ala Ser Leu Gly Ile Ser Thr Gly Asp Val Ile Thr Ala Val
65 70 75 80
Asp Gly Ala Pro Ile Asn Ser Ala Thr Ala Met Ala Asp Ala Leu Asn
85 90 95
Gly His His Pro Gly Asp Val Ile Ser Val Thr Trp Gln Thr Lys Ser
100 105 110
Gly Gly Thr Arg Thr Gly Asn Val Thr Leu Ala Glu Gly Pro Pro Ala
115 120 125
<210> 29
<211> 128
<212> PRT
<213> Mycobacterium tuberculosis
<400> 29
Thr Ala Ala Ser Asp Asn Phe Gln Leu Ser Gln Gly Gly Gln Gly Phe
1 5 10 15
Ala Ile Pro Ile Gly Gln Ala Met Ala Ile Ala Gly Gln Ile Arg Ser
20 25 30
Gly Gly Gly Ser Pro Thr Val His Ile Gly Pro Thr Ala Phe Leu Gly
35 40 45
Leu Gly Val Val Asp Asn Asn Gly Asn Gly Ala Arg Val Gln Arg Val
50 55 60
Val Gly Ser Ala Pro Ala Ala Ser Leu Gly Ile Ser Thr Gly Asp Val
65 70 75 80
Ile Thr Ala Val Asp Gly Ala Pro Ile Asn Ser Ala Thr Ala Met Ala
85 90 95
Asp Ala Leu Asn Gly His His Pro Gly Asp Val Ile Ser Val Thr Trp
100 105 110
Gln Thr Lys Ser Gly Gly Thr Arg Thr Gly Asn Val Thr Leu Ala Glu
115 120 125
<210> 30
<211> 355
<212> PRT
<213> Mycobacterium tuberculosis
<400> 30
Met Ser Asn Ser Arg Arg Arg Ser Leu Arg Trp Ser Trp Leu Leu Ser
1 5 10 15
Val Leu Ala Ala Val Gly Leu Gly Leu Ala Thr Ala Pro Ala Gln Ala
20 25 30
Ala Pro Pro Ala Leu Ser Gln Asp Arg Phe Ala Asp Phe Pro Ala Leu
35 40 45
Pro Leu Asp Pro Ser Ala Met Val Ala Gln Val Gly Pro Gln Val Val
50 55 60
Asn Ile Asn Thr Lys Leu Gly Tyr Asn Asn Ala Val Gly Ala Gly Thr
65 70 75 80
Gly Ile Val Ile Asp Pro Asn Gly Val Val Leu Thr Asn Asn His Val
85 90 95
Ile Ala Gly Ala Thr Asp Ile Asn Ala Phe Ser Val Gly Ser Gly Gln
100 105 110
Thr Tyr Gly Val Asp Val Val Gly Tyr Asp Arg Thr Gln Asp Val Ala
115 120 125
Val Leu Gln Leu Arg Gly Ala Gly Gly Leu Pro Ser Ala Ala Ile Gly
130 135 140
Gly Gly Val Ala Val Gly Glu Pro Val Val Ala Met Gly Asn Ser Gly
145 150 155 160
Gly Gln Gly Gly Thr Pro Arg Ala Val Pro Gly Arg Val Val Ala Leu
165 170 175
Gly Gln Thr Val Gln Ala Ser Asp Ser Leu Thr Gly Ala Glu Glu Thr
180 185 190
Leu Asn Gly Leu Ile Gln Phe Asp Ala Ala Ile Gln Pro Gly Asp Ser
195 200 205
Gly Gly Pro Val Val Asn Gly Leu Gly Gln Val Val Gly Met Asn Thr
210 215 220
Ala Ala Ser Asp Asn Phe Gln Leu Ser Gln Gly Gly Gln Gly Phe Ala
225 230 235 240
Ile Pro Ile Gly Gln Ala Met Ala Ile Ala Gly Gln Ile Arg Ser Gly
245 250 255
Gly Gly Ser Pro Thr Val His Ile Gly Pro Thr Ala Phe Leu Gly Leu
260 265 270
Gly Val Val Asp Asn Asn Gly Asn Gly Ala Arg Val Gln Arg Val Val
275 280 285
Gly Ser Ala Pro Ala Ala Ser Leu Gly Ile Ser Thr Gly Asp Val Ile
290 295 300
Thr Ala Val Asp Gly Ala Pro Ile Asn Ser Ala Thr Ala Met Ala Asp
305 310 315 320
Ala Leu Asn Gly His His Pro Gly Asp Val Ile Ser Val Thr Trp Gln
325 330 335
Thr Lys Ser Gly Gly Thr Arg Thr Gly Asn Val Thr Leu Ala Glu Gly
340 345 350
Pro Pro Ala
355
<210> 31
<211> 364
<212> PRT
<213> Haemophilus influenzae
<400> 31
Met Lys Leu Lys Thr Leu Ala Leu Ser Leu Leu Ala Ala Gly Val Leu
1 5 10 15
Ala Gly Cys Ser Ser His Ser Ser Asn Met Ala Asn Thr Gln Met Lys
20 25 30
Ser Asp Lys Ile Ile Ile Ala His Arg Gly Ala Ser Gly Tyr Leu Pro
35 40 45
Glu His Thr Leu Glu Ser Lys Ala Leu Ala Phe Ala Gln Gln Ala Asp
50 55 60
Tyr Leu Glu Gln Asp Leu Ala Met Thr Lys Asp Gly Arg Leu Val Val
65 70 75 80
Ile His Asp His Phe Leu Asp Gly Leu Thr Asp Val Ala Lys Lys Phe
85 90 95
Pro His Arg His Arg Lys Asp Gly Arg Tyr Tyr Val Ile Asp Phe Thr
100 105 110
Leu Lys Glu Ile Gln Ser Leu Glu Met Thr Glu Asn Phe Glu Thr Lys
115 120 125
Asp Gly Lys Gln Ala Gln Val Tyr Pro Asn Arg Phe Pro Leu Trp Lys
130 135 140
Ser His Phe Arg Ile His Thr Phe Glu Asp Glu Ile Glu Phe Ile Gln
145 150 155 160
Gly Leu Glu Lys Ser Thr Gly Lys Lys Val Gly Ile Tyr Pro Glu Ile
165 170 175
Lys Ala Pro Trp Phe His His Gln Asn Gly Lys Asp Ile Ala Ala Glu
180 185 190
Thr Leu Lys Val Leu Lys Lys Tyr Gly Tyr Asp Lys Lys Thr Asp Met
195 200 205
Val Tyr Leu Gln Thr Phe Asp Phe Asn Glu Leu Lys Arg Ile Lys Thr
210 215 220
Glu Leu Leu Pro Gln Met Gly Met Asp Leu Lys Leu Val Gln Leu Ile
225 230 235 240
Ala Tyr Thr Asp Trp Lys Glu Thr Gln Glu Lys Asp Pro Lys Gly Tyr
245 250 255
Trp Val Asn Tyr Asn Tyr Asp Trp Met Phe Lys Pro Gly Ala Met Ala
260 265 270
Glu Val Val Lys Tyr Ala Asp Gly Val Gly Pro Gly Trp Tyr Met Leu
275 280 285
Val Asn Lys Glu Glu Ser Lys Pro Asp Asn Ile Val Tyr Thr Pro Leu
290 295 300
Val Lys Glu Leu Ala Gln Tyr Asn Val Glu Val His Pro Tyr Thr Val
305 310 315 320
Arg Lys Asp Ala Leu Pro Ala Phe Phe Thr Asp Val Asn Gln Met Tyr
325 330 335
Asp Val Leu Leu Asn Lys Ser Gly Ala Thr Gly Val Phe Thr Asp Phe
340 345 350
Pro Asp Thr Gly Val Glu Phe Leu Lys Gly Ile Lys
355 360
<210> 32
<211> 313
<212> PRT
<213> Streptococcus pneumonae
<400> 32
Met Glu Ile Asn Val Ser Lys Leu Arg Thr Asp Leu Pro Gln Val Gly
1 5 10 15
Val Gln Pro Tyr Arg Gln Val His Ala His Ser Thr Gly Asn Pro His
20 25 30
Ser Thr Val Gln Asn Glu Ala Asp Tyr His Trp Arg Lys Asp Pro Glu
35 40 45
Leu Gly Phe Phe Ser His Ile Val Gly Asn Gly Cys Ile Met Gln Val
50 55 60
Gly Pro Val Asp Asn Gly Ala Trp Asp Val Gly Gly Gly Trp Asn Ala
65 70 75 80
Glu Thr Tyr Ala Ala Val Glu Leu Ile Glu Ser His Ser Thr Lys Glu
85 90 95
Glu Phe Met Thr Asp Tyr Arg Leu Tyr Ile Glu Leu Leu Arg Asn Leu
100 105 110
Ala Asp Glu Ala Gly Leu Pro Lys Thr Leu Asp Thr Gly Ser Leu Ala
115 120 125
Gly Ile Lys Thr His Glu Tyr Cys Thr Asn Asn Gln Pro Asn Asn His
130 135 140
Ser Asp His Val Asp Pro Tyr Pro Tyr Leu Ala Lys Trp Gly Ile Ser
145 150 155 160
Arg Glu Gln Phe Lys His Asp Ile Glu Asn Gly Leu Thr Ile Glu Thr
165 170 175
Gly Trp Gln Lys Asn Asp Thr Gly Tyr Trp Tyr Val His Ser Asp Gly
180 185 190
Ser Tyr Pro Lys Asp Lys Phe Glu Lys Ile Asn Gly Thr Trp Tyr Tyr
195 200 205
Phe Asp Ser Ser Gly Tyr Met Leu Ala Asp Arg Trp Arg Lys His Thr
210 215 220
Asp Gly Asn Trp Tyr Trp Phe Asp Asn Ser Gly Glu Met Ala Thr Gly
225 230 235 240
Trp Lys Lys Ile Ala Asp Lys Trp Tyr Tyr Phe Asn Glu Glu Gly Ala
245 250 255
Met Lys Thr Gly Trp Val Lys Tyr Lys Asp Thr Trp Tyr Tyr Leu Asp
260 265 270
Ala Lys Glu Gly Ala Met Val Ser Asn Ala Phe Ile Gln Ser Ala Asp
275 280 285
Gly Thr Gly Trp Tyr Tyr Leu Lys Pro Asp Gly Thr Leu Ala Asp Arg
290 295 300
Pro Glu Phe Arg Met Ser Gln Met Ala
305 310
<210> 33
<211> 166
<212> PRT
<213> Homo sapiens
<400> 33
Met Lys Tyr Thr Ser Tyr Ile Leu Ala Phe Gln Leu Cys Ile Val Leu
1 5 10 15
Gly Ser Leu Gly Cys Tyr Cys Gln Asp Pro Tyr Val Lys Glu Ala Glu
20 25 30
Asn Leu Lys Lys Tyr Phe Asn Ala Gly His Ser Asp Val Ala Asp Asn
35 40 45
Gly Thr Leu Phe Leu Gly Ile Leu Lys Asn Trp Lys Glu Glu Ser Asp
50 55 60
Arg Lys Ile Met Gln Ser Gln Ile Val Ser Phe Tyr Phe Lys Leu Phe
65 70 75 80
Lys Asn Phe Lys Asp Asp Gln Ser Ile Gln Lys Ser Val Glu Thr Ile
85 90 95
Lys Glu Asp Met Asn Val Lys Phe Phe Asn Ser Asn Lys Lys Lys Arg
100 105 110
Asp Asp Phe Glu Lys Leu Thr Asn Tyr Ser Val Thr Asp Leu Asn Val
115 120 125
Gln Arg Lys Ala Ile His Glu Leu Ile Gln Val Met Ala Glu Leu Ser
130 135 140
Pro Ala Ala Lys Thr Gly Lys Arg Lys Arg Ser Gln Met Leu Phe Arg
145 150 155 160
Gly Arg Arg Ala Ser Gln
165
<210> 34
<211> 233
<212> PRT
<213> Homo sapiens
<400> 34
Met Ser Thr Glu Ser Met Ile Arg Asp Val Glu Leu Ala Glu Glu Ala
1 5 10 15
Leu Pro Lys Lys Thr Gly Gly Pro Gln Gly Ser Arg Arg Cys Leu Phe
20 25 30
Leu Ser Leu Phe Ser Phe Leu Ile Val Ala Gly Ala Thr Thr Leu Phe
35 40 45
Cys Leu Leu His Phe Gly Val Ile Gly Pro Gln Arg Glu Glu Phe Pro
50 55 60
Arg Asp Leu Ser Leu Ile Ser Pro Leu Ala Gln Ala Val Arg Ser Ser
65 70 75 80
Ser Arg Thr Pro Ser Asp Lys Pro Val Ala His Val Val Ala Asn Pro
85 90 95
Gln Ala Glu Gly Gln Leu Gln Trp Leu Asn Arg Arg Ala Asn Ala Leu
100 105 110
Leu Ala Asn Gly Val Glu Leu Arg Asp Asn Gln Leu Val Val Pro Ser
115 120 125
Glu Gly Leu Tyr Leu Ile Tyr Ser Gln Val Leu Phe Lys Gly Gln Gly
130 135 140
Cys Pro Ser Thr His Val Leu Leu Thr His Thr Ile Ser Arg Ile Ala
145 150 155 160
Val Ser Tyr Gln Thr Lys Val Asn Leu Leu Ser Ala Ile Lys Ser Pro
165 170 175
Cys Gln Arg Glu Thr Pro Glu Gly Ala Glu Ala Lys Pro Trp Tyr Glu
180 185 190
Pro Ile Tyr Leu Gly Gly Val Phe Gln Leu Glu Lys Gly Asp Arg Leu
195 200 205
Ser Ala Glu Ile Asn Arg Pro Asp Tyr Leu Asp Phe Ala Glu Ser Gly
210 215 220
Gln Val Tyr Phe Gly Ile Ile Ala Leu
225 230
<210> 35
<211> 153
<212> PRT
<213> Homo sapiens
<400> 35
Met Tyr Arg Met Gln Leu Leu Ser Cys Ile Ala Leu Ser Leu Ala Leu
1 5 10 15
Val Thr Asn Ser Ala Pro Thr Ser Ser Ser Thr Lys Lys Thr Gln Leu
20 25 30
Gln Leu Glu His Leu Leu Leu Asp Leu Gln Met Ile Leu Asn Gly Ile
35 40 45
Asn Asn Tyr Lys Asn Pro Lys Leu Thr Arg Met Leu Thr Phe Lys Phe
50 55 60
Tyr Met Pro Lys Lys Ala Thr Glu Leu Lys His Leu Gln Cys Leu Glu
65 70 75 80
Glu Glu Leu Lys Pro Leu Glu Glu Val Leu Asn Leu Ala Gln Ser Lys
85 90 95
Asn Phe His Leu Arg Pro Arg Asp Leu Ile Ser Asn Ile Asn Val Ile
100 105 110
Val Leu Glu Leu Lys Gly Ser Glu Thr Thr Phe Met Cys Glu Tyr Ala
115 120 125
Asp Glu Thr Ala Thr Ile Val Glu Phe Leu Asn Arg Trp Ile Thr Phe
130 135 140
Cys Gln Ser Ile Ile Ser Thr Leu Thr
145 150
<210> 36
<211> 99
<212> PRT
<213> Homo sapiens
<400> 36
Met Thr Ser Lys Leu Ala Val Ala Leu Leu Ala Ala Phe Leu Ile Ser
1 5 10 15
Ala Ala Leu Cys Glu Gly Ala Val Leu Pro Arg Ser Ala Lys Glu Leu
20 25 30
Arg Cys Gln Cys Ile Lys Thr Tyr Ser Lys Pro Phe His Pro Lys Phe
35 40 45
Ile Lys Glu Leu Arg Val Ile Glu Ser Gly Pro His Cys Ala Asn Thr
50 55 60
Glu Ile Ile Val Lys Leu Ser Asp Gly Arg Glu Leu Cys Leu Asp Pro
65 70 75 80
Lys Glu Asn Trp Val Gln Arg Val Val Glu Lys Phe Leu Lys Arg Ala
85 90 95
Glu Asn Ser
<210> 37
<211> 662
<212> PRT
<213> Homo sapiens
<400> 37
Met Glu Pro Leu Val Thr Trp Val Val Pro Leu Leu Phe Leu Phe Leu
1 5 10 15
Leu Ser Arg Gln Gly Ala Ala Cys Arg Thr Ser Glu Cys Cys Phe Gln
20 25 30
Asp Pro Pro Tyr Pro Asp Ala Asp Ser Gly Ser Ala Ser Gly Pro Arg
35 40 45
Asp Leu Arg Cys Tyr Arg Ile Ser Ser Asp Arg Tyr Glu Cys Ser Trp
50 55 60
Gln Tyr Glu Gly Pro Thr Ala Gly Val Ser His Phe Leu Arg Cys Cys
65 70 75 80
Leu Ser Ser Gly Arg Cys Cys Tyr Phe Ala Ala Gly Ser Ala Thr Arg
85 90 95
Leu Gln Phe Ser Asp Gln Ala Gly Val Ser Val Leu Tyr Thr Val Thr
100 105 110
Leu Trp Val Glu Ser Trp Ala Arg Asn Gln Thr Glu Lys Ser Pro Glu
115 120 125
Val Thr Leu Gln Leu Tyr Asn Ser Val Lys Tyr Glu Pro Pro Leu Gly
130 135 140
Asp Ile Lys Val Ser Lys Leu Ala Gly Gln Leu Arg Met Glu Trp Glu
145 150 155 160
Thr Pro Asp Asn Gln Val Gly Ala Glu Val Gln Phe Arg His Arg Thr
165 170 175
Pro Ser Ser Pro Trp Lys Leu Gly Asp Cys Gly Pro Gln Asp Asp Asp
180 185 190
Thr Glu Ser Cys Leu Cys Pro Leu Glu Met Asn Val Ala Gln Glu Phe
195 200 205
Gln Leu Arg Arg Arg Gln Leu Gly Ser Gln Gly Ser Ser Trp Ser Lys
210 215 220
Trp Ser Ser Pro Val Cys Val Pro Pro Glu Asn Pro Pro Gln Pro Gln
225 230 235 240
Val Arg Phe Ser Val Glu Gln Leu Gly Gln Asp Gly Arg Arg Arg Leu
245 250 255
Thr Leu Lys Glu Gln Pro Thr Gln Leu Glu Leu Pro Glu Gly Cys Gln
260 265 270
Gly Leu Ala Pro Gly Thr Glu Val Thr Tyr Arg Leu Gln Leu His Met
275 280 285
Leu Ser Cys Pro Cys Lys Ala Lys Ala Thr Arg Thr Leu His Leu Gly
290 295 300
Lys Met Pro Tyr Leu Ser Gly Ala Ala Tyr Asn Val Ala Val Ile Ser
305 310 315 320
Ser Asn Gln Phe Gly Pro Gly Leu Asn Gln Thr Trp His Ile Pro Ala
325 330 335
Asp Thr His Thr Glu Pro Val Ala Leu Asn Ile Ser Val Gly Thr Asn
340 345 350
Gly Thr Thr Met Tyr Trp Pro Ala Arg Ala Gln Ser Met Thr Tyr Cys
355 360 365
Ile Glu Trp Gln Pro Val Gly Gln Asp Gly Gly Leu Ala Thr Cys Ser
370 375 380
Leu Thr Ala Pro Gln Asp Pro Asp Pro Ala Gly Met Ala Thr Tyr Ser
385 390 395 400
Trp Ser Arg Glu Ser Gly Ala Met Gly Gln Glu Lys Cys Tyr Tyr Ile
405 410 415
Thr Ile Phe Ala Ser Ala His Pro Glu Lys Leu Thr Leu Trp Ser Thr
420 425 430
Val Leu Ser Thr Tyr His Phe Gly Gly Asn Ala Ser Ala Ala Gly Thr
435 440 445
Pro His His Val Ser Val Lys Asn His Ser Leu Asp Ser Val Ser Val
450 455 460
Asp Trp Ala Pro Ser Leu Leu Ser Thr Cys Pro Gly Val Leu Lys Glu
465 470 475 480
Tyr Val Val Arg Cys Arg Asp Glu Asp Ser Lys Gln Val Ser Glu His
485 490 495
Pro Val Gln Pro Thr Glu Thr Gln Val Thr Leu Ser Gly Leu Arg Ala
500 505 510
Gly Val Ala Tyr Thr Val Gln Val Arg Ala Asp Thr Ala Trp Leu Arg
515 520 525
Gly Val Trp Ser Gln Pro Gln Arg Phe Ser Ile Glu Val Gln Val Ser
530 535 540
Asp Trp Leu Ile Phe Phe Ala Ser Leu Gly Ser Phe Leu Ser Ile Leu
545 550 555 560
Leu Val Gly Val Leu Gly Tyr Leu Gly Leu Asn Arg Ala Ala Arg His
565 570 575
Leu Cys Pro Pro Leu Pro Thr Pro Cys Ala Ser Ser Ala Ile Glu Phe
580 585 590
Pro Gly Gly Lys Glu Thr Trp Gln Trp Ile Asn Pro Val Asp Phe Gln
595 600 605
Glu Glu Ala Ser Leu Gln Glu Ala Leu Val Val Glu Met Ser Trp Asp
610 615 620
Lys Gly Glu Arg Thr Glu Pro Leu Glu Lys Thr Glu Leu Pro Glu Gly
625 630 635 640
Ala Pro Glu Leu Ala Leu Asp Thr Glu Leu Ser Leu Glu Asp Gly Asp
645 650 655
Arg Cys Lys Ala Lys Met
660
<210> 38
<211> 193
<212> PRT
<213> Homo sapiens
<400> 38
Met Ala Ala Glu Pro Val Glu Asp Asn Cys Ile Asn Phe Val Ala Met
1 5 10 15
Lys Phe Ile Asp Asn Thr Leu Tyr Phe Ile Ala Glu Asp Asp Glu Asn
20 25 30
Leu Glu Ser Asp Tyr Phe Gly Lys Leu Glu Ser Lys Leu Ser Val Ile
35 40 45
Arg Asn Leu Asn Asp Gln Val Leu Phe Ile Asp Gln Gly Asn Arg Pro
50 55 60
Leu Phe Glu Asp Met Thr Asp Ser Asp Cys Arg Asp Asn Ala Pro Arg
65 70 75 80
Thr Ile Phe Ile Ile Ser Met Tyr Lys Asp Ser Gln Pro Arg Gly Met
85 90 95
Ala Val Thr Ile Ser Val Lys Cys Glu Lys Ile Ser Thr Leu Ser Cys
100 105 110
Glu Asn Lys Ile Ile Ser Phe Lys Glu Met Asn Pro Pro Asp Asn Ile
115 120 125
Lys Asp Thr Lys Ser Asp Ile Ile Phe Phe Gln Arg Ser Val Pro Gly
130 135 140
His Asp Asn Lys Met Gln Phe Glu Ser Ser Ser Tyr Glu Gly Tyr Phe
145 150 155 160
Leu Ala Cys Glu Lys Glu Arg Asp Leu Phe Lys Leu Ile Leu Lys Lys
165 170 175
Glu Asp Glu Leu Gly Asp Arg Ser Ile Met Phe Thr Val Gln Asn Glu
180 185 190
Asp
<210> 39
<211> 177
<212> PRT
<213> Homo sapiens
<400> 39
Met Phe His Val Ser Phe Arg Tyr Ile Phe Gly Leu Pro Pro Leu Ile
1 5 10 15
Leu Val Leu Leu Pro Val Ala Ser Ser Asp Cys Asp Ile Glu Gly Lys
20 25 30
Asp Gly Lys Gln Tyr Glu Ser Val Leu Met Val Ser Ile Asp Gln Leu
35 40 45
Leu Asp Ser Met Lys Glu Ile Gly Ser Asn Cys Leu Asn Asn Glu Phe
50 55 60
Asn Phe Phe Lys Arg His Ile Cys Asp Ala Asn Lys Glu Gly Met Phe
65 70 75 80
Leu Phe Arg Ala Ala Arg Lys Leu Arg Gln Phe Leu Lys Met Asn Ser
85 90 95
Thr Gly Asp Phe Asp Leu His Leu Leu Lys Val Ser Glu Gly Thr Thr
100 105 110
Ile Leu Leu Asn Cys Thr Gly Gln Val Lys Gly Arg Lys Pro Ala Ala
115 120 125
Leu Gly Glu Ala Gln Pro Thr Lys Ser Leu Glu Glu Asn Lys Ser Leu
130 135 140
Lys Glu Gln Lys Lys Leu Asn Asp Leu Cys Phe Leu Lys Arg Leu Leu
145 150 155 160
Gln Glu Ile Lys Thr Cys Trp Asn Lys Ile Leu Met Gly Thr Lys Glu
165 170 175
His
<210> 40
<211> 152
<212> PRT
<213> Homo sapiens
<400> 40
Met Ser Arg Leu Pro Val Leu Leu Leu Leu Gln Leu Leu Val Arg Pro
1 5 10 15
Gly Leu Gln Ala Pro Met Thr Gln Thr Thr Ser Leu Lys Thr Ser Trp
20 25 30
Val Asn Cys Ser Asn Met Ile Asp Glu Ile Ile Thr His Leu Lys Gln
35 40 45
Pro Pro Leu Pro Leu Leu Asp Phe Asn Asn Leu Asn Gly Glu Asp Gln
50 55 60
Asp Ile Leu Met Glu Asn Asn Leu Arg Arg Pro Asn Leu Glu Ala Phe
65 70 75 80
Asn Arg Ala Val Lys Ser Leu Gln Asn Ala Ser Ala Ile Glu Ser Ile
85 90 95
Leu Lys Asn Leu Leu Pro Cys Leu Pro Leu Ala Thr Ala Ala Pro Thr
100 105 110
Arg His Pro Ile His Ile Lys Asp Gly Asp Trp Asn Glu Phe Arg Arg
115 120 125
Lys Leu Thr Phe Tyr Leu Lys Thr Leu Glu Asn Ala Gln Ala Gln Gln
130 135 140
Thr Thr Leu Ser Leu Ala Ile Phe
145 150
<210> 41
<211> 153
<212> PRT
<213> Homo sapiens
<400> 41
Met Gly Leu Thr Ser Gln Leu Leu Pro Pro Leu Phe Phe Leu Leu Ala
1 5 10 15
Cys Ala Gly Asn Phe Val His Gly His Lys Cys Asp Ile Thr Leu Gln
20 25 30
Glu Ile Ile Lys Thr Leu Asn Ser Leu Thr Glu Gln Lys Thr Leu Cys
35 40 45
Thr Glu Leu Thr Val Thr Asp Ile Phe Ala Ala Ser Lys Asn Thr Thr
50 55 60
Glu Lys Glu Thr Phe Cys Arg Ala Ala Thr Val Leu Arg Gln Phe Tyr
65 70 75 80
Ser His His Glu Lys Asp Thr Arg Cys Leu Gly Ala Thr Ala Gln Gln
85 90 95
Phe His Arg His Lys Gln Leu Ile Arg Phe Leu Lys Arg Leu Asp Arg
100 105 110
Asn Leu Trp Gly Leu Ala Gly Leu Asn Ser Cys Pro Val Lys Glu Ala
115 120 125
Asn Gln Ser Thr Leu Glu Asn Phe Leu Glu Arg Leu Lys Thr Ile Met
130 135 140
Arg Glu Lys Tyr Ser Lys Cys Ser Ser
145 150
<210> 42
<211> 134
<212> PRT
<213> Homo sapiens
<400> 42
Met Arg Met Leu Leu His Leu Ser Leu Leu Ala Leu Gly Ala Ala Tyr
1 5 10 15
Val Tyr Ala Ile Pro Thr Glu Ile Pro Thr Ser Ala Leu Val Lys Glu
20 25 30
Thr Leu Ala Leu Leu Ser Thr His Arg Thr Leu Leu Ile Ala Asn Glu
35 40 45
Thr Leu Arg Ile Pro Val Pro Val His Lys Asn His Gln Leu Cys Thr
50 55 60
Glu Glu Ile Phe Gln Gly Ile Gly Thr Leu Glu Ser Gln Thr Val Gln
65 70 75 80
Gly Gly Thr Val Glu Arg Leu Phe Lys Asn Leu Ser Leu Ile Lys Lys
85 90 95
Tyr Ile Asp Gly Gln Lys Lys Lys Cys Gly Glu Glu Arg Arg Arg Val
100 105 110
Asn Gln Phe Leu Asp Tyr Leu Gln Glu Phe Leu Gly Val Met Asn Thr
115 120 125
Glu Trp Ile Ile Glu Ser
130
<210> 43
<211> 212
<212> PRT
<213> Homo sapiens
<400> 43
Met Asn Ser Phe Ser Thr Ser Ala Phe Gly Pro Val Ala Phe Ser Leu
1 5 10 15
Gly Leu Leu Leu Val Leu Pro Ala Ala Phe Pro Ala Pro Val Pro Pro
20 25 30
Gly Glu Asp Ser Lys Asp Val Ala Ala Pro His Arg Gln Pro Leu Thr
35 40 45
Ser Ser Glu Arg Ile Asp Lys Gln Ile Arg Tyr Ile Leu Asp Gly Ile
50 55 60
Ser Ala Leu Arg Lys Glu Thr Cys Asn Lys Ser Asn Met Cys Glu Ser
65 70 75 80
Ser Lys Glu Ala Leu Ala Glu Asn Asn Leu Asn Leu Pro Lys Met Ala
85 90 95
Glu Lys Asp Gly Cys Phe Gln Ser Gly Phe Asn Glu Glu Thr Cys Leu
100 105 110
Val Lys Ile Ile Thr Gly Leu Leu Glu Phe Glu Val Tyr Leu Glu Tyr
115 120 125
Leu Gln Asn Arg Phe Glu Ser Ser Glu Glu Gln Ala Arg Ala Val Gln
130 135 140
Met Ser Thr Lys Val Leu Ile Gln Phe Leu Gln Lys Lys Ala Lys Asn
145 150 155 160
Leu Asp Ala Ile Thr Thr Pro Asp Pro Thr Thr Asn Ala Ser Leu Leu
165 170 175
Thr Lys Leu Gln Ala Gln Asn Gln Trp Leu Gln Asp Met Thr Thr His
180 185 190
Leu Ile Leu Arg Ser Phe Lys Glu Phe Leu Gln Ser Ser Leu Arg Ala
195 200 205
Leu Arg Gln Met
210
<210> 44
<211> 140
<212> PRT
<213> Homo sapiens
<400> 44
Met Val Leu Thr Ser Ala Leu Leu Leu Cys Ser Val Ala Gly Gln Gly
1 5 10 15
Cys Pro Thr Leu Ala Gly Ile Leu Asp Ile Asn Phe Leu Ile Asn Lys
20 25 30
Met Gln Glu Asp Pro Ala Ser Lys Cys His Cys Ser Ala Asn Val Thr
35 40 45
Ser Cys Leu Cys Leu Gly Ile Pro Ser Asp Asn Cys Thr Arg Pro Cys
50 55 60
Phe Ser Glu Arg Leu Ser Gln Met Thr Asn Thr Thr Met Gln Thr Arg
65 70 75 80
Tyr Pro Leu Ile Phe Ser Arg Val Lys Lys Ser Val Glu Val Leu Lys
85 90 95
Asn Asn Lys Cys Pro Tyr Phe Ser Cys Glu Gln Pro Cys Asn Gln Thr
100 105 110
Thr Ala Gly Asn Ala Leu Thr Phe Leu Lys Ser Leu Leu Glu Ile Phe
115 120 125
Gln Lys Glu Lys Met Arg Gly Met Arg Gly Lys Ile
130 135 140
<210> 45
<211> 178
<212> PRT
<213> Homo sapiens
<400> 45
Met His Ser Ser Ala Leu Leu Cys Cys Leu Val Leu Leu Thr Gly Val
1 5 10 15
Arg Ala Ser Pro Gly Gln Gly Thr Gln Ser Glu Asn Ser Cys Thr His
20 25 30
Phe Pro Gly Asn Leu Pro Asn Met Leu Arg Asp Leu Arg Asp Ala Phe
35 40 45
Ser Arg Val Lys Thr Phe Phe Gln Met Lys Asp Gln Leu Asp Asn Leu
50 55 60
Leu Leu Lys Glu Ser Leu Leu Glu Asp Phe Lys Gly Tyr Leu Gly Cys
65 70 75 80
Gln Ala Leu Ser Glu Met Ile Gln Phe Tyr Leu Glu Glu Val Met Pro
85 90 95
Gln Ala Glu Asn Gln Asp Pro Asp Ile Lys Ala His Val Asn Ser Leu
100 105 110
Gly Glu Asn Leu Lys Thr Leu Arg Leu Arg Leu Arg Arg Cys His Arg
115 120 125
Phe Leu Pro Cys Glu Asn Lys Ser Lys Ala Val Glu Gln Val Lys Asn
130 135 140
Ala Phe Asn Lys Leu Gln Glu Lys Gly Ile Tyr Lys Ala Met Ser Glu
145 150 155 160
Phe Asp Ile Phe Ile Asn Tyr Ile Glu Ala Tyr Met Thr Met Lys Ile
165 170 175
Arg Asn
<210> 46
<211> 145
<212> PRT
<213> Homo sapiens
<400> 46
Met Ala Leu Leu Leu Thr Thr Val Ile Ala Leu Thr Cys Leu Gly Gly
1 5 10 15
Phe Ala Ser Pro Gly Pro Val Pro Pro Ser Thr Ala Leu Arg Glu Leu
20 25 30
Ile Glu Glu Leu Val Asn Ile Thr Gln Asn Gln Lys Ala Pro Leu Cys
35 40 45
Asn Gly Ser Met Val Trp Ser Ile Asn Leu Thr Ala Gly Met Tyr Cys
50 55 60
Ala Ala Leu Glu Ser Leu Ile Asn Val Ser Gly Cys Ser Ala Ile Glu
65 70 75 80
Lys Thr Gln Arg Met Leu Ser Gly Phe Cys Pro His Lys Val Ser Ala
85 90 95
Gly Gln Phe Ser Ser Leu His Val Arg Asp Thr Lys Ile Glu Val Ala
100 105 110
Gln Phe Val Lys Asp Leu Leu Leu His Leu Lys Lys Leu Phe Arg Glu
115 120 125
Gly Gln Phe Asn Arg Asn Phe Glu Ser Ile Ile Ile Cys Arg Asp Arg
130 135 140
Thr
145
<210> 47
<211> 136
<212> PRT
<213> Homo sapiens
<400> 47
Met Asp Phe Gln Val Gln Ile Phe Ser Phe Leu Leu Ile Ser Ala Ser
1 5 10 15
Val Ile Met Ser Arg Ala Asn Trp Val Asn Val Ile Ser Asp Leu Lys
20 25 30
Lys Ile Glu Asp Leu Ile Gln Ser Met His Ile Asp Ala Thr Leu Tyr
35 40 45
Thr Glu Ser Asp Val His Pro Ser Cys Lys Val Thr Ala Met Lys Cys
50 55 60
Phe Leu Leu Glu Leu Gln Val Ile Ser Leu Glu Ser Gly Asp Ala Ser
65 70 75 80
Ile His Asp Thr Val Glu Asn Leu Ile Ile Leu Ala Asn Asn Ser Leu
85 90 95
Ser Ser Asn Gly Asn Val Thr Glu Ser Gly Cys Lys Glu Cys Glu Glu
100 105 110
Leu Glu Glu Lys Asn Ile Lys Glu Phe Leu Gln Ser Phe Val His Ile
115 120 125
Val Gln Met Phe Ile Asn Thr Ser
130 135
<210> 48
<211> 656
<212> PRT
<213> Homo sapiens
<400> 48
Met Glu Gly Asp Gly Ser Asp Pro Glu Pro Pro Asp Ala Gly Glu Asp
1 5 10 15
Ser Lys Ser Glu Asn Gly Glu Asn Ala Pro Ile Tyr Cys Ile Cys Arg
20 25 30
Lys Pro Asp Ile Asn Cys Phe Met Ile Gly Cys Asp Asn Cys Asn Glu
35 40 45
Trp Phe His Gly Asp Cys Ile Arg Ile Thr Glu Lys Met Ala Lys Ala
50 55 60
Ile Arg Glu Trp Tyr Cys Arg Glu Cys Arg Glu Lys Asp Pro Lys Leu
65 70 75 80
Glu Ile Arg Tyr Arg His Lys Lys Ser Arg Glu Arg Asp Gly Asn Glu
85 90 95
Arg Asp Ser Ser Glu Pro Arg Asp Glu Gly Gly Gly Arg Lys Arg Pro
100 105 110
Val Pro Asp Pro Asn Leu Gln Arg Arg Ala Gly Ser Gly Thr Gly Val
115 120 125
Gly Ala Met Leu Ala Arg Gly Ser Ala Ser Pro His Lys Ser Ser Pro
130 135 140
Gln Pro Leu Val Ala Thr Pro Ser Gln His His Gln Gln Gln Gln Gln
145 150 155 160
Gln Ile Lys Arg Ser Ala Arg Met Cys Gly Glu Cys Glu Ala Cys Arg
165 170 175
Arg Thr Glu Asp Cys Gly His Cys Asp Phe Cys Arg Asp Met Lys Lys
180 185 190
Phe Gly Gly Pro Asn Lys Ile Arg Gln Lys Cys Arg Leu Arg Gln Cys
195 200 205
Gln Leu Arg Ala Arg Glu Ser Tyr Lys Tyr Phe Pro Ser Ser Leu Ser
210 215 220
Pro Val Thr Pro Ser Glu Ser Leu Pro Arg Pro Arg Arg Pro Leu Pro
225 230 235 240
Thr Gln Gln Gln Pro Gln Pro Ser Gln Lys Leu Gly Arg Ile Arg Glu
245 250 255
Asp Glu Gly Ala Val Ala Ser Ser Thr Val Lys Glu Pro Pro Glu Ala
260 265 270
Thr Ala Thr Pro Glu Pro Leu Ser Asp Glu Asp Leu Pro Leu Asp Pro
275 280 285
Asp Leu Tyr Gln Asp Phe Cys Ala Gly Ala Phe Asp Asp Asn Gly Leu
290 295 300
Pro Trp Met Ser Asp Thr Glu Glu Ser Pro Phe Leu Asp Pro Ala Leu
305 310 315 320
Arg Lys Arg Ala Val Lys Val Lys His Val Lys Arg Arg Glu Lys Lys
325 330 335
Ser Glu Lys Lys Lys Glu Glu Arg Tyr Lys Arg His Arg Gln Lys Gln
340 345 350
Lys His Lys Asp Lys Trp Lys His Pro Glu Arg Ala Asp Ala Lys Asp
355 360 365
Pro Ala Ser Leu Pro Gln Cys Leu Gly Pro Gly Cys Val Arg Pro Ala
370 375 380
Gln Pro Ser Ser Lys Tyr Cys Ser Asp Asp Cys Gly Met Lys Leu Ala
385 390 395 400
Ala Asn Arg Ile Tyr Glu Ile Leu Pro Gln Arg Ile Gln Gln Trp Gln
405 410 415
Gln Ser Pro Cys Ile Ala Glu Glu His Gly Lys Lys Leu Leu Glu Arg
420 425 430
Ile Arg Arg Glu Gln Gln Ser Ala Arg Thr Arg Leu Gln Glu Met Glu
435 440 445
Arg Arg Phe His Glu Leu Glu Ala Ile Ile Leu Arg Ala Lys Gln Gln
450 455 460
Ala Val Arg Glu Asp Glu Glu Ser Asn Glu Gly Asp Ser Asp Asp Thr
465 470 475 480
Asp Leu Gln Ile Phe Cys Val Ser Cys Gly His Pro Ile Asn Pro Arg
485 490 495
Val Ala Leu Arg His Met Glu Arg Cys Tyr Ala Lys Tyr Glu Ser Gln
500 505 510
Thr Ser Phe Gly Ser Met Tyr Pro Thr Arg Ile Glu Gly Ala Thr Arg
515 520 525
Leu Phe Cys Asp Val Tyr Asn Pro Gln Ser Lys Thr Tyr Cys Lys Arg
530 535 540
Leu Gln Val Leu Cys Pro Glu His Ser Arg Asp Pro Lys Val Pro Ala
545 550 555 560
Asp Glu Val Cys Gly Cys Pro Leu Val Arg Asp Val Phe Glu Leu Thr
565 570 575
Gly Asp Phe Cys Arg Leu Pro Lys Arg Gln Cys Asn Arg His Tyr Cys
580 585 590
Trp Glu Lys Leu Arg Arg Ala Glu Val Asp Leu Glu Arg Val Arg Val
595 600 605
Trp Tyr Lys Leu Asp Glu Leu Phe Glu Gln Glu Arg Asn Val Arg Thr
610 615 620
Ala Met Thr Asn Arg Ala Gly Leu Leu Ala Leu Met Leu His Gln Thr
625 630 635 640
Ile Gln His Asp Pro Leu Thr Thr Asp Leu Arg Ser Ser Ala Asp Arg
645 650 655
<210> 49
<211> 124
<212> PRT
<213> Vibrio cholerae
<400> 49
Met Ile Lys Leu Lys Phe Gly Val Phe Phe Thr Val Leu Leu Ser Ser
1 5 10 15
Ala Tyr Ala His Gly Thr Pro Gln Asn Ile Thr Asp Leu Cys Ala Glu
20 25 30
Tyr His Asn Thr Gln Ile Tyr Thr Leu Asn Asp Lys Ile Phe Ser Tyr
35 40 45
Thr Glu Ser Leu Ala Gly Lys Arg Glu Met Ala Ile Ile Thr Phe Lys
50 55 60
Asn Gly Ala Ile Phe Gln Val Glu Val Pro Gly Ser Gln His Ile Asp
65 70 75 80
Ser Gln Lys Lys Ala Ile Glu Arg Met Lys Asp Thr Leu Arg Ile Ala
85 90 95
Tyr Leu Thr Glu Ala Lys Val Glu Lys Leu Cys Val Trp Asn Asn Lys
100 105 110
Thr Pro His Ala Ile Ala Ala Ile Ser Met Ala Asn
115 120
<210> 50
<211> 258
<212> PRT
<213> Vibrio cholerae
<400> 50
Met Val Lys Ile Ile Phe Val Phe Phe Ile Phe Leu Ser Ser Phe Ser
1 5 10 15
Tyr Ala Asn Asp Asp Lys Leu Tyr Arg Ala Asp Ser Arg Pro Pro Asp
20 25 30
Glu Ile Lys Gln Ser Gly Gly Leu Met Pro Arg Gly Gln Asn Glu Tyr
35 40 45
Phe Asp Arg Gly Thr Gln Met Asn Ile Asn Leu Tyr Asp His Ala Arg
50 55 60
Gly Thr Gln Thr Gly Phe Val Arg His Asp Asp Gly Tyr Val Ser Thr
65 70 75 80
Ser Ile Ser Leu Arg Ser Ala His Leu Val Gly Gln Thr Ile Leu Ser
85 90 95
Gly His Ser Thr Tyr Tyr Ile Tyr Val Ile Ala Thr Ala Pro Asn Met
100 105 110
Phe Asn Val Asn Asp Val Leu Gly Ala Tyr Ser Pro His Pro Asp Glu
115 120 125
Gln Glu Val Ser Ala Leu Gly Gly Ile Pro Tyr Ser Gln Ile Tyr Gly
130 135 140
Trp Tyr Arg Val His Phe Gly Val Leu Asp Glu Gln Leu His Arg Asn
145 150 155 160
Arg Gly Tyr Arg Asp Arg Tyr Tyr Ser Asn Leu Asp Ile Ala Pro Ala
165 170 175
Ala Asp Gly Tyr Gly Leu Ala Gly Phe Pro Pro Glu His Arg Ala Trp
180 185 190
Arg Glu Glu Pro Trp Ile His His Ala Pro Pro Gly Cys Gly Asn Ala
195 200 205
Pro Arg Ser Ser Met Ser Asn Thr Cys Asp Glu Lys Thr Gln Ser Leu
210 215 220
Gly Val Lys Phe Leu Asp Glu Tyr Gln Ser Lys Val Lys Arg Gln Ile
225 230 235 240
Phe Ser Gly Tyr Gln Ser Asp Ile Asp Thr His Asn Arg Ile Lys Asp
245 250 255
Glu Leu
<210> 51
<211> 124
<212> PRT
<213> Vibrio cholerae
<400> 51
Met Ile Lys Leu Lys Phe Gly Val Phe Phe Thr Val Leu Leu Ser Ser
1 5 10 15
Ala Tyr Ala His Gly Thr Pro Gln Asn Ile Thr Asp Leu Cys Ala Glu
20 25 30
Tyr His Asn Thr Gln Ile His Thr Leu Asn Asp Lys Ile Leu Ser Tyr
35 40 45
Thr Glu Ser Leu Ala Gly Asn Arg Glu Met Ala Ile Ile Thr Phe Lys
50 55 60
Asn Gly Ala Thr Phe Gln Val Glu Val Pro Gly Ser Gln His Ile Asp
65 70 75 80
Ser Gln Lys Lys Ala Ile Glu Arg Met Lys Asp Thr Leu Arg Ile Ala
85 90 95
Tyr Leu Thr Glu Ala Lys Val Glu Lys Leu Cys Val Trp Asn Asn Lys
100 105 110
Thr Pro His Ala Ile Ala Ala Ile Ser Met Ala Asn
115 120
<210> 52
<211> 18
<212> PRT
<213> Homo sapiens
<400> 52
Asp Pro Asn Ala Pro Lys Arg Pro Pro Ser Ala Phe Phe Leu Phe Cys
1 5 10 15
Ser Glu
<210> 53
<211> 96
<212> PRT
<213> Homo sapiens
<400> 53
Met Cys Cys Thr Lys Ser Leu Leu Leu Ala Ala Leu Met Ser Val Leu
1 5 10 15
Leu Leu His Leu Cys Gly Glu Ser Glu Ala Ala Ser Asn Phe Asp Cys
20 25 30
Cys Leu Gly Tyr Thr Asp Arg Ile Leu His Pro Lys Phe Ile Val Gly
35 40 45
Phe Thr Arg Gln Leu Ala Asn Glu Gly Cys Asp Ile Asn Ala Ile Ile
50 55 60
Phe His Thr Lys Lys Lys Leu Ser Val Cys Ala Asn Pro Lys Gln Thr
65 70 75 80
Trp Val Lys Tyr Ile Val Arg Leu Leu Ser Lys Lys Val Lys Asn Met
85 90 95
<210> 54
<211> 92
<212> PRT
<213> Homo sapiens
<400> 54
Met Gln Val Ser Thr Ala Ala Leu Ala Val Leu Leu Cys Thr Met Ala
1 5 10 15
Leu Cys Asn Gln Phe Ser Ala Ser Leu Ala Ala Asp Thr Pro Thr Ala
20 25 30
Cys Cys Phe Ser Tyr Thr Ser Arg Gln Ile Pro Gln Asn Phe Ile Ala
35 40 45
Asp Tyr Phe Glu Thr Ser Ser Gln Cys Ser Lys Pro Gly Val Ile Phe
50 55 60
Leu Thr Lys Arg Ser Arg Gln Val Cys Ala Asp Pro Ser Glu Glu Trp
65 70 75 80
Val Gln Lys Tyr Val Ser Asp Leu Glu Leu Ser Ala
85 90
<210> 55
<211> 144
<212> PRT
<213> Homo sapiens
<400> 55
Met Trp Leu Gln Ser Leu Leu Leu Leu Gly Thr Val Ala Cys Ser Ile
1 5 10 15
Ser Ala Pro Ala Arg Ser Pro Ser Pro Ser Thr Gln Pro Trp Glu His
20 25 30
Val Asn Ala Ile Gln Glu Ala Arg Arg Leu Leu Asn Leu Ser Arg Asp
35 40 45
Thr Ala Ala Glu Met Asn Glu Thr Val Glu Val Ile Ser Glu Met Phe
50 55 60
Asp Leu Gln Glu Pro Thr Cys Leu Gln Thr Arg Leu Glu Leu Tyr Lys
65 70 75 80
Gln Gly Leu Arg Gly Ser Leu Thr Lys Leu Lys Gly Pro Leu Thr Met
85 90 95
Met Ala Ser His Tyr Lys Gln His Cys Pro Pro Thr Pro Glu Thr Ser
100 105 110
Cys Ala Thr Gln Ile Ile Thr Phe Glu Ser Phe Lys Glu Asn Leu Lys
115 120 125
Asp Phe Leu Leu Val Ile Pro Phe Asp Cys Trp Glu Pro Val Gln Glu
130 135 140
<210> 56
<211> 204
<212> PRT
<213> Homo sapiens
<400> 56
Met Ala Gly Pro Ala Thr Gln Ser Pro Met Lys Leu Met Ala Leu Gln
1 5 10 15
Leu Leu Leu Trp His Ser Ala Leu Trp Thr Val Gln Glu Ala Thr Pro
20 25 30
Leu Gly Pro Ala Ser Ser Leu Pro Gln Ser Phe Leu Leu Lys Cys Leu
35 40 45
Glu Gln Val Arg Lys Ile Gln Gly Asp Gly Ala Ala Leu Gln Glu Lys
50 55 60
Leu Cys Ala Thr Tyr Lys Leu Cys His Pro Glu Glu Leu Val Leu Leu
65 70 75 80
Gly His Ser Leu Gly Ile Pro Trp Ala Pro Leu Ser Ser Cys Pro Ser
85 90 95
Gln Ala Leu Gln Leu Ala Gly Cys Leu Ser Gln Leu His Ser Gly Leu
100 105 110
Phe Leu Tyr Gln Gly Leu Leu Gln Ala Leu Glu Gly Ile Ser Pro Glu
115 120 125
Leu Gly Pro Thr Leu Asp Thr Leu Gln Leu Asp Val Ala Asp Phe Ala
130 135 140
Thr Thr Ile Trp Gln Gln Met Glu Glu Leu Gly Met Ala Pro Ala Leu
145 150 155 160
Gln Pro Thr Gln Gly Ala Met Pro Ala Phe Ala Ser Ala Phe Gln Arg
165 170 175
Arg Ala Gly Gly Val Leu Val Ala Ser His Leu Gln Ser Phe Leu Glu
180 185 190
Val Ser Tyr Arg Val Leu Arg His Leu Ala Gln Pro
195 200
<210> 57
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 57
Gln Glu Ile Asn Ser Ser Tyr
1 5
<210> 58
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 58
Ser His Pro Arg Leu Ser Ala
1 5
<210> 59
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 59
Ser Met Pro Asn Pro Met Val
1 5
<210> 60
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 60
Gly Leu Gln Gln Val Leu Leu
1 5
<210> 61
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 61
His Glu Leu Ser Val Leu Leu
1 5
<210> 62
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 62
Tyr Ala Pro Gln Arg Leu Pro
1 5
<210> 63
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 63
Thr Pro Arg Thr Leu Pro Thr
1 5
<210> 64
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 64
Ala Pro Val His Ser Ser Ile
1 5
<210> 65
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 65
Ala Pro Pro His Ala Leu Ser
1 5
<210> 66
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 66
Thr Phe Ser Asn Arg Phe Ile
1 5
<210> 67
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 67
Val Val Pro Thr Pro Pro Tyr
1 5
<210> 68
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 68
Glu Leu Ala Pro Asp Ser Pro
1 5
<210> 69
<211> 69
<212> PRT
<213> Shigella dysenteria 1
<400> 69
Thr Pro Asp Cys Val Thr Gly Lys Val Glu Tyr Thr Lys Tyr Asn Asp
1 5 10 15
Asp Asp Thr Phe Thr Val Lys Val Gly Asp Lys Glu Leu Phe Thr Asn
20 25 30
Arg Trp Asn Leu Gln Ser Leu Leu Leu Ser Ala Gln Ile Thr Gly Met
35 40 45
Thr Val Thr Ile Lys Gln Asn Ala Cys His Asn Gly Gly Gly Phe Ser
50 55 60
Glu Val Ile Phe Arg
65
<210> 70
<211> 560
<212> PRT
<213> Corynephage omega
<400> 70
Met Ser Arg Lys Leu Phe Ala Ser Ile Leu Ile Gly Ala Leu Leu Gly
1 5 10 15
Ile Gly Ala Pro Pro Ser Ala His Ala Gly Ala Asp Asp Val Val Asp
20 25 30
Ser Ser Lys Ser Phe Val Met Glu Asn Phe Ser Ser Tyr His Gly Thr
35 40 45
Lys Pro Gly Tyr Val Asp Ser Ile Gln Lys Gly Ile Gln Lys Pro Lys
50 55 60
Ser Gly Thr Gln Gly Asn Tyr Asp Asp Asp Trp Lys Gly Phe Tyr Ser
65 70 75 80
Thr Asp Asn Lys Tyr Asp Ala Ala Gly Tyr Ser Val Asp Asn Glu Asn
85 90 95
Pro Leu Ser Gly Lys Ala Gly Gly Val Val Lys Val Thr Tyr Pro Gly
100 105 110
Leu Thr Lys Val Leu Ala Leu Lys Val Asp Asn Ala Glu Thr Ile Lys
115 120 125
Lys Glu Leu Gly Leu Ser Leu Thr Glu Pro Leu Met Glu Gln Val Gly
130 135 140
Thr Glu Glu Phe Ile Lys Arg Phe Gly Asp Gly Ala Ser Arg Val Val
145 150 155 160
Leu Ser Leu Pro Phe Ala Glu Gly Ser Ser Ser Val Glu Tyr Ile Asn
165 170 175
Asn Trp Glu Gln Ala Lys Ala Leu Ser Val Glu Leu Glu Ile Asn Phe
180 185 190
Glu Thr Arg Gly Lys Arg Gly Gln Asp Ala Met Tyr Glu Tyr Met Ala
195 200 205
Gln Ala Cys Ala Gly Asn Arg Val Arg Arg Ser Val Gly Ser Ser Leu
210 215 220
Ser Cys Ile Asn Leu Asp Trp Asp Val Ile Arg Asp Lys Thr Lys Thr
225 230 235 240
Lys Ile Glu Ser Leu Lys Glu His Gly Pro Ile Lys Asn Lys Met Ser
245 250 255
Glu Ser Pro Asn Lys Thr Val Ser Glu Glu Lys Ala Lys Gln Tyr Leu
260 265 270
Glu Glu Phe His Gln Thr Ala Leu Glu His Pro Glu Leu Ser Glu Leu
275 280 285
Lys Thr Val Thr Gly Thr Asn Pro Val Phe Ala Gly Ala Asn Tyr Ala
290 295 300
Ala Trp Ala Val Asn Val Ala Gln Val Ile Asp Ser Glu Thr Ala Asp
305 310 315 320
Asn Leu Glu Lys Thr Thr Ala Ala Leu Ser Ile Leu Pro Gly Ile Gly
325 330 335
Ser Val Met Gly Ile Ala Asp Gly Ala Val His His Asn Thr Glu Glu
340 345 350
Ile Val Ala Gln Ser Ile Ala Leu Ser Ser Leu Met Val Ala Gln Ala
355 360 365
Ile Pro Leu Val Gly Glu Leu Val Asp Ile Gly Phe Ala Ala Tyr Asn
370 375 380
Phe Val Glu Ser Ile Ile Asn Leu Phe Gln Val Val His Asn Ser Tyr
385 390 395 400
Asn Arg Pro Ala Tyr Ser Pro Gly His Lys Thr Gln Pro Phe Leu His
405 410 415
Asp Gly Tyr Ala Val Ser Trp Asn Thr Val Glu Asp Ser Ile Ile Arg
420 425 430
Thr Gly Phe Gln Gly Glu Ser Gly His Asp Ile Lys Ile Thr Ala Glu
435 440 445
Asn Thr Pro Leu Pro Ile Ala Gly Val Leu Leu Pro Thr Ile Pro Gly
450 455 460
Lys Leu Asp Val Asn Lys Ser Lys Thr His Ile Ser Val Asn Gly Arg
465 470 475 480
Lys Ile Arg Met Arg Cys Arg Ala Ile Asp Gly Asp Val Thr Phe Cys
485 490 495
Arg Pro Lys Ser Pro Val Tyr Val Gly Asn Gly Val His Ala Asn Leu
500 505 510
His Val Ala Phe His Arg Ser Ser Ser Glu Lys Ile His Ser Asn Glu
515 520 525
Ile Ser Ser Asp Ser Ile Gly Val Leu Gly Tyr Gln Lys Thr Val Asp
530 535 540
His Thr Lys Val Asn Ser Lys Leu Ser Leu Phe Phe Glu Ile Lys Ser
545 550 555 560
<210> 71
<211> 114
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 71
Asn Trp Val Asn Val Ile Ser Asp Leu Lys Lys Ile Glu Asp Leu Ile
1 5 10 15
Gln Ser Met His Ile Asp Ala Thr Leu Tyr Thr Glu Ser Asp Val His
20 25 30
Pro Ser Cys Lys Val Thr Ala Met Lys Cys Phe Leu Leu Glu Leu Gln
35 40 45
Val Ile Ser Leu Glu Ser Gly Asp Ala Ser Ile His Asp Thr Val Glu
50 55 60
Asn Leu Ile Ile Leu Ala Asn Asp Ser Leu Ser Ser Asn Gly Asn Val
65 70 75 80
Thr Glu Ser Gly Cys Lys Glu Cys Glu Glu Leu Glu Glu Lys Asn Ile
85 90 95
Lys Glu Phe Leu Gln Ser Phe Val His Ile Val Gln Met Phe Ile Asn
100 105 110
Thr Ser
<210> 72
<211> 297
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 72
Ile Thr Cys Pro Pro Pro Met Ser Val Glu His Ala Asp Ile Trp Val
1 5 10 15
Lys Ser Tyr Ser Leu Tyr Ser Arg Glu Arg Tyr Ile Cys Asn Ser Gly
20 25 30
Phe Lys Arg Lys Ala Gly Thr Ser Ser Leu Thr Glu Cys Val Leu Asn
35 40 45
Lys Ala Thr Asn Val Ala His Trp Thr Thr Pro Ser Leu Lys Cys Ile
50 55 60
Arg Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro
65 70 75 80
Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys
85 90 95
Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val
100 105 110
Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr
115 120 125
Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu
130 135 140
Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His
145 150 155 160
Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys
165 170 175
Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln
180 185 190
Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu
195 200 205
Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro
210 215 220
Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn
225 230 235 240
Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu
245 250 255
Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val
260 265 270
Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln
275 280 285
Lys Ser Leu Ser Leu Ser Pro Gly Lys
290 295
<210> 73
<211> 535
<212> PRT
<213> Corynebacterium diphtheriae
<400> 73
Gly Ala Asp Asp Val Val Asp Ser Ser Lys Ser Phe Val Met Glu Asn
1 5 10 15
Phe Ser Ser Tyr His Gly Thr Lys Pro Gly Tyr Val Asp Ser Ile Gln
20 25 30
Lys Gly Ile Gln Lys Pro Lys Ser Gly Thr Gln Gly Asn Tyr Asp Asp
35 40 45
Asp Trp Lys Glu Phe Tyr Ser Thr Asp Asn Lys Tyr Asp Ala Ala Gly
50 55 60
Tyr Ser Val Asp Asn Glu Asn Pro Leu Ser Gly Lys Ala Gly Gly Val
65 70 75 80
Val Lys Val Thr Tyr Pro Gly Leu Thr Lys Val Leu Ala Leu Lys Val
85 90 95
Asp Asn Ala Glu Thr Ile Lys Lys Glu Leu Gly Leu Ser Leu Thr Glu
100 105 110
Pro Leu Met Glu Gln Val Gly Thr Glu Glu Phe Ile Lys Arg Phe Gly
115 120 125
Asp Gly Ala Ser Arg Val Val Leu Ser Leu Pro Phe Ala Glu Gly Ser
130 135 140
Ser Ser Val Glu Tyr Ile Asn Asn Trp Glu Gln Ala Lys Ala Leu Ser
145 150 155 160
Val Glu Leu Glu Ile Asn Phe Glu Thr Arg Gly Lys Arg Gly Gln Asp
165 170 175
Ala Met Tyr Glu Tyr Met Ala Gln Ala Cys Ala Gly Asn Arg Val Arg
180 185 190
Arg Ser Val Gly Ser Ser Leu Ser Cys Ile Asn Leu Asp Trp Asp Val
195 200 205
Ile Arg Asp Lys Thr Lys Thr Lys Ile Glu Ser Leu Lys Glu His Gly
210 215 220
Pro Ile Lys Asn Lys Met Ser Glu Ser Pro Asn Lys Thr Val Ser Glu
225 230 235 240
Glu Lys Ala Lys Gln Tyr Leu Glu Glu Phe His Gln Thr Ala Leu Glu
245 250 255
His Pro Glu Leu Ser Glu Leu Lys Thr Val Thr Gly Thr Asn Pro Val
260 265 270
Phe Ala Gly Ala Asn Tyr Ala Ala Trp Ala Val Asn Val Ala Gln Val
275 280 285
Ile Asp Ser Glu Thr Ala Asp Asn Leu Glu Lys Thr Thr Ala Ala Leu
290 295 300
Ser Ile Leu Pro Gly Ile Gly Ser Val Met Gly Ile Ala Asp Gly Ala
305 310 315 320
Val His His Asn Thr Glu Glu Ile Val Ala Gln Ser Ile Ala Leu Ser
325 330 335
Ser Leu Met Val Ala Gln Ala Ile Pro Leu Val Gly Glu Leu Val Asp
340 345 350
Ile Gly Phe Ala Ala Tyr Asn Phe Val Glu Ser Ile Ile Asn Leu Phe
355 360 365
Gln Val Val His Asn Ser Tyr Asn Arg Pro Ala Tyr Ser Pro Gly His
370 375 380
Lys Thr Gln Pro Phe Leu His Asp Gly Tyr Ala Val Ser Trp Asn Thr
385 390 395 400
Val Glu Asp Ser Ile Ile Arg Thr Gly Phe Gln Gly Glu Ser Gly His
405 410 415
Asp Ile Lys Ile Thr Ala Glu Asn Thr Pro Leu Pro Ile Ala Gly Val
420 425 430
Leu Leu Pro Thr Ile Pro Gly Lys Leu Asp Val Asn Lys Ser Lys Thr
435 440 445
His Ile Ser Val Asn Gly Arg Lys Ile Arg Met Arg Cys Arg Ala Ile
450 455 460
Asp Gly Asp Val Thr Phe Cys Arg Pro Lys Ser Pro Val Tyr Val Gly
465 470 475 480
Asn Gly Val His Ala Asn Leu His Val Ala Phe His Arg Ser Ser Ser
485 490 495
Glu Lys Ile His Ser Asn Glu Ile Ser Ser Asp Ser Ile Gly Val Leu
500 505 510
Gly Tyr Gln Lys Thr Val Asp His Thr Lys Val Asn Ser Lys Leu Ser
515 520 525
Leu Phe Phe Glu Ile Lys Ser
530 535
<210> 74
<211> 1331
<212> PRT
<213> Homo sapiens
<400> 74
Met Glu Ser His Ser Arg Ala Gly Lys Ser Arg Lys Ser Ala Lys Phe
1 5 10 15
Arg Ser Ile Ser Arg Ser Leu Met Leu Cys Asn Ala Lys Thr Ser Asp
20 25 30
Asp Gly Ser Ser Pro Asp Glu Lys Tyr Pro Asp Pro Phe Glu Ile Ser
35 40 45
Leu Ala Gln Gly Lys Glu Gly Ile Phe His Ser Ser Val Gln Leu Ala
50 55 60
Asp Thr Ser Glu Ala Gly Pro Ser Ser Val Pro Asp Leu Ala Leu Ala
65 70 75 80
Ser Glu Ala Ala Gln Leu Gln Ala Ala Gly Asn Asp Arg Gly Lys Thr
85 90 95
Cys Arg Arg Ile Phe Phe Met Lys Glu Ser Ser Thr Ala Ser Ser Arg
100 105 110
Glu Lys Pro Gly Lys Leu Glu Ala Gln Ser Ser Asn Phe Leu Phe Pro
115 120 125
Lys Ala Cys His Gln Arg Ala Arg Ser Asn Ser Thr Ser Val Asn Pro
130 135 140
Tyr Cys Thr Arg Glu Ile Asp Phe Pro Met Thr Lys Lys Ser Ala Ala
145 150 155 160
Pro Thr Asp Arg Gln Pro Tyr Ser Leu Cys Ser Asn Arg Lys Ser Leu
165 170 175
Ser Gln Gln Leu Asp Cys Pro Ala Gly Lys Ala Ala Gly Thr Ser Arg
180 185 190
Pro Thr Arg Ser Leu Ser Thr Ala Gln Leu Val Gln Pro Ser Gly Gly
195 200 205
Leu Gln Ala Ser Val Ile Ser Asn Ile Val Leu Met Lys Gly Gln Ala
210 215 220
Lys Gly Leu Gly Phe Ser Ile Val Gly Gly Lys Asp Ser Ile Tyr Gly
225 230 235 240
Pro Ile Gly Ile Tyr Val Lys Thr Ile Phe Ala Gly Gly Ala Ala Ala
245 250 255
Ala Asp Gly Arg Leu Gln Glu Gly Asp Glu Ile Leu Glu Leu Asn Gly
260 265 270
Glu Ser Met Ala Gly Leu Thr His Gln Asp Ala Leu Gln Lys Phe Lys
275 280 285
Gln Ala Lys Lys Gly Leu Leu Thr Leu Thr Val Arg Thr Arg Leu Thr
290 295 300
Ala Pro Pro Ser Leu Cys Ser His Leu Ser Pro Pro Leu Cys Arg Ser
305 310 315 320
Leu Ser Ser Ser Thr Cys Ile Thr Lys Asp Ser Ser Ser Phe Ala Leu
325 330 335
Glu Ser Pro Ser Ala Pro Ile Ser Thr Ala Lys Pro Asn Tyr Arg Ile
340 345 350
Met Val Glu Val Ser Leu Gln Lys Glu Ala Gly Val Gly Leu Gly Ile
355 360 365
Gly Leu Cys Ser Val Pro Tyr Phe Gln Cys Ile Ser Gly Ile Phe Val
370 375 380
His Thr Leu Ser Pro Gly Ser Val Ala His Leu Asp Gly Arg Leu Arg
385 390 395 400
Cys Gly Asp Glu Ile Val Glu Ile Ser Asp Ser Pro Val His Cys Leu
405 410 415
Thr Leu Asn Glu Val Tyr Thr Ile Leu Ser Arg Cys Asp Pro Gly Pro
420 425 430
Val Pro Ile Ile Val Ser Arg His Pro Asp Pro Gln Val Ser Glu Gln
435 440 445
Gln Leu Lys Glu Ala Val Ala Gln Ala Val Glu Asn Thr Lys Phe Gly
450 455 460
Lys Glu Arg His Gln Trp Ser Leu Glu Gly Val Lys Arg Leu Glu Ser
465 470 475 480
Ser Trp His Gly Arg Pro Thr Leu Glu Lys Glu Arg Glu Lys Asn Ser
485 490 495
Ala Pro Pro His Arg Arg Ala Gln Lys Val Met Ile Arg Ser Ser Ser
500 505 510
Asp Ser Ser Tyr Met Ser Gly Ser Pro Gly Gly Ser Pro Gly Ser Gly
515 520 525
Ser Ala Glu Lys Pro Ser Ser Asp Val Asp Ile Ser Thr His Ser Pro
530 535 540
Ser Leu Pro Leu Ala Arg Glu Pro Val Val Leu Ser Ile Ala Ser Ser
545 550 555 560
Arg Leu Pro Gln Glu Ser Pro Pro Leu Pro Glu Ser Arg Asp Ser His
565 570 575
Pro Pro Leu Arg Leu Lys Lys Ser Phe Glu Ile Leu Val Arg Lys Pro
580 585 590
Met Ser Ser Lys Pro Lys Pro Pro Pro Arg Lys Tyr Phe Lys Ser Asp
595 600 605
Ser Asp Pro Gln Lys Ser Leu Glu Glu Arg Glu Asn Ser Ser Cys Ser
610 615 620
Ser Gly His Thr Pro Pro Thr Cys Gly Gln Glu Ala Arg Glu Leu Leu
625 630 635 640
Pro Leu Leu Leu Pro Gln Glu Asp Thr Ala Gly Arg Ser Pro Ser Ala
645 650 655
Ser Ala Gly Cys Pro Gly Pro Gly Ile Gly Pro Gln Thr Lys Ser Ser
660 665 670
Thr Glu Gly Glu Pro Gly Trp Arg Arg Ala Ser Pro Val Thr Gln Thr
675 680 685
Ser Pro Ile Lys His Pro Leu Leu Lys Arg Gln Ala Arg Met Asp Tyr
690 695 700
Ser Phe Asp Thr Thr Ala Glu Asp Pro Trp Val Arg Ile Ser Asp Cys
705 710 715 720
Ile Lys Asn Leu Phe Ser Pro Ile Met Ser Glu Asn His Gly His Met
725 730 735
Pro Leu Gln Pro Asn Ala Ser Leu Asn Glu Glu Glu Gly Thr Gln Gly
740 745 750
His Pro Asp Gly Thr Pro Pro Lys Leu Asp Thr Ala Asn Gly Thr Pro
755 760 765
Lys Val Tyr Lys Ser Ala Asp Ser Ser Thr Val Lys Lys Gly Pro Pro
770 775 780
Val Ala Pro Lys Pro Ala Trp Phe Arg Gln Ser Leu Lys Gly Leu Arg
785 790 795 800
Asn Arg Ala Ser Asp Pro Arg Gly Leu Pro Asp Pro Ala Leu Ser Thr
805 810 815
Gln Pro Ala Pro Ala Ser Arg Glu His Leu Gly Ser His Ile Arg Ala
820 825 830
Ser Ser Ser Ser Ser Ser Ile Arg Gln Arg Ile Ser Ser Phe Glu Thr
835 840 845
Phe Gly Ser Ser Gln Leu Pro Asp Lys Gly Ala Gln Arg Leu Ser Leu
850 855 860
Gln Pro Ser Ser Gly Glu Ala Ala Lys Pro Leu Gly Lys His Glu Glu
865 870 875 880
Gly Arg Phe Ser Gly Leu Leu Gly Arg Gly Ala Ala Pro Thr Leu Val
885 890 895
Pro Gln Gln Pro Glu Gln Val Leu Ser Ser Gly Ser Pro Ala Ala Ser
900 905 910
Glu Ala Arg Asp Pro Gly Val Ser Glu Ser Pro Pro Pro Gly Arg Gln
915 920 925
Pro Asn Gln Lys Thr Leu Pro Pro Gly Pro Asp Pro Leu Leu Arg Leu
930 935 940
Leu Ser Thr Gln Ala Glu Glu Ser Gln Gly Pro Val Leu Lys Met Pro
945 950 955 960
Ser Gln Arg Ala Arg Ser Phe Pro Leu Thr Arg Ser Gln Ser Cys Glu
965 970 975
Thr Lys Leu Leu Asp Glu Lys Thr Ser Lys Leu Tyr Ser Ile Ser Ser
980 985 990
Gln Val Ser Ser Ala Val Met Lys Ser Leu Leu Cys Leu Pro Ser Ser
995 1000 1005
Ile Ser Cys Ala Gln Thr Pro Cys Ile Pro Lys Glu Gly Ala Ser
1010 1015 1020
Pro Thr Ser Ser Ser Asn Glu Asp Ser Ala Ala Asn Gly Ser Ala
1025 1030 1035
Glu Thr Ser Ala Leu Asp Thr Gly Phe Ser Leu Asn Leu Ser Glu
1040 1045 1050
Leu Arg Glu Tyr Thr Glu Gly Leu Thr Glu Ala Lys Glu Asp Asp
1055 1060 1065
Asp Gly Asp His Ser Ser Leu Gln Ser Gly Gln Ser Val Ile Ser
1070 1075 1080
Leu Leu Ser Ser Glu Glu Leu Lys Lys Leu Ile Glu Glu Val Lys
1085 1090 1095
Val Leu Asp Glu Ala Thr Leu Lys Gln Leu Asp Gly Ile His Val
1100 1105 1110
Thr Ile Leu His Lys Glu Glu Gly Ala Gly Leu Gly Phe Ser Leu
1115 1120 1125
Ala Gly Gly Ala Asp Leu Glu Asn Lys Val Ile Thr Val His Arg
1130 1135 1140
Val Phe Pro Asn Gly Leu Ala Ser Gln Glu Gly Thr Ile Gln Lys
1145 1150 1155
Gly Asn Glu Val Leu Ser Ile Asn Gly Lys Ser Leu Lys Gly Thr
1160 1165 1170
Thr His His Asp Ala Leu Ala Ile Leu Arg Gln Ala Arg Glu Pro
1175 1180 1185
Arg Gln Ala Val Ile Val Thr Arg Lys Leu Thr Pro Glu Ala Met
1190 1195 1200
Pro Asp Leu Asn Ser Ser Thr Asp Ser Ala Ala Ser Ala Ser Ala
1205 1210 1215
Ala Ser Asp Val Ser Val Glu Ser Thr Glu Ala Thr Val Cys Thr
1220 1225 1230
Val Thr Leu Glu Lys Met Ser Ala Gly Leu Gly Phe Ser Leu Glu
1235 1240 1245
Gly Gly Lys Gly Ser Leu His Gly Asp Lys Pro Leu Thr Ile Asn
1250 1255 1260
Arg Ile Phe Lys Gly Ala Ala Ser Glu Gln Ser Glu Thr Val Gln
1265 1270 1275
Pro Gly Asp Glu Ile Leu Gln Leu Gly Gly Thr Ala Met Gln Gly
1280 1285 1290
Leu Thr Arg Phe Glu Ala Trp Asn Ile Ile Lys Ala Leu Pro Asp
1295 1300 1305
Gly Pro Val Thr Ile Val Ile Arg Arg Lys Ser Leu Gln Ser Lys
1310 1315 1320
Glu Thr Thr Ala Ala Gly Asp Ser
1325 1330
<210> 75
<211> 155
<212> PRT
<213> Homo sapiens
<400> 75
Met Thr Pro Gly Lys Thr Ser Leu Val Ser Leu Leu Leu Leu Leu Ser
1 5 10 15
Leu Glu Ala Ile Val Lys Ala Gly Ile Thr Ile Pro Arg Asn Pro Gly
20 25 30
Cys Pro Asn Ser Glu Asp Lys Asn Phe Pro Arg Thr Val Met Val Asn
35 40 45
Leu Asn Ile His Asn Arg Asn Thr Asn Thr Asn Pro Lys Arg Ser Ser
50 55 60
Asp Tyr Tyr Asn Arg Ser Thr Ser Pro Trp Asn Leu His Arg Asn Glu
65 70 75 80
Asp Pro Glu Arg Tyr Pro Ser Val Ile Trp Glu Ala Lys Cys Arg His
85 90 95
Leu Gly Cys Ile Asn Ala Asp Gly Asn Val Asp Tyr His Met Asn Ser
100 105 110
Val Pro Ile Gln Gln Glu Ile Leu Val Leu Arg Arg Glu Pro Pro His
115 120 125
Cys Pro Asn Ser Phe Arg Leu Glu Lys Ile Leu Val Ser Val Gly Cys
130 135 140
Thr Cys Val Thr Pro Ile Val His His Val Ala
145 150 155
<210> 76
<211> 476
<212> PRT
<213> Homo sapiens
<400> 76
Arg Ala Val Pro Gly Gly Ser Ser Pro Ala Trp Thr Gln Cys Gln Gln
1 5 10 15
Leu Ser Gln Lys Leu Cys Thr Leu Ala Trp Ser Ala His Pro Leu Val
20 25 30
Gly His Met Asp Leu Arg Glu Glu Gly Asp Glu Glu Thr Thr Asn Asp
35 40 45
Val Pro His Ile Gln Cys Gly Asp Gly Cys Asp Pro Gln Gly Leu Arg
50 55 60
Asp Asn Ser Gln Phe Cys Leu Gln Arg Ile His Gln Gly Leu Ile Phe
65 70 75 80
Tyr Glu Lys Leu Leu Gly Ser Asp Ile Phe Thr Gly Glu Pro Ser Leu
85 90 95
Leu Pro Asp Ser Pro Val Gly Gln Leu His Ala Ser Leu Leu Gly Leu
100 105 110
Ser Gln Leu Leu Gln Pro Glu Gly His His Trp Glu Thr Gln Gln Ile
115 120 125
Pro Ser Leu Ser Pro Ser Gln Pro Trp Gln Arg Leu Leu Leu Arg Phe
130 135 140
Lys Ile Leu Arg Ser Leu Gln Ala Phe Val Ala Val Ala Ala Arg Val
145 150 155 160
Phe Ala His Gly Ala Ala Thr Leu Ser Pro Ile Trp Glu Leu Lys Lys
165 170 175
Asp Val Tyr Val Val Glu Leu Asp Trp Tyr Pro Asp Ala Pro Gly Glu
180 185 190
Met Val Val Leu Thr Cys Asp Thr Pro Glu Glu Asp Gly Ile Thr Trp
195 200 205
Thr Leu Asp Gln Ser Ser Glu Val Leu Gly Ser Gly Lys Thr Leu Thr
210 215 220
Ile Gln Val Lys Glu Phe Gly Asp Ala Gly Gln Tyr Thr Cys His Lys
225 230 235 240
Gly Gly Glu Val Leu Ser His Ser Leu Leu Leu Leu His Lys Lys Glu
245 250 255
Asp Gly Ile Trp Ser Thr Asp Ile Leu Lys Asp Gln Lys Glu Pro Lys
260 265 270
Asn Lys Thr Phe Leu Arg Cys Glu Ala Lys Asn Tyr Ser Gly Arg Phe
275 280 285
Thr Cys Trp Trp Leu Thr Thr Ile Ser Thr Asp Leu Thr Phe Ser Val
290 295 300
Lys Ser Ser Arg Gly Ser Ser Asp Pro Gln Gly Val Thr Cys Gly Ala
305 310 315 320
Ala Thr Leu Ser Ala Glu Arg Val Arg Gly Asp Asn Lys Glu Tyr Glu
325 330 335
Tyr Ser Val Glu Cys Gln Glu Asp Ser Ala Cys Pro Ala Ala Glu Glu
340 345 350
Ser Leu Pro Ile Glu Val Met Val Asp Ala Val His Lys Leu Lys Tyr
355 360 365
Glu Asn Tyr Thr Ser Ser Phe Phe Ile Arg Asp Ile Ile Lys Pro Asp
370 375 380
Pro Pro Lys Asn Leu Gln Leu Lys Pro Leu Lys Asn Ser Arg Gln Val
385 390 395 400
Glu Val Ser Trp Glu Tyr Pro Asp Thr Trp Ser Thr Pro His Ser Tyr
405 410 415
Phe Ser Leu Thr Phe Cys Val Gln Val Gln Gly Lys Ser Lys Arg Glu
420 425 430
Lys Lys Asp Arg Val Phe Thr Asp Lys Thr Ser Ala Thr Val Ile Cys
435 440 445
Arg Lys Asn Ala Ser Ile Ser Val Arg Ala Gln Asp Arg Tyr Tyr Ser
450 455 460
Ser Ser Trp Ser Glu Trp Ala Ser Val Pro Cys Ser
465 470 475
<210> 77
<211> 234
<212> PRT
<213> Homo sapiens
<400> 77
Met Cys Phe Pro Lys Val Leu Ser Asp Asp Met Lys Lys Leu Lys Ala
1 5 10 15
Arg Met Val Met Leu Leu Pro Thr Ser Ala Gln Gly Leu Gly Ala Trp
20 25 30
Val Ser Ala Cys Asp Thr Glu Asp Thr Val Gly His Leu Gly Pro Trp
35 40 45
Arg Asp Lys Asp Pro Ala Leu Trp Cys Gln Leu Cys Leu Ser Ser Gln
50 55 60
His Gln Ala Ile Glu Arg Phe Tyr Asp Lys Met Gln Asn Ala Glu Ser
65 70 75 80
Gly Arg Gly Gln Val Met Ser Ser Leu Ala Glu Leu Glu Asp Asp Phe
85 90 95
Lys Glu Gly Tyr Leu Glu Thr Val Ala Ala Tyr Tyr Glu Glu Gln His
100 105 110
Pro Glu Leu Thr Pro Leu Leu Glu Lys Glu Arg Asp Gly Leu Arg Cys
115 120 125
Arg Gly Asn Arg Ser Pro Val Pro Asp Val Glu Asp Pro Ala Thr Glu
130 135 140
Glu Pro Gly Glu Ser Phe Cys Asp Lys Val Met Arg Trp Phe Gln Ala
145 150 155 160
Met Leu Gln Arg Leu Gln Thr Trp Trp His Gly Val Leu Ala Trp Val
165 170 175
Lys Glu Lys Val Val Ala Leu Val His Ala Val Gln Ala Leu Trp Lys
180 185 190
Gln Phe Gln Ser Phe Cys Cys Ser Leu Ser Glu Leu Phe Met Ser Ser
195 200 205
Phe Gln Ser Tyr Gly Ala Pro Arg Gly Asp Lys Glu Glu Leu Thr Pro
210 215 220
Gln Lys Cys Ser Glu Pro Gln Ser Ser Lys
225 230
<210> 78
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 78
Met Ala Val Pro Met Gln Leu Ser Cys Ser Arg
1 5 10
<210> 79
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 79
Arg Ser Thr Gly
1
<210> 80
<211> 2
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 80
Thr Arg
1
<210> 81
<211> 3
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 81
Arg Ser Gln
1
<210> 82
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 82
Arg Ser Ala Gly Glu
1 5
<210> 83
<211> 2
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 83
Arg Ser
1
<210> 84
<211> 2
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 84
Gly Gly
1
<210> 85
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 85
Gly Ser Gly Gly Ser Gly Gly Ser Gly
1 5
<210> 86
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 86
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly
1 5 10
<210> 87
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 87
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly
1 5 10
<210> 88
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 88
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly
1 5 10 15
Gly
<210> 89
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 89
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly
1 5 10 15
Gly Ser Gly Gly
20
<210> 90
<211> 23
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 90
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly
1 5 10 15
Gly Ser Gly Gly Ser Gly Gly
20
<210> 91
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 91
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly
1 5 10 15
<210> 92
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 92
Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly
1 5 10 15
<210> 93
<211> 1872
<212> DNA
<213> Mycobacterium tuberculosis
<400> 93
gactacgttg gtgtagaaaa atcctgccgc ccggaccctt aaggctggga caatttctga 60
tagctacccc gacacaggag gttacgggat gagcaattcg cgccgccgct cactcaggtg 120
gtcatggttg ctgagcgtgc tggctgccgt cgggctgggc ctggccacgg cgccggccca 180
ggcggccccg ccggccttgt cgcaggaccg gttcgccgac ttccccgcgc tgcccctcga 240
cccgtccgcg atggtcgccc aagtggggcc acaggtggtc aacatcaaca ccaaactggg 300
ctacaacaac gccgtgggcg ccgggaccgg catcgtcatc gatcccaacg gtgtcgtgct 360
gaccaacaac cacgtgatcg cgggcgccac cgacatcaat gcgttcagcg tcggctccgg 420
ccaaacctac ggcgtcgatg tggtcgggta tgaccgcacc caggatgtcg cggtgctgca 480
gctgcgcggt gccggtggcc tgccgtcggc ggcgatcggt ggcggcgtcg cggttggtga 540
gcccgtcgtc gcgatgggca acagcggtgg gcagggcgga acgccccgtg cggtgcctgg 600
cagggtggtc gcgctcggcc aaaccgtgca ggcgtcggat tcgctgaccg gtgccgaaga 660
gacattgaac gggttgatcc agttcgatgc cgcgatccag cccggtgatt cgggcgggcc 720
cgtcgtcaac ggcctaggac aggtggtcgg tatgaacacg gccgcgtccg ataacttcca 780
gctgtcccag ggtgggcagg gattcgccat tccgatcggg caggcgatgg cgatcgcggg 840
ccagatccga tcgggtgggg ggtcacccac cgttcatatc gggcctaccg ccttcctcgg 900
cttgggtgtt gtcgacaaca acggcaacgg cgcacgagtc caacgcgtgg tcgggagcgc 960
tccggcggca agtctcggca tctccaccgg cgacgtgatc accgcggtcg acggcgctcc 1020
gatcaactcg gccaccgcga tggcggacgc gcttaacggg catcatcccg gtgacgtcat 1080
ctcggtgacc tggcaaacca agtcgggcgg cacgcgtaca gggaacgtga cattggccga 1140
gggacccccg gcctgatttc gtcgcggata ccacccgccg gccggccaat tggattggcg 1200
ccagccgtga ttgccgcgtg agcccccgag ttccgtctcc cgtgcgcgtg gcatcgtgga 1260
agcaatgaac gaggcagaac acagcgtcga gcaccctccc gtgcagggca gtcacgtcga 1320
aggcggtgtg gtcgagcatc cggatgccaa ggacttcggc agcgccgccg ccctgcccgc 1380
cgatccgacc tggtttaagc acgccgtctt ctacgaggtg ctggtccggg cgttcttcga 1440
cgccagcgcg gacggttccg gcgatctgcg tggactcatc gatcgcctcg actacctgca 1500
gtggcttggc atcgactgca tctggttgcc gccgttctac gactcgccgc tgcgcgacgg 1560
cggttacgac attcgcgact tctacaaggt gctgcccgaa ttcggcaccg tcgacgattt 1620
cgtcgccctg gtcgacgccg ctcaccggcg aggtatccgc atcatcaccg acctggtgat 1680
gaatcacacc tcggagtcgc acccctggtt tcaggagtcc cgccgcgacc cagacggacc 1740
gtacggtgac tattacgtgt ggagcgacac cagcgagcgc tacaccgacg cccggatcat 1800
cttcgtcgac accgaagagt cgaactggtc attcgatcct gtccgccgac agttctactg 1860
gcaccgattc tt 1872
<210> 94
<211> 396
<212> DNA
<213> Mycobacterium tuberculosis
<400> 94
acggccgcgt ccgataactt ccagctgtcc cagggtgggc agggattcgc cattccgatc 60
gggcaggcga tggcgatcgc gggccagatc cgatcgggtg gggggtcacc caccgttcat 120
atcgggccta ccgccttcct cggcttgggt gttgtcgaca acaacggcaa cggcgcacga 180
gtccaacgcg tggtcgggag cgctccggcg gcaagtctcg gcatctccac cggcgacgtg 240
atcaccgcgg tcgacggcgc tccgatcaac tcggccaccg cgatggcgga cgcgcttaac 300
gggcatcatc ccggtgacgt catctcggtg acctggcaaa ccaagtcggg cggcacgcgt 360
acagggaacg tgacattggc cgagggaccc ccggcc 396
<210> 95
<211> 702
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 95
catatgcatc accatcacca tcacacggcc gcgtccgata acttccagct gtcccagggt 60
gggcagggat tcgccattcc gatcgggcag gcgatggcga tcgcgggcca gatccgatcg 120
ggtggggggt cacccaccgt tcatatcggg cctaccgcct tcctcggctt gggtgttgtc 180
gacaacaacg gcaacggcgc acgagtccaa cgcgtggtcg ggagcgctcc ggcggcaagt 240
ctcggcatct ccaccggcga cgtgatcacc gcggtcgacg gcgctccgat caactcggcc 300
accgcgatgg cggacgcgct taacgggcat catcccggtg acgtcatctc ggtgacctgg 360
caaaccaagt cgggcggcac gcgtacaggg aacgtgacat tggccgaggg acccccggcc 420
gaattcgacg acgacgacaa ggatccacct gacccgcatc agccggacat gacgaaaggc 480
tattgcccgg gtggccgatg gggttttggc gacttggccg tgtgcgacgg cgagaagtac 540
cccgacggct cgttttggca ccagtggatg caaacgtggt ttaccggccc acagttttac 600
ttcgattgtg tcagcggcgg tgagcccctc cccggcccgc cgccaccggg tggttgcggt 660
ggggcaattc cgtccgagca gcccaacgct ccctgagaat tc 702
<210> 96
<211> 1746
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 96
catatgcatc accatcacca tcacacggcc gcgtccgata acttccagct gtcccagggt 60
gggcagggat tcgccattcc gatcgggcag gcgatggcga tcgcgggcca gatccgatcg 120
ggtggggggt cacccaccgt tcatatcggg cctaccgcct tcctcggctt gggtgttgtc 180
gacaacaacg gcaacggcgc acgagtccaa cgcgtggtcg ggagcgctcc ggcggcaagt 240
ctcggcatct ccaccggcga cgtgatcacc gcggtcgacg gcgctccgat caactcggcc 300
accgcgatgg cggacgcgct taacgggcat catcccggtg acgtcatctc ggtgacctgg 360
caaaccaagt cgggcggcac gcgtacaggg aacgtgacat tggccgaggg acccccggcc 420
gaattcccgc tggtgccgcg cggcagcccg atgggctccg acgttcggga cctgaacgca 480
ctgctgccgg cagttccgtc cctgggtggt ggtggtggtt gcgcactgcc ggttagcggt 540
gcagcacagt gggctccggt tctggacttc gcaccgccgg gtgcatccgc atacggttcc 600
ctgggtggtc cggcaccgcc gccggcaccg ccgccgccgc cgccgccgcc gccgcactcc 660
ttcatcaaac aggaaccgag ctggggtggt gcagaaccgc acgaagaaca gtgcctgagc 720
gcattcaccg ttcacttctc cggccagttc actggcacag ccggagcctg tcgctacggg 780
cccttcggtc ctcctccgcc cagccaggcg tcatccggcc aggccaggat gtttcctaac 840
gcgccctacc tgcccagctg cctcgagagc cagcccgcta ttcgcaatca gggttacagc 900
acggtcacct tcgacgggac gcccagctac ggtcacacgc cctcgcacca tgcggcgcag 960
ttccccaacc actcattcaa gcatgaggat cccatgggcc agcagggctc gctgggtgag 1020
cagcagtact cggtgccgcc cccggtctat ggctgccaca cccccaccga cagctgcacc 1080
ggcagccagg ctttgctgct gaggacgccc tacagcagtg acaatttata ccaaatgaca 1140
tcccagcttg aatgcatgac ctggaatcag atgaacttag gagccacctt aaagggccac 1200
agcacagggt acgagagcga taaccacaca acgcccatcc tctgcggagc ccaatacaga 1260
atacacacgc acggtgtctt cagaggcatt caggatgtgc gacgtgtgcc tggagtagcc 1320
ccgactcttg tacggtcggc atctgagacc agtgagaaac gccccttcat gtgtgcttac 1380
tcaggctgca ataagagata ttttaagctg tcccacttac agatgcacag caggaagcac 1440
actggtgaga aaccatacca gtgtgacttc aaggactgtg aacgaaggtt ttttcgttca 1500
gaccagctca aaagacacca aaggagacat acaggtgtga aaccattcca gtgtaaaact 1560
tgtcagcgaa agttctcccg gtccgaccac ctgaagaccc acaccaggac tcatacaggt 1620
gaaaagccct tcagctgtcg gtggccaagt tgtcagaaaa agtttgcccg gtcagatgaa 1680
ttagtccgcc atcacaacat gcatcagaga aacatgacca aactccagct ggcgctttga 1740
gaattc 1746
<210> 97
<211> 672
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 97
catatgcatc accatcacca tcacacggcc gcgtccgata acttccagct gtcccagggt 60
gggcagggat tcgccattcc gatcgggcag gcgatggcga tcgcgggcca gatccgatcg 120
ggtggggggt cacccaccgt tcatatcggg cctaccgcct tcctcggctt gggtgttgtc 180
gacaacaacg gcaacggcgc acgagtccaa cgcgtggtcg ggagcgctcc ggcggcaagt 240
ctcggcatct ccaccggcga cgtgatcacc gcggtcgacg gcgctccgat caactcggcc 300
accgcgatgg cggacgcgct taacgggcat catcccggtg acgtcatctc ggtgacctgg 360
caaaccaagt cgggcggcac gcgtacaggg aacgtgacat tggccgaggg acccccggcc 420
gaattcatcg agggaagggg ctctggctgc cccttattgg agaatgtgat ttccaagaca 480
atcaatccac aagtgtctaa gactgaatac aaagaacttc ttcaagagtt catagacgac 540
aatgccacta caaatgccat agatgaattg aaggaatgtt ttcttaacca aacggatgaa 600
actctgagca atgttgaggt gtttatgcaa ttaatatatg acagcagtct ttgtgattta 660
ttttaagaat tc 672
<210> 98
<211> 2191
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 98
atgcatcacc atcaccatca cacggccgcg tccgataact tccagctgtc ccagggtggg 60
cagggattcg ccattccgat cgggcaggcg atggcgatcg cgggccagat ccgatcgggt 120
ggggggtcac ccaccgttca tatcgggcct accgccttcc tcggcttggg tgttgtcgac 180
aacaacggca acggcgcacg agtccaacgc gtggtcggga gcgctccggc ggcaagtctc 240
ggcatctcca ccggcgacgt gatcaccgcg gtcgacggcg ctccgatcaa ctcggccacc 300
gcgatggcgg acgcgcttaa cgggcatcat cccggtgacg tcatctcggt gacctggcaa 360
accaagtcgg gcggcacgcg tacagggaac gtgacattgg ccgagggacc cccggccgaa 420
ttcatggtgg atttcggggc gttaccaccg gagatcaact ccgcgaggat gtacgccggc 480
ccgggttcgg cctcgctggt ggccgcggct cagatgtggg acagcgtggc gagtgacctg 540
ttttcggccg cgtcggcgtt tcagtcggtg gtctggggtc tgacggtggg gtcgtggata 600
ggttcgtcgg cgggtctgat ggtggcggcg gcctcgccgt atgtggcgtg gatgagcgtc 660
accgcggggc aggccgagct gaccgccgcc caggtccggg ttgctgcggc ggcctacgag 720
acggcgtatg ggctgacggt gcccccgccg gtgatcgccg agaaccgtgc tgaactgatg 780
attctgatag cgaccaacct cttggggcaa aacaccccgg cgatcgcggt caacgaggcc 840
gaatacggcg agatgtgggc ccaagacgcc gccgcgatgt ttggctacgc cgcggcgacg 900
gcgacggcga cggcgacgtt gctgccgttc gaggaggcgc cggagatgac cagcgcgggt 960
gggctcctcg agcaggccgc cgcggtcgag gaggcctccg acaccgccgc ggcgaaccag 1020
ttgatgaaca atgtgcccca ggcgctgcaa cagctggccc agcccacgca gggcaccacg 1080
ccttcttcca agctgggtgg cctgtggaag acggtctcgc cgcatcggtc gccgatcagc 1140
aacatggtgt cgatggccaa caaccacatg tcgatgacca actcgggtgt gtcgatgacc 1200
aacaccttga gctcgatgtt gaagggcttt gctccggcgg cggccgccca ggccgtgcaa 1260
accgcggcgc aaaacggggt ccgggcgatg agctcgctgg gcagctcgct gggttcttcg 1320
ggtctgggcg gtggggtggc cgccaacttg ggtcgggcgg cctcggtcgg ttcgttgtcg 1380
gtgccgcagg cctgggccgc ggccaaccag gcagtcaccc cggcggcgcg ggcgctgccg 1440
ctgaccagcc tgaccagcgc cgcggaaaga gggcccgggc agatgctggg cgggctgccg 1500
gtggggcaga tgggcgccag ggccggtggt gggctcagtg gtgtgctgcg tgttccgccg 1560
cgaccctatg tgatgccgca ttctccggca gccggcgata tcgccccgcc ggccttgtcg 1620
caggaccggt tcgccgactt ccccgcgctg cccctcgacc cgtccgcgat ggtcgcccaa 1680
gtggggccac aggtggtcaa catcaacacc aaactgggct acaacaacgc cgtgggcgcc 1740
gggaccggca tcgtcatcga tcccaacggt gtcgtgctga ccaacaacca cgtgatcgcg 1800
ggcgccaccg acatcaatgc gttcagcgtc ggctccggcc aaacctacgg cgtcgatgtg 1860
gtcgggtatg accgcaccca ggatgtcgcg gtgctgcagc tgcgcggtgc cggtggcctg 1920
ccgtcggcgg cgatcggtgg cggcgtcgcg gttggtgagc ccgtcgtcgc gatgggcaac 1980
agcggtgggc agggcggaac gccccgtgcg gtgcctggca gggtggtcgc gctcggccaa 2040
accgtgcagg cgtcggattc gctgaccggt gccgaagaga cattgaacgg gttgatccag 2100
ttcgatgccg cgatccagcc cggtgattcg ggcgggcccg tcgtcaacgg cctaggacag 2160
gtggtcggta tgaacacggc cgcgtcctag g 2191
<210> 99
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 99
caattacata tgcatcacca tcaccatcac acggccgcgt ccgataactt c 51
<210> 100
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 100
ctaatcgaat tcggccgggg gtccctcggc caa 33
<210> 101
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 101
caattagaat tcgacgacga cgacaaggat ccacctgacc cgcatcag 48
<210> 102
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 102
caattagaat tctcagggag cgttgggctg ctc 33
<210> 103
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 103
gcgaagctta tgaagttgct gatggtcctc atgc 34
<210> 104
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 104
cggctcgagt taaaataaat cacaaagact gctgtc 36
<210> 105
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 105
Met His His His His His His
1 5
<210> 106
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 106
Asp Asp Asp Lys
1
<210> 107
<211> 95
<212> PRT
<213> Homo sapiens
<400> 107
Met Cys Cys Thr Lys Ser Leu Leu Leu Ala Ala Leu Met Ser Val Leu
1 5 10 15
Leu Leu His Leu Cys Gly Glu Ser Glu Ala Ser Asn Phe Asp Cys Cys
20 25 30
Leu Gly Tyr Thr Asp Arg Ile Leu His Pro Lys Phe Ile Val Gly Phe
35 40 45
Thr Arg Gln Leu Ala Asn Glu Gly Cys Asp Ile Asn Ala Ile Ile Phe
50 55 60
His Thr Lys Lys Lys Leu Ser Val Cys Ala Asn Pro Lys Gln Thr Trp
65 70 75 80
Val Lys Tyr Ile Val Arg Leu Leu Ser Lys Lys Val Lys Asn Met
85 90 95
<210> 108
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 108
ggggtcaacg ttgagggggg 20
<210> 109
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 109
gggggacgat cgtcgggggg 20
<210> 110
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 110
ggggacgacg tcgtgggggg g 21
<210> 111
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 111
tccatgacgt tcctgatgct 20
<210> 112
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 112
tccatgacgt tcctgacgtt 20
<210> 113
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 113
tcgtcgtttt gtcgttttgt cgtt 24
<210> 114
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 114
tcgtcgttgt cgttttgtcg tt 22
<210> 115
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 115
tcgacgttcg tcgttcgtcg ttc 23
<210> 116
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 116
tcgcgacgtt cgcccgacgt tcggta 26
<210> 117
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 117
tcgtcgtttt cggcgcgcgc cg 22
<210> 118
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 118
tcgtcgtcgt tcgaacgacg ttgat 25
<210> 119
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 119
tcgcgaacgt tcgccgcgtt cgaacgcgg 29
Claims (51)
- 알파바이러스 표적 항원을 인코딩하는 서열을 포함하는 복제 결함성 바이러스 벡터를 포함하는 조성물.
- 제 1 항에 있어서, 알파바이러스 표적 항원을 인코딩하는 서열이 복수의 알파바이러스 표적 항원을 인코딩하는 서열을 포함하는 조성물.
- 제 2 항에 있어서, 복수의 알파바이러스 표적 항원을 인코딩하는 서열이 표적 항원에 각각 상응하는 복수의 유전자 삽입물을 포함하고, 각각의 유전자 삽입물이 자가-절단 2A 펩티드를 인코딩하는 핵산 서열에 의해 분리되어 있는 조성물.
- 제 3 항에 있어서, 자가-절단 2A 펩티드가 돼지 테스코바이러스-1 (Porcine teschovirus-1) 또는 토세아 아시그나 바이러스 (Thosea asigna virus) 에서 유래하는 조성물.
- 제 1 항 내지 제 4 항 중 어느 한 항에 있어서, 복제 결함성 바이러스 벡터가 아데노바이러스 벡터인 조성물.
- 제 1 항 내지 제 5 항 중 어느 한 항에 있어서, 복제 결함성 바이러스 벡터가 아데노바이러스 5 (Ad5) 벡터인 조성물.
- 제 1 항 내지 제 6 항 중 어느 한 항에 있어서, 복제 결함성 바이러스 벡터가 E1 유전자 부위, E2b 유전자 부위, E3 유전자 부위, E4 유전자 부위, 또는 그의 임의의 조합에서 결실을 갖는 아데노바이러스 벡터를 포함하는 조성물.
- 제 7 항에 있어서, E2b 유전자 부위에서의 결실은 E2b 부위에서의 복수의 결실을 포함하는 조성물.
- 제 7 항 또는 제 8 항에 있어서, E1 유전자 부위, E2b 유전자 부위, E3 유전자 부위, E4 유전자 부위, 또는 그의 임의의 조합에서의 결실이 각각 적어도 하나의 염기쌍을 포함하는 조성물.
- 제 7 항 내지 제 9 항 중 어느 한 항에 있어서, E1 유전자 부위, E2b 유전자 부위, E3 유전자 부위, E4 유전자 부위, 또는 그의 임의의 조합에서의 결실이 둘 이상의 염기쌍의 전좌로 인한 것인 조성물.
- 제 7 항 내지 제 10 항 중 어느 한 항에 있어서, E1 유전자 부위, E2b 유전자 부위, E3 유전자 부위, E4 유전자 부위, 또는 그의 임의의 조합에서의 결실이 각각 적어도 20 개, 적어도 30 개, 적어도 40 개, 적어도 50 개, 적어도 60 개, 적어도 70 개, 적어도 80 개, 적어도 90 개, 적어도 100 개, 적어도 110 개, 적어도 120 개, 적어도 130 개, 적어도 140 개, 또는 적어도 150 개의 염기쌍을 포함하는 조성물.
- 제 7 항 내지 제 11 항 중 어느 한 항에 있어서, E1 유전자 부위, E2b 유전자 부위, E3 유전자 부위, E4 유전자 부위, 또는 그의 임의의 조합에서의 결실이 각각 150 개 초과, 160 개 초과, 170 개 초과, 180 개 초과, 190 개 초과, 200 개 초과, 250 개 초과, 또는 300 개 초과의 염기쌍을 포함하는 조성물.
- 제 1 항 내지 제 12 항 중 어느 한 항에 있어서, 알파바이러스 표적 항원이 치쿤구니아 바이러스 (CHIKV), 오니옹니옹 바이러스 (ONNV), 로스 리버 바이러스 (RRV), 마야로 열 바이러스 (MAYV), 베네수엘라 말 뇌염 바이러스 (VEEV), 서부 말 뇌척수염 바이러스 (WEEV), 및 동부 말 뇌염 바이러스 (EEEV), 또는 그의 임의의 조합으로 이루어지는 군으로부터 선택되는 바이러스의 항원을 포함하는 조성물.
- 제 1 항 내지 제 13 항 중 어느 한 항에 있어서, 알파바이러스 표적 항원이 CHIKV, ONNV, RRV, 및 MAYV, 또는 그의 임의의 조합으로 이루어지는 군으로부터 선택되는 바이러스의 항원을 포함하는 조성물.
- 제 1 항 내지 제 14 항 중 어느 한 항에 있어서, 알파바이러스 표적 항원이 CHIKV 의 항원을 포함하는 조성물.
- 제 1 항 내지 제 15 항 중 어느 한 항에 있어서, 알파바이러스 표적 항원이 C, E3ALPHA, E2ALPHA, 6K, E1ALPHA, nsP1, nsP2, nsP3, 및 nsP4, 또는 그의 임의의 조합으로 이루어지는 군으로부터 선택되는 항원을 포함하는 조성물.
- 제 1 항 내지 제 16 항 중 어느 한 항에 있어서, 알파바이러스 표적 항원이 C, E3ALPHA, E2ALPHA, 6K, 및 E1ALPHA, 또는 그의 임의의 조합으로 이루어지는 군으로부터 선택되는 항원을 포함하는 조성물.
- 제 1 항 내지 제 17 항 중 어느 한 항에 있어서, 알파바이러스 표적 항원이 E1ALPHA 및 E2ALPHA, 또는 그의 임의의 조합으로 이루어지는 군으로부터 선택되는 항원을 포함하는 조성물.
- 제 1 항 내지 제 18 항 중 어느 한 항에 있어서, 알파바이러스 표적 항원을 인코딩하는 서열이 SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 20, 및 SEQ ID NO: 21, 또는 그의 임의의 조합으로 이루어지는 군으로부터 선택되는 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 92%, 적어도 95%, 적어도 97%, 또는 적어도 99% 서열 동일성을 포함하는 조성물.
- 제 1 항 내지 제 19 항 중 어느 한 항에 있어서, 알파바이러스 표적 항원을 인코딩하는 서열이 아미노산 서열이고, 아미노산 서열이 SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 20, 및 SEQ ID NO: 21, 또는 그의 임의의 조합으로 이루어지는 군으로부터 선택되는 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 92%, 적어도 95%, 적어도 97%, 또는 적어도 99% 서열 동일성을 포함하는 조성물.
- 제 1 항 내지 제 19 항 중 어느 한 항에 있어서, 알파바이러스 표적 항원을 인코딩하는 서열이 뉴클레오티드 서열이고, 뉴클레오티드 서열이 SEQ ID NO: 1, SEQ ID NO: 4, SEQ ID NO: 7, SEQ ID NO: 10, SEQ ID NO: 13, SEQ ID NO: 16, 및 SEQ ID NO: 19, 또는 그의 임의의 조합으로 이루어지는 군으로부터 선택되는 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 92%, 적어도 95%, 적어도 97%, 또는 적어도 99% 서열 동일성을 포함하는 조성물.
- 제 1 항 내지 제 19 항 중 어느 한 항에 있어서, 알파바이러스 표적 항원을 인코딩하는 서열이 SEQ ID NO: 1, SEQ ID NO: 2, 및 SEQ ID NO: 3, 또는 그의 임의의 조합으로 이루어지는 군으로부터 선택되는 서열에 대해 적어도 70%, 적어도 75%, 적어도 80% , 적어도 85%, 적어도 90%, 적어도 92%, 적어도 95%, 적어도 97%, 또는 적어도 99% 서열 동일성을 포함하는 조성물.
- 제 1 항 내지 제 22 항 중 어느 한 항에 있어서, 복제 결함성 바이러스 벡터가 알파바이러스 표적 항원의 발현을 증가시키는 요소를 추가로 포함하는 조성물.
- 제 23 항에 있어서, 요소가 적어도 1 개의 요소, 적어도 2 개의 요소, 적어도 3 개의 요소, 적어도 4 개의 요소, 또는 적어도 5 개의 요소를 포함하는 조성물.
- 제 23 항 또는 제 24 항에 있어서, 요소가 내부 리보솜 결합 부위를 포함하는 조성물.
- 제 23 항 내지 제 25 항 중 어느 한 항에 있어서, 요소가 구성적 프로모터를 포함하는 조성물.
- 제 23 항 내지 제 26 항 중 어느 한 항에 있어서, 요소가 유도성 프로모터를 포함하는 조성물.
- 제 23 항 내지 제 27 항 중 어느 한 항에 있어서, 요소가 전사 인핸서를 포함하는 조성물.
- 제 28 항에 있어서, 전사 인핸서가 라우스 육종 바이러스 (RSV) 인핸서인 조성물.
- 제 23 항 내지 제 29 항 중 어느 한 항에 있어서, 요소가 팔린드롬성 (palindromic) 서열을 함유하지 않는 조성물.
- 제 1 항 내지 제 30 항 중 어느 한 항에 있어서, 복제 결함성 바이러스 벡터가 알파바이러스 표적 항원 면역원성을 증가시키는 단백질을 인코딩하는 핵산 서열을 추가로 포함하는 조성물.
- 제 1 항 내지 제 31 항 중 어느 한 항에 있어서, 복제 결함성 바이러스 벡터가 거트 (gutted) 벡터가 아닌 조성물.
- 제 1 항 내지 제 32 항 중 어느 한 항에 있어서, 조성물 또는 복제 결함성 바이러스 벡터가 공동자극 분자 또는 면역학적 융합 파트너를 인코딩하는 서열을 추가로 포함하는 조성물.
- 제 33 항에 있어서, 공동자극 분자가 B7, ICAM-1, LFA-3, 또는 그의 임의의 조합을 포함하는 조성물.
- 제 1 항 내지 제 34 항 중 어느 한 항에 따른 조성물 및 약학적으로 허용가능한 담체를 포함하는 약학 조성물.
- 제 1 항 내지 제 34 항 중 어느 한 항에 따른 조성물 또는 제 35 항에 따른 약학 조성물을 포함하는 세포.
- 제 36 항에 있어서, 숙주 세포인 세포.
- 제 36 항 또는 제 37 항에 있어서, 수지상 세포 (DC) 인 세포.
- 제 1 항 내지 제 34 항 중 어느 한 항에 따른 조성물 또는 제 35 항에 따른 약학 조성물을 제조하는 것을 포함하는, 백신의 제조 방법.
- 대상에서 알파바이러스 표적 항원에 대한 면역 반응을 생성하는 방법으로서, 하기를 포함하는 방법:
제 1 항 내지 제 34 항 중 어느 한 항에 따른 조성물 또는 제 35 항에 따른 약학 조성물을 대상에게 투여하는 것. - 제 40 항에 있어서, 대상이 알파바이러스로 감염되지 않은 방법.
- 제 40 항 또는 제 41 항에 있어서, 알파바이러스 표적 항원이 알파바이러스로부터의 것이며, 알파바이러스가 치쿤구니아 바이러스 (CHIKV), 오니옹니옹 바이러스 (ONNV), 로스 리버 바이러스 (RRV), 마야로 열 바이러스 (MAYV), 베네수엘라 말 뇌염 바이러스 (VEEV), 서부 말 뇌척수염 바이러스 (WEEV), 동부 말 뇌염 바이러스 (EEEV), 또는 그의 임의의 조합을 포함하는 방법.
- 대상에서 치쿤구니아 바이러스 감염을 예방하는 방법으로서, 하기를 포함하는 조성물을 대상에게 투여하는 것을 포함하는 방법:
E2b 유전자 부위에서의 결실을 포함하는 복제 결함성 바이러스 벡터; 및
적어도 하나의 치쿤구니아 표적 항원을 인코딩하는 핵산 서열. - 제 40 항 내지 제 43 항 중 어느 한 항에 있어서, 대상이 아데노바이러스 또는 아데노바이러스 벡터에 대해 기존 면역성을 갖는 방법.
- 제 40 항 내지 제 44 항 중 어느 한 항에 있어서, 대상이 인간 또는 비-인간 동물인 방법.
- 제 40 항 내지 제 45 항 중 어느 한 항에 있어서, 투여가 정맥내, 피하, 림프선내, 종양내, 피부내, 근육내, 복강내, 직장내, 질내, 비강내, 경구, 방광 점적주입, 또는 난절법 (scarification) 을 통한 것인 방법.
- 제 40 항 내지 제 46 항 중 어느 한 항에 있어서, 대상에게 조성물을 투여하는 것이 적어도 1 회이거나, 적어도 2 회 반복되거나, 또는 적어도 3 회 반복되는 방법.
- 제 40 항 내지 제 47 항 중 어느 한 항에 있어서, 대상에게 투여하는 것이 용량 당 1x109 내지 5x1012 바이러스 입자를 포함하는 방법.
- 제 40 항 내지 제 48 항 중 어느 한 항에 있어서, 대상에게 투여하는 것이 용량 당 적어도 109 바이러스 입자, 적어도 1010 바이러스 입자, 또는 적어도 1011 바이러스 입자를 포함하는 방법.
- 제 40 항 내지 제 49 항 중 어느 한 항에 있어서, 복제 결함성 바이러스 벡터가 아데노바이러스 벡터인 방법.
- 제 40 항 내지 제 50 항 중 어느 한 항에 있어서, 복제 결함성 바이러스 벡터가 아데노바이러스 5 (Ad5) 벡터인 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662363136P | 2016-07-15 | 2016-07-15 | |
US62/363,136 | 2016-07-15 | ||
PCT/US2017/042272 WO2018014008A1 (en) | 2016-07-15 | 2017-07-14 | Compositions and methods for alphavirus vaccination |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20190031266A true KR20190031266A (ko) | 2019-03-25 |
Family
ID=60952221
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197004334A KR20190031266A (ko) | 2016-07-15 | 2017-07-14 | 알파바이러스 백신접종을 위한 조성물 및 방법 |
Country Status (8)
Country | Link |
---|---|
US (1) | US11104916B2 (ko) |
EP (1) | EP3484508A4 (ko) |
JP (1) | JP6903120B2 (ko) |
KR (1) | KR20190031266A (ko) |
CN (1) | CN109803677A (ko) |
AU (1) | AU2017297610B2 (ko) |
CA (2) | CA3206542A1 (ko) |
WO (1) | WO2018014008A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023027562A1 (ko) * | 2021-08-27 | 2023-03-02 | 한국과학기술원 | 신종 코로나바이러스 감염증 대응 예방 백신 조성물 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110520436A (zh) | 2017-03-15 | 2019-11-29 | 潘迪恩治疗公司 | 靶向免疫耐受性 |
AU2018273914A1 (en) | 2017-05-24 | 2019-11-14 | Pandion Operations, Inc. | Targeted immunotolerance |
WO2019016756A1 (en) * | 2017-07-21 | 2019-01-24 | Glaxosmithkline Biologicals Sa | ANTIGEN CONSTRUCTS OF CHIKUNGUNYA VIRUSES |
US10174091B1 (en) | 2017-12-06 | 2019-01-08 | Pandion Therapeutics, Inc. | IL-2 muteins |
US10946068B2 (en) | 2017-12-06 | 2021-03-16 | Pandion Operations, Inc. | IL-2 muteins and uses thereof |
WO2019147921A1 (en) * | 2018-01-26 | 2019-08-01 | Nantcell, Inc. | Rapid verification of virus particle production for a personalized vaccine |
CN109536464B (zh) * | 2018-12-10 | 2022-06-10 | 中国科学院武汉病毒研究所 | 一种缺失衣壳蛋白基因的基孔肯雅病毒感染性克隆及构建方法和在制备减毒疫苗中的应用 |
CN109806390A (zh) * | 2019-01-07 | 2019-05-28 | 康希诺生物股份公司 | 一种SamRNA疫苗及其制备方法 |
US20220218789A1 (en) * | 2019-05-10 | 2022-07-14 | Nant Holdings Ip, Llc | Nogapendekin Alfa-Inbakicept For Immune Stimulant Therapies And Treatment Of Viral Infections |
BR112021023345A2 (pt) | 2019-05-20 | 2022-02-01 | Pandion Operations Inc | Imunotolerância com alvo em madcam |
PE20221182A1 (es) | 2019-11-18 | 2022-08-05 | Janssen Biotech Inc | Vacunas basadas en calr y jak2 mutantes y sus usos |
WO2021168079A1 (en) | 2020-02-21 | 2021-08-26 | Pandion Operations, Inc. | Tissue targeted immunotolerance with a cd39 effector |
US11857620B2 (en) * | 2020-03-11 | 2024-01-02 | Immunitybio, Inc. | Method of inducing immunity against SARS-CoV-2 using spike (s) and nucleocapsid (N)-ETSD immunogens delivered by a replication-defective adenovirus |
WO2024059501A1 (en) * | 2022-09-15 | 2024-03-21 | University Of Florida Research Foundation, Inc. | Assays for detection of mayaro virus and methods of detection thereof |
CN117964722B (zh) * | 2024-01-31 | 2024-10-22 | 扬州优邦生物药品有限公司 | 一种预防猪盖他病毒的病毒样颗粒疫苗及其制备方法 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69920192T2 (de) * | 1998-03-27 | 2005-09-29 | The Secretary Of State For Defence, Salisbury | Rekombinantes virus |
ATE497010T1 (de) | 2005-12-12 | 2011-02-15 | Canji Inc | Adenovirale expressionsvektoren mit einer expressionskassette im e1-bereich und einer inaktivierten e2b-polymerase |
CA2545597A1 (en) * | 2006-03-15 | 2007-09-15 | Institut Pasteur | Novel isolated and purified strains of chikungunya virus and polynucleotides and polypeptides sequences, diagnostic and immunogenical uses thereof |
DK2170384T3 (en) * | 2007-07-02 | 2016-07-25 | Etubics Corp | METHODS AND COMPOSITIONS FOR THE PRODUCTION OF AN adenovirus vector for use in higher vaccination |
US9605276B2 (en) * | 2012-08-24 | 2017-03-28 | Etubics Corporation | Replication defective adenovirus vector in vaccination |
EP2712871A1 (en) * | 2012-09-27 | 2014-04-02 | Institut Pasteur | Recombinant Measles virus expressing Chikungunya virus polypeptides and their applications |
WO2014093602A1 (en) | 2012-12-14 | 2014-06-19 | Profectus Biosciences, Inc. | Compositions and methods for treating and preventing hepatitis c virus infection |
US9364523B2 (en) | 2014-03-17 | 2016-06-14 | Tapimmune Inc. | Chimeric nucleic acid molecule with non-AUG translation initiation sequences |
EP3140401A2 (en) | 2014-05-04 | 2017-03-15 | Forrest Innovations Ltd. | Compositions for mosquito control and uses of same |
WO2016086980A1 (en) * | 2014-12-02 | 2016-06-09 | Consejo Superior De Investigaciones Cientificas | Vaccine composition |
CA2973109A1 (en) | 2015-01-09 | 2016-07-14 | Etubics Corporation | Methods and compositions for ebola virus vaccination |
CN113456812B (zh) * | 2015-01-09 | 2024-08-20 | 埃图比克斯公司 | 用于联合免疫治疗的方法和组合物 |
US10166281B2 (en) * | 2015-09-04 | 2019-01-01 | Vlp Therapeutics, Llc | Method and composition for modulating immune response |
-
2017
- 2017-07-14 KR KR1020197004334A patent/KR20190031266A/ko not_active Application Discontinuation
- 2017-07-14 CN CN201780054911.4A patent/CN109803677A/zh active Pending
- 2017-07-14 CA CA3206542A patent/CA3206542A1/en active Pending
- 2017-07-14 JP JP2019501689A patent/JP6903120B2/ja active Active
- 2017-07-14 US US16/317,747 patent/US11104916B2/en active Active
- 2017-07-14 EP EP17828595.3A patent/EP3484508A4/en active Pending
- 2017-07-14 AU AU2017297610A patent/AU2017297610B2/en active Active
- 2017-07-14 CA CA3030451A patent/CA3030451C/en active Active
- 2017-07-14 WO PCT/US2017/042272 patent/WO2018014008A1/en unknown
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023027562A1 (ko) * | 2021-08-27 | 2023-03-02 | 한국과학기술원 | 신종 코로나바이러스 감염증 대응 예방 백신 조성물 |
Also Published As
Publication number | Publication date |
---|---|
CA3206542A1 (en) | 2018-01-18 |
CA3030451C (en) | 2023-09-05 |
US11104916B2 (en) | 2021-08-31 |
WO2018014008A1 (en) | 2018-01-18 |
AU2017297610A1 (en) | 2019-01-31 |
CA3030451A1 (en) | 2018-01-18 |
EP3484508A4 (en) | 2020-03-25 |
US20200172925A1 (en) | 2020-06-04 |
CN109803677A (zh) | 2019-05-24 |
JP2019521148A (ja) | 2019-07-25 |
JP6903120B2 (ja) | 2021-07-14 |
AU2017297610B2 (en) | 2020-03-12 |
EP3484508A1 (en) | 2019-05-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20190031266A (ko) | 알파바이러스 백신접종을 위한 조성물 및 방법 | |
DK2155243T3 (en) | Compositions and methods comprising KLK3, PSCA, or antigen FOLH1 | |
CN109843323B (zh) | 用于黄病毒疫苗接种的组合物和方法 | |
AU2013295647B2 (en) | Multimeric fusion protein vaccine and immunotherapeutic | |
Stone et al. | Multimeric soluble CD40 ligand and GITR ligand as adjuvants for human immunodeficiency virus DNA vaccines | |
JP5148116B2 (ja) | 癌胎児性抗原融合タンパク質及びその使用 | |
KR20190082850A (ko) | 반복되는 암 돌연변이를 표적화하는 면역원 조성물 및 그것의 사용 방법 | |
KR20180026670A (ko) | 맞춤형 전달 벡터-기반의 면역 요법 및 이의 용도 | |
Drew et al. | Humoral immune responses to DNA vaccines expressing secreted, membrane bound and non-secreted forms of the: Taenia ovis 45W antigen | |
JPH07507688A (ja) | ジフテリア毒素ワクチン | |
KR20110088526A (ko) | 구제역 백신 조성물 및 이의 제조 방법 | |
JP2000503325A (ja) | クラミジア感染に対するdna免疫法 | |
KR20020068040A (ko) | 키메라 면역원성 조성물 및 그들을 암호화하는 핵산 | |
JP2023539454A (ja) | 免疫刺激細菌ベースのワクチン、治療薬およびrnaデリバリープラットフォーム | |
KR20230019450A (ko) | 캡슐화된 rna 레플리콘 및 사용 방법 | |
KR20200001671A (ko) | 중증 열성 혈소판 감소 증후군(sfts) 바이러스 감염 질환 예방 또는 치료용 백신 조성물 | |
JP2022536850A (ja) | B型肝炎ウイルス(hbv)ワクチンおよび抗pd-1または抗pd-l1抗体の組合せ | |
KR102553857B1 (ko) | 신규 핵산 분자 | |
JP2024537847A (ja) | COVID19 mRNAワクチン | |
Lobaina et al. | Obtaining HBV core protein VLPs carrying SARS-CoV-2 nucleocapsid conserved fragments as vaccine candidates | |
CN118272396A (zh) | 用于预防或治疗hpv感染相关疾病的多核苷酸分子 | |
JP2014506880A (ja) | 抗原性gly1ポリペプチド | |
Vatakis | Rational design of DNA epitope vaccines | |
MXPA02003986A (en) | Chimeric immunogenic compositions and nucleic acids encoding them |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |