KR20100019423A - 백신에 유용한 약독화 바이러스 - Google Patents
백신에 유용한 약독화 바이러스 Download PDFInfo
- Publication number
- KR20100019423A KR20100019423A KR1020097022782A KR20097022782A KR20100019423A KR 20100019423 A KR20100019423 A KR 20100019423A KR 1020097022782 A KR1020097022782 A KR 1020097022782A KR 20097022782 A KR20097022782 A KR 20097022782A KR 20100019423 A KR20100019423 A KR 20100019423A
- Authority
- KR
- South Korea
- Prior art keywords
- virus
- influenza
- codon
- attenuated
- attenuated virus
- Prior art date
Links
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
- A61K39/125—Picornaviridae, e.g. calicivirus
- A61K39/13—Poliovirus
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N7/00—Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
- A61K39/145—Orthomyxoviridae, e.g. influenza virus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
- A61P31/16—Antivirals for RNA viruses for influenza or rhinoviruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
- A61P31/18—Antivirals for RNA viruses for HIV
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/20—Antivirals for DNA viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/20—Antivirals for DNA viruses
- A61P31/22—Antivirals for DNA viruses for herpes viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
- A61P37/02—Immunomodulators
- A61P37/04—Immunostimulants
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/51—Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
- A61K2039/525—Virus
- A61K2039/5254—Virus avirulent or attenuated
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2720/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsRNA viruses
- C12N2720/00011—Details
- C12N2720/12011—Reoviridae
- C12N2720/12311—Rotavirus, e.g. rotavirus A
- C12N2720/12361—Methods of inactivation or attenuation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2740/00—Reverse transcribing RNA viruses
- C12N2740/00011—Details
- C12N2740/10011—Retroviridae
- C12N2740/15011—Lentivirus, not HIV, e.g. FIV, SIV
- C12N2740/15061—Methods of inactivation or attenuation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/16011—Orthomyxoviridae
- C12N2760/16061—Methods of inactivation or attenuation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/16011—Orthomyxoviridae
- C12N2760/16111—Influenzavirus A, i.e. influenza A virus
- C12N2760/16121—Viruses as such, e.g. new isolates, mutants or their genomic sequences
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/16011—Orthomyxoviridae
- C12N2760/16111—Influenzavirus A, i.e. influenza A virus
- C12N2760/16134—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/16011—Orthomyxoviridae
- C12N2760/16111—Influenzavirus A, i.e. influenza A virus
- C12N2760/16161—Methods of inactivation or attenuation
- C12N2760/16162—Methods of inactivation or attenuation by genetic engineering
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/20011—Coronaviridae
- C12N2770/20061—Methods of inactivation or attenuation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/24011—Flaviviridae
- C12N2770/24111—Flavivirus, e.g. yellow fever virus, dengue, JEV
- C12N2770/24161—Methods of inactivation or attenuation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/32011—Picornaviridae
- C12N2770/32061—Methods of inactivation or attenuation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/32011—Picornaviridae
- C12N2770/32611—Poliovirus
- C12N2770/32621—Viruses as such, e.g. new isolates, mutants or their genomic sequences
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/32011—Picornaviridae
- C12N2770/32611—Poliovirus
- C12N2770/32634—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/32011—Picornaviridae
- C12N2770/32611—Poliovirus
- C12N2770/32661—Methods of inactivation or attenuation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/32011—Picornaviridae
- C12N2770/32611—Poliovirus
- C12N2770/32661—Methods of inactivation or attenuation
- C12N2770/32662—Methods of inactivation or attenuation by genetic engineering
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/32011—Picornaviridae
- C12N2770/32611—Poliovirus
- C12N2770/32671—Demonstrated in vivo effect
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/32011—Picornaviridae
- C12N2770/32711—Rhinovirus
- C12N2770/32721—Viruses as such, e.g. new isolates, mutants or their genomic sequences
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/32011—Picornaviridae
- C12N2770/32711—Rhinovirus
- C12N2770/32761—Methods of inactivation or attenuation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/32011—Picornaviridae
- C12N2770/32711—Rhinovirus
- C12N2770/32761—Methods of inactivation or attenuation
- C12N2770/32762—Methods of inactivation or attenuation by genetic engineering
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Virology (AREA)
- Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Veterinary Medicine (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Engineering & Computer Science (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Molecular Biology (AREA)
- Oncology (AREA)
- Communicable Diseases (AREA)
- Genetics & Genomics (AREA)
- Epidemiology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Mycology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Pulmonology (AREA)
- Biophysics (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Tropical Medicine & Parasitology (AREA)
- AIDS & HIV (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
Abstract
본 발명은 게놈 내 다수 위치에서 조작된 뉴클레오티드 치환을 가지는 변형된 바이러스 게놈을 포함하는 약독화 바이러스로서, 상기 치환이 동의 역최적화 코돈을 게놈 내에 도입하는 것인 약독화 바이러스를 제공한다. 본 약독화 바이러스는 피험체에서 보호 면역 반응을 유발하기 위한 백신 조성물에 사용될 수 있다. 본 발명은 또한 본 약독화 바이러스의 합성 방법도 제공한다. 또한, 본 발명은 피험체에게 본 약독화 바이러스를 포함하는 예방적 유효량의 백신 조성물을 투여하는 단계를 포함하는, 피험체가 바이러스 관련 질환을 앓게 되는 것을 예방하는 방법을 추가로 제공한다.
Description
관련 출원에 대한 상호 참조
본원은 전문이 본원에 각기 참조 인용되는, 미국 특허 출원 제60/909,389호(2007년 3월 30일 출원) 및 미국 특허 출원 제61/068,666호(2008년 3월 7일 출원)에 대해 우선권을 주장한다.
연방 자금지원
본 발명은, 미국립보건원으로부터 승인 번호 제AI15122호 하에, 미국립과학재단으로부터 EIA0325123 하에, 또한 미국립암연구소로부터 T32-CA009176 하에 미정부 지지를 받아 이루어졌다. 따라서, 미정부는 본 발명에 있어 일부 권리를 가진다.
저작권 공고
본 특허 문헌의 개시내용의 일부는 저작권 보호의 대상이 되는 요지를 포함한다. 저작권 소유자는, 미특허상표청 특허 파일 또는 기록에 나와 있을 때, 특허 문헌 또는 특허 개시내용이 혹자에 의해서 팩스로 재현됨에 대해 이의를 제기하지 않으나, 그와 다른 방식으로는 일체의 모든 저작권 권리를 보유한다.
기술 분야
본 발명은 복수개의 뉴클레오티드 치환을 가지는 변형된 바이러스 게놈을 포 함하는 약독화 바이러스의 생성에 관한 것이다. 뉴클레오티드 치환은 코돈의 다른 동의 코돈으로의 교환 및/또는 코돈 재배열 및 코돈 쌍 편향(codon pair bias)의 변화를 초래한다.
DNA 합성 기술에 있어서의 급진적 향상은 분명 바이러스학에 이용되는 종래 방법을 혁신하게 될 것이다. 바이러스 게놈의 상이한 영역의 기능을 제거하는 데 종래 사용되는 방법들 중 하나는, 바이러스 균주의 게놈 내 작은 서열 변화의 영향을 탐색하기 위해 부위 지정 돌연변이유발을 광대하나 수고스럽게도 사용한다. 그러나, 바이러스 게놈, 특히 RNA 바이러스의 바이러스 게놈은 비교적 작은데, 종종 10,000개 미만의 염기 길이를 가지며, 이에 따라 현재 이용 가능한 기술을 이용하는 전체 게놈 합성에 순응적이다. 최근 개발된 마이크로유체 칩 기반 기술은, 각기 수백 달러만으로 사양에 맞게 설계되는 새 게놈의 신생 합성(de novo synthesis)을 수행할 수 있다. 이는 전체적으로 신규한 코딩 서열을 생성하도록 하거나, 현존 서열을 종래 클로닝 방법으로는 실제로 불가능했던 정도까지 조절하도록 한다.
설계의 그러한 자유는, (1) 바이러스 번역 및 복제 효율에 대한 코돈 편향, 코돈 쌍 편향 및 RNA 2차 구조와 같은 파라미터들의 변화의 영향을 연구하고; (2) 성공적인 바이러스 재생에 필요한 미지의 조절 요소 및 기타 신호를 위한, 효율적 완전 게놈 스캔을 수행하며; (3) 바이러스 균주의 유전적 조작 및 항바이러스 백신의 설계를 위한 신규 생물공학을 발달시키기 위해, DNA/RNA 코딩 서열의 대규모 재설계를 수행하도록 하는 거대한 추진력을 제공한다.
유전 암호 축퇴성의 결과로서, 단백질 코딩 서열 내 2개의 아미노산을 제외한 모든 것은 하나 초과의 코돈에 의해 코딩될 수 있다. 그러한 동의 코돈이 사용되는 빈도는 동일하지 않고, 드물거나 다른 경우에서라면 불리하게 되는 tRNA에 종종 상응하는 차선적 코돈의 과다 사용을 피하기 위해 세포의 번역 기구와 공진화하였다(coevolved)(문헌 [Gustafsson et al., 2004]). 이는 "동의 코돈 편향"으로 칭해지는 현상을 초래하는데, 이 현상은 진화적으로 거리가 있는 종들 간에, 또한 가능하게는 동일한 종 내 상이한 조직들 간에 크게 다양하다(문헌 [Plotkin et al., 2004]).
재조합 방법에 의한 코돈 최적화(즉, 유전자의 동의 코돈 사용빈도(codon usage)를 숙주 세포의 코돈 편향에 상응하도록 함)는 교차-종 발현을 향상시키기 위해 널리 사용되어 왔다(예를 들어, 문헌 [Gustafsson et al., 2004] 참조). 차선적 동의 코돈을 의도적으로 도입함으로써 발현을 감소시키는 반대 목적이 심의 연구되지는 않았으나, 별도의 보고는 희소 코돈에 의한 천연 코돈의 치환이 상이한 생물체들에서의 유전자 발현 수준을 감소시킬 수 있음을 가리킨다. 예를 들어, 문헌 [Robinson et al., 1984]; 문헌 [Hoekema et al., 1987]; 문헌 [Carlini and Stephan, 2003]; 문헌 [Zhou et al., 1999]을 참조한다. 따라서, 역최적화 동의 코돈(deoptimized synonymous codon)이 바이러스 게놈 내로 도입됨은 단백질 번역에 부정적 영향을 줄 수 있고, 이에 의해 바이러스성 질환에 대항하는 백신을 제조하는 데 유용할 약독화 바이러스를 생성하는 생성 방법을 제공한다.
바이러스성 질환 및 백신
바이러스는 항상 인간에서의 사망 및 질환의 주요 원인들 중 하나였다. 세균성 질환과 달리, 바이러스성 질환은 항생제가 잘 듣지 않아, 치료하기 어렵다. 따라서, 백신접종이 바이러스에 저항한 인류의 주되고 가장 강한 방어책이었다. 오늘날, 가장 오래되고 가장 심각한 바이러스성 질환들 중 일부, 예컨대 천연두 및 급성 회백수염(소아마비)가 전세계적 면역화 프로그램에 의해 근절되어(또는 거의 근절되어) 왔다. 그러나, 다른 많은 오랜 바이러스들, 예컨대 리노바이러스 및 인플루엔자 바이러스는 잘 억제되지 않고, 여전히 실질적 문제들을 발생시키는데, 이들 문제는 해를 거듭할수록, 또한 국가별로 다양하다. 부가적으로, 새 바이러스, 예컨대 인간 면역결핍 바이러스(HIV) 및 중증 급성 호흡기 증후군(SARS) 바이러스가 인간 집단에서 정규적으로 나타나고, 종종 치명적 전염병을 유발한다. 또한, 인간에 의해 제조되거나 인간에 의해 변경된 치명적 바이러스가 전쟁 또는 테러의 수단으로서 의도적으로 도입될 가능성이 있다.
백신의 효과적 제조가 예측 불가능한 과업으로 남아 있다. 백신에는 3가지 주된 종류가 있는데, 이는 즉, 서브유닛 백신, 불활성화된(사멸된) 백신 및 약독화 생백신이다. 서브유닛 백신의 경우, 바이러스로부터의 하나 또는 수가지의 단백질(예를 들어, 재조합 DNA 기술을 이용하에 제조된 캡시드 단백질)이 백신으로 사용된다. 에쉐리키아 콜라이(Escherichia coli) 또는 효모에서 생성된 서브유닛 백신이 매우 안전하고, 바이러스성 질환의 위협도 주지 않는다. 그러나, 면역원성 바이러스 단백질 모두가 존재하는 것도 아니고 존재하는 것들도 이들의 본래 형태로 존재하지 않을 수 있기 때문에, 상기 백신들의 효능은 낮을 수 있다.
불활성화된(사멸된) 백신은 다소 야생형(wt)인 바이러스를 증식시킨 후, 그것을 예를 들어 (소크(Salk) 소아마비 백신에서와 같이) 포름알데히드로 불활성화함으로써 제조된다. 바이러스 모두를 사멸시키나 입자의 면역원성은 저해하지 않는 불활성화 처리법을 찾기 위해서는 상당의 실험이 요해진다. 부가적으로, 바이러스를 증식시키는 시설이 독성 바이러스가 빠져나가도록 할 수 있거나, 불활성화가 실패할 수 있다는 나머지 안전 과제가 남아 있다.
약독화 생백신은, 돌연변이가 일어나도록 하여 덜 독성이도록 한 것이면서 면역화를 위해 사용가능한 바이러스를 포함한다. 약독화 생바이러스는 백신과 같이 많은 이점들을 가지는데: 즉, 이는 종종 제조하기 용이하고 빠르고 저렴하며; 종종 투여하기 용이하며(예를 들어, 세이빈(Sabin) 소아마비 백신은 각설탕을 통해 경구 투여됨); 때때로 약독화 바이러스의 잔여 증식은 "군집" 면역화(일차 환자와 근접하게 접촉된 사람들의 면역화)를 허용한다. 이 이점들은 특히 백신이 조속히 필요한 긴급상황에 중요하다. 약독화 백신의 주요 결점은, 그것이 wt 독성(virulence)으로의 복귀(reversion) 빈도가 다소 상당하다는 점이다. 이러한 이유로, 세이빈 백신이 미국에서는 더 이상 사용되지 않는다.
따라서, 복귀 가능성이 실제로 없고, 이에 따라 백신을 제조하기에 빠르고 효율적이며 안전한 방법을 제공하는 약독화 생바이러스의 계통적 생성 방법에 대한 필요성이 여전히 존재한다. 본 발명은 수백개 또는 수천개의 작은 결손들을 가지고 있기 때문에 복귀 가능성이 본질적으로 가지고 있지 않은 약독화 생바이러스를 생성하기 위한 계통적 방법인 합성 약독화 바이러스 조작(SAVE)을 제공함으로써, 상 기 필요성을 충족한다. 이 방법은 다종 다양한 바이러스들에 광범위하게 적용 가능하고, 다종 다양한 항바이러스 백신을 제조하기 위한 효과적 방법을 제공한다.
발명의 개요
본 발명은, 게놈 내 다수 위치에서 조작된 뉴클레오티드 치환을 가지는 변형된 바이러스 게놈을 포함하는 약독화 바이러스로서, 상기 치환이 동의 역최적화 코돈을 게놈 내에 도입하는 것인 약독화 바이러스를 제공한다. 이러한 동의 코돈의 치환은 게놈 내의 코돈 편향, 코돈 쌍 편향, 역최적화 코돈 및 역최적화 코돈 쌍의 밀도, RNA 2차 구조, CpG 디뉴클레오티드 함량, C+G 함량, 번역 틀이동 부위, 번역 휴지 부위, 조직 특이적 마이크로RNA 인식 서열의 존재 또는 부재, 또는 이들의 조합을 포함한 각종 파라미터들을 변경시킨다. 본 발명의 약독화 바이러스는 관련된 다수의 결손으로 인해, 매우 다양한 바이러스성 질환들에 대항한 안정하게 약독화된 생백신을 생성하는 수단을 제공한다.
한 실시양태에서, 모(parent) 바이러스의 상응하는 서열과 동일한, 바이러스 단백질을 코딩하는 핵산 서열 또는 이의 일부를 포함하는 약독화 바이러스가 제공되는데, 여기에서 약독화 바이러스의 뉴클레오티드 서열은 유래의 기원이 되는 모 서열의 코돈을 가지고, 뉴클레오티드 서열은 모 바이러스의 뉴클레오티드 서열과 90% 미만 동일하다. 또 다른 실시양태에서, 뉴클레오티드 서열은 모 바이러스의 서열과 80% 미만 동일하다. 약독화를 제공하는 치환된 뉴클레오티드 서열은 100개 이상의 뉴클레오티드로 된 길이를 가지거나, 250개 이상의 뉴클레오티드로 된 길이를 가지거나, 500개 이상의 뉴클레오티드로 된 길이를 가지거나, 1000개 이상의 뉴클레오티드로 된 길이를 가진다. 약독화 서열의 코돈 쌍 편향은 모 바이러스의 코돈 쌍 편향보다 작고, 약 0.05 이상, 또는 약 0.1 이상, 또는 약 0.2 이상 감소된다.
약독화할 바이러스는 동물 또는 식물 바이러스일 수 있다. 특정 실시양태들에서, 바이러스는 인간 바이러스이다. 또 다른 실시양태에서, 바이러스는 다수 종들을 감염시킨다. 특정 실시양태들에는 폴리오바이러스, 인플루엔자 바이러스, 뎅기(Dengue) 바이러스, HIV, 로타바이러스 및 SARS가 포함되나, 이들에 국한되지 않는다.
본 발명은 또한 본 약독화 바이러스 및 약학적으로 허용되는 담체를 포함하는, 피험체에서 보호 면역 반응을 유발하기 위한 백신 조성물을 제공한다. 본 발명은 야생형 숙주 세포 내에 비생존성인 약독화 바이러스에 대해 침해성이 되도록 특수 조작된 변형 숙주 세포주를 추가로 제공한다.
부가적으로, 본 발명은 (a) 바이러스 게놈의 하나 이상의 비조절 부분 내 다수 위치에서, 동의 코돈으로 치환할 코돈을 동정하는 단계; (b) 각각의 동정된 코돈을 치환할 동의 코돈을 선택하는 단계; 및 (c) 각각의 동정된 코돈을 동의 코돈으로 치환하는 단계를 포함하는, 본 약독화 바이러스의 합성 방법을 제공한다.
또한, 본 발명은 코돈 쌍 편향을 조절하기 위해, 동일한 아미노산을 코딩하는 현존 코돈의 코딩 영역 내에서의 순서를 변화시키는 단계를 포함하는, 본 약독화 바이러스의 합성 방법을 제공한다.
또한, 본 발명은 이전의 두 방법을 조합하는, 본 약독화 바이러스의 합성 방법을 제공한다.
본 발명에 따라, 약독화 바이러스 입자는, 바이러스 게놈을 숙주 세포 내로 형질감염시킴으로써 약독화 바이러스 입자를 생성시킴에 의해 만들어진다. 본 발명은 면역화에 적당한 약독화 바이러스를 포함하는 약학적 조성물을 추가로 제공한다.
본 발명은 피험체에게 예방적 또는 치료적 유효량의 본 백신 조성물을 투여하는 단계를 포함하는, 피험체에서 보호 면역 반응을 유발하는 방법, 피험체가 바이러스 관련 질환을 앓게 되는 것을 예방하기 위한 방법, 및 바이러스 감염 피험체에서의 바이러스 관련 질환의 발병을 지연시키거나 진행 속도를 늦추는 방법을 추가로 제공한다.
본 발명은 게놈 내 다수 위치에서 조작된 뉴클레오티드 치환을 가지는 변형된 바이러스 게놈을 포함하는 약독화 바이러스로서, 상기 치환은 복수개의 동의 코돈을 게놈 내에 도입하는 것이고, 상기 뉴클레오티드 치환은 먼저 각각의 아미노산 허용 위치에 동의 코돈을 무작위 정렬함으로써 코딩 서열을 생성하고, (a) 동일한 아미노산을 코딩하는 코돈 쌍을 무작위 선택하고 교환하거나, (b) 모의 어닐링 최적화에 따라 동의 코돈을 치환하고, 추가적 향상(쌍 스코어 또는 편향의 변화)이 솔루션이 최적 또는 근최적 값에 수렴할 때까지 특정수 또는 충분수로 반복함에 대해 관찰되지 않을 때까지 이전 단계를 반복하는 단계를 포함하는 과정에 의해 선택되는 것인 약독화 바이러스를 추가로 제공한다.
도면의 간단한 설명
도 1. 합성 P1 캡시드 설계에서의 코돈 사용 통계. PV-SD는 서열 내 코돈 위치 변화를 최대화하면서, wt 대비 거의 동일한 코돈 빈도를 유지한다. PV-AB 캡시드에서, 바람직하지 않은 코돈의 사용을 최대화하였다. 막대의 길이 및 각 막대 뒤의 수는 서열 내의 각 코돈의 출현(occurrence)을 가리킨다. 참조로, 각 아미노산에 대한 정상 인간 동의 코돈 빈도(백분율로서 표현되는 "Freq.")가 세 번째 열에 제시되어 있다.
도 2. PV(M), PV-AB 및 PV-SD 캡시드 코딩 영역의 서열 정렬. 멀트알린(MultAlin) 온라인 소프트웨어 툴을 이용하여, PV(M)(서열 번호 1), PV-AB(서열 번호 2) 및 PV-SD(서열 번호 3)의 뉴클레오티드 서열을 정렬하였다(문헌 [Corpet, 1988]). 서열 위의 수는 캡시드 서열 내의 위치를 가리킨다. 뉴클레오티드 1은 PV(M) 바이러스 게놈 내의 뉴클레오티드 743에 상응한다. 일치 서열에서, 3개의 모든 서열 내 동일한 뉴클레오티드의 출현은 대문자로 표시되어 있고; 3개의 서열 중 2개의 서열 내 동일한 뉴클레오티드의 출현은 소문자로 표시되어 있으며; 3개의 서열 내 3개의 상이한 뉴클레오티드의 출현은 점으로 표시되어 있다.
도 3. 코돈 역최적화 바이러스 표현형. (A) 본 연구에 사용된 바이러스 작제물의 개요. (B) HeLa 세포 단층에서의 1단계 증식 동역학 특성. (C 내지 H) 인큐베이션 48시간 후(C 내지 F) 및 72시간(G 및 H)의 코돈 역최적화 바이러스의 플라크 표현형; 항3Dpo1 항체로 염색하여, 감염 세포를 가시화함. (C) PV(M), (D) PV-SD, (E) PV-AB, (F) PV-AB755-1513, (G 및 H) PV-AB2470-2954. 클리어된 플라크 부위가 감염 세포의 테두리에 의해 표시되어 있다(C 및 D). (H) 패널 G에 나타낸 웰의 후속 크리스탈바이올렛 염색 후, PV-AB2470-2954에 대해서는 플라크가 나타나지 않는다. (I 및 J) 48시간 동안의 감염 후, PV(M)에 의해 생성된 면역염색된 플라크의 말단(I) 또는 PV-AB2470-2954에 의해 생성된 감염 병소(J)의 현미경사진.
도 4. 코돈 역최적화는 특이적 감염력(specific infectivity)의 감소를 초래한다. (A) PV(M)(레인 1), PV-AB755-1513(레인 2), 및 PV-AB2470-2954(레인 3)의 정제된 바이러스 입자로부터 단리된 비리온 게놈 RNA의 아가로스 겔 전기영동. (B) 정제된 PV(M)(레인 1), PV-AB755-1513(레인 2), 및 PV-AB2470-2954(레인 3) 바이러스 입자의 은-염색 SDS-PAGE 단백질 겔. 4가지 캡시드 단백질 중 보다 큰 3가지(VP1, VP2, 및 VP3)가 나와 있고, 바이러스 제제의 순도 및 상대량을 나타낸다. (C) 폴리오바이러스 수용체-알칼리성 포스파타제(CD155-AP) 융합 단백질 프로브를 이용한 바이러스 포착 ELISA의 개발. 바이러스 특이적 항체를 사용하여, ELISA 플레이트를 코팅하였고, 미지의 바이러스 농도를 가지는 샘플을 적용한 후, CD155-AP로 검출하였다. 기지량의 정제된 wt 바이러스와 병행하여, 표준 곡선을 이용하여 바이러스 농도를 계산하였다(E). (D) 정제된 바이러스 및 추출된 비리온 RNA의 양을 분광광도법으로 정량하였고, 입자 또는 게놈 등가물(1 게놈 = 1 비리온)의 수를 계산하였다. 부가적으로, ELISA에 의해 비리온 농도를 측정하였다. 플라크/감염 병소 검정법에 의해, 각 바이러스의 감염성 역가를 측정하였고, 특이적 감염력을 PFU/입자 또는 FFU/입자로서 계산하였다.
도 5. 코돈 역최적화 바이러스 및 야생형 바이러스의 시험관내 번역. 게놈 번역의 수준으로 PV-AB 표현형을 결정한다. (A) 외인성 부가 아미노산 및 tRNA의 존재 하에서의 HeLa S10 추출물에 있어서의 표준 시험관내 번역은, PV(M) wt 대비, 코돈 역최적화 게놈의 번역 용량의 차이를 나타내지 않는다. 12.5% SDS-PAGE 겔 상에 분리된 [35S]메티오닌 표지 번역 산물의 방사능 사진이 나와 있다. 이상 밴드(*)의 동일성이 알려져 있지 않다. (B) 외인성 아미노산 및 tRNA 없이, 또한 경쟁 세포 mRNA의 존재 하, 비투석 HeLa S10 추출물에 있어서의 시험관내 번역은 코돈 역최적화 PV 게놈의 번역 용량에 있어서의 결손을 드러낸다. 10% SDS-PAGE 겔 상에서 분리된 폴리오바이러스 2C 반응성 번역 산물(2CATP아제, 2BC 및 P2)의 웨스턴 블롯이 나와 있다. 2BC 번역 산물의 상대량이 wt 밴드의 백분율로서 각 레인 아래에 표시되어 있다.
도 6. 디시스트론성 리포터 레플리콘을 이용한 생체내 번역의 분석에 의해, PV 번역에 대한 코돈 역최적화의 유해한 영향이 확인된다. (A) 디시스트론성 레플리콘의 개략도. 각종 P1 캡시드 코딩 서열을 반딧불 루시퍼라제 유전자(F-Luc)의 업스트림에 삽입하였다. 내부 대조군(R-Luc) 대비, F-Luc의 변화 수준을 측정하면, P1 캡시드 영역을 통한 리보솜 전이가 정량된다. (B) 레플리콘 RNA를 HeLa 세포 내로 형질감염시키고, 2 mM 구아니딘-염산염의 존재 하에 7시간 동안 인큐베이션하여, RNA 복제를 차단하였다. P1 영역을 통한 상대적 번역 속도는 코돈 역최적화 정도에 반비례하였다. 2개의 생존 가능한 바이러스 작제물, PV-AB2470-2954 및 PV-AB2954-3386의 캡시드 코딩 서열이 60 내지 80%의 wt 번역을 허용하는 반면, 20% 미만의 번역 효율은 PV-AB, PV-AB2470-3386 및 PV-AB1513-2470 게놈으로 관찰되는 치사 표현형과 관련된다. 값은 3가지 독립적 실험의 6가지 검정법의 평균을 나타낸다.
도 7. 인간 및 바이러스 ORF의 코돈 쌍 편향의 결정. 도트는 길이에 대해 플로팅된 한 ORF에 대한 코돈 쌍 당, 평균 코돈 쌍 스코어를 나타낸다. 14,795개의 주석(annotated) 인간 유전자에 대해 코돈 쌍 편향(CPB)을 계산하였다. 과소표시된 코돈 쌍은 음의 스코어를 산출한다. CPB가, 화살표를 갖는 기호에 의해 표시되어 있는 바, 각종 폴리오바이러스 P1 작제물에 대해 플로팅되어 있다. 본 도면은 인간 유전자의 벌크가 0.1 주위에 군집화됨을 도시한다. CPB가 PV(M)-wt("WT"로 표지)(-0.02), 맞춤화 합성 폴리오바이러스 캡시드 PV-Max(+0.25), PV-Min(-0.48), 및 PV(M)-wt:PV-Min 키메라 캡시드 PV-Min755-2470(="PV-MinXY")(-0.31) 및 PV-Min2470-3386(="PV-MinZ")(-0.20)에 대해 나와 있다. 바이러스 PV-SD 및 PV-AB는 변경되지 않은 코돈 쌍 편향의 결과가 아니라, 변경된 코돈 편향에 대한 결과이다.
도 8. 코돈 쌍 역최적화 폴리오의 특성. 1단계 증식 동역학 특성은, PV(M)-wt와 대비하여, 약 2.5 차수 등급으로 감소된 PV-Min755-2470 및 PV-Min2470-3385에 대한 PFU 생성을 나타낸다. 그러나, 모든 바이러스들이 유사한 수의 바이러스 입자를 생성시킨다(본 도면에는 나와 있지 않음). 그 결과, 코돈 역최적화 바이러스 PV-AB755-1513 및 PV-AB2470-2954와 마찬가지로, PFU/입자 비가 감소된다(도 3B)(PFU는 "플라크 형성 단위"임).
도 9. 키메라 바이러스 게놈의 어셈블리. 표적 게놈(적색)을 통해 "스캔"하기 위해, 소분절을 증폭시키거나 합성하여, 중첩 PCR에 의해 wt 게놈(흑색) 내로 도입한다.
도 10. 인플루엔자 A 바이러스의 생성을 위한 8개 플라스미드 pol I-pol II 시스템. 인간 pol I 프로모터와 pol II 프로모터 사이에 삽입된 8개의 바이러스 cDNA를 가지는 8개의 발현 플라스미드를 진핵생물 세포 내에 형질감염시킨다. 각 플라스미드가 2개의 상이한 프로모터를 보유하기 때문에, 세포 pol I 및 pol II 모두가, 추정컨대 상이한 핵 구획에서, 플라스미드 주형을 전사할 것이며, 그 결과, 바이러스 mRNA 및 vRNA가 합성되게 된다. 바이러스 중합효소 복합체 단백질(PB1, PB2, PA, 핵단백질)의 합성 후, 바이러스 복제 사이클이 개시된다. 궁극적으로, 세포 전사 및 번역 기구(machinery)로부터 직접적으로(pol II 전사) 또는 간접적으로(pol I 전사 및 바이러스 복제) 유래된 모든 바이러스 분자의 어셈블리는, 모든 합성된 분자(vRNP 및 구조 단백질 HA, NA, M1, M2, NS2/NEP)의 상호작용을 초래하여, 감염성 인플루엔자 A 바이러스를 발생시킨다. (문헌 [Reproduced from Neumann et al., 2000.]) (주: 인플루엔자의 신생 합성을 위한 다른 방법들도 있다).
도 11. 폴리오바이러스 게놈 및 합성 바이러스 작제물. 폴리오바이러스 게놈 및 키메라 바이러스 작제물의 개방 해독틀. 상단은 전장 PV(M)-wt 게놈 RNA의 개략도이고, 하단은 PV(M)-wt, CPB 맞춤화 합성 바이러스 PV-Max, PV-Min, 및 PV(M)-wt:PV-Min 키메라 바이러스의 개방 해독틀이다. 흑색은 PV(M)-wt 서열에 해당하고, 회색은 PV-Min 합성 서열에 해당하며, 이엉모양(Thatched)은 PV-Max에 해당한다. 강조된 바이러스 작제물들이, PV-Min755-2470(PV-MinXY) 및 PV-Min2470-3385(PV-MinZ)가 현저히 약독화된 표현형으로 인해 더욱 특징화되었다.
도 12. 1단계 증식 곡선은 감소된 감염력과 함께 유사한 양의 입자를 생성하는, 유사한 동역학적 특성을 나타낸다. (A) 2의 MOI를 사용하여, HeLa R19 세포의 단층을 감염시키고, 주어진 시점(0, 2, 4, 7, 10, 24, 48시간)에서의 PFU를 플라크 검정법에 의해 측정하였다. 상응 기호: (□) PV(M)-wt, (●) PV-Max, (◇) PV-Min755-1513, (×) PV-Min1513-2470, (◆) PV-MinXY, (△) PV-MinZ. (B)는 각 시점에서의 계산된 PFU/ml를 입자/ml로 전환시킴을 나타낸다. 이는 PFU/ml를 개별 바이러스 특이적 감염력과 곱함으로써 수득되었다. 상응 기호는 (A)에서와 같다.
도 13. CPB의 변경에 의한 번역의 생체내 조절. (A) CPB의 생체내 영향을 정량하기 위해 사용되는 디시스트론성 RNA 작제물은 번역 시에 있다. 첫 번째 시스트론은 레닐라(Renilla) 루스퍼라제(R-Luc)의 번역을 유도하는 C형 간염 바이러스(HCV) 내부 리보솜 부착 부위(IRES)를 이용한다. 이 첫 번째 시스트론은 투입 RNA의 양을 정규화하기 위해 사용되는 내부 대조군이다. PV(M)-wt IRES에 의해 조절되는 두 번째 시스트론은 반딧불 루스퍼라제(F-Luc)의 번역을 유도한다. 작제물에서의 "P1"으로 표지된 영역은 개별 바이러스 P1의 cDNA에 의해 치환되었다. (B) 각 개별 RNA 작제물을 2 mM 구아니딘 염산염의 존재 하에 HeLa R19 세포 내로 형질감염시켰고, 6시간 후, R-Luc 및 F-Luc를 측정하였다. F-Luc/R-Luc 값을 PV(M)-wt 번역(100%) 대비 정규화하였다.
도 14. 합성 바이러스의 열 불활성화 프로파일은 변하지 않는다. 캡시드 단백질이 미스폴딩된 경우에 기대할 수 있는 바와 같이, 대규모 코돈 쌍 편향이 비리온의 총 형태를 변경시키는 것을 배제하기 위해, PVMinXY 및 PV-MinZ의 열 안정성을 시험하였다. 동일한 수의 입자들을 50℃에서 인큐베이션하였고, 잔존 감염력을 주어진 시간 후에 플라크 검정법을 통해 정량하였다. 합성 바이러스의 캡시드가 탈안정화되면, wt PV(M) 대비, 50℃에서의 생존력의 손실이 증가할 것으로 본 발명자들은 예상한다. 여기에서는 그러하지 않았다. 양 합성 바이러스 모두의 열 불활성화 동역학 특성이 wt와 동일하였다. 대조적으로, 세이빈-1 바이러스는 캡시드를 코딩하는 게놈 내에 다수의 돌연변이를 가지며, 이는 적합하게도 이 바이러스를 wt PV1(M) 대비 덜 열 안정화하도록 만들었다.
도 15. 백신접종 후의 중화 항체 역가. 8마리의 CD155 tg 마우스(그 중 7마리는 처방을 완료함)로 된 한 군에, 각기 PV-MinZ() 및 PV-MinXY(◆)의 108개 입자를 주 간격으로 3회 복강내 주사에 의해 접종하였고, 혈청 전환율을 백신접종 후 10일에 측정하였다. 각 데이터 집합에 횡단하는 수평선은, 각 바이러스 작제물에 대한 평균 중화 항체를 표시한다. 마이크로중화 검정법을 통해, 항폴리오바이러스 항체 역가를 측정하였다. (*) 모의 백신접종(mock-vaccination)된 동물에 대한 바이러스 중화가 최저 시험 1:8에서 검출되지 않았다.
도 16. 코돈 쌍-역최적화 NP 분절을 가지는 인플루엔자 바이러스. (A) A/PR8-NPMin 바이러스는 생존력이 있고, A/PR8 wt에 비해, MDCK 세포 상에 보다 작은 플라크를 생성시킨다. (B) A/PR8-NPMin 바이러스는 지연된 증식 동역학 특성을 나타내고, 최종 역가는 야생형 A/PR8에 비해 3 내지 5배 더 낮다.
도 17. 코돈 쌍-역최적화 PB1 또는 HA 및 NP 분절을 가지는 인플루엔자 바이러스. (A) A/PR8-PB1Min-RR 및 A/PR8-HAMin/NPMin 바이러스는 생존력이 있고, A/PR8 야생형에 비해, MDCK 세포 상에 보다 작은 플라크를 생성시킨다. (B) A/PR8-PB1Min-RR 및 A/PR8-HAMin/NPMin 바이러스는 지연된 증식 동역학 특성을 나타내고, 최종 역가는 야생형 A/PR8에 비해 약 10배 더 낮다.
도 18. BALB/c 마우스 모델에서의 A/PR8-NP Min 의 약독화. (A) A/PR8-NPMin 바이러스는 백신접종 시 체중 손실에 의해 결정할 때, 야생형 A/PR8 바이러스에 비해 감소된 병원성을 가진다. (B) A/PR8-NPMin 바이러스로 백신접종된 모든 마우스들(8마리 중 8마리)이 생존한 반면, A/PR8로 감염된 단지 25%(8마리 중 2마리) 마우스만이 백신접종 후 13일째에 생존하였다. (C) A/PR8-NPMin 바이러스로 백신접종된 마우스는 A/PR8 야생형 바이러스의 LD50의 100배를 이용한 공격접종(challenge)으로부터 보호된다.
발명의 상세한 설명
본 발명은 바이러스 감염 및 질환으로부터 보호하기 위한 백신으로서 사용될 수 있는 약독화 바이러스의 제조에 관한 것이다. 따라서, 본 발명은, 게놈 내 다수 위치에서 조작된 뉴클레오티드 치환을 가지는 변형된 바이러스 게놈을 포함하는 약독화 바이러스로서, 상기 치환이 복수개의 동의 코돈 및/또는 동일한 아미노산에 대한 현존 코돈의 순서의 변화(코돈 쌍 이용의 변화)를 게놈 내에 도입하는 것인 약독화 바이러스를 제공한다. 양 경우 모두에서, 바이러스 유전자 산물의 원래의 야생형 아미노산 서열이 보유된다.
대부분의 아미노산이 1개 초과의 코돈에 의해 코딩된다. 표 1에 있는 유전 암호를 참조한다. 예를 들어, 알라닌은 GCU, GCC, GCA 및 GCG에 의해 코딩된다. 3개의 아미노산(Leu, Ser 및 Arg)이 6개의 상이한 코돈에 의해 코딩되는 반면, 단지 Trp 및 Met만이 독특한 코돈을 가진다. "동의(synonymous)" 코돈은 동일한 아미노산을 코딩하는 코돈이다. 따라서, 예를 들어, CUU, CUC, CUA, CUG, UUA 및 UUG는 Leu를 코딩하는 동의 코돈이다. 동의 코돈은 동등한 빈도로 사용되지 않는다. 일반적으로, 한 특정 생물체에서 가장 빈번히 사용되는 코돈은 동족 tRNA가 풍부한 코돈이며, 이러한 코돈의 사용은 단백질 번역의 속도 및/또는 정확도를 증진시킨다. 역으로, 희소하게 사용되는 코돈에 대한 tRNA는 비교적 낮은 수준으로 발견되고, 희소 코돈의 사용은 번역 속도 및/또는 정확도를 감소시키는 것으로 사료된다. 따라서, 핵산 내 주어진 코돈을 동의적이나 덜 빈번하게 사용되는 코돈에 의해 치환하는 것은, "역최적화" 코돈을 핵산 내로 치환하는 것이다.
a 한 특정 아미노산을 코딩하는 각 코돈 내의 첫 번째 뉴클레오티드가 최좌측에 있는 열에 나와 있고; 두 번째 뉴클레오티드가 상단 행에 나와 있으며; 세 번째 뉴클레오티드가 최우측의 열에 나와 있다.
부가적으로, 주어진 생물체는 주어진 코돈 A의 최근접 코돈 이웃에 대한 선호를 가지는데, 이는 코돈 쌍 이용에서의 편향으로 칭해진다. 현존 코돈을 변화시키지 않으면서 코돈 쌍 편향을 변화시키는 것은, 단백질 합성 및 단백질 생성의 속도에 영향을 줄 수 있다.
본 발명의 각종 실시양태들에서, 바이러스는 DNA, RNA, 이중 가닥 또는 단일 가닥의 바이러스이다. 추가 실시양태들에서, 바이러스는 동물 또는 식물을 감염시킨다. 바람직한 실시양태들에서, 동물은 인간이다. 다수의 동물 바이러스들이 질환을 유발하는 것으로 공지되어 있다(이하 참조). 일부 의학적으로 중요한 바이러스, 예컨대 공수병, 중증 급성 호흡기 증후군(SARS) 및 조류 독감을 유발하는 바이러스가 또한 그것들의 정상 비인간 숙주로부터 인간에게 전파될 수 있다.
바이러스는 또한 식물 병원체의 주요군을 구성하고, 유전자도입 식물의 생성을 위한 바이러스 벡터를 개발하기 위한 연구가 진행 중이다. 그러한 벡터의 이점에는, 식물의 형질전환 용이성, 단일 형질전환 세포로부터 유전자도입 식물의 재생 필요를 사전 방지하는 성숙 식물을 형질전환하는 능력, 및 세포당 다수의 카피수의 바이러스로부터의 외래 유전자의 높은 발현 수준이 포함된다. 그러나, 이러한 벡터의 주요 결점들 중 하나는, 바이러스의 병원성 오염물질로부터 필수 바이러스 복제 기능을 분리할 수 없었다는 점이다. 본원에 개시된 SAVE 기법은 식물 형질전환을 위한 비병원성 바이러스 벡터의 조작 수단을 제공할 수 있다.
인간에서의 주요 바이러스 병원체
바이러스 병원체는 인간 및 기타 동물들에 있어 많은 질환들의 원인적 작용제이다. 인간에 있어서의 바이러스성 질환의 공지된 예에는, 일반 감기(인간 리노바이러스, HRV에 의해 유발됨), 인플루엔자(인플루엔자 바이러스), 수두(바리셀라-조스터(varicella-zoster) 바이러스), 홍역(파라믹소(Paramyxo) 바이러스), 유행성 이하선염(파라믹소 바이러스), 급성 회백수염(폴리오바이러스, PV), 공수병(리싸(Lyssa) 바이러스), 단순성 포진(단순 포진 바이러스[HSV] 1형), 및 생식기 헤르페스(HSV 2형)가 포함된다. 아동을 위한 백신접종 프로그램을 도입하기 전에, 이들 중 다수가 전세계 통상의 아동기 질환이었고, 여전히 일부 개발도상국가에서 유의적인 위협 요소이다. 바이러스성 질환에는 또한 인간 면역결핍 바이러스(HIV)에 의해 유발되는 후천성 면역결핍 증후군(AIDS), SARS 코로나바이러스에 의해 유발되는 중증 급성 호흡기 증후군(SARS), 조류 독감(인플루엔자 A 바이러스의 H5N1 서브타입), 에볼라(Ebola)(에볼라바이러스), 말부르크 출혈 열(Marburg haemorrhagic fever)(말부르크 바이러스), 뎅기열 열(플라비바이러스 혈청형), 웨스트나일 뇌염(West Nile encephalitis)(플라비바이러스(flavivirus)), 감염성 단핵구증(엡스타인-바(Epstein-Barr) 바이러스, EBV), 간염(C형 간염 바이러스, HCV; 간염 B 바이러스, HBV), 및 황열(플라비바이러스)과 같은 더욱 심각한 질환들도 포함된다. 일부 유형의 암도 또한 바이러스에 의해 유발될 수 있다. 예를 들어, 인간 유두종 바이러스(HPV)에 의한 대부분의 감염은 양성이나, HPV는 자궁경부암과 관련된 것으로 나타났고, AIDS 환자에서 우세하게 나타나는 종양인 카포시 육종(KS)은 카포시 육종 관련 헤르페스바이러스(KSHV)에 의해 유발된다.
바이러스가 세포 내에 서식하고 재생을 위해 숙주 세포의 기구를 이용하기 때문에, 이는 숙주 세포을 사멸시키지 않고는 제거되기 어렵다. 바이러스성 질환에 대항하기 위한 가장 효과적인 방법은, 감염에 대한 내성을 제공하기 위해 감염의 위험에 놓인 대상의 백신접종이었다. 일부 질환들(예를 들어, 수두, 홍역, 유행성 이하선염, 황열)에 대해, 효과적인 백신이 이용 가능하다. 그러나, 다른 많은 바이러스성 질환들에 대한 백신을 개발하기 위한 필요성이 절박하다. 본원에 기재된 백신의 제조를 위한 SAVE(합성 약독화 바이러스 조작) 방법은, 원칙적으로 역유전학(reverse genetics) 시스템(이하 참조)이 이용 가능한 모든 바이러스들에 대해 적용 가능하다. 이 방법은 급성 회백수염, 일반 감기, 및 인플루엔자를 위한 약독화 바이러스 백신을 개발하기 위해 SAVE의 적용에 초점을 두는 것으로 본원에서 예시된다.
임의의 바이러스가 본원에 개시된 방법에 의해 약독화될 수 있다. 바이러스는 dsDNA 바이러스(예를 들어, 아데노바이러스, 헤르페스바이러스, 수두 바이러스), 단일 가닥의 "플러스(plus)" 센스 DNA 바이러스(예를 들어, 파르보바이러스), 이중 가닥의 RNA 바이러스(예를 들어, 레오바이러스), 단일 가닥의 + 센스 RNA 바이러스(예를 들어, 피코나바이러스, 토가바이러스), 단일 가닥의 "마이너스(minus)" 센스 RNA 바이러스(예를 들어, 오르토믹소바이러스, 랍도바이러스), DNA 중간체를 갖는 단일 가닥의 + 센스 RNA 바이러스(예를 들어, 레트로바이러스), 또는 이중 가닥의 역전사 바이러스(예를 들어, 헤파드나바이러스)일 수 있다. 본 발명의 일부 비제한 실시양태들에서, 바이러스는 폴리오바이러스(PV), 리노바이러스, 인플루엔자 바이러스, 예를 들어 조류 독감(예를 들어, 인플루엔자 A 바이러스의 H5N1 서브타입), 중증 급성 호흡기 증후군(SARS) 코로나바이러스, 인간 면역결핍 바이러스(HIV), 간염 B 바이러스(HBV), C형 간염 바이러스(HCV), 감염성 기관지염 바이러스, 에볼라바이러스, 말부르크 바이러스, 뎅기열 바이러스(플라비바이러스 혈청형), 웨스트 나일병 바이러스, 엡스타인-바 바이러스(EBV), 황열 바이러스, 에볼라(에볼라바이러스), 수두(바리셀라-조스터 바이러스), 홍역(파라믹소바이러스), 유행성 이하선염(파라믹소바이러스), 공수병(리싸바이러스), 인간 유두종 바이러스, 카포시 육종 관련 헤르페스바이러스, 단순 포진 바이러스(HSV 1형) 또는 생식기 헤르페스 (HSV 2형)이다.
용어 "모(parent)" 바이러스 또는 "모" 단백질 코딩 서열은 다소 약독화될 수 있는 신규 서열의 유래의 기원이 되는 바이러스 게놈 및 단백질 코딩 서열을 지칭하기 위해 본원에서 사용된다. 모 바이러스 및 서열은 통상 더욱 더 약독화된 바이러스를 수득하고자 하는, "야생형" 또는 "천연 발생" 원형(prototype) 또는 변이체의 분리주이다. 그러나, 모 바이러스에는 또한 실제 성질 또는 인지된 바람직한 성질에 기초하여 실험실에서 특이적으로 생성되거나 선택된 돌연변이체도 포함된다. 따라서, 약독화를 위한 후보물질인 모 바이러스에는 결실, 삽입, 아미노산 치환 등을 가지는 야생형 또는 천연 발생 바이러스의 돌연변이체가 포함되고, 또한 코돈 치환을 갖는 돌연변이체도 포함된다. 한 실시양태에서, 그러한 모 서열은 약 30개 이하의 아미노산만큼 천연 분리주와 차이가 있다. 또 다른 실시양태에서, 모 서열은 약 20개 이하의 아미노산만큼 천연 분리주와 차이가 있다. 또 다른 실시양태에서, 모 서열은 약 10개 이하의 아미노산만큼 천연 분리주와 차이가 있다.
약독화 PV는 폴리오바이러스 1형[마호니(폴리오바이러스 1형(Mahoney); "PV(M)"], 폴리오바이러스 2형[랜싱(Lansing)], 폴리오바이러스 3형[레온(Leon)], 1가 경구용 폴리오바이러스 백신(OPV) 바이러스, 또는 3가 OPV 바이러스로부터 유래될 수 있다. 특정 실시양태들에서, 폴리오바이러스는 서열 번호 2에 나와 있는 게놈 서열을 가지는 PV-AB, 또는 PV-AB755-1513, PV-AB755-2470, PV-AB1513-3386, PV-AB2470-3386, PV-AB1513-2470, PV-AB2470-2954, 또는 PV-AB2954-3386이다. 명명법은 게놈의 부분이 PV-AB의 뉴클레오티드로 치환된 PV(M) 게놈을 반영한다. 위첨자는 치환된 PV-AB의 뉴클레오티드의 번호를 제공한다.
각종 실시양태들에서, 약독화 리노바이러스는 HR V2, HRV14로부터 유래된 인간 리노바이러스(HRV), 인간 리노바이러스 10 인간 리노바이러스 100; 인간 리노바이러스 11; 인간 리노바이러스 12; 인간 리노바이러스 13; 인간 리노바이러스 15; 인간 리노바이러스 16; 인간 리노바이러스 18; 인간 리노바이러스 19; 인간 리노바이러스 1A; 인간 리노바이러스 1B; 인간 리노바이러스 2; 인간 리노바이러스 20; 인간 리노바이러스 21; 인간 리노바이러스 22; 인간 리노바이러스 23; 인간 리노바이러스 24; 인간 리노바이러스 25; 인간 리노바이러스 28; 인간 리노바이러스 29; 인간 리노바이러스 30; 인간 리노바이러스 31; 인간 리노바이러스 32; 인간 리노바이러스 33; 인간 리노바이러스 34; 인간 리노바이러스 36; 인간 리노바이러스 38; 인간 리노바이러스 39; 인간 리노바이러스 40; 인간 리노바이러스 41; 인간 리노바이러스 43; 인간 리노바이러스 44; 인간 리노바이러스 45; 인간 리노바이러스 46; 인간 리노바이러스 47; 인간 리노바이러스 49; 인간 리노바이러스 50; 인간 리노바이러스 51; 인간 리노바이러스 53; 인간 리노바이러스 54; 인간 리노바이러스 55; 인간 리노바이러스 56; 인간 리노바이러스 57; 인간 리노바이러스 58; 인간 리노바이러스 59; 인간 리노바이러스 60; 인간 리노바이러스 61; 인간 리노바이러스 62; 인간 리노바이러스 63; 인간 리노바이러스 64; 인간 리노바이러스 65; 인간 리노바이러스 66; 인간 리노바이러스 67; 인간 리노바이러스 68; 인간 리노바이러스 7; 인간 리노바이러스 71; 인간 리노바이러스 73; 인간 리노바이러스 74; 인간 리노바이러스 75; 인간 리노바이러스 76; 인간 리노바이러스 77; 인간 리노바이러스 78; 인간 리노바이러스 8; 인간 리노바이러스 80; 인간 리노바이러스 81; 인간 리노바이러스 82; 인간 리노바이러스 85; 인간 리노바이러스 88; 인간 리노바이러스 89; 인간 리노바이러스 9; 인간 리노바이러스 90; 인간 리노바이러스 94; 인간 리노바이러스 95; 인간 리노바이러스 96 인간 리노바이러스 98; 인간 리노바이러스 14; 인간 리노바이러스 17; 인간 리노바이러스 26; 인간 리노바이러스 27; 인간 리노바이러스 3; 인간 리노바이러스 8001 핀랜드 Nov1995; 인간 리노바이러스 35; 인간 리노바이러스 37;+ 인간 리노바이러스 6253 핀랜드 Sep1994; 인간 리노바이러스 9166 핀랜드 Sep1995; 인간 리노바이러스 4; 인간 리노바이러스 42; 인간 리노바이러스 48; 인간 리노바이러스 9864 핀랜드 Sep1996; 인간 리노바이러스 5; 인간 리노바이러스 52; 인간 리노바이러스 6; 인간 리노바이러스 7425 핀랜드 Dec1995; 인간 리노바이러스 69; 인간 리노바이러스 5928 핀랜드 May1995; 인간 리노바이러스 70; 인간 리노바이러스 72; 인간 리노바이러스 79; 인간 리노바이러스 83; 인간 리노바이러스 84; 인간 리노바이러스 8317 핀랜드 Aug1996; 인간 리노바이러스 86; 인간 리노바이러스 91; 인간 리노바이러스 7851 핀랜드 Sep1996; 인간 리노바이러스 92; 인간 리노바이러스 93; 인간 리노바이러스 97; 인간 리노바이러스 99; 앤트워프 리노바이러스 98/99; 인간 리노바이러스 263 베를린 2004; 인간 리노바이러스 3083/리노/효고/2005; 인간 리노바이러스 NY-003; 인간 리노바이러스 NY-028; 인간 리노바이러스 NY-041; 인간 리노바이러스 NY-042; 인간 리노바이러스 NY-060; 인간 리노바이러스 NY-063; 인간 리노바이러스 NY-074; 인간 리노바이러스 NY-1085; 인간 리노바이러스 균주 행크스; 유형 비정식 인간 리노바이러스 OK88-8162; 인간 엔테로바이러스 sp. ex 텍사스진드기(Amblyomma americanum); 인간 리노바이러스 sp. 또는 인간 리노바이러스 UC이다.
다른 실시양태들에서, 약독화 인플루엔자 바이러스는 인플루엔자 바이러스 A, 인플루엔자 바이러스 B, 또는 인플루엔자 바이러스 C로부터 유래된다. 추가 실시양태들에서, 인플루엔자 바이러스 A는 서브타입 H10N7, H10N1, H10N2, H10N3, H10N4, H10N5, H10N6, H10N7, H10N8, H10N9, H11N1, H11N2, H11N3, H11N4, H11N6, H11N8, H11N9, H12N1, H12N2, H12N4, H12N5, H12N6, H12N8, H12N9, H13N2, H13N3, H13N6, H13N9, H14N5, H14N6, H15N2, H15N8, H15N9, H16N3, H1N1, H1N2, H1N3, H1N5, H1N6, H1N8, H1N9, H2N1, H2N2, H2N3, H2N4, H2N5, H2N6, H2N7, H2N8, H2N9, H3N1, H3N2, H3N3, H3N4, H3N5, H3N6, H3N8, H3N9, H4N1, H4N2, H4N3, H4N4, H4N5, H4N6, H4N7, H4N8, H4N9, H5N1, H5N2, H5N3, H5N4, H5N6, H5N7, H5N8, H5N9, H6N1, H6N2, H6N3, H6N4, H6N5, H6N6, H6N7, H6N8, H6N9, H7N1, H7N2, H7N3, H7N4, H7N5, H7N7, H7N8, H7N9, H8N2, H8N4, H8N5, H9N1, H9N2, H9N3, H9N4, H9N5, H9N6, H9N7, H9N8, H9N9 및 미확인 서브타입에 속하나, 이들에 국한되지 않는다.
추가 실시양태들에서, 인플루엔자 바이러스 B는 서브타입 인플루엔자 B 바이러스(B/아이치/186/2005), 인플루엔자 B 바이러스(B/아이치/5/88), 인플루엔자 B 바이러스(B/아키타/27/2001), 인플루엔자 B 바이러스(B/아키타/5/2001), 인플루엔자 B 바이러스(B/알라바마/1/2006), 인플루엔자 B 바이러스(B/알라바마/2/2005), 인플루엔자 B 바이러스(B/알라스카/03/1992), 인플루엔자 B 바이러스(B/알라스카/12/1996), 인플루엔자 B 바이러스(B/알라스카/16/2000), 인플루엔자 B 바이러스(B/알라스카/16/2003), 인플루엔자 B 바이러스(B/알라스카/1777/2005), 인플루엔자 B 바이러스(B/알라스카/2/2004), 인플루엔자 B 바이러스(B/알라스카/6/2005), 인플루엔자 B 바이러스(B/앤 아버/1/1986), 인플루엔자 B 바이러스(B/앤 아버/1994), 인플루엔자 B 바이러스(B/아르젠티나/132/2001), 인플루엔자 B 바이러스(B/아르젠티나/3640/1999), 인플루엔자 B 바이러스(B/아르젠티나/69/2001), 인플루엔자 B 바이러스(B/아리조나/1/2005), 인플루엔자 B 바이러스(B/아리조나/12/2003), 인플루엔자 B 바이러스(B/아리조나/13/2003), 인플루엔자 B 바이러스(B/아리조나/135/2005), 인플루엔자 B 바이러스(B/아리조나/14/2001), 인플루엔자 B 바이러스(B/아리조나/14/2005), 인플루엔자 B 바이러스(B/아리조나/140/2005), 인플루엔자 B 바이러스(B/아리조나/146/2005), 인플루엔자 B 바이러스(B/아리조나/148/2005), 인플루엔자 B 바이러스(B/아리조나/15/2005), 인플루엔자 B 바이러스(B/아리조나/16/2005), 인플루엔자 B 바이러스(B/아리조나/162/2005), 인플루엔자 B 바이러스(B/아리조나/163/2005), 인플루엔자 B 바이러스(B/아리조나/164/2005), 인플루엔자 B 바이러스(B/아리조나/2/2000), 인플루엔자 B 바이러스(B/아리조나/2/2005), 인플루엔자 B 바이러스(B/아리조나/2e/2006), 인플루엔자 B 바이러스(B/아리조나/3/2006), 인플루엔자 B 바이러스(B/아리조나/4/2002), 인플루엔자 B 바이러스(B/아리조나/4/2006), 인플루엔자 B 바이러스(B/아리조나/48/2005), 인플루엔자 B 바이러스(B/아리조나/5/2000), 인플루엔자 B 바이러스(B/아리조나/59/2005), 인플루엔자 B 바이러스(B/아리조나/7/2000), 인플루엔자 B 바이러스(B/오클랜드/01/2000), 인플루엔자 B 바이러스(B/방콕/141/1994), 인플루엔자 B 바이러스(B/방콕/143/1994), 인플루엔자 B 바이러스(B/방콕/153/1990), 인플루엔자 B 바이러스(B/방콕/163/1990), 인플루엔자 B 바이러스(B/방콕/163/90), 인플루엔자 B 바이러스(B/방콕/34/99), 인플루엔자 B 바이러스(B/방콕/460/03), 인플루엔자 B 바이러스(B/방콕/54/99), 인플루엔자 B 바이러스(B/바르셀로나/215/03), 인플루엔자 B 바이러스(B/베이징/15/84), 인플루엔자 B 바이러스(B/베이징/184/93), 인플루엔자 B 바이러스(B/베이징/243/97), 인플루엔자 B 바이러스(B/베이징/43/75), 인플루엔자 B 바이러스(B/베이징/5/76), 인플루엔자 B 바이러스(B/베이징/76/98), 인플루엔자 B 바이러스(B/벨기에/WV106/2002), 인플루엔자 B 바이러스(B/벨기에/WV107/2002), 인플루엔자 B 바이러스(B/벨기에/WV109/2002), 인플루엔자 B 바이러스(B/벨기에/WV114/2002), 인플루엔자 B 바이러스(B/벨기에/WV122/2002), 인플루엔자 B 바이러스(B/본/43), 인플루엔자 B 바이러스(B/브라질/017/00), 인플루엔자 B 바이러스(B/브라질/053/00), 인플루엔자 B 바이러스(B/브라질/055/00), 인플루엔자 B 바이러스(B/브라질/064/00), 인플루엔자 B 바이러스(B/브라질/074/00), 인플루엔자 B 바이러스(B/브라질/079/00), 인플루엔자 B 바이러스(B/브라질/110/01), 인플루엔자 B 바이러스(B/브라질/952/2001), 인플루엔자 B 바이러스(B/브라질/975/2000), 인플루엔자 B 바이러스(B/브리스번/32/2002), 인플루엔자 B 바이러스(B/부쿠레슈티/311/1998), 인플루엔자 B 바이러스(B/부쿠레슈티/795/03), 인플루엔자 B 바이러스(B/부에노스아이레스/161/00), 인플루엔자 B 바이러스(B/부에노스아이레스/9/95), 인플루엔자 B 바이러스(B/부에노스아이레스/SW16/97), 인플루엔자 B 바이러스(B/부에노스아이레스/VL518/99), 인플루엔자 B 바이러스(B/캘리포니아/01/1995), 인플루엔자 B 바이러스(B/캘리포니아/02/1994), 인플루엔자 B 바이러스(B/캘리포니아/02/1995), 인플루엔자 B 바이러스(B/캘리포니아/1/2000), 인플루엔자 B 바이러스(B/캘리포니아/10/2000), 인플루엔자 B 바이러스(B/캘리포니아/11/2001), 인플루엔자 B 바이러스(B/캘리포니아/14/2005), 인플루엔자 B 바이러스(B/캘리포니아/2/2002), 인플루엔자 B 바이러스(B/캘리포니아/2/2003), 인플루엔자 B 바이러스(B/캘리포니아/3/2000), 인플루엔자 B 바이러스(B/캘리포니아/3/2004), 인플루엔자 B 바이러스(B/캘리포니아/6/2000), 인플루엔자 B 바이러스(B/캘리포니아/7/2005), 인플루엔자 B 바이러스(B/캐나다/16188/2000), 인플루엔자 B 바이러스(B/캐나다/464/2001), 인플루엔자 B 바이러스(B/캐나다/464/2002), 인플루엔자 B 바이러스(B/차코/366/00), 인플루엔자 B 바이러스(B/차코/R113/00), 인플루엔자 B 바이러스(B/찬타부리/218/2003), 인플루엔자 B 바이러스(B/제주/303/03), 인플루엔자 B 바이러스(B/치바/447/98), 인플루엔자 B 바이러스(B/칠레/3162/2002), 인플루엔자 B 바이러스(B/충칭/3/2000), 인플루엔자 B 바이러스(B/임상 분리주 SA1태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA10 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA100 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA101 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA102 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA103 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA104 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA105 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA106 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA107 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA108 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA109 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA11 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA110 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA112 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA113 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA114 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA115 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA116 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA12 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA13 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA14 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA15 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA16 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA17 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA18 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA19 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA2 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA20 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA21 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA22 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA23 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA24 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA25 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA26 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA27 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA28 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA29 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA3 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA30 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA31 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA32 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA33 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA34 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA37 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA38 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA39 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA40 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA41 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA42 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA43 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA44 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA45 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA46 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA47 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA5 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA50 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA51 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA52 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA53 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA57 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA58 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA59 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA6 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA60 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA61 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA62 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA63 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA64 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA65 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA66 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA67 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA68 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA69 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA7 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA70 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA71 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA73 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA74 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA76 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA77 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA78 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA79 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA8 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA80 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA81 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA82 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA83 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA84 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA85 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA86 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA87 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA88 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA89 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA9 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA90 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA91 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA92 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA93 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA94 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA95 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA96 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA97 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA98 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA99 필리핀/2002), 인플루엔자 B 바이러스(B/CNIC/27/2001), 인플루엔자 B 바이러스(B/콜로라도/04/2004), 인플루엔자 B 바이러스(B/콜로라도/11e/2004), 인플루엔자 B 바이러스(B/콜로라도/12e/2005), 인플루엔자 B 바이러스(B/콜로라도/13/2004), 인플루엔자 B 바이러스(B/콜로라도/13e/2004), 인플루엔자 B 바이러스(B/콜로라도/15/2004), 인플루엔자 B 바이러스(B/콜로라도/16e/2004), 인플루엔자 B 바이러스(B/콜로라도/17e/2004), 인플루엔자 B 바이러스(B/콜로라도/2/2004), 인플루엔자 B 바이러스(B/콜로라도/2597/2004), 인플루엔자 B 바이러스(B/콜로라도/4e/2004), 인플루엔자 B 바이러스(B/콜로라도/5/2004), 인플루엔자 B 바이러스(B/코넥티컷/02/1995), 인플루엔자 B 바이러스(B/코넥티컷/07/1993), 인플루엔자 B 바이러스(B/코르도바/2979/1991), 인플루엔자 B 바이러스(B/코르도바/VA418/99), 인플루엔자 B 바이러스(B/체코슬로바키아/16/89), 인플루엔자 B 바이러스(B/체코슬로바키아/69/1990), 인플루엔자 B 바이러스(B/체코슬로바키아/69/90), 인플루엔자 B 바이러스(B/대구/10/97), 인플루엔자 B 바이러스(B/대구/45/97), 인플루엔자 B 바이러스(B/대구/47/97), 인플루엔자 B 바이러스(B/대구/9/97), 인플루엔자 B 바이러스(B/델라웨어/1/2006), 인플루엔자 B 바이러스(B/Du/4/78), 인플루엔자 B 바이러스(B/더반/39/98), 인플루엔자 B 바이러스(B/더반/43/98), 인플루엔자 B 바이러스(B/더반/44/98), 인플루엔자 B 바이러스(B/더반/52/98), 인플루엔자 B 바이러스(B/더반/55/98), 인플루엔자 B 바이러스(B/더반/56/98), 인플루엔자 B 바이러스(B/이집트/2040/2004), 인플루엔자 B 바이러스(B/잉글랜드/1716/2005), 인플루엔자 B 바이러스(B/잉글랜드/2054/2005), 인플루엔자 B 바이러스(B/잉글랜드/23/04), 인플루엔자 B 바이러스(B/에스피리토산토/55/01), 인플루엔자 B 바이러스(B/에스피리토산토/79/99), 인플루엔자 B 바이러스(B/핀랜드/154/2002), 인플루엔자 B 바이러스(B/핀랜드/159/2002), 인플루엔자 B 바이러스(B/핀랜드/160/2002), 인플루엔자 B 바이러스(B/핀랜드/161/2002), 인플루엔자 B 바이러스(B/핀랜드/162/03), 인플루엔자 B 바이러스(B/핀랜드/162/2002), 인플루엔자 B 바이러스(B/핀랜드/162/91), 인플루엔자 B 바이러스(B/핀랜드/164/2003), 인플루엔자 B 바이러스(B/핀랜드/172/91), 인플루엔자 B 바이러스(B/핀랜드/173/2003), 인플루엔자 B 바이러스(B/핀랜드/176/2003), 인플루엔자 B 바이러스(B/핀랜드/184/91), 인플루엔자 B 바이러스(B/핀랜드/188/2003), 인플루엔자 B 바이러스(B/핀랜드/190/2003), 인플루엔자 B 바이러스(B/핀랜드/191/2003), 인플루엔자 B 바이러스(B/핀랜드/192/2003), 인플루엔자 B 바이러스(B/핀랜드/193/2003), 인플루엔자 B 바이러스(B/핀랜드/199/2003), 인플루엔자 B 바이러스(B/핀랜드/202/2003), 인플루엔자 B 바이러스(B/핀랜드/203/2003), 인플루엔자 B 바이러스(B/핀랜드/204/2003), 인플루엔자 B 바이러스(B/핀랜드/205/2003), 인플루엔자 B 바이러스(B/핀랜드/206/2003), 인플루엔자 B 바이러스(B/핀랜드/220/2003), 인플루엔자 B 바이러스(B/핀랜드/223/2003), 인플루엔자 B 바이러스(B/핀랜드/225/2003), 인플루엔자 B 바이러스(B/핀랜드/227/2003), 인플루엔자 B 바이러스(B/핀랜드/231/2003), 인플루엔자 B 바이러스(B/핀랜드/235/2003), 인플루엔자 B 바이러스(B/핀랜드/239/2003), 인플루엔자 B 바이러스(B/핀랜드/244/2003), 인플루엔자 B 바이러스(B/핀랜드/245/2003), 인플루엔자 B 바이러스(B/핀랜드/254/2003), 인플루엔자 B 바이러스(B/핀랜드/254/93), 인플루엔자 B 바이러스(B/핀랜드/255/2003), 인플루엔자 B 바이러스(B/핀랜드/260/93), 인플루엔자 B 바이러스(B/핀랜드/268/93), 인플루엔자 B 바이러스(B/핀랜드/270/2003), 인플루엔자 B 바이러스(B/핀랜드/275/2003), 인플루엔자 B 바이러스(B/핀랜드/767/2000), 인플루엔자 B 바이러스(B/핀랜드/84/2002), 인플루엔자 B 바이러스(B/핀랜드/886/2001), 인플루엔자 B 바이러스(B/핀랜드/WV4/2002), 인플루엔자 B 바이러스(B/핀랜드/WV5/2002), 인플루엔자 B 바이러스(B/플로리다/02/1998), 인플루엔자 B 바이러스(B/플로리다/02/2006), 인플루엔자 B 바이러스(B/플로리다/1/2000), 인플루엔자 B 바이러스(B/플로리다/1/2004), 인플루엔자 B 바이러스(B/플로리다/2/2004), 인플루엔자 B 바이러스(B/플로리다/2/2005), 인플루엔자 B 바이러스(B/플로리다/2/2006), 인플루엔자 B 바이러스(B/플로리다/7e/2004), 인플루엔자 B 바이러스(B/푸젠/36/82), 인플루엔자 B 바이러스(B/제네바/5079/03), 인플루엔자 B 바이러스(B/제노아/11/02), 인플루엔자 B 바이러스(B/제노아/2/02), 인플루엔자 B 바이러스(B/제노아/21/02), 인플루엔자 B 바이러스(B/제노아/33/02), 인플루엔자 B 바이러스(B/제노아/41/02), 인플루엔자 B 바이러스(B/제노아/52/02), 인플루엔자 B 바이러스(B/제노아/55/02), 인플루엔자 B 바이러스(B/제노아/56/02), 인플루엔자 B 바이러스(B/제노아/7/02), 인플루엔자 B 바이러스(B/제노아/8/02), 인플루엔자 B 바이러스(B/제노아l2/02), 인플루엔자 B 바이러스(B/제노아3/02), 인플루엔자 B 바이러스(B/제노아48/02), 인플루엔자 B 바이러스(B/제노아49/02), 인플루엔자 B 바이러스(B/제노아5/02), 인플루엔자 B 바이러스(B/제노아53/02), 인플루엔자 B 바이러스(B/제노아6/02), 인플루엔자 B 바이러스(B/제노아65/02), 인플루엔자 B 바이러스(B/제노바/1294/03), 인플루엔자 B 바이러스(B/제노바/1603/03), 인플루엔자 B 바이러스(B/제노바/2/02), 인플루엔자 B 바이러스(B/제노바/20/02), 인플루엔자 B 바이러스(B/제노바/2059/03), 인플루엔자 B 바이러스(B/제노바/26/02), 인플루엔자 B 바이러스(B/제노바/30/02), 인플루엔자 B 바이러스(B/제노바/54/02), 인플루엔자 B 바이러스(B/제노바/55/02), 인플루엔자 B 바이러스(B/죠지아/02/1998), 인플루엔자 B 바이러스(B/죠지아/04/1998), 인플루엔자 B 바이러스(B/죠지아/09/2005), 인플루엔자 B 바이러스(B/죠지아/1/2000), 인플루엔자 B 바이러스(B/죠지아/1/2005), 인플루엔자 B 바이러스(B/죠지아/2/2005), 인플루엔자 B 바이러스(B/죠지아/9/2005), 인플루엔자 B 바이러스(B/광동/05/94), 인플루엔자 B 바이러스(B/광동/08/93), 인플루엔자 B 바이러스(B/광동/5/94), 인플루엔자 B 바이러스(B/광동/55/89), 인플루엔자 B 바이러스(B/광동/8/93), 인플루엔자 B 바이러스(B/광저우/7/97), 인플루엔자 B 바이러스(B/광저우/86/92), 인플루엔자 B 바이러스(B/광저우/87/92), 인플루엔자 B 바이러스(B/경기/592/2005), 인플루엔자 B 바이러스(B/하노버/2/90), 인플루엔자 B 바이러스(B/하얼삔/07/94), 인플루엔자 B 바이러스(B/하와이/1/2003), 인플루엔자 B 바이러스(B/하와이/10/2001), 인플루엔자 B 바이러스(B/하와이/10/2004), 인플루엔자 B 바이러스(B/하와이/11/2004), 인플루엔자 B 바이러스(B/하와이/11e/2004), 인플루엔자 B 바이러스(B/하와이/11e/2005), 인플루엔자 B 바이러스(B/하와이/12e/2005), 인플루엔자 B 바이러스(B/하와이/13/2004), 인플루엔자 B 바이러스(B/하와이/13e/2004), 인플루엔자 B 바이러스(B/하와이/17/2001), 인플루엔자 B 바이러스(B/하와이/18e/2004), 인플루엔자 B 바이러스(B/하와이/1990/2004), 인플루엔자 B 바이러스(B/하와이/1993/2004), 인플루엔자 B 바이러스(B/하와이/19e/2004), 인플루엔자 B 바이러스(B/하와이/2/2000), 인플루엔자 B 바이러스(B/하와이/2/2003), 인플루엔자 B 바이러스(B/하와이/20e/2004), 인플루엔자 B 바이러스(B/하와이/21/2004), 인플루엔자 B 바이러스(B/하와이/26/2001), 인플루엔자 B 바이러스(B/하와이/31e/2004), 인플루엔자 B 바이러스(B/하와이/32e/2004), 인플루엔자 B 바이러스(B/하와이/33e/2004), 인플루엔자 B 바이러스(B/하와이/35/2001), 인플루엔자 B 바이러스(B/하와이/36/2001), 인플루엔자 B 바이러스(B/하와이/37/2001), 인플루엔자 B 바이러스(B/하와이/38/2001), 인플루엔자 B 바이러스(B/하와이/4/2006), 인플루엔자 B 바이러스(B/하와이/43/2001), 인플루엔자 B 바이러스(B/하와이/44/2001), 인플루엔자 B 바이러스(B/하와이/9/2001), 인플루엔자 B 바이러스(B/허베이/19/94), 인플루엔자 B 바이러스(B/허베이/3/94), 인플루엔자 B 바이러스(B/허베이/4/95), 인플루엔자 B 바이러스(B/하남/22/97), 인플루엔자 B 바이러스(B/히로시마/23/2001), 인플루엔자 B 바이러스(B/홍콩/02/1993), 인플루엔자 B 바이러스(B/홍콩/03/1992), 인플루엔자 B 바이러스(B/홍콩/05/1972), 인플루엔자 B 바이러스(B/홍콩/06/2001), 인플루엔자 B 바이러스(B/홍콩/110/99), 인플루엔자 B 바이러스(B/홍콩/1115/2002), 인플루엔자 B 바이러스(B/홍콩/112/2001), 인플루엔자 B 바이러스(B/홍콩/123/2001), 인플루엔자 B 바이러스(B/홍콩/1351/02), 인플루엔자 B 바이러스(B/홍콩/1351/2002), 인플루엔자 B 바이러스(B/홍콩/1434/2002), 인플루엔자 B 바이러스(B/홍콩/147/99), 인플루엔자 B 바이러스(B/홍콩/156/99), 인플루엔자 B 바이러스(B/홍콩/157/99), 인플루엔자 B 바이러스(B/홍콩/167/2002), 인플루엔자 B 바이러스(B/홍콩/22/1989), 인플루엔자 B 바이러스(B/홍콩/22/2001), 인플루엔자 B 바이러스(B/홍콩/22/89), 인플루엔자 B 바이러스(B/홍콩/28/2001), 인플루엔자 B 바이러스(B/홍콩/293/02), 인플루엔자 B 바이러스(B/홍콩/310/2004), 인플루엔자 B 바이러스(B/홍콩/329/2001), 인플루엔자 B 바이러스(B/홍콩/330/2001 에그 적응화), 인플루엔자 B 바이러스(B/홍콩/330/2001), 인플루엔자 B 바이러스(B/홍콩/330/2002), 인플루엔자 B 바이러스(B/홍콩/335/2001), 인플루엔자 B 바이러스(B/홍콩/336/2001), 인플루엔자 B 바이러스(B/홍콩/497/2001), 인플루엔자 B 바이러스(B/홍콩/542/2000), 인플루엔자 B 바이러스(B/홍콩/548/2000), 인플루엔자 B 바이러스(B/홍콩/553a/2003), 인플루엔자 B 바이러스(B/홍콩/557/2000), 인플루엔자 B 바이러스(B/홍콩/6/2001), 인플루엔자 B 바이러스(B/홍콩/666/2001), 인플루엔자 B 바이러스(B/홍콩/692/01), 인플루엔자 B 바이러스(B/홍콩/70/1996), 인플루엔자 B 바이러스(B/홍콩/8/1973), 인플루엔자 B 바이러스(B/홍콩/9/89), 인플루엔자 B 바이러스(B/휴스턴/1/91), 인플루엔자 B 바이러스(B/휴스턴/1/92), 인플루엔자 B 바이러스(B/휴스턴/1/96), 인플루엔자 B 바이러스(B/휴스턴/2/93), 인플루엔자 B 바이러스(B/휴스턴/2/96), 인플루엔자 B 바이러스(B/휴스턴/B 15/1999), 인플루엔자 B 바이러스(B/휴스턴/B56/1997), 인플루엔자 B 바이러스(B/휴스턴/B57/1997), 인플루엔자 B 바이러스(B/휴스턴/B58/1997), 인플루엔자 B 바이러스(B/휴스턴/B59/1997), 인플루엔자 B 바이러스(B/휴스턴/B60/1997), 인플루엔자 B 바이러스(B/휴스턴/B61/1997), 인플루엔자 B 바이러스(B/휴스턴/B63/1997), 인플루엔자 B 바이러스(B/휴스턴/B65/1998), 인플루엔자 B 바이러스(B/휴스턴/B66/2000), 인플루엔자 B 바이러스(B/휴스턴/B67/2000), 인플루엔자 B 바이러스(B/휴스턴/B68/2000), 인플루엔자 B 바이러스(B/휴스턴/B69/2002), 인플루엔자 B 바이러스(B/휴스턴/B70/2002), 인플루엔자 B 바이러스(B/휴스턴/B71/2002), 인플루엔자 B 바이러스(B/휴스턴/B720/2004), 인플루엔자 B 바이러스(B/휴스턴/B74/2002), 인플루엔자 B 바이러스(B/휴스턴/B745/2005), 인플루엔자 B 바이러스(B/휴스턴/B75/2002), 인플루엔자 B 바이러스(B/휴스턴/B756/2005), 인플루엔자 B 바이러스(B/휴스턴/B77/2002), 인플루엔자 B 바이러스(B/휴스턴/B787/2005), 인플루엔자 B 바이러스(B/휴스턴/B79/2003), 인플루엔자 B 바이러스(B/휴스턴/B81/2003), 인플루엔자 B 바이러스(B/휴스턴/B84/2003), 인플루엔자 B 바이러스(B/휴스턴/B846/2005), 인플루엔자 B 바이러스(B/휴스턴/B850/2005), 인플루엔자 B 바이러스(B/휴스턴/B86/2003), 인플루엔자 B 바이러스(B/휴스턴/B87/2003), 인플루엔자 B 바이러스(B/휴스턴/B88/2003), 인플루엔자 B 바이러스(B/허난/4/72), 인플루엔자 B 바이러스(B/이바라키/2/85), 인플루엔자 B 바이러스(B/아이다호/1/2005), 인플루엔자 B 바이러스(B/일리노이/1/2004), 인플루엔자 B 바이러스(B/일리노이/13/2004), 인플루엔자 B 바이러스(B/일리노이/13/2005), 인플루엔자 B 바이러스(B/일리노이/13e/2005), 인플루엔자 B 바이러스(B/일리노이/3/2001), 인플루엔자 B 바이러스(B/일리노이/3/2005), 인플루엔자 B 바이러스(B/일리노이/33/2005), 인플루엔자 B 바이러스(B/일리노이/36/2005), 인플루엔자 B 바이러스(B/일리노이/4/2005), 인플루엔자 B 바이러스(B/일리노이/47/2005), 인플루엔자 B 바이러스(B/인천/297/2005), 인플루엔자 B 바이러스(B/인도/3/89), 인플루엔자 B 바이러스(B/인도/7526/2001), 인플루엔자 B 바이러스(B/인도/7569/2001), 인플루엔자 B 바이러스(B/인도/7600/2001), 인플루엔자 B 바이러스(B/인도/7605/2001), 인플루엔자 B 바이러스(B/인도/77276/2001), 인플루엔자 B 바이러스(B/인디아나/01/1995), 인플루엔자 B 바이러스(B/인디아나/3/2006), 인플루엔자 B 바이러스(B/인디아나/5/2006), 인플루엔자 B 바이러스(B/아이오와/03/2002), 인플루엔자 B 바이러스(B/아이오와/1/2001), 인플루엔자 B 바이러스(B/아이오와/1/2005), 인플루엔자 B 바이러스(B/이스라엘/95/03), 인플루엔자 B 바이러스(B/이스라엘/WV124/2002), 인플루엔자 B 바이러스(B/이스라엘/WV126/2002), 인플루엔자 B 바이러스(B/이스라엘/WV133/2002), 인플루엔자 B 바이러스(B/이스라엘/WV135/2002), 인플루엔자 B 바이러스(B/이스라엘/WV137/2002), 인플루엔자 B 바이러스(B/이스라엘/WV142/2002), 인플루엔자 B 바이러스(B/이스라엘/WV143/2002), 인플루엔자 B 바이러스(B/이스라엘/WV145/2002), 인플루엔자 B 바이러스(B/이스라엘/WV146/2002), 인플루엔자 B 바이러스(B/이스라엘/WV150/2002), 인플루엔자 B 바이러스(B/이스라엘/WV153/2002), 인플루엔자 B 바이러스(B/이스라엘/WV158/2002), 인플루엔자 B 바이러스(B/이스라엘/WV161/2002), 인플루엔자 B 바이러스(B/이스라엘/WV166/2002), 인플루엔자 B 바이러스(B/이스라엘/WV169/2002), 인플루엔자 B 바이러스(B/이스라엘/WV170/2002), 인플루엔자 B 바이러스(B/이스라엘/WV174/2002), 인플루엔자 B 바이러스(B/이스라엘/WV183/2002), 인플루엔자 B 바이러스(B/이스라엘/WV187/2002), 인플루엔자 B 바이러스(B/이스탄불/CTF-132/05), 인플루엔자 B 바이러스(B/일본/1224/2005), 인플루엔자 B 바이러스(B/일본/1905/2005), 인플루엔자 B 바이러스(B/장쑤/10/03), 인플루엔자 B 바이러스(B/장쑤/10/2003(재조합)), 인플루엔자 B 바이러스(B/장쑤/10/2003), 인플루엔자 B 바이러스(B/길림/20/2003), 인플루엔자 B 바이러스(B/요하네스버그/05/1999), 인플루엔자 B 바이러스(B/요하네스버그/06/1994), 인플루엔자 B 바이러스(B/요하네스버그/1/99), 인플루엔자 B 바이러스(B/요하네스버그/113/010), 인플루엔자 B 바이러스(B/요하네스버그/116/01), 인플루엔자 B 바이러스(B/요하네스버그/119/01), 인플루엔자 B 바이러스(B/요하네스버그/123/01), 인플루엔자 B 바이러스(B/요하네스버그/163/99), 인플루엔자 B 바이러스(B/요하네스버그/187/99), 인플루엔자 B 바이러스(B/요하네스버그/189/99), 인플루엔자 B 바이러스(B/요하네스버그/2/99), 인플루엔자 B 바이러스(B/요하네스버그/27/2005), 인플루엔자 B 바이러스(B/요하네스버그/33/01), 인플루엔자 B 바이러스(B/요하네스버그/34/01), 인플루엔자 B 바이러스(B/요하네스버그/35/01), 인플루엔자 B 바이러스(B/요하네스버그/36/01), 인플루엔자 B 바이러스(B/요하네스버그/41/99), 인플루엔자 B 바이러스(B/요하네스버그/5/99), 인플루엔자 B 바이러스(B/요하네스버그/69/2001), 인플루엔자 B 바이러스(B/요하네스버그/77/01), 인플루엔자 B 바이러스(B/요하네스버그/94/99), 인플루엔자 B 바이러스(B/요하네스버그/96/01), 인플루엔자 B 바이러스(B/가도마/1076/99), 인플루엔자 B 바이러스(B/가도마/122/99), 인플루엔자 B 바이러스(B/가도마/122/99-V1), 인플루엔자 B 바이러스(B/가도마/122/99-V10), 인플루엔자 B 바이러스(B/가도마/122/99-V11), 인플루엔자 B 바이러스(B/가도마/122/99-V2), 인플루엔자 B 바이러스(B/가도마/122/99-V3), 인플루엔자 B 바이러스(B/가도마/122/99-V4), 인플루엔자 B 바이러스(B/가도마/122/99-V5), 인플루엔자 B 바이러스(B/가도마/122/99-V6), 인플루엔자 B 바이러스(B/가도마/122/99-V7), 인플루엔자 B 바이러스(B/가도마/122/99-V8), 인플루엔자 B 바이러스(B/가도마/122/99-V9), 인플루엔자 B 바이러스(B/가도마/136/99), 인플루엔자 B 바이러스(B/가도마/409/2000), 인플루엔자 B 바이러스(B/가도마/506/99), 인플루엔자 B 바이러스(B/가도마/642/99), 인플루엔자 B 바이러스(B/가도마/647/99), 인플루엔자 B 바이러스(B/가고시마/15/94), 인플루엔자 B 바이러스(B/가나가와/73), 인플루엔자 B 바이러스(B/캔사스/1/2005), 인플루엔자 B 바이러스(B/캔사스/22992/99), 인플루엔자 B 바이러스(B/켄터키/4/2005), 인플루엔자 B 바이러스(B/카즈코브/224/91), 인플루엔자 B 바이러스(B/키수무/2036/2006), 인플루엔자 B 바이러스(B/키수무/2037/2006), 인플루엔자 B 바이러스(B/키수무/2038/2006), 인플루엔자 B 바이러스(B/키수무/2039/2006), 인플루엔자 B 바이러스(B/키수무/2040/2006), 인플루엔자 B 바이러스(B/키수무/7/2005), 인플루엔자 B 바이러스(B/고베/1/2002), 인플루엔자 B 바이러스(B/고베/1/2002-V1), 인플루엔자 B 바이러스(B/고베/1/2002-V2), 인플루엔자 B 바이러스(B/고베/1/2003), 인플루엔자 B 바이러스(B/고베/1/94), 인플루엔자 B 바이러스(B/고베/2/2002), 인플루엔자 B 바이러스(B/고베/2/2003), 인플루엔자 B 바이러스(B/고베/25/2003), 인플루엔자 B 바이러스(B/고베/26/2003), 인플루엔자 B 바이러스(B/고베/28/2003), 인플루엔자 B 바이러스(B/고베/3/2002), 인플루엔자 B 바이러스(B/고베/3/2003), 인플루엔자 B 바이러스(B/고베/4/2002), 인플루엔자 B 바이러스(B/고베/4/2003), 인플루엔자 B 바이러스(B/고베/5/2002), 인플루엔자 B 바이러스(B/고베/6/2002), 인플루엔자 B 바이러스(B/고베/64/2001), 인플루엔자 B 바이러스(B/고베/65/2001), 인플루엔자 B 바이러스(B/고베/69/2001), 인플루엔자 B 바이러스(B/고베/7/2002), 인플루엔자 B 바이러스(B/고베/79/2001), 인플루엔자 B 바이러스(B/고베/83/2001), 인플루엔자 B 바이러스(B/고베/87/2001), 인플루엔자 B 바이러스(B/고우치/193/1999), 인플루엔자 B 바이러스(B/고우치/193/99), 인플루엔자 B 바이러스(B/라지오/1/02), 인플루엔자 B 바이러스(B/리/40), 인플루엔자 B 바이러스(B/레닌그라드/129/91), 인플루엔자 B 바이러스(B/레닌그라드/148/91), 인플루엔자 B 바이러스(B/리스본/02/1994), 인플루엔자 B 바이러스(B/리사본/2/90), 인플루엔자 B 바이러스(B/로스엔젤레스/1/02), 인플루엔자 B 바이러스(B/루사카/270/99), 인플루엔자 B 바이러스(B/루사카/432/99), 인플루엔자 B 바이러스(B/리옹/1271/96), 인플루엔자 B 바이러스(B/말레이지아/83077/2001), 인플루엔자 B 바이러스(B/마푸투/1/99), 인플루엔자 B 바이러스(B/마푸투/2/99), 인플루엔자 B 바이러스(B/마드델플라타/595/99), 인플루엔자 B 바이러스(B/마드델플라타/VL373/99), 인플루엔자 B 바이러스(B/마드델플라타/VL385/99), 인플루엔자 B 바이러스(B/메릴랜드/1/01), 인플루엔자 B 바이러스(B/메릴랜드/1/2002), 인플루엔자 B 바이러스(B/메릴랜드/2/2001), 인플루엔자 B 바이러스(B/메릴랜드/7/2003), 인플루엔자 B 바이러스(B/메사츄세츠/1/2004), 인플루엔자 B 바이러스(B/메사츄세츠/2/2004), 인플루엔자 B 바이러스(B/메사츄세츠/3/2004), 인플루엔자 B 바이러스(B/메사츄세츠/4/2001), 인플루엔자 B 바이러스(B/메사츄세츠/5/2003), 인플루엔자 B 바이러스(B/멤피스/1/01), 인플루엔자 B 바이러스(B/멤피스/10/97), 인플루엔자 B 바이러스(B/멤피스/11/2006), 인플루엔자 B 바이러스(B/멤피스/12/2006), 인플루엔자 B 바이러스(B/멤피스/12/97), 인플루엔자 B 바이러스(B/멤피스/12/97-MA), 인플루엔자 B 바이러스(B/멤피스/13/03), 인플루엔자 B 바이러스(B/멤피스/18/95), 인플루엔자 B 바이러스(B/멤피스/19/96), 인플루엔자 B 바이러스(B/멤피스/20/96), 인플루엔자 B 바이러스(B/멤피스/21/96), 인플루엔자 B 바이러스(B/멤피스/28/96), 인플루엔자 B 바이러스(B/멤피스/3/01), 인플루엔자 B 바이러스(B/멤피스/3/89), 인플루엔자 B 바이러스(B/멤피스/3/93), 인플루엔자 B 바이러스(B/멤피스/4/93), 인플루엔자 B 바이러스(B/멤피스/5/93), 인플루엔자 B 바이러스(B/멤피스/7/03), 인플루엔자 B 바이러스(B/멤피스/8/99), 인플루엔자 B 바이러스(B/멕시코/84/2000), 인플루엔자 B 바이러스(B/미시간/04/2006), 인플루엔자 B 바이러스(B/미시간/1/2005), 인플루엔자 B 바이러스(B/미시간/1/2006), 인플루엔자 B 바이러스(B/미시간/2/2004), 인플루엔자 B 바이러스(B/미시간/20/2005), 인플루엔자 B 바이러스(B/미시간/22572/99), 인플루엔자 B 바이러스(B/미시간/22587/99), 인플루엔자 B 바이러스(B/미시간/22596/99), 인플루엔자 B 바이러스(B/미시간/22631/99), 인플루엔자 B 바이러스(B/미시간/22659/99), 인플루엔자 B 바이러스(B/미시간/22687/99), 인플루엔자 B 바이러스(B/미시간/22691/99), 인플루엔자 B 바이러스(B/미시간/22721/99), 인플루엔자 B 바이러스(B/미시간/22723/99), 인플루엔자 B 바이러스(B/미시간/2e/2006), 인플루엔자 B 바이러스(B/미시간/3/2004), 인플루엔자 B 바이러스(B/미시간/4/2006), 인플루엔자 B 바이러스(B/미시간/e3/2006), 인플루엔자 B 바이러스(B/미코나/1/1989), 인플루엔자 B 바이러스(B/미에/01/1993), 인플루엔자 B 바이러스(B/미에/1/93), 인플루엔자 B 바이러스(B/밀라노/1/01), 인플루엔자 B 바이러스(B/밀라노/1/02), 인플루엔자 B 바이러스(B/밀라노/5/02), 인플루엔자 B 바이러스(B/밀라노/6/02), 인플루엔자 B 바이러스(B/밀라노/66/04), 인플루엔자 B 바이러스(B/밀라노/7/02), 인플루엔자 B 바이러스(B/미네소타/1/1985), 인플루엔자 B 바이러스(B/미네소타/14/2001), 인플루엔자 B 바이러스(B/미네소타/2/2001), 인플루엔자 B 바이러스(B/민스크/318/90), 인플루엔자 B 바이러스(B/미시시피/1/2001), 인플루엔자 B 바이러스(B/미시시피/2/2005), 인플루엔자 B 바이러스(B/미시시피/3/2001), 인플루엔자 B 바이러스(B/미시시피/3/2005), 인플루엔자 B 바이러스(B/미시시피/4/2003), 인플루엔자 B 바이러스(B/미시시피/4e/2005), 인플루엔자 B 바이러스(B/미주리/1/2006), 인플루엔자 B 바이러스(B/미주리/11/2003), 인플루엔자 B 바이러스(B/미주리/2/2005), 인플루엔자 B 바이러스(B/미주리/20/2003), 인플루엔자 B 바이러스(B/미주리/6/2005), 인플루엔자 B 바이러스(B/몬타나/1/2003), 인플루엔자 B 바이러스(B/몬타나/1/2006), 인플루엔자 B 바이러스(B/몬타나/1e/2004), 인플루엔자 B 바이러스(B/모스크바/16/2002), 인플루엔자 B 바이러스(B/모스크바/3/03), 인플루엔자 B 바이러스(B/나고야/20/99), 인플루엔자 B 바이러스(B/나이로비/2032/2006), 인플루엔자 B 바이러스(B/나이로비/2033/2006), 인플루엔자 B 바이러스(B/나이로비/2034/2006), 인플루엔자 B 바이러스(B/나이로비/2035/2006), 인플루엔자 B 바이러스(B/나이로비/351/2005), 인플루엔자 B 바이러스(B/나이로비/670/2005), 인플루엔자 B 바이러스(B/난창/1/00), 인플루엔자 B 바이러스(B/난창/1/2000), 인플루엔자 B 바이러스(B/난창/12/98), 인플루엔자 B 바이러스(B/난창/15/95), 인플루엔자 B 바이러스(B/난창/15/97), 인플루엔자 B 바이러스(B/난창/195/94), 인플루엔자 B 바이러스(B/난창/2/97), 인플루엔자 B 바이러스(B/난창/20/96), 인플루엔자 B 바이러스(B/난창/26/93), 인플루엔자 B 바이러스(B/난창/3/95), 인플루엔자 B 바이러스(B/난창/4/97), 인플루엔자 B 바이러스(B/난창/480/94), 인플루엔자 B 바이러스(B/난창/5/97), 인플루엔자 B 바이러스(B/난창/560/94), 인플루엔자 B 바이러스(B/난창/560a/94), 인플루엔자 B 바이러스(B/난창/560b/94), 인플루엔자 B 바이러스(B/난창/6/96), 인플루엔자 B 바이러스(B/난창/6/98), 인플루엔자 B 바이러스(B/난창/630/94), 인플루엔자 B 바이러스(B/난창/7/98), 인플루엔자 B 바이러스(B/난창/8/95), 인플루엔자 B 바이러스(B/나쉬빌/107/93), 인플루엔자 B 바이러스(B/나쉬빌/3/96), 인플루엔자 B 바이러스(B/나쉬빌/34/96), 인플루엔자 B 바이러스(B/나쉬빌/45/91), 인플루엔자 B 바이러스(B/나쉬빌/48/91), 인플루엔자 B 바이러스(B/나쉬빌/6/89), 인플루엔자 B 바이러스(B/네브라스카/1/01), 인플루엔자 B 바이러스(B/네브라스카/1/2005), 인플루엔자 B 바이러스(B/네브라스카/2/01), 인플루엔자 B 바이러스(B/네브라스카/4/2001), 인플루엔자 B 바이러스(B/네브라스카/5/2003), 인플루엔자 B 바이러스(B/네팔/1078/2005), 인플루엔자 B 바이러스(B/네팔/1079/2005), 인플루엔자 B 바이러스(B/네팔/1080/2005), 인플루엔자 B 바이러스(B/네팔/1087/2005), 인플루엔자 B 바이러스(B/네팔/1088/2005), 인플루엔자 B 바이러스(B/네팔/1089/2005), 인플루엔자 B 바이러스(B/네팔/1090/2005), 인플루엔자 B 바이러스(B/네팔/1092/2005), 인플루엔자 B 바이러스(B/네팔/1098/2005), 인플루엔자 B 바이러스(B/네팔/1101/2005), 인플루엔자 B 바이러스(B/네팔/1103/2005), 인플루엔자 B 바이러스(B/네팔/1104/2005), 인플루엔자 B 바이러스(B/네팔/1105/2005), 인플루엔자 B 바이러스(B/네팔/1106/2005), 인플루엔자 B 바이러스(B/네팔/1108/2005), 인플루엔자 B 바이러스(B/네팔/1114/2005), 인플루엔자 B 바이러스(B/네팔/1117/2005), 인플루엔자 B 바이러스(B/네팔/1118/2005), 인플루엔자 B 바이러스(B/네팔/1120/2005), 인플루엔자 B 바이러스(B/네팔/1122/2005), 인플루엔자 B 바이러스(B/네팔/1131/2005), 인플루엔자 B 바이러스(B/네팔/1132/2005), 인플루엔자 B 바이러스(B/네팔/1136/2005), 인플루엔자 B 바이러스(B/네팔/1137/2005), 인플루엔자 B 바이러스(B/네팔/1138/2005), 인플루엔자 B 바이러스(B/네팔/1139/2005), 인플루엔자 B 바이러스(B/네팔/1331/2005), 인플루엔자 B 바이러스(B/네덜란드/2781/90), 인플루엔자 B 바이러스(B/네덜란드/6357/90), 인플루엔자 B 바이러스(B/네덜란드/800/90), 인플루엔자 B 바이러스(B/네덜란드/801/90), 인플루엔자 B 바이러스(B/네덜란드/1/97), 인플루엔자 B 바이러스(B/네덜란드/13/94), 인플루엔자 B 바이러스(B/네덜란드/2/95), 인플루엔자 B 바이러스(B/네덜란드/31/95), 인플루엔자 B 바이러스(B/네덜란드/32/94), 인플루엔자 B 바이러스(B/네덜란드/384/95), 인플루엔자 B 바이러스(B/네덜란드/429/98), 인플루엔자 B 바이러스(B/네덜란드/580/89), 인플루엔자 B 바이러스(B/네덜란드/6/96), 인플루엔자 B 바이러스(B/네바다/1/2001), 인플루엔자 B 바이러스(B/네바다/1/2002), 인플루엔자 B 바이러스(B/네바다/1/2005), 인플루엔자 B 바이러스(B/네바다/1/2006), 인플루엔자 B 바이러스(B/네바다/2/2003), 인플루엔자 B 바이러스(B/네바다/2/2006), 인플루엔자 B 바이러스(B/네바다/3/2006), 인플루엔자 B 바이러스(B/네바다/5/2005), 인플루엔자 B 바이러스(B/뉴저지/1/2002), 인플루엔자 B 바이러스(B/뉴저지/1/2004), 인플루엔자 B 바이러스(B/뉴저지/1/2005), 인플루엔자 B 바이러스(B/뉴저지/1/2006), 인플루엔자 B 바이러스(B/뉴저지/3/2001), 인플루엔자 B 바이러스(B/뉴저지/3/2005), 인플루엔자 B 바이러스(B/뉴저지/4/2001), 인플루엔자 B 바이러스(B/뉴저지/5/2005), 인플루엔자 B 바이러스(B/뉴저지/6/2005), 인플루엔자 B 바이러스(B/뉴멕시코/1/2001), 인플루엔자 B 바이러스(B/뉴멕시코/1/2006), 인플루엔자 B 바이러스(B/뉴멕시코/2/2005), 인플루엔자 B 바이러스(B/뉴멕시코/9/2003), 인플루엔자 B 바이러스(B/뉴욕/1/2001), 인플루엔자 B 바이러스(B/뉴욕/1/2002), 인플루엔자 B 바이러스(B/뉴욕/1/2004), 인플루엔자 B 바이러스(B/뉴욕/1/2006), 인플루엔자 B 바이러스(B/뉴욕/10/2002), 인플루엔자 B 바이러스(B/뉴욕/11/2005), 인플루엔자 B 바이러스(B/뉴욕/12/2001), 인플루엔자 B 바이러스(B/뉴욕/12/2005), 인플루엔자 B 바이러스(B/뉴욕/12e/2005), 인플루엔자 B 바이러스(B/뉴욕/14e/2005), 인플루엔자 B 바이러스(B/뉴욕/17/2004), 인플루엔자 B 바이러스(B/뉴욕/18/2003), 인플루엔자 B 바이러스(B/뉴욕/19/2004), 인플루엔자 B 바이러스(B/뉴욕/2/2000), 인플루엔자 B 바이러스(B/뉴욕/2/2002), 인플루엔자 B 바이러스(B/뉴욕/2/2006), 인플루엔자 B 바이러스(B/뉴욕/20139/99), 인플루엔자 B 바이러스(B/뉴욕/24/1993), 인플루엔자 B 바이러스(B/뉴욕/2e/2005), 인플루엔자 B 바이러스(B/뉴욕/3/90), 인플루엔자 B 바이러스(B/뉴욕/39/1991), 인플루엔자 B 바이러스(B/뉴욕/40/2002), 인플루엔자 B 바이러스(B/뉴욕/47/2001), 인플루엔자 B 바이러스(B/뉴욕/6/2004), 인플루엔자 B 바이러스(B/뉴욕/7/2002), 인플루엔자 B 바이러스(B/뉴욕/8/2000), 인플루엔자 B 바이러스(B/뉴욕/9/2002), 인플루엔자 B 바이러스(B/뉴욕/9/2004), 인플루엔자 B 바이러스(B/뉴욕/C10/2004), 인플루엔자 B 바이러스(B/NIB/48/90), 인플루엔자 B 바이러스(B/닝샤/45/83), 인플루엔자 B 바이러스(B/노쓰캐롤라이나/1/2005), 인플루엔자 B 바이러스(B/노쓰캐롤라이나/3/2005), 인플루엔자 B 바이러스(B/노쓰캐롤라이나/4/2004), 인플루엔자 B 바이러스(B/노쓰캐롤라이나/5/2004), 인플루엔자 B 바이러스(B/노르웨이/1/84), 인플루엔자 B 바이러스(B/오하이오/1/2005), 인플루엔자 B 바이러스(B/오하이오/1/X-19/2005), 인플루엔자 B 바이러스(B/오하이오/1e/2005), 인플루엔자 B 바이러스(B/오하이오/1e4/2005), 인플루엔자 B 바이러스(B/오하이오/2/2002), 인플루엔자 B 바이러스(B/오하이오/2e/2005), 인플루엔자 B 바이러스(B/오이타/15/1992), 인플루엔자 B 바이러스(B/오클라호마/1/2006), 인플루엔자 B 바이러스(B/오클라호마/2/2005), 인플루엔자 B 바이러스(B/오만/16291/2001), 인플루엔자 B 바이러스(B/오만/16296/2001), 인플루엔자 B 바이러스(B/오만/16299/2001), 인플루엔자 B 바이러스(B/오만/16305/2001), 인플루엔자 B 바이러스(B/오레곤/1/2005), 인플루엔자 B 바이러스(B/오레곤/1/2006), 인플루엔자 B 바이러스(B/오레곤/5/80), 인플루엔자 B 바이러스(B/오사카/1036/97), 인플루엔자 B 바이러스(B/오사카/1058/97), 인플루엔자 B 바이러스(B/오사카/1059/97), 인플루엔자 B 바이러스(B/오사카/1146/1997), 인플루엔자 B 바이러스(B/오사카/1169/97), 인플루엔자 B 바이러스(B/오사카/1201/2000), 인플루엔자 B 바이러스(B/오사카/547/1997), 인플루엔자 B 바이러스(B/오사카/547/97), 인플루엔자 B 바이러스(B/오사카/710/1997), 인플루엔자 B 바이러스(B/오사카/711/97), 인플루엔자 B 바이러스(B/오사카/728/1997), 인플루엔자 B 바이러스(B/오사카/755/1997), 인플루엔자 B 바이러스(B/오사카/820/1997), 인플루엔자 B 바이러스(B/오사카/837/1997), 인플루엔자 B 바이러스(B/오사카/854/1997), 인플루엔자 B 바이러스(B/오사카/983/1997), 인플루엔자 B 바이러스(B/오사카/983/1997-M1), 인플루엔자 B 바이러스(B/오사카/983/1997-M2), 인플루엔자 B 바이러스(B/오사카/983/97-V1), 인플루엔자 B 바이러스(B/오사카/983/97-V2), 인플루엔자 B 바이러스(B/오사카/983/97-V3), 인플루엔자 B 바이러스(B/오사카/983/97-V4), 인플루엔자 B 바이러스(B/오사카/983/97-V5), 인플루엔자 B 바이러스(B/오사카/983/97-V6), 인플루엔자 B 바이러스(B/오사카/983/97-V7), 인플루엔자 B 바이러스(B/오사카/983/97-V8), 인플루엔자 B 바이러스(B/오사카/c19/93), 인플루엔자 B 바이러스(B/오슬로/1072/2001), 인플루엔자 B 바이러스(B/오슬로/1329/2002), 인플루엔자 B 바이러스(B/오슬로/1510/2002), 인플루엔자 B 바이러스(B/오슬로/1846/2002), 인플루엔자 B 바이러스(B/오슬로/1847/2002), 인플루엔자 B 바이러스(B/오슬로/1862/2001), 인플루엔자 B 바이러스(B/오슬로/1864/2001), 인플루엔자 B 바이러스(B/오슬로/1870/2002), 인플루엔자 B 바이러스(B/오슬로/1871/2002), 인플루엔자 B 바이러스(B/오슬로/2293/2001), 인플루엔자 B 바이러스(B/오슬로/2295/2001), 인플루엔자 B 바이러스(B/오슬로/2297/2001), 인플루엔자 B 바이러스(B/오슬로/238/2001), 인플루엔자 B 바이러스(B/오슬로/3761/2000), 인플루엔자 B 바이러스(B/오슬로/47/2001), 인플루엔자 B 바이러스(B/오슬로/668/2002), 인플루엔자 B 바이러스(B/오슬로/71/04), 인플루엔자 B 바이러스(B/오슬로/801/99), 인플루엔자 B 바이러스(B/오슬로/805/99), 인플루엔자 B 바이러스(B/오슬로/837/99), 인플루엔자 B 바이러스(B/파나마/45/1990), 인플루엔자 B 바이러스(B/파나마/45/90), 인플루엔자 B 바이러스(B/파라과이/636/2003), 인플루엔자 B 바이러스(B/파리/329/90), 인플루엔자 B 바이러스(B/파리/549/1999), 인플루엔자 B 바이러스(B/파마/1/03), 인플루엔자 B 바이러스(B/파마/1/04), 인플루엔자 B 바이러스(B/파마/13/02), 인플루엔자 B 바이러스(B/파마/16/02), 인플루엔자 B 바이러스(B/파마/2/03), 인플루엔자 B 바이러스(B/파마/2/04), 인플루엔자 B 바이러스(B/파마/23/02), 인플루엔자 B 바이러스(B/파마/24/02), 인플루엔자 B 바이러스(B/파마/25/02), 인플루엔자 B 바이러스(B/파마/28/02), 인플루엔자 B 바이러스(B/파마/3/04), 인플루엔자 B 바이러스(B/파마/4/04), 인플루엔자 B 바이러스(B/파마/5/02), 인플루엔자 B 바이러스(B/펜실베니아/1/2006), 인플루엔자 B 바이러스(B/펜실베니아/2/2001), 인플루엔자 B 바이러스(B/펜실베니아/2/2006), 인플루엔자 B 바이러스(B/펜실베니아/3/2003), 인플루엔자 B 바이러스(B/펜실베니아/3/2006), 인플루엔자 B 바이러스(B/펜실베니아/4/2004), 인플루엔자 B 바이러스(B/퍼스/211/2001), 인플루엔자 B 바이러스(B/퍼스/25/2002), 인플루엔자 B 바이러스(B/페루/1324/2004), 인플루엔자 B 바이러스(B/페루/1364/2004), 인플루엔자 B 바이러스(B/페루자/4/03), 인플루엔자 B 바이러스(B/필리핀/5072/2001), 인플루엔자 B 바이러스(B/필리핀/93079/2001), 인플루엔자 B 바이러스(B/부산/250/99), 인플루엔자 B 바이러스(B/부산/255/99), 인플루엔자 B 바이러스(B/부산/270/99), 인플루엔자 B 바이러스(B/부산/285/99), 인플루엔자 B 바이러스(B/퀘벡/1/01), 인플루엔자 B 바이러스(B/퀘벡/162/98), 인플루엔자 B 바이러스(B/퀘벡/173/98), 인플루엔자 B 바이러스(B/퀘벡/2/01), 인플루엔자 B 바이러스(B/퀘벡/3/01), 인플루엔자 B 바이러스(B/퀘벡/4/01), 인플루엔자 B 바이러스(B/퀘벡/452/98), 인플루엔자 B 바이러스(B/퀘벡/453/98), 인플루엔자 B 바이러스(B/퀘벡/465/98), 인플루엔자 B 바이러스(B/퀘벡/51/98), 인플루엔자 B 바이러스(B/퀘벡/511/98), 인플루엔자 B 바이러스(B/퀘벡/514/98), 인플루엔자 B 바이러스(B/퀘벡/517/98), 인플루엔자 B 바이러스(B/퀘벡/6/01), 인플루엔자 B 바이러스(B/퀘벡/7/01), 인플루엔자 B 바이러스(B/퀘벡/74199/99), 인플루엔자 B 바이러스(B/퀘벡/74204/99), 인플루엔자 B 바이러스(B/퀘벡/74206/99), 인플루엔자 B 바이러스(B/퀘벡/8/01), 인플루엔자 B 바이러스(B/퀘벡/9/01), 인플루엔자 B 바이러스(B/라밧/41/97), 인플루엔자 B 바이러스(B/라밧/45/97), 인플루엔자 B 바이러스(B/라밧/61/97), 인플루엔자 B 바이러스(B/리오데자네이루/200/02), 인플루엔자 B 바이러스(B/리오데자네이루/209/02), 인플루엔자 B 바이러스(B/리오데자이네루/315/01), 인플루엔자 B 바이러스(B/리오데자네이루/353/02), 인플루엔자 B 바이러스(B/리오데자네이루/354/02), 인플루엔자 B 바이러스(B/리오그란데술/337/01), 인플루엔자 B 바이러스(B/리오그란데도술/357/02), 인플루엔자 B 바이러스(B/리오그란데도술/374/01), 인플루엔자 B 바이러스(B/로마/1/03), 인플루엔자 B 바이러스(B/로마/2/03), 인플루엔자 B 바이러스(B/로마/3/03), 인플루엔자 B 바이러스(B/로마/4/02), 인플루엔자 B 바이러스(B/로마/7/02), 인플루엔자 B 바이러스(B/루마니아/217/1999), 인플루엔자 B 바이러스(B/루마니아/318/1998), 인플루엔자 B 바이러스(B/러시아/22/1995), 인플루엔자 B 바이러스(B/사가/S172/99), 인플루엔자 B 바이러스(B/씨일/네덜란드/1/99), 인플루엔자 B 바이러스(B/서울/1/89), 인플루엔자 B 바이러스(B/서울/1163/2004), 인플루엔자 B 바이러스(B/서울/12/88), 인플루엔자 B 바이러스(B/서울/12/95), 인플루엔자 B 바이러스(B/서울/13/95), 인플루엔자 B 바이러스(B/서울/16/97), 인플루엔자 B 바이러스(B/서울/17/95), 인플루엔자 B 바이러스(B/서울/19/97), 인플루엔자 B 바이러스(B/서울/21/95), 인플루엔자 B 바이러스(B/서울/232/2004), 인플루엔자 B 바이러스(B/서울/28/97), 인플루엔자 B 바이러스(B/서울/31/97), 인플루엔자 B 바이러스(B/서울/37/91), 인플루엔자 B 바이러스(B/서울/38/91), 인플루엔자 B 바이러스(B/서울/40/91), 인플루엔자 B 바이러스(B/서울/41/91), 인플루엔자 B 바이러스(B/서울/6/88), 인플루엔자 B 바이러스(B/산둥/7/97), 인플루엔자 B 바이러스(B/산둥/7/97), 인플루엔자 B 바이러스(B/상하이/1/77), 인플루엔자 B 바이러스(B/상하이/10/80), 인플루엔자 B 바이러스(B/상하이/24/76), 인플루엔자 B 바이러스(B/상하이/35/84), 인플루엔자 B 바이러스(B/상하이/361/03), 인플루엔자 B 바이러스(B/상하이/361/2002), 인플루엔자 B 바이러스(B/선전/423/99), 인플루엔자 B 바이러스(B/시가/51/98), 인플루엔자 B 바이러스(B/시가/N18/98), 인플루엔자 B 바이러스(B/시가/T30/98), 인플루엔자 B 바이러스(B/시가/T37/98), 인플루엔자 B 바이러스(B/시즈오카/15/2001), 인플루엔자 B 바이러스(B/시즈오카/480/2000), 인플루엔자 B 바이러스(B/쓰촨/281/96), 인플루엔자 B 바이러스(B/쓰촨/317/2001), 인플루엔자 B 바이러스(B/쓰촨/379/99), 인플루엔자 B 바이러스(B/쓰촨/38/2000), 인플루엔자 B 바이러스(B/쓰촨/8/92), 인플루엔자 B 바이러스(B/시에나/1/02), 인플루엔자 B 바이러스(B/싱가포르/04/1991), 인플루엔자 B 바이러스(B/싱가포르/11/1994), 인플루엔자 B 바이러스(B/싱가포르/22/1998), 인플루엔자 B 바이러스(B/싱가포르/222/79), 인플루엔자 B 바이러스(B/싱가포르/31/1998), 인플루엔자 B 바이러스(B/싱가포르/35/1998), 인플루엔자 B 바이러스(B/사우쓰오스트레일리아/5/1999), 인플루엔자 B 바이러스(B/사우쓰캐롤라이나/04/2003), 인플루엔자 B 바이러스(B/사우쓰캐롤라이나/25723/99), 인플루엔자 B 바이러스(B/사우쓰캐롤라이나/3/2003), 인플루엔자 B 바이러스(B/사우쓰캐롤라이나/4/2003), 인플루엔자 B 바이러스(B/사우쓰다코타/1/2000), 인플루엔자 B 바이러스(B/사우쓰다코타/3/2003), 인플루엔자 B 바이러스(B/사우쓰다코타/5/89), 인플루엔자 B 바이러스(B/스페인/WV22/2002), 인플루엔자 B 바이러스(B/스페인/WV26/2002), 인플루엔자 B 바이러스(B/스페인/WV27/2002), 인플루엔자 B 바이러스(B/스페인/WV29/2002), 인플루엔자 B 바이러스(B/스페인/WV33/2002), 인플루엔자 B 바이러스(B/스페인/WV34/2002), 인플루엔자 B 바이러스(B/스페인/WV36/2002), 인플루엔자 B 바이러스(B/스페인/WV41/2002), 인플루엔자 B 바이러스(B/스페인/WV42/2002), 인플루엔자 B 바이러스(B/스페인/WV43/2002), 인플루엔자 B 바이러스(B/스페인/WV45/2002), 인플루엔자 B 바이러스(B/스페인/WV50/2002), 인플루엔자 B 바이러스(B/스페인/WV51/2002), 인플루엔자 B 바이러스(B/스페인/WV56/2002), 인플루엔자 B 바이러스(B/스페인/WV57/2002), 인플루엔자 B 바이러스(B/스페인/WV65/2002), 인플루엔자 B 바이러스(B/스페인/WV66/2002), 인플루엔자 B 바이러스(B/스페인/WV67/2002), 인플루엔자 B 바이러스(B/스페인/WV69/2002), 인플루엔자 B 바이러스(B/스페인/WV70/2002), 인플루엔자 B 바이러스(B/스페인/WV73/2002), 인플루엔자 B 바이러스(B/스페인/WV78/2002), 인플루엔자 B 바이러스(B/세인트 피터스버그/14/2006), 인플루엔자 B 바이러스(B/산타카타리나/308/02), 인플루엔자 B 바이러스(B/산타카타리나/315/02), 인플루엔자 B 바이러스(B/산타카타리나/318/02), 인플루엔자 B 바이러스(B/산타카타리나/345/02), 인플루엔자 B 바이러스(B/스톡홀름/10/90), 인플루엔자 B 바이러스(B/스즈카/18/2005), 인플루엔자 B 바이러스(B/스즈카/28/2005), 인플루엔자 B 바이러스(B/스즈카/32/2005), 인플루엔자 B 바이러스(B/스즈카/58/2005), 인플루엔자 B 바이러스(B/스위스/4291/97), 인플루엔자 B 바이러스(B/스위스/5219/90), 인플루엔자 B 바이러스(B/스위스/5241/90), 인플루엔자 B 바이러스(B/스위스/5441/90), 인플루엔자 B 바이러스(B/스위스/5444/90), 인플루엔자 B 바이러스(B/스위스/5812/90), 인플루엔자 B 바이러스(B/스위스/6121/90), 인플루엔자 B 바이러스(B/대만/0002/03), 인플루엔자 B 바이러스(B/대만/0114/01), 인플루엔자 B 바이러스(B/대만/0202/01), 인플루엔자 B 바이러스(B/대만/0409/00), 인플루엔자 B 바이러스(B/대만/0409/02), 인플루엔자 B 바이러스(B/대만/0562/03), 인플루엔자 B 바이러스(B/대만/0569/03), 인플루엔자 B 바이러스(B/대만/0576/03), 인플루엔자 B 바이러스(B/대만/0600/02), 인플루엔자 B 바이러스(B/대만/0610/03), 인플루엔자 B 바이러스(B/대만/0615/03), 인플루엔자 B 바이러스(B/대만/0616/03), 인플루엔자 B 바이러스(B/대만/0654/02), 인플루엔자 B 바이러스(B/대만/0684/03), 인플루엔자 B 바이러스(B/대만/0699/03), 인플루엔자 B 바이러스(B/대만/0702/02), 인플루엔자 B 바이러스(B/대만/0722/02), 인플루엔자 B 바이러스(B/대만/0730/02), 인플루엔자 B 바이러스(B/대만/0735/03), 인플루엔자 B 바이러스(B/대만/0833/03), 인플루엔자 B 바이러스(B/대만/0874/02), 인플루엔자 B 바이러스(B/대만/0879/02), 인플루엔자 B 바이러스(B/대만/0880/02), 인플루엔자 B 바이러스(B/대만/0927/02), 인플루엔자 B 바이러스(B/대만/0932/02), 인플루엔자 B 바이러스(B/대만/0993/02), 인플루엔자 B 바이러스(B/대만/1013/02), 인플루엔자 B 바이러스(B/대만/1013/03), 인플루엔자 B 바이러스(B/대만/102/2005), 인플루엔자 B 바이러스(B/대만/103/2005), 인플루엔자 B 바이러스(B/대만/110/2005), 인플루엔자 B 바이러스(B/대만/1103/2001), 인플루엔자 B 바이러스(B/대만/114/2001), 인플루엔자 B 바이러스(B/대만/11515/2001), 인플루엔자 B 바이러스(B/대만/117/2005), 인플루엔자 B 바이러스(B/대만/1197/1994), 인플루엔자 B 바이러스(B/대만/121/2005), 인플루엔자 B 바이러스(B/대만/12192/2000), 인플루엔자 B 바이러스(B/대만/1243/99), 인플루엔자 B 바이러스(B/대만/1265/2000), 인플루엔자 B 바이러스(B/대만/1293/2000), 인플루엔자 B 바이러스(B/대만/13/2004), 인플루엔자 B 바이러스(B/대만/14/2004), 인플루엔자 B 바이러스(B/대만/1484/2001), 인플루엔자 B 바이러스(B/대만/1502/02), 인플루엔자 B 바이러스(B/대만/1503/02), 인플루엔자 B 바이러스(B/대만/1534/02), 인플루엔자 B 바이러스(B/대만/1536/02), 인플루엔자 B 바이러스(B/대만/1561/02), 인플루엔자 B 바이러스(B/대만/1574/03), 인플루엔자 B 바이러스(B/대만/1584/02), 인플루엔자 B 바이러스(B/대만/16/2004), 인플루엔자 B 바이러스(B/대만/1618/03), 인플루엔자 B 바이러스(B/대만/165/2005), 인플루엔자 B 바이러스(B/대만/166/2005), 인플루엔자 B 바이러스(B/대만/188/2005), 인플루엔자 B 바이러스(B/대만/1949/02), 인플루엔자 B 바이러스(B/대만/1950/02), 인플루엔자 B 바이러스(B/대만/202/2001), 인플루엔자 B 바이러스(B/대만/2026/99), 인플루엔자 B 바이러스(B/대만/2027/99), 인플루엔자 B 바이러스(B/대만/217/97), 인플루엔자 B 바이러스(B/대만/21706/97), 인플루엔자 B 바이러스(B/대만/2195/99), 인플루엔자 B 바이러스(B/대만/2551/03), 인플루엔자 B 바이러스(B/대만/2805/01), 인플루엔자 B 바이러스(B/대만/2805/2001), 인플루엔자 B 바이러스(B/대만/3143/97), 인플루엔자 B 바이러스(B/대만/31511/00), 인플루엔자 B 바이러스(B/대만/31511/2000), 인플루엔자 B 바이러스(B/대만/34/2004), 인플루엔자 B 바이러스(B/대만/3532/03), 인플루엔자 B 바이러스(B/대만/39/2004), 인플루엔자 B 바이러스(B/대만/41010/00), 인플루엔자 B 바이러스(B/대만/41010/2000), 인플루엔자 B 바이러스(B/대만/4119/02), 인플루엔자 B 바이러스(B/대만/4184/00), 인플루엔자 B 바이러스(B/대만/4184/2000), 인플루엔자 B 바이러스(B/대만/43/2005), 인플루엔자 B 바이러스(B/대만/4602/02), 인플루엔자 B 바이러스(B/대만/473/2005), 인플루엔자 B 바이러스(B/대만/52/2004), 인플루엔자 B 바이러스(B/대만/52/2005), 인플루엔자 B 바이러스(B/대만/54/2004), 인플루엔자 B 바이러스(B/대만/61/2004), 인플루엔자 B 바이러스(B/대만/635/2005), 인플루엔자 B 바이러스(B/대만/637/2005), 인플루엔자 B 바이러스(B/대만/68/2004), 인플루엔자 B 바이러스(B/대만/68/2005), 인플루엔자 B 바이러스(B/대만/69/2004), 인플루엔자 B 바이러스(B/대만/70/2005), 인플루엔자 B 바이러스(B/대만/74/2004), 인플루엔자 B 바이러스(B/대만/75/2004), 인플루엔자 B 바이러스(B/대만/77/2005), 인플루엔자 B 바이러스(B/대만/81/2005), 인플루엔자 B 바이러스(B/대만/872/2005), 인플루엔자 B 바이러스(B/대만/97271/2001), 인플루엔자 B 바이러스(B/대만/98/2005), 인플루엔자 B 바이러스(B/대만/H96/02), 인플루엔자 B 바이러스(B/대만/M214/05), 인플루엔자 B 바이러스(B/대만/M227/05), 인플루엔자 B 바이러스(B/대만/M24/04), 인플루엔자 B 바이러스(B/대만/M244/05), 인플루엔자 B 바이러스(B/대만/M251/05), 인플루엔자 B 바이러스(B/대만/M53/05), 인플루엔자 B 바이러스(B/대만/M71/01), 인플루엔자 B 바이러스(B/대만/N1013/99), 인플루엔자 B 바이러스(B/대만/N1115/02), 인플루엔자 B 바이러스(B/대만/N1207/99), 인플루엔자 B 바이러스(B/대만/N1316/01), 인플루엔자 B 바이러스(B/대만/N1549/01), 인플루엔자 B 바이러스(B/대만/N1582/02), 인플루엔자 B 바이러스(B/대만/N16/03), 인플루엔자 B 바이러스(B/대만/N1619/04), 인플루엔자 B 바이러스(B/대만/N1848/02), 인플루엔자 B 바이러스(B/대만/N1902/04), 인플루엔자 B 바이러스(B/대만/N200/05), 인플루엔자 B 바이러스(B/대만/N2050/02), 인플루엔자 B 바이러스(B/대만/N230/01), 인플루엔자 B 바이러스(B/대만/N232/00), 인플루엔자 B 바이러스(B/대만/N2333/02), 인플루엔자 B 바이러스(B/대만/N2335/01), 인플루엔자 B 바이러스(B/대만/N253/03), 인플루엔자 B 바이러스(B/대만/N2620/04), 인플루엔자 B 바이러스(B/대만/N2986/02), 인플루엔자 B 바이러스(B/대만/N3688/04), 인플루엔자 B 바이러스(B/대만/N371/05), 인플루엔자 B 바이러스(B/대만/N376/05), 인플루엔자 B 바이러스(B/대만/N384/03), 인플루엔자 B 바이러스(B/대만/N3849/02), 인플루엔자 B 바이러스(B/대만/N404/02), 인플루엔자 B 바이러스(B/대만/N473/00), 인플루엔자 B 바이러스(B/대만/N511/01), 인플루엔자 B 바이러스(B/대만/N559/05), 인플루엔자 B 바이러스(B/대만/N612/01), 인플루엔자 B 바이러스(B/대만/N701/01), 인플루엔자 B 바이러스(B/대만/N767/01), 인플루엔자 B 바이러스(B/대만/N798/05), 인플루엔자 B 바이러스(B/대만/N860/05), 인플루엔자 B 바이러스(B/대만/N872/04), 인플루엔자 B 바이러스(B/대만/N913/04), 인플루엔자 B 바이러스(B/대만/S117/05), 인플루엔자 B 바이러스(B/대만/S141/02), 인플루엔자 B 바이러스(B/대만/S76/02), 인플루엔자 B 바이러스(B/대만/S82/02), 인플루엔자 B 바이러스(B/대만/103/2005), 인플루엔자 B 바이러스(B/테헤란/80/02), 인플루엔자 B 바이러스(B/템플/B10/1999), 인플루엔자 B 바이러스(B/템플/B1166/2001), 인플루엔자 B 바이러스(B/템플/B1181/2001), 인플루엔자 B 바이러스(B/템플/B1182/2001), 인플루엔자 B 바이러스(B/템플/B1188/2001), 인플루엔자 B 바이러스(B/템플/B1190/2001), 인플루엔자 B 바이러스(B/템플/B1193/2001), 인플루엔자 B 바이러스(B/템플/B17/2003), 인플루엔자 B 바이러스(B/템플/B18/2003), 인플루엔자 B 바이러스(B/템플/B19/2003), 인플루엔자 B 바이러스(B/템플/B20/2003), 인플루엔자 B 바이러스(B/템플/B21/2003), 인플루엔자 B 바이러스(B/템플/B24/2003), 인플루엔자 B 바이러스(B/템플/B3/1999), 인플루엔자 B 바이러스(B/템플/B30/2003), 인플루엔자 B 바이러스(B/템플/B7/1999), 인플루엔자 B 바이러스(B/템플/B8/1999), 인플루엔자 B 바이러스(B/템플/B9/1999), 인플루엔자 B 바이러스(B/텍사스/06/2000), 인플루엔자 B 바이러스(B/텍사스/1/2000), 인플루엔자 B 바이러스(B/텍사스/1/2004), 인플루엔자 B 바이러스(B/텍사스/1/2006), 인플루엔자 B 바이러스(B/텍사스/1/91), 인플루엔자 B 바이러스(B/텍사스/10/2005), 인플루엔자 B 바이러스(B/텍사스/11/2001), 인플루엔자 B 바이러스(B/텍사스/12/2001), 인플루엔자 B 바이러스(B/텍사스/14/1991), 인플루엔자 B 바이러스(B/텍사스/14/2001), 인플루엔자 B 바이러스(B/텍사스/16/2001), 인플루엔자 B 바이러스(B/텍사스/18/2001), 인플루엔자 B 바이러스(B/텍사스/2/2006), 인플루엔자 B 바이러스(B/텍사스/22/2001), 인플루엔자 B 바이러스(B/텍사스/23/2000), 인플루엔자 B 바이러스(B/텍사스/3/2001), 인플루엔자 B 바이러스(B/텍사스/3/2002), 인플루엔자 B 바이러스(B/텍사스/3/2006), 인플루엔자 B 바이러스(B/텍사스/37/1988), 인플루엔자 B 바이러스(B/텍사스/37/88), 인플루엔자 B 바이러스(B/텍사스/4/2006), 인플루엔자 B 바이러스(B/텍사스/4/90), 인플루엔자 B 바이러스(B/텍사스/5/2002), 인플루엔자 B 바이러스(B/텍사스/57/2002), 인플루엔자 B 바이러스(B/텍사스/6/2000), 인플루엔자 B 바이러스(B/도꾸시마/101/93), 인플루엔자 B 바이러스(B/동경/6/98), 인플루엔자 B 바이러스(B/트렌토/3/02), 인플루엔자 B 바이러스(B/트리에스테/1/02), 인플루엔자 B 바이러스(B/트리에스테/1/03), 인플루엔자 B 바이러스(B/트리에스테/15/02), 인플루엔자 B 바이러스(B/트리에스테/17/02), 인플루엔자 B 바이러스(B/트리에스테/19/02), 인플루엔자 B 바이러스(B/트리에스테/2/03), 인플루엔자 B 바이러스(B/트리에스테/25/02), 인플루엔자 B 바이러스(B/트리에스테/27/02), 인플루엔자 B 바이러스(B/트리에스테/28/02), 인플루엔자 B 바이러스(B/트리에스테/34/02), 인플루엔자 B 바이러스(B/트리에스테/37/02), 인플루엔자 B 바이러스(B/트리에스테/4/02), 인플루엔자 B 바이러스(B/트리에스테/8/02), 인플루엔자 B 바이러스(B/트리에스테 14/02), 인플루엔자 B 바이러스(B/트리에스테 18/02), 인플루엔자 B 바이러스(B/트리에스테23/02), 인플루엔자 B 바이러스(B/트리에스테24/02), 인플루엔자 B 바이러스(B/트리에스테7/02), 인플루엔자 B 바이러스(B/울란우데/4/02), 인플루엔자 B 바이러스(B/울란우데/6/2003), 인플루엔자 B 바이러스(B/울란우데/4/02), 인플루엔자 B 바이러스(B/영국/34304/99), 인플루엔자 B 바이러스(B/영국/34520/99), 인플루엔자 B 바이러스(B/우루과이/19/02), 인플루엔자 B 바이러스(B/우루과이/19/05), 인플루엔자 B 바이러스(B/우루과이/2/02), 인플루엔자 B 바이러스(B/우루과이/28/05), 인플루엔자 B 바이러스(B/우루과이/33/05), 인플루엔자 B 바이러스(B/우루과이/4/02), 인플루엔자 B 바이러스(B/우루과이/5/02), 인플루엔자 B 바이러스(B/우루과이/65/05), 인플루엔자 B 바이러스(B/우루과이/7/02), 인플루엔자 B 바이러스(B/우루과이/74/04), 인플루엔자 B 바이러스(B/우루과이/75/04), 인플루엔자 B 바이러스(B/우루과이/NG/02), 인플루엔자 B 바이러스(B/우슈아이아/15732/99), 인플루엔자 B 바이러스(B/USSR/100/83), 인플루엔자 B 바이러스(B/유타/1/2005), 인플루엔자 B 바이러스(B/유타/20139/99), 인플루엔자 B 바이러스(B/유타/20975/99), 인플루엔자 B 바이러스(B/버몬트/1/2006), 인플루엔자 B 바이러스(B/빅토리아/02/1987), 인플루엔자 B 바이러스(B/빅토리아/103/89), 인플루엔자 B 바이러스(B/빅토리아/19/89), 인플루엔자 B 바이러스(B/빅토리아/2/87), 인플루엔자 B 바이러스(B/빅토리아/504/2000), 인플루엔자 B 바이러스(B/비엔나/1/99), 인플루엔자 B 바이러스(B/버지니아/1/2005), 인플루엔자 B 바이러스(B/버지니아/1/2006), 인플루엔자 B 바이러스(B/버지니아/11/2003), 인플루엔자 B 바이러스(B/버지니아/2/2006), 인플루엔자 B 바이러스(B/버지니아/3/2003), 인플루엔자 B 바이러스(B/버지니아/3/2006), 인플루엔자 B 바이러스(B/버지니아/9/2005), 인플루엔자 B 바이러스(B/워싱턴/1/2004), 인플루엔자 B 바이러스(B/워싱턴/2/2000), 인플루엔자 B 바이러스(B/워싱턴/2/2004), 인플루엔자 B 바이러스(B/워싱턴/3/2000), 인플루엔자 B 바이러스(B/워싱턴/3/2003), 인플루엔자 B 바이러스(B/워싱턴/5/2005), 인플루엔자 B 바이러스(B/웰링턴/01/1994), 인플루엔자 B 바이러스(B/위스콘신/1/2004), 인플루엔자 B 바이러스(B/위스콘신/1/2006), 인플루엔자 B 바이러스(B/위스콘신/10/2006), 인플루엔자 B 바이러스(B/위스콘신/15e/2005), 인플루엔자 B 바이러스(B/위스콘신/17/2006), 인플루엔자 B 바이러스(B/위스콘신/2/2004), 인플루엔자 B 바이러스(B/위스콘신/2/2006), 인플루엔자 B 바이러스(B/위스콘신/22/2006), 인플루엔자 B 바이러스(B/위스콘신/26/2006), 인플루엔자 B 바이러스(B/위스콘신/29/2006), 인플루엔자 B 바이러스(B/위스콘신/3/2000), 인플루엔자 B 바이러스(B/위스콘신/3/2004), 인플루엔자 B 바이러스(B/위스콘신/3/2005), 인플루엔자 B 바이러스(B/위스콘신/3/2006), 인플루엔자 B 바이러스(B/위스콘신/31/2006), 인플루엔자 B 바이러스(B/위스콘신/4/2006), 인플루엔자 B 바이러스(B/위스콘신/5/2006), 인플루엔자 B 바이러스(B/위스콘신/6/2006), 인플루엔자 B 바이러스(B/위스콘신/7/2002), 인플루엔자 B 바이러스(B/우한/2/2001), 인플루엔자 B 바이러스(B/우한/356/2000), 인플루엔자 B 바이러스(B/W194/2002), 인플루엔자 B 바이러스(B/와이오밍/15/2001), 인플루엔자 B 바이러스(B/와이오밍/16/2001), 인플루엔자 B 바이러스(B/와이오밍/2/2003), 인플루엔자 B 바이러스(B/쉬엔우/1/82), 인플루엔자 B 바이러스(B/쉬엔우/23/82), 인플루엔자 B 바이러스(B/야마가타/1/73), 인플루엔자 B 바이러스(B/야마가타/115/2003), 인플루엔자 B 바이러스(B/야마가타/1246/2003), 인플루엔자 B 바이러스(B/야마가타/1311/2003), 인플루엔자 B 바이러스(B/야마가타/16/1988), 인플루엔자 B 바이러스(B/야마가타/16/88), 인플루엔자 B 바이러스(B/야마가타/222/2002), 인플루엔자 B 바이러스(B/야마가타/K198/2001), 인플루엔자 B 바이러스(B/야마가타/K246/2001), 인플루엔자 B 바이러스(B/야마가타/K270/2001), 인플루엔자 B 바이러스(B/야마가타/K298/2001), 인플루엔자 B 바이러스(B/야마가타/K320/2001), 인플루엔자 B 바이러스(B/야마가타/K354/2001), 인플루엔자 B 바이러스(B/야마가타/K386/2001), 인플루엔자 B 바이러스(B/야마가타/K411/2001), 인플루엔자 B 바이러스(B/야마가타/K461/2001), 인플루엔자 B 바이러스(B/야마가타/K490/2001), 인플루엔자 B 바이러스(B/야마가타/K500/2001), 인플루엔자 B 바이러스(B/야마가타/K501/2001), 인플루엔자 B 바이러스(B/야마가타/K508/2001), 인플루엔자 B 바이러스(B/야마가타/K513/2001), 인플루엔자 B 바이러스(B/야마가타/K515/2001), 인플루엔자 B 바이러스(B/야마가타/K519/2001), 인플루엔자 B 바이러스(B/야마가타/K520/2001), 인플루엔자 B 바이러스(B/야마가타/K521/2001), 인플루엔자 B 바이러스(B/야마가타/K535/2001), 인플루엔자 B 바이러스(B/야마가타/K542/2001), 인플루엔자 B 바이러스(B/야마나시/166/1998), 인플루엔자 B 바이러스(B/야마나시/166/98), 인플루엔자 B 바이러스(B/윈난/123/2001), 인플루엔자 B 바이러스(균주 B/알라스카/12/96), 인플루엔자 B 바이러스(균주 B/앤 아버/1/66[저온-적응화]), 인플루엔자 B 바이러스(균주 B/앤 아버/1/66[야생형]), 인플루엔자 B 바이러스(균주 B/BA/78), 인플루엔자 B 바이러스(균주 B/베이징/1/87), 인플루엔자 B 바이러스(균주 B/잉글랜드/222/82), 인플루엔자 B 바이러스(균주 B/핀랜드/145/90), 인플루엔자 B 바이러스(균주 B/핀랜드/146/90), 인플루엔자 B 바이러스(균주 B/핀랜드/147/90), 인플루엔자 B 바이러스(균주 B/핀랜드/148/90), 인플루엔자 B 바이러스(균주 B/핀랜드/149/90), 인플루엔자 B 바이러스(균주 B/핀랜드/150/90), 인플루엔자 B 바이러스(균주 B/핀랜드/151/90), 인플루엔자 B 바이러스(균주 B/핀랜드/24/85), 인플루엔자 B 바이러스(균주 B/핀랜드/56/88), 인플루엔자 B 바이러스(균주 B/후쿠오카/80/81), 인플루엔자 B 바이러스(균주 B/GA/86), 인플루엔자 B 바이러스(균주 B/GL/54), 인플루엔자 B 바이러스(균주 B/홍콩/8/73), 인플루엔자 B 바이러스(균주 B/HT/84), 인플루엔자 B 바이러스(균주 B/ID/86), 인플루엔자 B 바이러스(균주 B/레닌그라드/179/86), 인플루엔자 B 바이러스(균주 B/메릴랜드/59), 인플루엔자 B 바이러스(균주 B/멤피스/6/86), 인플루엔자 B 바이러스(균주 B/나가사키/1/87), 인플루엔자 B 바이러스(균주 B/오사카/491/97), 인플루엔자 B 바이러스(균주 B/PA/79), 인플루엔자 B 바이러스(균주 B/RU/69), 인플루엔자 B 바이러스(균주 B/싱가포르/64), 인플루엔자 B 바이러스(균주 B/동경/942/96), 인플루엔자 B 바이러스(균주 B/빅토리아/3/85), 인플루엔자 B 바이러스(균주 B/빅토리아/87), 인플루엔자 B 바이러스(B/로체스터/02/2001), 및 기타 서브타입에 속하나, 이들에 국한되지 않는다. 추가 실시양태들에서, 인플루엔자 바이러스 C는 서브타입 인플루엔자 C 바이러스(C/아이치/1/81), 인플루엔자 C 바이러스(C/아이치/1/99), 인플루엔자 C 바이러스(C/앤 아버/1/50), 인플루엔자 C 바이러스(C/아오모리/74), 인플루엔자 C 바이러스(C/캘리포니아/78), 인플루엔자 C 바이러스(C/잉글랜드/83), 인플루엔자 C 바이러스(C/후쿠오카/2/2004), 인플루엔자 C 바이러스(C/후쿠오카/3/2004), 인플루엔자 C 바이러스(C/후쿠시마/1/2004), 인플루엔자 C 바이러스(C/그리스/79), 인플루엔자 C 바이러스(C/히로시마/246/2000), 인플루엔자 C 바이러스(C/히로시마/247/2000), 인플루엔자 C 바이러스(C/히로시마/248/2000), 인플루엔자 C 바이러스(C/히로시마/249/2000), 인플루엔자 C 바이러스(C/히로시마/250/2000), 인플루엔자 C 바이러스(C/히로시마/251/2000), 인플루엔자 C 바이러스(C/히로시마/252/2000), 인플루엔자 C 바이러스(C/히로시마/252/99), 인플루엔자 C 바이러스(C/히로시마/290/99), 인플루엔자 C 바이러스(C/히로시마/4/2004), 인플루엔자 C 바이러스(C/효고/1/83), 인플루엔자 C 바이러스(C/요하네스버그/1/66), 인플루엔자 C 바이러스(C/요하네스버그/66), 인플루엔자 C 바이러스(C/가나가와/1/76), 인플루엔자 C 바이러스(C/가나가와/2/2004), 인플루엔자 C 바이러스(C/캔사스/1/79), 인플루엔자 C 바이러스(C/교토/1/79), 인플루엔자 C 바이러스(C/교토/41/82), 인플루엔자 C 바이러스(C/미시시피/80), 인플루엔자 C 바이러스(C/미야기/1/90), 인플루엔자 C 바이러스(C/미야기/1/93), 인플루엔자 C 바이러스(C/미야기/1/94), 인플루엔자 C 바이러스(C/미야기/1/97), 인플루엔자 C 바이러스(C/미야기/1/99), 인플루엔자 C 바이러스(C/미야기/12/2004), 인플루엔자 C 바이러스(C/미야기/2/2000), 인플루엔자 C 바이러스(C/미야기/2/92), 인플루엔자 C 바이러스(C/미야기/2/93), 인플루엔자 C 바이러스(C/미야기/2/94), 인플루엔자 C 바이러스(C/미야기/2/96), 인플루엔자 C 바이러스(C/미야기/2/98), 인플루엔자 C 바이러스(C/미야기/3/2000), 인플루엔자 C 바이러스(C/미야기/3/91), 인플루엔자 C 바이러스(C/미야기/3/92), 인플루엔자 C 바이러스(C/미야기/3/93), 인플루엔자 C 바이러스(C/미야기/3/94), 인플루엔자 C 바이러스(C/미야기/3/97), 인플루엔자 C 바이러스(C/미야기/3/99), 인플루엔자 C 바이러스(C/미야기/4/2000), 인플루엔자 C 바이러스(C/미야기/4/93), 인플루엔자 C 바이러스(C/미야기/4/96), 인플루엔자 C 바이러스(C/미야기/4/97), 인플루엔자 C 바이러스(C/미야기/4/98), 인플루엔자 C 바이러스(C/미야기/42/2004), 인플루엔자 C 바이러스(C/미야기/5/2000), 인플루엔자 C 바이러스(C/미야기/5/91), 인플루엔자 C 바이러스(C/미야기/5/93), 인플루엔자 C 바이러스(C/미야기/6/93), 인플루엔자 C 바이러스(C/미야기/6/96), 인플루엔자 C 바이러스(C/미야기/7/91), 인플루엔자 C 바이러스(C/미야기/7/93), 인플루엔자 C 바이러스(C/미야기/7/96), 인플루엔자 C 바이러스(C/미야기/77), 인플루엔자 C 바이러스(C/미야기/8/96), 인플루엔자 C 바이러스(C/미야기/9/91), 인플루엔자 C 바이러스(C/미야기/9/96), 인플루엔자 C 바이러스(C/나라/1/85), 인플루엔자 C 바이러스(C/나라/2/85), 인플루엔자 C 바이러스(C/나라/82), 인플루엔자 C 바이러스(C/뉴저지/76), 인플루엔자 C 바이러스(C/니가카/1/2004), 인플루엔자 C 바이러스(C/오사카/2/2004), 인플루엔자 C 바이러스(C/돼지/베이징/115/81), 인플루엔자 C 바이러스(C/사이타마/1/2000), 인플루엔자 C 바이러스(C/사이타마/1/2004), 인플루엔자 C 바이러스(C/사이타마/2/2000), 인플루엔자 C 바이러스(C/사이타마/3/2000), 인플루엔자 C 바이러스(C/삿뽀로/71), 인플루엔자 C 바이러스(C/시즈오카/79), 인플루엔자 C 바이러스(C/야마가타/1/86), 인플루엔자 C 바이러스(C/야마가타/1/88), 인플루엔자 C 바이러스(C/야마가타/10/89), 인플루엔자 C 바이러스(C/야마가타/13/98), 인플루엔자 C 바이러스(C/야마가타/15/2004), 인플루엔자 C 바이러스(C/야마가타/2/2000), 인플루엔자 C 바이러스(C/야마가타/2/98), 인플루엔자 C 바이러스(C/야마가타/2/99), 인플루엔자 C 바이러스(C/야마가타/20/2004), 인플루엔자 C 바이러스(C/야마가타/20/96), 인플루엔자 C 바이러스(C/야마가타/21/2004), 인플루엔자 C 바이러스(C/야마가타/26/81), 인플루엔자 C 바이러스(C/야마가타/27/2004), 인플루엔자 C 바이러스(C/야마가타/3/2000), 인플루엔자 C 바이러스(C/야마가타/3/2004), 인플루엔자 C 바이러스(C/야마가타/3/88), 인플루엔자 C 바이러스(C/야마가타/3/96), 인플루엔자 C 바이러스(C/야마가타/4/88), 인플루엔자 C 바이러스(C/야마가타/4/89), 인플루엔자 C 바이러스(C/야마가타/5/92), 인플루엔자 C 바이러스(C/야마가타/6/2000), 인플루엔자 C 바이러스(C/야마가타/6/98), 인플루엔자 C 바이러스(C/야마가타/64), 인플루엔자 C 바이러스(C/야마가타/7/88), 인플루엔자 C 바이러스(C/야마가타/8/2000), 인플루엔자 C 바이러스(C/야마가타/8/88), 인플루엔자 C 바이러스(C/야마가타/8/96), 인플루엔자 C 바이러스(C/야마가타/9/2000), 인플루엔자 C 바이러스(C/야마가타/9/88), 인플루엔자 C 바이러스(C/야마가타/9/96), 인플루엔자 C 바이러스(균주 C/베를린/1/85), 인플루엔자 C 바이러스(균주 C/영국/892/83), 인플루엔자 C 바이러스(균주 C/오대호/1167/54), 인플루엔자 C 바이러스(균주 C/JJ/50), 인플루엔자 C 바이러스(균주 C/돼지/베이징/10/81), 인플루엔자 C 바이러스(균주 C/돼지/베이징/439/82), 인플루엔자 C 바이러스(균주 C/테일러/1233/47), 인플루엔자 C 바이러스(균주 C/야마가타/10/81), 이사바이러스(Isavirus) 또는 감염성 연어 빈혈증 바이러스, 토고토바이러스(Thogotovirus) 또는 도리(Dhori) 바이러스, 바트켄(Batken) 바이러스, 도리 바이러스(균주 인디안/1313/61) 또는 토고토 바이러스, 토고토 바이러스(분리주 SiAr 126) 또는 미분류 토고토바이러스, 아라구아리(Araguari) 바이러스, 미분류 오르토믹소비리대 또는 가금 페스트 바이러스 또는 돼지 인플루엔자 바이러스 또는 미확인 인플루엔자 바이러스 및 기타 서브타입에 속하나, 이들에 국한되지 않는다.
각종 실시양태들에서, 약독화 바이러스는 델타 바이러스 과 및 이의 모든 관련 속에 속한다.
각종 실시양태들에서, 약독화 바이러스는 아데노비리대 바이러스 과, 및 이의 모든 관련 속, 균주, 형 및 분리주, 예를 들어 단, 이들에 국한되는 것은 아니나, 인간 아데노바이러스 A, B, C에 속한다.
각종 실시양태들에서, 약독화 바이러스는 헤르페스비리대 바이러스 과 및 이의 모든 관련 속, 균주, 형 및 분리주 예를 들어 단, 이들에 국한되는 것은 아니나, 단순 포진 바이러스에 속한다.
각종 실시양태들에서, 약독화 바이러스는 레오비리대 바이러스 과 및 이의 모든 관련 속, 균주, 형 및 분리주에 속한다.
각종 실시양태들에서, 약독화 바이러스는 유두종 비리대 바이러스 과 및 이의 모든 관련 속, 균주, 형 및 분리주에 속한다.
각종 실시양태들에서, 약독화 바이러스는 폭스비리대(Poxviridae) 바이러스 과 및 이의 모든 관련 속, 균주, 형 및 분리주에 속한다.
각종 실시양태들에서, 약독화 바이러스는 레트로비리대 바이러스 과 및 이의 모든 관련 속, 균주, 형 및 분리주에 속한다. 예를 들어 단, 이들에 국한되는 것은 아니나, 인간 면역결핍 바이러스에 속한다.
각종 실시양태들에서, 약독화 바이러스는 필로비리대(Filoviridae) 바이러스 과 및 이의 모든 관련 속, 균주, 형 및 분리주에 속한다.
각종 실시양태들에서, 약독화 바이러스는 파라믹소비리대 바이러스 과 및 이의 모든 관련 속, 균주, 형 및 분리주에 속한다.
각종 실시양태들에서, 약독화 바이러스는 오르토믹소비리대 바이러스 과 및 이의 모든 관련 속, 균주, 형 및 분리주에 속한다.
각종 실시양태들에서, 약독화 바이러스는 피코나비리대 바이러스 과 및 이의 모든 관련 속, 균주, 형 및 분리주에 속한다.
각종 실시양태들에서, 약독화 바이러스는 버냐비리대(Bunyaviridae) 바이러스 과 및 이의 모든 관련 속, 균주, 형 및 분리주에 속한다.
각종 실시양태들에서, 약독화 바이러스는 니도비랄레스(Nidovirales) 바이러스 과 및 이의 모든 관련 속, 균주, 형 및 분리주에 속한다.
각종 실시양태들에서, 약독화 바이러스는 칼리시비리대(Caliciviridae) 바이러스 과 및 이의 모든 관련 속, 균주, 형 및 분리주에 속한다.
특정 실시양태들에서, 동의 코돈 치환은 게놈 내, 코돈 편향, 코돈 쌍 편향, 역최적화 코돈 및 역최적화 코돈 쌍의 밀도, RNA 2차 구조, CpG 디뉴클레오티드 함량, C+G 함량, 번역 틀이동 부위, 번역 휴지 부위, 마이크로RNA 인식 서열의 존재 또는 부재, 또는 이들의 임의의 조합을 변경시킨다. 코돈 치환은 게놈 전반에 걸쳐 분포된 다수 위치에서, 또는 게놈의 부분에 국한된 다수 위치에서 조작될 수 있다. 추가 실시양태들에서, 게놈의 부분은 캡시드 코딩 영역이다.
본 발명의 바람직한 실시양태들에서, 바이러스는 동물 숙주에서 보호 면역 반응을 유발하는 능력을 보유한다. 다른 바람직한 실시양태들에서, 바이러스의 독성은 야생형으로 복귀되지 않는다.
폴리오바이러스, 리노바이러스 및 인플루엔자 바이러스
피코나바이러스 과의 한 구성원인 폴리오바이러스는 길이가 7.5 kb인 단일 가닥의 (+) 센스 RNA 게놈을 가지고 외피를 가지지 않은 작은 바이러스이다(문헌 [Kitamura et al., 1981]). 세포 침투 시, 게놈 RNA는, 자체가 촉매 절단 이벤트들의 캐스케이드 후에, 기능성 폴리오바이러스 단백질의 완전 상보를 일어나도록 하는 단일 다단백질을 코딩하는 mRNA로서 작용한다. 동일한 게놈 RNA는 자손 비리온 내로 이입되게 되는 mRNA, 복제 주형 또는 게놈 RNA로 작용하는 새 (+) 나선의 합성을 위한 중간자적인 (-) 센스 RNA의 합성을 위한 주형으로서 작용한다(문헌 [Mueller et al., 2005]). 본원에 기재된 바와 같이, 잘 확립된 PV 시스템을 사용하여, 약독화 합성 바이러스의 생성을 위한 설계 기법의 최적화의 일반 문제를 해결하였다. PV는 항바이러스 기법을 개발하기 위한, 가장 중요하고 가장 잘 이해되는 분자 모델들 중 하나를 제공한다. 특히, 바이러스 핵산이 완전히 합성적인 방법에 의해 시험관내 합성된 후 감염성 비리온으로 전환될 수 있도록 하는 역유전학 시스템이 존재한다(이하 참조). 또한, 전술된 바와 같은 합성 PV 설계의 약독화를 시험하기 위해 편리한 마우스 모델(소아마비를 위한 인간 수용체를 발현하는 CD155tg 마우스)이 이용 가능하다(문헌 [Cello et al., 2002]).
리노 바이러스도 또한 피코나바이러스 과의 구성원이고, PV와 관련된다. 인간 리노바이러스(HRV)는 일반 감기의 통상적 원인 작용제이고, 이에 따라 이는 다른 어떠한 감염성 작용제보다 더 많은 병환 에피소드의 원인이 된다(문헌 [Hendley, 1999]). 일반 감기에 부가하여, HRV는 또한 귀 및 공동(sinus) 감염, 천식성 공격, 및 기타 질환들과 관련된다. PV와 유사하게, HRV는 자가 처리 다단백질을 코딩하는 게놈을 갖는, 단일 가닥의 양성 센스 RNA 바이러스를 포함한다. RNA는, 2가지 바이러스 프로테아제인 2A 및 3C, 및 RNA 의존성 중합효소와 같은 비구조 단백질뿐만 아니라, 캡시드를 형성하는 구조 단백질을 생성하기 위해 내부 리보솜 부착 부위(IRES)를 이용한 내부 개시 기전을 통해 번역된다(문헌 [Jang et al., 1989]; 문헌 [Pelletier et al., 1988]). 또한, PV와 같이, HRV는 60개 카피수의 4가지 캡시드 단백질 VP1-4에 의해 형성되는 외피를 가지지 않은 20면체형 캡시드를 가진다(문헌 [Savolainen et al., 2003]). HRV의 복제 사이클도 또한 폴리오바이러스의 복제 사이클과 동일하다. 인간 건강에 대해 유의적이고 거의 편재하는 영향과 함께, PV와의 근접 유사성은 HRV가 면역화에 유용한 신규 약독화 바이러스의 생성을 위해 극히 선호적인 후보물질이 되도록 한다.
제약 회사들에 의한 수십가지 연구에도 불구하고, HRV에 대한 성공적인 약물이 개발되지 않았다. 이는 부분적으로는 대체로 심각하지 않은 감염을 치료하는 약물에 대한 대중 및 연방 제어단체의 비교적 낮은 위험 내인성(tolerance)으로 인한 것이다. 즉, 심지어 작은 부작용도 허용되지 않는다. 따라서, 약물의 부재 하에, 안전하고 효과적인 항리노바이러스 백신에 대한 명료한 요망이 있다. 그러나, 항리노바이러스 백신의 개발은 극히 도전적인데, 이는 HRV에는 100개 초과의 혈청형이 있기 때문이며, 이 중 대략 30개는 널리 순환하고 인간을 정규적으로 감염시킨다. 한 효과적인 백신은 면역계가 진정한 면역을 부여하기 위해 모든 단일 혈청형을 인식할 수도 있도록 해야 한다. 본원에 기재된 SAVE 방법은 효과적인 리노바이러스 백신의 개발에 대한 실질적 솔루션을 제공한다. SAVE 설계 과정의 예측 가능성에 기초하여, 조합하여 백신을 구성하는, 100개 이상의 SAVE-약독화 리노 바이러스를 설계하고 합성하는 것이 저렴하게 된다.
인플루엔자 바이러스 - 1990년과 1999년 사이에, 인플루엔자 바이러스는 미국 내에서 매년 대략 35,000 사망을 초래하였다(문헌 [Thompson et al., 2003]). 대략 200,000건의 입원과 함께, 미국 경제에 대한 영향은 매년 2백3십억 달러를 초과하는 것으로 평가되었다(문헌 [Cram et al., 2001]). 전세계적으로, 300,000명 내지 500,000명 사람들이 인플루엔자 바이러스 감염으로 인해 매년 사망한다(문헌 [Kamps et al., 2006]). 바이러스가 모든 연령 군들 간에 질환을 유발하나, 심각한 합병증의 발병율은 어린이 및 65세 초과의 사람들에게 가장 높다. 인플루엔자는, 약 3천만명 사람들이 사망한 1918년의 대형 인플루엔자 유행병 보급 중에 일어났었던 바와 같이 극히 치명적인 형태로 돌연변이되거나 재조합할 가능성을 가진다. 이는 가능히 인간 역사에 있어 단일의 가장 치명적인 1년 유행병이었다.
인플루엔자 바이러스는 A, B 및 C의 3가지 유형으로 나뉜다. 항원성은 외피를 가진 비리온의 표면에 있는 2가지 당단백질, 즉 헤마글루티닌(HA) 및 뉴라미니다제(NA)에 의해 결정된다. 양 당단백질 모두는 체액성 면역을 면하기 위해 자체의 항원성을 연속적으로 변화시킨다. 당단백질을 변경하면, 바이러스 균주가 백신접종된 개체를 계속 감염시키게 되고, 이는 고위험군의 매년 백신접종의 원인이다. 부가적으로, 인간 인플루엔자 바이러스는 HA 또는 NA 당단백질을 새 및 돼지의 그 단백질로 치환할 수 있는데, 이는 유전 이동으로 알려진 유전자 분절의 재정렬로서, 새로운 바이러스(H1N1 내지 H2N2 또는 H3N2 등)을 초래한다(문헌 [Steinhauer and Skehel, 2002]). 세계 인구가 면역학적으로 나이브(naive)인 상기 신규 바이러스는 수백만 사람들을 사멸시킨 전염병의 원인이다(문헌 [Kilbourne, 2006]; 문헌 [Russell and Webster, 2005]). 인플루엔자 바이러스의 역사는, 고병원성 조류 인플루엔자 바이러스, H5N1의 현 위협과 함께(문헌 [Stephenson and Democratis, 2006]), 인플루엔자 바이러스성 질환의 예방에 대한 필요성을 강조한다.
현재, 2가지 인플루엔자 백신, 즉 약독화 생백신(저온 적응형; "FluMist") 및 불활성화 바이러스가 사용 중에 있다. 약독화 백신의 적용은 5세 내지 49세 연령의 건강한 어린이, 청소년 및 성인(임신한 여성 제외)에 국한된다. 이 연령 제한은 인플루엔자의 최고 위험에 처한 자들을 정확히 제외한다. 또한, 약독화 FluMist 바이러스는 생바이러스에 대해 통상적인 복귀 가능성을 가진다. 두 번째의 더욱 통상적으로 투여되는 불활성화 인플루엔자 바이러스 백신의 생성은 복잡하다. 또한, 이 백신은 노인(65세 초과의 연령) 집단에 있어 사망을 방지하기 위해 희망되는 것보다 덜 효과적인 것으로 보인다(문헌 [Simonson et al., 2005]). 이 사실은 인플루엔자 바이러스 백신의 생성을 위한 신규 기법에 대한 필요성을 강조한다.
피코나바이러스의 역유전학
역유전학이란, 일반적으로 정통 유전학의 소위 전방 유전적 방법과 반대되는 방향으로 진전하는, 유전자의 기능을 발견하는 실험적 방법을 지칭한다. 즉, 전방 유전학 방법은 표현형 특색의 유전적 기초를 밝힘으로써 유전자의 기능을 결정하도록 모색하는 것에 반해, 역유전학에 기초하는 기법은 단리된 유전자로 시작하여, wt 또는 돌연변이된 유전자의 발현에 의해 생성된 가능한 표현형을 조사함으로써 그 기능을 발견하도록 모색한다. 바이러스 시스템의 문맥에서 본원에 사용되는 "역유전학" 시스템이란, RNA로 된 바이러스 게놈의 유전적 조작을 허용하는 기법의 이용 가능성을 지칭한다. 간략히 말해, 바이러스 게놈은 비리온 또는 감염된 세포로부터 단리되어, 효소 역전사효소에 의해 DNA("cDNA")로 전환되고, 이는 가능히 필요에 따라 변형되고, 다시 감염성 바이러스 입자로 통상 RNA 중간체를 통해 복귀된다. 피코나바이러스에서의 이 과정은 극히 단순하고; 실제로, 임의의 동물 RNA 바이러스를 위해 개발된 첫 번째 역유전학 시스템은 PV에 대한 것이었다(문헌 [Racaniello and Baltimore, 1981]). 바이러스 역유전학 시스템은, 네이키드 바이러스 게놈 RNA이 적당한 포유동물 세포에 형질감염될 대 감염성이라는 역사적 발견사실에 기초한다(문헌 [Alexander et al., 1958]). 1970년대의 역전사효소의 발견 및 분자 클로닝 기법의 개발로 인해, 과학자들이 RNA 바이러스 게놈의 cDNA 카피를 생성하고 조작할 수 있게 되었다. 가장 통상적으로, 게놈의 전체 cDNA 카피는 게놈 RNA의 시험관내 합성을 허용하는 파지 T7 RNA 중합효소 프로모터의 바로 다운스트림에 클로닝된 후, 바이러스 생성을 위해 세포 내로 형질감염된다(문헌 [van der Wert, et al., 1986]). 대안적으로, 동일한 DNA 플라스미드는 세포질에서 T7 RNA 중합효소를 발현하는 세포 내로 형질감염될 수 있다. 이 시스템은 PV 및 HRV 양자 모두를 포함한 각종 바이러스 병원체들을 위해 사용될 수 있다.
인플루엔자 바이러스의 분자 바이러스학 및 역유전학
인플루엔자 바이러스는 피코나바이러스 PV 및 HRV와 같이, RNA 바이러스이나, 다른 방식으로는 PV와 관련없고 그와 매우 상이하다. 피코나바이러스와 대조적으로, 인플루엔자는 마이너스 가닥 바이러스이다. 또한, 인플루엔자는 890 내지 2341 뉴클레오티드 범위의 8가지 분리된 유전자 분절로 구성된다(문헌 [Lamb and Krug, 2001]). 부분적 이유로 마이너스 가닥 조직화로 인해, 또한 또 다른 부분적 이유로는 8가지 분리된 유전자 분절로 인해, 역유전학 시스템이 PV에 대해서보다 더욱 복잡하다. 그럼에도 불구하고, 인플루엔자 바이러스에 대한 역유전학 시스템이 개발되었다(문헌 [Enami et al., 1990]; 문헌 [Fodor et al., 1999]; 문헌 [Garcia-Sastre and Palese, 1993]; 문헌 [Hoffman et al., 2000]; 문헌 [Luytjes et al., 1989]; 문헌 [Neumann et al., 1999]). 각각의 8가지 유전자 분절이, 분리된 플라스미드로부터 발현된다. 이 역유전학 시스템은, 가장 긴 개별 유전자 분절이 3 kb 미만이기 때문에, 본원에 기재된 SAVE 기법에 사용하기에 극히 편리하고, 이에 따라 합성하고 조작하기 용이하다. 또한, 상이한 유전자 분절들은, 상이한 플라스미드를 혼합함으로써 간단히 조합되고 재조합될 수 있다. 따라서, SAVE 방법의 적용은 가능히 PV에 대해서보다 인플루엔자 바이러스에 대해 더욱 더 개연성이 있다.
바이러스 역유전학에 있어서의 한 최근의 패러다임 이동은 본 발명자의, 합성 DNA 올리고뉴클레오티드로부터의 어셈블리에 의한 감염성 바이러스 게놈의 첫 번째 화학적 합성과 함께 일어났다(문헌 [Cello et al., 2002]). 이러한 성취는, 역유전학 시스템이 이용 가능한 대부분 또는 모든 바이러스가 단지 자체의 게놈 서열 정보로부터 합성될 수 있다는 것을 명료하게 만들었고, 요망되는 기준을 충족하도록 상기 바이러스를 재합성하고 변형시킴에 있어 전례없는 유연성을 보장한다.
바이러스 게놈의 신생 합성
바이러스 게놈의 신규 설계 및 합성을 위해, 컴퓨터 기반 알고리즘이 사용된다. 본원에 기재된 약독화 PV의 합성으로 예시되는, 상기 합성된 게놈은 야생형(wt) 바이러스와 정확히 동일한 단백질을 코딩하나, 단 치환 동의 코돈을 이용하여, 코돈 편향, 코돈 쌍 편향, RNA 2차 구조, 및/또는 디뉴클레오티드 함량을 포함한 각종 파라미터들이 변경된다. 제시된 데이터는, 이러한 코딩-비의존성 변화가 종종 단백질의 불량한 번역으로 인해, 매우 약독화된 바이러스를 생성한다는 것을 보여준다. 모든 바이러스의 기본적 기능, 즉 단백질 번역을 표적화함으로써, 백신 제조에 유용한, 예측 가능하게, 안전하게, 빠르게, 또한 저렴하게 약독화 바이러스를 생성하기 위한 매우 일반적인 방법이 개발되었다. "SAVE"(합성 약독화 바이러스 조작)이라고도 하는 이 방법은 새 백신에 대한 의료적 필요성이 있는 PV 이외의 매우 다양한 바이러스들에 대해 적용 가능하다. 이 바이러스에는 리노바이러스, 인플루엔자 바이러스, SARS 및 기타 코로나바이러스, HIV, HCV, 감염성 기관지염 바이러스, 에볼라바이러스, 말부르크 바이러스, 뎅기열 바이러스, 웨스트 나일병 바이러스, EBV, 황열 바이러스, 폴리오바이러스 외의 엔테로바이러스, 예컨대 에코바이러스, 콕사키(coxsackie) 바이러스, 및 엔트로바이러스71; 간염 A 바이러스, 아프토바이러스, 예컨대 수족구병 바이러스, 믹소바이러스, 예컨대 인플루엔자 바이러스, 파라믹소바이러스, 예컨대 홍역 바이러스, 유행성 이하선염 바이러스, 호흡기 세포융합 바이러스, 플라비바이러스, 예컨대 뎅기열 바이러스, 황열 바이러스, 세인트루이스 뇌염 바이러스 및 진드기-매개 바이러스, 알파바이러스, 예컨대 서부 및 동부 뇌염 바이러스, 간염 B 바이러스, 및 소 설사 바이러스, 및 에볼라바이러스가 포함되나, 이들에 국한되지 않는다.
PV 캡시드 코딩 영역 내 코돈 및 코돈 쌍 역최적화의 양자 모두는 PV 적응도(fitness)를 급격히 감소시키는 것으로 본원에 나와 있다. 본 발명은 동의 코돈의 치환을 통한 바이러스 약독화의 기저를 이루는 임의의 특정 분자 기전에 제한되지 않는다. 그럼에도 불구하고, 약독화 바이러스의 생성에 있어서의 코돈 및 코돈 쌍 역최적화의 기저 분자 기전을 보다 잘 이해하기 위한 실험들이 진행 중에 있다. 특히, 코돈 역최적화 및 코돈 쌍 역최적화가 비효율적 번역을 초래할 수 있음을 가리키는 증거가 본원에 제공되어 있다. 다수의 바이러스 작제물의 급속 생성 및 선별을 위한 고효율(high-throughout) 방법이 또한 개발되고 있다.
대규모 DNA 어셈블리
근년, 급락하는 원가 및 증가하는 품질의 올리고뉴클레오티드 합성으로 인해, 합성 올리고뉴클레오티드로부터 큰 분절의 DNA(적어도 약 10 kb에 달함)를 어셈블리하는 것이 실제화되었다. 블루 헤론 바이오테크놀로지 인코포레이션(Blue Heron Biotechnology, Inc.)(미국 워싱턴주 보쓰웰 소재)(및 기타 많은 판매자들)와 같은 상업적 판매자들은 현재 염기 당 약 1.50 달러의 비교적 적은 비용으로 기지의 서열로 합성 DNA의 큰 분절을 합성하고, 어셈블리하며, 클로닝하고, 서열확인하고, 전달한다. 따라서, 상업적 공급자로부터의 합성된 바이러스 게놈의 판매는 편리하고 비용효과적인 선택안이고, 비용이 계속해서 급격히 감소한다. 또한, 극히 낮은 원가로 매우 큰 DNA 분자를 합성하고 어셈블리하는 새 방법이 출현하고 있다(문헌 [Tian et al., 2004]). 처치랩(Church lab)은, (예를 들어, 광-프로그래밍가능한 마이크로유체 칩 또는 님블젠 시스템즈 인코포레이티드(Agilent Technologies, Inc.)(미국 캘리포니아주 산타클라라 소재)로부터 입수가능한 마이크로어레이 상에서) 수천개의 올리고뉴클레오티드의 병렬 합성을 이용한 후, 에러를 감소시키고, 중첩 PCR에 의해 어셈블리하는 방법을 개척하였다. 이 방법은 큰 합성 DNA의 원가를 염기 당, 1 센트 미만으로 감소시킬 수 있는 가능성을 가진다. 대규모 DNA 합성의 향상된 효율 및 정확도, 및 급감 원가는 SAVE 기법의 발달 및 광범위한 적용을 위한 원동력을 제공한다.
대안적 코딩, 코돈 편향, 및 코돈 쌍 편향
대안적 코딩
주어진 펩티드는 다수의 핵산 서열에 의해 코딩될 수 있다. 예를 들어, 심지어 전형적인 짧은 10량체 올리고펩티드를 대략 410(약 106)개의 상이한 핵산에 의해 코딩할 수 있고, PV의 단백질을 약 10442개의 상이한 핵산에 의해 코딩할 수 있다. 자연 선택은 궁극적으로 가능한 이들 10442개의 핵산 중 하나를 PV 게놈으로 선택하였다. 일차 아미노산 서열이 주어진 mRNA에 의해 코딩되는 가장 중요한 정보 수준인 반면, 상이한 종류의 RNA 서열 내에 부가적 종류의 정보가 있다. 이에는 구분된 기능의 RNA 구조 요소(예를 들어, PV에 경우, 시스 작용성 복제 요소, 또는 CRE(문헌 [Goodfellow et al., 2000]; 문헌 [McKnight, 2003]), 번역 동역학 신호(휴지 부위, 틀이동 부위 등), 폴리아데닐화 신호, 스플라이스 신호, 효소 기능(리보솜), 및 매우 가능히는 아직 미확인된 정보 및 신호와 같은 기타 요소들)이 포함된다.
CRE와 같은 신호가 보존되어야 한다는 주의사항에도, 10442개의 가능한 코딩 서열은 동일한 단백질을 코딩하는 능력을 보존하면서 소아마비의 RNA의 서열을 급격한 변화를 일으키는 거대한 유연성을 제공한다. 코돈 편향 또는 코돈 쌍 편향을 변화시킬 수 있고, RNA에서의 핵산 신호 및 2차 구조를 부가하거나 제거할 수 있다. 부가적 또는 신규 단백질을 대체 틀에서 동시에 코딩할 수 있다(예를 들어, 문헌 [Wang et al., 2006] 참조).
코돈 편향
대부분의 아미노산이 수가지 상이한 코돈에 의해 코딩될 수 있으나, 모든 코돈들이 동등한 빈도로 사용되는 것은 아니며: 일부 코돈은 "희소" 코돈인 반면, 다른 코돈은 "빈번한(frequent)" 코돈이다. 본원에 사용되는 "희소" 코돈은 한 특정 아미노산을 위해 가장 빈번하게 사용되는 코돈에 비해 유의적으로 더 낮은 빈도로 mRNA 내에 존재하는, 그 아미노산을 코딩하는 2개 이상의 동의 코돈 중 하나이다. 따라서, 희소 코돈은 가장 빈번하게 사용되는 코돈보다 약 2배 더 낮은 빈도로 존재할 수 있다. 바람직하게, 희소 코돈은 아미노산을 위해 가장 빈번하게 사용되는 코돈보다 3배 이상, 더욱 바람직하게는 5배 이상 더 낮은 빈도로 존재한다. 역으로, "빈번한" 코돈은 한 특정 아미노산을 위해 가장 덜 빈번하게 사용되는 코돈보다 유의적으로 더 높은 빈도로 mRNA 내에 존재하는, 그 아미노산을 코딩하는 2개 이상의 동의 코돈 중 하나이다. 빈번한 코돈은 그 아미노산을 위해 가장 덜 빈번하게 사용되는 코돈에 비해 약 2배, 바람직하게는 3배 이상, 더욱 바람직하게는 5배 이상 더 높은 빈도로 존재할 수 있다. 예를 들어, 인간 유전자는 시간 기준 40%로 루이신 코돈 CTG을 사용하나, 시간 기준 단지 7%만으로 동의 CTA를 사용한다(표 2 참조). 따라서, CTG는 빈번한 코돈인 반면, CTA는 희소 코돈이다. 이러한 사용 빈도와 대략 일관되게도, CTG를 인식하는 tRNA에 대한 유전자는 게놈에 6개 카피가 있는 반면, CTA를 인식하는 tRNA에 대한 유전자는 단지 2개의 카피가 있다. 유사하게, 인간 유전자는 세린에 대해, 각기 시간 기준 18% 및 22%로, 빈번한 코돈 TCT 및 TCC를 사용하나, 시간 기준 단지 5%로 희소 코돈 TCG를 사용한다. TCT 및 TCC는, 게놈 내에 그 유전자의 10개 카피를 가지는, 동일한 tRNA에 의해, 워블(wobble)을 통해, 해독되고, 한편 TCG는 단지 4개 카피만으로 tRNA에 의해 해독된다. 매우 활발히 번역되는 상기 mRNA는 단지 가장 빈번한 코돈만을 사용하도록 강하게 편향되어짐이 공지되어 있다. 이에는 리보솜 단백질 및 해당 효소를 위한 유전자가 포함된다. 한편, 비교적 풍부하지 않은 단백질을 위한 mRNA가 희소 코돈을 사용할 수 있다.
고발현 유전자가 빈번한 코돈을 사용하는 성향을 "코돈 편향"으로 부른다. 리보솜 단백질에 대한 유전자는 61개 코돈 중 가장 빈번한 단지 20 내지 25개만을 사용할 수도 있고, 높은 코돈 편향(1에 근접하는 코돈 편향)을 가질 수 있는 반면, 불량하게 발현된 유전자는 60개 모두의 코돈을 사용하고, 코돈 편향이 없거나 거의 없을 수 있다(0에 근접한 코돈 편향). 빈번하게 사용되는 코돈은, 보다 많은 양의 동족 tRNA가 발현되는 코돈이며, 이들 코돈의 사용은 번역이 더욱 급속히 또는 더욱 정확히, 또는 더욱 급속하면서도 더욱 정확히 진행되도록 하는 것으로 사료된다. PV 캡시드 단백질은 매우 활발하게 번역되고, 높은 코돈 편향을 가진다.
코돈 쌍 편향
코딩 서열의 한 구분된 특성인 그것의 코돈 쌍 편향이다. 이는 8개의 상이한 코돈 쌍에 의해 코딩될 수 있는 아미노산 쌍 Ala-Glu을 고려함으로써 설명될 수 있다. (표 2에 나와 있는 바와 같은) 각 개별 코돈의 빈도 이외의 어떠한 인자도 코돈 쌍의 빈도의 원인이지 않을 경우, 각각의 8개 코딩의 예상 빈도는 2개의 관련 코돈의 빈도를 곱함으로써 계산될 수 있다. 예를 들어, 이 계산에 의해, 코돈 쌍 GCA-GAA은 모든 Ala-Glu 코딩 쌍 중 0.097(0.23×0.42; 표 2에서의 빈도에 기초함)의 빈도로 일어날 것으로 예상된다. 각 코돈 쌍의 예상(가설) 빈도를 인간 게놈에서 실제로 관찰되는 빈도와 상관시키기 위해, 총 14,795개 인간 유전자를 가지는, 일관된 주석의 인간 코딩 영역의 일치 CDS(CCDS) 데이터베이스가 사용되었다. 이 유전자 집합은 인간 코딩 서열 중 가장 보편적인 표시이다. 이 유전자 집합을 사용하여, 코돈 사용빈도의 빈도는, 코돈의 출현수를 동일한 아미노산을 코딩하는 모든 동의 코돈의 수로 나눔으로써 재계산될 수 있다. 예상된 바와 같이, 빈도는 표 2에 제시된 것들과 같이 이전에 공개된 것들과 밀접히 상관되었다. 84949개 인간 코딩 서열이 계산이 포함된(인간 유전자의 실제수보다 훨씬 많음) 가즈사 DNA 연구원(Kazusa DNA Research Institute)(http://www.kazusa.or.jp/codon/codon.html)에서의 코돈 사용빈도 데이터베이스에 의해 제공되는 데이터에 있어, 약간의 빈도 변동은 가능히 오버샘플링 효과로 인한 것일 수 있다. 이처럼 계산되는 코돈 빈도를 이어서 사용하여, 먼저 2개의 관련 코돈의 빈도를 서로 곱한 후(표 3의 예상 빈도 참조), 이 결과를 관심 코돈 쌍에 의해 코딩되는 아미노산 쌍이 일어나게 되는 (전체 CCDS 데이터 집합에서의) 관찰 빈도와 곱함으로써, 예상 코돈 쌍 빈도를 계산하였다. 코돈 쌍 GCA-GAA의 예에서, 이 두 번째 계산으로 (가즈사 데이터 집합을 이용한 첫 계산에서의 0.97과 대비하여) 0.098의 예상 빈도가 수득된다. 마지막으로, 14,795개 인간 유전자 집합에서 관찰되는 실제 코돈 쌍 빈도는, 집합 내 각 코돈 쌍의 총 출현 수를 계수하여, 그것을 동일한 아미노산 쌍을 코딩하는 집합 내 모든 동의 코딩 쌍의 수로 나눔으로써 결정되었다(표 3; 관찰 빈도). 14,795개 인간 유전자 집합에 기초한 3721(612)개 코돈 쌍의 완전 집합에 대한 빈도 및 관찰/예상 값이 보충 표 1로서 여기에 제공된다.
코돈 쌍의 관찰 빈도/예상 빈도의 비가 1 초과인 경우, 코돈 쌍은 과대표시된다고 말해진다. 그 비가 1 미만인 경우, 그것은 과소표시된다고 말해진다. 그 예에서, 코돈 쌍 GCA-GAA는 1.65배 과대표시되는 반면, 코딩 쌍 GCC-GAA는 5배 초과 과소표시된다.
많은 다른 코돈 쌍들이 매우 강한 편향을 나타내고; 일부 쌍은 과소표시되는 반면, 다른 쌍은 과대표시된다. 예를 들어, 코돈 쌍 GCCGAA(AlaGlu) 및 GATCTG(AspLeu)는 3배 내지 6배 과소표시되는(바람직한 쌍은 각기 GCAGAG 및 GACCTG임) 반면, 코돈 쌍 GCCAAG(AlaLys) 및 AATGAA(AsnGlu)는 약 2배 과대표시된다. 코돈 쌍 편향이 아미노산의 쌍의 빈도 및 개별 코돈의 빈도 모두와 관계없음을 주목할만하다. 예를 들어, 과소표시된 쌍 GATCTG(AspLeu)는 가장 빈번한 Leu 코돈(CTG)을 사용하게 되는 일이 있다.
코돈 쌍 편향이 원핵생물 세포에서도 발견되었으나(문헌 [Greve et al., 1989] 참조), 인간을 포함한, 모든 다른 조사 종들에서도 줄곧 나타났다. 효과는 매우 높은 통계학적 유의성을 가지며, 분명히 단지 노이즈는 아니다. 그러나, 그것의 기능적 유의성이 있다면, 그것은 신비한 것이다. 한 제안은, tRNA의 일부 쌍들이 이들이 리보솜 상에 함께 모이면 잘 상호작용하나, 다른 쌍들은 불량하게 상호작용한다는 것이다. 상이한 코돈들이 통상 상이한 tRNA에 의해 해독되기 때문에, 코돈 쌍은 비상용성 tRNA의 쌍을 함께 조합되는 것을 막도록 편향될 수 있다(문헌 [Greve et al., 1989]). 많은(단, 모두는 아닌) 과소표시된 쌍들이 중심 CG 디뉴클레오티드(예를 들어, GCCGAA, AlaGlu를 코딩함)를 가지고, CG 디뉴클레오티드가 포유동물에서 계통적으로 과소표시된다는 또 다른 사상도 있다(문헌 [Buchan et al., 2006]; 문헌 [Curran et al., 1995]; 문헌 [Fedorov et al., 2002]). 따라서, 코돈 쌍 편향의 영향으로는 2가지가 있을 수 있는데, 그 중 하나는 포유동물의 게놈 내 CG의 과소표시의 간접적 영향이고, 다른 하나는 번역의 효율, 속도 및/또는 정확도와 관계가 있다. 본 발명은 코돈 쌍 편향의 기저가 되는 임의의 특정 분자 기전에 국한되지 않음이 강조된다.
이하 더욱 충분히 논의되는 바와 같이, 코돈 쌍 편향은 코딩 서열의 전체 길이에 걸쳐 평균을 구한 코딩 서열 내 각 코돈 쌍에 대한 스코어를 고려한다. 본 발명에 따라, 코돈 쌍 편향은 에 의해 결정된다.
따라서, 코딩 서열에 대한 유사한 코돈 쌍 편향은 예를 들어, 부분서열에 걸친 최소화된 코돈 쌍 스코어, 또는 코딩 서열의 전장에 걸친 적당히 감소된 코돈 쌍 스코어에 의해 수득될 수 있다.
모든 61개의 센스 코돈 및 모든 센스 코돈 쌍이 분명히 사용될 수 있으나, 빈번한 코돈을 단일 희소 코돈으로 치환하는 것, 또는 빈번한 코돈 쌍을 희소 코돈 쌍으로 치환하는 것이 큰 효과를 가질 것으로 예상되지는 않는다. 그러므로, 코돈 및 코돈 쌍 편향에 대한 과거 많은 연구들이 실험이 아닌 정보학을 통해 이루어졌다. 실험 작업에 기초한 코돈 쌍 편향에 대한 한 연구는 문헌 [Irwin et al. (1995)]의 연구였는데, 그 저자는 일부 과대표시된 코돈 쌍이 보다 느린 번역을 유발한다는 것을 반직관적으로 밝혀냈다. 그러나, 이 결과는 두 번째 그룹에 의해 재현될 수 없었고(문헌 [Cheng and Goldman, 2001]), 또한 이하 보고되는 결과와 상충된다. 따라서, 현 결과(이하 참조)는 코돈 쌍 편향의 기능적 역할에 대한 첫 번째 실험 증거일 수 있다.
본원에 개시된 일부 실험들은, 불량한 코돈 편향 및 불량한 코돈 쌍 편향 모두를 게놈에 분리하여 도입하기 위해, 약 1000개 코돈을 포함하는 바이러스 게놈 서열, 예컨대 PV의 전체 캡시드 영역을 재코딩하는 것과 관련된다. 이 실험에 기저를 이루는 근본적 이유는, 각 치환이 작은 영향을 발생시키면, 모든 치환들이 함께 큰 영향을 일으키게 된다는 것이다. 실제로, 역최적화 코돈 편향과 역최적화 코돈 쌍 편향 모두 분리하여 비생존성 바이러스를 발생시키는 것으로 나타났다. 실시예에서 더욱 상세히 논의되는 바와 같이, 예비 데이터는 비효율적 번역이 불량한 코돈 편향 또는 코돈 쌍 편향으로 바이러스 생존력을 감소시키는 주요 기전임을 제시한다. 정확한 기전과 상관없이, 데이터는 동의 역최적화 코돈의 바이러스 게놈 내로의 대규모 치환이 심하게 약독화된 바이러스를 초래한다는 것을 가리킨다. 약독화 바이러스를 생성하기 위한 이 절차는 SAVE(합성 약독화 바이러스 조작)으로 칭해졌다.
본 발명에 따라, 바이러스 약독화는 코돈 편향뿐만 아니라, 코돈 쌍 편향을 변화시키는 것에 의해 이루어질 수 있다. 그러나, 코돈 쌍 편향을 조정하는 것이 특히 유리할 것으로 예상된다. 예를 들어, 바이러스를 코돈 편향을 통해 약독화하는 것은 일반적으로 공통된 코돈을 제거하는 것을 요하고, 이에 따라 뉴클레오티드 서열의 복잡성이 감소된다. 이와는 달리, 코돈 쌍 편향 감소 또는 최소화는 보다 큰 서열 밀도 및 이에 따른 핵산 2차 구조의 보다 큰 조절, 어닐링 온도, 및 기타 물리적 및 생화학적 성질을 유지하면서 이루어질 수 있다. 본원에 개시된 연구는, 코돈은 셔플링되나 코돈 사용빈도 프로파일은 변화되지 않는 약독화 코돈 쌍 편향이 감소되거나 최소화된 서열을 포함한다.
바이러스 약독화는 당업자에게 공지된 방식으로 확인될 수 있다. 비제한적 예에는 시험 동물에 있어서의 플라크 검정법, 증식 측정 및 감소된 치사율이 포함된다. 본원은 약독화 바이러스가 숙주에서 보호 면역 반응을 유발할 수 있음을 입증한다.
합성 약독화 바이러스 조작(SAVE)
SAVE는 특수 설계된 컴퓨터 소프트웨어, 및 바이러스의 게놈을 재코딩하고 재합성하기 위한 핵산 합성 및 어셈블리의 근대적 방법을 이용한다. 이 기법은 효능적 백신이 모색되는, 각종 의학적으로 중요한 바이러스에 대한 백신을 생성하는 효율적 방법을 제공한다.
2가지 효과적인 소아마비 백신인, [Jonas Salk]에 의해 개발된 불활성화된 소아마비 백신(IPV) 및 [Albert Sabin]에 의해 개발된 약독화 생바이러스를 포함하는 경구용 소아마비 백신(OPV)은 각기 1950년 이후로 이용 가능하였다. 실제로, 1988년에 시작하여 세계보건기구(WHO)에 의해 선도되어온, 급성 회백수염을 근절하기 위한 세계적 노력은 세계 대부분의 국가들로부터 소아마비를 근절하는 데 성공을 거두었다. 매년 진단된 사례의 수가 수십만에서 2005년에는 인도 및 나이지리아에서 주로 발생한 수인 2천 미만으로 감소하였다. 그러나, OPV의 광범위 사용에 관한 우려는, 그것이 독성 형태로 복귀될 수 있다는 것이며, 백신에서 유래되는 소아마비의 발병이 희소 이벤트인 것으로 판단되기는 하나 보고된 바 있다(문헌 [Georgescu et al., 1997]; 문헌 [Kew et al., 2002]; 문헌 [Shimizu et al., 2004]). 사실상, 각각 7개 미만의 약독화 돌연변이를 가지는 생 폴리오바이러스 백신 균주가 사용되는 한, 상기 균주가 wt로 복귀될 가능성이 있고, 그러한 복귀는 소아마비의 완전 근절에 대해 심각한 위협을 제기한다. 따라서, WHO는 소아마비 근절을 위한 노력을 마감하는 단계에서 복귀 가능성을 저지하기 위한 신규 소아마비 백신을 필요로 하는 것도 당연하며, 이는 SAVE를 PV에 적용함에 관한 본원에 개시된 연구에 대한 한 근본적 이유를 제공한다. 그러나, PV는, 그것이 SAVE를 개발하기 위한 우수한 모델 시스템이기 때문에 일차적으로 선택된 것이었다.
재코딩 중에, 바이러스 게놈 내의 필수 핵산 신호가 보존되나, 단백질 번역의 효율은 코돈 편향, 코돈 쌍 편향, 및 RNA 2차 구조 및 CpG 디뉴클레오티드 함량, C+G 함량, 번역 틀이동 부위, 번역 휴지 부위, 또는 이들의 임의의 조합과 같은 기타 파라미터들을 역최적화함으로써 계통적으로 감소된다. 이 역최적화는 각기 작은 효과를 가지는 수백가지 또는 수천가지 변화를 수반할 수 있다. 일반적으로, 역최적화는, 바이러스가 일부 세포주(한 특정 바이러스에 대해 허용되도록 특수 조작된 세포주 포함)에서는 여전히 증식할 수 있으나, 바이러스가 정상 동물 또는 인간 내에서는 비독성인 지점까지 수행된다. 그러한 비독성 바이러스는, 완전 독성 바이러스와 정확히 동일한 단백질을 코딩하고 이에 따라 완전 독성 바이러스와 정확히 동일한 면역 반응을 일으키기 때문에, 사멸된 백신 또는 생백신 중 어느 하나의 우수한 후보물질이다. 부가적으로, SAVE 과정은 약독화 수준을 미세 조정하기 위한 전망을 제공하며; 즉 그것은 대략 예측 가능한 정도로 역최적화되는 합성 바이러스를 설계하는 능력을 제공한다. 바이러스 입자의 설계, 합성 및 생성은 일단 게놈 서열이 알려지면 수주의 시간틀 내에 달성 가능하고, 이는 가능한 위급상황에서 백신을 생성시킴에 관한 중요한 이점을 가진다. 또한, 약독화 바이러스는 극히 큰 수의 유해한 뉴클레오티드 변화가 수반되기 때문에, 독성으로 복귀할 가능성이 사실상 없을 것으로 예상된다. 이 방법은 일반적으로, 광범위한 바이러스에 적용 가능할 수 있고, 이는 임의의 특정 바이러스에 대한 바이러스 게놈 서열 및 역유전학 시스템의 지식만을 요한다.
코돈 편향의 역최적화에 의한 바이러스
약독화
상기 기재된 대조군 세포/시험 세포 방법의 IC50 비를 사용할 경우, 1 이하의 CSG 값을 갖는 화합물은 양호한 임상 후보 화합물로 간주되지 않는 반면, 대략 10 초과의 CSG 값을 갖는 화합물은 매우 유망하고 더욱 고려할 가치가 있을 것이다.
약독화 바이러스를 조작하는 한 수단으로서, 폴리오바이러스 1형 마호니[PV(M)]의 캡시드 코딩 영역을, 동의 코돈 사용빈도를 변화시킴으로써 재조작하였다. 캡시드 영역은 바이러스의 약 1/3을 구성하고, 매우 활발하게 번역된다. 최대 가능한 수의 빈번하게 사용되는 코돈을 동의 희소 코돈으로 치환함으로 인해 매우 낮은 코돈 편향을 갖는, 한 돌연변이체 바이러스(바이러스 PV-AB)를 생성시켰다. 대조군으로서, 본래의 코돈 편향을 유지하면서 최대의 가능한 수의 동의 코돈 변화를 가지는 또 다른 바이러스(PV-SD)를 생성시켰다. 따라서, PV-SD는 wt와 본질적으로 동일한 코돈을 셔플링된 위치에 가지면서 정확히 동일한 단백질을 코딩하는 바이러스이다. PV-SD에서, 셔플링 절차에 의해 코돈 쌍 편향을 증가시키거나 감소시키기 위한 노력은 이루어지지 않았다. 실시예 1을 참조한다. 캡시드 코딩 영역에서의 934개 뉴클레오티드 변화에도 불구하고, PV-SD RNA는 wt와 구분불가능한 특성을 갖는 바이러스를 생성시켰다. 그와 대조적으로, 680개 침묵 돌연변이를 가지는 PV-AB로부터는 생존 가능한 바이러스가 회수되지 않았다. 실시예 2를 참조한다.
PV-AB의 비생존성의 진부한 설명은, 뉴클레오티드 변화들 중 단지 한 개는 어떻게든 치사적이긴 하나, 다른 679개는 무해하는 것이다. 예를 들어, 뉴클레오티드 변화는 일부 극적인, 다만 인정받지 못하는 이유로 인해, 예컨대 복제 예방으로 인해 치사적일 수 있다. 그러나, 이러한 설명은 개연성있지 않다. PV가 CRE와 같은, 그것의 RNA 내에 중요한 조절 요소를 포함하나, 그러한 요소는 캡시드 코딩 영역 내에 존재하지 않는 것으로 알려져 있다. 이는, 전체 캡시드 코딩 영역이 세포 내의 잔여 게놈의 정상 복제에 영향을 주지 않으면서 결실될 수 있으나, 물론 바이러스 입자가 형성될 수 없다는 입증사실에 의해 지지된다(문헌 [Kaplan and Racamiello, 1988]).
일부 재조작된 바이러스의 비생존성에 관한 문제를 해결하기 위해, 바이러스 PV-AB의 캡시드 영역의 부분분절을 야생형 바이러스 내에 클로닝하였다. 실시예 1 및 도 3을 참조한다. 서브클로닝된 큰 분절(비중첩 분절 포함)의 도입은 치사적인 것으로 입증되었으나, 서브클로닝된 작은 분절은 생존력을 지니나(단 한 예외가 있음) 병약한 바이러스를 생성시켰다. "병약함(sickness)"은 많은 검정법들에 의해 밝혀지는데: 예를 들어, 불량한 코돈 편향의 분절은 불량한 역가(도 3B) 및 작은 플라크(도 3C-H)를 유발한다. 일반적으로, 큰 치사적인 분절은 2개의 부분분절로 나뉠 수 있고, 이 양 부분분절 모두는 살아있으나 병약하다는 것이 특히 주목할만하다(도 3). 이 결과는, 생존력이 단지 하나의 변화로 인한 것이며; 그 대신 최소한, 많은 변화들이 표현형에 기여하는 것이어야 한다는 가설을 배제한다.
위치 1513 내지 2470의 예외적 분절이 있다. 이 분절은 매우 작으나, PV 게놈 내의 그것의 혼입은 비생존성을 유발한다. 이 단편이 단지 병약성을 유발하고 바이러스를 불활성화하지 않는 부분단편으로 세분될 수 있는지의 여부는 현재 알려져 있지 않다. 이 분절은 매우 유해한 변화, 가능하게는 번역 틀이동 부위를 포함하는 것으로 생각할 수 있다.
불량한 코돈 편향이 본래 번역에 대한 영향을 미치나, 바이러스 PV-AB에 의해 코딩되는 단백질의 번역을 시험하였다. 실시예 5 및 도 5를 참조한다. 실제로, 모든 병약한 바이러스가 캡시드 단백질을 불량하게 번역하였다(도 5B). 불량한 번역이 병약성의 원인이라는 것과 일관되게도, 번역은 보다 병약한 바이러스에서 보다 덜 효율적이었다. 희소 코돈의 인식율이 제한적이라는 것과 일관되게도, 번역은 과잉 tRNA 및 아미노산으로 보충된 반응에서의 wt 수준까지 본질적으로 향상되었다.
역최적화 코돈 편향이 비효율적 번역을 유발하는지의 여부에 관한 두 번째 시험으로서, wt 및 역최적화 캡시드의 부분을 디시스트론성 리포터 작제물 내 반딧불 루시퍼라제의 N-말단에 융합시켰다. 실시예 5 및 도 6을 참조한다. 이 융합 작제물에서, 루시퍼라제의 번역은 N-말단에 융합된 캡시드 단백질의 번역에 의존한다. 또한, 역최적화 코돈을 갖는 캡시드 단백질의 번역이 불량하였고, 보다 병약한 바이러스에서 더 좋지 않았다는 것이 밝혀졌고, 이는 원인과 결과의 관계를 제시한다. 따라서, 데이터는, PV-AB 바이러스 내의 수백개의 희소 코돈이 대체로 불량한 번역으로 인해 비생존성을 유발한다는 것을 제시한다. 또한, 시험관내 관측되는 불량한 번역 및 배양된 세포 내 관측되는 바이러스 병약성은 또한 동물의 감염에서도 반영된다. 심지어 가장 덜 쇠약화된 역최적화 바이러스 중 하나인 PV-AB2470-2954의 경우에서도, 마우스에서 질환을 유발하는 데 필요한 바이러스 입자의 수가 약 100배만큼 증가되었다. 실시예 4 및 표 4를 참조한다.
문헌 [Burns et al. (2006)]은 최근 PV의 세이빈 2형 백신 균주를 이용한 일부 유사한 실험을 기재하였고, 유사한 결론에 도달하였다. [Burns 등]은 완전히 상이한 코돈 역최적화 바이러스(즉, 본원에 기재된 PV-AB 바이러스의 뉴클레오티드 서열, 및 이들의 "abcd" 바이러스는 매우 상이함)를 합성하였으나, 유사한 검정법을 이용하여 유사한 쇠약화 정도를 얻었다. [Burns 등]은 약독화에 대해 숙주 생물체에서의 그들의 바이러스 작제물을 시험하지 않았다. 그러나, 그 결과는, SAVE가 예측 가능하고, 그 결과가 정확한 뉴클레오티드 서열에 크게 의존하지 않는 견해를 입증한다.
코돈 쌍 편향의 역최적화에 의한 바이러스 약독화
본 발명에 따라, 코돈 쌍 편향은 코돈 사용빈도와 무관하게 변경될 수 있다. 예를 들어, 관심 단백질 코돈 서열에서, 코돈 쌍 편향은 간단히 그것의 코돈의 지정된 재배열에 의해 변경될 수 있다. 특히, 숙주 생물체에서 빈도가 다양할 수 있는, 모 서열에서 나타나는 동일한 코돈이 변경된 서열에, 다만 상이한 위치에서 사용된다. 가장 간단한 형태로, 동일한 코돈이 모 서열에서와 같이 사용되므로, 단백질 코딩 영역에 걸친 코돈 사용빈도는, (코딩된 아미노산 서열과 마찬가지로) 변화되지 않은 채로 남는 것으로 간주된다. 그럼에도 불구하고, 일부 코돈은 새 부문에서, 즉 상이한 뉴클레오티드 삼중체를 이용하기는 하나 모 서열에서와 같이 동일한 아미노산을 코딩하는 코돈이 선행 및/또는 후행되는 부문에 나타난다. 이상적으로는, 코돈의 재배열은 모 서열에서보다 덜 빈번한 코돈 쌍을 초래한다. 실제로, 코돈의 재배열이 종종 한 위치에서 덜 빈번한 코돈 쌍을 초래하고, 두 번째 위치에서 더 빈번한 쌍을 초래한다. 코돈의 적절한 재배열에 의해, 주어진 길이의 코딩 서열에 걸친 코돈 쌍 사용빈도 편향이 모 서열에 비해 감소될 수 있다. 대안적으로, 코돈은 모 서열에서보다 숙주 세포에서 더 빈번한 코돈 쌍을 이용하는 서열을 생성하기 위해 재배열될 수 있다.
코돈 쌍 편향은, 본원에 개시된 바와 같이, 각 코돈 쌍을 차례로 고려하고, 코돈 쌍이 숙주 세포의 단백질 코딩 서열에서 관찰되는 빈도에 따라 각 쌍을 스코어링한 후, 서열에 대한 코돈 쌍 편향을 결정함으로써 평가된다. 혹자는 동일한 코돈 쌍 편향을 가지는 많은 상이한 서열들을 발생시킬 수 있음이 인지될 것이다. 또한, 코돈 쌍 편향은, 코돈이 재배열되는 방식에 따라 다소의 정도로 변경될 수 있다. 코딩 서열의 코돈 쌍 편향은 전체 코딩 서열을 재코딩하거나, 하나 이상의 부분서열을 재코딩함으로써 변경될 수 있다. 본원에 사용되는 "코돈 쌍 편향"은, 서열의 단지 일부만이 돌연변이될 수 있을지라도, 코딩 서열의 길이에 걸쳐 평가ㄷ된. 코돈 쌍이 숙주 생물체의 코돈 사용빈도의 부문에서 스코어링되기 때문에, 코돈 쌍 편향 값은 야생형 바이러스 서열 및 돌연변이체 바이러스 서열에 배당될 수 있다. 본 발명에 따라, 바이러스는 자체의 코돈 쌍 편향을 감소시키기 위해, 바이러스의 단백질 코딩 서열의 전부 또는 일부를 재코딩함으로써 약독화될 수 있다.
본 발명에 따라, 코돈 쌍 편향은 숙주의 코돈 쌍 사용빈도로부터 결정되는 정량적 성질이다. 따라서, 절대적 코돈 쌍 편향 값을 임의의 주어진 바이러스 단백질 코딩 서열에 대해 결정할 수 있다. 대안적으로, 역최적화 바이러스 단백질 코딩 서열을 유래의 기원이 되는 "모" 서열과 상관시키는 코돈 쌍 편향 값의 상대적 변화를 결정할 수 있다. 바이러스가 각종 유형들(즉, 발티모어(Baltimore) 분류법에 의해 I형 내지 VII형)의 것이 되고, 상이한 바이러스의 천연(즉, 독성) 분리주가 절대 코돈 쌍 편향의 상이한 값을 생성하기 때문에, 원하는 약독화 수준을 결정하는 것과 통상 더욱 관련된 것은 코돈 쌍의 상대적 변화이다. 따라서, 본 발명은 하나 이상의 단백질 코딩 뉴클레오티드 서열이 돌연변이에 의해 감소된 코돈 쌍 편향을 가지는 바이러스 게놈을 포함하는 약독화 바이러스 및 그것의 제조 방법을 제공한다. 단지 단일 단백질(즉, 다단백질)을 코딩하는 바이러스에서, 다단백질의 전부 또는 일부는 요망되는 정도로 코돈 쌍 편향을 감소시키도록 돌연변이될 수 있고, 돌연변이된 서열의 전부 또는 일부가 재조합 바이러스 작제물 내에 제공될 수 있다. 다중 단백질을 분리하여 코딩하는 바이러스의 경우, 혹자는 단백질 코딩 서열의 코돈 쌍 편향을 동시에 감소시키거나, 변형을 위한 단백질 코딩 서열의 단지 하나 또는 수개를 선택할 수 있다. 코돈 쌍 편향의 감소는 단백질 코딩 서열의 길이에 걸쳐 결정되고, 약 0.05 이상, 또는 약 0.1 이상, 또는 약 0.15 이상, 또는 약 0.2 이상, 또는 약 0.3 이상, 또는 약 0.4 이상이다. 바이러스에 따라, 숙주의 코돈 쌍 사용빈도에 기초하는, 절대적 코돈 쌍 편향은 약 -0.05 이하, 또는 약 -0.1 이하, 또는 약 -0.15 이하, 또는 약 -0.2 이하, 또는 약 -0.3 이하, 또는 약 -0.4 이하일 수 있다.
코돈 쌍 편향은 또한 다른 서열 변화에 중첩될 수 있음이 명백할 것이다. 예를 들어, 코딩 서열은 하나 이상의 아미노산 변화를 가지는 단백질 또는 폴리펩티드를 코딩하기 위해, 또한 변경된 코돈 쌍 편향을 가지도록 하기 위해 변경될 수 있다. 또한, 일부 경우에서, 혹자는 모 단백질 코딩 서열에서와 같이 코돈 편향 감소 단백질 코딩 서열에서 정확히 동일한 코돈 사용빈도 프로파일을 유지하기 위해 코돈을 셔플링할 수 있다. 이 절차는 코돈 쌍 편향 변화의 위력을 강조하나 이에 집착할 필요는 없다. 대안적으로, 코돈 선택은 코딩 서열에서의 코돈 사용빈도의 전체 변화를 초래할 수 있다. 이와 관련하여, 본원에 제공된 일부 실시예(예를 들어, PV-Min의 설계)에서, 코돈 사용빈도 프로파일이 코돈 쌍 편향 최소화 서열을 생성하는 과정에서 변화되지 않더라도, 그 서열의 일부가 돌연변이되지 않은 서열에 서브클로닝될 때(예를 들어, PV-MinXY 또는 PV-MinZ), 서브클로닝된 부분 상 및 생성된 하이브리드 내 코돈 사용빈도 프로파일은 본래의 돌연변이되지 않은 단백질 코딩 서열의 프로파일이 부합하지 않음을 주목한다. 그러나, 코돈 사용빈도 프로파일의 이러한 변화는 코돈 쌍 편향의 최소의 영향을 가진다.
마찬가지로, 하나 또는 다수의 아미노산 치환을 갖는 단백질 또는 폴리펩티드를 코딩하기 위해 뉴클레오티드 서열을 변화시키는 것도 또한 그 자체로 코돈 쌍 편향의 유의적 변화를 가지는 서열을 생성시킬 가능성이 매우 낮다는 것을 주목한다. 궁극적으로, 코돈 쌍 편향 변경은 돌연변이된 아미노산 서열을 코딩하기 위해 추가 변형된 뉴클레오티드 서열에서도 인식될 수 있다. 또한, 코돈 편향을 증가시키는 자체 의미의 돌연변이는 코돈 쌍 편향에 대한 작은 정도 이상의 영향을 미치기 쉽지 않음을 주목말한 만하다. 예를 들어, 본원에 개시된 바와 같이, 바람직하지 않은 코돈(PV-AB)의 사용을 최대화하기 위해 재코딩된 폴리오바이러스 돌연변이체에 대한 코돈 쌍 편향은, 야생형(PV-I(M))에서 단지 약 0.05만큼 감소된다. 또한, 그러한 단백질 코딩 서열이 크게 감소된 서열 다양성을 가진다는 것도 주목할만하다. 그와 반대로, 실질적 서열 다양성은 본 발명의 코돈 쌍 편향 변형 서열에서 유지된다. 또한, 희소 코돈의 사용 증가없이 수득가능한 코돈 쌍 편향의 유의적 감소는, PV-AB에서와 같이 바람직하지 않은 코돈의 사용을 최대화하는 대신, 코돈 쌍 편향을 더욱 효과적으로 감소시키기 위해 바람직하지 않은 코돈을 충분한 수의 바람직한 코돈으로 재배열하는 것이 유익할 것이다.
돌연변이의 정도 및 강도는 단백질 코딩 핵산의 길이, 전부 또는 일부가 돌연변이될 수 있는지의 여부, 및 코돈 쌍 편향의 요망되는 감소에 따라 다양할 수 있다. 본 발명의 한 실시양태에서, 단백질 코딩 서열은 약 100개 이상의 뉴클레오티드, 또는 약 200개 이상의 뉴클레오티드, 또는 약 300개 이상의 뉴클레오티드, 또는 약 500개 이상의 뉴클레오티드, 또는 약 1000개 이상의 뉴클레오티드의 길이에 걸쳐 변형된다.
상기 논의된 바와 같이, 용어 "모" 바이러스 또는 "모" 단백질 코딩 서열은, 다소 약독화될 수 있는 새 서열이 유래되는 기원이 되는 바이러스 게놈 및 단백질 코딩 서열을 지칭하기 위해 본원에 사용된다. 따라서, 모 바이러스는 "야생형" 또는 "천연 발생" 원형 또는 분리주, 또는 실제 또는 인식되는 바람직한 성질에 기초하여 특수 발생되거나 선택된 변이체 또는 돌연변이체일 수 있다.
신생 DNA 합성을 이용하여, 야생형 바이러스의 코돈 편향을 보존하면서, 최대 가능한 수의 희소하게 사용되는 코돈 쌍(바이러스 PV-Min)(서열 번호 4) 또는 최대 가능한 수의 빈번하게 사용되는 코돈 쌍(바이러스 PV-Max)(서열 번호 5)을 도입하도록, PV(M)의 캡시드 코딩 영역(뉴클레오티드 755 내지 뉴클레오티드 3385의 P1 영역)을 재설계하였다. 실시예 7를 참조한다. 즉, 설계된 서열은 모 서열과 동일한 코돈을 사용하나, 그것은 상이한 순서로 나타난다. PV-Max 바이러스는 1단계 증식 동역학 특성, 및 야생형 바이러스와 본질적으로 동일한 감염된 세포의 사멸을 나타냈다. (증식 동역학 특성이 야생형에 비해 코돈 쌍 최대화 바이러스에 대해 증가되지 않는다는 점은 다른 바이러스에 대해서도 유효한 것으로 나타낸다.) 역으로, PV-Min 돌연변이체 RNA로 형질감염된 세포는 사멸되지 않았고, 생존 가능한 바이러스가 회수될 수 없었다. PV-Min의 캡시드 영역의 단편(PV-Min755-2470, PV-Min2470-3386)의 wt 백그라운드로의 서브클로닝은, 매우 쇠약화되었으나 사멸하지 않은 바이러스를 생성시켰다. 실시예 7 및 도 8를 참조한다. 이 결과는, 유해한 코돈 변화가 바람직하게 널리 분포되어 있다는 가설을 입증하고, 전체 서열에 대한 코돈 쌍 편향 및 바이러스 산물의 약독화를 다양하게 하기 위해 야생형 모 바이러스 게놈 내로 치환된 코돈 쌍 역최적화 서열의 정도를 다양하게 함의 단순성 및 유효성을 증명한다. PV-AB 바이러스에서 관측되는 바와 같이, PV-Min 바이러스의 표현형은 자손 바이러스의 보다 적은 생성보다는, 바이러스 입자의 감소된 특이적 감염력의 결과이다.
역최적화 코돈 쌍 편향을 갖는 바이러스가 약독화된다. 이하 예시된 바와 같이(실시예 8 및 표 5 참조), CD155tg 마우스는 야생형 바이러스에 대해 치사적인 양보다 1000배 더 큰 양으로 약독화 바이러스를 뇌내 주사함에 의한 공격접종에도 생존하였다. 이러한 발견사실은, 바이러스에 대한 치사성을 최소화하기 위한 코돈 쌍 편향의 역최적화의 위력을 입증한다. 또한, 코돈 쌍 편향 역최적화 정도를 선택함으로써, 바이러스의 생존력이 감염력 감소와 균형을 이룰 수 있다. 또한, 일단 요망되는 약독화 성질을 제공하는 코돈 쌍 편향 역최적화의 정도 또는 범위가 결정되면, 그러한 코돈 쌍 편향 정도를 얻기 위한 부가적 서열을 설계할 수 있다. 예를 들어, 서열 번호 6은 갖는 폴리오바이러스 서열에 약 -0.2의 코돈 쌍 편향, 및 PV-MinXY 및 PV-MinZ의 돌연변이된 부분을 포괄하는 영역(즉, PV755-3385)에 걸쳐 분포한 돌연변이를 제공한다.
서열 설계를 위한 알고리즘
본 발명자들은 주어진 아미노산 서열을 코딩함과 동시에 특정의 요망되는 성질을 위해 DNA 서열을 최적화하는 유전자 설계를 위한 수가지 신규 알고리즘을 개발하였다. 특히, 패턴의 특정 집합을 최대로 부가 및/또는 제거함과 더불어(문헌 [Skiena, 2001]), 서열 내 요망되는 RNA 2차 구조를 최대화 또는 최소화하기 위한 알고리즘(문헌 [Cohen and Skiena, 2003])이 개발되었다. 전자 문제는 생존성 바이러스의 설계에 있어 제기되는 한편, 후자는 기술적 이유로 인해 제한효소 분위를 최적으로 삽입하는 데 유용하다. 교대 해독틀에서 2개 이상의 유전자를 동시에 코딩하는 중첩 유전자가 설계될 수 있는 정도가 연구되었다(문헌 [Wang et al., 2006]). 단일 핵산의 상이한 해독틀에서 코딩되는 상이한 기능성 폴리펩티드의 이러한 성질은 바이러스에 있어 공통적이고, 항생제 내성 유전자에서의 위빙(weaving)과 같은 기술적 목적을 위해 이용될 수 있다.
문헌 [Jayaraj et al. (2005)] 및 문헌 [Richardson et al. (2006)]에 기재되어 있는 바와 같이, 합성 생물학을 위한 설계 툴의 제1 세대가 확립되었다. 이는 생물학적 활성을 위한 서열 최적화 대신에 제조능을 위한 설계 최적화(즉, 국소 2차 구조 및 말단 반복체를 갖는 올리고뉴클레오티드)에 주로 초점을 두고 있다. 이 제1 세대 툴은, 고차원 설계 원리를 지지하기 보다는, 그 대신에 설계 원칙을 체킹하는 것과 관련하여 확립된 초기 VLSI CAD 툴과 유사한 것으로 볼 수 있다.
본원에 예시된 바와 같이, 임의의 코딩 영역의 코돈 쌍 편향을 조작하기 위해, 컴퓨터 기반 알고리즘이 사용될 수 있다. 알고리즘은 현존 코돈을 셔플링하고 생성되는 CPB를 평가한 후, 그 서열, 임의적으로는 특히 "중요(valuable)" 코돈 쌍에 고정된 서열을 리셔플링하는 능력을 가진다. 알고리즘은 또한 국부 최소점에 끼워지게 되지 않도록 "모의 어닐링"을 이용한다. RNA 폴딩의 자유 에너지와 같은 다른 파라미터들이 또한 임의적으로, 요망되지 않는 2차 구조의 발생을 막기 위한 알고리즘의 조절 하에 놓일 수 있다. 최소의 코돈 쌍 편향을 가지는 서열을 찾기 위해 알고리즘을 사용할 수 있고, 그러한 서열이 생존성 바이러스를 제공하지 않는 경우, 편향이 감소되었으나 최소화되지는 않은 서열을 찾기 위해 알고리즘을 조정할 수 있다. 물론, 생존성 바이러스 서열은 또한 컴퓨터 최소화 서열의 부분서열만을 이용하여 생성될 수 있다.
예를 들어 구배 강하, 또는 모의 어닐링을 이용한 컴퓨터로 보조하여, 또는 다른 최소화 통상적 절차로 수행하는지의 여부. 출발 서열 내에 존재하는 코돈을 재배열하는 절차의 한 예가 하기 단계들에 의해 나타내어질 수 있다:
1) 야생형 바이러스 게놈 서열을 얻는 단계.
2) 약독화 설계를 위해 표적화하는 단백질 코딩 서열을 선택하는 단계.
3) 비코딩 기능을 갖는, 알려지거나 추측된 DNA 분절을 잠그는(lock down) 단계.
4) 재설계된 단백질 내 잔존 아미노산의 요망되는 코돈 분포를 선택하는 단계.
5) 잠그어지지 않은 코돈 위치의 무작위 셔플을 수행하고, 코돈 쌍 스코어를 계산하는 단계.
6) 모의 어닐링 절차를 임의적으로 이용하여, 코돈 쌍 스코어를 더욱 감소(또는 증가)시키는 단계.
7) 수득된 설계를 과다 2차 구조 및 원치 않는 제한효소 부위에 대해 조사하는 단계:
"예"이면, 단계 (5)로 가거나, 문제있는 영역을 야생형 서열로 치환함으로써 설계를 수정하고, 단계 (8)로 감.
8. 바이러스 설계에 상응하는 DNA 서열을 합성하는 단계.
9. 바이러스 작제물을 생성하고, 발현을 평가하는 단계:
지나치게 약독화된 경우, 서브클론 작제물을 제조하고, 9로 가고;
불충분하게 약독화되면, 2로 감.
컴퓨터 기반 모의 어닐링의 일반 절차의 소스 암호(PERL 스크립트)가 제공된다.
대안적으로, 혹자는 코돈이 단백질 코딩 서열 내 다른 임의의 곳으로부터 스와핑되어야 한다는 요건없이 코돈 쌍을 선택함으로써 아미노산의 각 쌍이 역최적화되도록 하는 절차를 고안할 수 있다.
바이러스 약독화의 분자 기전: 고효율 방법을 이용한 약독화
PV
의 특성 분석
상기 기재되고 실시예에서 더욱 상세히 기재되는 바와 같이, 야생형 바이러스와 정확히 동일한 단백질을 코딩하나 변경된 코돈 편향 또는 변경된 코돈 쌍 편향을 가지는 2개의 합성 약독화 폴리오바이러스를 작제하였다. 한 바이러스는 역최적화 코돈을 이용하고; 다른 한 바이러스는 역최적화 코돈 쌍을 이용한다. 각 바이러스는 wt 바이러스에 대해 많은 수백개의 뉴클레오티드 변화를 가진다.
본원에 제시된 데이터는, 이들 바이러스가 불량한 번역으로 인해 약독화됨을 제시한다. 이러한 발견사실은 수정이 된다면 중요한 결과를 가진다. 첫 째로, 각 바이러스의 감소된 적응도/독성은 게놈에 걸쳐 확산되어 있는 수백개 위치에서의 작은 결손으로 인한 것이다. 따라서, 본질적으로 바이러스가 야생형으로 복귀될 가능성이 없고, 이에 따라 바이러스는 생백신 또는 사멸된 백신 중 어느 하나에 대한 좋은 출발점이다. 두 번째로, 감소된 적응도/독성이 번역에서의 수백개의 결손의 부가적 영향으로 인한 것인 경우, 복귀의 위험이 최소이면서 적응도를 감소시키는 상기 방법이 다른 많은 바이러스들에 대해 적용 가능해야 한다.
본 발명이 임의의 특정 작용 방식 또는 기저를 이루는 분자 기전에 국한되지 않음이 강조될지라도, 현재 진행 중인 연구는 이러한 대체 가설을 특징화하는 것에 목적을 둔다. 현재 진행 중인 검토는, 코돈 및 코돈 쌍 역최적화 폴리오바이러스 및 인플루엔자 바이러스와 같은 각종 약독화 바이러스 설계의 게놈을 통해 스캔하고, 또한 각 돌연변이체 바이러스의 중첩 300 bp 부분을 wt 부문에 둠으로써 키메라를 작제하는 고효율 방법을 이용하는 것을 수반한다. 실시예 11을 참조한다. 이어서, 이러한 키메라 바이러스의 기능을 검정한다. 본원에 개시된 예비 데이터에 의해 제시된 바와 같이, 대부분의 키메라가 야생형보다 급진적이지는 않으나 약간 덜 적합하다는 발견사실은, 많은 유해 돌연변이가 키메라에 의해 커버되는 영역 전반에 걸쳐 분포되어 있다는 "기능의 점증 손실"을 상관시킨다. 이와 역으로, 대부분의 키메라가 wt와 유사하거나 동일한 반면, 하나 또는 단지 몇 개의 키메라만 모 돌연변이체와 같이 약독화된다는 발견사실은, 돌연변이가 약독화를 초래하는 서열 위치가 비교적 소수로 있음과 그 위치에서의 약독화가 유의적임을 제시한다.
실시예 12에 기재된 바와 같이, 코돈 및 코돈 쌍 역최적화가 RNA 안정성 및 풍부도에 어떻게 영향을 미치는지 결정하고, 재조작된 바이러스 게놈의 번역을 저해하는 파라미터를 지적하기 위해, 실험을 수행한다. 분자에 기초한 이러한 저해의 이해는 SAVE 방법의 광범위한 바이러스로의 적용 가능성을 더욱 증진시킬 것이다. 번역 저해의 기저를 이루는 것으로 생각해 볼 수 있는 또 다른 기전은, 리보솜이 상이한 해독틀을 번역하기 시작하여, 그것이 인-프레임 정지 코돈을 만나게 되는 지점까지 의사적(spurious)이나, 전형적으로는 절단된(truncated) 폴리펩티드를 발생시키는 번역 틀이동이다. 잔기 1513 내지 2470로부터의 AB 돌연변이체 분절을 가지는 PV 게놈은 비생존성일 뿐만 아니라, 대략 42-44 kDa의 시험관내 번역 중에 신규 단백질 밴드를 생성시킨다(도 5A 참조). 신규 단백질의 생성을 유도하는 능력뿐만 아니라, PV를 불활성화하는 상기 AB1513-2470 단편의 능력은 틀이동 이벤트의 출현을 반영할 수 있고, 이 가능성도 또한 조사 중이다. 틀이동 부위의 도입을 막기 위한 필터가 SAVE 설계 소프트웨어 내에 만들어진다.
번역 결손에 대한 보다 상세한 조사가, 실시예 12에 기재된 바와 같이, 폴리솜 프로파일링, 토우프린팅(toeprinting), 및 융합 단백질의 루시퍼라제 검정법을 포함하나, 이들에 국한되지 않는 각종 기법들을 이용하여 수행된다.
폴리오바이러스의 분자 생물학
SAVE에 의해 바이러스 약독화에 기저를 이루는 기전을 파악하기 위해 연구가 진행 중이나, PV 캡시드 코딩 영역의 대규모 코돈 역최적화는 PV 그 자체의 생물학에 흥미로운 식견을 밝혀내었다. 무엇이 바이러스의 PFU/입자 비(특이적 감염력)을 결정하는지는 오래 지속되어 온 질문이다. 일반적으로, 생산적 감염의 확립 전의 감염성 라이프 사이클 중의 임의의 단계에서의 실패는 부전형(abortive) 감염을 초래할 것이며, 이에 따라 감염 입자의 소멸을 초래할 것이다. PV의 경우, 대략 100개의 비리온이 배양된 세포에서 한 감염성 이벤트를 초래하도록 할 것이 요구되어지는 것으로 나타났다(문헌 [Joklik and Darnell, 1961]; 문헌 [Schwerdt and Fogh, 1957]). 즉, 접종한 100개의 입자들 중 단지 대략 1개만이, 수용체 결합(단계 1), 및 이에 이은 내재화 및 탈피(단계 2), 게놈 번역의 개시(단계 3), 다단백질 번역(단계 4), RNA 복제(단계 5), 및 자손의 이입(단계 6)의 수준에서 모든 단계를 성공적으로 완성하기 쉽다.
본원에 기재된 AB-형 바이러스의 감염성 사이클에서, 자신의 캡시드가 동일한 경우, 단계 1 및 2는 PV(M) 감염과 동일하게 되어야 한다. 마찬가지로, 동일한 5' 미번역 영역은 번역 복합체의 어셈블리(단계 3)에서 동등하게 잘 수행하여야 한다. 한편, 바이러스 다단백질 번역(단계 4)은 캡시드 영역 내 다수의 차선적 동의 코돈의 도입으로 인해 심하게 쇠약화된다(도 5 및 6). 질량 작용의 법칙에 의해, 희소 아미노아실-tRNA가 리보솜 상의 A 부위 내로 확산되는 데에 더 오래 걸리기 때문에, 번역 기작에 의한 희소 코돈의 반복 출현은 리보솜의 막힘(stalling)을 초래하게 되는 것으로 사료된다. 펩티드가 큰 정도로 신장하는 것이 이용 가능한 아미노아실-tRNA의 농도에 의해 유도되기 때문에, 많은 희소 tRNA에 대한 mRNA의 의존성은 궁극적으로 번역 시간을 증가시킨다(문헌 [Gustafsson et al., 2004]). 대안적으로, 리보솜의 과다 막힘은 번역 복합체의 RNA로부터의 조기 해체를 유발하여, 분해되게 될 예정인 절단된 단백질을 초래할 수 있다. 양 과정 모두는 단위 시간 당, mRNA 분자 당 단백질 합성 속도를 더 낮게 만든다. 본원에 제시된 데이터가 코돈 역최적화 바이러스의 표현형이 게놈 번역 속도에 의해 결정되는 것으로 제시하나, 다른 기전적 설명도 가능할 수 있다. 예를 들어, 간염 A 바이러스 내 바이러스 캡시드 서열 전반에 걸친 희소 동의 코돈의 보존된 위치가, 필수적인 번역 휴지의 도입에 의한 초기 폴리펩티드의 적절한 폴딩을 위해 작용적으로 중요한 것으로 제시되었다(문헌 [Sanchez et al., 2003]). 따라서, 코돈 조성물의 대규모 변경은 상기 휴지 부위들 중 일부를 변화시켜, 미스폴딩된 캡시드 단백질의 증가를 초래할 수 있다고 생각할 수 있을 것이다.
이들 고려사항이 또한 PV 캡시드에도 적용되는지의 여부는 불분명하다. 그와 같이 적용될 경우, 변경된 표현형은, wt 코돈은 보존되나 캡시드 전반에 걸친 그 위치가 완전히 변화된 PV-SD 설계를 가질 것으로 예상될 것이다. 즉, 주장되는 휴지 부위 중 어느 것도 단백질 서열에 대해 적절한 위치에 있지 않을 것이다. 그러나, 표현형의 변화가 관찰되지 않았고, PV-SD가 야생형 수준으로 번역되어 복제되었다(도 3B).
또 다른 가능성은, 시험한 설계에 있어서의 대규모 코돈 변경이 우연의 우세-음성 RNA 요소, 예컨대 안정한 2차 구조, 또는 게놈의 다른 영역과 분열성 장기 상호작용을 겪을 수 있는 서열을 발생시킬 수 있다는 것이다.
바이러스 탈피 전 단계들 및 바이러스 탈피를 포함한 모든 단계들은, 본원에 기재된 wt 및 돌연변이체 바이러스를 비교해 볼 때 변화되지 않는 것으로 가정한다. 이는, 이들 모두의 분리주에 대한 암흑기(eclipse period)가 유사하다는 관찰에 의해 지지된다(도 3B). 그러므로, PFU/입자 비의 급격한 감소는 역최적화 게놈의 감소된 번역 능력의 결과일 가능성이 큰데, 즉 돌연변이체 바이러스의 핸디캡은 세포 내에서 결정된다.
일반적으로, 1/100 내지 1/1,000의 피코나바이러스의 비교적 낮은 PFU/입자 비(문헌 [Rueckert, 1985])는 세포 침투 전, 또는 세포 침투의 수준에서, 수용체 결합 단계에서의 구조적 변경에 의해 주로 결정되는 것으로 가정된다. 거의 감염성이 아닌 135S 입자의 형성은 폴리오바이러스 감염력의 비효율성의 주요 배후 요인일 수 있다(문헌 [Hogle, 2002]). 그러나, 일부 바이러스 돌연변이체는 보다 높은 특이적 감염력을 초래하지 않으면서 단계 A 입자 전환을 부정하기 쉽고, 관찰은 다른 침투후 기전이 낮은 PFU/입자 비의 원인일 수 있음이 제시된다(문헌 [Dove and Racaniello, 1997]).
본 데이터는 바이러스와 세포 사이의 그러한 침투후 상호작용에 대한 명료한 증거를 제공하고, 침투전이 아닌 이러한 이벤트는 폴리오바이러스의 구분된 PFU/입자 비에 기여함을 제시한다. 폴리오바이러스 내의 모든 복제 단백질이 다단백질 상의 P1의 다운스트림에 위치하기 때문에, 그것들은 결정적으로 P1 번역의 성공적 완성에 의존한다. 그러므로, P1 번역 속도의 저하는 모든 복제 단백질의 번역을 동일한 정도로 저하시킨다. 이는 다시, 생산적 감염의 확립에 필요한 숙주 세포에의 필수 변형, 예컨대 숙주 세포 번역의 정지 또는 숙주 세포 본유의 반응의 방지를 수행하는 바이러스의 능력을 감소시키게 되기 쉽다. 코돈 역최적화가 본원에 기재된 바와 같이, 펩티드 신장 단계에서 번역을 수행하기 쉬우나, 번역 개시의 감소도 또한 폴리오바이러스의 세이빈 백신 균주 내 내부 리보솜 부착 부위에서의 돌연변이에 대해 나타난 바와 같이, 강력한 약독화 결정자일 수 있다(문헌 [Svitkin et al., 1993; 1985]).
이러한 고려사항들에 기초하여, 게놈 번역 또는 조기 게놈 복제에서의 결손에 기인하는 많은 돌연변이체 표현형들이 실제로 PFU/입자 비를 저하시킴으로써 자체를 표명하는 것으로 예측된다. 이는, 결손이 부전형 감염의 가능성을 증가시키게 되는 한, 사실이다. 거의 모든 연구들에서, 어디에서도 사용되는 플라크 검정법이 선택되는 바이러스 검출 방법이기 때문에, 겉보기 바이러스 역가의 감소는 종종 그 자체의 바이러스 생성 감소와 동등화된다. 이는 단일 세포 수준에서 바이러스 성질을 특징화하는 곤란성으로 해명될 수 있는 고유의 문제점일 수 있다. 그 대신, 대부분의 검정법들은 큰 세포 집단에 대해 행해진다. 바이러스를 생성하는 세포의 수가 감소되더라도 세포 내 바이러스 생성이 정상적일 수 있는 것으로는 간주하지 않으면서, 선택된 시험의 보다 낮은 해독정보(단백질 합성, RNA 복제, PFU로 측정되는 바이러스 생성)는 한 세포를 기준으로 할 때 보다 낮은 생성의 지시자로서의 액면값으로 취해진다.
코돈 역최적화 바이러스에 의한 세포당 입자의 근접하게 동일한 생성은, 연장 시간 후에 생성된 총 단백질이 심하게 영향을 받지 않는 반면, 단백질의 생성 속도는 급격히 감소되었음을 가리킨다. 이는 지연된 CPE 출현으로 반영되며, 이는 유사한 세포내 바이러스 단백질 농도를 구축하기 위해 더 많은 RNA 복제 사이클을 통과해야 한다는 표시일 수 있다. 코돈 역최적화 바이러스는, 유입되는 감염 게놈의 조기 번역 속도가 감소되기 때문에, 생산적 감염을 확립함에 있어 심하게 저해되어지는 것으로 보인다. 이러한 보다 낮은 번역 속도의 결과, 세포의 항바이러스 반응을 불능화하는 데 필수적인 PV 단백질(가장 가능하게는 프로테나제 2Apro 및 3Cpro)은 수명 사이클에서의 상기 중대한 장애를 충분히 빨리 통과하도록 하기에 충분한 양으로 합성되지 않는다. 궁극적으로, 바이러스 복제가 전개되어 세포를 인수할 수 있기 전에, 세포가 감염을 제거할 가능성이 더 크다. 따라서, 생산적 감염 이벤트에 대한 가능성이 감소되고, 부전형 감염 속도가 증가된다. 그러나, 코돈 역최적화 바이러스가 세포 불능화에 성공하는 경우, 이 바이러스는 야생형과 거의 동일한 양의 자손을 생성시킬 것이다. 본 데이터는, 세포의 자체 번역이 대체로 중지될 때, 복제 상태 중에 조기 번역(유입 RNA 게놈으로부터)과 후기 번역 사이에 근본적 차이가 존재할 수 있다는 것을 제시한다. 이는 일반적 현상일 수 있으나, 그것은 특히 코돈 역최적화 게놈의 경우에 중요할 수 있다. 숙주 세포 차단은 유리 아미노아실-tRNA의 과풍부도를 초래할 가능성이 매우 큰데, 이는 PV 게놈이 더 이상 번역 자원을 위해 세포 RNA와 경쟁해야 할 필요가 없기 때문에, 차선적 코돈 사용빈도의 부과된 영향을 극복할 수 있다. 이는 실제로 본원에 기재된 변형된 시험관내 번역 시스템에서의 관찰과 유사할 수 있다(도 5B). 뉴클레아제로 처리되지 않고(이에 따라 세포 mRNA를 함유함), 외인성 아미노산 또는 tRNA로 보충되지 않은 번역 추출물을 이용할 때, 상이한 캡시드 설계 돌연변이체의 번역 능력에서 명료한 차이가 관찰된다. 이러한 조건 하에서, 바이러스 게놈은 공급이 제한된 환경에서 세포 mRNA와 경쟁해야 한다. 그와 대조적으로, 내인성 mRNA가 제거되고 과잉 tRNA 및 아미노산이 부가된 종래 번역 추출물에서는, 모든 PV RNA가 코돈 편향과 상관없이 잘 균등하게 번역되었다(도 5A). 이 두 가지 상이한 시험관내 조건은 PV 감염 세포에서의 조기 상태 및 후기 상태 중에 생체내 번역과 유사할 수 있다.
본 연구의 한 핵심적 발견사실은, 물리적 상호작용 및 바이러스 입수 동안의 단계 외에서는, PFU/입자 비도 또한 숙주 세포 항바이러스 반응을 극복하기 위한 바이러스의 능력을 대체로 반영한다는 것을 인식한 것이다. 이는, 피코나바이러스가 실제로 이 대항을 이겨나감에 있어 매우 비효율적이고, 세포가 효과적으로 반응할 수 있기 전에 빨리 복제할 수 있는 작은 게놈을 진화하는 경로를 택한 것으로 보인다. 데이터에서 나타나는 바와 같이, PV-AB2470-2954에서 번역 속도를 단지 30% 감속시키는 것(도 6 참조)은, 보다 낮은 특이적 감염력으로 반영되는 바와 같이 1,000배 보다 높은 부전형 감염 속도를 초래한다(도 4D). 피코나바이러스는 분명히 에러 카타스트로피(error catastrophe)의 시초(threshold)에서 복제할 뿐만 아니라(문헌 [Crotty et al., 2001]; 문헌 [Holland et al., 1990]), 숙주 세포의 항바이러스 방어에 의해 제거의 시초에서도 복제한다. 이러한 효과는 피코나바이러스의 병원성 표현형에 대해 심오한 결과를 가질 수 있다. 코돈 역최적화 바이러스에 의한 부전 감염의 속도 증가의 원인이 되는 세포 항바이러스 과정은 현재 완전히 이해되어지고 있지 않다. PV는 아포프토시스를 유도함은 물론 억제하는 것으로 나타났다(문헌 [Belov et al., 2003]; 문헌 [Girard et al., 1999]; 문헌 [Tolskaya et al., 1995]). 유사하게, PV는 NF-κB을 절단함으로써 인터페론 경로를 간섭한다(문헌 [Neznanov et al., 2005]). 조기 게놈 번역의 속도가 감소된 PV가 여전히 wt 바이러스와 동일한 방식으로 항바이러스 반응을 유도하나(디폴트에 의한 인터페론 및 아포프토시스의 유도), 이어서 낮은 단백질 합성으로 인해, 상기 과정을 억제하는 가능성이 감소될 소지가 있다. 이러한 개요는 세포가 초기 감염을 부전이 되게 할 가능성을 증가시키고, 관찰된 현상을 설명할 수 있다. 개별 세포 수준에서, PV 감염은 전부가 아니면 무(all-or-nothing)인 현상이기 쉽다. 바이러스 단백질 및 RNA 합성은 생산적 감염을 확보하기 위해 최대 범위 내에 있을 필요가 있을 것으로 보인다.
약독화 바이러스 백신 조성물
본 발명은 본원에 기재된 약독화 바이러스 중 임의의 것 및 약학적으로 허용되는 담체를 포함하는, 피험체에서 보호 면역 반응을 유발하는 백신 조성물을 제공한다.
본 발명의 약독화 바이러스는 피험체에서 보호 면역 반응을 도출하거나 피험체가 바이러스 관련 질환을 앓게 되지 않도록 예방하기 위해 사용될 경우, 약학적으로 허용되는 담체를 부가적으로 포함하는 조성물의 형태로 피험체에게 투여된다는 것을 이해해야 한다. 약학적으로 허용되는 담체는 당업자에게 공지되어 있고, 이에는 0.01 내지 0.1 M 및 바람직하게는 0.05 M 인산염 완충액, 인산염 완충 염수(PBS), 또는 0.9% 염수 중 하나 이상이 포함되나, 이들에 국한되지 않는다. 그러한 담체에는 또한 수용액 또는 비수용액, 현탁액 및 유화액이 포함된다. 수성 담체에는 물, 알코올 용액/수용액, 유화액 또는 현탁액, 염수 및 완충 매질이 포함된다. 비수성 용매의 예는 프로필렌 글리콜, 폴리에틸렌 글리콜, 식물성 오일, 예컨대 올리브 오일, 및 주사용 유기 에스테르, 예컨대 에틸 올레에이트가 포함된다. 비경구 비히클에는 염화나트륨 용액, 링거 덱스트로스, 덱스트로스 및 염화나트륨, 유산 링거액 및 고정 오일이 포함된다. 정맥내 비히클에는 체액 및 영양소 보충물, 전해질 보충물, 예컨대 링거 덱스트로스에 기초한 전해질 보충물 등이 포함된다. 고체 조성물은 예를 들어, 글루코스, 수크로스, 만니톨, 소르비톨, 락토스, 전분, 스테아르산마그네슘, 셀룰로스 또는 셀룰로스 유도체, 탄산나트륨 및 탄산마그네슘과 같은 비독성 고체 담체를 포함할 수 있다. 에어로졸 내 투여를 위해, 예컨대 폐 전달 및/또는 비강내 전달을 위해, 작용제 또는 조성물은 바람직하게 비독성 계면활성제, 예를 들어, C6-C22 지방산 또는 천연 글리세리드의 에스테르 또는 부분 에스테르, 및 추진제와 함께 제형된다. 비강내 전달을 촉진하기 위해, 레시틴과 같은 부가적 담체가 포함될 수 있다. 약제학적으로 허용되는 담체는, 활성 성분의 반감기 및/또는 효능을 증진시키는 소량의 보조 물질, 예컨대 습윤제 또는 유화제, 보존제, 및 예를 들어 항미생물제, 산화방지제 및 킬레이트화제와 같은 기타 첨가제를 추가로 포함할 수 있다. 본 조성물은, 당업계에 공지되어 있는 바와 같이, 피험체에게 투여된 후 활성 성분의 속방출, 서방출, 또는 지연방출을 제공하도록 제형될 수 있다.
본 백신 조성물의 각종 실시양태들에서, 약독화 바이러스는 (i) 감염 세포 내 바이러스 단백질의 합성 및 처리를 실질적으로 변경시키지 않고/않거나; (ii) 감염된 세포당 비리온을 wt 바이러스와 유사한 양으로 생성하고/생성하거나; (iii) wt 바이러스보다 실질적으로 더 낮은 비리온 특이적 감염력을 나타낸다. 추가 실시양태들에서, 약독화 바이러스는 숙주 동물에서 상응하는 wt 바이러스에서와 실질적으로 유사한 면역 반응을 유발한다.
본 발명은 또한 야생형 숙주 세포에서 비생존성인 약독화 바이러스에 대해 침해성이 되도록 특수 단리되거나 조작된 변형 숙주 세포주를 제공한다. 약독화 바이러스는 성장(야생형) 세포에서 증식할 수 없기 때문에, 그것은 증식을 위해 특정 헬퍼 세포주에 절대적으로 의존한다. 이는 백신 생성용 바이러스를 생성하는 데 매우 높은 안전 수준을 제공한다. 본 변형 세포주의 각종 실시양태들은 약독화 바이러스의 증식을 허용하게 되며, 여기에서 상기 세포주의 게놈은 희소 tRNA를 코딩하는 유전자의 수를 증가시키도록 변형되었다.
바람직한 실시양태들에서, 희소 코돈은 CTA(Leu 코딩), TCG(Ser), 및 CCG(Pro)이다. 상이한 실시양태들에서, 이들 희소 코돈의 1, 2 또는 3개는 바이러스 게놈에서 동의 빈번한 코돈을 위해 치환된다. 예를 들어, 단일 바이러스에서, 바이러스 내 모든 Leu 코돈이 CTA로 변화될 수 있거나; 모든 Ser 코돈이 TCG로 변화될 수 있거나; 모든 Pro 코돈이 CCG로 변화될 수 있거나; Leu 및 Ser, 또는 Leu 및 Pro, 또는 Ser 및 Pro 코돈이 동정된 희소 코돈에 의해 대체될 수 있거나; 모든 Leu, Ser, 및 Pro 코돈이 CTA, TCG 및 CCG로 각기 바뀔 수 있다. 또한, 관련 코돈의 분율, 즉 100% 미만이 희소 코돈으로 변화될 수 있다. 따라서, 치환된 코돈의 분율은 코돈의 총 수의 약 20%, 40%, 60%, 80% 또는 100%일 수 있다.
일부 실시양태들에서, 이들 치환은 바이러스의 캡시드 영역에서만 이루어지며, 여기에서는 높은 번역 속도가 가장 중요하다. 다른 실시양태들에서, 치환은 바이러스 전반에 걸쳐 이루어진다. 추가 실시양태들에서, 세포주는 희소 코돈에 결합하는 tRNA를 과다발현한다.
본 발명은, (a) 바이러스 게놈의 하나 이상의 비조절 부분 내 다수 위치에서의 코돈을 동정하는 단계(상기 코돈은 동의 코돈으로 치환될 수 있음); (b) 각각의 동정된 코돈을 치환하기 위한 동의 코돈을 선택하는 단계; 및 (c) 각각의 동정된 코돈을 동의 코돈으로 치환하는 단계를 포함하는, 본원에 기재된 약독화 바이러스 중 임의의 것을 합성하는 방법을 추가로 제공한다.
본 발명의 특정 실시양태들에서, 단계 (a) 및 (b)는 바람직한 한도 내에서 역최적화 코돈 분포 및/또는 역최적화 코돈 쌍 분포의 특정화 패턴 집합을 다양화함으로써, 바이러스 게놈의 설계를 허용하는 합성 약독화 바이러스 조작(SAVE)을 위한 컴퓨터 기반 알고리즘에 의해 주도된다. 본 발명은 또한 패턴 집합이 역최적화 코돈 및 역최적화 코돈 쌍의 밀도, RNA 2차 구조, CpG 디뉴클레오티드 함량, C+G 함량, 중첩 코딩 틀, 제한효소 부위 분포, 틀이동 부위, 또는 이들의 임의의 조합을 대안적으로 또는 부가적으로 포함하는 방법을 제공한다.
다른 실시양태들에서, 단계 (c)는 동의 코돈 및/또는 코돈 쌍을 가지는 DNA를 신생 합성하고, 게놈의 상응하는 영역을 합성 DNA로 치환함으로써 수행한다. 추가 실시양태들에서, 전체 게놈은 합성된 DNA로 치환된다. 또 다른 실시양태들에서, 게놈의 부분은 합성된 DNA로 치환된다. 또 다른 실시양태들에서, 게놈의 상기 부분은 캡시드 코딩 영역이다.
부가적으로, 본 발명은 피험체에게 예방적 또는 치료적 유효량의 본원에 기재된 백신 조성물들 중 임의의 것을 투여하는 단계를 포함하는, 피험체에서 보호 면역 반응을 유발하는 방법을 제공한다. 본 발명은 또한 피험체에게 예방적 유효량의 본 백신 조성물들 중 임의의 것을 투여하는 단계를 포함하는, 피험체가 바이러스 관련 질환을 앓게 되는 것을 예방하는 방법도 제공한다. 상기 방법의 실시양태에서, 피험체는 병원성 바이러스에 노출되었다. 병원성 바이러스에 "노출된다"라는 것은, 감염이 초래되도록 바이러스와 접촉되는 것을 의미한다.
본 발명은 피험체에게 치료적 유효량의 본 백신 조성물들 중 임의의 것을 투여하는 단계를 포함하는, 바이러스 감염 피험체에서의 바이러스 관련 질환의 발병을 지연시키거나 진행 속도를 늦추는 방법을 추가로 제공한다.
본원에 사용되는 "투여한다"는 것은, 당업자에게 공지된 각종 방법 및 전달 시스템 중 임의의 것을 이용하여 전달함을 의미한다. 투여는 예를 들어, 복강내, 뇌내, 정맥내, 경구, 경점막, 피하, 경피, 피내, 근육내, 국소, 비경구, 임플란트를 통해, 지주막하강내, 림프관내, 병변내, 심막, 또는 경막외를 통해 수행될 수 있다. 작용제 또는 조성물은 또한 에어로졸 내, 예컨대 폐 및/또는 비강내 전달을 위해 투여될 수 있다. 투여는 예를 들어, 1회, 복수회, 및/또는 1회 초과의 연장 기간 수행될 수 있다.
피험체에서 보호 면역 반응을 유발하는 것은, 예를 들어 피험체에게 일차 용량의 백신을 투여하고, 이어서 적당한 시간 후에 백신을 1회 이상 후속 투여함으로써 수행할 수 있다. 백신 투여 사이의 적당한 시간은 당업자에 의해 용이하게 결정될 수 있고, 통상 대략 수주 내지 수개월이다. 그러나, 본 발명은 어떠한 투여 방법, 경로 또는 빈도에도 국한되지 않는다.
"피험체"는 임의의 동물 또는 인공적으로 변형된 동물을 의미한다. 동물에는 인간, 비인간 영장동물, 소, 말, 양, 돼지, 개, 고양이, 토끼, 흰족제비, 설치류, 예컨대 마우스, 래트 및 기니아피그, 및 새가 포함되나, 이들에 국한되지 않는다. 인공적으로 변형된 동물에는 인간 면역계를 갖는 SCID 마우스, 및 인간 폴리오바이러스 수용체 CD155를 발현하는 CD155tg 유전자도입 마우스가 포함되나, 이들에 국한되지 않는다. 한 바람직한 실시양태에서, 피험체는 인간이다. 새의 바람직한 실시양태는 닭, 칠면조, 오리 및 거위를 포함하나 이에 국한되지 않는 가축화된 가금 종이다.
"예방적 유효량"은, 바이러스 감염에 걸리기 쉽거나 바이러스 관련 장애를 앓기 쉬운 피험체에게 투여될 때, 피험체에서 피험체가 바이러스에 의해 감염되게 되거나 장애를 앓게 되는 것을 보호하는 면역 반응을 유발하도록 하는, 백신의 임의의 양이다. 피험체를 "보호한다"는 것은, 2배 이상, 바람직하게는 10배 이상만큼, 피험체가 바이러스에 의해 감염되게 될 가능성을 감소시키거나, 피험체에서의 장애의 발병 가능성을 저하시키는 것을 의미한다. 예를 들어, 피험체가 바이러스에 의해 감염되게 되는 가능성이 1%인 경우, 피험체가 바이러스에 감염될 경향의 2배 감소는 피험체가 바이러스에 의해 감염되게 되는 가능성이 0.5%가 되도록 하는 것이다. 가장 바람직하게는, "예방적 유효량"은 피험체에서 피험체가 바이러스에 의해 감염되게 되는 것으로부터 완전히 방지하거나 피험체에서의 장애 발병을 전체적으로 방지하는 면역 반응을 유발한다.
본원에 사용되는 "치료적 유효량"은, 백신이 대항 효과를 가지는 장애를 앓는 피험체에게 투여될 때, 피험체에서 피험체로 하여금 장애 및/또는 그것의 증상의 감소, 경감 또는 퇴보를 유발하는 면역 반응을 유발하도록 하는, 백신의 임의의 양이다. 바람직한 실시양태들에서, 장애 및/또는 그것의 증상의 재발이 예방된다. 다른 바람직한 실시양태들에서, 피험체는 장애 및/또는 그것의 증상이 치유된다.
본 면역화 및 치료 방법 중 임의의 것의 일부 실시양태들은, 피험체에게 1종 이상의 면역보조제(adjuvant)를 투여하는 단계를 추가로 포함한다. "면역보조제"는 피험체에서 항원의 면역원성을 증진시키고 면역 반응을 증대시키는 데 적당한 임의의 작용제를 의미할 것이다. 단백질에 기초한 백신 및 핵산에 기초한 백신 모두와 함께 사용하기에 적당한, 입상 면역보조제를 포함한 다수의 면역보조제들, 및 면역보조제를 항원과 조합하는 방법이 당업자에게 공지되어 있다. 핵산에 기초한 백신을 위해 적당한 면역보조제에는, 정제된 단백질 또는 핵산 형태로 전달되는, 퀼(Quil) A, 이미퀴모드(imiquimod), 레시퀴모드(resiquimod), 및 인터루킨(interleukin)-12가 포함되나, 이들에 국한되지 않는다. 단백질 면역화와 함께 사용하기에 적당한 면역보조제에는 알룸(alum), 프로인트 불완전 면역보조제(FIA), 사포닌, 퀼 A, 및 QS-21이 포함되나, 이들에 국한되지 않는다.
본 발명은 또한 본 발명의 약독화 바이러스로 피험체를 면역화하기 위한 키트를 제공한다. 키트는 약독화 바이러스, 약학적으로 허용되는 담체, 애플리케이터(applicator), 및 이의 사용에 대한 사용설명 자료를 포함한다. 추가 실시양태들에서, 약독화 바이러스는 하나 이상의 폴리오바이러스, 하나 이상의 리노바이러스, 하나 이상의 인플루엔자 바이러스 등일 수 있다. 한 특정 바이러스의 다수의 상이한 분리주에 대해 숙주를 면역화하는 데 바람직한 경우, 1개 초과의 바이러스가 바람직할 수 있다. 본 발명은 당업자에게 공지된 다른 실시양태의 키트들도 포함한다. 사용설명서는 약독화 바이러스의 투여를 지시하는 데 유용한 임의의 정보를 제공할 수 있다.
물론, 본원에 개시된 본 발명의 원칙의 변화가 당업자에 의해 수행될 수 있고, 그러한 변형도 본 발명의 범주 내에 포함되는 것으로 이해하고 예상한다. 하기 실시예는 본 발명을 추가로 설명하나, 어떠한 식으로도 본 발명의 범주를 제한하는 것으로 간주되어서는 안된다. 통상적 방법들, 예컨대 재조합 플라스미드의 작제, 숙주 세포의 바이러스 작제물로의 형질감염, 중합효소 연쇄 반응(PCR), 및 면역학적 기법에 이용되는 방법들에 대한 상세한 설명은, 문헌 [Sambrook et al. (1989)] 및 문헌 [Coligan et al. (1994)]을 포함한 다수의 발행물로부터 수득될 수 있다. 본원에 언급된 모든 참조문헌들은 본원에 전문이 참조 인용된다.
본원 전반에 걸쳐 인용되는 각종 발행물들에 대한 전체 상세내용이 청구범위 직전에 있는 명세서 말미에 제공되어 있다. 이 발행물들의 개시내용은 본원에 전문이 참조 인용된다. 그러나, 본원의 참조문헌의 인용은 그러한 참조문헌이 본 발명에 대한 종래 기술임을 인정하는 것으로 간주되어서는 안된다.
실시예 1
코돈 편향을 변경시킴에 의한 폴리오바이러스의
캡시드
영역의 재조작
세포, 바이러스, 플라스미드 및 세균
HeLa R19 세포 단층을 37℃에서 10% 우태 혈청(BCS)으로 보충된 둘베코 변형 이글 배지(DMEM) 중에 유지시켰다. 모든 PV 감염성 cDNA 작제물들은 PV1(M) cDNA 클론 pT7PVM에 기초한다(문헌 [Cao et al., 1993]; 문헌 [van der Werf et al., 1986]). pHRPF-Luc를 이용하여, 디시스트론성 리포터 플라스미드를 작제하였다(문 헌 [Zhao and Wimmer, 2001]). 플라스미드 형질전환 및 증식을 위해, 에쉐리키아 콜라이 DH5α를 사용하였다. HeLa R19 세포 단층을 5 PFU/세포로 감염시킴으로써 바이러스를 증폭시켰다. 감염된 세포를, 완전 세포병변 효과(CPE)가 명백해질 때까지, 또는 감염후 적어도 4일 동안, 37℃에서 DMEM(2% BCS) 중에서 인큐베이션하였다. 3회 냉동 및 해동 후, 저속 원심분리에 의해 용해물로부터 세포 잔해물을 제거하였고, 바이러스를 포함하는 상등액을 추가 계대배양 또는 분석을 위해 사용하였다.
합성 캡시드 대체 및 디시스트론성 리포터 레플리콘의
클로닝
진메이커(GeneMaker) 기술(블루 헤론 바이오테크놀리지(Blue Heron Biotechnology))를 이용하여, SD 및 AB로 칭해지는, 뉴클레오티드 495와 3636 사이의 게놈에 걸쳐 있는 2개의 PV 게놈 cDNA 단편을 합성하였다. PflMI 분해에 의해 판매업자의 클로닝 벡터로부터 치환 카세트를 방출하고, 상응하는 PflMI 단편이 제거된 pT7PVM 벡터에 삽입함으로써, pPV-SD 및 pPV-AB를 생성시켰다. pPV-AB755-1513 및 pPV-AB2470-3386은, pPV-AB로부터의 BsmI 단편 또는 NheI-EcoRI 단편을 동등하게 분해된 pT7PVM 벡터 내로 각기 삽입함으로써 생성되었다. pPV-AB1513-3386 및 pPV-AB755-2470에서, pT7PVM의 BsmI 단편 또는 NheI-EcoRI 단편은 각기 pPV-AB 벡터의 각 단편을 치환한다. pPV-AB1513-3386의 pT7PVM의 단편으로 NheI-EcoRI 단편을 치환함으로써, pPV-AB2470-3386이 생성되었다. 마지막으로, pPV-AB2470-3386 및 pT7PVM의 SnaBI-EcoRI 단편을 상호 치환함으로써, pPV-AB2954-3386 및 pPV-AB2470-2954가 각기 생성되었다.
올리고뉴클레오티드 Fluc-mutRI(+)/Fluc-mutRI(-)를 이용한 부위 지정 돌연변이유발에 의해 pHRPF-Luc 내에 침묵 돌연변이를 도입하여, 반딧불 루시퍼라제 개방 해독틀 내에 EcoRI 부위를 돌연변이시키고 pdiLuc-mRI를 생성시킴으로써, 디시스트론성 리포터 작제물의 클로닝을 수행하였다. pT7PVM, pPV-AB1513-2470, 및 pPV-AB2470-2954의 캡시드 영역을, 올리고뉴클레오티드 RI-2A-P1wt(+)/P1wt-2A-RI(-)를 이용하여 PCR 증폭시켰다. pPV-AB2470-3386 및 pPV-AB2954-3386 또는 pPV-AB의 캡시드 서열을 RI-2A-P1wt(+)/P1AB-2A-RI(-) 또는 RI-2A-P1AB(+)/P1AB-2A-RI(-)로 각기 증폭시켰다. PCR 산물을 EcoRI로 분해하고, pdiLuc-mRI 내 현재 독특한 EcoRI 부위에 삽입하여, pdiLuc-PV, pdiLuc-AB1513-2470, pdiLuc-AB2470-2954, pdiLuc-AB2470-3386, pdiLuc-AB2954-3386 및 pdiLuc-AB를 각기 초래하였다.
올리고뉴클레오티드
하기 올리고뉴클레오티드들을 사용하였다:
Fluc-mutRI(+), 5'-GCACTGATAATGAACTCCTCTGGATCTACTGG-3'(서열 번호 6); Fluc-mutRI(-), 5'-CCAGTAGATCCAGAGGAGTTCATTATCAGTGC-3'(서열 번호 7); RI-2A-P1wt(+), 5'-CAAGAATTCCTGACCACATACGGTGCTCAGGTTTCATCACAGAAAGTGGG-3'(서열 번호 8); RI-2A-P1AB(+), 5'-CAAGAATTCCTGACCACATACGGTGCGCAAGTATCGTCGCAAAAAGTAGG-3(서열 번호 9); P1wt-2A-RI(-), 5'-TTCGAATTCTCCATATGTGGTCAGATCCTTGGTGG-AGAGG-3'(서열 번호 10); 및 P1AB-2A-RI(-), 5'-TTCGAATTCTCCATACGTCGTTAAATCTTTCGTCGATAACG-3'(서열 번호 11).
시험관내 전사 및 RNA 형질감염
T7 프로모터에 의해 유도되는, 2 ㎍의 EcoRI 선형화 플라스미드 DNA를 37℃에서 1시간 동안 T7 RNA 중합효소(스트라타젠(Stratagene))에 의해 전사시켰다. 1 마이크로그램의 바이러스 또는 디시스트론성 전사체 RNA를 사용하여, DEAE-덱스트란 방법의 변형에 따라 직경 35 mm 플레이트 상에서 106개 HeLa R19 세포를 감염시켰다(문헌 [van der Werf et al., 1986]). 실온에서 30분 동안 인큐베이션한 후, 상등액을 제거하였고, 세포를 CPE가 나타날 때까지 2% BCS 함유의 2 ml의 DMEM 중에 37℃에서 인큐베이션하거나, 세포를 추가 계대배양을 위해 형질감염후 4일에 냉동시켰다. 최소 이글 배지에서 0.6% 트래거캔스 검(시그마-알드리치(Sigma-Aldrich))의 반고체 오버레이를 이용하여, HeLa R19 세포 상에서 표준 플라크 검정법에 의해 바이러스 역가를 측정하였다.
코돈 역최적화 폴리오바이러스의 설계 및 합성
폴리오바이러스 P1 캡시드 영역의 2가지 상이한 동의 코딩을 생성시켰으며, 이 코딩은 각기 상이한 설계 기준에 의해 지배된다. 전체 캡시드 코딩 서열이 생성되는 부분게놈 레플리콘의 복제에 영향을 주지 않으면서 외인성 서열로 치환되거나 PV 게놈으로부터 제거될 수 있다는 것으로 궁극적으로 나타난 바, 상기 설계는 캡시드에 국한되었다(문헌 [Johansen and Morrow, 2000]; 문헌 [Kaplan and Racaniello, 1988]). 그러므로, 미확인 중대 조절 RNA 요소가 캡시드 영역에 위치하지 않았음이 매우 확실하며, 이는 RNA 서열의 조절에 의해 우연히 영향을 받을 수 있다.
첫 번째 설계(PV-SD)는 야생형 P1 영역의 정확한 코돈 사용빈도 분포를 보존하면서 RNA 염기 변화의 수를 최대화고자 모색하였다(도 1). 이를 수행하기 위해, 동의 코돈 위치를, 그 위치와 코돈 사이의 최대 중량 이분 매칭(문헌 [Gabow, 1973])을 찾음으로써 각 아미노산과 교환하였고, 여기에서 각 위치-코돈 쌍의 중량은 원래의 코돈과 그것을 치환하기 위한 동의 후보 코돈 사이의 염기 변화의 수이다. 매칭 알고리즘으로부터 임의의 위치 편향을 피하기 위해, 동의 코돈 위치를 삽입 그래프를 생성하기 전에 무작위로 변경시켰고, 그 위치를 후속하여 복원하였다. 로쓰버그(Rothberg)의 최대 이분 매칭 프로그램(문헌 [Rothberg, 1985])을 이용하여, 매칭을 연산하였다. 각기 6개 뉴클레오티드로 된, 총 11개의 유용한 제한효소 부위를 바이러스 게놈 서열 내에 잠금하여, 코돈 위치 교환에 관여하지 않도록 하였다. 코돈 셔플링 기법은 잠재적으로 생성되는 재구성 전장 게놈 내에 바람직하게 독특하게 남아야 하는 부가적 제한효소 부위를 생성시킨다. 이러한 이유로, 요망되지 않는 부위를 제거하도록 코돈을 치환함으로써, 서열을 추가로 가공하였다. 이는 코돈 빈도 분포를 약간 변경시킨 부가적 9개의 동의 코돈 변화를 초래하였다. 그러나, 코돈은 야생형 서열에 걸친 빈도 변화가 1개를 초과하지 않았다. 총체적으로, 캡시드 코딩 도메인의 동일한 단백질 서열을 유지하면서, wt P1 서열에 비해 PV-SD 캡시드 설계에서 변화된 것은 2,643개 뉴클레오티드 중 934개가 있었다(도 1 및 2 참조). 코돈 사용빈도가 변화하지 않았으므로, PVM-SD 캡시드 코딩 서열 내 GC 함량은 49%로 wt 내 GC 함량과 동일하게 한 채로 남았다.
두 번째 설계인 PV-AB는 wt P1 영역에 걸쳐 코돈 사용빈도 분포를 급격히 변화시키고자 모색하였다. 이 설계는, 코돈 편향이 조직 특이적 발현에 영향을 줄 수 있다는 것을 제시하는 최근 연구에 의해 영향을 받았다(문헌 [Plotkin et al., 2004]). 요망되는 코돈 사용빈도 분포는 전술된 뇌 특이적 유전자의 집합에서 관찰되는 가장 바람직하지 않은 코돈으로부터 유래되었다(문헌 [Hsiao et al., 2001]; 문헌 [Plotkin et al., 2004]). 본 유전자 집합에서 관찰되는 각 특정 아미노산에 대한 가장 희소한 동의 코돈의 사용빈도를 최대화함으로써, 캡시드 코딩 영역을 합성하였다(도1). 단 하나(Leu)를 제외한 모든 아미노산에 있어, 뇌 내의 가장 희소한 코돈은 대체로 모든 인간 유전자들 중의 가장 희소한 코돈에 상응하기 때문에, 실제로 이 설계는 또한 다른 인간 조직에서의 발현과 차별되는 것으로 예상된다. 아울러, PV-AB 캡시드는 680 뉴클레오티드 위치에서 wt 캡시드와 상이하다(도 2 참조). PVM-AB 캡시드 영역 내의 GC 함량은, wt에서는 49%로 감소된 것에 비해, 43%로 감소되었다.
실시예 2
폴리오바이러스의 증식 및 감염력에 대한 코돈 역최적화의 영향
감염 병소 검정법에 의한 바이러스 역가의 결정
표준 플라크 검정법에서와 같이 감염을 수행하였다. 48시간 또는 72시간 동안의 인큐베이션 후, 트래거캔스 검 오버레이를 제거하였고, 웰을 인산염 완충 염수(PBS)로 2회 세정하고, 30분 동안 냉 메탄올/아세톤으로 고정하였다. 웰을 10% BCS 함유의 PBS 중에 블록킹한 후, 항3D 마우스 단클론성 항체 125.2.3의 1:20 희석액과 함께 37℃에서 1시간 동안 인큐베이션하였다(문헌 [Paul et al., 1998]). 세정 후, 세포를 호스래디쉬 퍼옥시다제 표지 염소 항마우스 항체와 함께 인큐베이션하였고(문헌 [Jackson ImmunoResearch, West Grove, PA]), 감염된 세포를 벡터 VIP 기질 키트(벡터 라보라토리즈(Vector Laboratories), 미국 캘리포니아주 벌링게임 소재)를 이용하여 가시화하였다. wt 바이러스로 수득된 플라크와 동등한 염색된 병소를 계수하였고, 플라크 검정법 절차에서와 같이 역가를 계산하였다.
코돈 역최적화 폴리오바이러스는 심한 성장 표현형을 표시한다.
2가지 초기 캡시드 ORF 치환 설계들 중(도 3A), 단지 PV-SD만이 생존성 바이러스를 생성시켰다. 이와 대조적으로, 3회 계대배양 후에도, PV-AB RNA를 이용한 4가지 독립적 형질감염으로부터 생존성 바이러스가 회수되지 않았다(도 3E). PV-AB 게놈 내로 도입된 코돈 편향이 지나치게 심한 것으로 나타났다. 따라서, PV-AB 캡시드 코딩 서열의 보다 작은 부분이 PV(M) 백그라운드 내로 서브클로닝되어, 바람직하지 않은 코돈의 유해한 영향을 감소시켰다. 이들 서브클론 중, PV-AB2954-3386은 RNA 형질감염 후 40시간에 CPE를 생성시킨 반면, PV-AB755-1513 및 PV-AB2470-2954은 각기 형질감염 후 1 또는 2회 부가 계대배양을 필요로 하였다(야생형 바이러스의 경우 24시간인 것과 대비됨). 흥미롭게도, 이 키메라 바이러스들은 원래의 AB 서열의 가장 작은 부분을 갖는 3개 서브클론을 나타내고, 관찰은 바람직하지 않은 코돈의 수와 바이러스의 적응도 간의 직접적 상관관계를 제시한다.
감염 중복지수(MOI)가 2인 HeLa 단층을, RNA 형질감염 후 최대 2 계대배양 후에 수득된 바이러스 세포 용해물로 감염시킴으로써, 모든 생존성 바이러스 변이체의 1단계 증식 동역학 특성을 결정하였다(도 3B). PV-AB2470-2954의 보다 낮은 역가로 인해, 또한 접종물을 농축하고 정제하는 데 필요한 추가 계대배양의 필요를 제거하도록 MOI를 선택하였다. 사용 조건 하에서, 모든 바이러스들이 감염후 24시간까지 완전 또는 근완전 CPE를 생성시켰다.
자체의 캡시드 영역 내 934개 단일-점 돌연변이에도 불구하고, PV-SD는 wt 역량으로 복제하였고(도 3B), wt와 유사한 크기의 플라크를 생성시켰다(도 3D). PV-AB2954-3386가 근야생형 동역학 특성을 가지며 증식하였고(도 3B), PV-AB755-1513은 미세한 플라크 및 대략 22배 적은 감염성 바이러스를 생성시켰다(각기 도 2, 3B 및 F). 매우 지연되기는 하나 고MOI 감염에서 CPE를 유발할 수 있으나(20 내지 24시간 후, 80 내지 90% CPE), PV-AB2470-2954는 표준 플라크 검정법의 조건 하에서 플라크를 전혀 생성하지 않았다(도 3H). 그러므로, 항체를 이용하여 바이러스 중합효소 3D로 면역화학적으로 염색한 후, 플라크 검정법 조건 하에 72시간 동안 인큐베이션한 후에 감염된 세포 병소를 계수하는 병소 형성 검정법을 이용하여, 상기 바이러스를 정량하였다(도 3G). 48시간 동안의 감염 후, PV-AB2470-2954 감염 병소는, wt의 경우에는 병소 3 mm 플라크인 것에 비해, 통상 단지 수십개 내지 수백개의 세포만이(도 3J) 병소 직경이 0.2 내지 0.5 mm이 되었다(도 3C 및 D). 그러나, 부가적 24시간 후에, 병소의 직경은 유의적으로 증가되었다(2 내지 3 mm; 도 3G). HeLa 세포를 1의 MOI로 PV-AB755-1513 및 PV-AB2470-2954로 감염시켰을 때, CPE는, wt의 경우는 8시간인 것에 비해, 각기 12시간 내지 18시간, 및 3일 내지 4일인 것으로 나타났다(데이터는 나와 있지 않음).
단백질 코딩 서열 내 한 특정 코돈 편향의 누적 효과를 정량하기 위해, 인간 게놈 내 일반 코돈 분포에 대한 비교 측정값인 상대 코돈 역최적화 지수(RCDI)를 계산하였다. 1/코돈의 RCDI는, 유전자가 정상 인간 코돈 빈도를 따르나, 정상 인간 코돈 편향으로부터의 임의의 이탈은 RCDI이 1 초과가 되도록 함을 나타낸다. 하기 식을 이용하여, RCDI을 유도하였다:
C i F a 는 동일한 아미노산에 대한 모든 동의 코돈들 중 각 코돈 i의 시험 서열에서의 관찰된 상대 빈도(0 내지 1)이고; C i F h 는 그 아미노산에 대한 모든 동의 코돈들 중 각 코돈 i의 인간 게놈 내에서 관찰되는 정상 상대 빈도(0.06 내지 1)이며; N Ci 는 서열 내 그 코돈 i의 출현 수이고; N은 서열 내 코돈(아미노산)의 총 수이다.
따라서, 서열 내 희소 코돈의 수가 높으면 지수가 높아지게 된다. 이 식을 이용하여, 각종 캡시드 코딩 서열의 RCDI 값이 PV(M) 및 PV-SD의 경우 1.14인 것으로 계산되었는데, 이는 정상 인간 분포에 매우 근접한다. AB 작제물에 대한 RCDI 값은 PV-AB755-1513에 대해서는 1.73이고, PV-AB2470-2954에 대해서는 1.45이며, 모 PV-AB에 대해서는 6.51이다. 비교하자면, 원래의 아에쿠오라 빅토리아(Aequora vicoria) gfp 유전자의 RCDI는 1.68인 것에 비해, 아마도 가장 잘 알려져 있는 코돈-최적화 단백질인 "인간화" 녹색 형광 형광 단백질(GFP)의 RCDI은 1.31이었다(문헌 [Zolotukhin et al., 1996]). 이 계산들에 따라, RCDI가 <2인 캡시드 코딩 서열은 생존성 바이러스 표현형과 관련되는 반면, RCDI가 >2이면(PV-AB = 6.51, PV-AB1513-3386 = 4.04, PV-AB755-2470 = 3.61), 치사적 표현형을 초래한다.
실시예 3
폴리오바이러스의 특이적 감염력에 대한 코돈
역최적화의
영향
바이러스 입자의 분자적 정량: 직접적 OD
260
흡광도 방법
완전 CPE가 발생될 때까지(하룻밤 대 4일), 0.5의 MOI에서, HeLa 세포(4×107개 세포)의 15 cm 디쉬를 PV(M), PV-AB755-1513 또는 PV-AB2470-2954로 감염시켰다. 세포 결합 바이러스를 3회 연속 냉동/해동 사이클에 의해 방출시켰다. 세포 용해물을, 2,000×g로 10분간 원심분리한 후, 10분간 14,000×g에서 두 번째 10분 원심분리를 함으로써 제거하였다. 상등액을 10 ㎍/ml RNase A(로쉐(Roche))의 존재 하에 실온에서 1시간 동안 인큐베이션하여, 임의의 바이러스외 또는 세포내 RNA를 분해하였다. 0.5% 도데실황산나트륨(SDS) 및 2 mM EDTA를 첨가한 후, 바이러스 함유 상등액을 6 ml 수크로스 쿠션(행크스 밸런스 염용액 [HBSS] 중 30% 수크로스; 인비트로겐(Invitrogen), 미국 캘리포니아주 칼스배드 소재) 상에 두었다. 바이러스 입자를 SW28 스윙 버켓 회전자를 이용하여 28,000 rpm에서 4시간 동안 초원심분리함으로써 침강시켰다. 상등액을 폐기하였고, 원심분리관을 HBSS로 2회 헹구면서, 수크로스 쿠션은 비변형 상태로 남겼다. 마지막 세정액 및 수크로스 쿠션을 제거한 후, 바이러스 펠렛을 0.2% SDS 및 5 mM EDTA를 함유하는 PBS 중에 재현탁시켰다. 플라크 검정법/감염 병소 검정법에 의해 바이러스 감염성 역가를 측정하였다(상기 참조). 260 nm에서의 흡광도(OD260)에서 나노드롭(NanoDrop) 분광광도계(나노드롭 테크놀로지즈 인코포레이티드(NanoDrop Technologies, Inc.), 미국 델라웨어주 윌밍턴 소재)를 이용하여 바이러스 입자 농도를 측정하여, 식 [1 OD260 단위 = 9.4×1012 입자/ml]를 이용하여 계산하였다(문헌 [Rueckert, 1985]). 부가적으로, 3회 페놀 추출 및 1회 클로로포름 추출에 의해 비리온 RNA를 추출하였다. RNA를 에탄올 석출시켜, 초순수 중에 재현탁하였다. TAE 완충 아가로스 겔 분석에 의해 RNA 순도를 확인하였고, 농도를 분광광도법으로 측정하였다. 측정된 RNA 농도 및 RNA의 분자량을 통해, 상응하는 바이러스 제제의 게놈 등가물의 총수를 계산하였다. 따라서, 한 RNase 보호 바이러스 게놈 등가물이 한 바이러스 입자에 상응하는 것으로 가정하여, 감염성 단위 당 비리온의 상대량을 계산하였다.
바이러스 입자의 분자적 정량: ELISA 방법
Nunc 맥시소브(Maxisorb) 96웰 플레이트를 37℃에서 2시간 동안, 또한 부가적으로 4℃에서 14시간 동안, 100 ㎕ PBS 중에서 10 ㎍의 토끼 항PV(M) 항체(문헌 [Murdin and Wimmer, 1989])으로 코팅한 후, 플레이트를 350 ㎕의 PBS으로 간략히 3회 세정하고, 37℃에서 1시간 동안 350 ㎕의 PBS 중 10% 우태 혈청으로 블록킹하였다. PBS로 3회 간략히 세정한 후, 웰을 실온에서 4시간 동안 2% BCS 보충의 DMEM 중 100 ㎕의 바이러스 함유 세포 용해물 또는 대조군과 함께 인큐베이션하였다. 웰을 각기 5분 동안 350 ㎕의 PBS로 3회 세정하였다. 이어서, 웰을 100 ㎕의 DMEM-10% BCS 중의 2 ㎍의 CD155-알칼리성 포스파타제(AP) 융합 단백질(문헌 [He et al., 2000])과 함께 실온에서 4시간 동안 인큐베이션하였다. PBS를 이용한 5회 세정 중 마지막 세정 후, 100 ㎕의 10 mM 트리스(Tris)(pH 7.5)를 첨가하였고, 플레이트를 65℃에서 1시간 동안 인큐베이션하였다. 100 ㎕의 9 mg/ml 파라-니트로페닐인산염(2 M 디에탄올아민 중, 1 mM MgCl2, pH 9.8)을 첨가함으로써, 비색(colorimetric) 알칼리성 포스파타제 측정을 수행하였다. 알칼리성 포스파타제 활성을 측정하였고, 기지 농도의 정제된 PV(M) 바이러스 스톡의 2배 일련의 희석액을 이용하여 병렬 제조된 표준 곡선에서, 405-nm 파장에서 효소 결합 면역흡수 검정법(ELISA) 플레이트 리더(몰레큘러 디바이시스(Molecular Devices), 미국 캘리포니아주 서니베일 소재) 상에서, 바이러스 입자 농도를 계산하였다.
PFU/입자 비가 코돈 역최적화 바이러스에서 감소된다.
세포 배양액 중 PV-AB2470-2954의 극히 불량한 성장 표현형 및 그것의 플라크 형성 불능은, 개별 바이러스 입자의 보다 낮은 특이적 감염력과 일관될 수 있는 세포 대 세포 확산의 결손을 제기하였다.
이 가설을 시험하기 위해, PV(M), PV-AB755-1513 및 PV-AB2470-2954 바이러스를 정제하여, 바이러스 입자의 양을 분광광도법에 의해 측정하였다. 정제된 바이러스 제제를, OD260를 측정함으로써 직접적으로 정량하였고, 식 [1 OD260 단위 = 9.4×1012 입자/ml]에 따라 입자 농도를 계산하였다(도 4D)(문헌 [Rueckert, 1985]). 부가적으로, 게놈 RNA를 그 비리온으로부터 추출하고(도 4A), OD260에서 정량하였다(데이터는 나와 있지 않음). 이어서, 게놈 RNA에 대한 2.53×106 g/mol의 분자 크기를 통해, 비리온의 수(1 비리온 = 1 게놈)을 측정하였다. 구체적으로, 상기 기재된 바와 같이, 완전 CPE가 나타날 때까지, 0.5 MOI의 바이러스로 감염된 4×107개 HeLa 세포로부터 바이러스를 제조하였다. 양 입자 결정의 방법 모두가 유사한 결과를 산출하였다(도 4D). 실제로, PV(M) 및 PV-AB755-1513는 대략 동일한 양의 비리온을 생성한 반면, PV-AB2470-2954는, PV(M)(게놈 RNA 방법에 의함[데이터는 나와 있지 않음])에 비해, 비리온의 수의 1/3(직접적 UV 방법에 의함(도 4D)) 내지 1/8을 생성시킨 것으로 밝혀졌다. 이와 대조적으로, wt 바이러스 샘플은 각기 PV-AB755-1513 및 PV-AB2470- 2954보다 대략 30배 및 3,000배 더 많은 감염성 단위에 상응하였다(도 4D). 부가적으로, 정제된 비리온의 캡시드 단백질을 SDS-폴리아크릴아미드 겔 전기영동(PAGE)에 의해 분리하고, 은 염색에 의해 가시화하였다(도 4B). 이 데이터는 또한 세포당 기준으로 하여, PV-AB2470-2954 및 PV-AB755-1513이 세포당 유사하거나 약간 감소된 양의 자손을 생성하는 반면(도 4B, 레인 3), 그것의 PFU/입자 비는 감소된다는 결론을 지지한다. 바이러스에 대한 PFU/입자 비는, 플라크(플라크 검정법 및 특정 플라크 검정 기법에 대한 세포 유형) 또는 입자 계수(분광광도법 또는 전자현미경법)를 측정하는 방법에 상당히 의존하여, 다양할 수 있다. 본원에 기재된 방법을 이용하여, PV1(M)에 대한 1/115의 PFU/입자 비를 결정하였고, 이는 1/272(문헌 [Joklik and Darnell, 1961])(HeLa 세포에서 행해짐) 및 1/87(문헌 [Schwerdt and Fogh, 1957])(일차적 원숭이 신장 세포에서)의 이전 결정값과 잘 대비된다.
비리온 특이적 ELISA의 개발
코돈 역최적화 폴리오바이러스에 대해 관찰되는 감소된 PFU/입자 비를 확인하기 위해, 생물학적 변수인 감염성 역가가 아닌 샘플 내 비변형 바이러스 입자의 물리적 양을 측정하기 위한 한 방법으로서 신규 비리온 특이적 ELISA를 개발하였다(도 4C 및 E). 그 검정법은 열안정성 태반 알칼리성 포스파타제(CD155-AP)에 융합된 PV 수용체 CD155의 엑토도메인이 매우 단단히 또한 특이적으로 비변형 160S 입자에 결합한다는 기존 관찰에 기초한다(문헌 [He et al., 2000]). PV 130S 입자(A 입자)가 효율적으로 CD155에 결합하는 능력을 소실한다는 점(문헌 [Hogle, 2002])을 고려해 볼 때, 다른 어떤 캡시드 중간체나 캡시드 서브유닛도 CD155-AP와 상호작용하지 않을 것으로 예상되며, 이에 비변형 입자에 대한 특이성을 확실히 한다. 이 개념을 지지하는 것으로서, P1 캡시드 전구체를 발현하는 우두 바이러스 균주로 감염된 세포로부터의 용해물(문헌 [Ansardi et al., 1993])은 정량 가능한 신호를 초래하지 않았다(데이터는 나와 있지 않음).
ELISA 방법은 감염 후의 세포 용해물과 같은 조 샘플 내의 바이러스 입자를 정량하도록 하고, 이는 샘플 취급 및 정제 중의 다른 기전(열/화학적 불활성화, 산화, 분해 등)에 의한 PFU/입자 비의 가능한 변경을 최소화하게 된다. 현 조건 하에서, 이 검정법의 감도는, 신호 증폭 단계가 수반되지 않는 바, 대략 107개 바이러스 입자이다. 이는 다시, 매우 낮은 백그라운드를 초래하였다. 이 ELISA로써, PV 입자 농도는 기지의 농도의 정제된 PV(M)으로 제조된 표준 곡선 상에서 역계산에 의해 샘플에서 결정될 수 있다(도 4E). ELISA에 의한 입자 결정은 직접적 UV 방법에 의해 수득되는 결과와 잘 일치하였다(도 4D).
결과의 의미
본 연구는 약독화 바이러스를 생성하기 위한 신생 유전자 합성에 의한 PV 캡시드 코딩 서열의 대규모 코돈 역최적화의 유용성을 입증한다. 초기 목적은, 약독화 바이러스 생백신을 발생시키기 위한 툴로서의 상기 기술의 가능성을 탐색하고자 하는 것이었다. 코돈 역최적화 바이러스는 매우 낮은 특이적 감염력을 가지는 것을 밝혀졌다(도 4). 낮은 특이적 감염력(단일 바이러스 입자가 성공적으로 세포 내에 서 감염성 사이클을 개시하는 가능성)은 숙주 내에서의 바이러스 감염이 더욱 천천히 퍼지도록 한다. 이는 다시, 숙주 생물체가 면역 반응을 시작하고 감염을 소거하는 데 더 많은 시간을 소요하도록 하며, 이는 약독화 바이러스 백신에 있어 가장 바람직한 특성이다. 한편, 코돈 역최적화 바이러스는 야생형 바이러스에 비해 세포당 유사량의 자손을 생성시켰고, 한편 감염성은 2 내지 3등급 더 적었다(도 4). 이는 wt 바이러스 그 자체의 생성과 같이 효과적이고도 비용효율적으로 wt와 항원성의 측면에서 비슷한 바이러스 입자가 생성되도록 한다. 그러나, 낮은 특이적 감염력으로 인해, 상기 바이러스 제제의 실제 취급 및 가공이 더 안전하다. 그 후, 고도의 감금 조건 하에서의 충분량의 독성 바이러스의 생성과 이와 연관되어 우연히 또는 악의적으로 생성 시설로부터 바이러스가 방출될 관련 위험이 증가하고 있다. 본원에 기재된 바이러스는 불활성화된 바이러스 백신의 생성에 있어 보다 안전한 대체물로서 매우 유용한 것으로 입증될 수 있다. 이들은 단백질 수준에서 wt 바이러스와 100% 동일하기 때문에, 불활성화된 바이러스를 주입한 숙주 내에서의 동일한 면역 반응이 보장된다.
실시예 4
폴리오바이러스의 신경병원성에 대한 코돈 역최적화의 영향
마우스 신경병원성 시험
4 내지 5마리의 6 내지 8주령 CD155tg 마우스(균주 Tg21)(문헌 [Koike et al., 1991])로 된 군에 30 ㎕ PBS 중 102 내지 106 PFU/병소 형성 단위(FFU)의 바이 러스 희석액을 뇌내 주사하였다. 문헌 [Reed and Muench (1938)]의 방법에 의해, 50% 치사 용량(LD50) 값을 계산하였다. 플라크 또는 감염 병소 검정법에 의해, 사망 또는 마비 시의 척수 조직 내 바이러스 역가를 측정하였다.
코돈 역최적화 폴리오바이러스는 입자에 기초할 때 CD155tg 마우스에서 신경약독화된다.
본 연구에서 작제된 바이러스의 병원성 가능성을 시험하기 위해, CD155 유전자도입 마우스(문헌 [Koike et al., 1991])에 PV(M), PV-SD, PV-AB755-1513, 및 PV-AB2470-2954를 102 내지 105 PFU/FFU의 용량으로 뇌내 주사하였다. 매우 반직관적으로는 PV-AB755-1513, 또한 특별하게는 PV-AB2470-2954가 초기에는 wt 바이러스와 같은 신경병원성이거나 그것보다 약간 더 신경병원성인 것으로 밝혀졌기 때문에, 초기 결과는 혼동스러웠다. 표 4를 참조한다.
a LD50는 플라크 또는 감염 병소 검정법에 의한 측정 시, 뇌내 접종 후 50% 치사율을 초래하는 감염성 단위의 수로 표시됨.
b LD50는 OD260 측정에 의해 측정 시, 뇌내 접종 후 50% 치사율을 초래하는 바이러스 입자의 수로 표시됨.
c 사망 또는 마비 시의 감염된 마우스의 척수로부터 회수한 바이러스; 플라크 또는 감염 병소 검정법에 의해 측정 시, PFU 또는 FFU/g 조직으로 표시됨.
d 사망 또는 마비 시, 감염된 마우스의 척수로부터 회수한 바이러스, 세 번째 열에 있는 값을 각 바이러스에 대한 특성인 입자/PFU 비와 곱함으로써 유도한 입자/조직의 g로 표시됨(도 4D).
부가적으로, PV-AB755-1513 및 PV-AB2470-2954로 감염시킨 후 마비 개시 시간은 wt 바이러스의 마비 개시 시간에 필적하였다(데이터는 나와 있지 않음). 유사하게, 사망 또는 마비 시에, 플라크 검정법에 의해 측정 시, PV-AB755-1513 및 PV-AB2470-295로 감염된 마우스의 척수 내 바이러스 부하는, wt 바이러스로 감염된 마우스에서의 그 값에 비해 각기 30배 및 300배 더 낮다는 관찰도 유사하게 혼동스러웠다(표 4). 따라서, 명백히 wt 바이러스의 단지 0.3%로 복제하는 PV-AB2470-2954가 wt와 동일한 신경병원성 가능성을 가질 것으로 보이지 않는다. 그러나, PV-AB755-1513 및 PV-AB2470-2954에 있어 변경된 PFU/입자에서의 관계를 확립한 후(실시예 3 참조), 접종물의 양은 이제 접종된 입자의 실제 수와 상관될 수 있게 되었다. 이러한 보정을 행한 후, 입자에 기초하여, PV-AB755-1513 및 PV-AB2470-2954가 wt에 비해 20배 및 100배 신경약독화된다는 것이 확립되었다. 표 4를 참조한다. 또한, 입자에 기초하여, 마비된 마우스의 척수에서의 바이러스 부하는 3개의 모든 바이러스와 매우 유사하였다(표 4).
또한, 중추신경계에서의 발현과 특이적으로 구별되게 되는 동의 코돈을 이용하여 PV 캡시드 유전자를 재설계할 수 없다고 결론이 내려졌다. 이는, 다른 이들에 의해 기재된 코돈 편향(문헌 [Plotkin et al., 2004])에 있어서의 조직 특이적 차이가 너무 작아, 조직-제한적 바이러스 표현형이 발생되지 않기 때문일 수 있다. 문헌 [Plotkin et al.]에 의해 사용된 것보다 더 큰 집합의 뇌 특이적 유전자에서, 인식가능한 조직 특이적 코돈 편향이 검출되지 않았다(데이터는 나와 있지 않음). 그러나, 이 결론은, 본 발명의 방법에 의해 생성된 폴리오바이러스가 실제로 100배 이하의 인자로 마우스에서 신경약독화된다는 사실과 상충되지 않는다. 즉, 중추 신경계에서 wt 바이러스와 동일한 손상을 초래하기 위해서는, 100배 더 많은 코돈 또는 코돈 쌍 역최적화 바이러스 입자가 필요하다.
실시예 5
폴리오바이러스의 게놈 번역에 대한 코돈 역최적화의 영향
시험관내 및 생체내 번역
본 연구에 2개의 상이한 HeLa 세포 S10 세포질 추출물을 사용하였다. 문헌 [Molla et al. (1991)]의 방법에 의해, 표준 추출물을 제조하였다. [35S]메티오닌 표지 번역 산물을 겔 방사선촬영에 의해 분석하였다. 두 번째 추출물을, 기존에 기재된 바대로(문헌 [Kaplan and Racaniello, 1988]), 단 그 추출물을 투석하지 않았고 내인성 세포 mRNA를 포도상구균 뉴클레아제로 제거하지 않으면서, 제조하였다. 변형 추출물과의 반응은 외인성 아미노산 또는 tRNA로 보충되지 않았다. 항2C 단클론성 항체 91.23를 이용한 웨스턴 블로팅에 의해 번역 산물을 분석하였다(문헌 [Pfister and Wimmer, 1999]). NIH-이미지를 이용한, 스캔 겔 이미지 1.62 소프트웨어의 픽셀 계수에 의해, 2BC 밴드의 상대 강도를 측정하였다. 모든 경우들에서, 번역 반응을 200 ng의 각종 시험관내-전사 바이러스 게놈 RNA으로 프로그래밍하였다.
생체내 번역의 분석을 위해, HeLa 세포를 상기 기재된 바와 같이 시험관내-전사된 디시스트론성 레플리콘 RNA로 형질감염시켰다. RNA 복제로부터 단리된 번역을 평가하기 위해, 2 mM 구아니딘 염산염의 존재 하에 형질감염을 수행하였다. 부동 세포용해 완충액(프로메가(Promega), 미국 위스콘신주 매디슨 소재) 중에 7시간 둔 후 세포를 용해시키고, 이어서 이중 반딧불 (F-Luc) 및 레닐라(R-Luc) 루시퍼라제 검정법(프로메가)을 행하였다. 두 번째 시스트론(P1-Fluc-P2-P3 다단백질)의 번역 효율을, C형 간염 바이러스(HCV) 내부 리보솜 부착 부위(IRES)의 조절 하에 발현되는 첫 번째 시스트론의 레닐라 루시퍼라제 활성으로 나눔으로써, 정규화하였다.
코돈 역최적화 바이러스는 게놈 번역 수준에서 결함이 있다.
합성 바이러스 및 wt PV(M)가 이들의 단백질 구성에 있어서는 구분불가능하고 공지된 RNA에 기초한 조절 요소가 변형 RNA 게놈에서 변경되지 않았기 때문에, 본 설계는 바이러스의 세포 및 조직 향성(tropism) 또는 면역학적 성질에 영향을 주지 않으면서 약독화에 감소된 게놈 번역/복제가 미치는 영향의 연구를 가능하게 하였다. 많은 차선적 코돈의 캡시드 코딩 서열 내로의 도입이 게놈 번역의 감소를 초래한다는 가설 하에, PV-AB 게놈을 설계하였다. P1 영역이 다단백질의 N-말단에 있기 때문에, 모든 다운스트림 비구조 단백질의 합성은 P1 영역을 통한 번역 속도에 의해 결정된다. 실제로 번역이 영향을 받는지에 대한 여부를 시험하기 위해, 시험관내 번역을 수행하였다(도 5).
예기치 못하게도, 표준 HeLa 세포에 기초한 세포질 S10 추출물(문헌 [Molla et al., 1991]) 내 초기 번역은 시험한 게놈 중 임의의 것에 대한 번역 능력의 차이를 나타내지 않았다(도 5A). 그러나, 이 번역 시스템이 최대 번역을 위해 최적화되기 때문에, 유전적으로 조작된 코돈 편향에 대해 보상할 수 있을 것으로 생각할 수 있는 과잉 아미노산 및 tRNA의 외인 부가를 포함한다. 그러므로, 시험관내 번역을, 투석하지 않았고 세포 mRNA를 포도상구균 뉴클레아제 처리에 의해 제거하지 않은 변형된 HeLa 세포 추출물을 이용하여 반복하였다(도 5B). 외인성 tRNA 또는 아미노산을 첨가하지 않고 이 추출물에서의 번역을 수행하였다. 따라서, PV 게놈의 번역이 세포 mRNA를 갖는 자원을 위해 경쟁하면서 세포성 공급에만 의존하는, 감염 세포에서의 환경과 더욱 근접하게 유사한 환경을 생성시켰다. 세포 mRNA로부터의 고 백그라운드 번역 및 비투석 추출물 내 낮은 [35S]Met 도입으로 인해, 바이러스 특이적 번역 산물의 집합을, 항2C 항체를 이용한 웨스턴 블로팅에 의해 검출하였다(문헌 [Pfister and Wimmer, 1999]). 이 변형 조건은 역최적화 서열 정도와 상관되는 변형된 게놈의 번역 효율의 급격한 감소를 초래하였다. PV-SD의 번역이 wt의 그 번역에 필적하는 반면, 3개의 비감염성 게놈, 즉 PV-AB, PV-AB1513-3386, 및 PV-AB755-2470의 번역은 대략 90% 감소하였다(도 5B).
문헌 [Burns et al. (2006)]은 최근 본원에 기재된 것들과 관련된 실험들을 보고하였다. 이 저자들은 코돈 사용빈도를 본 연구에서보다 더욱 더 제한된 정도로 변경시켰고, 그들의 돌연변이체 바이러스 중 어느 것도 치사 표현형을 발현하지 않았다. 흥미롭게도, [Burns 등]은, 번역이 그들의 돌연변이체 바이러스의 변경된 표현형에 주된 역할을 하지 않았다고 결정하였는데, 이는 본원에 제시된 데이터와 일치하지 않은 결론이다. 비감염 HeLa 세포 추출물 및 과잉 아미노산으로 보충된 뉴클레아제-처리 토끼 망상적혈구 해물을 이용한, 문헌 [Burns et al. (2006)]에 의해 사용된 시험관내 번역 검정은, 이들이 번역의 어떠한 유의적 감소도 검출하지 못했음을 설명하는 것으로 보인다. 도 5A를 참조한다.
시험관내 번역 시스템의 궁극적으로 인위적인 성질을 고려하여, 세포 내 번역에 대한 각종 캡시드 설계의 영향도 또한 조사하였다. 이 목적을 위해, 이전에 보고된 디시스트론성 레플리콘(문헌 [Zhao and Wimmer, 2001])에 기초하여, 디시스트론성 폴리오바이러스 리포터 레플리콘을 작제하였다(도 6A). 각종 P1 카세트를 반딧불 루시퍼라제(F-Luc) 유전자의 바로 업스트림에 인-프레임으로 삽입하였다. 따라서, 폴리오바이러스 IRES는, 캡시드와 2Apro 프로테나제 사이의 반딧불 루시퍼라제 단백질을 제외한, 바이러스 게놈 내의 것과 유사한 단일 바이러스 다단백질의 발현을 유도한다. HCV IRES의 조절 하에서의 레닐라 루시퍼라제(R-Luc) 유전자의 발현은 내부 대조군을 제공한다. 모든 실험들을 게놈 복제를 완전히 차단하는 2 mM 구아니딘 염산염의 존재 하에 수행하였다(문헌 [Wimmer et al., 1993]). 이 유형의 작제물의 사용은, F-Luc/R-Luc 비를 계산함으로써 두 번째 시스테론의 상대 발현을 정확히 결정할 수 있도록 하였다. F-Luc 발현이 업스트림 P1 영역을 통한 리보솜의 성공적 전이에 의존하기 때문에, 다단백질 번역 속도에 대한 삽입된 P1 서열의 영향의 척도를 제공한다. 이 방법을 이용하여, 실제로 바이러스 백그라운드에서의 치사 표현형(예를 들어, PV-AB, PV-AB1513-2470, 및 PV-AB2470-3386)과 관련된 변형된 캡시드 코딩 영역이 번역 속도를 대략 80 내지 90% 감소시켰다는 것이 밝혀졌다(도 6B). 2개의 생존성 바이러스 작제물, 즉 PV-AB2470-2954 및 PV-AB2954-3386로부터의 캡시드는 각기 wt 수준의 68% 및 83%로 번역을 허용하였다. 첫 번째 시스트론의 생체내 번역 속도는 3 내지 12시간의 기간에 걸쳐 모든 작제물에서 일정하게 유지되었는데, 이는 RNA 안정성이 코돈 변경에 의해 영향을 받지 않음을 제시한다(데이터는 나와 있지 않음). 결론적으로, 본 실험들의 결과는, PV-AB2470-2954에서 보여지는 바와 같은, 30%라는 P1 영역을 통한 상대적으로 적은 번역 효율 하락이 심한 바이러스 복제 표현형을 초래함에 따라, 폴리오바이러스가 매우 효율적인 번역에 상당히 의존한다는 것을 제시한다.
실시예 6
코돈 역최적화 폴리오바이러스의 유전적 안정성
표현형에 기여하는 큰 게놈 분절에 걸친 많은 돌연변이들의 분포된 영향으로 인해, 코돈 역최적화 바이러스는 유전적으로 안정한 표현형을 가져야 한다. 코돈 역최적화 바이러스의 유전적 안정성을 연구하고 이 바이러스가 유전적으로 안정하다는 전제를 시험하기 위해, 바이러스를 적당한 숙주 세포에서 계대배양한다. 백신 설계의 본 "1000 컷에 의한 사망(death by 1000 cuts)" 이론의 한 이점은, 야생형으로의 복귀 위험이 감소된 것이다. 전형적인 백신 균주는 wt 바이러스와 단지 극소수의 점 돌연변이만을 차이로 하고, 이의 단지 작은 부분집합만이 실제로 약독화에 기여할 수 있다. 바이러스 진화는 그러한 소수의 활성 돌연변이를 복귀시키기 위해 급속히 이루어진다. 실제로, 그러한 복귀는 전세계로부터 폴리오바이러스를 근절하기 위한 세계보건기구(WHO) 프로젝트에 심각한 위험을 제기한다. 생백신 균주가 사용되는 한, 이 균주가 wt로 복귀할 실제 가능성이 매우 크다. 그러한 복귀는 이미 새 소아마비 발생의 공급원으로서 관찰되었다(문헌 [Georgescu et al., 1997]; 문헌 [Kew et al., 2002]; 문헌 [Shimizu et al., 2004]).
본 합성 설계에서의 수십만가지 점 돌연변이들에서는, wt 균주로의 복귀 위험이 거의 없다. 그러나, 천연 선택이 강력하고, 또한 계대배양 시, 합성 바이러스가 불가피하게 진화한다. 이 진화의 종점을 결정하기 위한 연구가 진행 중에 있으나, 가능한 성과는 그것들이 원래의 설계에서 크게 벗어나지 않은 국부 최적점에서 포획된다는 것이다.
이 이론을 입증하기 위해, 대표적인 재조작 바이러스를 숙주 세포 내에서 50회 이하 계대배양한다. 진화된 바이러스의 게놈을 10, 20 및 50회 계대배양 후에 시퀀싱한다. 더욱 구체적으로, 각 유형의 역최적화 바이러스로부터 하나 이상의 예의 키메라를 선택한다. 출발 키메라는 매우 쇠약화되나 사멸하지 않는다. 예를 들어, PV의 경우, 키메라는 PV-AB2470-2954 및 PV-Min755-2470일 수 있다. 각 출발 바이러스로부터, 10개의 플라크가 선택된다. 각각의 10개의 플라크에서 유래된 바이러스 집단을 총 50회 벌크로 계대배양한다. 10, 20 및 50번째 계대배양 후, 10개 플라크로 정제된 바이러스를 다시 선택하고, 그것의 게놈을 10개의 모 바이러스의 게놈과 함께 시퀀싱한다. 계대배양 후, 40(모 바이러스 당, 30 + 10)개의 선택된 바이러스의 적응도를, 플라크 크기를 조사하고 1단계 증식 동역학 특성으로서 플라크 형성 단위/ml를 결정함으로써, 상기 바이러스의 모(parents)의 적응도와 비교한다. 선택 계대배양 단리주를 적절한 숙주 생물체 내 그 병원성에 대해 시험한다. 예를 들어, 폴리오바이러스의 병원성을 CD155tg 마우스에서 시험한다.
게놈을 시퀀싱할 때, 10개 모두의 10 바이러스주가 공통적으로 일부 돌연변이를 가진다는 발견사실은, 상기 변화가 바이러스 적응도를 위해 특히 중요하다는 것을 제시한다. 이 변화를 주요 휴지 부위로서 토우프린팅에 의해 확인되는 부위와 비교할 수 있고(실시예 9 참조); 2가지 종류 이상의 검정법의 조합은 바이러스 적응도에 가장 유해한 돌연변이체 코돈을 동정할 수 있다. 이와 역으로, 상이한 주들이 모든 상이한 돌연변이들을 가진다는 발견사실은, 많은 돌연변이체 코돈 변화들이 적응도에 대한 그 영향에 있어 매우 유사하다는 견해를 지지한다. 따라서, HeLa 세포 중에서의 10회 계대배양 후, PV-AB755-1513 및 PV-AB2470-2954는 어떠한 인식가능한 적응도 증가도 겪지 않았다. 바이러스 감염성 역가는 계대배양 실험의 초기와 같이 낮은 상태로(107 PFU/ml 및 106 FFU /ml) 남았고, 플라크 표현형은 변화하지 않았다(데이터는 나와 있지 않음). 계대배양 중에 유전적 변화가 일어나는지, 또한 어떠한 종류의 유전적 변화가 일어나는지를 결정하기 위해, 상기 계대배양된 바이러스의 서열 분석이 현재 진행 중이다.
문헌 [Burns et al. (2006)]은, 그것의 변경된 코돈 조성물이 HeLa 세포에서 25회 일련 계대배양 중에 대체로 보존되었음을 보고하였다. 이들은, 비변형 세이빈 2 바이러스 및 코돈 치환 바이러스 모두의 HeLa 세포 내 복제에 대한 적응도가 계대배양 수가 커질수록 증가한 반면, 변형된 바이러스의 상대 적응도는 비변형 바이러스의 상대 적응도보다 낮은 상태로 남았음을 밝혀내었다. 따라서, 모두 SAVE에 의해 재설계된 바이러스가 유전적으로 매우 안정적임을 나타냈다. 본 발명의 코돈 및 코돈 쌍 역최적화 바이러스의 예비 데이터는, 많은 수의 코돈 상에 걸쳐 분포된 덜 심한 코돈 변화가 개별 바이러스 표현형의 유전적 안정성을 향상시키고, 이에 따라 백신에서의 그것의 사용 가능성을 향상시킴을 제시한다.
실시예 7
코돈 쌍의 역최적화에 의한 폴리오바이러스의
캡시드
영역의 재조작
코돈 쌍 편향의 계산
코돈 쌍(예를 들어, GTT-GCT)을 갖는 가능한 3721 비"STOP"의 모든 개별 코돈 쌍은 유전자의 주어진 "훈련 집합"에 대해 특이적인 배당된 "코돈 쌍 스코어" 또는 "CPS"를 지닌다. 주어진 코돈 쌍의 CPS는, 본 유전자 집합(본 실시예에서, 인간 게놈)에서 예상되는 수에 대한 관찰된 출현 수의 로그 비로 정의된다. 특정 코돈 쌍의 실제 출현 수(또는 달리 말하면, 한 특정 아미노산이 한 특정 코돈 쌍에 의해 코딩될 가능성)의 결정은, 단순히 코딩 서열의 한 특정 집합 내 코돈 쌍의 실제 출현 수를 계수하는 문제이다. 그러나, 예상 수를 결정하기 위해서는 부가적 계산이 필요하다. 그러나, 문헌 [Gutman and Hatfield]와 유사하게, 아미노산 빈도 및 코돈 편향 모두에 대해 독립적이게 되도록 예상 수를 계산한다. 즉, 예상 빈도는, 아미노산이 한 특정 코돈에 의해 코딩되는 횟수의 상대 분율에 기초하여 계산된다. 양의 CPS 값은, 인간 게놈에 있어 주어진 코돈 쌍이 통계학적으로 과대표시됨을 의미하고, 음의 CPS는 쌍이 통계학적으로 과소표시됨을 의미한다.
인간 부문 내에서 상기 계산을 수행하기 위해, 가장 최근의 일치 CDS(CCDS) 데이터베이스는 총 14,795개 유전자를 가지는 일관된 주석의 인간 코딩 영역을 사용하였다. 이 데이터 집합은 코돈 및 코돈 쌍, 및 이에 따라 게놈 규모에서의 아미노산 및 아미노산 쌍 빈도를 제공하였다.
문헌 [Federov et al. (2002)]의 패러다임을 이용하여, 문헌 [Gutman and Hatfield (1989)]의 방법을 더욱 증진시켰다. 이는 한 특정 아미노산 쌍을 코딩하는 이웃 코돈의 비무작위 결합 및 코돈 빈도와 무관한 주어진 코돈 쌍의 예상 빈도를 계산할 수 있도록 하였다.
계산에서, P ij 는 그것의 동의 군에서 N 0 (P ij )의 빈도로 일어나는 코돈 쌍이다. C i 및 C j 는 그것의 동의 군에서 빈도 F(C i ) 및 F(C j )로 일어나는, P ij 를 포함하는 2개의 코돈이다. 더욱 명백히, F(C i )는 상응하는 아미노산 X i 이 모든 코딩 영역에 걸쳐 코돈 C i 에 의해 코딩되는 빈도이고, F(C i )=No(C i )ZNo(X i )(여기에서, N 0 (C i ) 및 N 0 (X i )는 각각의 코돈 C i 및 아미노산 X i 의 관찰된 출현 수임)이다. 이에 따라 F(C j )도 계산된다. 또한, N 0 (X ij )는 모든 코딩 영역 전반에 걸친 아미노산 쌍 Xij의 출현 수이다. P ij 의 코돈 쌍 편향 스코어 S(P ij )를, N e (P ij )의 예상 출현 수에 대한 관찰 빈도 N 0 (P ij )의 로그-오즈(log-odds) 비로서 계산하였다.
이어서, 상기 식을 이용하여, 개별 코딩 서열 내 개별 코돈 쌍이 전체 인간 CCDS 데이터 집합을 이용하여 계산한 상응하는 게놈 N e (P ij ) 값에 비해 과대표시 또는 과소표시되는지의 여부를 결정하였다. 이 계산은 인간 코딩 영역 내 과대표시된 코돈 쌍에서는 양의 S(Pij) 스코어 값을 초래하였고, 과소표시된 코돈 쌍에 대해서는 음의 값을 초래하였다(도 7).
하기 식에 따라, 모든 코돈 쌍 스코어들의 평균을 구함으로써 개별 코딩 서열의 "조합된" 코돈 쌍 편향을 계산하였다:
이에 따라, 영역을 포함하는 개별 코돈 쌍 스코어의 모두를 더하고, 이 총합을 코딩 서열의 길이로 나눔으로써, 전체 코딩 영역의 코돈 쌍 편향을 계산한다.
코돈 쌍 편향의 변화
PV(M)의 캡시드 코딩 영역을 코돈 쌍 편향을 변화시키도록 재조작하였다. wt 바이러스 게놈의 코돈 편향 및 다른 모든 특성을 보존하면서, 최대 가능한 수의 희소하게 사용되는 코돈 쌍(바이러스 PV-Min 생성) 또는 최대 가능한 수의 광범위하게 사용되는 코돈 쌍(바이러스 PV-Max 생성)을 도입하였다. 이하는 본 발명자들의 방법을 상세히 설명한다.
양의 방향(PV-Max; 서열 번호 4) 및 음의 방향(PV-Min; 서열 번호 5)으로 폴리오바이러스 P1 영역 코돈 쌍 스코어를 다양하게 하도록, 2개의 서열을 설계하였다. 아미노산 서열을 변경되지 않도록 남기고 코돈 편향을 최소한으로 변형시킴으로써, P1 캡시드 영역에 대한 최소 또는 최대 코돈 쌍 스코어의 최적화를 목적으로 하여, 모의 어닐링 알고리즘을 코돈 셔플링을 위해 사용하였다. 스플라이스 부위의 제거 및 국소화 2차 구조의 감소를 위해, 생성되는 서열을 가공하였다. 이어서, 이 서열을 상업적 판매업자인 블루 헤론 바이오테크놀로지에 의해 합성하고, 서열 확인하였다. 새 캡시드 유전자를 이용하여, 2개의 PflMI 제한효소 부위를 통해 wt PV의 감염성 cDNA 클론 내 동등한 wt 서열을 치환하였다. 실시예 1에 기재된 바대로, 바이러스를 유도하였다.
PV-Max 바이러스에 대해, 감염된 세포의 사멸이 24시간 후에 나타났고, 이는 wt 바이러스로 수득된 결과와 유사한 결과이다. PV-Max의 최대 바이러스 역가 및 1단계 증식 동역학 특성도 wt와 동일하였다. 이와 대조적으로, 세포 사멸은 세포의 PV-Min 돌연변이체 RNA로의 형질감염을 초래하지 않았고, 생존성 바이러스가 회수될 수 없었다. 형질감염을 다수 반복하였고, 결과는 동일하였다. PV-Min 형질감염된 세포의 용해물을 4회 연속 맹검 계대배양하였고, 여전히 바이러스가 수득되지 않았다.
PV-Min의 캡시드 영역을, PV-AB(불량한 코돈 편향)에 대해 행한 바와 같이 보다 작은 부분단편(PV-Min755-2470 및 PV-Min2470-3386)으로 나누었고, 부분단편을 wt 백그라운드 내로 클로닝하였다. PV-AB 서브클론에 대해서는, PV-Min의 서브클론이 매우 병약하였으나 사멸하지는 않았다(도 8). PV-AB 바이러스에서 관찰되는 바와 같이, PV-Min 바이러스의 표현형은 자손 바이러스의 생성 저하가 아닌, 바이러스 입자의 감소된 특이적 감염력의 결과이다. 진행 중에 있는 연구는 CD155tg 마우스 내의 코돈 쌍-약독화 키메라를 시험하여 그것의 병원성을 결정하는 것을 수반한다. 또한, PV-Min cDNA의 서브클론을 포함하는 부가적 키메라 바이러스가 만들어지고 있고, 그것의 복제 능력을 결정하고 있다(이하 실시예 8 및 9 참조). 또한, 보다 긴 서열에 걸친 중간양의 코돈 쌍 편향을 분포시키는 것의 영향을 확인하고 있다. 예를 들어, 폴리오바이러스 유도체가 약 -0.2(PV-0.2; 서열 번호 6)의 코돈 쌍 편향을 가지도록 설계되고, 야생형으로부터의 돌연변이가 P1 캡시드 영역의 전장에 걸쳐 분포된다. 이는 유사한 코돈 쌍 편향을 가지나, 코돈 변화가 보다 짧은 서열에 걸쳐 분포되어 있는, PV-MinZ(PV-Min2470-3386)와 대조적이다.
PV-Min 및 PV-0.2이 야생형 대비 코돈 사용빈도가 거의 변화하지 않은 서열임을 지적하는 것은 주목할만하다. 대부분의 경우, 서열은 야생형 PV(M) 바이러스에서 나타나는 동일한 코돈을 이용한다. PV-MinZ는 PV(M) 내로 서브클로닝된 PV-Min의 부분을 포함한다는 점에서 다소 차이가 있다. PV-Min 및 PV-0.2에 대해, 코딩된 단백질 서열은 변화가 없으나, 서브클로닝된 영역 내에 또는 전체 P1 캡시드 영역에 걸쳐 결정되는 코돈 사용빈도는 PV-Min(또는 PV-0.2)와 동일하지 않으며, 이는 단지 (전장에 걸쳐 동일한 코돈을 가지나 보다 작은 분절에서는 그러하지 않은) 코돈 재배열 서열의 일부만이 PV(M) 야생형 서열 내로 치환되었기 때문이다. 물론, 뉴클레오티드 2470-3386으로부터의 영역 내에서만 코돈을 셔플링하면서, 전체 P1 캡시드 영역에 걸쳐 코돈 쌍 편향을 가지도록 돌연변이된 캡시드 서열을 설계할 수 있다.
실시예 8
코돈 쌍 편향의 변화에 의해 작제된 바이러스가 CD155 tg 마우스에서 약독화된다.
마우스 뇌내 주사, 생존율
동물 모델에서의 PV-Min755-2470 및 PV-Min2470-3385의 약독화를 시험하기 위해, 이 바이러스들을 정제하여, CD155(PVR/폴리오바이러스 수용체) 유전자도입 마우스 내로 뇌내 주사하였다(표 5 참조). 실제로, 상기 바이러스는 본 발명자들의 알고리즘을 이용하여 코돈 쌍 편향의 맞춤으로 인해 유의적으로 약독화된 표현형을 나타냈다. PVM-wt로 인해 10e5 비리온로 공격접종된 모든 마우스가 사망하였기 때문에, PVM-wt를 보다 높은 용량으로 주사하지 않았다. 이 약독화 표현형은 본 발명자들의 알고리즘을 이용한 코돈 쌍 편향의 맞춤으로 인한 것이다. 이는 코돈 쌍 편향의 맞춤이 생백신 발생의 한 수단으로 적용 가능하다는 것을 재확인시켜준다.
마우스 뇌내 주사, 생존율 | ||||
바이러스 | 10e4 비리온 | 10e5 비리온 | 10e6 비리온 | 10e7 비리온 |
PV-Min755-2470 | 4/4 | 3/4 | 3/5 | 3/4 |
PV-Min2470-3385 | 4/4 | 4/4 | 5/5 | 3/4 |
PVM-wt | 3/4 | 0/4 | - | - |
이 발견사실은 두가지 측면에서 의미가 있다. 첫 번째로, 그것은 코돈 쌍 편향이 기능적으로 중요하다는 것, 즉 코돈 쌍 편향의 분포로 인해 유해한 표현형이 생성될 수 있다는 최초의 명백한 실험 증거이다. 두 번째로, 그것은 바이러스를 약독화하기 위해 사용될 수 있는 부가적 크기의 동의 코돈 변화를 제공한다. 이 코돈 쌍 약독화 키메라의 생체내 병원성이 CD155tg에서 시험되었고, 약독화된 표현형을 나타냈다(표 5 참조). PV-Min 캡시드 cDNA의 서브클론을 포함하는 부가적 키메라 바이러스를 감염된 세포에서의 복제에 대해 검정하였고, 이 또한 약독화 표현형을 나타냈다.
실시예 9
변경된 코돈 쌍 편향을 갖는 합성 폴리오바이러스의
작제
: 백신 개발의 의미
코돈 쌍 편향의 계산, 코돈 쌍 역최적화 서열을 생성하기 위한 알고리즘의 실행
본 발명자들은 코돈 쌍 편향을 정량하기 위한 알고리즘을 개발하였다. 모든 가능한 개별 코돈 쌍에는 "코돈 쌍 스코어", 또는 "CPS"가 주어졌다. 본 발명자들은 CPS를 모든 인간 코딩 영역 상에 걸친 각 코돈 쌍의 예상 출현 수에 대한 관찰 출현 수의 비의 자연 로그로서 정의한다.
한 특정 코돈 쌍의 관찰 출현의 계산은 직접적이나(유전자 집합 내의 실제 계수), 코돈 쌍의 예상 출현 수는 부가적 계산을 요한다. 본 발명자들은 문헌 [Gutman and Hatfield]와 유사하게, 아미노산 빈도 및 코돈 편향 모두와 무관하게 상기 예상 수를 계산한다. 즉, 예상 빈도는, 아미노산이 한 특정 코돈에 의해 코딩되는 횟수의 상대 분율에 기초하여 계산된다. 인간 게놈에 있어, 양의 CPS 값은, 주어진 코돈 쌍이 통계학적으로 과대표시됨을 의미하고, 음의 CPS는 쌍이 통계학적으로 과소표시됨을 의미한다.
이어서, 이 계산된 CPS를 이용하여, 임의의 코딩 영역이, 코돈 쌍 스코어들의 평균을 취해 전체 유전자에 대한 코돈 쌍 편향(CPB)을 수득함으로써, 과대표시 또는 과소표시된 코돈 쌍을 이용하는 것으로 간주될 수 있다.
나와 있는 방정식을 이용하여 모든 주석 인간 유전자에 대해 CPB를 계산하여 플로팅하였다(도 7). 그래프 내 각 점은 단일 인간 유전자의 CPB에 상응한다. 분포의 피크는 모든 주석 인간 유전자에 대한 평균 스코어인 0.07이라는 양의 코돈 쌍 편향을 가진다. 또한, 음의 코돈 쌍 편향을 갖는 유전자는 극소수이다. 이어서, CPB를 정의하고 계산하기 위해 확립된 방정식을 이용하여, 이 편향을 조작하였다.
코돈 쌍 역최적화 서열을 생성하기 위한 컴퓨터 기반 알고리즘의 개발 및 실행
본 발명자들은 이어서 상기 식을 이용하여, 원래의 아미노산 서열을 유지하면서 임의의 코딩 영역의 CPB를 조작하기 위한 컴퓨터 기반 알고리즘을 개발하였다. 알고리즘은 유전자의 코돈 사용빈도를 유지하나(즉, 각 기존 코돈의 사용의 빈도를 보존하나), 현존 코돈을 "셔플링"하여, CPB가 증가 또는 감소될 수 있도록 하는 중요 능력을 가진다. 알고리즘은 전장 최적화에 적당한 수학 과정인 모의 어닐링을 이용한다(문헌 [Park, S. et al., 2004]). 다른 파라미터들도 또한 이 알고리즘의 조절 하에 있으며; 예를 들어, RNA의 폴딩 자유 에너지가 그러하다. 이 자유 에너지는 좁은 범위 내에서 유지되어, 코돈 재배열의결과로서 2차 구조의 큰 변화를 방지한다. 최적화 과정은 큰 2차 구조, 예컨대 헤어핀 또는 줄기 루프(이는 다른 방식으로라면 맞춤화 RNA에서 일어나게 됨)를 가지는 임의의 영역이 발생되는 것을 특별히 배제한다. 이 컴퓨터 소프트웨어를 이용하여, 사용자는 단순히 주어진 유전자의 cDNA 서열을 입력할 필요가 있고, 유전자의 CPB는 실험자가 적합하다고 볼 때, 맞춤화될 수 있다.
과대표시 또는 과소표시된 코돈 쌍에 의해 코딩되는 P1의 신생 합성
P1이 과대표시 또는 과소표시된 코돈 쌍에 의해 코딩되는 신규의 합성 폴리오바이러스를 수득하기 위해, 본 발명자들은 폴리오바이러스 I형 마호니(PV(M)-wt)의 P1 구조 영역에 상응하는 DNA 서열을 본 발명자들의 프로그램에 입력하여, 과대표시된 코돈 쌍(566개 돌연변이)을 이용하는 PV-Max-P1 및 과소표시된 코돈 쌍(631개 돌연변이)을 이용하는 PV-Min-P1를 산출하였다. 이 맞춤화된 신규 합성 P-1 영역의 CPB 스코어는 PV-Max = +0.25 및 PV-Min = -0.48인 반면, PV(M)-wt의 CPB는 -0.02이다(도 7).
부가적 맞춤화는, P1 영역의 서브클로닝을 허용하도록 주어진 간격으로 양 합성 서열 내로 설계되어 들어간 제한효소 주위를 포함시키는 것을 포함한다. 이 합성 P1 단편을 블루 헤론 코포레이션에 의해 신생 합성하여, 폴리오바이러스의 전장 cDNA 작제물 내에 도입하였다(도 11)(문헌 [Karlin et al., 1994]). PV(M)-wt 서열의 작은 단편(3개 코돈, 9개 뉴클레오티드)을 양 작제물 내에서 AUG 출발 코돈 뒤에 두어, 모든 합성 바이러스들에 대해 동등하게 번역이 개시되도록 하였고; 이에 따라 번역의 신장 상태에 대한 CPB의 영향의 더욱 정확한 측정을 제공하였다.
DNA 합성, 플라스미드, 합성 캡시드의 서브클로닝 및 세균
PV 게놈의 뉴클레오티드 495 내지 3636에 상응하는 큰 코돈 쌍 변경 PV cDNA 단편을 블루 헤론 코포레이션에 의해, 그 회사의 자산 진메이커 시스템을 이용하여 합성하였다(http://www.blueheronbio.com/). 독특한 제한효소 부위를 이용하여, PV1(M) cDNA 클론 pT7PVM으로부터 모든 후속 폴리오바이러스 cDNA 클론/서브클론을 작제하였다(문헌 [van der Wert, et al., 1986]). 전장 PV-Min, PV-Max 카세트를 PflMI 분해 및 pT7PVM 벡터 내로의 삽입을 통해 블루 헤론의 담체 벡터로부터 분리시켰고, 그것의 PflMI 단편을 제거하였다. NheI 및 BgIII를 동시에 분해한 후, 이 단편을, 유사하게 분해한 pT7PVM 벡터로 치환함으로써, PV-MinXY 및 PV-MinZ 작제물을 수득하였다. BsmI 분해하고, 그 단편/벡터를 유사하게 분해된 pT7PVM과 교환하여, PV-MinXY 및 PV-MinZ을 작제하였다. PV-MinXY 작제물을 BsmI로 분해하고, 이 단편을 분해된 pT7PVM에 대한 BsmI 단편과 치환함으로써, PV-MinY를 작제하였다. 플라스미드 형질전환 및 증폭은 모두 에쉐리키아 콜라이 DH5α를 통해 수행되었다.
CPB 변경 캡시드 영역을 가지는 키메라 바이러스의 생성: P1 전반에 걸친 과소표시된 코돈 쌍 편향은 무효(null) 표현형을 초래한다.
폴리오바이러스 게놈 서열의 업스트림에 있는 T7 RNA 중합효소 프로모터를 이용하여, 포지티브 센스 RNA를 전사하였다. 상기의 것으로부터의 1.5 ㎍의 주어진 플라스미드 cDNA 클론을 EcoRI 분해를 통해 선형화한 후, 37℃에서 2시간 동안 cDNA의 업스트림에 있는 자신의 프로모터에 의해 유도되는 T7 RNA 중합효소(스트라타젠(Stratagene))를 통해 RNA 내로 전사하였다(문헌 [van der Werf et al., 1986]). 이 RNA를 DEAE-덱스트란 방법을 이용하여 1×106 HeLa R19 세포 내로 형질감염시켰다(문헌 [van der Werf et al., 1986]). 이어서, 이 세포를 실온(RT)에서 30분 동안 인큐베이션하였다. 형질감염 상등액을 제거하고, 2% 우태 혈청(BCS) 함유의 둘베코 변형 이글 배지(DMEM)를 첨가하였으며, 세포를 37℃에서 인큐베이션하고, 세포병변 효과(CPE)의 개시에 대해 관찰하였다(4일까지).
PV-Max RNA 형질감염은 24시간 후 90% 세포병변 효과(CPE)를 발생시켰고, 이는 PV(M)-wt RNA의 형질감염에 필적한다. PV-Max 바이러스는 야생형과 동일한 크기의 플라크를 생성시켰다. 이와 대조적으로, PV-Min RNA는 96시간 후에 가시적인 세포병변 효과를 발생시키지 않았고, 형질감염된 세포로부터의 상등액의 4회 맹검 계대배양 후에도 생존성 바이러스가 단리되지 않았다.
또한, PV-Max RNA 형질감염시킨 세포로부터의 상등액의 후속 사용으로도 12시간 후에 95% CPE를 생성시켰고, 따라서 이는 형질감염된 게놈 물질이 PV-Max 폴리오바이러스 비리온을 성공적으로 생성시켰음을 가리킨다. 이와 대조적으로, PV-Min 바이러스 RNA는 96시간 후에 가시적 CPE를 산출하지 않았고, 또한 가능히 극히 낮은 수준의 바이러스를 함유했을 수 있는 상등액을 4회 맹검 계대배양한 경우에도 CPE가 생성되지 않았다. 그러므로, P1 영역 내 과소표시된 코돈 쌍을 이용하는 전장 PV-Min 합성 서열은 생존성 바이러스를 생성시킬 수 없고, 이에 따라 그것은 서브클로닝될 필요가 있다.
HeLa R19 세포를 10% BCS를 함유하는 DMEM 중에서 단층으로서 유지시켰다. 1 M.O.I를 이용하여 (1.0×108 세포) HeLa R19 단층 상에서 바이러스 증폭을 수행하였다. 감염된 세포를 3일 동안 또는 CPE가 관찰될 때까지, 2% BCS를 갖는 DMEM 중에서 37℃에서 인큐베이션하였다. 3회 냉동/해동 사이클 후에, 저속 원심분리를 통해 용해물로부터 세포 잔해물을 제거하였고, 바이러스를 함유하는 상등액을 추가 실험을 위해 사용하였다.
HeLa R19 세포의 단층을 5 M.O.I의 주어진 바이러스로 감염시키고, 접종물을 제거하였으며, 세포를 PBS로 2회 세정한 후, 37℃에서 0, 2, 4, 7, 10, 24, 및 48시간 동안 인큐베이션함으로써, 1단계 증식 곡선을 얻었다. 이어서, 이 시점을 플라크 검정법을 통해 분석하였다. HeLa R19 세포의 단층에서 모든 플라크 검정법을 수행하였다. 이 세포를 주어진 성장 곡선 시점의 일련 희석액 또는 정제된 바이러스로 감염시켰다. 이어서, 이 세포에 2% BCS 함유의 변형 이글 배지 중에서 0.6% 트래거캔스 검을 부가한 후, 그 세포를 PV(M)-wt 및 PV-Max 바이러스의 경우에는 2일간, 또는 PV-Min(X, Y, XY, 또는 Z) 바이러스의 경우에는 3일 동안 37℃에서 인큐베이션하였다. 이어서, 그것을 크리스탈바이올렛 염색을 통해 전개하여, 가시적 플라크를 계수함으로써 PFU/ml 역가를 계산하였다.
과소표시된 코돈 쌍 편향의 작은 영역이 생존성을 복구시키나, 바이러스를 약독화한다.
PV-Min 서열 내에 설계된 제한효소 부위를 이용하여, 본 발명자들은 PV-Min P1 영역의 부분을 이와 다른 방식으로 야생형인 바이러스 내로 서브클로닝하여, P1의 단지 부분영역만이 불량한 코돈 쌍 편향을 가진 키메라 바이러스를 생성시켰다(도 11)(문헌 [van der Werf et al., 1986]). 각각의 이 서브클론으로부터, RNA를 시험관내 전사를 통해 생성시킨 후, HeLa R19 세포 내로 형질감염시켜, 다양한 약독화 정도를 갖는 바이러스를 산출시켰다(생존성 스코어, 도 11). P1 단편 X 및 Y는 각기 약간 약독화되나; 그것들은 함께 첨가될 때, 실질적으로 약독화된 바이러스(PV-Min755-2470, PV-MinXY)를 산출시킨다(도 3, 4). 바이러스 PVMin2470-3385(PV-MinZ)는 PV-MinXY와 대략 유사하게 약독화된다. 작제물 PV-Min1513-3385(YZ)는 플라크를 산출하지 않았고, 따라서 매우 약독화되어 생존성 바이러스를 산출하지 못함이 명백하다. 다양한 약독화 정도를 나타낸 상기 바이러스 작제물을 더욱 연구하여, 그것의 실제 증식 동역학 특성을 결정하였다.
1단계 증식 동역학 특성 및 약독화의 기전: 특이적 감염력이 감소된다.
각 생존성 작제물에 대해, 1 단계 증식 동역학 특성을 조사하였다. 이 동역학 특성은 동일한 기본 방식으로 진행된다는 점에서, 야생형의 동역학 특성과 일반적으로 유사하다(즉, 암흑 상태 후에, 급속한 지수 성장이 이어짐). 그러나, 모든 PV-Min 작제물들에 대해, 플라크 형성 단위(PFU) 측면에서의 최종 역가는 전형적으로 야생형 바이러스의 최종 역가에 비해 1 내지 3 등급 더 낮았다(도 12A).
바이러스를 PFU 대신에 바이러스 입자/ml로 측정할 때(도 12B), 약간 상이한 결과가 수득되며, 이는 이 바이러스가 감염 사이클 당, 야생형 바이러스와 거의 균등한 세포당 입자 수를 생성시킴을 제시한다. 바이러스 입자/ml의 측면에서, 가장 약독화된 바이러스는 단지 78%(PV-MinXY) 또는 82%(PV-MinZ) 약독화되고, 이 정도는 로그 규모로 약 1 등급 미만이다. 따라서, 이 바이러스는 이의 특이적 감염력(플라크 생성에 필요한 비리온 수)에 있어 약 2 등급만큼 약독화되는 것으로 보여진다.
특이적 감염력이 감소되었음을 확인하기 위해, 본 발명자들은 매우 정제된 바이러스 입자를 이용하여, PFU 당 바이러스 입자의 비를 재측정하였다. 선택된 바이러스를 108개 HeLa R19 세포 상에서 증폭시켰다. 바이러스 용해물을 RNAse A로 처리하여, OD 값을 모호하게 하는 노출된 바이러스 게놈 및 임의 세포 RNA를 파괴하였다. 또한, 이어서 바이러스 용해물을 0.2% SDS 및 2 mM EDTA와 함께 1시간 동안 인큐베이션하여, 세포내 및 비비리온 바이러스 단백질을 변성시켰다. 적절히 폴딩되어 형성된 폴리오바이러스 캡시드는, 알파 입자는 생존하지 못했던, 이 격한 SDS 처리에 남아 생존하였다(문헌 [Mueller et al., 2005]). 이 처리된 용해물로부터의 비리온을 이어서 수크로스 구배로 초원심분리를 통해 정제하였다. 식 [9.4×1012 입자/ml = 1 OD260 단위]를 이용하여, 260 nm에서의 흡광도에 의해, 바이러스 입자 농도를 측정하였다(문헌 [Rueckert, 1985]). 각각의 4가지 바이러스에 대해 유사한 수의 입자가 생성되었다(표 6). 이어서, 이 정제된 비리온을 이용하여, 플라크 검정법을 수행하였다. 다시, PV-MinXY 및 PV-MinZ는, 플라크의 생성을 위해 야생형보다 더 많은 바이러스 입자들을 요하였다(표 6).
야생형 바이러스에 있어서, 특이적 감염력은 문헌들(문헌 [Mueller et al., 2006]; 문헌 [Schwerdt 및 Fogh, 1957]; 문헌 [Joklik 및 Darnell, 1961])과 일관되게도, 137 입자 당 1 PFU인 것으로 계산되었다(표 6). 바이러스 PV-MinXY 및 PV-MinZ의 특이적 감염력은 1 PFU/10,000개 입자 부근이다(표 6).
부가적으로, 합성 바이러스의 열 안정성을 PV(M)-wt의 열 안정성과 비교하여, 신규 RNA의 부분을 갖는 상기 입자들이 동등하게 안정하다는 SDS 처리 데이터를 재확인하였다. 실제로, 이 합성 바이러스는 50℃에서 인큐베이션하여 시간 코스로 정량할 때, PV(M)-wt와 동일한 온도 프로파일을 가졌다(데이터는 나와 있지 않음).
과소표시된 코돈 쌍은 번역 효율을 감소시키는 반면, 과대표시된 쌍은 번역을 증진시킨다.
코돈 쌍 편향의 존재에 대한 한 가설은, 과소표시된 쌍의 이용이 불량하거나 낮은 번역 속도를 유발한다는 것이다. 본 발명자들의 합성 바이러스는, 본 발명자의 지견에 따르면, 고농도의 과소표시된 코돈 쌍을 함유하는 첫 번째 분자이며, 이에 따라 첫 번째 분자는 그 번역 가설의 시험에 적당하다.
번역에 대한 코돈 쌍 편향의 영향을 측정하기 위해, 본 발명자들은 디시스트론성 리포터를 사용하였다(문헌 [Mueller et al., 2006])(도 13). 첫 번째 시스트론은 C형 간염 바이러스 내부 리보솜 부착 부위(IRES)의 조절 하에서 레닐라 루시퍼라제(R-Luc)를 발현시키고, 정규화 대조군으로서 사용된다. 두 번째 시스트론은 폴리오바이러스 IRES의 조절 하에 반딧불 루시퍼라제(F-Luc)를 발현한다. 그러나, 이 두 번째 시스트론에서는, F-Luc 앞에 폴리오바이러스의 P1 영역이 있고, 이 P1 영역은 본원에 기재된 합성 서열 변이체들 중 임의의 것에 의해 코딩될 수 있다. F-Luc가 P1 영역의 단백질로 융합 단백질로서 번역되기 때문에, P1 영역의 번역능은 생성되는 F-Luc 단백질의 양에 직접적으로 영향을 준다. 따라서, F-Luc 발광도(luminescence) 대 R-Luc 발광도의 비는 각종 P1 코딩의 번역능의 척도이다.
야생형, PV-Max, PV-Min, PV-MinXY 및 PV-MinZ의 P1 영역을 "P1"로 표지된 영역에 삽입하였다(도 13A). PV-MinXY, PV-MinZ, 및 PV-Min은 야생형 P1 영역에 비해 R-Luc의 단위 당 훨씬 더 적은 F-Luc를 생성하고, 이는 과소표시된 코돈 쌍이 불량하거나 낮은 번역 속도를 유발하고 있음을 강하게 제시한다(도 13). 이와 대조적으로, PV-Max P1(과대표시된 코돈 쌍을 사용함)은 R-Luc의 단위 당 더 많은 F-Luc를 생성시켰고, 이는 번역이 PV(M)-wt P1에 비해 PV-Max P1에서 더 잘 이루어짐을 제시한다.
디시스트론성 리포터 작제 및 생체내 번역
pdiLuc-PV에 기초하여 디시스트론성 리포터 작제물을 모두 작제하였다(문헌 [Mueller et al., 2006]). 올리고뉴클레오티드 P1max-2A-RI(+)/P1max-2A-RI(-) 또는 P1min-2A-RI(+)/P1min-2A-RI(-)를 각기 이용하여, PCR을 통해 PV-Max 및 PV-Min 캡시드 영역을 증폭시켰다. PCR 단편을 겔 정제한 후, 중간 벡터 pCR--XL-TOPO(인비트로겐)에 삽입하였다. 이어서 이 중간 벡터를 원샷(One Shot) 토피오(TOPlO) 화학적 경쟁 세포 내에서 증폭시켰다. 키아겐 미니프렙(Quiagene miniprep)을 통해 플라스미드를 제조한 후, PV-Min를 포함하는 중간 벡터를 EcoRI로 분해하였고, 이 단편들을 EcoRI로 동일하게 분해된 pdiLuc-PV 벡터 내로 결찰시켰다(문헌 [Mueller et al., 2006]). 이 플라스미드를 또한 원샷 토피오 화학적 경쟁 세포(인비트로겐)에 삽입하였다. pdiLuc-PV-MinXY 및 pdiLuc-PV-MinZ를 작제하기 위해, pdiLuc-PV 및 pdiLuc-PV-Min을 NheI로 동일하게 분해하였고, 생성되는 제한효소 단편을 각 벡터 간에 교환하였다. 이어서, 이것을 원샷 토피오 화학적 경쟁 세포 내로 형질전환한 후, 증폭시켰다. 4개 모두의 이 클론들로부터, RNA을 T7 중합효소 방법을 통해 전사시켰다(문헌 [van der Werf et al., 1986]).
합성 캡시드의 생체내 번역 효율을 분석하기 위해, 디시스트론성 리포터 작제물의 RNA를, 리포펙타민(Lipofectamine) 2000(인비트로겐)을 통해 12웰 디쉬 상에서 2×105개 HeLa R19 세포 내로 형질감염시켰다. 단지 투입된 RNA의 번역을 정량하기 위해, 형질감염을 2 mM 구아니딘 염산염(GuHCL)의 존재 하에 수행하였다. 형질감염한지 6시간 후, 세포를 부동 세포용해 완충액(프로메가)를 통해 용해시킨 후, 이 용해물을 이중 반딧불(F-Luc) 레닐라(R-Luc) 루시퍼라제 검정법(프로메가)에 의해 분석하였다.
PV-MinXY 및 PV-MinZ의 유전적 안정성
PV-MinXY 및 PV-MinZ가 각기 수백개의 돌연변이(이들 각 돌연변이는 전체 코돈 쌍 편향의 미소한 감소를 유발함)를 가지기 때문에(각각 407개 및 224개), 본 발명자들은 이 바이러스들이 야생형 독성으로 복귀하기는 매우 어려울 것으로 판단한다. 이 사상의 직접적 시험으로서, 바이러스 PV-MinXY 및 PV-MinZ를 0.5의 MOI로 각기 15회 일련 계대배양하였다. 역가를 표현형 복귀에 대해 모니터링하였고, 계대배양된 바이러스의 서열을 복귀 또는 돌연변이에 대해 모니터링하였다. 15회 계대배양 후, 바이러스에 있어 표현형 변화가 없었고(즉, 동일한 역가, CPE 유도), 합성 영역에 고정된 돌연변이가 없었다.
열 안정성 및 계대배양
합성 바이러스인 PV-MinXY 및 PV-MinZ의 안정성을 시험하여, PV(M)-wt와 비교하였다. 이는, PBS 중에 현탁된 1×108개 입자를 60분 동안 50℃로 가열한 후, 5, 15, 30 및 60분에서 플라크 검정법을 통해 비변형 바이러스 입자의 감소를 측정함으로써 수행되었다(도 14). 바이러스 PV-MinXY 및 PV-MinZ의 P1 영역의 합성 부분의 유전적 안정성을 시험하기 위해, 이 바이러스들을 일련 계대배양하였다. 이는, 1×106개 HeLa R19 세포의 단층을 0.5 MOI의 바이러스, PV-MinXY 및 PV-MinZ로 감염시킨 후, CPE의 유도를 대기함으로써 수행되었다. CPE가 일단 개시되면, 계대배양 전반에 걸쳐 일정하게 남는데, 용해물을 사용하여 HeLa R19 세포의 새 단층을 감염시켰다. 역가 및 서열을 계대배양 5, 9, 및 15에서 모니터링하였다(데이터는 나와 있지 않음).
바이러스 정제, 및 OD
260
흡광도를 통한 바이러스 입자의 결정
CPE가 관찰될 때까지, 15 cm 디쉬(1×108개 세포) 상에서의 HeLa R19 세포의 단층을 PV(M)-wt, PV-Max, PV-MinXY 또는 PV-MinZ로 감염시켰다. 3회 냉동/해동 사이클 후, 세포 용해물을 3,000×g에서 15분 동안, 이어서 10,000×g에서 15분 동안 2회 초기 원심분리하였다. 이어서, 10 ㎍/ml의 RNAse A(로쉐)를 상등액에 첨가하여, 1시간 동안 실온에서 인큐베이션하였으며; 후속하여, 0.5% 도데실황산나트륨(SDS) 및 2 mM EDTA를 상등액에 첨가하여, 완만하게 혼합하고, 30분 동안 실온에서 인큐베이션하였다. 바이러스 입자를 함유하는 이 상등액을 6 ml 수크로스 쿠션[행크스 완충 염액(HBSS) 중 30% 수크로스] 위에 두었다. SW28 스윙-버킷 회전자를 이용하여 28,000 rpm에서 3.5시간 동안 수크로스 구배를 통해 초원심분리하여, 바이러스 입자의 침강을 수행하였다.
원심분리 후, 수크로스 쿠션을 비변형 상태로 두었고, 상등액을 제거하였으며, 관을 HBBS로 2회 세정하였다. 세정 후, 수크로스를 제거하였고, 바이러스 "펄(pearl)"을 0.1% SDS 함유의 PBS 중에 재현탁하였다. 플라크 검정법(상기 참조)을 통해, 바이러스 역가를 측정하였다. 식 [9.4×1012 입자/ml = 1 OD260 단위]을 이용하여, 나노드롭 분광광도계(나노드롭 테크놀로지즈 인코포레이티드)를 통해 용액의 260 nm에서의 흡광도를 3회 측정하여 평균을 구함으로써, 바이러스 입자 농도를 측정하였다(문헌 [Mueller et al., 2006]; 문헌 [Rueckert, 1985]).
CD155tg 마우스에서의 PV-MinXY 및 PV-MinZ의 신경약독화
야생형 폴리오바이러스의 감염의 일차 부위는 인두 중앙부 및 위이나, 이 감염은 비교적 무증상이다. 그러나, 감염이 PV(M)-wt 감염의 1%로 CNS 내에 운동 뉴런에 퍼지면, 바이러스는 뉴런을 파괴하여, 사망, 또는 급성 회백수염으로 알려진 바와 같은 급성 이완성 마비를 유발한다(문헌 [Landsteiner 및 Popper, 1909]; 문헌 [Mueller et al., 2005]). 운동 뉴런 및 CNS가 폴리오바이러스의 중요 표적이므로, 본 발명자들은 합성 바이러스가 이 조직들에서 약독화되었는지의 여부를 알기 원한다. 그러므로, 이 바이러스들을 뇌내 주사를 통해 CD155tg 마우스(폴리오바이러스 수용체를 발현하는 유전자도입 마우스)에 투여하였다(문헌 [Koike et al., 1991]). 각 바이러스에 대해 PLD50 값을 계산하였고, PV-MinXY 및 PV-MinZ 바이러스는 입자 기준 1,000배 약독화 또는 PFU 기준 10배 약독화되었다(표 6)(문헌 [Reed and Muench, 1938]). 바이러스들은 신경약독화를 나타냈으므로, 가능한 백신으로 사용될 수 있다.
CD155tg 마우스에서의 감소된 특이적 감염력 및 신경약독화 | ||||||
바이러스 | A260 | 정제된 입자/ml a | 정제된 PFU/ml | 특이적 감염력 b | PLD50(입자) c | PLD50(PFU) d |
PV-M(wt) | 0.956 | 8.97×1012 | 6.0×1010 | 1/137 | 104.0 | 101.9 |
PV-Max | 0.842 | 7.92×1012 | 6.0×1010 | 1/132 | 104.1 | 101.9 |
PV-MinXY | 0.944 | 8.87×1012 | 9.6×108 | 1/9,200 | 107.1 | 103.2 |
PV-MinZ | 0.731 | 6.87×1012 | 5.1×108 | 1/13,500 | 107.3 | 103.2 |
a) A260를 사용하여, 식 [9.4×1012개 입자/ml = 1 OD260]을 통해 입자/ml를 구함 b) 정제된 바이러스의 PFU/ml를 입자/ml로 나눔으로써 계산됨 c, d) 바이러스를, 각종 용량으로 CD155tg 마우스에 뇌내 주사로 투여한 후에 계산됨 |
CD155tg 마우스의 백신접종은 면역성 및 치사 공격접종으로부터의 보호를 제공한다.
4-6, 6-8주령 CD155tg 마우스(Tg21 균주)의 군에, 30 ㎕ PBS 중의 102개 입자 내지 109개 입자의 정제된 바이러스 희석물을 뇌내 주사하여, 신경병원성을 결정하였다(문헌 [Koike, et al., 1991]).
[Reed 및 Muench] 방법에 의해, 치사 용량(LD50)을 계산하였다(문헌 [Reed and Muench, 1938]). 플라크 검정법에 의해, 척수 및 뇌에서의 바이러스 역가를 정량하였다(데이터는 나와 있지 않음).
PV-MinZ 및 PV-MinXY는 야생형 바이러스와 정확히 동일한 단백질을 코딩하나, 감소된 특이적 감염력 및 신경약독화 모두에 대해, 수가지 면에서 약독화된다.
백신으로서의 PV-MinZ, PV-MinXY를 시험하기 위해, 3가지 부분치사 용량(108개 입자)의 이 바이러스를 100 ㎕의 PBS 중에서 8, 6-8주령 CD155tg 마우스에 뇌내 주사를 통해 3주 동안 매주 1회 투여하였다. 백신 코호트로부터의 한 마우스는 병약으로 인해 백신 처방을 완료하지 못했다. 또한, 대조군 마우스의 집합에 100 ㎕ PBS를 이용하여 3회 모의 백신접종을 실시하였다. 최종 백신접종한 지 대략 1주 후에, 30 ㎕의 혈액을 꼬리정맥으로부터 추출하였다. 이 혈액을 저속 원심분리하였고, 혈청을 회수하였다. WHO의 권장사항에 따라 수행되는, 공격접종 바이러스의 100 플라크 형성 단위(PFU)를 이용한 미세중화 검정법을 통해, PV(M)-wt에 대한 혈청 전환을 분석하였다(문헌 [Toyoda et al., 2007]; 문헌 [Wahby, A.F., 2000]). 최종 백신접종한 지 대략 2주 후에, 백신접종된 마우스 및 대조군 마우스를, 100 ㎕의 PBS 중의 106 PFU로 뇌내 주사함으로써 치사 용량의 PV(M)-wt로 공격접종하였다(문헌 [Toyoda et al., 2007]). CD155tg 마우스를 이용한 모든 실험들을, 연방 지침뿐만 아니라, 스토니 브루크 유니버시티(Stony Brook University)의 IACUC에 따라 수행하였다. 14마리 모두의 백신접종된 마우스가 생존하였고, 마비 또는 파라시아(Parasia)의 어떠한 표시도 나타내지 않았으며; 이와 대조적으로, 모든 모의 백신접종된 마우스는 사망하였다(표 7). 이 데이터는, 실제로 역최적화 코돈 쌍을 갖는 CPB 바이러스가 야생형 바이러스에 대해 면역화할 수 있어, 양자 모두에게 강한 상박골 반응을 제공하고, 또한 공격접종 후 완전한 생존을 허용하였다.
치사적 공격접종으로부터의 보호 | |
바이러스 a | 보호된 마우스(7마리 중의 마리수) b |
PV-MinZ | 7 |
PV-MinXY | 7 |
모의 백신접종 | 0 |
a) CD155tg 마우스에 3가지 백신접종 용량(108개 입자)의 각 바이러스를 투입함 b) 뇌내 주사를 통해 106 PFU의 PV(M)-wt로 공격접종함 |
실시예 10
인플루엔자 바이러스에의 SAVE의 적용
인플루엔자 바이러스는 8개의 분리된 게놈 분절을 가진다. 인플루엔자 A 바이러스(A/푸에르토리코/8/34/시나이(H1N1))에 대한 분절 서열을 개시하는 유전자은행 수탁에는, AF389115(분절 1, 중합효소 PB2), AF389116(분절 2, 중합효소 PB1), AF389117(분절 3, 중합효소 PA), AF389118(분절 4, 헤마글루티닌 HA), AF389119(분절 5, 핵단백질 NP), AF389120(분절 6, 뉴라미니다제 NA), AF389121(분절 7, 매트릭스 단백질 M1 및 M2), 및 AF389122(분절 8, 비구조 단백질 NS1)이 포함된다.
초기 연구에서, 전장 바이러스 RNA에 단량체로서 결합하여 코일링된 리보핵단백질을 형성하게 되는 비리온의 주요 구조 단백질이자 두 번째로 풍부한 단백질(입자 당, 1,000개 카피)인 핵단백질 NP을 코딩하는 균주 A/PR/8/34의 게놈 분절(본원에서 A/PR8로도 칭해짐)을 역최적화를 위해 선택하였다. (모 및 역최적화 서열에 대해 이하 표 8을 참조한다). 또한, NP는 mRNA에서 주형으로의 중대 전환 및 비리온 RNA 합성에 관여한다(문헌 [Palese and Shaw, 2007]). 2개의 동의 코딩을 합성하였는데, 첫 번째는 빈번하게 사용되는 코돈을 희소 동의 코돈(NPCD)으로 치환하는 것이고(즉, 역최적화 코돈 편향), 두 번째는 코돈 쌍(NPCPmin)을 역최적화하는 것이다. 분절의 어느 한 끝에 있는 말단 120개 뉴클레오티드를, 복제 및 이입을 저해하지 않도록 변경하였다. NPCP는 338개 침묵 돌연변이를 포함하고, NPCPmin(서열 번호 23)는 314개 침묵 돌연변이를 포함한다. 돌연변이체 NP 분절을 (이하) 기재된 바와 같이, 또한 293T/MDCK 동시 배양된 세포 내로 동시 형질감염된 다른 7개의 wt 인플루엔자 플라스미드와 함께, 앰비센스(ambisense) 벡터에 도입하였다. 대조군으로서, 세포를 모든 8개의 wt A/PR8 플라스미드로 형질감염시켰다. NPCD 분절 및 NPCPmin 분절로 형질감염된 세포는 야생형 NP로 형질감염된 세포와 유사하게, 생존성 인플루엔자 바이러스를 생성시켰다. 각기 A/PR8-NPCD 또는 A/PR8-NPCPmin로 칭해지는, 이 새로운 역최적화 바이러스들은 약독화되는 것으로 보여지며; 즉, 역가(PFU 단위)가 야생형 바이러스에 비해 3 내지 10배 더 적고, 양 돌연변이체 바이러스 모두가 작은 플라크를 만든다.
역최적화 인플루엔자 바이러스가 유사한 수의 역최적화 코돈을 갖는 폴리오바이러스와 같이 심하게 약독화되지 않으나, 두 바이러스의 번역 기법에는 차이가 있다. 폴리오바이러스는 단일 다단백질로 번역되는, 단일의 긴 mRNA를 가진다. (본 발명자들의 캡시드 역최적화 바이러스에서와 같은) 이 긴 mRNA를 시작으로 한 저속 번역은 전체 메시지의 번역을 감소시키고, 이에 따라 모든 단백질들에 영향을 준다. 이와 대조적으로, 인플루엔자는 8개의 분리된 분절을 가지고, 하나의 역최적화는 다른 것들의 번역에 대해 영향을 가진다해도 거의 가지지 않을 것이다. 또한, NP 단백질의 발현은 특히 인플루엔자 바이러스 감염에서 일찍 우세하게 일어난다(문헌 [Palese and Shaw, 2007]).
코돈 쌍 역최적화 NP 분절을 가지는 인플루엔자 바이러스의 특성 분석
0.001 감염 다중도(MOI)로 100 mm 디쉬에서 개의 원위세뇨관 세포(Madin Darby Canine Kidney Cells)(MDCK 세포)의 컨플루언트 단층을 감염시킴으로써, A/PR8-NPCPmin의 성장 특성을 분석하였다. 바이러스 접종물을 록킹 플랫폼 상에서 30분 동안 실온에서 흡착되도록 한 후, 0.2% 우태 혈청 알부민(BSA) 및 2 ㎍/ml TPCK 처리 트립신을 함유하는 10 ml의 둘베코 변형 이글 배지(DMEM)로 보충하고, 37℃에서 인큐베이션하였다. 0, 3, 6, 9, 12, 24 및 48시간 후, 100 ㎕의 바이러스를 함유하는 배지를 제거하고, 플라크 검정법에 의해 바이러스 역가를 측정하였다.
35 mm 6웰 플레이트에서 MDCK 세포의 컨플루언트 단층에 플라크 검정법을 g행하여, 바이러스 역가 및 플라크 표현형을 결정하였다. 바이러스의 10배 일련 희석액을, 0.2% 우태 혈청 알부민(BSA) 및 2 ㎍/ml TPCK 처리 트립신을 함유하는 둘베코 변형 이글 배지(DMEM)에서 제조하였다. 바이러스 희석액을 MDCK 세포 상에 도말하고, 록킹 플랫폼에서 30분 동안 실온에서 흡착하도록 한 후, 세포 배양 인큐베이터에서 37℃에서 1시간 동안 인큐베이션하였다. 이어서, 접종물을 제거하였고, 0.6% 트래거캔스 검(시그마-알드리치) 0.2 % BSA 및 2 ㎍/ml TPCK 처리 트립신을 함유하는 3 ml의 최소 이글 배지로 보충하였다. 37℃에서 72시간 동안 인큐베이션한 후, 웰을 크리스탈바이올렛으로 염색함으로써 플라크를 가시화하였다.
A/PR8-NPMin는 A/PR8 wt에 비해, MDCK 세포 상에서 보다 작은 플라크를 생성시킨 생존성 바이러스를 생성시켰다(도 16A). 또한, 낮은 MOI 감염 시, A/PR8-NPMin는 감염후 3 내지 12시간에 지연된 증식 동역학 특성을 나타내고, 여기에서 A/PR8-NPMin 역가는 A/PR8에 비해 1.5 로그 지체된다(도 16B). 최종 역가는 A/PR8의 최종 역가보다 3 내지 5배 더 낮았다(3개의 상이한 실험들의 평균).
코돈 쌍 역최적화 PB1, HA, 또는 HA 및 NP 분절을 가지는 인플루엔자 바이러스 A/PR8-PB1
Min-RR
, A/PR8-HA
Min
및 A/PR8-HA
Min
/NP
Min
의 특성 분석
헤마글루티닌 단백질 HA 및 중합효소 서브유닛 PB1을 코딩하는 균주 A/PR/8/34의 코돈 쌍 역최적화 게놈 분절을 생성시켰다. HA는 바이러스 표면 매개 수용체 부착 및 바이러스 침투로부터 나오는 바이러스 구조 단백질이다. PB1은 바이러스 RNA 복제 기구의 중요 성분이다. 구체적으로, 야생형 코돈 사용빈도(PB1Min-RR)를 보유하면서 코돈 190 내지 488(PB1 분절의 뉴클레오티드 531 내지 1488)의 코돈 쌍을 역최적화함으로써, PB1의 동의 코딩(서열 번호 15)을 합성하였다. 분절 PB1Min-RR은 wt PB1 분절에 비해 236개 침묵 돌연변이를 포함하였다.
야생형 코돈 사용빈도(HAMin)를 보유하면서 코돈 50 내지 541(HA 분절의 뉴클레오티드 180 내지 1655)의 코돈 쌍을 역최적화함으로써, HA의 두 번째 동의 코딩(서열 번호 21)을 합성하였다. HAMin은 wt PB1 분절에 비해 355개 침묵 돌연변이를 포함하였다.
돌연변이체 PB1Min-RR 및 HAMin 분절을, 상기 기재된 바와 같이, 앰비센스 벡터 내로, 또한 293T/MDCK 동시 배양된 세포 내로 동시 형질감염된 다른 7개의 wt 인플루엔자 플라스미드와 함께 도입하였다. NPMin 분절 및 나머지 6개 wt 플라스미드와 함께 HAMin 분절을 동시 형질감염시켰다. 대조군으로서, 세포를 모든 8개의 wt A/PR8 플라스미드로 형질감염시켰다. PB1Min-RR 또는 HAMin 분절로 형질감염된 세포는, 코돈 쌍 역최적화 분절 HAMin 및 NPMin의 조합과 마찬가지로, 생존성 바이러스를 생성시켰다. 새 역최적화 바이러스는 각기 A/PR8-PB1Min-RR, A/PR8-HAMin 및 A/PR8-HAMin/NPMin로 칭해진다.
성장 특성 및 플라크 표현형을 상기 기재된 바대로 평가하였다.
A/PR8-PB1Min-RR, A/PR8-HAMin, 및 A/PR8-HAMin/NPMin은 모든 생존성 바이러스를 생성시켰다. A/PR8-PB1Min-RR 및 A/PR8-HAMin/NPMin는 A/PR8 wt에 비해 MDCK 세포 상에서 보다 작은 플라크를 생성시켰다(도 17A). 또한, MDCK 세포 상에서의 낮은 MOI 감염 시, A/PR8-HAMin 및 A/PR8-HAMin/NPMin은 매우 감소된 증식 동역학 특성을, 특히 감염후 3 내지 12시간에 나타냈고, 여기에서 A/PR8-HAMin/NPMin 역가는 A/PR8보다 1 내지 2 등급 지체된다(도 17B). A/PR8-HAMin 및 A/PR8-HAMin/NPMin의 양자 모두에 대한 최종 역가는 A/PR8의 최종 역가보다 10배 더 낮았다. A/PR8-HAMin/NPMin이 A/PR8-HAMin보다 더 심하게 증식이 지체되는 바, 두 분절을 역최적화하는 효과는 부가적인 것으로 결론내릴 수 있다.
BALB/c 마우스 모델에서의 A/PR8-NP
Min
의 약독화
6 내지 8마리의 마취한 6주령의 BALB/c 마우스로 된 군에, 102 및 106 PFU의 바이러스의 10배 일련 희석액을 함유하는 12.5 ㎕의 A/PR8 또는 A/PR8-NPMin 바이러스 용액을 콧구멍으로 주입하였다. 치사율 및 질병율(체중 감소, 감소된 활성, 사망)을 모니터링하였다. [Reed 및 Muench]의 방법(문헌 [Reed, L. J., and M. Muench. 1938. Am. J. Hyg. 27:493-497])에 의해 치사 용량 50, LD50을 계산하였다.
8마리의 마우스에, 102 PFU의 A/PR8-NPMin 바이러스를 비강내 접종함으로써 한 번 백신접종하였다. 6마리의 마우스로 된 대조군에는 어떠한 바이러스도 백신접종하지 않았다(모의). 이 초기 백신접종을 한 지 28일 후, 마우스를 LD50의 100배에 상응하는, 치사 용량의 wt 바이러스 A/PR8으로 공격접종하였다.
A/PR8에 대한 LD50은 4.6×101 PFU인 반면, A/PR8-NPMin에 대한 LD50은 1×103 PFU이었다. 102의 용량에서, 모든 A/PR8-NPMin 감염 마우스들이 생존하였다. A/PR8-NPMin이 wt A/PR8 바이러스에 비해 10배 초과만큼 마우스에서 약독화된 것으로 결론내릴 수 있다. 이에 따라, 백신접종 실험을 위해 상기 농도를 선택하였다. 마우스에 102 A/PR8-NPMin를 백신접종하면, 10% 미만의 상대적 체중 감소로 나타나는 바와 같이, 보통 정도의 짧은 병약이 초래되었다(도 18A). 8마리의 백신접종된 마우스들 중 8마리 모두가 생존하였다. 동일한 용량의 A/PR8로 감염된 마우스는 심한 질환으로 급속한 체중 감소를 겪었다. A/PR8로 감염된 8마리 마우스 중 6마리가 감염후 10 내지 13일에 사망하였다(도 18B). 두 마리의 마우스가 생존하여, 야생형 감염으로부터 회복하였다.
wt 바이러스의 LD50의 100배로 공격접종했을 때, 백신접종된 모든 A/PR8-NPMin이 보호되었고, 질환 증상 또는 체중 감소없이 공격접종에 살아 남았다(도 18C). 모의 백신접종된 마우스는 한편 심각한 증상을 나타냈고, 공격접종 9 내지 11일 후 감염에 굴복당했다. A/PR8-NPMin가 마우스에서 보호 면역을 유도하였고, 이에 따라 약독화 인플루엔자 생백신으로서의 가능성을 가지는 것으로 결론내릴 수 있다. 마우스에서 역시 시험하고자 하는 A/PR8-PB1Min-RR 및 A/PR8-HAMin/NPMin와 같은 다른 바이러스도 또한 백신으로서의 코돈 쌍 역최적화 인플루엔자 바이러스의 유익한 성질을 추가로 향상시키게 될 수 있다.
실시예 11
바이러스 키메라를 제조하고 특성 분석하기 위한 고효율 방법의 개발
중첩 PCR에 의한 키메라 바이러스의 작제
각 약독화 돌연변이체 바이러스를 통한 "스캔"은, 중첩 PCR을 이용하여 각 돌연변이체 바이러스로부터의 대략 300 bp 단편을 wt 부분에 둠으로써 수행된다. 임의의 주어진 300 bp 분절은 ~200 bp만큼 선행 분절과 중첩되나(즉, 스캐닝 창이 ~300 bp 길이임), 각 키메라 바이러스에 대해 ~100 bp만큼 진행된다. 따라서, (단지 ~3000 bp의 캡시드 영역이 변경된) 한 돌연변이체 바이러스를 통한 스캔은 약 30 키메라 바이러스를 필요로 한다. 동시에 두 바이러스의 분석에 충분한 용량을 초과하는 용량을 가지는 96웰 포맷으로 스캔을 수행한다.
출발 물질은 두 플라스미드의 피코그램 양으로서, 이때 한 플라스미드는 wt 바이러스의 서열을 포함하고, 다른 하나는 돌연변이체 바이러스의 서열을 포함한다. 플라스미드는 T7 RNA 중합효소 프로모터, 해머헤드 리보솜(문헌 [Herold and Aldino, 2000]), 및 DNA 코딩 폴리(A) 꼬리를 포함한, PV 역유전학 시스템(문헌 [van der Werf et al., 1986])을 위한 모든 필수 요소를 포함한다. PCR 프라이머의 3 쌍, 즉 A, M(돌연변이체의 경우), 및 B 쌍을 사용한다. 도 9를 참조한다. M 쌍은 돌연변이체 바이러스의 요망되는 300 bp 분절을 증폭시키고; 그것은 wt를 증복시키지 않는데, 이는 M 프라이머 쌍이 돌연변이체 내에서 유의적으로 변경된 서열에 기초하여 설계되기 때문이다. A 및 B 쌍은 wt 바이러스 게놈의 요망되는 측면(flank)을 증폭시킨다. 중요하게도, 약 20 내지 25 bp의 중첩 서열이 각기 A2 및 B1뿐만 아니라 각 M 프라이머의 5' 말단 내에 만들어지고; 이 20 내지 25 bps가 A 분절의 3' 말단 및 B 분절의 5' 말단과 각기 중첩한다(100% 상보성).
중첩 PCR을 수행하기 위해, 1개의 96웰 디쉬는 30가지 상이한 웰에 wt 플라스미드 DNA, 및 30개의 상이한 A 및 B 쌍을 포함한다. 분리되어 있으나 매칭되는 96웰 플레이트는 돌연변이체 플라스미드 DNA 및 30개의 상이한 M 프라이머 쌍을 포함한다. PCR는 매우 절차적이고 낮은 오류율을 가지는 열안정성 중합효소로 수행된다. PCR의 1회 번째 수행 후, 각 반응물을, 메틸화 GmATC 부위에서 절단에 의해 주형 플라스미드를 파괴하는 DpnI로 처리한다. 각 wt 및 매칭 돌연변이체 반응물로부터의 분취량을 이어서 세 번째 96웰 디쉬에서 PCR 반응 완충액 중에 혼합한다. 이때, 전체 작제물에 측면에 있는 프라이머를 사용한다(즉, A1 및 B2 프라이머). 각 분절(A, M, 및 B)이 각 인접한 분절과 20 bp 이상 중첩되도록 설계되고, 또한 반응이 단지 전장 산물을 증폭시킬 수 있는 프라이머에 의해 유도되고 있기 때문에, 분절들은 어닐링하고 상호 확장하여, 2 또는 3 사이클 후에 전장 산물을 생성시킨다. 이는 "1 튜브"(1개의 96웰 디쉬) 설계로 압축될 수 있는 "3 튜브"(3개의 96웰 디쉬) 설계이다.
키메라 바이러스의 특성 분석
T7 RNA 중합효소와 함께 인큐베이션할 때, 모든 필요한 업스트림 및 다운스트림 조절 요소를 갖는, 상기 생성된 전장 선형 키메라 DNA 게놈은 활성 바이러스 RNA를 생성하고, 이는 HeLa S10 세포 추출물 중 인큐베이션할 때(문헌 [Molla et al., 1991]), 또는 HeLa 세포 내로 형질감염시킬 때, 바이러스 입자를 생성시킨다. 대안적으로, DNA 작제물을 세포질 내 T7 RNA 중합효소를 발현하는 HeLa 세포 내로 직접 형질감염시키는 것도 가능하다.
이어서, 96웰 포맷으로 바이러스-유도 CPE를 평가하기 위한 세포의 시각적 조사; ELISA를 이용한 바이러스 생성의 평가; 일련의 96웰 플레이트에서 세포 내로 접종된 동등량의 바이러스 입자의 증식 동역학 특성의 정량적 측정; 및 특이적 감염력(감염성 단위/입자 [IU/P] 비)의 측정을 포함한, 각종 비교적 고효율인 검정법들을 이용하여, 각 키메라 바이러스의 기능성을 검정한다.
이어서, 각 키메라 바이러스의 기능성을 검정할 수 있다. 다수의 비교적 고효율인 검정법들이 이용 가능하다. 첫 번째 검정법은 96웰 포맷에서 바이러스-유도 CPE(세포 사멸)을 찾기 위해 현미경을 이용하여 세포를 시각적으로 조사하는 것일 수 있다. 이는 바이탈 염료를 이용하여 자동화 96웰 검정법으로 수행될 수 있으나, CPE를 위한 96웰 플레이트의 시각적 조사가 1시간 미만의 실체험(hands-on) 시간을 요하며, 이는 대부분의 목적들에 있어 충분히 빠른 시간이다.
두 번째로, 형질감염한지 3 내지 4일 후, 실시예 3에 기재된 ELISA 방법을 이용하여 바이러스 생성을 검정할 수 있다. 대안적으로, 캡시드 특이적 항체와 함께 ELISA를 이용하여 입자 역가를 측정한다. 이 검정으로, 비생존성 작제물(바이러스 입자가 없음)을 확인할 수 있고, 작제물(소수 입자)을 불량하게 복제할 수 있으며, 작제물(다수 입자)을 효율적으로 복제할 수 있으며, 이들의 영향을 정량할 수 있다.
세 번째로, 더욱 정량적인 측정을 위해, 상기 결정된 동등량의 바이러스 입자를 일련의 프레쉬 96웰 플레이트에 접종하여, 증식 동역학 특성을 측정한다. 각종 시점들(감염한지 0, 2, 4, 6, 8, 12, 24, 48, 72시간 후)에서, 1개의 96웰 플레이트를 제거하여, 냉동-해동 사이클에 적용하여, 세포 결합 바이러스를 유리시킨다. 각 시점에서 각 작제물로부터 생성된 바이러스 입자의 수를 상기와 같은 ELISA에 의해 결정한다.
네 번째로, IU/P 비를 측정할 수 있다(실시예 3 참조).
고해상도 스캔
바이러스의 치명성은 예비 데이터가 가리키는 바와 같이, 캡시드 영역을 통해 퍼져 있는 많은 결손으로 인한 것인 경우, 키메라의 다수 또는 대부분이 병약하고, 단지 소수만이 비생존성이다. 이것이 사실인 경우, 보다 고도의 해상력을 갖는 스캔이 아마 필요하지 않을 것이다. 이와 역으로, (이하 기재된 바와 같이 본 분절의 강한 표현형에 기여하는 번역 틀이동 신호를 가질 수 있는, 1513 내지 2470의 분절에서의 코돈 역최적화 바이러스에서 가능한 바와 같은) 300개의 bp 분절들 중 하나 이상이 치사성을 유발하는 경우, 게놈 스캔을 고해상도로 반복하는데, 예를 들어 30 bp 창을 300 bp 분절 상에서 작제물들 간에 10 bp로 이동한 후, 표현형 분석을 행한다. 30 bp 스캔은 돌연변이체 바이러스의 PCR을 수반하지 않고; 그 대신, wt 바이러스의 경우 변경된 30 bp 분절을 PCR 프라이머 내에 들어가도록 설계한다. 이는 치사성의 원인이 되는 변화를 정확히 나타내도록 한다.
실시예 12
SAVE의 근거가 되는 분자 기전에 대한 진행 중의 연구
키메라의 선택
각각의 모 비생존성 바이러스(즉, 4 내지 8개의 총 바이러스)로부터 2 내지 4개의 예시 키메라를 하기 실험들에 사용한다. 돌연변이체 DNA의 비교적 작은 분절을 가지나 강한 표현형을 가지는 생존성 키메라를 선택한다. 예를 들어, 역최적화 코돈 바이러스로부터의 바이러스 PV-AB755-1513, PVAB2470-2954 및 PV-AB2954-3386(실시예 1 참조), 및 PV-Min755-2470 및 PV-Min2470-3386(실시예 7 참조)이 적당하다. 분석을 더욱 용이하게 만들 보다 작은 삽입물과 함께, 더욱 양호한 출발 키메라가 또한 상기 기재된 실험으로부터 수득될 수 있다(실시예 8).
RNA 풍부성/안정성
변경된 게놈 서열이 바이러스 RNA를 탈안정화하는 것도 생각해 볼 수 있다. 그러한 탈안정화는 신규 서열의 직접적 영향이거나, 번역 중 휴지 또는 번역 중 다른 결손의 간접적 영향일 수 있다(예를 들어, 문헌 [Doma and Parker, 2006] 참조). 그러므로, 돌연변이체 바이러스 RNA의 풍부성을 조사한다. 키메라 돌연변이체 바이러스 및 wt 바이러스로부터의 동등량의 RNA를 혼합하여, HeLa 세포 내로 형질감염시킨다. 2, 4, 8, 및 12시간 후에 샘플을 취하여, 수백개의 뉴클레오티드 차이가 있어 용이하게 구분가능한 2개의 상이한 바이러스 RNA에 대해 노던 블로팅 또는 정량적 PCR을 행함으로써 분석한다. PV-SD(wt 표현형을 가지는 코돈-셔플링된 바이러스) 대비, wt 바이러스 RNA로의 조절도 또한 행한다. wt 바이러스 RNA에 대한 돌연변이체의 감소된 비는, 키메라가 탈안정화된 RNA를 가진다는 것을 가리킨다.
시험관내 번역
번역은 코돈 역최적화 바이러스 및 이의 유도체들 중 일부에 있어서 감소되는 것으로 나타났다. 실시예 5를 참조한다. 코돈 쌍-역최적화 바이러스(PV-Min) 및 그것의 선택된 키메라를 이용하여, 시험관내 번역 실험을 반복한다. 역최적화 코돈 쌍이 바이러스 비생존성을 초래하는 이유에 대한 적절한 이론도 없고, 어떠한 증거도 매우 적기 때문에, 번역에 대한 영향에 관한 조사가 이의 기저를 이루는 기전을 조명하는데 도움이 될 수 있다.
실시예 5에서의 2종의 추출물에서 시험관내 번역을 수행하였다. 하나는 "숩업(souped up)" 추출물이었는데(문헌 [Molla et al., 1991]), 여기에서는 심지어 코돈 역최적화 바이러스도 명백히 양호한 번역을 제공하였다. 다른 하나는 정상적 생체내 조건에 더욱 근접한 추출물인데, 여기에서 역최적화-코돈 바이러스가 비효율적으로 번역되었다. 추출물들 간에는 4가지 차이가 있었는데: 이는, 더욱 "네이티브(native)"한 추출물을 투석하지 않았고; 내인성 세포 mRNA를 포도상구균 뉴클레아제로 파괴하지 않았으며; 추출물을 외인성 아미노산으로 보충하지 않았고; 추출물을 외인성 tRNA로 보충하지 않았다는 것이다. 본 연구에서, 이러한 4가지 파라미터들을 동시에(또는 필요에 따라서는 쌍으로) 변경하여, 무엇이 번역에 가장 유의적인 영향을 미치는지를 찾는다. 예를 들어, 코돈 역최적화 바이러스의 번역을 허용하는 것이 아미노산 및 tRNA의 첨가라는 발견사실은, 단순히 희소 아미노아실-tRNA이 제한적이기 때문에 번역이 비효율적이라는 가설을 강하게 지지한다. 그러한 발견사실은, 다른 종류의 바이러스들에까지 SAVE 방법을 확장시킨다는 관점으로 볼 때 중요하다.
번역 틀이동
또 다른 가능한 결손은, 코돈 변화가 번역 틀이동을 추진할 수 있다는 것; 즉 일부 코돈 쌍에서, 리보솜이 상이한 해독틀 내로 이동한 후, 의사적 펩티드 서열을 번역한 후에 인-프레임 정지 코돈에 도달할 수 있다는 것이다. 이 유형의 틀이동은 일부 바이러스에서 중요한 조절 이벤트이다. 현 데이터는, 잔기 1513 내지 2470로부터의 AB 돌연변이체 분절을 가지는 모든 PV 게놈이 비생존성이라는 것을 밝혀낸다. 또한, 이 돌연변이체 영역을 가지는 모든 게놈은 대략 42-44 kDa의 시험관내 번역 중에 신규 단백질 밴드를 생성시킨다(도 5A 참조, 별표로 표시됨). 이 신규 단백질은 틀이동의 결과일 수 있다.
1513-2470 간격의 서열 조사는, 진핵생물에서의 -1 틀이동에 대한 불안정한(slippery) 7량체성 일치 서열(X-XXY-YYZ)에 순응하는 3개의 가능한 후보 부위를 밝혀낸다(문헌 [Farabaugh, 1996]). 이 부위는 위치 1885 및 1948에서는 A-AAA-AAT이고, 위치 2119에서는 T-TTA-TTT이다. 그 후, 각기 1929, 1986 또는 2149에서 -1 프레임에 정지 코돈이 이어진다. 전자 2가지는 관찰된 크기의 밴드를 생성하기 위해 더욱 가능성있는 후보물질인 것으로 보인다.
틀이동이 일어나고 있는지의 여부를 결정하기 위해, 각각의 3개의 후보 영역은 분리하여 돌연변이되어, 틀이동을 위해 바람직하지 않게 된다. 또한, 각각의 후보 정지 코돈은 센스 코돈으로 분리하여 돌연변이된다. 이 6개의 새 점 돌연변이체를 시험관내 번역에 의해 시험한다. 틀이동 부위의 바람직하지 못한 서열로의 돌연변이 시, 신규 42-44 kDa 단백질의 손실, 및 정지 코돈의 제거 시의 단백질 밴드의 분자량 증가는, 틀이동이 일어나고 있음을 가리킨다. 틀이동이 이상 번역 산물의 원인인 경우, 틀이동 부위가 결핍된 새 돌연변이체의 생존성을 1513 내지 2470 돌연변이체 분절의 부문에서 시험한다. 명백히, 그러한 발견사실은 향후 게놈 설계를 위해 중요할 것이며, 필요하다면, 틀이동 필터가 잠재적 틀이동 부위를 피하기 위해 소프트웨어 알고리즘에 도입될 수 있다.
융합 단백질의 폴리솜 프로파일링, 토우프린팅, 및 루시퍼라제 검정법을 포함하나 이에 국한되지 않는 각종 기법들을 이용하여, 번역 결손의 보다 상세한 조사를 수행한다.
폴리솜 프로파일링
폴리솜 프로파일링은 한 전통적 번역 조사 방법이다. 그것은 고효율은 아니나, 매우 잘 개발되어 있고 이해되어져 있다. 폴리솜 프로파일링을 위해, (시클로헥시미드로) 번역을 정지시키고 자체의 개별 mRNA를 번역하는 작용 중에 있는 리보솜 집합("폴리솜")을 보존하는 방식으로, 세포 추출물을 제조한다. 이 폴리솜을 수크로스 구배로 분획화하고, 이로써 보다 다수의 리보솜이 결합된 메시지가 바닥쪽으로 침강한다. 구배의 분획화, 및 UV 흡수를 이용한 RNA 함량의 분석 후에, 연속되는 흡수 피크가 N+1 리보솜을 갖는 mRNA에 상응하는 폴리솜 프로파일이 나타나고; 전형적으로 피크가 흐려지기 전에, 10 내지 15개의 구분된 피크(단일 mRNA 상에서의 4OS 리보솜 서브유닛, 60S 서브유닛, 및 1, 2, 3, ... 12, 13 리보솜을 나타냄)가 식별될 수 있다. 이어서, 수크로스 구배로부터의 각종 분획들을 겔에 적용하여 막까지 블로팅하고, 특정 mRNA에 대해 노던 분석으로 분석한다. 이어서, 이는 그 특정 mRNA가 가령 10 내지 15개 리보솜(잘 번역됨), 또는 1 내지 4개 리보솜(불량하게 번역됨)과 일차적으로 결착되는지의 여부를 보여준다.
본 연구에서, 예를 들어 wt 바이러스, PV-AB(코돈 역최적화) 바이러스, 및 그것의 유도체 PV-AB755-1513, 및 PV-AB2954-3386(이들은 각기 일차적으로 N-말단 또는 C-말단 역최적화 분절을 가짐)을 비교한다. N-말단 및 C-말단 돌연변이체 분절 간의 비교는 특히 유의적이다. 코돈 역최적화가 번역을 감속시키거나 휴지시키면, N-말단 돌연변이체 RNA가 비교적 소수인 리보솜과 결합한다(이는 리보솜이 N-말단 영역을 통해 매우 천천히 이동하여 다른 리보솜이 로딩되는 것을 막고, 이어서 역최적화 영역을 횡단한 후, 메시지의 나머지를 통해 진전하기 때문임). 이와 대조적으로, C-말단 돌연변이체 RNA는 비교적 많은 수의 리보솜과 결합하는데, 이는 많은 리보솜들이 로딩할 수 있기 때문이나, 이들은 C-말단 부근에서 방해를 받기 때문에(hindered), 전사체를 이탈시킬 수 없고 결합된 리보솜의 수가 크다.
폴리솜 분석은, 얼마나 많은 리보솜들이 상이한 종류의 돌연변이체 RNA와 활발히 결합하는지를 나타내고, 예를 들어 번역이 저속으로 일어나는 모델과 리보솜이 실제로 RNA를 조기에 이탈시키는 모델을 구별할 수 있다. 다른 종의 모델들도 시험할 수 있다.
토우프린팅
토우프린팅은 리보솜이 느리고 휴지하는 mRNA 상의 위치를 확인하는 기법이다. 폴리솜 프로파일링에서와 같이, 활발히 번역하는 mRNA가 수득되고, 이때 이들의 리보솜은 시클로헥시미드로 고정되나 여전히 결합되어 있고; mRNA는 종종 시험관내 번역 반응으로부터 수득된다. mRNA의 일부 비교적 3'인 부분에 상보적인 DNA 올리고뉴클레오티드 프라이머를 사용한 후, 역전사효소에 의해 연장시킨다. 역전사효소는 그것이 리보솜과 충돌할 때까지 연장된다. 따라서, 번역 mRNA 분자의 집단은 프라이머의 부위에서 최근방 리보솜으로 연장하는 DNA 단편의 집단이다. 리보솜이 휴지하는 경향이 있는 부위 또는 영역(가령, 프라이머로부터의 200개 염기)이 있는 경우, 이 부위 또는 영역은 불균형 수의 DNA 단편들(이 경우, 200개 염기 길이의 단편)을 제공할 것이다. 이어서, 이는 고해상도 겔 상에서 "토우프린트"(밴드 또는 어두운 부위)로 나타난다. 이는 mRNA 상에서 (수개 뉴클로에티드 내로) 리보솜 휴지 부위를 매핑하기 위한 표준 방법이다.
역최적화 코돈 또는 코돈 쌍의 분절을 갖는 키메라로서, 상이한 키메라들에서 분절이 약간 5' 또는 3'로 이동하는 키메라를 분석한다. 역최적화 분절이 리보솜이 저속이거나 휴지되도록 유발하는 경우, 토우프린트는 5' 또는 3' 이동하여, 역최적화 분절의 위치에 매칭된다. 대조군에는 wt 바이러스 RNA 및 수가지 (무해하게) 셔플링된 바이러스 RNA가 포함된다. 대조군에는 또한 역전사 시에 신규 서열의 리보솜과 무관한 영향을 배제하기 위한 순수 돌연변이체 바이러스 RNA(즉, 번역에 결부되지 않음)가 포함된다.
토우프린트 검정법은 2가지 이상의 이점을 가진다. 첫 째로, 그것은 휴지 리보솜에 대한 직접적 증거를 제공할 수 있다. 두 번째로, 그것은 수개의 뉴클레오티드 분리를 행하여, 정확히 어떠한 역최적화 코돈 또는 역최적화 코돈 쌍이 휴지를 유발하고 있는지를 확인할 수 있다. 즉, 이는 역최적화 코돈 또는 코돈 쌍 중 소수만이 대부분의 그러한 효과에 원인이 될 수 있고, 토우프린팅이 그것을 나타낼 수 있다.
융합 단백질의 이중 루스퍼라제 리포터 검정법
상기 실험은, 일부 코돈 또는 코돈 쌍이 번역에 특히 유해하다는 것을 제시할 수 있다. 번역에 대한 특정 코돈 및 코돈 쌍의 영향을 분석하기 위한 고효율 방식으로서, 작은 시험 펩티드를 설계하여 바다팬지 루시퍼라제의 N-말단에 융합시킨다. 이어서, 루스퍼라제 활성을 펩티드의 번역능의 검정으로서 측정한다. 즉, N-말단 펩티드가 불량하게 번역되면, 적은 루시퍼라제가 생성될 것이다.
일련의 8개 25량체 펩티드를 상기 실험들에 기초하여 설계한다. 관심 희소 코돈 및/또는 희소 코돈 쌍의 각종 순열을 이용하여, 각각의 8개 25량체를 12가지 상이한 방식으로 코딩한다. 어셈블리 PCR을 이용하여, 이 96개 작제물(8개의 25량체×12 코딩)을, 상기 기재된 디시스트론성 이중 루시퍼라제 벡터에서 반딧불 루시퍼라제(F-luc)의 N-말단에 융합한다(실시예 5 및 도 6 참조). 이중 루시퍼라제 시스템은 반딧불 루시퍼라제(F-Luc) 및 바다팬지(레닐라) 루시퍼라제(R-Luc)를 모두 이용하고; 이는 상이한 생화학 조건 하에서 발광하고, 이에 따라 단일 관 또는 웰로부터 분리하여 검정될 수 있다. 디시스트론성 리포터는 단일 mRNA로 발현되나, 대조군 루시퍼라제(R-Luc)는 한 내부 리보솜 부착 부위(IRES)로부터 번역되는 한편, 실험 루시퍼라제(F-luc)(N-말단에 융합된 시험 펩티드를 가짐)는 그 자체의 IRES로부터 독립적으로 번역된다. 따라서, R-Luc 활성에 대한 F-Luc 활성의 비는 시험 펩티드의 번역능을 가리킨다. 도 6을 참조한다.
생성되는 96개의 디시스트론성 리포터 작제물을, PCR 반응으로부터 HEK293 또는 HeLa 세포의 96웰에 직접적으로 형질감염시킨다. 업스트림 시스트론의 반딧불 루시퍼라제는 내부 형질감염 대조군으로 작용한다. 두 번째 시스트론에서 바다팬지 루시퍼라제의 코돈- 또는 코돈 쌍 의존적 발현을, R-Luc와 F-Luc 간의 비로서 정확히 결정할 수 있다. 이 검정법은 본래 고효율이고, 필요에 따라서는 수백개 또는 심지어는 수천개 시험 서열을 검정할 수 있다.
실시예 13
신규한 대안적 코돈 기법을 이용한 약독화 바이러스의 설계 및 합성
백신 생성을 위해 바이러스를 재조작하기 위한 SAVE 방법은, 바이러스 단백질의 번역을 감소시키기 위해 대규모 동의 코돈 치환에 의존한다. 이는, 코돈 및 코돈 쌍 편향, 및 RNA 2차 구조 및 CpG 함량과 같은 다른 파라미터를 적절히 조절함으로써 수행될 수 있다. 4가지 신규 PV 설계들 중, 2가지(셔플링된 코돈 바이러스, PV-SD, 및 우선적 코돈 쌍 바이러스, PV-Max)는 wt 바이러스에 비해 적은 표현형 변화를 초래한다. 다른 2가지 신규 설계(PV-AB 및 PV-Min)는 2가지 상이한 기전(각각 코돈 편향 및 코돈 쌍 편향의 급격한 변화)을 통해 단지 동의 치환을 이용하여 바이러스를 사멸시키는 데 성공하였다. 불활성화된 바이러스 균주로부터의 영역을 wt에 서브클로닝함으로써, 살아있으나 약독화된 균주를 작제하였다.
대규모 동의 치환을 이용하는 바이러스 약독화의 기저 기전을 보다 잘 이해하면, 합성 바이러스의 표현형 및 발현 수준을 용이하게 예측할 수 있다. 진행 중인 연구는 번역 효율에 대한 총 변경 수 또는 변경 밀도의 영향; 코돈 및 코돈 쌍 편향의 상호작용; 및 게놈 내로 다수의 좁은 범위의 RNA 2차 구조를 조작하여 넣는 효과와 관련된 문제를 해소한다. wt와 불활성화된 균주 사이의 연속성이 있고, 임의의 요망되는 약독화 수준이 약화된 균주 내로 조작되어 들어갈 수 있음이 가능하다. 그러나, 임의의 감염이 자기지체되고 이에 따라 검출될 수 있도록 하는, 달성 가능한 약독화 수준에는 엄한 한계가 있을 수 있다. PV 단백질의 15442개 코딩은 탐색하고자 하는 큰 서열 공간을 구성하고, 이 서열 공간을 더욱 계통적으로 탐색하기 위해 각종 방법들이 이용되고 있다. 이 방법들에는 첫 번째로, 신규 약독화 바이러스의 설계를 돕는 소프트웨어 플랫폼을 개발하는 것, 및 두 번째로는 이 소프트웨어를 이용하여, 더 많은 서열 공간을 탐색하는 다수의 신규 바이러스를 설계한 후, 합성하고, 특성 분석하며. 어떻게 대안적 코딩이 약독화를 유발하는지에 대한 특정 질의에 답을 구하는 것이 포함된다. 부가적으로, 고려해야 할 중요 관건은, 동의 코돈의 명백히 유해한 셔플링에 의해 위험한 바이러스가 우연히 발생될 수 있는지의 여부이다.
바이러스 게놈의 컴퓨터 기반 설계를 위한 소프트웨어의 개발 및 데이터 분석
합성 바이러스의 설계는 (1) 코돈 및 코돈 쌍 사용빈도를 최적화하고, 서열 특이적 서열을 보존, 삽입 또는 제거하면서 RNA 2차 구조를 모니터링하는 것, 또한 (2) 서열을 올리고뉴클레오티드 내로 분획화하여, 정확한 서열 어셈블리를 확보하는 것을 목적으로 하는 실질적 소프트웨어 지지를 필요로 한다. 원형 합성 게놈 설계 소프트웨어 툴은 합성 게놈 설계를 위해 전체 환경으로 확장되고 있다. 이 확장된 소프트웨어에서, 유전자 에디터가 서열 대신에 제약 주위에 구성되는 것으로 생각해 볼 수 있다. 유전자 설계자는 요망되는 유전자(예를 들어, 아미노산 서열, 코돈/코돈 쌍 분포, 제한효소 부위의 분포, 및 RNA 2차 구조 제약)의 특성을 구체화하는 수준으로 작업하고, 유전자 에디터는 이 제약을 실현하는 DNA를 알고리즘 방식으로 설계한다. 아미노산 서열, 코돈 편향, 코돈 쌍 편향, CG 디뉴클레오티드 함량, RNA 2차 구조, 시스 작용성 핵산 신호, 예컨대 CRE, 스플라이스 부위, 폴리아데닐화 부위, 및 제한효소 효소 인식 부위를 포함하나 이에 국한되지 않는, 종종 서로 상호작용하는, 많은 제약들이 있다. 유전자 설계자는 이 제약들의 존재를 인식하고, 모든 제약을 예비구체화 수준으로 자동적으로 만족하면서 요망되는 특성을 갖는 유전자를 설계한다.
패턴, 2차 구조, 중첩 코딩 틀을 삽입/제거하고, 코돈/코돈 쌍 분포에 부착하기 위해 이전에 개발된 합성 알고리즘이 에디터의 일부로 실행되나, 더욱 중요한 것은 그러한 우선사항들의 이종적 조합을 실현하는 알고리즘이다. 그러한 조합이 연산적으로 처치곤란한(NP-완전) 문제를 초래하기 때문에, 발견법적인 최적화가 필수적으로 에디터에서 중요한 역할을 한다. 그러한 설계를 실현하기 위해 모의 어닐링 기법이 이용되고; 이는 모의 어닐링이 초기 VLSI 설계 툴에서 최초로 실용화를 달성한 바, 특히 적절하다.
통합 특성(full-featured) 유전자 설계 프로그래핑 환경은, 리눅스(Linux), 윈도우(Windows) 및 맥(Mac) OS에서 수행 시, 플랫폼에 의존하지 않는다. 시스템은 세균 또는 진균류(효모) 규모에서 게놈과 함께 작용하도록 설계되고, 이하 기재되는 신규 약독화 바이러스 설계의 합성 및 평가를 통해 입증된다.
1개 또는 수개의 아미노산에서의 극한 코돈 편향을 갖는 바이러스 설계
생백신의 경우, 바이러스는 불활성화가 부족하여, 가능한 한 쇠약화되어야 하고, 이 경우에 바이러스를 증식시키고 제조할 방법이 없다. 최적의 쇠약화를 달성하는 한 방식은, 단지 1개 또는 수개의 아미노산의 치환을 조작하는 것과, 상기 희소 코돈에 결합하는 희소 tRNA를 과다발현하는 상응 세포주를 발생시키는 것이다. 이에, 바이러스는 특수 침해성(permissive) 세포주에서 효율적으로 증식할 수 있으나, 정상 숙주 세포주에서는 비생존성이다. 바이러스는 침해성 세포주를 이용하여 증식시키고 제조되는데, 이는 매우 편리할 뿐만 아니라 약독화 생백신의 제조를 위해 현재 사용되는 방법보다 더 안전하다.
인간 게놈을 시퀀싱하면서, 희소 코돈을 해독하는 각종 tRNA 유전자의 카피수에 관한 정보가 입수가능하다. 문헌(예를 들어, 문헌 [Lavner and Kotlar, 2005])에 기초하여, 본 목적을 위해 최량인 희소 코돈은 단지 2 카피의 동족 tRNA 유전자를 가지는 극희소 코돈인 CTA(Leu); 4 카피의 동족 tRNA 유전자를 가지는 희소 코돈인 TCG(Ser); 및 4 카피의 동족 tRNA 유전자를 가지는 희소 코돈인 CCG(Pro)이다(문헌 [Lavner and Kotlar, 2005]). 특정 유형의 tRNA 유전자의 평균 카피 수는 9이고, 한편 범위는 2 내지 33개 카피이다(문헌 [Lavner and Kotlar, 2005]). 따라서, CTA 코돈은 단지 희소 코돈이 아니고, 이는 또한 가장 적은 수의 동족 tRNA 유전자를 갖는 그러한 코돈이다. 이 코돈은 어떠한 다른 tRNA에 의해서도 해독되지 않고; 예를 들어, 이는 워블 염기 쌍형성을 통해 해독되지 않는다.
Leu(180개 코돈), Ser(153개 코돈), 및 Pro(119개 코돈)을 코딩하는 바이러스 게놈 전반에 걸친 모든 코돈을 각기 희소 동의 코돈 CTA, TCG, 또는 CCG로 바꿀 경우, 심하게 쇠약화되거나 심지어 비생존성인 바이러스가 생성될 것으로 예상된다. 이어서, 상응하는 희소 tRNA를 과다발현하는 헬퍼 세포가 생성될 수 있다. 상응하는 바이러스는 이 인공 배양 시스템에서만 증식하는 것에 절대적으로 의존하고, 이에 백신 생성을 위한 바이러스를 생성함에 있어 최고의 안전성을 제공한다.
4가지 고우선순위(high-priority) 바이러스가 설계되고 합성되는데, 단일 바이러스에서, 모든 Leu 코돈은 CTA로 바뀌고; 모든 Ser 코돈은 TCG로 바뀌며; 모든 Pro 코돈은 CCG로 바뀌고; 모든 Leu, Ser 및 Pro 코돈은 각기 CTA, TCG 및 CCG로 바뀐다. 한 실시양태에서, 이 치환들은 바이러스의 캡시드 영역에서만 이루어지고, 이때 높은 번역 속도가 가장 중요하다. 또 다른 실시양태에서, 치환은 바이러스 전반에 걸쳐 이루어진다.
CG 디뉴클레오티드 편향 바이러스
예외가 거의 없이, 바이러스 게놈은 디뉴클레오티드 CpG를 과소표시하나, GpC에 대해서는 그러하지 않다(문헌 [Karlin et al., 1994]). 이 현상은 게놈의 전체 G+C 함량과 무관하다. CpG는 통상 인간 게놈에서 메틸화되어, 세균 및 DNA 바이러스에 종종 존재하는, 비메틸화 CpG 디뉴클레오티드를 포함하는 단일 가닥의 DNA는 톨(Toll)유사 수용체 9에 의해 병원체 기호로 인식되게 된다. 이는 선천적 면역계의 활성화를 초래한다. 유사한 시스템이 RNA 바이러스에 대해 작용하는 것으로 나타나지 않았으나, PV 게놈의 조사는, PV가 인간에서의 CpG 디뉴클레오티드의 유의적 과소표시보다 더욱 더 큰 정도로 CpG를 함유하는 동의 코돈에 대항하여 선택하였음을 제시한다. 이는 특히 아르기닌 코돈에 대해 현저하다. 6개의 동의 Arg 코돈들 중, 4개의 CG 함유 코돈(CGA, CGC CGG, CCU)이 모든 96 Arg 코돈들 중 단지 24개에만 해당되고, 한편 나머지 2가지(AGA, AGG)는 72개에 해당된다. 이는 65개의 CG 함유 코돈 및 31개의 AGA/AGO 코돈을 예측하는 평균 인간 코돈 사용빈도와 대조적이다. 실제로, PV에서 과소표시되는 코돈 중 2개가 인간 세포에 빈번하게 사용된다(CGC, CGG). CG가 PV에서 불리한 디뉴클레오티드일 수 있음을 나타내는 2가지 다른 암시도 있다. 첫 번째로, 코돈 쌍-역최적화 바이러스에서, 도입된 희소 코돈 쌍들 중 상당수가 코돈 쌍 헥사머의 중심 디뉴클레오티드로서 CG를 포함한다. 두 번째로, [Burns et al. (2006)]가 그들의 코돈 편향-역최적화 바이러스를 계대배양하고 게놈을 시퀀싱했을 때, 이 바이러스들이 일부 CG 디뉴클레오티드를 제거하도록 진화하였다는 것이 관찰되었다.
따라서, 한 고순위 재설계된 바이러스에서, 대부분 또는 모든 Arg 코돈들이 CGC 또는 CGG(2개의 빈번한 인간 코돈)로 바뀌었다. 이는 번역에 부정적 영향을 주지 않고, 바이러스 증식에 대한 CpG 디뉴클레오티드 편향의 영향을 평가할 수 있도록 한다. 생성되는 바이러스의 증가된 C+G 함량은 2차 구조의 주의깊은 모니터링을 요하는데; 즉, Arg 코돈의 변화가 현저한 2차 구조의 생성을 허용하지 않는다.
코돈 편향 및 코돈 쌍 편향의 동시 조절.
코돈 편향 및 코돈 쌍 편향은 번역 수준에서 서로 상호작용할 수 있을 것으로 생각해 볼 수 있다. 이 상호작용을 이해하면, 가능히 극한 범위에 걸쳐, 임의의 주어진 단백질의 번역능을 예측 가능하게 조절할 수 있을 것이다.
본 발명자들이 야생형 소아마비 코돈 편향 및 코돈 쌍 편향을 0으로 나타내고, 가장 좋지 않은 가능한 코돈 편향 및 코돈 쌍 편향을 -1로 나타낼 경우, 4개의 고순위 바이러스는 (-0.3, -0.3), (-0.3, -0.6), (-0.6, -0.3), 및 (-0.6, -0.6) 바이러스이다. 이 바이러스들은 어떻게 보통으로 불량하거나 매우 불량한 코돈 편향이 보통으로 불량하거나 매우 불량한 코돈 쌍 바이러스와 상호작용하는지를 보여줄 것이다. 이 바이러스는 야생형 및 극한 PV-AB(-1, 0) 및 PV-Min(0, -1) 설계와 비교된다.
RNA 2차 구조의 조절
상기 합성 설계는 과다 2차 구조로부터 보호한다. 2가지 부가적 설계는 2차 구조를 계통적으로 막는다. 이 바이러스들은, (1) 입증가능하게 최소인 2차 구조, 및 (2) 번역을 감속시키는 데 충분한 많은 작은 2차 구조를 갖는 wt 코돈 및 코돈 쌍 편향을 가지도록 조작된다.
부가적 바이러스 설계
부가적 바이러스 설계에는 완전-게놈 코돈 편향 및 코돈 쌍 편향 설계; 비CG 코돈 쌍 편향 설계; 감소된 밀도 희소 코돈 설계; 및 캡시드 영역에 걸쳐 퍼져있거나 캡시드의 N-말단에 군집화되거나 캡시드의 C-말단에 군집화된 약 150개 희소 코돈을 갖는 바이러스가 포함된다.
실시예 14
독성이 증가된 바이러스를 우연히 생성할 수 있는 가능성에 대한 시험
이 바이러스를 약독화할 목적으로 바이러스 게놈을 재설계하는 것이 우연히 바이러스를 wt 바이러스보다 더 독성으로 만들 수 있음이 이론적으로 가능하다. 단백질 서열이 SAVE 절차에서 변경되지 않기 때문에, 이러한 성과는 있음직하지 않다. 그럼에도 불구하고, SAVE 방법이 포지티브하다는 것을 실험적으로 입증하는 것이 바람직하다.
PV 단백질을 가능히 코딩할 수 있는 가능한 10442개 서열들 중, 일부 합당히 적합한 양태의 PV는 과거에는 일부 지점에서 발생하여, 국부 최적점(전역 최적점과 반대됨)까지 진화되었다. 동일한 단백질 코딩 용량을 가지나 매우 상이한 코돈 집합을 가지는 새 양태의 PV를 생성시킴은, 상기 새 바이러스를 wt PV와 상이한 국부 최적점에 근접한 것으로 생각해 볼 수 있는, 전역 적응도 범위 상에의 상이한 위치에 둔다. 구상가능하게는, 이 새 국부 최적점은 야생형 국부 최적점보다 양호할 수 있다. 따라서, 동의 코돈의 셔플링이 보다 적합한 바이러스를 발생시킬 수 있음은 거의 가능하지 않다.
이 가능성을 조사하기 위해, 13개 PV 게놈을 재설계하고 합성하였는데: 한 바이러스는 최량의 가능한 코돈 편향을 가지고; 한 바이러스는 최량의 가능한 코돈 쌍 편향을 가지며(즉, PV-Max); 한 바이러스는 최량의 가능한 코돈 및 코돈 쌍 편향을 가지고; 10개의 부가적 바이러스는 wt 코돈 및 코돈 쌍 편향을 가지나 셔플링된 동의 코돈을 가지는 것이다. 2차 구조, C+G 함량, 및 CG 디뉴클레오티드 함량과 같은 다른 파라미터들이 가능한 wt 수준에 근접하게 유지된다.
이 13개 바이러스는 각기 서로에 비해, 또한 야생형에 비해, 전역 적응도 범위의 매우 상이한 위치에 있을 수 있다. 그러나, 이들 중 어느 것도 선택을 받지 않았으므로 국부 최적점에 있지 않다. 13개 바이러스 및 wt를 계대배양하고, 샘플 바이러스를 1, 10, 20, 및 50번째 계대배양에서 취한다. 이들의 적응도를, 플라크 크기, 1단계 증식 곡선에서의 플라크-형성 단위/ml, 및 세포당 형성되는 입자 수를 평가함으로써, 서로 간에 또한 wt와 비교한다. 실시예 1을 참조한다. 각각의 13개 바이러스 중 5개의 예를 10, 20 및 50 계대배양 후에 시퀀싱한다. 선택 계대배양 단리주를 CD155tg 마우스에서 병원성에 대해 시험하고, LD50을 결정한다. 이 검정법은, 바이러스 중 임의의 것이 wt보다 적합한지의 여부를 밝혀내고, 특히 독성인 바이러스가 우연히 생성되는 위험을 정량적으로 측정하도록 한다. wt 수준의 코돈 및 코돈 쌍 편향을 가지는 10개 바이러스가 또한 코딩 수준에서의 적응도 범위의 가변성에 대한 정보를 제공한다.
보다 적합한 바이러스가 출현할 수 있는 가능성 및 보다 적합한 바이러스가 더 위험한 바이러스가 될 수 있는 가능성의 측면에서, 상기 실험들을 BSL3 실험실에서 행한다. 10번째 계대배양 후, 표현형 및 서열을 평가하고, 출현 바이러스가 PV 특이적 항체에 의해 중화되는 것에 대한 감수성을 입증한다. 실험을 중단하고, 유의적으로 보다 적합한 바이러스로의 진화를 가리키거나 항체 중화를 회피하는 새 단백질 서열로의 계통적 진화를 나타내는 임의의 증가가 수득되는지의 여부를 다시 고려한다. 계대배양 20 후, 계대배양 50로 진행하기 전에, 표현형 및 서열을 유사하게 평가한다. wt 바이러스와 정확히 동일한 단백질을 코딩하는 합성 바이러스가 생성되기 때문에, (약간) 증가된 적합도로의 진화가 관찰되지라도, 증가된 독성에 대한 범주가 매우 제한적인 것으로 보인다.
실시예 15
폴리오바이러스 이외의 바이러스 시스템으로의
SAVE
방법의 확장
소아마비 근절을 위한 세계적 노력의 마지막 단계에서 복귀 가능성을 막기 위한 새 소아마비 백신에 대한 가능한 필요성에도 불구하고, PV는 SAVE를 개발하기 위한 모델 시스템으로서 일차적으로 본 연구에서 선택되었다. 그러나, SAVE는, 이 방법이 백신이 필요한 다른 바이러스에까지 확장될 수 있다는 기대로 개발되었다. 이러한 SAVE 기법의 확장은 본원에서 리노바이러스, 일반 감기의 원인 작용제, 및 인플루엔자 바이러스로의 적용에 의해 예시된다.
폴리오바이러스와 밀접한 관련이 있는 바이러스인 인간 리노바이러스에 대한 SAVE의 적응화
수가지 이유에서 SAVE 방법을 시험하기 위해, 2개의 모델 리노바이러스인 HRV2 및 HRV14를 선택하였는데: 즉, 그 이유들은 (1) HRV2 및 HRV14는 2개의 상이한 유전적 하위군 A 및 B의 2개의 구성원을 나타내고(문헌 [Ledford et al., 2004]); (2) 이 2개의 모델 바이러스는 상이한 수용체인 LDL-수용체 및 ICAM-1을 각기 사용하며(문헌 [Greve et al., 1989]; 문헌 [Hofer et al., 1994]); 양 바이러스 모두 및 이들의 감염성 cDNA 클론을 광위적으로 사용하였고, 대부분의 적용 가능한 재료 및 방법이 확립되었으며(문헌 [Altmeyer et al., 1991]; 문헌 [Gerber et al., 2001]); (4) 리노바이러스의 상당한 이용 가능한 분자 정보가 이 두 혈청형의 연구로부터 비롯된다는 것이다.
PV 실험을 통해 개발된 가장 유망한 SAVE 기법을 HRV2 및 HRV14의 게놈에 적용한다. 예를 들어, 코돈, 코돈 쌍, 2차 구조 또는 이들의 조합이 역최적화된다. 각 유전형에 대해, 다양한 약독화 정도를 가지는 3개의 게놈들 중 2개를 합성한다. 약 60개 뉴클레오티드의 결정적 RNA 2차 구조인 CRE를 변경시키지 않도록 주의한다(문헌 [Gerber et al., 2001]; 문헌 [Goodfellow et al., 2000]; 문헌 [McKnight, 2003]). 이 요소는 피코나바이러스의 복제에 대해 중요하고, 이에 따라 그 구조 자체가 게놈 재설계 시에 유지되어야 한다. 게놈 내의 CRE의 위치는 상이한 피코나바이러스별로 다양하나, 대부분의 패밀리에 대해 알려져 있으며(문헌 [Gerber et al., 2001]; 문헌 [Goodfellow et al., 2000]; 문헌 [McKnight, 2003]), 실험적 증가가 결여되어 있는 다른 것들에 대한 상동성 모델링에 의해 추론될 수 있다. HRV2의 경우, CRE는 비구조 단백질 2Apro에 상응하는 RNA 서열 내에 위치하고; HRV14의 CRE는 VP1 캡시드 단백질 영역 내에 위치한다(문헌 [Gerber et al., 2001]; 문헌 [McKnight, 2003]).
DNA 게놈 등가물로부터 리노바이러스를 유도하기 위한 역유전학 시스템은 PV에 대해 사기 기재된 바와 본질적으로 동일하나, 단 예외적으로 바이러스 캡시드를 안정화하기 위해, 형질감염을 3 mM Mg++ 함유 헤페스 완충액 배지 중 34℃에서 HeLa-H1 세포에서 행한다. 생성되는 합성 바이러스를 조직 매질에서 검정하여, PFU/IU 비를 결정한다. 실시예 3를 참조한다. 플라크 크기 및 1단계 증식 곡선에서의 동역학 특성도 또한 상기 기재된 바대로 검정한다. 실시예 2를 참조한다. SAVE 과정이 모든 100개 또는 이와 관련된 리노바이러스에 비교적 저렴하게 적용될 수 있으므로, 이 방법을 이용하여 일반 감기를 위한 안전하고 효과적인 백신을 생성할 수 있을 것이다.
폴리오바이러스와 관련이 없는 바이러스인 인플루엔자 A 바이러스에 대한 SAVE의 적응화
PV 실험으로부터 확인된 가장 유망한 SAVE 설계 기준을 사용하여, 코돈 역최적화 양태의 인플루엔자 바이러스를 합성한다. 인플루엔자 바이러스는 8개의 분리된 RNA 분절들로 구성된 "분절화된" 바이러스이고; 이들 각각은 코돈 변형될 수 있다. 잘 확립된 앰비센스 플라스미드 역유전학 시스템을 사용하여, 인플루엔자 바이러스 균주 A/PR/8/34의 변이체를 생성시킨다. 이 8-플라스미드 시스템은 이전에 기재된 것의 변화이고(문헌 [Hoffmann et al., 2000]), [박사 P. Palese] 및 [박사 A. Garcia-S astre]에 의해 친절히 제공되었다. 간략히 말해, 분리된 플라스미드 내에 각기 함유된, 인플루엔자의 8개 게놈 분절은 안티센스 가닥에서는 3' 말단에 PoL I 프로모터가 접해 있고, 5' 말단에서는 Pol I 종결서열이 접해 있다. 이 카세트는 다시 전방 가닥에서는 5' 말단에 사이토메갈로바이러스 프로모터(Pol II 프로모터)가 접해 있고, 3' 말단에 폴리아데닐화 신호가 접해 있다(문헌 [Hoffmann et al., 2000]). 동시 배양된 293T 및 MDCK 세포 내로의 동시 형질감염 시에, 각 앰비센스 발현 카세트는 2 종류의 RNA 분자를 생성시킨다. 전방 가닥에서의 Pol II 전사 단위는, 바이러스 단백질의 단백질 합성에 필수적인 모든 인플루엔자 mRNA를 생성시킨다. 역방 가닥에서의 Pol I 전사 단위는 리보뉴클레오단백질 복합체의 어셈블리 및 이입에 필수적인 (-) 센스 게놈 RNA 분절을 생성시킨다. 따라서, 감염성 인플루엔자 A/PR/8/34 입자가 형성된다(도 10). H1N1 혈청형의 이 특정 균주는 인간에 대해 상대적으로 양성이다. 그것은 조직 배양 세포에서의 증식을 위해 적응되었고, 이는 BALB/c 마우스 내에서 병원성이므로, 병인 연구에 특히 유용하다.
택일적으로 스플라이싱되는 분절(NS 및 M)을 합성할 때, 스플라이스 부위 및 대체 해독틀을 파괴하지 않도록 주의한다. 모든 경우들에 있어서, 이 서열들이 RNA 복제 및 바이러스 어셈블리를 위한 신호를 포함하는 것으로 알려져 있는 바, 각 분절의 어느 한 말단에 있는 말단 120 nt는 제외한다. 적어도 두 양태의 각 단편을 합성한다(보통 및 최대 역최적화). 단지 하나의 분절만이 변형된 바이러스가 생성되고, 더욱 변형된 분절이 필요에 따라 도입된다. 이는, 각 분절이 분리된 플라스미드 상에 있기 때문에, 본 시스템에서 용이하다.
바이러스 감염력은 1 ㎍/ml(TPCK)-트립신의 존재 하에 MDCK 세포 상에서 플라크 검정법에 의해 역가 측정된다. 대안적으로, 상이한 바이러스 작제물의 수에 따라, 96웰 ELISA를 사용하여, 본질적으로 PV에 대해 상기 기재된 바와 같이, MDCK 세포 상의 세포 감염성 단위로서 각종 바이러스의 역가를 측정한다. 실시예 3을 참조한다. 유일한 차이는, 이제 HA 특이적 항체가 감염된 세포를 염색하는 데 사용된다는 것이다. 부가적으로, 표준 프로토콜(문헌 [Kendal et al., 1982])을 이용하여, 닭 적혈 세포(RBC)를 이용하는 응집(hemagglutination; HA) 검정법을 통해 비리온의 상대 농도를 측정한다(문헌 [Charles River Laboratories]). 간략히 말해, 바이러스 현탁액을 V-바닥 96웰 플레이트에서 PBS 중에 2배 일련 희석한다. PBS 단독을 검정 대조군으로 사용한다. 표준화된 양의 RBC를 각 웰에 첨가하고, 플레이트를 간략히 교반하며, 실온에서 30분 동안 인큐베이션한다. HA 역가를, 완전 응집과 함께 마지막 웰에서의 바이러스의 상호 희석으로 해독한다. HA 역가 존재하는 입자의 양의 직접적 결과인 반면, PFU 역가는 감염력의 기능적 측정값이다. 양 측정값을 결정함으로써, PV 실험에 기재된 PFU/입자 비와 유사하게, 상대적 PFU/HA 단위 비를 계산한다. 실시예 3을 참조한다. 이는, 코돈- 및 코돈 쌍-역최적화 인플루엔자 바이러스가 또한 PV에 대해 관찰되는 바와 같이, 더 낮은 PFU/입자를 나타내는지의 여부에 관한 질의를 해결한다.
독성 시험
먼저 마우스에 대해 모 NPR/8/34 바이러스의 치사 용량 50(LD50)을 결정하고, 비강내 감염에 의한 BALB/c 마우스의 감염을 위해 합성 인플루엔자 바이러스를 선택한다. LD50 값을 결정하는 방법은 당업자에게 공지되어 있다(문헌 [Reed and Muench, 1938], 및 실시예 4 참조). 이상적 후보 바이러스는 높은 비리온 농도(고HA 역가)와 함께 낮은 감염력(저 PFU 역가)를 나타낸다. 마취된 마우스에 102 내지 107 PFU의 바이러스의 10배 일련 희석액을 함유하는, PBS 중 25 ㎕의 바이러스 용액을 콧구멍으로 투여한다. 치사율 및 질병율(체중 감소, 감소된 활성)을 3주 이하 동안 매일 2회 모니터링한다. 문헌 [Reed and Muench (1938)]의 방법에 의해 LD50를 계산한다. A/PR/8/34 wt 바이러스에 대해, 예상 LD50는 약 10 PFU이나(문헌 [Talon et al., 2000]), 바이러스의 역가를 측정하는 특정 실험실 조건에 따라 다양할 수 있다.
뎅기열, HIV, 로타바이러스 및 SARS에 대한 SAVE의 적응화
SAVE 방법을 추가로 시험하기 위해, 수개의 바이러스를 선택하였다. 표 8은 각각의 뎅기열, HIV, 로타바이러스(2개 분절) 및 SARS의 코딩 영역을 규명하고, 모 바이러스에 대한 뉴클레오티드 서열 및 역최적화 코돈 쌍 편향을 갖는 예시적 바이러스 게놈 서열을 제공한다. 상기 기재된 바와 같이, 단지 일부분(부분서열)만이 역최적화 돌연변이를 포함할 수 있을지라도, 코딩 서열에 대해 코돈 쌍 편향을 결정한다.
* - CPB는 완전 코딩 서열보다 작은 내부 분절을 역최적화함으로써 감소될 수 있다. 그럼에도 불구하고, 완전 CDS에 대해 CPB를 계산한다.
실시예 16
마우스에서의 폴리오바이러스 및 인플루엔자 바이러스 백신 후보물질의 평가
소아마비 또는 인플루엔자에 대해 마우스를 백신접종하는 역최적화 바이러스의 능력을 시험한다.
폴리오바이러스 면역화, 항체 역가, 및 wt 공격접종 실험
작용 가설은, 양호한 백신 후보물질이 낮은 감염력 역가를 높은 비리온 역가와 조합한다는 것이다. 이는, 많은 양의 바이러스 입자(즉, 항원)가 낮은 위험 프로파일을 동시에 가지면서 주입될 수 있음을 확실히 한다. 따라서, 5마리의 CD155tg 마우스로 된 군에, 103, 104, 105, 및 106 PFU의 PV(마호니)(즉, 야생형), PV1 세이빈 백신 균주, PVAB2470-2954, PV-Min755-2470, 또는 본 연구 중에 개발된 다른 유망한 약독화 폴리오바이러스를 복강내 주사할 것이다 야생형의 경우, 1 PFU는 약 100개 바이러스 입자인 반면, 약독화 바이러스의 경우에는 1 PFU가 대략 5,000 내지 100,000개 입자이다. 따라서, 동등수의 PFU의 주사란, 50 내지 1000배 더 많은 입자의 약독화 바이러스를 주사하고 있음을 의미한다. 복강내 주사하는 wt 바이러스의 경우, LD50는 약 106 PFU, 또는 약 108개 입자이다. 따라서, 최고 용량에서 일부 사멸이 예상되나, 보다 낮은 용량에서는 그러하지 않다.
동일한 용량의 추가투여 접종(booster shots)을 1주일 후 및 초기 접종한지 4주 후에 주입한다. 두 번째 추가투여로부터 1주일 후, PV 중화 항체 역가를 플라크 감소 검정법에 의해 측정한다. 이 목적을 위해, 100 PFU의 wt PV(M) 바이러스를 면역화된 마우스로부터의 혈청의 2배 일련 희석액과 함께 인큐베이션한다. PFU의 잔류 수를 플라크 검정법에 의해 결정한다. 중화 항체 역가는 플라크가 관찰되지 않는 최저 혈청 희석액의 역수로 표시된다.
마지막 추가투여로부터 4주 후, 면역화된 마우스 및 면역화되지 않은 대조군을 치사 용량의 PV(M) wt 바이러스(106 PFU)로 복강내 공격접종하고; 이는 LD50의 100배이고, 생존율을 모니터링한다.
인플루엔자 면역화, 항체
역가
, 및
wt
공격접종 실험
백신접종 실험에 대해, 5마리의 BALB/c 마우스로 된 군에 wt 및 약독화 인플루엔자 바이러스를 0.001, 0.01, 0.1, 및 1.0 LD50의 용량으로 복강내 주사한다. 추가투여 백신접종을 PV에 대해 상기 기재된 바와 동일한 간격으로 주입한다. 두 번째 추가투여로부터 1주일 후의 인플루엔자 항체 역가를, 표준 프로토콜에 따라 응집(HI) 억제 검정법에 의해 결정한다(문헌 [Kendal et al., 1982]). 간략히 말해, 수용체 파괴 효소(RDE; 시그마(Sigma), 미국 미주리주 세인트루이스 소재)로 처리한 면역화 마우스 및 대조군 마우스로부터의 혈청을 2배 일련 희석하고, V-바닥 웰에서 5 HA 단위의 A/PR/8/34 바이러스와 혼합한다. 이어서, RBC를 첨가하고, 플레이트를 표준 HA 검정법에 대해 상기 기재한 바대로 가공한다. 항체 역가는 응집의 완전 억제를 초래하는 희석율의 역수로 표시된다.
마지막 추가투여 백신접종으로부터 3주 후, 마우스를 100 또는 1000 LD50의 A/PR/8/34 모 바이러스(대략 105 및 106 PFU)로 비강내 공격접종하고, 생존율을 모니터링한다.
동물 취급
인간 폴리오바이러스 수용체 CD155를 발현하는 유전자도입 마우스(CD155tg)를, 동경대 [박사 Nomoto]로부터 입수하였다. CD155tg 마우스 콜로니를 뉴욕주립대학(SUNY) 동물 시설에 의해 관라한다. BALB/c 마우스를 타코닉(Taconic)(미국 뉴욕주 저먼타운 소재)으로부터 입수한다. 마취된 마우스에 정맥내, 복강내 또는 뇌내 경로에 의해 25 게이지 피하 주사침을 이용하여 30 ㎕의 바이러스 현탁액을, 또는 비강내 경로에 의해서는 50 ㎕를 접종한다. 양 성별의 6 내지 24주령 마우스를 사용한다. 마우스가 폴리오바이러스 및 인플루엔자 바이러스 연구를 위한 가장 경제적인 모델 시스템이다. 부가적으로, PV의 경우, CD155tg 마우스주가 비인간 영장류를 제외한 유일한 동물 모델이다. 마우스는 또한, 바이러스가 폴리오바이러스 및 인플루엔자 바이러스 모두에 대해 동물들 사이에 일어나지 않기 때문에 가장 안전한 동물 모델이다.
모든 마우스들을 실험실 동물 연구부(DLAR) 및 이의 수의학 직원들의 발기 하에 아트 동물 시설의 SUNY 부서에 사육한다. 모든 동물들을 수의학 직원들에 의해 매주 2회 체크한다. 바이러스 감염 동물을 연구원에 의해 매주 2회 체크하고, 수의학 직원에 의해 매일 체크한다. 모든 감염 실험들을 동물 시설 내 특수 설계된 최대 격리실에서 수행한다. 실험을 마친 후, 생존 마우스를 마취하고, 시체는 고압살균에 의해 무균화한다. 어떤 마우스도 바이러스실에 살아남지 않게 된다.
본 연구에서, 정맥내, 뇌내, 복강내, 근육내 또는 비강내 접종, 마취제 주사, 및 혈액 샘플 수집을 제외한 어떠한 외과술 절차도 마우스에 행하지 않는다. 백신접종 실험을 위해, 혈액 샘플을 바이러스 특이적 항체의 검출을 위해 백신접종 전 및 후에 취한다. 이러한 취지에서, 50 내지 100 ㎕를 주사 전날, 및 두 번째 추가투여 백신접종으로부터 1주 후에 마우스로부터 수집한다. 개별 동물에서의 최대 2개 혈액 샘플을 적어도 4주 간격을 두고 수집한다. 동물을 마취하고, 날카로운 외과용 메스(scalpel)를 사용하여 꼬리의 2 mm를 절개해낸다. 혈액을 모세관으로 수집한다. 꼬리에 있는 딱지를 제거함으로써, 후속 샘플링을 수득한다. 꼬리가 치유되면, 꼬리의 새 2 mm 절개를 반복한다.
모든 동물 실험들을, SUNY 실험동물사용관리위원회(Institutional Animal Care and Use Committee)(IACUC)에 의해 승인된 프로토콜에 따라 수행한다. 미수의학협회(American Veterinary Medical Association)의 권장사항에 따라 CO2 기체실에서 훈련된 인원에 의해 안락사를 수행한다. 미질병통제예방센터(Centers for Disease Control 및 Prevention)(CDC)에 의해 발행된 최신 ABSL 2/소아마비 권장사항 하에 감염 실험을 수행한다.
실시예 17
코돈 쌍 편향 알고리즘 - 코돈 쌍 편향 및 스코어 매트릭스
대부분의 생물체에서, 아미노산의 우선성이 종종 다른 것들에 비해 특정 코돈에 의해 코딩된다는 것을 설명하는, 구분된 코돈 편향이 존재한다. 코돈 편향이 단백질 번역 속도와 연관된다는 것이 널리 믿어지고 있다. 또한, 각 종은 주어진 코돈 쌍이 유전자 서열 내 이웃으로서 나타나는지의 여부에 대해 특정 우선성을 가지는데, 이는 코돈 쌍 편향으로 불리우는 것이다.
코돈 쌍 편향을 정량하기 위해, 본 발명자들은 코돈 쌍 거리를 생물체의 유전자 내 코돈 쌍의 출현 수(빈도)에 대한 관찰 출현 수의 로그 비로서 정의한다. 유전자 집합 내 코돈 쌍의 관찰 빈도의 계산이 직접적이나, 코돈 쌍의 예상 빈도는 문헌 [Gutman and Hatfield, Proc. Natl. Acad. Sci. USA, 86:3699-3703, 1989]에서와 같이 계산되고, 이는 아미노산 및 코돈 편향과 무관하다. 이를 달성하기 위해, 예상 빈도를 아미노산이 한 특정 코돈에 의해 코딩되는 횟수의 상대 분율에 기초하여 계산한다. 간략히 말해, 이하와 같다:
(식 중에서, 코돈 쌍 AB는 아미노산 쌍 XY를 코딩하고, F는 빈도(출현 수)를 나타낸다).
이 반응식에서, 본 발명자들은 상기 정의된 바와 같은 모든 쌍별 비용으로 64×64 코돈 쌍 거리 매트릭스를 정의할 수 있다. 임의의 m-잔기 단백질은 자체의 코딩을 포함하는 코돈 쌍 스코어의 평균에 의해 과대표시 또는 과소표시된 코돈 쌍을 이용하여 평가될 수 있다.
코돈 쌍 편향에 기초한 유전자 코딩의 최적화
특정 단백질의 번역에 대한 코돈 쌍 편향의 영향을 조사하기 위해, 본 발명자들은 동일한 코돈 분포를 유지하면서 코돈 쌍을 변화시키기로 결정하였다. 따라서, 본 발명자들은 하기 문제를 정의한다: 아미노산 서열 및 코돈 빈도 집단(코돈 분포)이 주어지면, 코돈 쌍 스코어가 최적화(통상은 최소화 또는 최대화)되도록, 서열의 DNA 코딩을 변화시킨다.
상기 정의된 바와 같은 본 발명자들의 문제는, 판매원 순회 문제(Traveling Salesman Problem)(TSP)와 관련된다. 판매원 순회 문제는 가장 악명높은 NP-완전 문제이다. 이는 그것의 일반적 유용성의 함수이며, 이는 대체로 공중에게 설명하기 용이하기 때문이다. 차로 각각의 주어진 도시 집합을 방문해야 하는 순회 판매원을 상상해보라. 그가 순회를 하고 집에 돌아오도록 할 수 있는 최단 거리로서, 그의 총 운전거리를 최소화하는 경로는 무엇일까?
TSP 발견법(heuristics)
TSP의 실질적으로 임의의 이점은 NP-완전일 것이며, 이에 따라 올바른 진행 방식은 발견법을 이용한다. 이는 종종 매우 성공적이며, 전형적으로 대부분의 용도들에 대해 또한 특히 본 발명자들의 최적화 코딩을 위해 충분히 근접하는, 최적 해결책의 몇 퍼센트 내에 포함된다.
최소 신장 트리(Minimum spanning trees) - 한 간단하고 보편적인 발견법, 특히 부위가 평면 내 점을 나타내는 발견법은 점의 최소 신장 트리에 기초한다. 이 트리의 깊이-우선(depth-first) 연구를 행함으로써, 본 발명자들은 트리의 각 선단(edge)을 두 번 지나는데, 한 번은 본 발명자들이 새 정점을 발견할 때 내려가고, 또 한 번은 본 발명자들이 되돌아갈 때 올라간다. 이어서, 본 발명자들은 정점이 발견되는 순서에 따라 정점의 행로(tour)을 정의하여, 이 순서로 정점의 각 이웃 쌍들 간의 최단 거리를 이용하여, 이들을 연결할 수 있다. 이 경로는, 평면에 있는 점들에서와 같이, 그래프가 완전하고 삼각 부등을 따르는 경우 단일 선단이어야 한다. 생성되는 행로는 항상 최소 TSP 행로 길이의 2배 이하이다. 실제로, 그것이 통상 최적보다 더 양호한데, 전형적으로는 15% 내지 20% 더 양호하다. 또한, 알고리즘의 시간은 평면 내 점들의 경우에는 단지 O(n 1g n)인, 최소 신장 트리를 연산하는 시간에 의해 국한된다.
점증 삽입 방법 - 한 상이한 부류의 발견법은, 행로가 완성될 때까지, (단일 정점으로부터 시작하여) 한 시점에서 새 점들을 새로운 부분 행로 점에 삽입한다. 최량으로 작용하는 것으로 보이는 이 발견법의 양태는 최원점 삽입법인데: 나머지 모든 점들 중, 이하와 같이 되도록 점 v를 부분 행로 T에 삽입한다:
최소점은, 본 발명자들이 행로에의 최소 양의 거리를 부가하는 위치에 정점을 삽입하는 것을 확실히 하고, 한편 최대점은 본 발명자들이 가장 좋지 않은 그러한 정점을 먼저 채택하도록 확실히 한다. 이는, 먼저 상세히 채우기 전에, 먼저 "개략적으로 그리기" 때문에, 잘 작용하는 것으로 보인다. 전형적으로, 그러한 행로는 최적보다 단지 5% 내지 10% 더 길다.
k-최적 행로 - 커닝건-린(Kernighan-Lin) 또는 k-opt 부류의 발견법이 실질적으로 더 강력하다. 임의적 행로에서 시작하여, 본 방법은 그것을 향상시키고자 하는 희망에서 행로에 국부 개량을 적용한다. 특히, k≥2 선단의 부분집단을 행로에서 결실시키고, k 잔존 부분사슬은 생성되는 행로가 개선책인지의 여부를 확인하기 위해 상이한 방식으로 재배선된다. 한 행로는, 행로의 비용을 감소시키도록 결실되고 재배선될 수 없는 k 선단의 부분집합이 없을 때, k-최적이 된다. 연장 실험은, 3 최적 행로가 통상 최적 행로의 수 % 이내에 있음을 제시한다. K>3이 경우, 연산 시간은 솔루션 품질보다 상당히 더 빨리 증가한다. 행로를 2-선택(two-opting)하는 것이 임의의 다른 발견법을 향상시키기 위한 빠르고 효과적인 방식이다. 모의 어닐링은 발견법 행로를 향상시키기 위한 선단 플립을 이용하는 대안적 기전을 제공한다.
최적의 코딩 문제를 해결하기 위한 알고리즘
정의된 바와 같은 본 발명자들의 문제는, 64개국 계량 하에 순회 판매원 경로(행로가 아님)를 찾는 문제와 연관된다. 이 공식화에서, 각각의 64개 가능한 코돈은 국가와 동종성을 가지고, 코돈 다중도는 국가 내 도시들의 수로서 모델링된다. 코돈 쌍 편향 측정은 국가 거리 매트릭스로서 반영된다.
코돈 쌍 편향 측정 하에서 유전자/DNA 서열을 최적화하기 위해 주어진 코돈 다중도 집합을 이용하여 특정 단백질을 코딩하는 유전자를 설계하는 실제 생물학적 문제는 약간 상이하다. 국가 TSP 모델에서 본 발명자들의 모델에 없는 것은, 특정 단백질을 코딩할 필요성이다. DNA 삼중체 암호는 64개 코돈을 21개 균등 부류(각각의 20개의 가능한 아미노산 및 중지 기호에 대한 코딩)로 분획화한다. 임의의 주어진 단백질/아미노산 서열은 그것을 코딩하는 관련 코돈 등가물의 임의적 대표를 선택함으로써 구체화될 수 있다.
본 발명자들의 문제의 특수 제한 및 성질, 및 최적화에서의 부가적 기준의 적용에 대한 적합성으로 인해, 본 발명자들은 서열을 최적화하기 위해 모의 어닐링 발견법을 선택하였다. 기법이 이하에 요약되어 있다.
모의 어닐링 발견법
모의 어닐링은, 더욱 고가인 (이에 따라 더 열등한) 솔루션을 초래하는 우발적 전이를 허용하는 발견법적 검색 절차이다. 이는 성공적인 것으로 들리지 않을 수 있으나, 본 발명자들의 연구가 국부 최적점에 고착되는 것으로부터 보호하는 것을 돕는 작용을 하는 것이기도 하다.
모의 어닐링에 대한 영감은 용융된 물질을 고체 상태로 냉각시키는 물리적 과정으로부터 나온다. 열역학적 이론에서, 시스템의 에너지 상태는 시스템을 구성하는 각각의 입자의 에너지 상태에 의해 설명된다. 각 입자의 에너지 상태는 대략 무작위로 뛰어오르고, 이때 그러한 전이는 시스템의 온도에 의해 지배된다. 특히, 온도 T 에서 에너지 e i 에서 e j 로의 전이의 확률 P(e i , e j , T)는 하기와 같이 주어진다:
(여기에서, kB는 볼츠만 상수로 일컬어지는 상수이다). 이 식이 의미하는 바는 무엇일까? 상이한 조건 하에 지수의 값을 고려해보라. 고에너지 상태에서 저에너지 상태로의 이동 가능성은 매우 높다. 그러나, 고에너지 상태로의 전이를 수용하는 비영점 확률이 또한 있고, 이에 작은 에너지는 큰 에너지보다 훨씬 더 가능하게 뛰어오른다. 온도가 높을수록, 그러한 에너지가 뛰어오를 가능성이 더 클 것이다.
이는 조합 최적화를 위해 무슨 관련성을 가질까? 물리적 시스템은, 그것이 냉각될 때, 최소-에너지 상태로 가려고 한다. 임의의 구분된 입자 집합에서, 총 에너지의 최소화는 조합 최적화 문제이다. 상기 확률 분포에 따라 발생되는 무작위 전이를 통해, 본 발명자들은 임의적 조합 최적화 문제를 해결하기 위해 물리학을 모의할 수 있다.
국부적 연구에서와 같이, 문제 표시는 솔루션 공간의 표시와, 주어진 솔루션의 품질을 측정하는, 적절하고 용이하게 연산가능한 비용 함수 C(s)를 모두 포함한다. 새로운 요소는, 본 발명자들이 어떻게 가능히 시간의 함수로서 좋지 않은 전이를 수용할지를 지배하는 파라미터를 가지는 냉각 스케줄이다.
연구 개시 시에, 본 발명자들은 연구 공간을 넓게 탐색하기 위해 무작위성을 이용하고자 열망하여, 부정적 전이를 수용하는 확률이 높게 된다. 연구가 진행됨에 따라, 본 발명자들은 국부 개량 및 최적화로의 전이를 제한하고자 한다. 냉각 스케줄은 하기 파라미터들에 의해 조절될 수 있다:
초기 시스템 온도 - 전형적으로, t 1 =1.
온도 감소분 함수 - 전형적으로, t k =αㆍt k -1(여기에서, 0.8≤α≤0.99임). 이는 선형 쇠퇴와 반대되는, 온도의 지수적 쇠퇴를 의미한다.
온도 변화 간의 반복 수 - 전형적으로, 온도를 저하시키기 전에 100 내지 1,000회 반복이 허용될 수 있다.
수용 기준 - 한 전형적 기준은, C(s i +1)<C(s i )일 때, s i 에서 s j +1로의 임의의 전이를 수용하고, 이하를 만족하는 임의의 경우에 음의 전이를 수용하는 것이다:
(여기에서, r은 0≤r<1의 무작위 수이다). 상수 c는 이 비용 함수를 정규화하며, 이로써 거의 모든 전이가 출발 온도에서 수용된다.
중지 기준 - 전형적으로, 현 솔루션의 값이 마지막 반복 정도 이내에서 변화되거나 향상되지 않았을 때, 연구를 종료하고, 현 솔루션을 보고한다.
전문가의 능력에서, TSP에 대한 최량의 문제 특이적 발견법이 모의 어닐링보다 약간 성능이 우월할 수 있으나, 모의 어닐링 솔루션이 용이하고도 훌륭하게 작용한다.
참조문헌
SEQUENCE LISTING
<110> The Research Foundation of State University of New York
SUNY at Stony Brook
Colman, John R
Cello, Jeronimo
Futcher, Bruce
Mueller, Steffen
Papamichail, Dimitris
Skiena, Steven
Wimmer, Eckard
<120> Attenuated Viruses Useful For Vaccines
<130> 14421/46276
<140> not assigned
<141> 2008-03-31
<150> 60/909,389
<151> 2007-03-30
<150> 61/068,666
<151> 2008-03-07
<160> 42
<170> PatentIn version 3.3
<210> 1
<211> 2643
<212> DNA
<213> Human poliovirus 1 Mahoney
<400> 1
atgggtgctc aggtttcatc acagaaagtg ggcgcacatg aaaactcaaa tagagcgtat 60
ggtggttcta ccattaatta caccaccatt aattattata gagattcagc tagtaacgcg 120
gcttcgaaac aggacttctc tcaagaccct tccaagttca ccgagcccat caaggatgtc 180
ctgataaaaa cagccccaat gctaaactcg ccaaacatag aggcttgcgg gtatagcgat 240
agagtactgc aattaacact gggaaactcc actataacca cacaggaggc ggctaattca 300
gtagtcgctt atgggcgttg gcctgaatat ctgagggaca gcgaagccaa tccagtggac 360
cagccgacag aaccagacgt cgctgcatgc aggttttata cgctagacac cgtgtcttgg 420
acgaaagagt cgcgagggtg gtggtggaag ttgcctgatg cactgaggga catgggactc 480
tttgggcaaa atatgtacta ccactaccta ggtaggtccg ggtacaccgt gcatgtacag 540
tgtaacgcct ccaaattcca ccagggggca ctaggggtat tcgccgtacc agagatgtgt 600
ctggccgggg atagcaacac cactaccatg cacaccagct atcaaaatgc caatcctggc 660
gagaaaggag gcactttcac gggtacgttc actcctgaca acaaccagac atcacctgcc 720
cgcaggttct gcccggtgga ttacctcctt ggaaatggca cgttgttggg gaatgccttt 780
gtgttcccgc accagataat aaacctacgg accaacaact gtgctacact ggtactccct 840
tacgtgaact ccctctcgat agatagtatg gtaaagcaca ataattgggg aattgcaata 900
ttaccattgg ccccattaaa ttttgctagt gagtcctccc cagagattcc aatcaccttg 960
accatagccc ctatgtgctg tgagttcaat ggattaagaa acatcaccct gccacgctta 1020
cagggcctgc cggtcatgaa cacccctggt agcaatcaat atcttactgc agacaacttc 1080
cagtcaccgt gtgcgctgcc tgaatttgat gtgaccccac ctattgacat acccggtgaa 1140
gtaaagaaca tgatggaatt ggcagaaatc gacaccatga ttccctttga cttaagtgcc 1200
acaaaaaaga acaccatgga aatgtatagg gttcggttaa gtgacaaacc acatacagac 1260
gatcccatac tctgcctgtc actctctcca gcttcagatc ctaggttgtc acatactatg 1320
cttggagaaa tcctaaatta ctacacacac tgggcaggat ccctgaagtt cacgtttctg 1380
ttctgtggat tcatgatggc aactggcaaa ctgttggtgt catacgcgcc tcctggagcc 1440
gacccaccaa agaagcgtaa ggaggcgatg ttgggaacac atgtgatctg ggacatagga 1500
ctgcagtcct catgtactat ggtagtgcca tggattagca acaccacgta tcggcaaacc 1560
atagatgata gtttcaccga aggcggatac atcagcgtct tctaccaaac tagaatagtc 1620
gtccctcttt cgacacccag agagatggac atccttggtt ttgtgtcagc gtgtaatgac 1680
ttcagcgtgc gcttgttgcg agataccaca catatagagc aaaaagcgct agcacagggg 1740
ttaggtcaga tgcttgaaag catgattgac aacacagtcc gtgaaacggt gggggcggca 1800
acatctagag acgctctccc aaacactgaa gccagtggac caacacactc caaggaaatt 1860
ccggcactca ccgcagtgga aactggggcc acaaatccac tagtcccttc tgatacagtg 1920
caaaccagac atgttgtaca acataggtca aggtcagagt ctagcataga gtctttcttc 1980
gcgcggggtg catgcgtgac cattatgacc gtggataacc cagcttccac cacgaataag 2040
gataagctat ttgcagtgtg gaagatcact tataaagata ctgtccagtt acggaggaaa 2100
ttggagttct tcacctattc tagatttgat atggaactta cctttgtggt tactgcaaat 2160
ttcactgaga ctaacaatgg gcatgcctta aatcaagtgt accaaattat gtacgtacca 2220
ccaggcgctc cagtgcccga gaaatgggac gactacacat ggcaaacctc atcaaatcca 2280
tcaatctttt acacctacgg aacagctcca gcccggatct cggtaccgta tgttggtatt 2340
tcgaacgcct attcacactt ttacgacggt ttttccaaag taccactgaa ggaccagtcg 2400
gcagcactag gtgactccct ttatggtgca gcatctctaa atgacttcgg tattttggct 2460
gttagagtag tcaatgatca caacccgacc aaggtcacct ccaaaatcag agtgtatcta 2520
aaacccaaac acatcagagt ctggtgcccg cgtccaccga gggcagtggc gtactacggc 2580
cctggagtgg attacaagga tggtacgctt acacccctct ccaccaagga tctgaccaca 2640
tat 2643
<210> 2
<211> 7521
<212> DNA
<213> Unknown
<220>
<223> synthetic
<400> 2
ttaaaacagc tctggggttg tacccacccc agaggcccac gtggcggcta gtactccggt 60
attgcggtac ccttgtacgc ctgttttata ctcccttccc gtaacttaga cgcacaaaac 120
caagttcaat agaagggggt acaaaccagt accaccacga acaagcactt ctgtttcccc 180
ggtgatgtcg tatagactgc ttgcgtggtt gaaagcgacg gatccgttat ccgcttatgt 240
acttcgagaa gcccagtacc acctcggaat cttcgatgcg ttgcgctcag cactcaaccc 300
cagagtgtag cttaggctga tgagtctgga catccctcac cggtgacggt ggtccaggct 360
gcgttggcgg cctacctatg gctaacgcca tgggacgcta gttgtgaaca aggtgtgaag 420
agcctattga gctacataag aatcctccgg cccctgaatg cggctaatcc caacctcgga 480
gcaggtggtc acaaaccagt gattggcctg tcgtaacgcg caagtccgtg gcggaaccga 540
ctactttggg tgtccgtgtt tccttttatt ttattgtggc tgcttatggt gacaatcaca 600
gattgttatc ataaagcgaa ttggattggc catccggtga aagtgagact cattatctat 660
ctgtttgctg gatccgctcc attgagtgtg tttactctaa gtacaatttc aacagttatt 720
tcaatcagac aattgtatca taatgggtgc tcaggtttcg tcgcaaaaag taggtgcgca 780
tgaaaactcg aatcgtgcgt atggttcgtc gacgataaat tatacgacga taaattatta 840
tcgtgattcg gcgtctaatg cggcttcgaa acaagatttt tcgcaagatc cgtcgaaatt 900
tacggaaccg ataaaagatg tattaataaa aacggcgccg atgttaaatt cgccgaatat 960
agaagcgtgt ggttattcgg atcgtgtatt acaattaacg ttaggtaatt cgacgataac 1020
gacgcaagaa gcggctaatt cggtagtagc gtatggtcgt tggccggagt atttacgtga 1080
ttcggaagcg aatccggtag atcaaccgac ggaaccggac gtcgcggcgt gtcgttttta 1140
tacgttagat acggtatcgt ggacgaaaga atcgcgaggt tggtggtgga aattaccgga 1200
tgcgttacgt gatatgggtt tatttggtca aaatatgtat tatcattatt taggtcgttc 1260
gggttatacg gtacatgtac aatgtaatgc gtcgaaattt catcaaggtg cgttaggtgt 1320
atttgcggta ccggaaatgt gtttagcggg tgactcgaat acgacgacga tgcatacgtc 1380
gtatcaaaat gcgaatccgg gtgaaaaagg tggtacgttt acgggtacgt ttacgccgga 1440
taataatcaa acgtcgccgg cgcgtcgttt ttgtccggta gattatttat taggtaatgg 1500
tacgttatta gggaatgcct ttgtatttcc gcatcaaata ataaatttgc gtacgaataa 1560
ttgtgcgacg ttagtattac cgtatgtaaa ttcgttatcg atagattcga tggtaaaaca 1620
taataattgg ggtatagcaa tattaccgtt agcgccgtta aattttgcgt cggaatcgtc 1680
gccggaaata ccgataacgt taacgatagc gccgatgtgt tgtgaattta atggtttgcg 1740
taatataacg ttaccgcgtt tacaaggttt accggtaatg aatacgccgg gctcgaatca 1800
gtatttaacg gcggataatt ttcaatcgcc gtgtgcgtta ccggaatttg atgtaacgcc 1860
gccgatagat ataccgggtg aagtaaaaaa tatgatggaa ttagcggaaa tagatacgat 1920
gataccgttt gatttatcgg cgacgaaaaa aaatacgatg gaaatgtatc gtgtacgttt 1980
atcggataaa ccgcatacgg atgatccgat attatgttta tcgttatcgc cggcgtcgga 2040
tcctaggtta tcgcatacga tgttaggtga gatattaaat tattatacgc attgggcggg 2100
ttcgttaaaa tttacgtttt tattttgtgg ttcgatgatg gcgacgggta aattattagt 2160
atcgtatgcg ccgccgggtg cggatccgcc gaaaaaacgt aaagaagcga tgttaggtac 2220
gcatgtaata tgggatatag gtttacaatc gtcgtgtacg atggtagtac cgtggatatc 2280
gaatacgacg tatcgtcaaa cgatagatga ttcgtttacg gaaggtggtt atatatcggt 2340
attttatcaa acgcgtatag tagtaccgtt atcgacgccg cgtgaaatgg atatattagg 2400
ttttgtatcg gcgtgtaatg atttttcggt acgtttatta cgtgatacga cgcatataga 2460
acaaaaagcg ctagcacaag gtttaggtca aatgttagaa tcgatgatag ataatacggt 2520
acgtgaaacg gtaggtgcgg ctacgtcgcg tgatgcgtta ccgaatacgg aagcgtcggg 2580
tccgacgcac tcgaaagaaa taccggcgtt aacggcggta gaaacgggtg cgacgaatcc 2640
actagtcccg tcggatacgg tacaaacgcg tcatgtagta caacatcgtt cgcgttcgga 2700
atcgtcgata gaatcgtttt ttgcgcgtgg tgcgtgtgta acgataatga cggtagataa 2760
tccggcgtcg acgacgaata aagataaatt atttgcggta tggaaaataa cgtataaaga 2820
tacggtacaa ttacgtcgta aattagaatt tttcacgtat tcgcgttttg atatggaatt 2880
aacgtttgta gtaacggcga attttacgga aacgaataat ggtcatgcgt taaatcaagt 2940
atatcaaata atgtacgtac cgccgggtgc gccggtaccc gaaaaatggg atgattatac 3000
gtggcaaacg tcgtcgaatc cgtcgatatt ttacacgtat ggtacggcgc cggcgcgtat 3060
atcggtaccg tatgtaggta tatctaatgc gtattcgcat ttttatgatg gtttctcgaa 3120
agtaccgtta aaagatcaat cggcggcgtt aggtgattcg ttatatggtg cggcgtcgtt 3180
aaatgatttt ggtatattag cggtacgtgt agtaaatgat cataatccga cgaaggtcac 3240
ctcgaaaata cgtgtatatt taaaaccgaa acatatacgt gtatggtgtc cgcgtccgcc 3300
gcgtgcggta gcgtattatg gtccgggtgt agattataaa gatggtacgt taacgccgtt 3360
atcgacgaaa gatttaacga cgtatggatt cggacaccaa aacaaagcgg tgtacactgc 3420
aggttacaaa atttgcaact accacttggc cactcaggat gatttgcaaa acgcagtgaa 3480
cgtcatgtgg agtagagacc tcttagtcac agaatcaaga gcccagggca ccgattcaat 3540
cgcaaggtgc aattgcaacg caggggtgta ctactgcgag tctagaagga aatactaccc 3600
agtatccttc gttggcccaa cgttccagta catggaggct aataactatt acccagctag 3660
gtaccagtcc catatgctca ttggccatgg attcgcatct ccaggggatt gtggtggcat 3720
actcagatgt caccacgggg tgatagggat cattactgct ggtggagaag ggttggttgc 3780
attttcagac attagagact tgtatgccta cgaagaagaa gccatggaac aaggcctcac 3840
caattacata gagtcacttg gggccgcatt tggaagtgga tttactcagc agattagcga 3900
caaaataaca gagttgacca atatggtgac cagtaccatc actgaaaagc tacttaagaa 3960
cttgatcaag atcatatcct cactagttat tataactagg aactatgaag acaccacaac 4020
agtgctcgct accctggccc ttcttgggtg tgatgcttca ccatggcagt ggcttagaaa 4080
gaaagcatgc gatgttctgg agatacctta tgtcatcaag caaggtgaca gttggttgaa 4140
gaagtttact gaagcatgca acgcagctaa gggactggag tgggtgtcaa acaaaatctc 4200
aaaattcatt gattggctca aggagaaaat tatcccacaa gctagagata agttggaatt 4260
tgtaacaaaa cttagacaac tagaaatgct ggaaaaccaa atctcaacta tacaccaatc 4320
atgccctagt caggaacacc aggaaattct attcaataat gtcagatggt tatccatcca 4380
gtctaagagg tttgcccctc tttacgcagt ggaagccaaa agaatacaga aactcgagca 4440
tactattaac aactacatac agttcaagag caaacaccgt attgaaccag tatgtttgct 4500
agtacatggc agccccggaa caggtaaatc tgtagcaacc aacctgattg ctagagccat 4560
agctgaaaga gaaaacacgt ccacgtactc gctacccccg gatccatcac acttcgacgg 4620
atacaaacaa cagggagtgg tgattatgga cgacctgaat caaaacccag atggtgcgga 4680
catgaagctg ttctgtcaga tggtatcaac agtggagttt ataccaccca tggcatccct 4740
ggaggagaaa ggaatcctgt ttacttcaaa ttacgttcta gcatccacaa actcaagcag 4800
aatttccccc cccactgtgg cacacagtga cgcgttagcc aggcgctttg cgttcgacat 4860
ggacattcag gtcatgaatg agtattctag agatgggaaa ttgaacatgg ccatggctac 4920
tgaaatgtgt aagaactgtc accaaccagc aaactttaag agatgctgtc ctttagtgtg 4980
tggtaaggca attcaattaa tggacaaatc ttccagagtt agatacagta ttgaccagat 5040
cactacaatg attatcaatg agagaaacag aagatccaac attggcaatt gtatggaggc 5100
tttgtttcaa ggaccactcc agtataaaga cttgaaaatt gacatcaaga cgagtccccc 5160
tcctgaatgt atcaatgact tgctccaagc agttgactcc caggaggtga gagattactg 5220
tgagaagaag ggttggatag ttaacatcac cagccaggtt caaacagaaa ggaacatcaa 5280
cagggcaatg acaattctac aagcggtgac aaccttcgcc gcagtggctg gagttgtcta 5340
tgtcatgtat aaactgtttg ctggacacca gggagcatac actggtttac caaacaaaaa 5400
acccaacgtg cccaccattc ggacagcaaa ggtacaagga ccagggttcg attacgcagt 5460
ggctatggct aaaagaaaca ttgttacagc aactactagc aagggagagt tcactatgtt 5520
aggagtccac gacaacgtgg ctattttacc aacccacgct tcacctggtg aaagcattgt 5580
gatcgatggc aaagaagtgg agatcttgga tgccaaagcg ctcgaagatc aagcaggaac 5640
caatcttgaa atcactataa tcactctaaa gagaaatgaa aagttcagag acattagacc 5700
acatatacct actcaaatca ctgagacaaa tgatggagtc ttgatcgtga acactagcaa 5760
gtaccccaat atgtatgttc ctgtcggtgc tgtgactgaa cagggatatc taaatctcgg 5820
tgggcgccaa actgctcgta ctctaatgta caactttcca accagagcag gacagtgtgg 5880
tggagtcatc acatgtactg ggaaagtcat cgggatgcat gttggtggga acggttcaca 5940
cgggtttgca gcggccctga agcgatcata cttcactcag agtcaaggtg aaatccagtg 6000
gatgagacct tcgaaggaag tgggatatcc aatcataaat gccccgtcca aaaccaagct 6060
tgaacccagt gctttccact atgtgtttga aggggtgaag gaaccagcag tcctcactaa 6120
aaacgatccc aggcttaaga cagactttga ggaggcaatt ttctccaagt acgtgggtaa 6180
caaaattact gaagtggatg agtacatgaa agaggcagta gaccactatg ctggccagct 6240
catgtcacta gacatcaaca tagaacaaat gtgcttggag gatgccatgt atggcactga 6300
tggtctagaa gcacttgatt tgtccaccag tgctggctac ccttatgtag caatgggaaa 6360
gaagaagaga gacatcttga acaaacaaac cagagacact aaggaaatgc aaaaactgct 6420
cgacacatat ggaatcaacc tcccactggt gacttatgta aaggatgaac ttagatccaa 6480
aacaaaggtt gagcagggga aatccagatt aattgaagct tctagtttga atgactcagt 6540
ggcaatgaga atggcttttg ggaacctata tgctgctttt cacaaaaacc caggagtgat 6600
aacaggttca gcagtggggt gcgatccaga tttgttttgg agcaaaattc cggtattgat 6660
ggaagagaag ctgtttgctt ttgactacac agggtatgat gcatctctca gccctgcttg 6720
gttcgaggca ctaaagatgg tgcttgagaa aatcggattc ggagacagag ttgactacat 6780
cgactaccta aaccactcac accacctgta caagaataaa acatactgtg tcaagggcgg 6840
tatgccatct ggctgctcag gcacttcaat ttttaactca atgattaaca acttgattat 6900
caggacactc ttactgaaaa cctacaaggg catagattta gaccacctaa aaatgattgc 6960
ctatggtgat gatgtaattg cttcctaccc ccatgaagtt gacgctagtc tcctagccca 7020
atcaggaaaa gactatggac taactatgac tccagctgac aaatcagcta catttgaaac 7080
agtcacatgg gagaatgtaa cattcttgaa gagattcttc agggcagacg agaaataccc 7140
atttcttatt catccagtaa tgccaatgaa ggaaattcat gaatcaatta gatggacaaa 7200
agatcctagg aacactcagg atcacgttcg ctctctgtgc cttttagctt ggcacaatgg 7260
cgaagaagaa tataacaaat tcctagctaa aatcaggagt gtgccaattg gaagagcttt 7320
attgctccca gagtactcaa cattgtaccg ccgttggctt gactcatttt agtaacccta 7380
cctcagtcga attggattgg gtcatactgg tgtaggggta aatttttctt taattcggag 7440
gaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 7500
aaaaaaaaaa aaaaaaaaaa a 7521
<210> 3
<211> 7521
<212> DNA
<213> Unknown
<220>
<223> synthetic
<400> 3
ttaaaacagc tctggggttg tacccacccc agaggcccac gtggcggcta gtactccggt 60
attgcggtac ccttgtacgc ctgttttata ctcccttccc gtaacttaga cgcacaaaac 120
caagttcaat agaagggggt acaaaccagt accaccacga acaagcactt ctgtttcccc 180
ggtgatgtcg tatagactgc ttgcgtggtt gaaagcgacg gatccgttat ccgcttatgt 240
acttcgagaa gcccagtacc acctcggaat cttcgatgcg ttgcgctcag cactcaaccc 300
cagagtgtag cttaggctga tgagtctgga catccctcac cggtgacggt ggtccaggct 360
gcgttggcgg cctacctatg gctaacgcca tgggacgcta gttgtgaaca aggtgtgaag 420
agcctattga gctacataag aatcctccgg cccctgaatg cggctaatcc caacctcgga 480
gcaggtggtc acaaaccagt gattggcctg tcgtaacgcg caagtccgtg gcggaaccga 540
ctactttggg tgtccgtgtt tccttttatt ttattgtggc tgcttatggt gacaatcaca 600
gattgttatc ataaagcgaa ttggattggc catccggtga aagtgagact cattatctat 660
ctgtttgctg gatccgctcc attgagtgtg tttactctaa gtacaatttc aacagttatt 720
tcaatcagac aattgtatca taatgggtgc tcaggtttcg tctcagaagg taggtgctca 780
cgaaaatagc aacagggcat acggatcatc cacaatcaac tatacaacaa tcaactacta 840
ccgggactcc gcctccaatg cagcttcgaa acaagatttt agccaggatc catctaaatt 900
tactgaacca attaaagacg tgctcatcaa gactgcacct atgttgaata gccctaacat 960
tgaagcctgt ggctactcag accgggtgct tcagctgacc ctcggtaatt caaccatcac 1020
aacgcaagaa gctgcaaaca gcgtggtggc atacggaagg tggccagagt acttaagaga 1080
ttctgaggca aaccctgtcg atcaaccaac cgagccggac gtcgcggcgt gtcgattcta 1140
caccctcgat actgtaagct ggaccaagga atcgcgaggt tggtggtgga aacttccaga 1200
cgccctacgc gatatgggtt tgttcggtca gaacatgtat tatcattatt tgggacgctc 1260
tggatataca gtccacgtgc aatgcaatgc ttcaaagttt catcagggag ctttgggtgt 1320
gttcgcggtg ccggaaatgt gcttagcagg agactcaaat acgaccacaa tgcatacttc 1380
ttaccagaac gcaaaccccg gagaaaaggg cggtacgttt accgggacct ttaccccaga 1440
taataatcaa acctccccag caagacgttt ttgtccagtt gactatttgt tgggcaacgg 1500
tacactacta gggaatgcct tcgtatttcc tcatcagatt atcaatctta gaactaataa 1560
ttgcgcaact ctcgtgttgc catatgtaaa ttctctgtcc atcgactcga tggtgaaaca 1620
taacaactgg gggatagcaa tattacctct cgcgcctctg aacttcgcgt cagaatcaag 1680
tccggaaatc ccgataacac ttactatcgc tcccatgtgt tgcgagttca acgggctcag 1740
gaatataaca ctacccaggc tgcaagggct accagttatg aatacaccag gatctaacca 1800
gtacttaacc gccgataact tccaatcccc atgcgcctta ccagagttcg atgtcacgcc 1860
gcccatcgat atccctgggg aggtgaaaaa tatgatggag cttgccgaga ttgatacaat 1920
gataccattc gatctgtccg caactaagaa aaatacaatg gagatgtacc gtgtgagact 1980
ttccgataag cctcacaccg acgacccaat tctgtgtctc agtctatctc ctgcaagtga 2040
ccctaggctt agccacacca tgctgggcga gatattgaac tattataccc actgggcggg 2100
cagtcttaaa ttcaccttct tattttgtgg gtcaatgatg gctacgggta agttgctagt 2160
aagctacgct ccaccaggcg cagatcctcc gaagaaaagg aaagaagcta tgcttgggac 2220
ccacgtcatt tgggatattg gtttacaatc ttcgtgcacc atggtggttc cttggatatc 2280
aaatacgacc tacagacaga caatcgacga ctcctttacg gagggtggtt atatatcagt 2340
gttttatcag acccgtattg tggtgccact gtctacccca cgggaaatgg atattctggg 2400
attcgtctcc gcctgcaacg acttctcagt caggctccta agggacacga cccacattga 2460
acagaaggcg ctagcacaag gactgggtca aatgttggag tcaatgatag ataataccgt 2520
aagggagacc gtaggagctg ccacttcacg ggatgcactg ccgaatacag aggcatcagg 2580
gcccacccat tcaaaagaga tcccagctct gacagctgta gagaccggtg caaccaaccc 2640
actagtccca tcggacactg ttcagacacg gcacgtggtg cagcacagaa gtagatccga 2700
atcctcgatt gaaagctttt tcgccagagg cgcctgtgta acaataatga cggtagacaa 2760
tcccgcaagt actaccaaca aagacaaact gttcgctgtc tggaaaataa catacaagga 2820
caccgtacaa ctgagaagaa agcttgaatt ttttacttac agcaggttcg acatggagtt 2880
aacattcgta gtgaccgcta acttcaccga aaccaataac gggcacgccc tgaaccaggt 2940
ttatcagata atgtacgtac cgccgggtgc ccccgtaccc gaaaagtggg atgattatac 3000
ttggcagact agctccaacc cttccatatt ctatacttat ggcaccgcgc cggcgagaat 3060
ttcagttcca tacgtgggaa tatcaaatgc atactctcat ttctatgatg gcttctcaaa 3120
ggtgccttta aaagaccaat cagcggccct gggagattcg ttgtacgggg ccgcctcctt 3180
gaacgatttt gggatcctag cagtgagggt ggtgaacgac cataatccaa cgaaggtcac 3240
cagtaagata cgggtctact tgaagcctaa gcatattcgt gtgtggtgtc caagacctcc 3300
acgcgccgtc gcatattatg gacccggtgt cgactataaa gacgggacct tgaccccact 3360
gagtacaaaa gacctcacaa cttacggatt cggacaccaa aacaaagcgg tgtacactgc 3420
aggttacaaa atttgcaact accacttggc cactcaggat gatttgcaaa acgcagtgaa 3480
cgtcatgtgg agtagagacc tcttagtcac agaatcaaga gcccagggca ccgattcaat 3540
cgcaaggtgc aattgcaacg caggggtgta ctactgcgag tctagaagga aatactaccc 3600
agtatccttc gttggcccaa cgttccagta catggaggct aataactatt acccagctag 3660
gtaccagtcc catatgctca ttggccatgg attcgcatct ccaggggatt gtggtggcat 3720
actcagatgt caccacgggg tgatagggat cattactgct ggtggagaag ggttggttgc 3780
attttcagac attagagact tgtatgccta cgaagaagaa gccatggaac aaggcctcac 3840
caattacata gagtcacttg gggccgcatt tggaagtgga tttactcagc agattagcga 3900
caaaataaca gagttgacca atatggtgac cagtaccatc actgaaaagc tacttaagaa 3960
cttgatcaag atcatatcct cactagttat tataactagg aactatgaag acaccacaac 4020
agtgctcgct accctggccc ttcttgggtg tgatgcttca ccatggcagt ggcttagaaa 4080
gaaagcatgc gatgttctgg agatacctta tgtcatcaag caaggtgaca gttggttgaa 4140
gaagtttact gaagcatgca acgcagctaa gggactggag tgggtgtcaa acaaaatctc 4200
aaaattcatt gattggctca aggagaaaat tatcccacaa gctagagata agttggaatt 4260
tgtaacaaaa cttagacaac tagaaatgct ggaaaaccaa atctcaacta tacaccaatc 4320
atgccctagt caggaacacc aggaaattct attcaataat gtcagatggt tatccatcca 4380
gtctaagagg tttgcccctc tttacgcagt ggaagccaaa agaatacaga aactcgagca 4440
tactattaac aactacatac agttcaagag caaacaccgt attgaaccag tatgtttgct 4500
agtacatggc agccccggaa caggtaaatc tgtagcaacc aacctgattg ctagagccat 4560
agctgaaaga gaaaacacgt ccacgtactc gctacccccg gatccatcac acttcgacgg 4620
atacaaacaa cagggagtgg tgattatgga cgacctgaat caaaacccag atggtgcgga 4680
catgaagctg ttctgtcaga tggtatcaac agtggagttt ataccaccca tggcatccct 4740
ggaggagaaa ggaatcctgt ttacttcaaa ttacgttcta gcatccacaa actcaagcag 4800
aatttccccc cccactgtgg cacacagtga cgcgttagcc aggcgctttg cgttcgacat 4860
ggacattcag gtcatgaatg agtattctag agatgggaaa ttgaacatgg ccatggctac 4920
tgaaatgtgt aagaactgtc accaaccagc aaactttaag agatgctgtc ctttagtgtg 4980
tggtaaggca attcaattaa tggacaaatc ttccagagtt agatacagta ttgaccagat 5040
cactacaatg attatcaatg agagaaacag aagatccaac attggcaatt gtatggaggc 5100
tttgtttcaa ggaccactcc agtataaaga cttgaaaatt gacatcaaga cgagtccccc 5160
tcctgaatgt atcaatgact tgctccaagc agttgactcc caggaggtga gagattactg 5220
tgagaagaag ggttggatag ttaacatcac cagccaggtt caaacagaaa ggaacatcaa 5280
cagggcaatg acaattctac aagcggtgac aaccttcgcc gcagtggctg gagttgtcta 5340
tgtcatgtat aaactgtttg ctggacacca gggagcatac actggtttac caaacaaaaa 5400
acccaacgtg cccaccattc ggacagcaaa ggtacaagga ccagggttcg attacgcagt 5460
ggctatggct aaaagaaaca ttgttacagc aactactagc aagggagagt tcactatgtt 5520
aggagtccac gacaacgtgg ctattttacc aacccacgct tcacctggtg aaagcattgt 5580
gatcgatggc aaagaagtgg agatcttgga tgccaaagcg ctcgaagatc aagcaggaac 5640
caatcttgaa atcactataa tcactctaaa gagaaatgaa aagttcagag acattagacc 5700
acatatacct actcaaatca ctgagacaaa tgatggagtc ttgatcgtga acactagcaa 5760
gtaccccaat atgtatgttc ctgtcggtgc tgtgactgaa cagggatatc taaatctcgg 5820
tgggcgccaa actgctcgta ctctaatgta caactttcca accagagcag gacagtgtgg 5880
tggagtcatc acatgtactg ggaaagtcat cgggatgcat gttggtggga acggttcaca 5940
cgggtttgca gcggccctga agcgatcata cttcactcag agtcaaggtg aaatccagtg 6000
gatgagacct tcgaaggaag tgggatatcc aatcataaat gccccgtcca aaaccaagct 6060
tgaacccagt gctttccact atgtgtttga aggggtgaag gaaccagcag tcctcactaa 6120
aaacgatccc aggcttaaga cagactttga ggaggcaatt ttctccaagt acgtgggtaa 6180
caaaattact gaagtggatg agtacatgaa agaggcagta gaccactatg ctggccagct 6240
catgtcacta gacatcaaca tagaacaaat gtgcttggag gatgccatgt atggcactga 6300
tggtctagaa gcacttgatt tgtccaccag tgctggctac ccttatgtag caatgggaaa 6360
gaagaagaga gacatcttga acaaacaaac cagagacact aaggaaatgc aaaaactgct 6420
cgacacatat ggaatcaacc tcccactggt gacttatgta aaggatgaac ttagatccaa 6480
aacaaaggtt gagcagggga aatccagatt aattgaagct tctagtttga atgactcagt 6540
ggcaatgaga atggcttttg ggaacctata tgctgctttt cacaaaaacc caggagtgat 6600
aacaggttca gcagtggggt gcgatccaga tttgttttgg agcaaaattc cggtattgat 6660
ggaagagaag ctgtttgctt ttgactacac agggtatgat gcatctctca gccctgcttg 6720
gttcgaggca ctaaagatgg tgcttgagaa aatcggattc ggagacagag ttgactacat 6780
cgactaccta aaccactcac accacctgta caagaataaa acatactgtg tcaagggcgg 6840
tatgccatct ggctgctcag gcacttcaat ttttaactca atgattaaca acttgattat 6900
caggacactc ttactgaaaa cctacaaggg catagattta gaccacctaa aaatgattgc 6960
ctatggtgat gatgtaattg cttcctaccc ccatgaagtt gacgctagtc tcctagccca 7020
atcaggaaaa gactatggac taactatgac tccagctgac aaatcagcta catttgaaac 7080
agtcacatgg gagaatgtaa cattcttgaa gagattcttc agggcagacg agaaataccc 7140
atttcttatt catccagtaa tgccaatgaa ggaaattcat gaatcaatta gatggacaaa 7200
agatcctagg aacactcagg atcacgttcg ctctctgtgc cttttagctt ggcacaatgg 7260
cgaagaagaa tataacaaat tcctagctaa aatcaggagt gtgccaattg gaagagcttt 7320
attgctccca gagtactcaa cattgtaccg ccgttggctt gactcatttt agtaacccta 7380
cctcagtcga attggattgg gtcatactgg tgtaggggta aatttttctt taattcggag 7440
gaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 7500
aaaaaaaaaa aaaaaaaaaa a 7521
<210> 4
<211> 2643
<212> DNA
<213> Unknown
<220>
<223> synthetic
<400> 4
atgggagctc aggtgtcatc ccaaaaagta ggcgcacacg aaaactcgaa tcgggcatac 60
ggatctagta cgattaacta tactacaatc aattactata gggactccgc ctctaacgcc 120
gcttcgaaac aggacttttc gcaagaccct agcaagttta ccgaaccgat taaggacgtg 180
ttgatcaaaa ccgcacctat gcttaactca cctaacatag aggcatgcgg atactccgat 240
agggtgttgc aactgacact cggcaatagt acgattacga cacaggaagc cgctaatagc 300
gtagtcgcat acggaaggtg gcccgaatac cttagagact ccgaagcgaa tccagtcgat 360
cagcctaccg aacctgacgt cgccgcatgt cggttttaca cactcgatac cgtgtcatgg 420
actaaggaat cgcgagggtg gtggtggaaa ctgccagacg cattgcgcga tatggggttg 480
ttcggacaga atatgtacta tcactatctc ggaagatccg ggtataccgt acacgtgcaa 540
tgtaacgcct ctaagtttca ccagggagcg ttaggcgtat tcgcagtgcc agagatgtgt 600
ctagccggag actccaatac gactactatg catacctcat accaaaacgc taacccaggc 660
gaaaaggggg ggacatttac cggaacattc acacccgata acaatcagac atcccccgct 720
agacggtttt gcccagtcga ctatctactc ggaaacggta cactgttagg gaatgccttc 780
gtattcccac accagataat taacttacgg actaacaatt gcgcaaccct agtgttgcca 840
tacgttaact cactgtcaat cgatagtatg gtgaaacata acaattgggg gatcgcaata 900
ttaccgttag cgccactgaa tttcgccagc gaatcgtcac ctgagatacc gattaccctt 960
acaatcgcac ctatgtgttg cgagttcaac ggattgcgta atataaccct accacggttg 1020
caggggttgc ccgttatgaa taccccaggg tctaaccaat accttaccgc cgataatttc 1080
caatcccctt gcgcactgcc agagttcgac gtaacccctc caatcgacat acccggcgag 1140
gttaagaata tgatggagtt agccgaaatc gatactatga taccgttcga tctatccgct 1200
acgaaaaaga atactatgga gatgtatcgc gtgagattgt ccgataagcc acataccgac 1260
gatccgatac tgtgtctgtc actgtcaccc gccagcgatc ctaggttgtc ccatacaatg 1320
ttaggcgaga tactgaatta ctatacccat tgggccggta gtctgaaatt cacatttctg 1380
ttttgcggat ctatgatggc gaccggaaag ctgttagtgt catacgctcc acccggagcc 1440
gatccaccta aaaaacgcaa ggaagcgatg ctcggtacac acgtgatatg ggatatcgga 1500
ctgcaatcgt catgtactat ggtcgtgcca tggatatcga atacgactta tagacagaca 1560
atcgacgata gctttaccga gggggggtat attagcgtat tctatcagac acgtatcgta 1620
gtgccactgt caacccctag agagatggac atactcggat tcgtatccgc atgtaacgac 1680
tttagcgtga gactgttacg cgatactacc catatcgaac agaaagcgct agcacagggg 1740
ttagggcaaa tgctagagtc aatgatcgac aatactgtac gcgaaaccgt aggcgcagcg 1800
accagtaggg acgcactacc gaataccgaa gcgagcggac ctacccactc taaagagata 1860
ccggcactaa ccgccgtcga aaccggagcg actaacccac tagtcccatc cgataccgtg 1920
caaaccagac acgtagtgca acatcggtct agatccgagt catcaatcga atcctttttc 1980
gctagaggcg catgcgttac gattatgacc gtcgataacc cagcgtcaac gactaacaaa 2040
gacaaattgt tcgccgtatg gaaaattacc tataaggata ccgtgcaatt gcgacgtaaa 2100
ctagagttct ttacatactc tagattcgat atggagctta cattcgtagt gaccgctaac 2160
tttaccgaga ctaataacgg tcacgccctt aatcaggtgt atcagattat gtacgtaccg 2220
ccaggcgcac cagtgcccga aaaatgggac gactatacat ggcagactag ctctaatccg 2280
tcaattttct atacatacgg taccgcacca gctaggatta gcgtgccata cgtcggtata 2340
tcgaacgctt actcacactt ttacgacgga ttctctaaag tgccacttaa ggaccaatcc 2400
gccgcactag gcgatagcct atacggagcc gctagtctta acgatttcgg tatactcgcc 2460
gttagggtcg tgaacgacca taaccctact aaggtcacct ctaagattag ggtgtatctt 2520
aagcctaagc atattagggt gtggtgtcct agaccgccta gagccgttgc gtattacgga 2580
ccaggcgtcg actataagga cggtacattg accccactgt caacgaaaga ccttacgacg 2640
tac 2643
<210> 5
<211> 2643
<212> DNA
<213> Unknown
<220>
<223> synthetic
<400> 5
atgggagctc aagtatcttc acaaaaagtt ggtgctcatg aaaattcaaa cagagcatat 60
ggttcttcaa caataaacta caccacaata aattattaca gggacagtgc ttcaaatgca 120
gcttcgaaac aagatttttc tcaagatcct tccaagttca cagagcccat caaagatgtt 180
ttaataaaaa cagcacccat gctgaacagc cccaacattg aagcatgtgg ttatagtgac 240
agagttctac agctcacgct gggaaattca acaataacaa ctcaagaagc agcaaattct 300
gtggtggcct atggtcgttg gccagagtat ctgcgggact cggaggcaaa tcctgtggac 360
cagccaacag agccggacgt cgctgcctgc cgcttctaca cgttagacac ggtctcctgg 420
accaaggagt cgcgaggctg gtggtggaaa cttccagatg ctctgcggga catgggcctc 480
tttgggcaga acatgtacta tcattatttg ggaagaagtg gctacacggt ccatgtgcag 540
tgtaatgcat ccaagtttca tcaaggtgcc ctgggcgtgt tcgcggttcc tgagatgtgt 600
ttggctgggg acagcaacac caccaccatg cacacgtcct accaaaatgc aaatccagga 660
gaaaaaggtg gcaccttcac gggcaccttc actccagaca acaaccagac ctcgccggcg 720
cgccgcttct gcccagtaga ttatcttctt ggaaatggca cgctgctggg gaatgccttt 780
gtatttcctc atcaaataat aaatttgagg accaacaact gtgccacctt ggttcttcct 840
tatgtcaaca gcctctccat tgactccatg gtgaagcaca acaactgggg aatagcaata 900
ttacctttgg cacctttaaa ttttgcctcg gagagttctc cagagatccc catcaccctc 960
accatcgcgc cgatgtgctg cgagttcaat gggctgagga acatcaccct gcccaggcta 1020
caaggtcttc ctgtcatgaa cacaccaggt tcaaatcagt atttaacagc agacaacttc 1080
cagtctccat gtgctttgcc agaatttgat gtcactccac caatagatat tccaggagaa 1140
gtaaagaaca tgatggaact agcagaaata gacaccatga ttccatttga tctttcagcc 1200
accaagaaga acaccatgga gatgtaccgt gtcaggcttt cagataaacc acacacagat 1260
gatccaattc tctgcctcag tctttctcca gcctcggacc ctaggctcag ccacaccatg 1320
ctaggagaga tattaaatta ttacacgcac tgggcaggct ccctgaagtt caccttcctc 1380
ttctgtggct ccatgatggc aactggaaaa ttattagtat catatgcgcc gccgggggca 1440
gatcctccaa agaagaggaa ggaggccatg ctaggaactc atgtaatatg ggacattggg 1500
ttgcagagca gctgcaccat ggttgttccc tggatctcca acaccaccta caggcagacc 1560
attgatgaca gcttcacaga aggtggttat atttctgtct tctaccagac aagaattgtg 1620
gtgccgctgt ccactccaag agaaatggat attcttggat ttgtatcagc ctgcaatgac 1680
ttctctgtga ggctgctgcg ggacaccact catattgagc agaaggcgct agcacaagga 1740
cttggacaaa tgctggagtc catgattgac aacactgtgc gggagactgt gggggcggcc 1800
acctcaagag atgctttgcc aaatacagag gcttcggggc caacacacag caaagaaata 1860
ccagctttga cagcagtaga aactggagca acaaatccac tagtcccttc agatactgta 1920
caaacaagac atgtggtgca gcacagatca agaagtgaaa gttcaataga atccttcttt 1980
gctcgtgggg cctgtgtcac catcatgact gtggacaacc cagcctccac caccaacaaa 2040
gataaattat ttgctgtgtg gaagatcacc tacaaagata ctgtgcagct aagaagaaaa 2100
ctagagttct tcacctactc aagatttgac atggaactaa cttttgtggt cacagccaac 2160
ttcacagaga ccaacaatgg acatgctttg aatcaagtct accagattat gtacgtacca 2220
ccaggggctc ctgtgcccga aaaatgggat gactacacgt ggcagacttc atcaaatcct 2280
tccatcttct acacatatgg aacagcgccg gccaggatat cagttcctta tgtgggcatc 2340
tcaaatgctt acagccactt ctatgatggc ttctccaaag tacctttgaa ggaccagtcg 2400
gcggcgctgg gggacagttt atatggtgca gcatctctaa atgattttgg aattttggct 2460
gtccgtgtag taaatgacca caaccccacc aaggtcacca gcaagatccg agtatattta 2520
aaaccaaagc acatccgagt gtggtgtccg agaccgccaa gagctgtagc gtattacggt 2580
cctggtgtgg actataaaga tgggactttg actcctttgt ccaccaaaga cctcaccacg 2640
tac 2643
<210> 6
<211> 7441
<212> DNA
<213> Unknown
<220>
<223> synthetic
<400> 6
ttaaaacagc tctggggttg tacccacccc agaggcccac gtggcggcta gtactccggt 60
attgcggtac ccttgtacgc ctgttttata ctcccttccc gtaacttaga cgcacaaaac 120
caagttcaat agaagggggt acaaaccagt accaccacga acaagcactt ctgtttcccc 180
ggtgatgtcg tatagactgc ttgcgtggtt gaaagcgacg gatccgttat ccgcttatgt 240
acttcgagaa gcccagtacc acctcggaat cttcgatgcg ttgcgctcag cactcaaccc 300
cagagtgtag cttaggctga tgagtctgga catccctcac cggtgacggt ggtccaggct 360
gcgttggcgg cctacctatg gctaacgcca tgggacgcta gttgtgaaca aggtgtgaag 420
agcctattga gctacataag aatcctccgg cccctgaatg cggctaatcc caacctcgga 480
gcaggtggtc acaaaccagt gattggcctg tcgtaacgcg caagtccgtg gcggaaccga 540
ctactttggg tgtccgtgtt tccttttatt ttattgtggc tgcttatggt gacaatcaca 600
gattgttatc ataaagcgaa ttggattggc catccggtga aagtgagact cattatctat 660
ctgtttgctg gatccgctcc attgagtgtg tttactctaa gtacaatttc aacagttatt 720
tcaatcagac aattgtatca taatgggcgc gcaagtgtcg tctcaaaagg ttggagccca 780
cgagaatagt aacagagcat acggatcaag cacaataaat tatacgacga tcaattacta 840
ccgtgactcg gcatccaacg ccgctagcaa acaggacttt tctcaggatc catctaaatt 900
cacggaaccc ataaaagacg tgcttattaa gaccgcacct atgctgaatt caccgaatat 960
cgaagcctgt ggttactctg accgggtgct acagctgaca cttggcaact caacgatcac 1020
aacccaagag gccgcaaatt ccgtagtagc gtacggtagg tggccagagt acctacgtga 1080
ttcagaggct aaccctgtag atcaacctac cgaaccggac gtggcagctt gtcgtttcta 1140
cactcttgat accgtgtcct ggaccaagga aagtaggggt tggtggtgga aactccccga 1200
cgcccttagg gatatggggc tgttcggtca gaacatgtac tatcactatc tgggacgctc 1260
aggctatacg gtacacgtgc aatgcaacgc aagtaagttt catcagggcg cgctgggagt 1320
gttcgcagtt ccggaaatgt gcctagctgg cgactcaaat acaacgacta tgcatacaag 1380
ttatcagaac gcgaacccag gagaaaaggg gggaacattt acaggcacat ttaccccaga 1440
taataaccaa acctccccag cacggagatt ctgtcctgta gactacttgt tggggaacgg 1500
aaccctactt ggtaacgcat tcgtttttcc acatcaaatt atcaatctta gaactaataa 1560
ttgtgcaact ctcgtgttgc catatgtcaa ttccttgtcg atagactcca tggtcaaaca 1620
taacaactgg ggcatagcca ttctaccgct cgcaccactg aacttcgcat ccgaatcctc 1680
acccgaaatc cccataacac tcacaatcgc accaatgtgt tgcgaattta acggactgcg 1740
gaatataacc ctaccgagac tccagggttt acccgtaatg aatacgccag gatcaaatca 1800
gtacttaacc gccgataatt tccaatcccc atgcgcctta ccagaattcg acgtaacgcc 1860
tccaattgat attccaggag aggtgaaaaa tatgatggag ctcgcagaga ttgatactat 1920
gataccgttc gatctttccg ctaccaagaa aaatacgatg gagatgtacc gcgtgagact 1980
gtccgataag ccacacaccg atgacccaat actgtgttta agtttgtctc cagcttccga 2040
cccacgtctc tctcatacca tgttagggga gatacttaac tattatactc attgggccgg 2100
gtcattaaag tttaccttcc tgttttgcgg gtctatgatg gccaccggga agctgctagt 2160
tagctatgcc ccacctggtg cggatcctcc taaaaagaga aaagaagcaa tgctcggtac 2220
ccacgtaatt tgggatattg gactgcaatc gagctgcacc atggtggtgc cttggatatc 2280
taatacaacc tacagacaga caatcgacga ctcattcaca gagggtgggt atatatcggt 2340
gttttatcag acccgaatcg ttgtgccatt gtccacccct cgggaaatgg atatccttgg 2400
cttcgtgagt gcttgcaacg acttttcagt gagactacta agggacacta cgcatattga 2460
acagaaggca ctggctcaag gcctgggcca aatgctcgag tcaatgatcg ataataccgt 2520
gagagagacc gtaggtgcag cgacctcaag ggacgcgttg cctaataccg aggcgtccgg 2580
gccgactcac agtaaagaga taccagcgtt aacagcagtc gaaaccggtg cgactaatcc 2640
cttggtgcca agcgatacag tgcaaacaag gcacgtagtc cagcaccgat ccaggtcgga 2700
aagctctatc gagtcctttt ttgctagggg ggcttgtgtc actataatga cagtcgacaa 2760
tccggcatca acaaccaaca aagacaagtt attcgctgta tggaaaatta cctacaagga 2820
caccgtccaa ctgagacgga agttagaatt ctttacatac tcacggttcg acatggaatt 2880
gactttcgta gtgaccgcta actttaccga aaccaataac ggtcacgccc tgaatcaggt 2940
ataccagatc atgtacgtcc ctcctggggc accagttccg gagaaatggg atgactatac 3000
ttggcagaca tctagcaacc ctagcatttt ctacacttat ggtaccgccc ccgctagaat 3060
tagtgtgcct tacgtaggaa tttcaaacgc atatagccat ttctacgacg gattctcaaa 3120
ggtgccatta aaggatcaga gcgcggcctt gggggattcg ttgtacggag ccgcttcatt 3180
gaacgatttc gggatactag cagtcagggt cgtgaacgac cataacccta ctaaagtgac 3240
atcgaagata cgcgtctacc ttaagccaaa acacatcagg gtgtggtgtc ctaggccgcc 3300
aagagccgtc gcctattatg gtcccggtgt cgattataaa gacggaaccc tgaccccatt 3360
gtcaactaaa gacctaacca cttatggatt cggacaccaa aacaaagcgg tgtacactgc 3420
aggttacaaa atttgcaact accacttggc cactcaggat gatttgcaaa acgcagtgaa 3480
cgtcatgtgg agtagagacc tcttagtcac agaatcaaga gcccagggca ccgattcaat 3540
cgcaaggtgc aattgcaacg caggggtgta ctactgcgag tctagaagga aatactaccc 3600
agtatccttc gttggcccaa cgttccagta catggaggct aataactatt acccagctag 3660
gtaccagtcc catatgctca ttggccatgg attcgcatct ccaggggatt gtggtggcat 3720
actcagatgt caccacgggg tgatagggat cattactgct ggtggagaag ggttggttgc 3780
attttcagac attagagact tgtatgccta cgaagaagaa gccatggaac aaggcctcac 3840
caattacata gagtcacttg gggccgcatt tggaagtgga tttactcagc agattagcga 3900
caaaataaca gagttgacca atatggtgac cagtaccatc actgaaaagc tacttaagaa 3960
cttgatcaag atcatatcct cactagttat tataactagg aactatgaag acaccacaac 4020
agtgctcgct accctggccc ttcttgggtg tgatgcttca ccatggcagt ggcttagaaa 4080
gaaagcatgc gatgttctgg agatacctta tgtcatcaag caaggtgaca gttggttgaa 4140
gaagtttact gaagcatgca acgcagctaa gggactggag tgggtgtcaa acaaaatctc 4200
aaaattcatt gattggctca aggagaaaat tatcccacaa gctagagata agttggaatt 4260
tgtaacaaaa cttagacaac tagaaatgct ggaaaaccaa atctcaacta tacaccaatc 4320
atgccctagt caggaacacc aggaaattct attcaataat gtcagatggt tatccatcca 4380
gtctaagagg tttgcccctc tttacgcagt ggaagccaaa agaatacaga aactcgagca 4440
tactattaac aactacatac agttcaagag caaacaccgt attgaaccag tatgtttgct 4500
agtacatggc agccccggaa caggtaaatc tgtagcaacc aacctgattg ctagagccat 4560
agctgaaaga gaaaacacgt ccacgtactc gctacccccg gatccatcac acttcgacgg 4620
atacaaacaa cagggagtgg tgattatgga cgacctgaat caaaacccag atggtgcgga 4680
catgaagctg ttctgtcaga tggtatcaac agtggagttt ataccaccca tggcatccct 4740
ggaggagaaa ggaatcctgt ttacttcaaa ttacgttcta gcatccacaa actcaagcag 4800
aatttccccc cccactgtgg cacacagtga cgcgttagcc aggcgctttg cgttcgacat 4860
ggacattcag gtcatgaatg agtattctag agatgggaaa ttgaacatgg ccatggctac 4920
tgaaatgtgt aagaactgtc accaaccagc aaactttaag agatgctgtc ctttagtgtg 4980
tggtaaggca attcaattaa tggacaaatc ttccagagtt agatacagta ttgaccagat 5040
cactacaatg attatcaatg agagaaacag aagatccaac attggcaatt gtatggaggc 5100
tttgtttcaa ggaccactcc agtataaaga cttgaaaatt gacatcaaga cgagtccccc 5160
tcctgaatgt atcaatgact tgctccaagc agttgactcc caggaggtga gagattactg 5220
tgagaagaag ggttggatag ttaacatcac cagccaggtt caaacagaaa ggaacatcaa 5280
cagggcaatg acaattctac aagcggtgac aaccttcgcc gcagtggctg gagttgtcta 5340
tgtcatgtat aaactgtttg ctggacacca gggagcatac actggtttac caaacaaaaa 5400
acccaacgtg cccaccattc ggacagcaaa ggtacaagga ccagggttcg attacgcagt 5460
ggctatggct aaaagaaaca ttgttacagc aactactagc aagggagagt tcactatgtt 5520
aggagtccac gacaacgtgg ctattttacc aacccacgct tcacctggtg aaagcattgt 5580
gatcgatggc aaagaagtgg agatcttgga tgccaaagcg ctcgaagatc aagcaggaac 5640
caatcttgaa atcactataa tcactctaaa gagaaatgaa aagttcagag acattagacc 5700
acatatacct actcaaatca ctgagacaaa tgatggagtc ttgatcgtga acactagcaa 5760
gtaccccaat atgtatgttc ctgtcggtgc tgtgactgaa cagggatatc taaatctcgg 5820
tgggcgccaa actgctcgta ctctaatgta caactttcca accagagcag gacagtgtgg 5880
tggagtcatc acatgtactg ggaaagtcat cgggatgcat gttggtggga acggttcaca 5940
cgggtttgca gcggccctga agcgatcata cttcactcag agtcaaggtg aaatccagtg 6000
gatgagacct tcgaaggaag tgggatatcc aatcataaat gccccgtcca aaaccaagct 6060
tgaacccagt gctttccact atgtgtttga aggggtgaag gaaccagcag tcctcactaa 6120
aaacgatccc aggcttaaga cagactttga ggaggcaatt ttctccaagt acgtgggtaa 6180
caaaattact gaagtggatg agtacatgaa agaggcagta gaccactatg ctggccagct 6240
catgtcacta gacatcaaca tagaacaaat gtgcttggag gatgccatgt atggcactga 6300
tggtctagaa gcacttgatt tgtccaccag tgctggctac ccttatgtag caatgggaaa 6360
gaagaagaga gacatcttga acaaacaaac cagagacact aaggaaatgc aaaaactgct 6420
cgacacatat ggaatcaacc tcccactggt gacttatgta aaggatgaac ttagatccaa 6480
aacaaaggtt gagcagggga aatccagatt aattgaagct tctagtttga atgactcagt 6540
ggcaatgaga atggcttttg ggaacctata tgctgctttt cacaaaaacc caggagtgat 6600
aacaggttca gcagtggggt gcgatccaga tttgttttgg agcaaaattc cggtattgat 6660
ggaagagaag ctgtttgctt ttgactacac agggtatgat gcatctctca gccctgcttg 6720
gttcgaggca ctaaagatgg tgcttgagaa aatcggattc ggagacagag ttgactacat 6780
cgactaccta aaccactcac accacctgta caagaataaa acatactgtg tcaagggcgg 6840
tatgccatct ggctgctcag gcacttcaat ttttaactca atgattaaca acttgattat 6900
caggacactc ttactgaaaa cctacaaggg catagattta gaccacctaa aaatgattgc 6960
ctatggtgat gatgtaattg cttcctaccc ccatgaagtt gacgctagtc tcctagccca 7020
atcaggaaaa gactatggac taactatgac tccagctgac aaatcagcta catttgaaac 7080
agtcacatgg gagaatgtaa cattcttgaa gagattcttc agggcagacg agaaataccc 7140
atttcttatt catccagtaa tgccaatgaa ggaaattcat gaatcaatta gatggacaaa 7200
agatcctagg aacactcagg atcacgttcg ctctctgtgc cttttagctt ggcacaatgg 7260
cgaagaagaa tataacaaat tcctagctaa aatcaggagt gtgccaattg gaagagcttt 7320
attgctccca gagtactcaa cattgtaccg ccgttggctt gactcatttt agtaacccta 7380
cctcagtcga attggattgg gtcatactgg tgtaggggta aatttttctt taattcggag 7440
g 7441
<210> 7
<211> 32
<212> DNA
<213> Unknown
<220>
<223> synthetic
<400> 7
gcactgataa tgaactcctc tggatctact gg 32
<210> 8
<211> 32
<212> DNA
<213> Unknown
<220>
<223> synthetic
<400> 8
ccagtagatc cagaggagtt cattatcagt gc 32
<210> 9
<211> 50
<212> DNA
<213> Unknown
<220>
<223> synthetic
<400> 9
caagaattcc tgaccacata cggtgctcag gtttcatcac agaaagtggg 50
<210> 10
<211> 50
<212> DNA
<213> synthetic
<400> 10
caagaattcc tgaccacata cggtgcgcaa gtatcgtcgc aaaaagtagg 50
<210> 11
<211> 40
<212> DNA
<213> Unknown
<220>
<223> synthetic
<400> 11
ttcgaattct ccatatgtgg tcagatcctt ggtggagagg 40
<210> 12
<211> 41
<212> DNA
<213> Unknown
<220>
<223> synthetic
<400> 12
ttcgaattct ccatacgtcg ttaaatcttt cgtcgataac g 41
<210> 13
<211> 2341
<212> DNA
<213> Influenza virus
<400> 13
agcgaaagca ggcaaaccat ttgaatggat gtcaatccga ccttactttt cttaaaagtg 60
ccagcacaaa atgctataag cacaactttc ccttatactg gagaccctcc ttacagccat 120
gggacaggaa caggatacac catggatact gtcaacagga cacatcagta ctcagaaaag 180
ggaagatgga caacaaacac cgaaactgga gcaccgcaac tcaacccgat tgatgggcca 240
ctgccagaag acaatgaacc aagtggttat gcccaaacag attgtgtatt ggaagcaatg 300
gctttccttg aggaatccca tcctggtatt tttgaaaact cgtgtattga aacgatggag 360
gttgttcagc aaacacgagt agacaagctg acacaaggcc gacagaccta tgactggact 420
ctaaatagaa accaacctgc tgcaacagca ttggccaaca caatagaagt gttcagatca 480
aatggcctca cggccaatga gtctggaagg ctcatagact tccttaagga tgtaatggag 540
tcaatgaaaa aagaagaaat ggggatcaca actcattttc agagaaagag acgggtgaga 600
gacaatatga ctaagaaaat gataacacag agaacaatag gtaaaaagaa gcagagattg 660
aacaaaagga gttatctaat tagagcattg accctgaaca caatgaccaa agatgctgag 720
agagggaagc taaaacggag agcaattgca accccaggga tgcaaataag ggggtttgta 780
tactttgttg agacactggc aaggagtata tgtgagaaac ttgaacaatc agggttgcca 840
gttggaggca atgagaagaa agcaaagttg gcaaatgttg taaggaagat gatgaccaat 900
tctcaggaca ccgaactttc tttcaccatc actggagata acaccaaatg gaacgaaaat 960
cagaatcctc ggatgttttt ggccatgatc acatatatga caagaaatca gcccgaatgg 1020
ttcagaaatg ttctaagtat tgctccaata atgttctcaa acaaaatggc gagactggga 1080
aaagggtata tgtttgagag caagagtatg aaacttagaa ctcaaatacc tgcagaaatg 1140
ctagcaagca tcgatttgaa atatttcaat gattcaacaa gaaagaagat tgaaaaaatc 1200
cgaccgctct taatagaggg gactgcatca ttgagccctg gaatgatgat gggcatgttc 1260
aatatgttaa gcactgtatt aggcgtctcc atcctgaatc ttggacaaaa gagatacacc 1320
aagactactt actggtggga tggtcttcaa tcctctgacg attttgctct gattgtgaat 1380
gcacccaatc atgaagggat tcaagccgga gtcgacaggt tttatcgaac ctgtaagcta 1440
cttggaatca atatgagcaa gaaaaagtct tacataaaca gaacaggtac atttgaattc 1500
acaagttttt tctatcgtta tgggtttgtt gccaatttca gcatggagct ccccagtttt 1560
ggggtgtctg ggatcaacga gtcagcggac atgagtattg gagttactgt catcaaaaac 1620
aatatgataa acaatgatct tggtccagca acagctcaaa tggcccttca gttgttcatc 1680
aaagattaca ggtacacgta ccgatgccat agaggtgaca cacaaataca aacccgaaga 1740
tcatttgaaa taaagaaact gtgggagcaa acccgttcca aagctggact gctggtctcc 1800
gacggaggcc caaatttata caacattaga aatctccaca ttcctgaagt ctgcctaaaa 1860
tgggaattga tggatgagga ttaccagggg cgtttatgca acccactgaa cccatttgtc 1920
agccataaag aaattgaatc aatgaacaat gcagtgatga tgccagcaca tggtccagcc 1980
aaaaacatgg agtatgatgc tgttgcaaca acacactcct ggatccccaa aagaaatcga 2040
tccatcttga atacaagtca aagaggagta cttgaagatg aacaaatgta ccaaaggtgc 2100
tgcaatttat ttgaaaaatt cttccccagc agttcataca gaagaccagt cgggatatcc 2160
agtatggtgg aggctatggt ttccagagcc cgaattgatg cacggattga tttcgaatct 2220
ggaaggataa agaaagaaga gttcactgag atcatgaaga tctgttccac cattgaagag 2280
ctcagacggc aaaaatagtg aatttagctt gtccttcatg aaaaaatgcc ttgtttctac 2340
t 2341
<210> 14
<211> 2341
<212> DNA
<213> unknown
<220>
<223> synthetic
<400> 14
agcgaaagca ggcaaaccat ttgaatggat gtcaatccga ccttactttt cttaaaagtg 60
ccagcacaaa atgctataag cacaactttc ccttatactg gagaccctcc ttacagccat 120
gggacaggaa caggatacac catggatact gtcaacagga cacatcagta ctcagaaaag 180
ggaagatgga caacaaacac cgaaactgga gcaccgcaac tcaacccgat tgatgggcca 240
ctgccagaag acaatgaacc aagtggttat gcccaaacag attgtgtatt ggaagcaatg 300
gctttccttg aggaatccca tcctggtatt tttgaaaact cgtgtattga aacgatggag 360
gttgttcagc aaacacgagt agacaagctg acacaaggcc gacagaccta tgactggact 420
ctaaatagaa accaacctgc tgcaacagca ttggccaaca caatagaagt gttcagatca 480
aatggcctca cggccaatga gtctggaagg ctcatagact tccttaagga cgttatggag 540
tctatgaaaa aagaggaaat ggggattacg acacattttc aacgaaaaag acgggttagg 600
gataatatga caaaaaaaat gattacgcaa cgaacaatcg gaaagaaaaa acagagactg 660
aataagcgat catacttgat tagggcactt acacttaaca ctatgactaa ggacgccgaa 720
aggggaaagc taaagcgtag agcaattgca acacccggaa tgcaaattag ggggttcgta 780
tacttcgtcg agacactcgc tagatccata tgcgaaaagt tagagcaatc cggactgcca 840
gtcgggggga acgaaaaaaa agcgaaactc gctaacgtcg ttagaaaaat gatgactaat 900
agtcaggata ccgaactgtc atttacgatt accggcgata atactaagtg gaacgagaat 960
cagaatccta gaatgtttct cgcaatgatc acatatatga cacgtaacca acccgaatgg 1020
tttagaaacg tactgtcaat cgcaccaatt atgtttagca ataagatggc tagattgggc 1080
aaggggtata tgtttgaatc taagagtatg aaattgcgaa cacagatacc tgccgaaatg 1140
ctagcatcaa tcgatctaaa gtactttaac gatagtacac gaaaaaaaat cgaaaagatt 1200
agaccgttac tgatagaggg aaccgccagc ctatcccccg gaatgatgat ggggatgttt 1260
aatatgctta gtaccgtgtt aggcgttagc atacttaact tagggcaaaa acgttatact 1320
aagactacat attggtggga cggactgcaa tctagcgacg atttcgcact aatcgttaac 1380
gcacctaacc atgaggggat acaagccgga gtcgatagat tctatagaac atgcaaactg 1440
ttagggatta atatgtctaa aaaaaagtca tacataaata gaaccggaac atttgaattc 1500
actagctttt tttacagata cggattcgtt gctaatttta gtatggagtt acctagtttc 1560
ggagttagcg gaattaacga atccgccgat atgtcaatcg gcgtaaccgt tattaagaat 1620
aatatgatta ataacgatct agggccagca accgcacaaa tggcattgca gttgttcata 1680
aaggattatc gttatacata tagatgtcat agaggcgata cacagataca gactagacga 1740
tcatttgaaa tcaaaaaatt gtgggagcaa actaggtcta aagccggact gttagtgtcc 1800
gacggagggc ctaatctata caatattagg aatctgcata tacccgaagt gtgtctaaag 1860
tgggagctta tggacgaaga ctatcagggg agattgtgca atccgcttaa cccattcgtt 1920
agccataaag agatagagtc aatgaataac gccgttatga tgccagcaca cggacccgct 1980
aagaatatgg aatacgacgc agtcgcaact acacatagtt ggataccgaa acggaatcga 2040
tccatactga atacatccca aagaggcgta ctcgaagacg aacaaatgta ccaacggtgt 2100
tgcaatctat ttgaaaaatt ttttcctagt agtagctata gacgaccagt cgggatatcc 2160
agtatggtgg aggctatggt ttccagagcc cgaattgatg cacggattga tttcgaatct 2220
ggaaggataa agaaagaaga gttcactgag atcatgaaga tctgttccac cattgaagag 2280
ctcagacggc aaaaatagtg aatttagctt gtccttcatg aaaaaatgcc ttgtttctac 2340
t 2341
<210> 15
<211> 2341
<212> DNA
<213> unknown
<220>
<223> synthetic
<400> 15
agcgaaagca ggcaaaccat ttgaatggat gtcaatccga ccttactttt cttaaaagtg 60
ccagcacaaa atgctataag cacaactttc ccttatactg gagaccctcc ttacagccat 120
gggacaggaa caggatacac catggatact gtcaacagga cacatcagta ctcagaaaag 180
ggaagatgga caacaaacac cgaaactgga gcaccgcaac tcaacccgat tgatgggcca 240
ctgccagaag acaatgaacc aagtggttat gcccaaacag attgtgtatt ggaagcaatg 300
gctttccttg aggaatccca tcctggtatt tttgaaaact cgtgtattga aacgatggag 360
gttgttcagc aaacacgagt agacaagctg acacaaggcc gacagaccta tgactggact 420
ctaaatagaa accaacctgc tgcaacagca ttggccaaca caatagaagt gttcagatca 480
aatggcctca cggccaatga gtctggaagg ctcatagact tccttaagga cgttatggag 540
tctatgaaaa aagaggaaat ggggattacg acacattttc aacgaaaaag acgggttagg 600
gataatatga caaaaaaaat gattacgcaa cgaacaatcg gaaagaaaaa acagagactg 660
aataagcgat catacttgat tagggcactt acacttaaca ctatgactaa ggacgccgaa 720
aggggaaagc taaagcgtag agcaattgca acacccggaa tgcaaattag ggggttcgta 780
tacttcgtcg agacactcgc tagatccata tgcgaaaagt tagagcaatc cggactgcca 840
gtcgggggga acgaaaaaaa agcgaaactc gctaacgtcg ttagaaaaat gatgactaat 900
agtcaggata ccgaactgtc atttacgatt accggcgata atactaagtg gaacgagaat 960
cagaatccta gaatgtttct cgcaatgatc acatatatga cacgtaacca acccgaatgg 1020
tttagaaacg tactgtcaat cgcaccaatt atgtttagca ataagatggc tagattgggc 1080
aaggggtata tgtttgaatc taagagtatg aaattgcgaa cacagatacc tgccgaaatg 1140
ctagcatcaa tcgatctaaa gtactttaac gatagtacac gaaaaaaaat cgaaaagatt 1200
agaccgttac tgatagaggg aaccgccagc ctatcccccg gaatgatgat ggggatgttt 1260
aatatgctta gtaccgtgtt aggcgttagc atacttaact tagggcaaaa acgttatact 1320
aagactacat attggtggga cggactgcaa tctagcgacg atttcgcact aatcgttaac 1380
gcacctaacc atgaggggat acaagccgga gtcgatagat tctatagaac atgcaaactg 1440
ttagggatta atatgtctaa aaaaaagtca tacataaata gaaccggaac atttgaattc 1500
acaagttttt tctatcgtta tgggtttgtt gccaatttca gcatggagct ccccagtttt 1560
ggggtgtctg ggatcaacga gtcagcggac atgagtattg gagttactgt catcaaaaac 1620
aatatgataa acaatgatct tggtccagca acagctcaaa tggcccttca gttgttcatc 1680
aaagattaca ggtacacgta ccgatgccat agaggtgaca cacaaataca aacccgaaga 1740
tcatttgaaa taaagaaact gtgggagcaa acccgttcca aagctggact gctggtctcc 1800
gacggaggcc caaatttata caacattaga aatctccaca ttcctgaagt ctgcctaaaa 1860
tgggaattga tggatgagga ttaccagggg cgtttatgca acccactgaa cccatttgtc 1920
agccataaag aaattgaatc aatgaacaat gcagtgatga tgccagcaca tggtccagcc 1980
aaaaacatgg agtatgatgc tgttgcaaca acacactcct ggatccccaa aagaaatcga 2040
tccatcttga atacaagtca aagaggagta cttgaagatg aacaaatgta ccaaaggtgc 2100
tgcaatttat ttgaaaaatt cttccccagc agttcataca gaagaccagt cgggatatcc 2160
agtatggtgg aggctatggt ttccagagcc cgaattgatg cacggattga tttcgaatct 2220
ggaaggataa agaaagaaga gttcactgag atcatgaaga tctgttccac cattgaagag 2280
ctcagacggc aaaaatagtg aatttagctt gtccttcatg aaaaaatgcc ttgtttctac 2340
t 2341
<210> 16
<211> 2341
<212> DNA
<213> Influenza virus
<400> 16
agcgaaagca ggtcaattat attcaatatg gaaagaataa aagaactaag aaatctaatg 60
tcgcagtctc gcacccgcga gatactcaca aaaaccaccg tggaccatat ggccataatc 120
aagaagtaca catcaggaag acaggagaag aacccagcac ttaggatgaa atggatgatg 180
gcaatgaaat atccaattac agcagacaag aggataacgg aaatgattcc tgagagaaat 240
gagcaaggac aaactttatg gagtaaaatg aatgatgcag gatcagaccg agtgatggta 300
tcacctctgg ctgtgacatg gtggaatagg aatggaccaa taacaaatac agttcattat 360
ccaaaaatct acaaaactta ttttgaaaga gtcgaaaggc taaagcatgg aacctttggc 420
cctgtccatt ttagaaacca agtcaaaata cgtcggagag ttgacataaa tcctggtcat 480
gcagatctca gtgccaagga ggcacaggat gtaatcatgg aagttgtttt ccctaacgaa 540
gtgggagcca ggatactaac atcggaatcg caactaacga taaccaaaga gaagaaagaa 600
gaactccagg attgcaaaat ttctcctttg atggttgcat acatgttgga gagagaactg 660
gtccgcaaaa cgagattcct cccagtggct ggtggaacaa gcagtgtgta cattgaagtg 720
ttgcatttga ctcaaggaac atgctgggaa cagatgtata ctccaggagg ggaagtgagg 780
aatgatgatg ttgatcaaag cttgattatt gctgctagga acatagtgag aagagctgca 840
gtatcagcag atccactagc atctttattg gagatgtgcc acagcacaca gattggtgga 900
attaggatgg tagacatcct taggcagaac ccaacagaag agcaagccgt ggatatatgc 960
aaggctgcaa tgggactgag aattagctca tccttcagtt ttggtggatt cacatttaag 1020
agaacaagcg gatcatcagt caagagagag gaagaggtgc ttacgggcaa tcttcaaaca 1080
ttgaagataa gagtgcatga gggatatgaa gagttcacaa tggttgggag aagagcaaca 1140
gccatactca gaaaagcaac caggagattg attcagctga tagtgagtgg gagagacgaa 1200
cagtcgattg ccgaagcaat aattgtggcc atggtatttt cacaagagga ttgtatgata 1260
aaagcagtca gaggtgatct gaatttcgtc aatagggcga atcagcgatt gaatcctatg 1320
catcaacttt taagacattt tcagaaggat gcgaaagtgc tttttcaaaa ttggggagtt 1380
gaacctatcg acaatgtgat gggaatgatt gggatattgc cagacatgac tccaagcatc 1440
gagatgtcaa tgagaggagt gagaatcagc aaaatgggtg tagatgagta ctccagcacg 1500
gagagggtag tggtgagcat tgaccgtttt ttgagaatcc gggaccaacg aggaaatgta 1560
ctactgtctc ccgaggaggt cagtgaaaca cagggaacag agaaactgac aataacttac 1620
tcatcgtcaa tgatgtggga gattaatggt cctgaatcag tgttggtcaa tacctatcaa 1680
tggatcatca gaaactggga aactgttaaa attcagtggt cccagaaccc tacaatgcta 1740
tacaataaaa tggaatttga accatttcag tctttagtac ctaaggccat tagaggccaa 1800
tacagtgggt ttgtaagaac tctgttccaa caaatgaggg atgtgcttgg gacatttgat 1860
accgcacaga taataaaact tcttcccttc gcagccgctc caccaaagca aagtagaatg 1920
cagttctcct catttactgt gaatgtgagg ggatcaggaa tgagaatact tgtaaggggc 1980
aattctcctg tattcaacta taacaaggcc acgaagagac tcacagttct cggaaaggat 2040
gctggcactt taactgaaga cccagatgaa ggcacagctg gagtggagtc cgctgttctg 2100
aggggattcc tcattctggg caaagaagac aagagatatg ggccagcact aagcatcaat 2160
gaactgagca accttgcgaa aggagagaag gctaatgtgc taattgggca aggagacgtg 2220
gtgttggtaa tgaaacggaa acgggactct agcatactta ctgacagcca gacagcgacc 2280
aaaagaattc ggatggccat caattagtgt cgaatagttt aaaaacgacc ttgtttctac 2340
t 2341
<210> 17
<211> 2341
<212> DNA
<213> unknown
<220>
<223> synthetic
<400> 17
agcgaaagca ggtcaattat attcaatatg gagagaatca aagagcttag gaatcttatg 60
tcacaatcta gaactagaga gatactgact aagactacag tcgatcatat ggctataatc 120
aaaaaatata ctagcggaag acaggaaaaa aatcccgcac ttagaatgaa atggatgatg 180
gctatgaaat accctattac agccgataag cgaattaccg aaatgatacc agagagaaac 240
gaacagggac agacattgtg gtctaaaatg aacgacgccg gatccgatag agtgatggtt 300
tcgccactag ccgtaacatg gtggaataga aacggaccta ttacgaatac agtgcattac 360
cctaagatat acaaaacata tttcgaaaga gtcgagagac tgaaacacgg aacattcgga 420
ccagtgcatt ttcggaatca ggttaagatt agacgtagag tcgatattaa tccagggcat 480
gcagatctct ccgctaaaga ggcacaagac gttattatgg aggtcgtgtt tcctaacgag 540
gtcggcgcta ggatactgac tagcgaatcg caattgacaa ttacgaaaga gaaaaaagag 600
gaactccagg attgcaaaat tagcccactt atggtcgcat atatgctcga acgcgaattg 660
gttagaaaga ctagattcct accagtcgca ggcggaacgt ctagcgtgta tatcgaagtg 720
ttgcatctaa cacagggaac atgttgggag caaatgtata ctccaggagg cgaagtgaga 780
aacgacgacg ttgatcaatc gctaatcata gccgctagga atatagtgag aagggcagcc 840
gttagcgcag acccacttgc gtcactactc gaaatgtgcc atagtacgca aatcggaggg 900
attagaatgg tcgatatcct taggcagaat cctacagagg aacaggccgt agacatatgc 960
aaagccgcaa tgggattgcg aattagctca tcattctcat tcggagggtt tacgtttaaa 1020
cggactagcg gatctagcgt aaaacgcgaa gaggaagtgc ttactggcaa tctgcaaaca 1080
ctaaagatta gggtgcatga gggatacgaa gagtttacaa tggtcggacg tagagcaacc 1140
gctatactta gaaaagcgac taggagactg atacaattga tcgttagcgg aagggacgaa 1200
cagtcaatcg ccgaagcgat aatagtcgca atggtgtttt cgcaagagga ttgcatgatt 1260
aaggccgtta ggggggatct gaatttcgtt aatagggcta atcagagact gaatcctatg 1320
catcaattgc ttagacattt tcagaaagac gctaaagtgt tgtttcagaa ttggggagtc 1380
gaacctatcg ataacgttat gggtatgata gggatactgc cagatatgac accatcaatc 1440
gaaatgtcaa tgagaggcgt taggattagt aagatgggcg tagacgaata ctccagcact 1500
gagagagtgg tagtgtcaat cgatagattt cttaggatta gggatcagag aggcaacgta 1560
ctgctatcac ccgaagaagt tagcgaaaca cagggaaccg aaaaattgac aattacgtat 1620
agtagtagta tgatgtggga gattaacgga ccagagtcag tgttagtgaa tacatatcaa 1680
tggataatac ggaattggga gacagtgaaa atacaatggt cacagaatcc tacaatgcta 1740
tacaataaga tggagttcga accttttcaa tcgttagtgc ctaaggccat aagaggccaa 1800
tatagtgggt tcgttagaac attgtttcag caaatgagag acgtactcgg aacattcgat 1860
accgcacaga taattaagct attgccattc gcagccgcac cacctaagca atctagaatg 1920
caattttcta gctttaccgt taacgttagg ggatccggaa tgcgaatact cgttaggggg 1980
aatagtccag tgtttaatta caataaggca actaagagat tgacagtgtt aggcaaggac 2040
gcaggaacat tgaccgaaga cccagacgag ggaaccgctg gagtggaatc cgcagtgctt 2100
agggggtttc tgatactcgg aaaggaggat aagagatacg gacctgcact atcgattaac 2160
gaactatcta atctcgctaa aggcgaaaaa gcgaatgtgt taatcggaca gggagacgta 2220
gtgttagtga tgaaacggaa acgcgatagc tcaatactga cagactcaca aaccgctact 2280
aagagaattc ggatggcaat taattagtgt cgaatagttt aaaaacgacc ttgtttctac 2340
t 2341
<210> 18
<211> 2233
<212> DNA
<213> Influenza virus
<400> 18
agcgaaagca ggtactgatc caaaatggaa gattttgtgc gacaatgctt caatccgatg 60
attgtcgagc ttgcggaaaa aacaatgaaa gagtatgggg aggacctgaa aatcgaaaca 120
aacaaatttg cagcaatatg cactcacttg gaagtatgct tcatgtattc agattttcac 180
ttcatcaatg agcaaggcga gtcaataatc gtagaacttg gtgatccaaa tgcacttttg 240
aagcacagat ttgaaataat cgagggaaga gatcgcacaa tggcctggac agtagtaaac 300
agtatttgca acactacagg ggctgagaaa ccaaagtttc taccagattt gtatgattac 360
aaggagaata gattcatcga aattggagta acaaggagag aagttcacat atactatctg 420
gaaaaggcca ataaaattaa atctgagaaa acacacatcc acattttctc gttcactggg 480
gaagaaatgg ccacaaaggc agactacact ctcgatgaag aaagcagggc taggatcaaa 540
accagactat tcaccataag acaagaaatg gccagcagag gcctctggga ttcctttcgt 600
cagtccgaga gaggagaaga gacaattgaa gaaaggtttg aaatcacagg aacaatgcgc 660
aagcttgccg accaaagtct cccgccgaac ttctccagcc ttgaaaattt tagagcctat 720
gtggatggat tcgaaccgaa cggctacatt gagggcaagc tgtctcaaat gtccaaagaa 780
gtaaatgcta gaattgaacc ttttttgaaa acaacaccac gaccacttag acttccgaat 840
gggcctccct gttctcagcg gtccaaattc ctgctgatgg atgccttaaa attaagcatt 900
gaggacccaa gtcatgaagg agagggaata ccgctatatg atgcaatcaa atgcatgaga 960
acattctttg gatggaagga acccaatgtt gttaaaccac acgaaaaggg aataaatcca 1020
aattatcttc tgtcatggaa gcaagtactg gcagaactgc aggacattga gaatgaggag 1080
aaaattccaa agactaaaaa tatgaagaaa acaagtcagc taaagtgggc acttggtgag 1140
aacatggcac cagaaaaggt agactttgac gactgtaaag atgtaggtga tttgaagcaa 1200
tatgatagtg atgaaccaga attgaggtcg ctagcaagtt ggattcagaa tgagtttaac 1260
aaggcatgcg aactgacaga ttcaagctgg atagagctcg atgagattgg agaagatgtg 1320
gctccaattg aacacattgc aagcatgaga aggaattatt tcacatcaga ggtgtctcac 1380
tgcagagcca cagaatacat aatgaagggg gtgtacatca atactgcctt gcttaatgca 1440
tcttgtgcag caatggatga tttccaatta attccaatga taagcaagtg tagaactaag 1500
gagggaaggc gaaagaccaa cttgtatggt ttcatcataa aaggaagatc ccacttaagg 1560
aatgacaccg acgtggtaaa ctttgtgagc atggagtttt ctctcactga cccaagactt 1620
gaaccacata aatgggagaa gtactgtgtt cttgagatag gagatatgct tataagaagt 1680
gccataggcc aggtttcaag gcccatgttc ttgtatgtga gaacaaatgg aacctcaaaa 1740
attaaaatga aatggggaat ggagatgagg cgttgcctcc tccagtcact tcaacaaatt 1800
gagagtatga ttgaagctga gtcctctgtc aaagagaaag acatgaccaa agagttcttt 1860
gagaacaaat cagaaacatg gcccattgga gagtccccca aaggagtgga ggaaagttcc 1920
attgggaagg tctgcaggac tttattagca aagtcggtat tcaacagctt gtatgcatct 1980
ccacaactag aaggattttc agctgaatca agaaaactgc ttcttatcgt tcaggctctt 2040
agggacaacc ttgaacctgg gacctttgat cttggggggc tatatgaagc aattgaggag 2100
tgcctgatta atgatccctg ggttttgctt aatgcttctt ggttcaactc cttccttaca 2160
catgcattga gttagttgtg gcagtgctac tatttgctat ccatactgtc caaaaaagta 2220
ccttgtttct act 2233
<210> 19
<211> 2233
<212> DNA
<213> unknown
<220>
<223> synthetic
<400> 19
agcgaaagca ggtactgatc caaaatggag gatttcgtta ggcaatgctt taatccaatg 60
atagtcgagt tagccgaaaa gactatgaaa gagtatggcg aagacctaaa gattgagact 120
aataaattcg ccgcaatttg cacacacctt gaggtttgct ttatgtattc cgattttcac 180
tttattaacg aacagggaga gtcaattata gtcgagttag gcgatccgaa cgcattgcta 240
aagcatagat ttgaaattat agagggacgc gataggacaa tggcatggac cgtagttaat 300
tcgatttgca atacaaccgg agccgaaaaa ccgaaattct tacccgatct atacgattat 360
aaagagaata ggtttatcga aatcggagtg actagacgcg aagtgcatat ttattatctc 420
gaaaaagcga ataagattaa gtccgaaaag acacacatac acatttttag ctttaccgga 480
gaggaaatgg caacaaaagc cgattataca cttgacgaag agtctagggc taggattaag 540
actagactgt ttacaattag acaggaaatg gctagtaggg ggttgtggga tagctttaga 600
caatccgaaa gaggcgaaga gacaatcgaa gagagatttg aaattaccgg aacaatgcga 660
aagcttgccg atcaatccct accccccaat ttctctagcc ttgagaattt tagggcatac 720
gttgacggat tcgaacctaa cggatatata gagggaaagc tatcgcaaat gtctaaagag 780
gttaacgcta gaatcgaacc attcctaaag acaacaccta gaccacttag actgccaaac 840
ggaccaccat gctcacagcg atctaagttt ctgcttatgg acgcactaaa gttgtcaatc 900
gaagacccat cacacgaggg agaggggata ccattgtacg acgcaattaa gtgtatgcga 960
acatttttcg gatggaaaga gcctaacgta gtgaaaccac acgaaaaagg gattaatccg 1020
aattatctgc ttagttggaa acaggtgtta gccgaattgc aggatatcga aaacgaagag 1080
aaaattccga aaactaagaa tatgaaaaaa actagccaac tgaaatgggc acttggcgag 1140
aatatggcac ccgaaaaagt cgatttcgac gattgcaaag acgtcggcga tctaaagcaa 1200
tacgatagcg acgaacccga acttagatca ctcgctagtt ggatacagaa cgagttcaat 1260
aaggcatgcg aattgaccga tagctcatgg atagagcttg acgagatagg cgaagacgta 1320
gcaccaatcg aacacatagc ctctatgaga cggaattatt ttacatccga agtgtcacat 1380
tgtagggcaa cagagtatat tatgaaaggg gtgtatatta ataccgcatt gcttaacgct 1440
agttgcgccg caatggacga tttccaactg ataccgatga tctcgaagtg tagaacaaaa 1500
gagggacgta gaaagactaa tctgtatggg ttcattatta agggaaggtc tcatttaagg 1560
aacgatacag acgtagtgaa tttcgttagt atggagttta gccttaccga tccgagactc 1620
gaaccacaca aatgggaaaa gtattgcgta ctagagatag gggatatgtt gattagatcc 1680
gcaatcggac aggtttcgag accaatgttt ttgtacgtta ggactaacgg aacctcgaag 1740
attaaaatga aatggggaat ggagatgcgt agatgcctat tgcaatccct tcagcaaatc 1800
gaatctatga tagaggccga atctagcgtt aaagagaaag atatgacaaa agagtttttt 1860
gaaaataagt ccgaaacatg gccaatcgga gagtcaccaa aaggggttga ggaatcctca 1920
atcggaaaag tttgtagaac attgctcgca aaatccgtat tcaatagtct atacgccagc 1980
ccacaactag agggattctc tgctgagtca cgaaaactgt tactgatagt gcaagccctt 2040
agggataatc tcgaacccgg aacattcgat ctaggggggt tgtacgaagc aatcgaagag 2100
tgtctgatta acgatccatg ggtactgctt aacgctagtt ggtttaattc gttccttaca 2160
cacgcactat cttagttgtg gcagtgctac tatttgctat ccatactgtc caaaaaagta 2220
ccttgtttct act 2233
<210> 20
<211> 1775
<212> DNA
<213> Influenza virus
<400> 20
agcaaaagca ggggaaaata aaaacaacca aaatgaaggc aaacctactg gtcctgttaa 60
gtgcacttgc agctgcagat gcagacacaa tatgtatagg ctaccatgcg aacaattcaa 120
ccgacactgt tgacacagta ctcgagaaga atgtgacagt gacacactct gttaacctgc 180
tcgaagacag ccacaacgga aaactatgta gattaaaagg aatagcccca ctacaattgg 240
ggaaatgtaa catcgccgga tggctcttgg gaaacccaga atgcgaccca ctgcttccag 300
tgagatcatg gtcctacatt gtagaaacac caaactctga gaatggaata tgttatccag 360
gagatttcat cgactatgag gagctgaggg agcaattgag ctcagtgtca tcattcgaaa 420
gattcgaaat atttcccaaa gaaagctcat ggcccaacca caacacaaac ggagtaacgg 480
cagcatgctc ccatgagggg aaaagcagtt tttacagaaa tttgctatgg ctgacggaga 540
aggagggctc atacccaaag ctgaaaaatt cttatgtgaa caaaaaaggg aaagaagtcc 600
ttgtactgtg gggtattcat cacccgccta acagtaagga acaacagaat atctatcaga 660
atgaaaatgc ttatgtctct gtagtgactt caaattataa caggagattt accccggaaa 720
tagcagaaag acccaaagta agagatcaag ctgggaggat gaactattac tggaccttgc 780
taaaacccgg agacacaata atatttgagg caaatggaaa tctaatagca ccaatgtatg 840
ctttcgcact gagtagaggc tttgggtccg gcatcatcac ctcaaacgca tcaatgcatg 900
agtgtaacac gaagtgtcaa acacccctgg gagctataaa cagcagtctc ccttaccaga 960
atatacaccc agtcacaata ggagagtgcc caaaatacgt caggagtgcc aaattgagga 1020
tggttacagg actaaggaac actccgtcca ttcaatccag aggtctattt ggagccattg 1080
ccggttttat tgaaggggga tggactggaa tgatagatgg atggtatggt tatcatcatc 1140
agaatgaaca gggatcaggc tatgcagcgg atcaaaaaag cacacaaaat gccattaacg 1200
ggattacaaa caaggtgaac actgttatcg agaaaatgaa cattcaattc acagctgtgg 1260
gtaaagaatt caacaaatta gaaaaaagga tggaaaattt aaataaaaaa gttgatgatg 1320
gatttctgga catttggaca tataatgcag aattgttagt tctactggaa aatgaaagga 1380
ctctggattt ccatgactca aatgtgaaga atctgtatga gaaagtaaaa agccaattaa 1440
agaataatgc caaagaaatc ggaaatggat gttttgagtt ctaccacaag tgtgacaatg 1500
aatgcatgga aagtgtaaga aatgggactt atgattatcc caaatattca gaagagtcaa 1560
agttgaacag ggaaaaggta gatggagtga aattggaatc aatggggatc tatcagattc 1620
tggcgatcta ctcaactgtc gccagttcac tggtgctttt ggtctccctg ggggcaatca 1680
gtttctggat gtgttctaat ggatctttgc agtgcagaat atgcatctga gattagaatt 1740
tcagaaatat gaggaaaaac acccttgttt ctact 1775
<210> 21
<211> 1775
<212> DNA
<213> unknown
<220>
<223> synthetic
<400> 21
agcaaaagca ggggaaaata aaaacaacca aaatgaaggc aaacctactg gtcctgttaa 60
gtgcacttgc agctgcagat gcagacacaa tatgtatagg ctaccatgcg aacaattcaa 120
ccgacactgt tgacacagta ctcgagaaga atgtgacagt gacacactct gttaacctgt 180
tagaggactc acataacgga aagctatgta ggcttaaggg aatcgcacca ctgcaattgg 240
gcaagtgtaa tatagccgga tggttgttgg ggaatcccga atgcgatcca ctgttacccg 300
ttaggtcatg gtcatatata gtcgagacac ctaatagcga aaacggaatt tgttatcccg 360
gcgattttat cgattacgaa gagcttagag agcaattgtc tagcgttagt tcattcgaaa 420
gattcgaaat ttttccgaaa gagtctagtt ggccaaatca taatactaac ggagtgactg 480
ccgcatgctc acacgaaggc aagtctagct tttataggaa tctgttgtgg ttgactgaga 540
aagagggatc atatccgaaa ctgaaaaact catacgtgaa caaaaaggga aaggaagtgt 600
tagtgttgtg ggggatacac catccaccaa atagtaaaga gcaacagaat atatatcaga 660
acgaaaacgc atacgttagc gtcgtaacta gtaattataa tagaaggttt acacccgaaa 720
tcgcagagag accgaaagtt agagaccaag ccggaagaat gaattattat tggacactac 780
tgaaacccgg cgatacaatt atattcgaag cgaacggaaa tctgatcgca ccgatgtatg 840
cattcgcact atctaggggg ttcggatccg gaattattac tagtaacgct agtatgcacg 900
aatgtaacac gaagtgtcag actccactag gcgcaattaa ctctagtctg ccatatcaga 960
atatacatcc cgtaacaatc ggcgaatgcc caaaatacgt tagatccgct aagcttagaa 1020
tggttaccgg actgagaaat acaccatcaa tccaatctag ggggttgttc ggagcgatag 1080
ccggatttat cgaagggggg tggacaggga tgatagacgg ttggtacgga tatcatcacc 1140
aaaacgaaca gggatccgga tacgcagccg atcagaaatc gacgcaaaac gctattaacg 1200
gaattactaa taaagtgaat accgtaatcg aaaaaatgaa tatccaattt accgcagtcg 1260
gaaaggaatt caataagctt gagaaaagaa tggagaatct gaataaaaaa gtcgacgacg 1320
gatttctaga catatggact tataacgccg aactgttagt gttgctcgaa aacgaaagaa 1380
cactagactt tcacgactca aacgttaaga atctatacga aaaagtgaaa tcccaattga 1440
aaaataacgc taaagagata gggaacggat gtttcgagtt ctatcataaa tgcgataacg 1500
aatgtatgga atccgttagg aacggaacat acgattatcc taagtatagc gaagagtcaa 1560
aactgaatag ggagaaagtc gacggagtga aactcgaatc aatggggata tatcagatac 1620
tggcaatcta tagtacagtc gccagctcac tggttctttt ggtctccctg ggggcaatca 1680
gtttctggat gtgttctaat ggatctttgc agtgcagaat atgcatctga gattagaatt 1740
tcagaaatat gaggaaaaac acccttgttt ctact 1775
<210> 22
<211> 1565
<212> DNA
<213> Influenza virus
<400> 22
agcaaaagca gggtagataa tcactcactg agtgacatca aaatcatggc gtcccaaggc 60
accaaacggt cttacgaaca gatggagact gatggagaac gccagaatgc cactgaaatc 120
agagcatccg tcggaaaaat gattggtgga attggacgat tctacatcca aatgtgcacc 180
gaactcaaac tcagtgatta tgagggacgg ttgatccaaa acagcttaac aatagagaga 240
atggtgctct ctgcttttga cgaaaggaga aataaatacc tggaagaaca tcccagtgcg 300
gggaaagatc ctaagaaaac tggaggacct atatacagga gagtaaacgg aaagtggatg 360
agagaactca tcctttatga caaagaagaa ataaggcgaa tctggcgcca agctaataat 420
ggtgacgatg caacggctgg tctgactcac atgatgatct ggcattccaa tttgaatgat 480
gcaacttatc agaggacaag agctcttgtt cgcaccggaa tggatcccag gatgtgctct 540
ctgatgcaag gttcaactct ccctaggagg tctggagccg caggtgctgc agtcaaagga 600
gttggaacaa tggtgatgga attggtcagg atgatcaaac gtgggatcaa tgatcggaac 660
ttctggaggg gtgagaatgg acgaaaaaca agaattgctt atgaaagaat gtgcaacatt 720
ctcaaaggga aatttcaaac tgctgcacaa aaagcaatga tggatcaagt gagagagagc 780
cggaacccag ggaatgctga gttcgaagat ctcacttttc tagcacggtc tgcactcata 840
ttgagagggt cggttgctca caagtcctgc ctgcctgcct gtgtgtatgg acctgccgta 900
gccagtgggt acgactttga aagagaggga tactctctag tcggaataga ccctttcaga 960
ctgcttcaaa acagccaagt gtacagccta atcagaccaa atgagaatcc agcacacaag 1020
agtcaactgg tgtggatggc atgccattct gccgcatttg aagatctaag agtattaagc 1080
ttcatcaaag ggacgaaggt gctcccaaga gggaagcttt ccactagagg agttcaaatt 1140
gcttccaatg aaaatatgga gactatggaa tcaagtacac ttgaactgag aagcaggtac 1200
tgggccataa ggaccagaag tggaggaaac accaatcaac agagggcatc tgcgggccaa 1260
atcagcatac aacctacgtt ctcagtacag agaaatctcc cttttgacag aacaaccatt 1320
atggcagcat tcaatgggaa tacagaggga agaacatctg acatgaggac cgaaatcata 1380
aggatgatgg aaagtgcaag accagaagat gtgtctttcc aggggcgggg agtcttcgag 1440
ctctcggacg aaaaggcagc gagcccgatc gtgccttcct ttgacatgag taatgaagga 1500
tcttatttct tcggagacaa tgcagaggag tacgacaatt aaagaaaaat acccttgttt 1560
ctact 1565
<210> 23
<211> 1565
<212> DNA
<213> unknown
<220>
<223> synthetic
<400> 23
agcaaaagca gggtagataa tcactcactg agtgacatca aaatcatggc gtcccaaggc 60
accaaacggt cttacgaaca gatggagact gatggagaac gccagaatgc cactgaaatc 120
agagctagcg tcggaaaaat gataggggga atcggaaggt tttacataca aatgtgtacc 180
gaactcaaat tgtccgatta cgaagggaga ttgatccaaa atagtctgac aatcgaaaga 240
atggtgttaa gcgcattcga cgaaagacgg aataagtatc tcgaagagca tcctagcgca 300
ggcaaggatc caaaaaaaac cggagggcca atctatagga gagtgaacgg aaagtggatg 360
cgcgaactga tactgtacga taaagaggag attagacgga tatggcgaca agcgaataac 420
ggagacgacg ctactgccgg actgacacat atgatgatat ggcactctaa tcttaacgac 480
gctacatacc aacggactag ggcactcgtt agaaccggaa tggatcctag aatgtgctca 540
cttatgcagg gatctacact ccctagacga tccggagccg caggagcagc cgttaaggga 600
gtcggaacta tggttatgga actcgttaga atgataaaaa gggggattaa cgataggaat 660
ttttggagag gcgaaaacgg acgtaaaact agaatcgcat acgaaagaat gtgcaatata 720
ctcaaaggga aattccaaac cgcagcgcaa aaagctatga tggatcaagt tagggagtct 780
aggaatccag gaaatgccga attcgaagac cttacatttc tcgctcggtc cgcactaatc 840
cttcgcggat cagtcgcaca caaatcttgc ttacccgcat gcgtatacgg acctgcagtc 900
gctagcggat acgatttcga acgcgaaggg tatagtctag taggaattga tccatttaga 960
ttgctccaaa attcgcaagt gtatagtctg attagaccta acgagaatcc tgcacacaaa 1020
tctcaactcg tatggatggc atgccatagt gccgcattcg aagaccttag agtgctatct 1080
ttcataaagg gaacgaaagt gttgcctagg ggaaagctat ctactagggg agtgcaaatc 1140
gctagtaacg agaatatgga gactatggag tctagtacac tcgaactgag atctagatat 1200
tgggctatta ggactagatc cggagggaat acgaatcagc aacgagctag cgccgggcaa 1260
atctcaatcc aacctacatt ttccgtgcaa cggaatctgc cattcgatcg gacaacgatt 1320
atggccgcat tcaatgggaa taccgaggga cggactagcg atatgagaac cgaaattatc 1380
agaatgatgg aatccgctag accagaggac gtttcgtttc aaggacgggg agtcttcgag 1440
ctctcggacg aaaaggcagc gagcccgatc gtgccttcct ttgacatgag taatgaagga 1500
tcttatttct tcggagacaa tgcagaggag tacgacaatt aaagaaaaat acccttgttt 1560
ctact 1565
<210> 24
<211> 1413
<212> DNA
<213> Influenza virus
<400> 24
agcgaaagca ggggtttaaa atgaatccaa atcagaaaat aacaaccatt ggatcaatct 60
gtctggtagt cggactaatt agcctaatat tgcaaatagg gaatataatc tcaatatgga 120
ttagccattc aattcaaact ggaagtcaaa accatactgg aatatgcaac caaaacatca 180
ttacctataa aaatagcacc tgggtaaagg acacaacttc agtgatatta accggcaatt 240
catctctttg tcccatccgt gggtgggcta tatacagcaa agacaatagc ataagaattg 300
gttccaaagg agacgttttt gtcataagag agccctttat ttcatgttct cacttggaat 360
gcaggacctt ttttctgacc caaggtgcct tactgaatga caagcattca aatgggactg 420
ttaaggacag aagcccttat agggccttaa tgagctgccc tgtcggtgaa gctccgtccc 480
cgtacaattc aagatttgaa tcggttgctt ggtcagcaag tgcatgtcat gatggcatgg 540
gctggctaac aatcggaatt tcaggtccag ataatggagc agtggctgta ttaaaataca 600
acggcataat aactgaaacc ataaaaagtt ggaggaagaa aatattgagg acacaagagt 660
ctgaatgtgc ctgtgtaaat ggttcatgtt ttactataat gactgatggc ccgagtgatg 720
ggctggcctc gtacaaaatt ttcaagatcg aaaaggggaa ggttactaaa tcaatagagt 780
tgaatgcacc taattctcac tatgaggaat gttcctgtta ccctgatacc ggcaaagtga 840
tgtgtgtgtg cagagacaac tggcatggtt cgaaccggcc atgggtgtct ttcgatcaaa 900
acctggatta tcaaatagga tacatctgca gtggggtttt cggtgacaac ccgcgtcccg 960
aagatggaac aggcagctgt ggtccagtgt atgttgatgg agcaaacgga gtaaagggat 1020
tttcatatag gtatggtaat ggtgtttgga taggaaggac caaaagtcac agttccagac 1080
atgggtttga gatgatttgg gatcctaatg gatggacaga gactgatagt aagttctctg 1140
ttaggcaaga tgttgtggca atgactgatt ggtcagggta tagcggaagt ttcgttcaac 1200
atcctgagct aacagggcta gactgtatga ggccgtgctt ctgggttgaa ttaatcaggg 1260
gacgacctaa agaaaaaaca atctggacta gtgcgagcag catttctttt tgtggcgtga 1320
atagtgatac tgtagattgg tcttggccag acggtgctga gttgccattc agcattgaca 1380
agtagtctgt tcaaaaaact ccttgtttct act 1413
<210> 25
<211> 1413
<212> DNA
<213> unknown
<220>
<223> synthetic
<400> 25
agcgaaagca ggggtttaaa atgaatccaa atcagaaaat aacaaccatt ggatcaatct 60
gtctggtagt cggactaatt agcctaatat tgcaaatagg gaatataatc tcaatatgga 120
tttcgcattc aatccaaacc ggatcacaaa atcatacagg catatgcaat cagaatataa 180
ttacttataa aaatagtaca tgggtgaaag atactactag cgtgatacta accggcaatt 240
ctagtctatg tccgattagg gggtgggcta tatactctaa agacaatagt atacggatag 300
ggtctaaggg agacgttttc gtaattaggg aaccgtttat aagttgttca catctagagt 360
gtaggacctt ttttctgaca caaggcgcac tattaaacga taagcattct aacggtacag 420
ttaaggatag gtcaccttat agggcactta tgtcatgtcc cgtaggcgaa gcccctagtc 480
catacaatag tagatttgaa tccgttgcat ggtccgctag cgcatgtcac gacggaatgg 540
ggtggttgac tatagggatt agcggacccg ataacggagc cgttgccgta ctgaaatata 600
acggtataat taccgaaact attaagagtt ggcgtaaaaa aatattgcgt acacaagagt 660
ccgaatgcgc atgcgttaac ggatcatgtt ttacaattat gactgacgga cctagcgacg 720
ggttagcgtc atacaaaatt tttaaaatcg aaaaaggcaa ggttactaag tcaatcgagt 780
taaacgcacc taattcgcat tacgaagagt gttcatgtta tcccgatacc ggaaaggtta 840
tgtgcgtttg tagggataat tggcacggtt cgaacagacc ttgggtgtca ttcgatcaaa 900
atctagacta tcaaatcgga tatatatgta gcggagtgtt cggcgataat cctagaccag 960
aggacggtac aggcagctgt ggaccggttt acgttgacgg cgctaacggc gttaaggggt 1020
ttagttatag atacggcaat ggcgtatgga tcggtaggac taagtcacat agttctagac 1080
acggatttga aatgatatgg gatcctaacg gatggaccga aaccgactcg aagtttagcg 1140
ttaggcaaga cgtagtcgct atgaccgatt ggtccgggta tagcggatca ttcgtgcaac 1200
atccagagtt aaccggattg gattgtatgc gaccatgttt ttgggttgag ttgattaggg 1260
ggagaccgaa agagaaaact atatggacta gcgcgagcag catttctttt tgtggcgtga 1320
atagtgatac tgtagattgg tcttggccag acggtgctga gttgccattc agcattgaca 1380
agtagtctgt tcaaaaaact ccttgtttct act 1413
<210> 26
<211> 1026
<212> DNA
<213> Influenza virus
<400> 26
agcgaaagca ggtagatatt gaaagatgag tcttctaacc gaggtcgaaa cgtacgtact 60
ctctatcatc ccgtcaggcc ccctcaaagc cgagatcgca cagagacttg aagatgtctt 120
tgcagggaag aacactgatc ttgaggttct catggaatgg ctaaagacaa gaccaatcct 180
gtcacctctg actaagggga ttttaggatt tgtgttcacg ctcaccgtgc ccagtgagcg 240
aggactgcag cgtagacgct ttgtccaaaa tgcccttaat gggaacgggg atccaaataa 300
catggacaaa gcagttaaac tgtataggaa gctcaagagg gagataacat tccatggggc 360
caaagaaatc tcactcagtt attctgctgg tgcacttgcc agttgtatgg gcctcatata 420
caacaggatg ggggctgtga ccactgaagt ggcatttggc ctggtatgtg caacctgtga 480
acagattgct gactcccagc atcggtctca taggcaaatg gtgacaacaa ccaatccact 540
aatcagacat gagaacagaa tggttttagc cagcactaca gctaaggcta tggagcaaat 600
ggctggatcg agtgagcaag cagcagaggc catggaggtt gctagtcagg ctagacaaat 660
ggtgcaagcg atgagaacca ttgggactca tcctagctcc agtgctggtc tgaaaaatga 720
tcttcttgaa aatttgcagg cctatcagaa acgaatgggg gtgcagatgc aacggttcaa 780
gtgatcctct cgctattgcc gcaaatatca ttgggatctt gcacttgaca ttgtggattc 840
ttgatcgtct ttttttcaaa tgcatttacc gtcgctttaa atacggactg aaaggagggc 900
cttctacgga aggagtgcca aagtctatga gggaagaata tcgaaaggaa cagcagagtg 960
ctgtggatgc tgacgatggt cattttgtca gcatagagct ggagtaaaaa actaccttgt 1020
ttctac 1026
<210> 27
<211> 890
<212> DNA
<213> Influenza virus
<400> 27
agcaaaagca gggtgacaaa gacataatgg atccaaacac tgtgtcaagc tttcaggtag 60
attgctttct ttggcatgtc cgcaaacgag ttgcagacca agaactaggt gatgccccat 120
tccttgatcg gcttcgccga gatcagaaat ccctaagagg aaggggcagc accctcggtc 180
tggacatcga gacagccaca cgtgctggaa agcagatagt ggagcggatt ctgaaagaag 240
aatccgatga ggcacttaaa atgaccatgg cctctgtacc tgcgtcgcgt tacctaactg 300
acatgactct tgaggaaatg tcaagggact ggtccatgct catacccaag cagaaagtgg 360
caggccctct ttgtatcaga atggaccagg cgatcatgga taagaacatc atactgaaag 420
cgaacttcag tgtgattttt gaccggctgg agactctaat attgctaagg gctttcaccg 480
aagagggagc aattgttggc gaaatttcac cattgccttc tcttccagga catactgctg 540
aggatgtcaa aaatgcagtt ggagtcctca tcgggggact tgaatggaat gataacacag 600
ttcgagtctc tgaaactcta cagagattcg cttggagaag cagtaatgag aatgggagac 660
ctccactcac tccaaaacag aaacgagaaa tggcgggaac aattaggtca gaagtttgaa 720
gaaataagat ggttgattga agaagtgaga cacaaactga agataacaga gaatagtttt 780
gagcaaataa catttatgca agccttacat ctattgcttg aagtggagca agagataaga 840
actttctcgt ttcagcttat ttaataataa aaaacaccct tgtttctact 890
<210> 28
<211> 890
<212> DNA
<213> unknown
<220>
<223> synthetic
<400> 28
agcaaaagca gggtgacaaa gacataatgg atccaaacac tgtgtcaagc tttcaggtag 60
attgctttct ttggcatgtc cgcaaacgag ttgcagacca agaactaggt gatgccccat 120
tccttgaccg actgagacgg gatcagaaat cccttagggg caggggatcg accctaggcc 180
tagacatcga aaccgcaact agggccggaa agcagatcgt ggagcgtata ctgaaagagg 240
agtccgacga agcgcttaag atgactatgg ccagcgtacc cgctagtcgg taccttaccg 300
atatgacact cgaagagatg tcacgcgatt ggtctatgct aatccctaag cagaaagtgg 360
ccggacctct atgtatacgg atggaccagg cgattatgga caaaaacatt atccttaaag 420
cgaacttttc cgtgatattc gatcgcctag agactctgat actgttgcgt gcattcacag 480
aagagggagc aattgttggc gaaatttcac cattgccttc tcttccagga catactgctg 540
aggatgtcaa aaatgcagtt ggagtcctca tcgggggact tgaatggaat gataacacag 600
ttcgagtctc tgaaactcta cagagattcg cttggagaag cagtaatgag aatgggagac 660
ctccactcac tccaaaacag aaacgagaaa tggcgggaac aattaggtca gaagtttgaa 720
gaaataagat ggttgattga agaagtgaga cacaaactga agataacaga gaatagtttt 780
gagcaaataa catttatgca agccttacat ctattgcttg aagtggagca agagataaga 840
actttctcgt ttcagcttat ttaataataa aaaacaccct tgtttctact 890
<210> 29
<211> 7152
<212> DNA
<213> Human rhinovirus 89
<400> 29
ttaaaactgg gagtgggttg ttcccactca ctccacccat gcggtgttgt actctgttat 60
tacggtaact ttgtacgcca gtttttccca cccttcccca taatgtaact tagaagtttg 120
tacaatatga ccaataggtg acaatcatcc agactgtcaa aggtcaagca cttctgtttc 180
cccggtcaat gaggatatgc tttacccaag gcaaaaacct tagagatcgt tatccccaca 240
ctgcctacac agagcccagt accatttttg atataattgg gttggtcgct ccctgcaaac 300
ccagcagtag acctggcaga tgaggctgga cattccccac tggcgacagt ggtccagcct 360
gcgtggctgc ctgctcaccc ttcttgggtg agaagcctaa ttattgacaa ggtgtgaaga 420
gccgcgtgtg ctcagtgtgc ttcctccggc ccctgaatgt ggctaacctt aaccctgcag 480
ccgttgccca taatccaatg ggtttgcggt cgtaatgcgt aagtgcggga tgggaccaac 540
tactttgggt gtccgtgttt cctgtttttc ttttgattgc attttatggt gacaatttat 600
agtgtataga ttgtcatcat gggtgcacaa gtatctagac aaaatgttgg gacacactcc 660
acacaaaatt cagtgagcaa tggatctagc ttaaattatt tcaacatcaa ttattttaaa 720
gacgcagctt caagtggtgc ttctagattg gatttttctc aagaccctag taaatttact 780
gatcctgtta aagatgtgtt agaaaagggt attccaacac ttcaatcacc aacagttgaa 840
gcttgtggtt attcagacag actaatacag ataacccgag gagattccac tataacatcc 900
caagatactg caaatgcagt tgttgcttat ggtgtgtggc catcatactt gactccagat 960
gatgcgactg ctattgacaa acccacacaa cctgatacat catccaacag attctacacc 1020
ttggacagtc gttcttggac atctgcctca tctggatggt ggtggaaatt gcctgatgcc 1080
cttaaaaaca tgggtatatt tggtgaaaat atgttttacc attttctagg gagatctgga 1140
tacacaatac atgtacaatg taattctagc aagtttcatc agggtttatt aatagttgcc 1200
gccatcccag aacatcaatt ggcatctgca acaagtggaa atgtatcagt cgggtacaat 1260
cacacccacc caggtgagca aggtagagaa gtagtaccat cacggacatc tagtgataat 1320
aaaagaccta gtgatgacag ttggttaaat tttgatggaa cattacttgg taacttacct 1380
atttatcccc accaatacat taatctaagg actaacaatt cagctaccct tattttacct 1440
tatgtcaatg ctgtaccaat ggactctatg cttagacata ataattggag cttggttata 1500
atcccaatat gccctcttca ggtccaacct ggggggacac aatccatacc tataacagta 1560
tcaattagcc ctatgttttc agaattttca gggccaagaa gtaaggttgt gtttagtacc 1620
actcagggtt taccagttat gttaacacct ggatctgggc aattcttaac aactgatgat 1680
actcaatccc catcagcgtt tccatacttc cacccgacca aggaaatatt tatacctgga 1740
caagttagga atttaattga aatgtgccaa gttgacacac tcattcctgt taacaataca 1800
caggaaaatg taagatctgt gaatatgtac actgttgatt tacgcacaca agttgattta 1860
gctaaagaag tcttttctat accagtagat attgcctcac aacctttagc cactactctc 1920
ataggagaac ttgcaagcta ttacacacac tggactggta gtctgcgctt tagctttatg 1980
ttttgtggtt ctgctagctc tactttgaaa ctattaattg catacactcc tcctggtgtt 2040
ggaaaaccta aatccaggag agaagccatg cttggtacac atttagtgtg ggatgtgggg 2100
ttgcagtcca ccgcctcact agttgtacca tgggttagtg ctagccattt tagattcact 2160
acacctgaca catattcctc agctggttat attacatgct ggtaccagac caactttgta 2220
gtacctgata gtactccaga taacgccaaa atggtgtgca tggtttctgc atgcaaagat 2280
ttttgcttaa gattagccag agatactaac ctacacacac aagaaggagt actcacacaa 2340
aacccagttg aaaattatat agatagtgta ttaaatgaag ttcttgtggt gccaaatatc 2400
caacctagca catctgtgtc aagtcatgca gcgcctgcat tggatgctgc ggaaaccgga 2460
cacaccagct ctgttcaacc tgaagatatg attgaaacta gatatgttat aactgatcaa 2520
acaagggatg aaacaagtat tgagagtttc ttaggtaggt cagggtgtat cgctatgata 2580
gaatttaata caagtagtga taaaactgaa catgataaaa ttggtaaagg attcaaaaca 2640
tggaaggtta gtcttcaaga aatggcacaa atcagaagaa aatatgaatt attcacatat 2700
acaagatttg attcagagat aacaatagtc actgcagccg cagctcaagg aaatgatagt 2760
ggacatatag tattgcaatt tatgtatgta cccccaggag cacctgtccc cgaaaaacgt 2820
gatgattaca catggcaatc aggaacaaat gcatctgtgt tctggcaaga aggacaacca 2880
taccccagat tcacaatccc ttttatgagc attgcatcag cctattacat gttttatgat 2940
ggttatgatg gtgatagtgc agcatcaaaa tacggttctg tagtcactaa tgatatggga 3000
accatatgtg ttagaatagt gacatccaac caaaaacacg attcaaatat tgtgtgccgc 3060
atttaccaca aggccaaaca tataaaagca tggtgtcctc gcccaccaag ggctgttgcc 3120
tatcaacaca cacactcaac caattacata ccatccaatg gtgaggccac aactcagatt 3180
aaaaccagac ctgatgtttt taccgttaca aacgtcggac catctagtat gtttgtacat 3240
gtgggtaact taatctatag aaatcttcat ctctttaatt ctgatcttga tgattctatt 3300
cttgtatcat actccagtga tctaatcata tatcgaacaa acactgaagg taatgatgtg 3360
atccctaatt gtgattgcac tgaatgtaca tattactgcc accacaaaga taggtatttt 3420
cctatcagag ttactgcaca tgattggtat gagattcaag aatcagaata ttacccaaaa 3480
catatccaat ataatctcct gattggagag ggtccttgtg aaccaggaga ttgtggagga 3540
aaactattgt gtaaacatgg tgttataggt atgattacag ctggaggtga aggtcacgtt 3600
gcttttattg acctgagaaa attccagtgt gctgaggagc aagggttatc tgattatgtg 3660
gaacatcttg gtcaagtctt tggtgtaggc ttcgtagaca gcatcaaaca acaggtaaac 3720
tttatcaacc ccactagtaa aattggttca aaagtgatta aatggttgtt gaggatagtt 3780
tcagctatga taataatggt aaggaatagt tctgatccac aaactgtaat tgccactctc 3840
acccttctag gttgttcagg ctcaccatgg aggtttctta aagagaaact ctgtgcgtgg 3900
ctccagctta gctatgtaca taagcagtct gattcatggc tcaagaaatt tactgaagcg 3960
tgtaacgcag cacgtgggct agagtggatt ggacaaaaga tatctaaatt tatagattgg 4020
ataaagagta tgttaccaca ggctcaattg aaaattgatt acctaaccaa attaaaacaa 4080
cttaatctct tagagaaaca aatagaaaca attagacttg cacctgctag tgttcaggag 4140
aaaattttca ttgaaataaa cacccttcat gatttatcct taaaattctt accactgtat 4200
gcatctgaag cacgtagaat taagaattta tatatcaaat gcagtaatgt tattaaaggg 4260
ggaaagagga atgaaccagt tgcagttcta atacatggtt ctcctggtac tggaaaatct 4320
cttgccactt ctgttcttgc tcgaatgcta actgttgaga ctgatatata ttctttgccc 4380
ccagatccta aatattttga tgggtatgat caacagagtg ttgttatcat ggatgatatc 4440
atgcaaaatc ctagtggtga agacatgact ttgttttgcc aaatggtatc gagtgtccct 4500
ttcatacctc ctatggcaga tcttccagat aaaggaaaac catttacatc caagtttgta 4560
cttgcaagca ctaatcacac tctactaaca ccaccaacag tatcttcatt accagcaatg 4620
gcaagaaggt tttactttga tctagacatt caagttaaga aagagtatct tttagatggc 4680
aaactagata tagcaaaaag ctttcgacca tgtgatgtta atattaaaat aggcaatgct 4740
aagtgctgtc catttatctg tggaaaagct gtagagttta aagatagaaa ttcatgtaca 4800
accttgtctt tatctcaatt gtatagtcat ataaaggaag aagataggag aagaagcagt 4860
gcagcacaag caatggaggc tatatttcaa ggtatagacc tccaatctcc tccacctcca 4920
gccatagctg acctccttag gtctgtgaaa acaccagaga tcattaagta ttgccaagat 4980
aataattgga ttgttccagc agagtgttct attgaaagag atttagggat agcaaatatg 5040
actataggta taatagctaa tgtggtctct atagtaggtg ttatctatat aatttataaa 5100
ttgttctgta cacttcaggg tccatactca ggggaaccta aacccaaaag cagagctcca 5160
gagagaagag tagttactca gggcccagag gaagagtttg gtcgctcact actcaaacat 5220
aattgctgtg ttgtgacaac cgacaaaggc aaattcacag gtcttggcat atatgaccaa 5280
gtcatggtac ttccaacaca ttctgaccca ggctctgaga tcttggtaga tggagtaaaa 5340
gttaaggtct ctgattccta tgatttgcat aaccatgagg gtgttaagct agagatcaca 5400
gttgtgaaat taattagaaa tgagaagttt aaagacatca gaaaatattt accctcacgt 5460
gaagatgact atcctgcttg taaccttgcc ttactagcta atcaagatga gccaacaata 5520
ataagtgttg gtgatgcagt atcttatggt aacatcttat tgagtggtac caatactgca 5580
cgaatgatca agtaccatta cccgacaaaa gctggatatt gtgggggtgt tttgtacaag 5640
gttggctcta ttcttggtat acatgttggt ggcaatggta gagatggatt ttctgcaatg 5700
cttctcaaat cttattttgg tgaaacccag ggtttaatca ctaaagaact tcctgtatct 5760
gtaaagaact taccatccgt acatgtttca tctaaaaccc gactacaacc tagtgttttt 5820
catgatgttt tccctggaac aaaagagcct gcagttctta gtagtaatga tccaagacta 5880
gaaactgact ttgactcagc acttttctcc aaatataaag gtaatcctgc ttgtcaagtg 5940
accccacaca tgaaaattgc tgtagcacat tatgcagcac agttatctac actagacata 6000
aatcctcaac ccctttcatt ggaagagagt gtgtttggta ttgagggatt agaagctttg 6060
gatttaaata ctagtgcagg atttccttat gtttcactgg gaataaagaa gaaagatctt 6120
atagataaaa agaccaaaga catcacaaaa cttaggaaag caattgatga atatggtatt 6180
gatttgccta tggttacttt tctgaaagat gaacttagaa agaaggaaaa aataaaagat 6240
ggaaagacta gagtcataga agctaatagt gtgaatgata ctgtgttatt cagaagtgta 6300
tttggaaatc ttttctctgc tttccacaaa aacccaggta tagtcactgg ttcagcagta 6360
gggtgtgacc ctgaagtatt ctggtcaact atacctctca tgctagatgg agaatgttta 6420
atggcttttg attattcaaa ctatgatggt agcctacatc ccgtttggtt taaatgtctt 6480
agtatgctct tagaagacat aggtttctcc tctcaactta ttaaccagat ctgtaactct 6540
aaacatatat acaaatctaa gtattatgaa gtggaaggag gtatgccatc tggatgtgct 6600
ggtactagta tttttaatac aataatcaac aatattatca ttagaacttt ggtactagat 6660
gcttataaga acatagatct agataaactg aaaatcttag catatgggga tgatgtcatc 6720
ttttcttata attttaaact tgacatggca gttcttgcca aagaaggaga aaaatatgga 6780
ctaacaatca cccctgctga taagtctgat gttttccaag aattgaccta taaaaatgta 6840
acttttctta aaagaggatt cagagctgat gagcgccact ctttccttat acaccctacc 6900
tttcctgtgg ctgagattca tgactccatc agatggacca aaaacccttc atgtatgcag 6960
gaacacgtgc tatctttgtg tcatttaatg tggcataatg gtagacatgc ataccaggaa 7020
ttcattaaag gtatacgcag tgtatctgcc ggtcgggcac tgtatatacc agcttatgaa 7080
gttcttgaac atgaatggta tgaaaaattt tagatataaa actgttaaat atagctagtt 7140
tattagtttt at 7152
<210> 30
<211> 7152
<212> DNA
<213> unknown
<220>
<223> synthetic
<400> 30
ttaaaactgg gagtgggttg ttcccactca ctccacccat gcggtgttgt actctgttat 60
tacggtaact ttgtacgcca gtttttccca cccttcccca taatgtaact tagaagtttg 120
tacaatatga ccaataggtg acaatcatcc agactgtcaa aggtcaagca cttctgtttc 180
cccggtcaat gaggatatgc tttacccaag gcaaaaacct tagagatcgt tatccccaca 240
ctgcctacac agagcccagt accatttttg atataattgg gttggtcgct ccctgcaaac 300
ccagcagtag acctggcaga tgaggctgga cattccccac tggcgacagt ggtccagcct 360
gcgtggctgc ctgctcaccc ttcttgggtg agaagcctaa ttattgacaa ggtgtgaaga 420
gccgcgtgtg ctcagtgtgc ttcctccggc ccctgaatgt ggctaacctt aaccctgcag 480
ccgttgccca taatccaatg ggtttgcggt cgtaatgcgt aagtgcggga tgggaccaac 540
tactttgggt gtccgtgttt cctgtttttc ttttgattgc attttatggt gacaatttat 600
agtgtataga ttgtcatcat gggagcacaa gtgtctagac aaaacgtagg tacacatagt 660
acacaaaact cagtgtctaa cggatctagt cttaattatt ttaatattaa ttattttaaa 720
gacgctgcat ctagcggagc tagtagactt gattttagtc aggatccatc taaatttacc 780
gatccagtta aagacgtact cgaaaaaggt atacctacat tgcaatcacc tacagtcgaa 840
gcatgcggat actctgatag attgatacaa attactaggg gggatagtac tattactagt 900
caggataccg ctaacgccgt agtcgcatac ggagtttggc catcttatct tacacctgat 960
gacgcaaccg caatcgataa acctacacaa cctgatacta gttctaatag attctataca 1020
cttgattcta gatcatggac tagtgctagt tcaggttggt ggtggaaatt gcctgacgca 1080
cttaaaaata tgggtatatt cggtgagaat atgttttatc atttcttagg taggtcaggg 1140
tatactatac acgttcaatg taatagttct aaatttcacc aaggtctatt aatcgttgcc 1200
gctatacccg aacaccaatt agctagcgct acatcaggta acgttagcgt agggtataat 1260
catacacatc caggcgaaca gggtagggaa gtcgtaccat ctagaacatc tagcgataat 1320
aaacgaccat ctgacgatag ttggcttaat ttcgatggta cactattagg taatctacct 1380
atatatccac atcaatatat taatcttaga actaataatt ccgctacact tatactgcca 1440
tacgttaacg cagtgcctat ggatagtatg cttagacata ataattggtc attagtgatt 1500
ataccgatat gtccattgca agtgcaacct ggaggtacac aatctatacc tattaccgtt 1560
agtattagtc ctatgtttag cgaatttagc ggacctagat ctaaggtagt gtttagtact 1620
acacaggggt tacccgttat gcttacacct ggatcaggtc aatttttgac tactgacgat 1680
acacaatcac ctagtgcatt cccatatttt caccctacta aagagatttt tatacccggt 1740
caggttagga atctaatcga aatgtgtcaa gtcgatacac ttatacccgt taataataca 1800
caggaaaacg ttagatccgt taatatgtat accgttgatt tgcgtacaca agtcgatcta 1860
gctaaagagg ttttttcgat accagtcgat atcgctagtc aaccattagc tactacactt 1920
ataggcgaac tcgcatcata ttatacacat tggaccggat cacttagatt ttcttttatg 1980
ttttgcggat ccgctagtag tacacttaaa ctgttaatcg catatacacc tccaggagtg 2040
ggtaagccta aatctagacg cgaagctatg ttaggtacac atctagtttg ggacgtaggg 2100
ttacaatcta ccgctagttt agtcgtacca tgggttagcg catcacattt tagatttact 2160
acacctgata cttattctag tgccggatat ataacatgtt ggtatcaaac taatttcgta 2220
gtgccagata gtacacctga taacgctaaa atggtttgta tggttagcgc atgtaaagat 2280
ttttgtctta gattagctag ggatactaat ttgcatacac aagagggagt gcttacacaa 2340
aatccagtcg aaaattatat cgatagcgta cttaacgaag tgttagtcgt acctaatata 2400
caacctagta ctagtgtgtc atctcacgct gcaccagcat tagacgcagc cgaaaccgga 2460
catacatcta gtgtgcaacc tgaggatatg atagagacta gatacgttat taccgatcag 2520
actagagacg aaacatcaat cgaatcattc ttaggtaggt cagggtgtat cgctatgata 2580
gagtttaata ctagttccga taaaaccgaa cacgataaga taggtaaggg gtttaaaact 2640
tggaaagtgt cattgcagga aatggcacaa attagacgta aatacgaatt gtttacatat 2700
actagattcg atagtgagat tactatcgtt accgcagccg cagcacaagg taacgattca 2760
ggtcatatag tgttacaatt tatgtacgta ccaccaggtg caccagtacc cgaaaaacgc 2820
gatgattata catggcaatc cggtactaac gctagcgttt tttggcaaga gggacaacca 2880
tatcctagat ttactatacc ttttatgtca atcgctagtg catattatat gttttacgac 2940
ggatacgatg gcgattctgc cgcatctaaa tacggatctg tagtgactaa cgatatgggt 3000
actatatgcg ttagaatcgt tacatctaat caaaaacacg attctaatat cgtttgtaga 3060
atatatcata aagctaaaca tattaaggca tggtgtccta gaccacctag agccgttgca 3120
tatcaacata cacatagtac taattatata ccatctaacg gtgaggctac tacacaaatt 3180
aaaactagac ctgacgtttt taccgttact aacgtaggtc catctagtat gttcgtacac 3240
gtaggtaatc tgatatatag aaatttgcat ctattcaatt ccgatttaga cgattctata 3300
ctcgttagtt attctagcga tctgattata tatagaacta ataccgaagg taacgatgtg 3360
atacctaatt gcgattgtac cgaatgtact tattattgtc atcataaaga taggtatttt 3420
ccgatacgcg ttaccgcaca cgattggtac gaaatacagg aatctgagta ttatcctaaa 3480
catatacaat ataatctgtt aataggcgaa ggtccatgcg aaccaggcga ttgcggaggt 3540
aagttattgt gtaaacacgg agtgataggt atgattaccg cagggggaga gggacacgtt 3600
gcgtttatcg atttgcgaaa atttcaatgc gcagaggaac aggggttatc cgattacgtt 3660
gagcatttag ggcaagtgtt cggagtcgga ttcgttgatt caattaaaca acaggttaat 3720
tttattaatc ctacatctaa aatcggatct aaagtgataa aatggttact tagaatcgtt 3780
agcgctatga taattatggt taggaattct agcgatccac aaaccgtaat cgctacactt 3840
acactattag ggtgttcagg ttcaccttgg cgatttctta aagagaaatt atgcgcatgg 3900
ttgcaattgt catacgttca taaacaatcc gatagttggc ttaaaaaatt taccgaagca 3960
tgtaacgccg ctaggggact cgaatggata gggcaaaaaa tatctaaatt tatcgattgg 4020
attaaatcta tgttaccaca agcgcaattg aaaatcgatt atcttactaa gcttaaacaa 4080
ttgaacttac tcgaaaaaca aatcgaaact attagactcg caccagctag tgtgcaagag 4140
aaaattttta tagagattaa tacattacac gatctatcac ttaaattctt accattatac 4200
gctagcgaag ctagacggat taaaaatcta tatattaagt gttctaacgt aattaaggga 4260
ggtaagcgta acgaacccgt tgccgtactt atacacggat caccaggtac cggtaagtca 4320
ttagcgacta gcgtactcgc tagaatgctt acagtcgaaa ccgatatata ctctttacca 4380
cctgatccta aatatttcga cggatacgat caacaatccg tagtgattat ggacgatatt 4440
atgcaaaatc ctagtggtga ggatatgaca ttgttttgtc aaatggtatc tagcgtacca 4500
tttataccac ctatggccga tttacccgat aagggtaagc cttttacatc taaattcgta 4560
ctcgcatcaa ctaatcatac attgcttaca ccacctaccg ttagttcact accagctatg 4620
gctagacggt tttatttcga tctagatata caggttaaaa aagagtatct gttagacggt 4680
aagttagata tcgctaaatc ttttagacca tgcgatgtta atattaaaat cggtaacgct 4740
aaatgttgtc catttatatg cggtaaggca gtcgaattta aagataggaa ttcatgtact 4800
acactatcac tatcacaatt gtattcacat attaaggaag aggatagacg tagatctagt 4860
gccgcacaag ctatggaagc tatttttcag ggtatcgatc tgcaatcacc accaccacca 4920
gctatagccg atctacttag atccgttaaa acacctgaga taattaagta ttgtcaggat 4980
aataattgga tcgtaccagc cgaatgttca atcgaacgcg atttagggat agcgaatatg 5040
acaatcggta taatcgctaa cgtagtgtca atcgtaggcg ttatatatat tatatataaa 5100
ttgttttgta cattgcaggg accatactct ggcgaaccta aacctaaatc tagagcacct 5160
gaaagacgcg tagtgacaca gggacctgaa gaggaattcg gtaggtcatt gcttaaacat 5220
aattgttgcg tagtgactac cgataagggt aagtttaccg gattaggtat atacgatcag 5280
gttatggtgt tacctacaca ttccgatcca ggatctgaga tactcgtaga cggagttaag 5340
gttaaggtta gcgattcata cgatctacat aatcacgaag gcgttaagtt agagattacc 5400
gtagttaagc ttatacgtaa cgaaaaattt aaagatatac gaaaatatct accatcacgc 5460
gaagacgatt atcctgcatg taatctcgca ctattagcga atcaagacga acctacaatt 5520
attagcgtag gcgatgccgt atcatacggt aatatactgt tatccggtac taataccgct 5580
agaatgatta agtatcatta tcctactaaa gccggatatt gcggaggagt gttatataaa 5640
gtcggatcta tactcggtat acacgtaggc ggtaacggta gggacggatt ttccgctatg 5700
ttacttaaat cttatttcgg tgagacacag ggattgatta ctaaagagtt acccgtatcc 5760
gttaaaaatc tacctagcgt acacgttagt tctaaaacta gattgcaacc tagtgtgttt 5820
cacgacgttt ttccaggtac taaggaacct gccgtactat cttctaacga tcctagactc 5880
gaaaccgatt tcgatagtgc attattctct aaatataagg gtaatcctgc atgtcaggtt 5940
acaccacata tgaaaatcgc agtcgcacat tacgctgcac aattgtctac acttgatatt 6000
aatccacaac cactatcact tgaggaatcc gtattcggta tcgaagggtt agaggcactt 6060
gatcttaata ctagtgccgg attcccatac gttagtctag gtattaaaaa aaaagatcta 6120
atcgataaaa aaactaagga tattactaaa ttgcgaaaag cgatagacga atacggtatc 6180
gatctaccta tggttacatt ccttaaagac gaacttagaa aaaaagagaa aattaaagac 6240
ggtaagacta gggttatcga agctaactct gttaacgata ccgtactttt tagatccgta 6300
ttcggtaatc tattttccgc attccataaa aatccaggta tcgttaccgg atccgcagtc 6360
ggatgcgatc cagaagtgtt ttggtctact ataccactta tgttagacgg tgagtgtctt 6420
atggcattcg attattctaa ttacgatggg tcattgcatc ccgtatggtt taaatgtcta 6480
tctatgttac tcgaagatat agggtttagt tcacaattga ttaatcagat ttgtaactct 6540
aaacatatat ataaatctaa atattacgaa gtcgaagggg gtatgccatc aggttgcgca 6600
ggtacatcta tttttaatac tataattaat aatattataa ttagaacatt agtgttagac 6660
gcatataaaa atatcgatct agataagctt aagatactcg catacggaga tgacgttata 6720
ttctcatata attttaaact tgatatggcc gtactcgcta aagagggaga aaaatacgga 6780
cttacaatta cacctgccga taagtctgac gtttttcagg aattgactta taaaaacgtt 6840
acattcctta aaagggggtt tcgcgcagac gaacgacatt cttttcttat acatcctaca 6900
tttcccgttg ccgaaataca cgattcaatt agatggacta aaaatcctag ttgtatgcaa 6960
gaacacgtac ttagtctatg tcatcttatg tggcataacg gtagacacgc ttatcaggaa 7020
tttattaagg gtattagatc cgttagtgcc ggtagggcac tatatatacc cgcatacgaa 7080
gtactcgaac acgaatggta cgaaaaattt tagatataaa actgttaaat atagctagtt 7140
tattagtttt at 7152
<210> 31
<211> 7212
<212> DNA
<213> Human rhinovirus 14
<400> 31
ttaaaacagc ggatgggtat cccaccattc gacccattgg gtgtagtact ctggtactat 60
gtacctttgt acgcctgttt ctccccaacc acccttcctt aaaattccca cccatgaaac 120
gttagaagct tgacattaaa gtacaatagg tggcgccata tccaatggtg tctatgtaca 180
agcacttctg tttcccagga gcgaggtata ggctgtaccc actgccaaaa gcctttaacc 240
gttatccgcc aaccaactac gtaacagtta gtaccatctt gttcttgact ggacgttcga 300
tcaggtggat tttccctcca ctagtttggt cgatgaggct aggaattccc cacgggtgac 360
cgtgtcctag cctgcgtggc ggccaaccca gcttatgctg ggacgccctt ttaaggacat 420
ggtgtgaaga ctcgcatgtg cttggttgtg agtcctccgg cccctgaatg cggctaacct 480
taaccctaga gccttatgcc acgatccagt ggttgtaagg tcgtaatgag caattccggg 540
acgggaccga ctactttggg tgtccgtgtt tctcattttt cttcatattg tcttatggtc 600
acagcatata tatacatata ctgtgatcat gggcgctcag gtttctacac agaaaagtgg 660
atctcacgaa aatcaaaaca ttttgaccaa tggatcaaat cagactttca cagttataaa 720
ttactataag gatgcagcaa gtacatcatc agctggtcaa tcactgtcaa tggacccatc 780
taagtttaca gaaccagtta aagatctcat gcttaagggt gcaccagcat tgaattcacc 840
caatgttgag gcctgtggtt atagtgatag agtacaacaa atcacactcg ggaattcaac 900
aataacaaca caagaagcag ccaacgctgt tgtgtgttat gctgaatggc cagagtacct 960
tccagatgtg gacgctagtg atgtcaataa aacttcaaaa ccagacactt ctgtctgtag 1020
gttttacaca ttggatagta agacatggac aacaggttct aaaggctggt gctggaaatt 1080
accagatgca ctcaaggata tgggtgtgtt cgggcaaaac atgtttttcc actcactagg 1140
aagatcaggt tacacagtac acgttcagtg caatgccaca aaattccata gcggttgtct 1200
acttgtagtt gtaataccag aacaccaact ggcttcacat gagggtggca atgtttcagt 1260
taaatacaca ttcacgcatc caggtgaacg tggtatagat ttatcatctg caaatgaagt 1320
gggagggcct gtcaaggatg tcatatacaa tatgaatggt actttattag gaaatctgct 1380
cattttccct caccagttca ttaatctaag aaccaataat acagccacaa tagtgatacc 1440
atacataaac tcagtaccca ttgattcaat gacacgtcac aacaatgtct cactgatggt 1500
catccctatt gcccctctta cagtaccaac tggagcaact ccctcactcc ctataacagt 1560
cacaatagca cctatgtgca ctgagttctc tgggataagg tccaagtcaa ttgtgccaca 1620
aggtttgcca actacaactt tgccggggtc aggacaattc ttgaccacag atgacaggca 1680
atcccccagt gcactgccaa attatgagcc aactccaaga atacacatac tagggaaagt 1740
tcataacttg ctagaaatta tacaggtaga tacactcatt cctatgaaca acacgcatac 1800
aaaagatgag gttaacagtt acctcatacc actaaatgca aacaggcaaa atgagcaggt 1860
ttttgggaca aacctgttta ttggtgatgg ggtcttcaaa actactcttc tgggtgaaat 1920
tgttcagtac tatacacatt ggtctggatc acttagattc tcttcgatgt atactggtcc 1980
tgccttgtcc agtgctaaac tcactctagc atacaccccg cctggtgctc gtggtccaca 2040
ggacaggaga gaagcaatgc taggtactca tgttgtctgg gatattggtc tgcaatccac 2100
catagtaatg acaataccat ggacatcagg ggtgcagttt agatatactg atccagatac 2160
atacaccagt gctggctttc tatcatgttg gtatcaaact tctcttatac ttcccccaga 2220
aacgaccggc caggtctact tattatcatt cataagtgca tgtccagatt ttaagcttag 2280
gctgatgaaa gatactcaaa ctatctcaca gactgttgca ctcactgaag gcttaggtga 2340
tgaattagaa gaagtcatcg ttgagaaaac gaaacagacg gtggcctcaa tctcatctgg 2400
tccaaaacac acacaaaaag tccccatact aactgcaaac gaaacagggg ccacaatgcc 2460
tgttcttcca tcagacagca tagaaaccag aactacctac atgcacttta atggttcaga 2520
aactgatgta gaatgctttt tgggtcgtgc agcttgtgtg catgtaactg aaatacaaaa 2580
caaagatgct actggaatag ataatcacag agaagcaaaa ttgttcaatg attggaaaat 2640
caacctgtcc agccttgtcc aacttagaaa gaaactggaa ctcttcactt atgttaggtt 2700
tgattctgag tataccatac tggccactgc atctcaacct gattcagcaa actattcaag 2760
caatttggtg gtccaagcca tgtatgttcc acatggtgcc ccgaaatcca aaagagtggg 2820
cgattacaca tggcaaagtg cttcaaaccc cagtgtattc ttcaaggtgg gggatacatc 2880
aaggtttagt gtgccttatg taggattggc atcagcatat aattgttttt atgatggtta 2940
ctcacatgat gatgcagaaa ctcagtatgg cataactgtt ctaaaccata tgggtagtat 3000
ggcattcaga atagtaaatg aacatgatga acacaaaact cttgtcaaga tcagagttta 3060
tcacagggca aagctcgttg aagcatggat tccaagagca cccagagcac taccctacac 3120
atcaataggg cgcacaaatt atcctaagaa tacagaacca gtaattaaga agaggaaagg 3180
tgacattaaa tcctatggtt taggacctag gtacggtggg atttatacat caaatgttaa 3240
aataatgaat taccacttga tgacaccaga agaccaccat aatctgatag caccctatcc 3300
aaatagagat ttagcaatag tctcaacagg aggacatggt gcagaaacaa taccacactg 3360
taaccgtaca tcaggtgttt actattccac atattacaga aagtattacc ccataatttg 3420
cgaaaagccc accaacatct ggattgaagg aagcccttat tacccaagta gatttcaagc 3480
aggagtgatg aaaggggttg ggccggcaga gctaggagac tgcggtggga ttttgagatg 3540
catacatggt cccattggat tgttaacagc tgaaggtagt ggatatgttt gttttgctga 3600
catacgacag ttggagtgta tcgcagagga acaggggctg agtgattaca tcacaggttt 3660
gggtagagct tttggtgtcg ggttcactga ccaaatctca acaaaagtca cagaactaca 3720
agaagtggcg aaagatttcc tcaccacaaa agttttgtcc aaagtggtca aaatggtttc 3780
agctttagtg atcatttgca gaaatcatga tgacttggtc actgttacgg ccactctagc 3840
actacttgga tgtgatggat ctccttggag atttctgaag atgtacattt ccaaacactt 3900
tcaggtgcct tacattgaaa gacaagcaaa tgatggatgg ttcagaaagt ttaatgatgc 3960
atgtaatgct gcaaagggat tggaatggat tgctaataag atttccaaac tgattgaatg 4020
gataaaaaac aaagtacttc cccaagccaa agaaaaacta gaattttgta gtaaactcaa 4080
acaacttgat atactagaga gacaaataac caccatgcat atctcgaatc caacacagga 4140
aaaacgagag cagttgttca ataacgtatt gtggttggaa caaatgtcgc aaaagtttgc 4200
cccattttat gccgttgaat caaaaagaat cagggaactc aagaacaaaa tggtaaatta 4260
tatgcaattt aaaagtaaac aaagaactga accagtgtgt gtattaatcc atggtacacc 4320
cggttctggt aaatcattaa caacatccat tgtgggacgt gcaattgcag aacacttcaa 4380
ttcagcagta tattcacttc caccagatcc caagcacttt gatggttatc agcaacagga 4440
agttgtgatt atggatgatc tgaaccaaaa tccagatgga caggatataa gcatgttttg 4500
tcaaatggtt tcttcagtgg atttcttgcc tccaatggct agtttagata acaagggcat 4560
gttattcacc agtaattttg ttctagcctc cacaaattct aacacactaa gccccccaac 4620
aatcttgaat cctgaagctt tagtcaggag atttggtttt gacctagata tatgtttgca 4680
tactacctac acaaagaatg gaaaactcaa tgcaggcatg tcaaccaaga catgcaaaga 4740
ttgccatcaa ccatctaatt tcaagaaatg ttgcccccta gtctgtggaa aagctattag 4800
cttggtagac agaactacca acgttaggta tagtgtggat caactggtca cggctattat 4860
aagtgatttc aagagcaaaa tgcaaattac agattcccta gaaacactgt ttcaaggacc 4920
agtgtataaa gatttagaga ttgatgtttg caacacacca ccttcagaat gtatcaacga 4980
tttactgaaa tctgtagatt cagaagagat tagggaatat tgtaagaaga agaaatggat 5040
tatacctgaa attcctacca acatagaaag ggctatgaat caagccagca tgattattaa 5100
tactattctg atgtttgtca gtacattagg tattgtttat gtcatttata aattgtttgc 5160
tcaaactcaa ggaccatatt ctggtaaccc gcctcacaat aaactaaaag ccccaacttt 5220
acgcccagtt gttgtgcaag gaccaaacac agaatttgca ctatccctgt taaggaaaaa 5280
cataatgact ataacaacct caaagggaga gttcacaggg ttaggcatac atgatcgtgt 5340
ctgtgtgata cccacacacg cacagcctgg tgatgatgta ctagtgaatg gtcagaaaat 5400
tagagttaag gataagtaca aattagtaga tccagagaac attaatctag agcttacagt 5460
gttgacttta gatagaaatg aaaaattcag agatatcagg ggatttatat cagaagatct 5520
agaaggtgtg gatgccactt tggtagtaca ttcaaataac tttaccaaca ctatcttaga 5580
agttggccct gtaacaatgg caggacttat taatttgagt agcaccccca ctaacagaat 5640
gattcgttat gattatgcaa caaaaactgg gcagtgtgga ggtgtgctgt gtgctactgg 5700
taagatcttt ggtattcatg ttggcggtaa tggaagacaa ggattttcag ctcaacttaa 5760
aaaacaatat tttgtagaga aacaaggcca agtaatagct agacataagg ttagggagtt 5820
taacataaat ccagtcaaca cggcaactaa gtcaaaatta catcccagtg tattttatga 5880
tgtttttcca ggtgacaagg aacctgctgt attgagtgac aatgatccca gactggaagt 5940
taaattgact gaatcattat tctctaagta caaggggaat gtaaatacgg aacccactga 6000
aaatatgctt gtggctgtag accattatgc agggcaacta ttatcactag atatccccac 6060
ttctgaactt acactaaaag aagcattata tggagtagat ggactagaac ctatagatat 6120
tacaaccagt gcaggatttc cctatgtgag tcttgggatc aaaaagagag acattctgaa 6180
taaagagacc caggacacag aaaagatgaa gttttatcta gacaagtatg gcattgactt 6240
gcctctagtt acatatatta aggatgaatt aagaagtgtt gacaaagtcc gattagggaa 6300
aagtagatta attgaagcct ccagtttgaa tgattctgtt aacatgagaa tgaaactagg 6360
caacctttac aaagcattcc atcaaaatcc cggtgttctg actggatcag cagtgggttg 6420
tgatcctgat gtgttttggt ctgtcatccc ttgcttaatg gatgggcacc tgatggcatt 6480
tgattactct aattttgatg cctctttgtc accagtttgg tttgtctgtc tagagaaggt 6540
tttgaccaag ttaggctttg caggctcttc attaattcaa tcaatttgta atacccatca 6600
tatctttagg gatgaaatat atgtggttga aggtggcatg ccctcagggt gttcaggaac 6660
cagcatattc aattccatga tcaacaacat aatcattagg actttgatat tagatgcata 6720
taaaggaata gatttagaca aacttaaaat cttagcttac ggtgatgatt tgattgtttc 6780
ttatccttat gaactggatc cacaagtgtt ggcaactctt ggtaaaaatt atggactaac 6840
catcacaccc ccagacaaat ctgaaacttt tacaaaaatg acatgggaaa acttgacatt 6900
tttaaagaga tacttcaagc ctgatcaaca atttcccttt ttggttcacc cagttatgcc 6960
catgaaagat atacatgagt caatcagatg gacaaaggat cctaaaaaca cacaggatca 7020
cgtccgatca ttatgcatgt tagcatggca ctcaggagaa aaagagtaca atgaattcat 7080
tcagaagatc agaactactg acattggaaa atgtctaatt ctcccagaat acagcgtact 7140
taggaggcgc tggttggacc tcttttaggt taacaatata gacacttaat ttgagtagaa 7200
gtaggagttt at 7212
<210> 32
<211> 7212
<212> DNA
<213> unknown
<220>
<223> synthetic
<400> 32
ttaaaacagc ggatgggtat cccaccattc gacccattgg gtgtagtact ctggtactat 60
gtacctttgt acgcctgttt ctccccaacc acccttcctt aaaattccca cccatgaaac 120
gttagaagct tgacattaaa gtacaatagg tggcgccata tccaatggtg tctatgtaca 180
agcacttctg tttcccagga gcgaggtata ggctgtaccc actgccaaaa gcctttaacc 240
gttatccgcc aaccaactac gtaacagtta gtaccatctt gttcttgact ggacgttcga 300
tcaggtggat tttccctcca ctagtttggt cgatgaggct aggaattccc cacgggtgac 360
cgtgtcctag cctgcgtggc ggccaaccca gcttatgctg ggacgccctt ttaaggacat 420
ggtgtgaaga ctcgcatgtg cttggttgtg agtcctccgg cccctgaatg cggctaacct 480
taaccctaga gccttatgcc acgatccagt ggttgtaagg tcgtaatgag caattccggg 540
acgggaccga ctactttggg tgtccgtgtt tctcattttt cttcatattg tcttatggtc 600
acagcatata tatacatata ctgtgatcat gggcgcacaa gtgtcaacgc aaaaatccgg 660
atcacacgaa aaccaaaaca tactgactaa cggatctaat cagactttta cagtgattaa 720
ttattataaa gacgccgcta gtactagttc agccggtcaa tcactatcta tggatccatc 780
taaatttacc gaacccgtta aggatcttat gcttaaaggc gcaccagcac ttaactcacc 840
taacgttgag gcatgcggat actctgatag agtgcaacaa attacattgg gtaatagtac 900
aattactaca caggaagccg ctaacgcagt cgtttgttac gccgaatggc ccgaatactt 960
acccgatgtc gacgcatcag acgttaataa gacatctaaa cccgatacta gcgtatgtag 1020
attctataca ctcgatagta agacttggac taccggtagt aagggatggt gttggaaatt 1080
gcctgacgca cttaaggata tgggcgtatt cggtcagaat atgttttttc actcattggg 1140
taggtcaggg tatacagtac acgttcaatg taacgctact aaatttcact cagggtgtct 1200
gttagtcgtt gtgatacccg aacaccaatt ggcatcacac gaagggggta acgttagcgt 1260
taagtataca tttacacatc caggcgaaag aggtatcgat ctatcatccg ctaacgaagt 1320
ggggggaccc gttaaagacg ttatatacaa tatgaacggt acactgttag gtaatctgtt 1380
aatttttcca catcaattta ttaatctgag aactaataat accgctacaa tcgttatacc 1440
atatattaac tcagtgccaa tcgatagtat gactagacat aataacgtta gtcttatggt 1500
gataccaatc gcaccattga cagtgccaac cggtgcaaca cctagtctac caattacggt 1560
tacaatcgca cctatgtgta ctgagttttc cggtattagg tctaaatcaa tcgtaccaca 1620
agggttacct actactacat tgcccggatc cggtcaattt ttgactactg acgataggca 1680
atcacctagc gcattgccta attacgaacc tacaccacgt atacatatac tcggtaaggt 1740
gcataatctg ttagagatta tacaggtcga tacactgata cctatgaata atacacatac 1800
aaaagacgaa gtgaattcgt atctgatacc gttaaacgct aataggcaaa acgaacaggt 1860
attcggtacg aatctgttta taggcgatgg cgtattcaaa actacactgt taggcgaaat 1920
cgttcaatac tatacacatt ggtcagggtc acttagattc tcatctatgt atacaggtcc 1980
agcactatct agcgctaaat tgacactcgc atatacacct cccggtgcta ggggaccaca 2040
ggataggaga gaggctatgt taggtacaca cgtagtgtgg gatatcggat tgcaatcgac 2100
aatcgttatg actataccat ggacatcagg cgtacaattt agatataccg atcccgatac 2160
atatacatca gccggattcc tatcatgttg gtatcagact agtctgatac tgccacccga 2220
aactaccggt caagtgtatc tattgtcatt catatccgca tgtcccgatt ttaaacttag 2280
attgatgaaa gatacacaaa caatttcgca aacagtcgca ctaaccgaag ggttaggcga 2340
cgaattagag gaagtgatag tcgaaaaaac taagcaaaca gtcgcatcaa ttagttccgg 2400
acctaaacat acacaaaaag tgccaatatt gaccgctaac gaaacaggcg caactatgcc 2460
cgtactgcca tccgattcaa tcgaaacacg aactacttat atgcatttta acggatccga 2520
aaccgatgtc gaatgctttc taggtagggc cgcatgcgta cacgttacag agatacagaa 2580
taaagacgca accggtatcg ataatcatag agaggctaaa ttgtttaacg attggaaaat 2640
taatctatct agtctagtgc aattgcgtaa aaaactcgaa ttgtttacat acgttagatt 2700
cgatagcgaa tatactatac tcgcaaccgc atcacaaccc gattccgcta attatagttc 2760
taacttagtc gttcaggcta tgtacgtacc acacggtgca cctaaatcta aaagagtcgg 2820
cgattataca tggcaatccg catctaatcc atcagtgttt tttaaggtag gcgatactag 2880
tagattctca gtgccatacg tagggttagc tagcgcatat aattgttttt acgacggata 2940
ctcacacgac gatgccgaaa cacaatacgg tattacggta ctgaatcata tggggtcaat 3000
ggcatttaga atcgttaacg aacacgacga acataaaaca ctagttaaga ttagagtgta 3060
tcatagggct aagttagtcg aagcatggat acctagagca cctagagcac taccatatac 3120
atcaatcggt aggactaatt atcctaaaaa taccgaaccc gttattaaaa aacgtaaagg 3180
cgatattaag tcatacggat tagggcctag atacggaggt atatatacat ctaacgttaa 3240
gattatgaat tatcatctta tgacaccaga ggatcatcat aacttaatcg caccataccc 3300
taatagggat ctagcaatcg ttagtacagg gggacacgga gccgaaacta taccgcattg 3360
taatagaaca tcaggcgtat actatagtac atattataga aagtattatc ctattatatg 3420
cgaaaaacct actaatattt ggatcgaagg gtcaccatat tatcctagta gattccaagc 3480
cggagtgatg aaaggcgtag gtccagccga attaggcgat tgcggaggta tactgagatg 3540
tatacacggt ccaatcggac tgttaactgc cgaagggtca ggatacgttt gtttcgccga 3600
tattaggcaa ttggagtgta tagccgaaga acagggacta tccgattata ttaccggatt 3660
gggtagggca ttcggagtgg ggtttacgga tcagattagt actaaggtta ccgaattgca 3720
ggaagtcgct aaggattttt tgactactaa agtgctatct aaagtcgtta aaatggttag 3780
cgcattagtg ataatttgta ggaatcacga cgatctagtt acggttaccg ctacactcgc 3840
actattaggg tgcgatgggt caccatggag attccttaaa atgtatatta gtaagcattt 3900
tcaagtgcca tatatcgaaa gacaggctaa cgacggatgg tttagaaaat ttaacgatgc 3960
atgtaacgcc gctaagggac tcgaatggat cgctaataag attagtaagt taatcgaatg 4020
gattaaaaat aaagtgttac cacaagctaa agagaaactc gaattttgta gtaagcttaa 4080
gcaattggat atactcgaaa gacagattac gactatgcat atatctaacc ctacacaaga 4140
gaaacgcgaa caattgttta ataacgtatt gtggttagag caaatgtcac aaaaattcgc 4200
accattttac gcagtcgaat ctaaacgtat acgcgaactg aaaaataaaa tggttaacta 4260
tatgcaattt aaatctaaac aacgaaccga acccgtatgc gtactgatac acggtacacc 4320
cggtagcggt aagtcattga ctacatcaat cgtaggtagg gctatagccg aacactttaa 4380
ctcagccgta tatagtctac cacccgatcc aaaacatttc gatgggtatc aacaacagga 4440
agtcgttatt atggacgatc tgaatcagaa tcccgatggt caggatatta gtatgttttg 4500
tcaaatggtg tcatcagtcg attttctacc acctatggca tcactcgata ataagggtat 4560
gttgtttaca tctaatttcg tactcgcatc aactaactct aatacactat caccacctac 4620
tatactgaat cccgaagcat tagtgcgtag attcggattc gatctagata tatgcttgca 4680
tacaacttat actaaaaacg gtaagcttaa cgccggtatg tcaactaaga catgtaagga 4740
ttgtcaccaa cctagtaatt ttaaaaaatg ttgtccacta gtttgcggta aggcaattag 4800
tctagtcgat agaactacta acgttaggta ttcagtcgat caattggtta ccgcaattat 4860
atccgatttt aaatctaaaa tgcaaattac cgattcactc gaaacattgt ttcagggacc 4920
agtgtataag gatcttgaga tagacgtatg caatacacca cctagtgagt gtattaacga 4980
tctgttaaaa tcagtcgata gcgaagagat acgcgaatat tgtaaaaaaa aaaaatggat 5040
tatacccgaa ataccgacta atatcgaaag agctatgaat caggctagta tgattattaa 5100
tactatactt atgttcgtta gtacattggg tatcgtttac gttatataca aattgttcgc 5160
acaaacacag ggaccatact caggtaatcc accacataat aagcttaagg cacctacact 5220
tagacccgta gtcgttcagg gacctaatac cgaattcgca ctatcactat tgcgtaaaaa 5280
tattatgaca attactacat ctaaaggcga atttacaggg ttagggatac acgatagggt 5340
atgcgttata ccgacacacg ctcaacccgg tgatgacgta ctggttaacg gtcaaaaaat 5400
tagggttaag gataagtata agttagtcga tccagagaat attaacttag agttaaccgt 5460
actgacactc gatagaaacg aaaaatttag ggatattagg gggtttatat ccgaagatct 5520
tgagggagtc gacgctacat tagtcgtaca ctctaataat tttacgaata ctatactcga 5580
agtcggaccc gttactatgg ccggattgat taatctatct agtacaccta ctaatagaat 5640
gattaggtac gattacgcta ctaagacagg gcaatgcgga ggggtgttat gcgcaaccgg 5700
taagatattc ggtatacacg tagggggtaa cggtagacag gggtttagcg cacaattgaa 5760
aaaacagtat ttcgtcgaaa aacagggtca ggtaatcgct agacataagg ttagagagtt 5820
taatattaat cccgttaata ccgctactaa gtctaaattg catccatcag tgttttacga 5880
cgtattccca ggcgataagg aaccagccgt actatccgat aacgatccta gacttgaggt 5940
taagttaacc gaatcactat tctctaagta taagggtaac gttaataccg aacctaccga 6000
aaatatgtta gtcgcagtcg atcattacgc cggtcaattg ctatcacttg atataccgac 6060
tagcgaattg acacttaaag aggcactata cggagtcgac ggactcgaac caatcgatat 6120
tactacatca gccggattcc catacgttag tctaggtatt aaaaaaaggg atatacttaa 6180
caaagagaca caggataccg aaaaaatgaa attttatcta gataaatacg gtatcgatct 6240
accattagtg acttatatta aagacgaatt gcgatcagtc gataaggtta ggttaggtaa 6300
gtctagattg atcgaagcta gttcacttaa cgatagcgtt aatatgcgta tgaaattggg 6360
taatctgtat aaggcatttc accaaaatcc cggagtgtta accggatccg cagtcggatg 6420
cgatccagac gttttttggt cagtgatacc atgtcttatg gacggacatc ttatggcatt 6480
cgattactct aatttcgatg catcactatc acccgtttgg ttcgtatgtc ttgagaaagt 6540
gttaactaag ttagggttcg caggatctag tctgatacaa tcaatttgta atacacatca 6600
tatttttaga gacgaaatat acgtagtcga agggggtatg cctagcggat gttccggtac 6660
atcaattttt aactctatga ttaacaatat tattattaga acattgatac ttgacgcata 6720
taagggtatc gatctagata agcttaagat actcgcatac ggagacgatc taatcgttag 6780
ttatccatac gaactcgatc cacaagtgtt agcgacattg ggtaagaatt acggattgac 6840
tattacacct cccgataaat ccgaaacttt tacgaaaatg acatgggaga atctgacatt 6900
tctgaaacga tattttaaac ccgatcagca atttccattc ttagtgcatc ccgttatgcc 6960
tatgaaagat atacacgaat caattagatg gactaaggat ccaaaaaata cacaggatca 7020
cgttaggtca ctatgtatgt tagcatggca ttcaggcgaa aaagagtata acgaattcat 7080
acaaaaaatt agaactaccg atatcggtaa gtgtctgata ttgcccgaat actcagtgct 7140
tagacgtaga tggttagatc tattctaggt taacaatata gacacttaat ttgagtagaa 7200
gtaggagttt at 7212
<210> 33
<211> 10735
<212> DNA
<213> Dengue virus type 1
<400> 33
agttgttagt ctacgtggac cgacaagaac agtttcgaat cggaagcttg cttaacgtag 60
ttctaacagt tttttattag agagcagatc tctgatgaat aatcaacgta aaaaaacggg 120
tcgtccgtcg tttaatatgt taaaacgtgc gcgtaatcgt gtatcgacgg tatcgcaatt 180
agcgaaacgt ttttcgaaag gtttattatc gggtcaaggt ccgatgaaat tagtaatggc 240
gtttatagcg tttttacgtt ttttagcgat accgccgacg gcgggtatat tagcgcgttg 300
gggttcgttt aaaaaaaatg gtgcgataaa agtattacgt ggttttaaaa aagaaatatc 360
gaatatgtta aatataatga atcgtcgtaa acgttcggta acgatgttat taatgttatt 420
accgacggcg ttagcgtttc atttaacgac gcgtggtggt gaaccgcata tgatagtatc 480
gaaacaagaa cgtggtaaat cgttattatt taaaacgtcg gcgggtgtaa atatgtgtac 540
gttaatagcg atggatttag gtgaattatg tgaagatacg atgacgtata aatgtccgcg 600
tataacggaa acggaaccgg atgatgtaga ttgttggtgt aatgcgacgg aaacgtgggt 660
aacgtatggt acgtgttcgc aaacgggtga acatcgtcgt gataaacgtt cggtagcgtt 720
agcgccgcat gtaggtttag gtttagaaac gcgtacggaa acgtggatgt cgtcggaagg 780
tgcgtggaaa caaatacaaa aagtagaaac gtgggcgtta cgtcatccgg gttttacggt 840
aatagcgtta tttttagcgc atgcgatagg tacgtcgata acgcaaaaag gtataatatt 900
tatattatta atgttagtaa cgccgtcgat ggcgatgcgt tgtgtaggta taggtaatcg 960
tgattttgta gaaggtttat cgggtgcgac gtgggtagat gtagtattag aacatggttc 1020
gtgtgtaacg acgatggcga aagataaacc gacgttagat atagaattat taaaaacgga 1080
agtaacgaat ccggcggtat tacgtaaatt atgtatagaa gcgaaaatat cgaatacgac 1140
gacggattcg cgttgtccga cgcaaggtga agcgacgtta gtagaagaac aagatacgaa 1200
ttttgtatgt cgtcgtacgt ttgtagatcg tggttggggt aatggttgtg gtttatttgg 1260
taaaggttcg ttaataacgt gtgcgaaatt taaatgtgta acgaaattag aaggtaaaat 1320
agtacaatat gaaaatttaa aatattcggt aatagtaacg gtacatacgg gtgatcaaca 1380
tcaagtaggt aatgaaacga cggaacatgg tacgacggcg acgataacgc cgcaagcgcc 1440
gacgtcggaa atacaattaa cggattatgg tgcgttaacg ttagattgtt cgccgcgtac 1500
gggtttagat tttaatgaaa tggtattatt aacgatgaaa aaaaaatcgt ggttagtaca 1560
taaacaatgg tttttagatt taccgttacc gtggacgtcg ggtgcgtcga cgtcgcaaga 1620
aacgtggaat cgtcaagatt tattagtaac gtttaaaacg gcgcatgcga aaaaacaaga 1680
agtagtagta ttaggttcgc aagaaggtgc gatgcatacg gcgttaacgg gtgcgacgga 1740
aatacaaacg tcgggtacga cgacgatatt tgcgggtcat ttaaaatgtc gtttaaaaat 1800
ggataaatta atattaaaag gtatgtcgta tgtaatgtgt acgggttcgt ttaaattaga 1860
aaaagaagta gcggaaacgc aacatggtac ggtattagta caagtaaaat atgaaggtac 1920
ggatgcgccg tgtaaaatac cgttttcgtc gcaagatgaa aaaggtgtaa cgcaaaatgg 1980
tcgtttaata acggcgaatc cgatagtaac ggataaagaa aaaccggtaa atatagaagc 2040
ggaaccgccg tttggtgaat cgtatatagt agtaggtgcg ggtgaaaaag cgttaaaatt 2100
atcgtggttt aaaaaaggtt cgtcgatagg taaaatgttt gaagcgacgg cgcgtggtgc 2160
gcgtcgtatg gcgatattag gtgatacggc gtgggatttt ggttcgatag gtggtgtatt 2220
tacgtcggta ggtaaattaa tacatcaaat atttggtacg gcgtatggtg tattattttc 2280
gggtgtatcg tggacgatga aaataggtat aggtatatta ttaacgtggt taggtttaaa 2340
ttcgcgttcg acgtcgttat cgatgacgtg tatagcggta ggtatggtaa cgttatattt 2400
aggtgtaatg gtacaagcgg attcgggttg tgtaataaat tggaaaggtc gtgaattaaa 2460
atgtggttcg ggtatatttg taacgaatga agtacatacg tggacggaac aatataaatt 2520
tcaagcggat tcgccgaaac gtttatcggc ggcgataggt aaagcgtggg aagaaggtgt 2580
atgtggtata cgttcggcga cgcgtttaga aaatataatg tggaaacaaa tatcgaatga 2640
attaaatcat atattattag aaaatgatat gaaatttacg gtagtagtag gtgatgtatc 2700
gggtatatta gcgcaaggta aaaaaatgat acgtccgcaa ccgatggaac ataaatattc 2760
gtggaaatcg tggggtaaag cgaaaataat aggtgcggat gtacaaaata cgacgtttat 2820
aatagatggt ccgaatacgc cggaatgtcc ggataatcaa cgtgcgtgga atatatggga 2880
agtagaagat tatggttttg gtatatttac gacgaatata tggttaaaat tacgtgattc 2940
gtatacgcaa gtatgtgatc atcgtttaat gtcggcggcg ataaaagatt cgaaagcggt 3000
acatgcggat atgggttatt ggatagaatc ggaaaaaaat gaaacgtgga aattagcgcg 3060
tgcgtcgttt atagaagtaa aaacgtgtat atggccgaaa tcgcatacgt tatggtcgaa 3120
tggtgtatta gaatcggaaa tgataatacc gaaaatatat ggtggtccga tatcgcaaca 3180
taattatcgt ccgggttatt ttacgcaaac ggcgggtccg tggcatttag gtaaattaga 3240
attagatttt gatttatgtg aaggtacgac ggtagtagta gatgaacatt gtggtaatcg 3300
tggtccgtcg ttacgtacga cgacggtaac gggtaaaacg atacatgaat ggtgttgtcg 3360
ttcgtgtacg ttaccgccgt tacgttttaa aggtgaagat ggttgttggt atggtatgga 3420
aatacgtccg gtaaaagaaa aagaagaaaa tttagtaaaa tcgatggtat cggcgggttc 3480
gggtgaagta gattcgtttt cgttaggttt attatgtata tcgataatga tagaagaagt 3540
aatgcgttcg cgttggtcgc gtaaaatgtt aatgacgggt acgttagcgg tatttttatt 3600
attaacgatg ggtcaattaa cgtggaatga tttaatacgt ttatgtataa tggtaggtgc 3660
gaatgcgtcg gataaaatgg gtatgggtac gacgtattta gcgttaatgg cgacgtttcg 3720
tatgcgtccg atgtttgcgg taggtttatt atttcgtcgt ttaacgtcgc gtgaagtatt 3780
attattaacg gtaggtttat cgttagtagc gtcggtagaa ttaccgaatt cgttagaaga 3840
attaggtgat ggtttagcga tgggtataat gatgttaaaa ttattaacgg attttcaatc 3900
gcatcaatta tgggcgacgt tattatcgtt aacgtttgta aaaacgacgt tttcgttaca 3960
ttatgcgtgg aaaacgatgg cgatgatatt atcgatagta tcgttatttc cgttatgttt 4020
atcgacgacg tcgcaaaaaa cgacgtggtt accggtatta ttaggttcgt taggttgtaa 4080
accgttaacg atgtttttaa taacggaaaa taaaatatgg ggtcgtaaat cgtggccgtt 4140
aaatgaaggt ataatggcgg taggtatagt atcgatatta ttatcgtcgt tattaaaaaa 4200
tgatgtaccg ttagcgggtc cgttaatagc gggtggtatg ttaatagcgt gttatgtaat 4260
atcgggttcg tcggcggatt tatcgttaga aaaagcggcg gaagtatcgt gggaagaaga 4320
agcggaacat tcgggtgcgt cgcataatat attagtagaa gtacaagatg atggtacgat 4380
gaaaataaaa gatgaagaac gtgatgatac gttaacgata ttattaaaag cgacgttatt 4440
agcgatatcg ggtgtatatc cgatgtcgat accggcgacg ttatttgtat ggtatttttg 4500
gcaaaaaaaa aaacaacgtt cgggtgtatt atgggatacg ccgtcgccgc cggaagtaga 4560
acgtgcggta ttagatgatg gtatatatcg tatattacaa cgtggtttat taggtcgttc 4620
gcaagtaggt gtaggtgtat ttcaagaagg tgtatttcat acgatgtggc atgtaacgcg 4680
tggtgcggta ttaatgtatc aaggtaaacg tttagaaccg tcgtgggcgt cggtaaaaaa 4740
agatttaata tcgtatggtg gtggttggcg ttttcaaggt tcgtggaatg cgggtgaaga 4800
agtacaagta atagcggtag aaccgggtaa aaatccgaaa aatgtacaaa cggcgccggg 4860
tacgtttaaa acgccggaag gtgaagtagg tgcgatagcg ttagatttta aaccgggtac 4920
gtcgggttcg ccgatagtaa atcgtgaagg taaaatagta ggtttatatg gtaatggtgt 4980
agtaacgacg tcgggtacgt atgtatcggc gatagcgcaa gcgaaagcgt cgcaagaagg 5040
tccgttaccg gaaatagaag atgaagtatt tcgtaaacgt aatttaacga taatggattt 5100
acatccgggt tcgggtaaaa cgcgtcgtta tttaccggcg atagtacgtg aagcgataaa 5160
acgtaaatta cgtacgttag tattagcgcc gacgcgtgta gtagcgtcgg aaatggcgga 5220
agcgttaaaa ggtatgccga tacgttatca aacgacggcg gtaaaatcgg aacatacggg 5280
taaagaaata gtagatttaa tgtgtcatgc gacgtttacg atgcgtttat tatcgccggt 5340
acgtgtaccg aattataata tgataataat ggatgaagcg cattttacgg atccggcgtc 5400
gatagcggcg cgtggttata tatcgacgcg tgtaggtatg ggtgaagcgg cggcgatatt 5460
tatgacggcg acgccgccgg gttcggtaga agcgtttccg caatcgaatg cggtaataca 5520
agatgaagaa cgtgatatac cggaacgttc gtggaattcg ggttatgatt ggataacgga 5580
ttttccgggt aaaacggtat ggtttgtacc gtcgataaaa tcgggtaatg atatagcgaa 5640
ttgtttacgt aaaaatggta aacgtgtagt acaattatcg cgtaaaacgt ttgatacgga 5700
atatcaaaaa acgaaaaata atgattggga ttatgtagta acgacggata tatcggaaat 5760
gggtgcgaat tttcgtgcgg atcgtgtaat agatccgcgt cgttgtttaa aaccggtaat 5820
attaaaagat ggtccggaac gtgtaatatt agcgggtccg atgccggtaa cggtagcgtc 5880
ggcggcgcaa cgtcgtggtc gtataggtcg taatcaaaat aaagaaggtg atcaatatat 5940
atatatgggt caaccgttaa ataatgatga agatcatgcg cattggacgg aagcgaaaat 6000
gttattagat aatataaata cgccggaagg tataataccg gcgttatttg aaccggaacg 6060
tgaaaaatcg gcggcgatag atggtgaata tcgtttacgt ggtgaagcgc gtaaaacgtt 6120
tgtagaatta atgcgtcgtg gtgatttacc ggtatggtta tcgtataaag tagcgtcgga 6180
aggttttcaa tattcggatc gtcgttggtg ttttgatggt gaacgtaata atcaagtatt 6240
agaagaaaat atggatgtag aaatatggac gaaagaaggt gaacgtaaaa aattacgtcc 6300
gcgttggtta gatgcgcgta cgtattcgga tccgttagcg ttacgtgaat ttaaagaatt 6360
tgcggcgggt cgtcgttcgg tatcgggtga tttaatatta gaaataggta aattaccgca 6420
acatttaacg caacgtgcgc aaaatgcgtt agataattta gtaatgttac ataattcgga 6480
acaaggtggt aaagcgtatc gtcatgcgat ggaagaatta ccggatacga tagaaacgtt 6540
aatgttatta gcgttaatag cggtattaac gggtggtgta acgttatttt ttttatcggg 6600
tcgtggttta ggtaaaacgt cgataggttt attatgtgta atagcgtcgt cggcgttatt 6660
atggatggcg tcggtagaac cgcattggat agcggcgtcg ataatattag aatttttttt 6720
aatggtatta ttaataccgg aaccggatcg tcaacgtacg ccgcaagata atcaattagc 6780
gtatgtagta ataggtttat tatttatgat attaacggta gcggcgaatg aaatgggttt 6840
attagaaacg acgaaaaaag atttaggtat aggtcatgcg gcggcggaaa atcatcatca 6900
tgcggcgatg ttagatgtag atttacatcc ggcgtcggcg tggacgttat atgcggtagc 6960
gacgacgata ataacgccga tgatgcgtca tacgatagaa aatacgacgg cgaatatatc 7020
gttaacggcg atagcgaatc aagcggcgat attaatgggt ttagataaag gttggccgat 7080
atcgaaaatg gatataggtg taccgttatt agcgttaggt tgttattcgc aagtaaatcc 7140
gttaacgtta acggcggcgg tattaatgtt agtagcgcat tatgcgataa taggtccggg 7200
tttacaagcg aaagcgacgc gtgaagcgca aaaacgtacg gcggcgggta taatgaaaaa 7260
tccgacggta gatggtatag tagcgataga tttagatccg gtagtatatg atgcgaaatt 7320
tgaaaaacaa ttaggtcaaa taatgttatt aatattatgt acgtcgcaaa tattattaat 7380
gcgtacgacg tgggcgttat gtgaatcgat aacgttagcg acgggtccgt taacgacgtt 7440
atgggaaggt tcgccgggta aattttggaa tacgacgata gcggtatcga tggcgaatat 7500
atttcgtggt tcgtatttag cgggtgcggg tttagcgttt tcgttaatga aatcgttagg 7560
tggtggtcgt cgtggtacgg gtgcgcaagg tgaaacgtta ggtgaaaaat ggaaacgtca 7620
attaaatcaa ttatcgaaat cggaatttaa tacgtataaa cgttcgggta taatagaagt 7680
agatcgttcg gaagcgaaag aaggtttaaa acgtggtgaa acgacgaaac atgcggtatc 7740
gcgtggtacg gcgaaattac gttggtttgt agaacgtaat ttagtaaaac cggaaggtaa 7800
agtaatagat ttaggttgtg gtcgtggtgg ttggtcgtat tattgtgcgg gtttaaaaaa 7860
agtaacggaa gtaaaaggtt atacgaaagg tggtccgggt catgaagaac cgataccgat 7920
ggcgacgtat ggttggaatt tagtaaaatt atattcgggt aaagatgtat tttttacgcc 7980
gccggaaaaa tgtgatacgt tattatgtga tataggtgaa tcgtcgccga atccgacgat 8040
agaagaaggt cgtacgttac gtgtattaaa aatggtagaa ccgtggttac gtggtaatca 8100
attttgtata aaaatattaa atccgtatat gccgtcggta gtagaaacgt tagaacaaat 8160
gcaacgtaaa catggtggta tgttagtacg taatccgtta tcgcgtaatt cgacgcatga 8220
aatgtattgg gtatcgtgtg gtacgggtaa tatagtatcg gcggtaaata tgacgtcgcg 8280
tatgttatta aatcgtttta cgatggcgca tcgtaaaccg acgtatgaac gtgatgtaga 8340
tttaggtgcg ggtacgcgtc atgtagcggt agaaccggaa gtagcgaatt tagatataat 8400
aggtcaacgt atagaaaata taaaaaatga acataaatcg acgtggcatt atgatgaaga 8460
taatccgtat aaaacgtggg cgtatcatgg ttcgtatgaa gtaaaaccgt cgggttcggc 8520
gtcgtcgatg gtaaatggtg tagtacgttt attaacgaaa ccgtgggatg taataccgat 8580
ggtaacgcaa atagcgatga cggatacgac gccgtttggt caacaacgtg tatttaaaga 8640
aaaagtagat acgcgtacgc cgaaagcgaa acgtggtacg gcgcaaataa tggaagtaac 8700
ggcgcgttgg ttatggggtt ttttatcgcg taataaaaaa ccgcgtatat gtacgcgtga 8760
agaatttacg cgtaaagtac gttcgaatgc ggcgataggt gcggtatttg tagatgaaaa 8820
tcaatggaat tcggcgaaag aagcggtaga agatgaacgt ttttgggatt tagtacatcg 8880
tgaacgtgaa ttacataaac aaggtaaatg tgcgacgtgt gtatataata tgatgggtaa 8940
acgtgaaaaa aaattaggtg aatttggtaa agcgaaaggt tcgcgtgcga tatggtatat 9000
gtggttaggt gcgcgttttt tagaatttga agcgttaggt tttatgaatg aagatcattg 9060
gttttcgcgt gaaaattcgt tatcgggtgt agaaggtgaa ggtttacata aattaggtta 9120
tatattacgt gatatatcga aaataccggg tggtaatatg tatgcggatg atacggcggg 9180
ttgggatacg cgtataacgg aagatgattt acaaaatgaa gcgaaaataa cggatataat 9240
ggaaccggaa catgcgttat tagcgacgtc gatatttaaa ttaacgtatc aaaataaagt 9300
agtacgtgta caacgtccgg cgaaaaatgg tacggtaatg gatgtaatat cgcgtcgtga 9360
tcaacgtggt tcgggtcaag taggtacgta tggtttaaat acgtttacga atatggaagc 9420
gcaattaata cgtcaaatgg aatcggaagg tatattttcg ccgtcggaat tagaaacgcc 9480
gaatttagcg gaacgtgtat tagattggtt aaaaaaacat ggtacggaac gtttaaaacg 9540
tatggcgata tcgggtgatg attgtgtagt aaaaccgata gatgatcgtt ttgcgacggc 9600
gttaacggcg ttaaatgata tgggtaaagt acgtaaagat ataccgcaat gggaaccgtc 9660
gaaaggttgg aatgattggc aacaagtacc gttttgttcg catcattttc atcaattaat 9720
aatgaaagat ggtcgtgaaa tagtagtacc gtgtcgtaat caagatgaat tagtaggtcg 9780
tgcgcgtgta tcgcaaggtg cgggttggtc gttacgtgaa acggcgtgtt taggtaaatc 9840
gtatgcgcaa atgtggcaat taatgtattt tcatcgtcgt gatttacgtt tagcggcgaa 9900
tgcgatatgt tcggcggtac cggtagattg ggtaccgacg tcgcgtacga cgtggtcgat 9960
acatgcgcat catcaatgga tgacgacgga agatatgtta tcggtatgga atcgtgtatg 10020
gatagaagaa aatccgtgga tggaagataa aacgcatgta tcgtcgtggg aagatgtacc 10080
gtatttaggt aaacgtgaag atcaatggtg tggttcgtta ataggtttaa cggcgcgtgc 10140
gacgtgggcg acgaatatac aagtagcgat aaatcaagta cgtcgtttaa taggtaatga 10200
aaattattta gattttatga cgtcgatgaa acgttttaaa aatgaatcgg atccggaagg 10260
tgcgttatgg taagccaact cattcacaaa ataaaggaaa ataaaaaatc aaacaaggca 10320
agaagtcagg ccggattaag ccatagcacg gtaagagcta tgctgcctgt gagccccgtc 10380
caaggacgta aaatgaagtc aggccgaaag ccacggttcg agcaagccgt gctgcctgta 10440
gctccatcgt ggggatgtaa aaacccggga ggctgcaaac catggaagct gtacgcatgg 10500
ggtagcagac tagtggttag aggagacccc tcccaagaca caacgcagca gcggggccca 10560
acaccagggg aagctgtacc ctggtggtaa ggactagagg ttagaggaga ccccccgcac 10620
aacaacaaac agcatattga cgctgggaga gaccagagat cctgctgtct ctacagcatc 10680
attccaggca cagaacgcca aaaaatggaa tggtgctgtt gaatcaacag gttct 10735
<210> 34
<211> 10735
<212> DNA
<213> Unknown
<220>
<223> synthetic
<400> 34
agttgttagt ctacgtggac cgacaagaac agtttcgaat cggaagcttg cttaacgtag 60
ttctaacagt tttttattag agagcagatc tctgatgaat aaccaacgaa aaaaaaccgg 120
acgaccatca ttcaatatgc ttaaacgcgc taggaatagg gtgtcaaccg tatcgcaatt 180
ggctaagaga ttctctaagg gactgttaag cggacaggga ccaatgaaac tggttatggc 240
attcatagcg tttctgagat ttctcgcaat accgccaacc gccggaatac tcgctagatg 300
ggggtcattc aaaaaaaacg gcgcaattaa agtgcttagg gggttcaaaa aagagatatc 360
gaatatgctt aacattatga atagacgtaa gagatccgtt acaatgctat tgatgctatt 420
gccaaccgca ctagcctttc acctaacgac tagggggggg gaaccacata tgatagtgag 480
taagcaagag agaggtaagt cactattgtt caaaacatcc gccggagtga atatgtgtac 540
actaatcgct atggacttag gcgaattgtg cgaagacact atgacatata agtgtcctag 600
gattaccgaa accgaaccag acgacgtcga ttgttggtgt aacgcaaccg aaacatgggt 660
gacatacgga acatgttcgc aaaccggaga gcatagacgc gataagagat cagtcgcact 720
cgcaccacac gtcggattgg ggttagagac tagaaccgaa acatggatgt ctagcgaagg 780
cgcatggaaa cagatacaga aagtcgagac atgggccctt agacacccag ggtttaccgt 840
aatcgcacta tttctcgcac acgcaatcgg aacgtcaatt acgcaaaaag ggattatatt 900
catactgctt atgttagtga caccatctat ggctatgaga tgcgtcggaa tcggaaatag 960
ggatttcgtt gagggactat ccggagcgac atgggtcgac gtagtgctcg aacacggatc 1020
atgcgttacg actatggcca aagacaaacc gacacttgac atagagttac tgaaaaccga 1080
agtgactaac ccagccgtac tgagaaagtt gtgtatcgaa gctaagatat cgaatacgac 1140
taccgatagt aggtgtccaa cgcaaggcga agcgacacta gtcgaagagc aggatacgaa 1200
tttcgtatgt agacgtacat tcgtcgatag ggggtgggga aacggatgcg gattgttcgg 1260
taagggatca ctgattacat gcgctaaatt caaatgcgtt acgaaactcg agggtaagat 1320
agtgcaatac gagaatctga aatatagcgt aatcgttaca gtgcataccg gagaccaaca 1380
ccaagtggga aacgagacta ccgaacacgg aactaccgca acgattacgc cacaagcccc 1440
tactagcgaa atccaattga ccgattacgg cgcactaaca ctcgattgtt cacctagaac 1500
cggattggac tttaacgaaa tggtgctatt gactatgaaa aaaaaatcat ggttagtgca 1560
taagcaatgg ttcttagacc taccactacc atggactagc ggagctagta cgtcacagga 1620
gacatggaat agacaggatc tgttagtgac attcaaaacc gcacacgcta aaaaacagga 1680
ggtcgtagtg ttagggtcac aagagggagc tatgcatacc gcactaacag gcgcaaccga 1740
gatacagact agcggaacga ctacgatatt cgccggacac cttaagtgta gactgaaaat 1800
ggacaaactg atactgaaag gtatgtcata cgttatgtgt accggatcat tcaaactcga 1860
aaaagaggtc gccgaaacgc aacacggaac agtgttagtg caagtgaaat acgagggaac 1920
tgacgcacca tgtaagatac cgttttcgtc acaggacgaa aaaggcgtta cgcaaaacgg 1980
tagactgatt accgctaacc caatcgttac cgataaagag aaaccggtta atatcgaagc 2040
cgaaccacca ttcggcgaat catatatcgt agtcggagcc ggagagaaag cccttaagct 2100
atcatggttt aaaaaagggt catcaatcgg taagatgttc gaagcaaccg ctagaggcgc 2160
tagacgtatg gccatactag gcgataccgc atgggatttc ggatcaatcg gaggagtgtt 2220
tacgtcagtc ggaaaactga tacaccaaat tttcggaacc gcatacggag tgttgtttag 2280
cggagtgtca tggactatga aaatcggaat cggaatactg ttgacatggt tagggttgaa 2340
ctctagatcg actagtctat ctatgacatg tatcgcagtc ggaatggtga cactatactt 2400
aggcgtaatg gtgcaagccg atagcggatg cgttattaat tggaaaggga gagagcttaa 2460
atgcggatcc ggaatattcg ttacgaacga agtgcataca tggaccgaac agtataaatt 2520
ccaagccgat agtccgaaaa gactatctgc cgcaatcggt aaggcatggg aggagggagt 2580
gtgcggaatt aggtcagcga ctagactcga aaacattatg tggaaacaga tatctaacga 2640
actgaatcac atactgttag agaacgatat gaaatttaca gtcgtagtcg gagacgttag 2700
cggaatactc gcacagggta agaaaatgat tagaccgcaa cctatggagc ataagtatag 2760
ttggaaatca tggggaaaag cgaaaattat cggagccgac gtgcaaaata cgacattcat 2820
aatcgacgga ccgaatacgc cagagtgtcc agacaatcag agagcatgga acatatggga 2880
ggtcgaagac tacggattcg gaatttttac gactaacata tggcttaagc ttagagactc 2940
atatacacag gtatgcgatc atagattgat gtctgccgca atcaaagact ctaaagccgt 3000
acacgccgat atggggtatt ggatcgaatc cgaaaaaaac gagacatgga aactcgctag 3060
agcgtcattc atagaggtta agacatgtat ttggcctaag tcacatacat tgtggtctaa 3120
cggagtgctt gagtctgaga tgataatccc taagatatac ggcggaccga tatcgcaaca 3180
taactataga ccagggtatt ttacgcaaac agccggacca tggcatctcg gtaagcttga 3240
gttagacttc gatctatgcg aagggactac cgtagtggtc gacgaacatt gcggtaatag 3300
gggacctagt ctgagaacga ctaccgttac cggtaagact atacacgaat ggtgttgtag 3360
gtcatgtaca ctaccaccac ttagattcaa aggcgaagac ggatgttggt acggaatgga 3420
gattagacca gtgaaagaga aagaggaaaa cctagtgaaa tctatggtgt cagccggatc 3480
aggcgaagtc gactcattct cactcggact gttatgcata tcgattatga tcgaagaggt 3540
tatgcgatct agatggtcac gaaaaatgct tatgaccgga acactagccg tttttctgtt 3600
actgactatg gggcaattga catggaacga tctgattagg ttgtgtatta tggtcggagc 3660
taacgctagc gataagatgg gtatgggaac gacatactta gcccttatgg ctacatttag 3720
aatgcgacca atgttcgccg tagggttact gtttagacgg ttgactagta gggaagtgct 3780
attgttgaca gtcggactgt cactagtcgc tagcgttgag ttgcctaact cactcgaaga 3840
gttaggcgac ggactcgcaa tggggattat gatgcttaag ctattgaccg atttccaatc 3900
tcaccaattg tgggctacac tattgtcact gacattcgtt aagactacat tctcattgca 3960
ttacgcatgg aaaactatgg ctatgatact gtcaatcgtt agtctattcc cactatgtct 4020
atctacaact agtcagaaaa ctacatggtt gccagtgcta ttggggtcac tagggtgtaa 4080
accattgact atgtttctga ttaccgaaaa caaaatttgg gggagaaagt catggccact 4140
taacgaggga attatggccg tagggatagt gtcaatactg ctatctagtc tgcttaaaaa 4200
cgacgtgcca ctagccggac cactgatagc cggaggtatg ctaatcgcat gttacgtgat 4260
atccggatct agcgccgatc tgtcactcga aaaagccgcc gaagtgtcat gggaagagga 4320
agccgaacac tctggcgcat cacataacat actagtcgaa gtgcaagacg acggaactat 4380
gaaaattaaa gacgaagaga gagacgatac acttacgata ctgcttaaag cgacactgtt 4440
agcgatatcc ggagtgtatc ctatgtcaat acccgctaca ctattcgttt ggtatttttg 4500
gcaaaaaaaa aaacagagat ccggagtgtt gtgggataca cctagtccac ccgaagtcga 4560
gagagccgta ctcgacgacg gaatatatag gatactgcaa cggggattgc tcggtaggtc 4620
acaggtcgga gtgggagtgt ttcaggaggg agtgtttcac actatgtggc acgttacgag 4680
aggcgccgta ctgatgtatc agggtaagag actcgaacct agttgggcta gcgttaaaaa 4740
agacctaatc tcatacggag gggggtggag atttcagggg tcatggaacg ccggagagga 4800
agtgcaagtg atagccgtcg aacccggtaa gaaccctaaa aacgtgcaaa ccgcacccgg 4860
aacgtttaag acacccgaag gcgaagtggg cgcaatcgca ctcgacttta aacccggaac 4920
tagcggatca ccaatcgtta atagagaggg taagatagtc ggattgtacg gaaacggagt 4980
ggttacgact agcggaacat acgttagcgc aatagcgcaa gcgaaagcgt cacaagaggg 5040
accactacca gagatagagg acgaagtgtt tagaaagcgt aatctgacaa ttatggacct 5100
acatcccgga tccggtaaga ctagacggta tctgccagca atcgttaggg aggcaattaa 5160
gagaaagttg cgtacactag tgttagcccc aactagagtg gtcgctagcg aaatggccga 5220
agcccttaag ggaatgccaa ttaggtatca gactaccgcc gttaagtccg aacataccgg 5280
taaggagata gtcgacctta tgtgtcacgc tacattcaca atgagactgc tatcaccagt 5340
gagagtgcct aactataata tgataattat ggacgaagcc cattttacag acccagcctc 5400
aatcgccgct agggggtata ttagtactag ggtgggaatg ggcgaagccg ccgcaatttt 5460
tatgacagcg acaccacccg gatccgtcga agcgtttccg caatctaacg ccgttataca 5520
ggacgaagag agagacatac ccgaacggtc atggaatagc ggatacgatt ggataaccga 5580
ttttcccggt aagacagtgt ggttcgtacc gtcaattaag tccggaaacg atatcgctaa 5640
ttgtcttaga aaaaacggta agagagtggt gcaattgtct agaaagacat tcgataccga 5700
ataccaaaaa actaagaata acgattggga ttacgtagtg acaaccgaca tatccgaaat 5760
gggcgctaac tttagagccg atagggtgat agaccctaga cggtgtctga aaccagtgat 5820
actgaaagac ggaccagaga gagtgatact agccggacca atgccagtga cagtcgcatc 5880
cgccgcacaa cgtaggggac ggatagggag aaaccaaaac aaagagggag accaatacat 5940
atatatggga cagccactga ataacgacga agaccacgca cattggaccg aagcgaaaat 6000
gctattagac aatattaaca cacccgaagg gattataccc gcactattcg aacccgaacg 6060
cgaaaaatcc gccgcaatcg acggcgaata tagactgaga ggcgaagcta gaaagacatt 6120
cgttgagctt atgcgtagag gcgatctacc cgtatggttg tcatacaaag tcgctagcga 6180
agggtttcag tattccgata ggagatggtg tttcgacggc gaacggaata accaagtgct 6240
cgaagagaat atggacgttg agatatggac taaagagggc gaacgaaaaa aactgagacc 6300
tagatggtta gacgcacgta catattccga tccgttagcc cttagagagt ttaaagagtt 6360
cgcagccggt aggagatccg ttagcggaga tctgatactc gaaatcggta agctaccaca 6420
acacctaacg caacgagccc aaaacgcact agacaatctg gttatgttgc ataactccga 6480
acagggcggt aaggcatata gacacgctat ggaagagtta cccgatacaa tcgaaacact 6540
tatgctactc gcactgatag ccgtactgac aggcggagtg acactattct ttctatccgg 6600
tagggggtta ggtaagacat caatcggact gttatgcgta atcgcatcta gcgcactatt 6660
gtggatggct agcgtcgaac cacattggat agccgcatca attatactcg aattctttct 6720
tatggtgtta ctgatacccg aacccgatag gcaacgaaca ccacaggata accaattggc 6780
atacgtcgta atcggactat tgtttatgat actgacagtc gccgctaacg aaatgggatt 6840
gctcgagaca acgaaaaaag acctagggat cggacacgcc gcagccgaaa atcaccatca 6900
cgccgcaatg ttagacgtcg atctgcatcc cgctagcgca tggacactat acgcagtcgc 6960
aacgacaatt attacgccta tgatgcgaca tacaatcgag aatactaccg ctaacatatc 7020
gctaaccgct atagcgaatc aggccgcaat actgatgggg ttagacaaag ggtggccaat 7080
tagtaagatg gatatcggag tgccactgtt agccttaggg tgttatagtc aggttaaccc 7140
attgacattg accgcagccg tacttatgct agtcgcacat tacgctataa tcggaccagg 7200
actgcaagcg aaagcgacac gcgaagcgca aaaaagaacc gcagccggaa ttatgaaaaa 7260
ccctacagtc gacggaatag tcgcaatcga cttagaccca gtggtgtacg acgctaaatt 7320
cgaaaaacag ttgggacaga ttatgctact gatactgtgt acgtcacaga tactgcttat 7380
gcgaactaca tgggcactat gcgaatcaat tacactcgca accggaccat tgactacatt 7440
gtgggaggga tcacccggta agttttggaa tacgactata gccgttagta tggctaacat 7500
ttttaggggg tcatatctag ccggagccgg actcgcattc tcacttatga aatcactcgg 7560
agggggacgt agggggacag gcgcacaggg agagacacta ggcgaaaaat ggaaacgaca 7620
attgaaccaa ttgtctaaat ccgaatttaa cacttataag agatccggaa taatcgaagt 7680
cgatagatcc gaagcgaaag agggactgaa acgcggagag acaacgaaac acgccgttag 7740
taggggaacc gctaagctta gatggttcgt tgagcgtaac ttagtgaaac cagagggtaa 7800
ggtaatcgat ctcggatgcg gtaggggggg gtggtcatac tattgcgccg gactgaaaaa 7860
agtgaccgaa gtgaaagggt atactaaggg cggacccgga cacgaagagc caataccgat 7920
ggcaacatac ggatggaacc tagtgaaact gtattccggt aaggacgtat tctttacacc 7980
acccgaaaaa tgcgatacac tgttatgcga tataggcgaa tctagtccta accctacaat 8040
cgaagaggga cgtacactta gagtgcttaa aatggtcgaa ccatggttga gggggaatca 8100
gttttgtatt aagatactga atccatatat gcctagcgta gtcgagacac tcgaacagat 8160
gcaacgaaaa cacggcggaa tgctagtgag aaacccacta tctaggaatt cgacacacga 8220
aatgtattgg gtgtcatgcg gaaccggaaa catagtgtca gccgttaata tgactagtag 8280
aatgctactg aatcggttta caatggccca tagaaaaccg acatacgaaa gagacgtcga 8340
cctaggagcc ggaactagac acgttgccgt cgaacccgaa gtcgctaact tagacataat 8400
cggacagaga atcgagaata ttaaaaacga acacaaatcg acatggcatt acgacgaaga 8460
caatccgtat aagacatggg catatcacgg atcatacgaa gtgaaaccta gcggatccgc 8520
tagttctatg gttaacggag tggtgagact gttgactaag ccatgggacg tgataccgat 8580
ggtgacacaa atcgctatga ccgatacgac accattcgga cagcaaagag tgtttaaaga 8640
gaaagtcgac actagaacac ctaaagcgaa acgcggaacc gcacagatta tggaggttac 8700
cgctagatgg ttgtgggggt tcctatctag aaacaaaaaa cctaggattt gtacacgcga 8760
agagtttaca cgaaaagtga gatctaacgc cgcaatcgga gccgtattcg tagacgaaaa 8820
ccaatggaat tccgctaaag aggccgtcga agacgaacgg ttttgggact tagtgcatag 8880
ggaacgcgaa ttgcataaac agggtaagtg cgcaacatgc gtatacaata tgatgggtaa 8940
gcgcgaaaaa aagttaggcg aattcggtaa ggctaaggga tctagagcga tatggtatat 9000
gtggttaggc gctaggtttc tcgaattcga agcactcgga tttatgaacg aagaccattg 9060
gttttctaga gagaatagtc tatccggagt cgagggagag ggattgcata aactcggata 9120
tatactgaga gacatatcta agatacccgg agggaatatg tacgccgacg atacagccgg 9180
atgggataca cgaattaccg aagacgatct gcaaaacgaa gcgaaaatta ccgatattat 9240
ggaacccgaa cacgcactgt tagcgacatc tatttttaag ttgacatatc agaataaggt 9300
cgttagggtg caacgacccg ctaaaaacgg aacggttatg gacgtgatta gtaggagaga 9360
ccaacgcgga tccggacagg tcggaacata cggactgaat acgtttacga atatggaagc 9420
gcaattgatt agacagatgg agtctgaggg gatattctca cctagcgaac tcgagacacc 9480
taacctagcc gaacgggtac tcgattggtt gaaaaaacac ggaaccgaaa gactgaaaag 9540
aatggcaatt agcggagacg attgcgtagt gaaaccaatc gacgatagat tcgcaaccgc 9600
actaaccgca cttaacgata tgggtaaggt gagaaaagac ataccgcaat gggagccatc 9660
taagggatgg aacgattggc aacaggtgcc attttgctca catcactttc accaattgat 9720
tatgaaagac ggtagggaga tagtcgtgcc atgtaggaat caggacgaac tcgtaggtag 9780
ggctagagtg tcacagggag ccggatggtc acttagggaa accgcatgcc taggtaagtc 9840
atacgctcaa atgtggcaat tgatgtattt ccatagacgc gatctgagac tagccgctaa 9900
cgctatatgc tctgccgtac cagtcgattg ggtgccaact agtagaacga catggtctat 9960
acacgcacat caccaatgga tgacaaccga agacatgcta tccgtttgga atagggtgtg 10020
gatcgaagag aatccatgga tggaggataa gacacacgtg tctagttggg aggacgtgcc 10080
atatctcgga aaacgcgaag accaatggtg cggatcacta atcggattga ccgctagagc 10140
gacatgggca actaacatac aggtcgcaat taaccaagtg agacgattga tcggaaacga 10200
gaattatctc gactttatga catctatgaa aagattcaaa aacgaatccg atcccgaagg 10260
cgcactatgg taagccaact cattcacaaa ataaaggaaa ataaaaaatc aaacaaggca 10320
agaagtcagg ccggattaag ccatagcacg gtaagagcta tgctgcctgt gagccccgtc 10380
caaggacgta aaatgaagtc aggccgaaag ccacggttcg agcaagccgt gctgcctgta 10440
gctccatcgt ggggatgtaa aaacccggga ggctgcaaac catggaagct gtacgcatgg 10500
ggtagcagac tagtggttag aggagacccc tcccaagaca caacgcagca gcggggccca 10560
acaccagggg aagctgtacc ctggtggtaa ggactagagg ttagaggaga ccccccgcac 10620
aacaacaaac agcatattga cgctgggaga gaccagagat cctgctgtct ctacagcatc 10680
attccaggca cagaacgcca aaaaatggaa tggtgctgtt gaatcaacag gttct 10735
<210> 35
<211> 9181
<212> DNA
<213> Human immunodeficiency virus type 1
<400> 35
ggtctctctg gttagaccag atctgagcct gggagctctc tggctaacta gggaacccac 60
tgcttaagcc tcaataaagc ttgccttgag tgcttcaagt agtgtgtgcc cgtctgttgt 120
gtgactctgg taactagaga tccctcagac ccttttagtc agtgtggaaa atctctagca 180
gtggcgcccg aacagggacc tgaaagcgaa agggaaacca gaggagctct ctcgacgcag 240
gactcggctt gctgaagcgc gcacggcaag aggcgagggg cggcgactgg tgagtacgcc 300
aaaaattttg actagcggag gctagaagga gagagatggg tgcgcgtgcg tcggtattat 360
cgggtggtga attagatcgt tgggaaaaaa tacgtttacg tccgggtggt aaaaaaaaat 420
ataaattaaa acatatagta tgggcgtcgc gtgaattaga acgttttgcg gtaaatccgg 480
gtttattaga aacgtcggaa ggttgtcgtc aaatattagg tcaattacaa ccgtcgttac 540
aaacgggttc ggaagaatta cgttcgttat ataatacggt agcgacgtta tattgtgtac 600
atcaacgtat agaaataaaa gatacgaaag aagcgttaga taaaatagaa gaagaacaaa 660
ataaatcgaa aaaaaaagcg caacaagcgg cggcggatac gggtcattcg aatcaagtat 720
cgcaaaatta tccgatagta caaaatatac aaggtcaaat ggtacatcaa gcgatatcgc 780
cgcgtacgtt aaatgcgtgg gtaaaagtag tagaagaaaa agcgttttcg ccggaagtaa 840
taccgatgtt ttcggcgtta tcggaaggtg cgacgccgca agatttaaat acgatgttaa 900
atacggtagg tggtcatcaa gcggcgatgc aaatgttaaa agaaacgata aatgaagaag 960
cggcggaatg ggatcgtgta catccggtac atgcgggtcc gatagcgccg ggtcaaatgc 1020
gtgaaccgcg tggttcggat atagcgggta cgacgtcgac gttacaagaa caaataggtt 1080
ggatgacgaa taatccgccg ataccggtag gtgaaatata taaacgttgg ataatattag 1140
gtttaaataa aatagtacgt atgtattcgc cgacgtcgat attagatata cgtcaaggtc 1200
cgaaagaacc gtttcgtgat tatgtagatc gtttttataa aacgttacgt gcggaacaag 1260
cgtcgcaaga agtaaaaaat tggatgacgg aaacgttatt agtacaaaat gcgaatccgg 1320
attgtaaaac gatattaaaa gcgttaggtc cggcggcgac gttagaagaa atgatgacgg 1380
cgtgtcaagg tgtaggtggt ccgggtcata aagcgcgtgt attagcggaa gcgatgtcgc 1440
aagtaacgaa ttcggcgacg ataatgatgc aacgtggtaa ttttcgtaat caacgtaaaa 1500
tagtaaaatg ttttaattgt ggtaaagaag gtcatacggc gcgtaattgt cgtgcgccgc 1560
gtaaaaaagg ttgttggaaa tgtggtaaag aaggtcatca aatgaaagat tgtacggaac 1620
gtcaagcgaa ttttttaggg aagatctggc cttcctacaa gggaaggcca gggaattttc 1680
ttcagagcag accagagcca acagccccac cagaagagag cttcaggtct ggggtagaga 1740
caacaactcc ccctcagaag caggagccga tagacaagga actgtatcct ttaacttccc 1800
tcaggtcact ctttggcaac gacccctcgt cacaataaag ataggtggtc aattaaaaga 1860
agcgttatta gatacgggtg cggatgatac ggtattagaa gaaatgtcgt taccgggtcg 1920
ttggaaaccg aaaatgatag gtggtatagg tggttttata aaagtacgtc aatatgatca 1980
aatattaata gaaatatgtg gtcataaagc gataggtacg gtattagtag gtccgacgcc 2040
ggtaaatata ataggtcgta atttattaac gcaaataggt tgtacgttaa attttccgat 2100
atcgccgata gaaacggtac cggtaaaatt aaaaccgggt atggatggtc cgaaagtaaa 2160
acaatggccg ttaacggaag aaaaaataaa agcgttagta gaaatatgta cggaaatgga 2220
aaaagaaggt aaaatatcga aaataggtcc ggaaaatccg tataatacgc cggtatttgc 2280
gataaaaaaa aaagattcga cgaaatggcg taaattagta gattttcgtg aattaaataa 2340
acgtacgcaa gatttttggg aagtacaatt aggtataccg catccggcgg gtttaaaaaa 2400
aaaaaaatcg gtaacggtat tagatgtagg tgatgcgtat ttttcggtac cgttagatga 2460
agattttcgt aaatatacgg cgtttacgat accgtcgata aataatgaaa cgccgggtat 2520
acgttatcaa tataatgtat taccgcaagg ttggaaaggt tcgccggcga tatttcaatc 2580
gtcgatgacg aaaatattag aaccgtttcg taaacaaaat ccggatatag taatatatca 2640
atatatggat gatttatatg taggttcgga tttagaaata ggtcaacatc gtacgaaaat 2700
agaagaatta cgtcaacatt tattacgttg gggtttaacg acgccggata aaaaacatca 2760
aaaagaaccg ccgtttttat ggatgggtta tgaattacat ccggataaat ggacggtaca 2820
accgatagta ttaccggaaa aagattcgtg gacggtaaat gatatacaaa aattagtagg 2880
taaattaaat tgggcgtcgc aaatatatcc gggtataaaa gtacgtcaat tatgtaaatt 2940
attacgtggt acgaaagcgt taacggaagt aataccgtta acggaagaag cggaattaga 3000
attagcggaa aatcgtgaaa tattaaaaga accggtacat ggtgtatatt atgatccgtc 3060
gaaagattta atagcggaaa tacaaaaaca aggtcaaggt caatggacgt atcaaatata 3120
tcaagaaccg tttaaaaatt taaaaacggg taaatatgcg cgtatgcgtg gtgcgcatac 3180
gaatgatgta aaacaattaa cggaagcggt acaaaaaata acgacggaat cgatagtaat 3240
atggggtaaa acgccgaaat ttaaattacc gatacaaaaa gaaacgtggg aaacgtggtg 3300
gacggaatat tggcaagcga cgtggatacc ggaatgggaa tttgtaaata cgccgccgtt 3360
agtaaaatta tggtatcaat tagaaaaaga accgatagta ggtgcggaaa cgttttatgt 3420
agatggtgcg gcgaatcgtg aaacgaaatt aggtaaagcg ggttatgtaa cgaatcgtgg 3480
tcgtcaaaaa gtagtaacgt taacggatac gacgaatcaa aaaacggaat tacaagcgat 3540
atatttagcg ttacaagatt cgggtttaga agtaaatata gtaacggatt cgcaatatgc 3600
gttaggtata atacaagcgc aaccggatca atcggaatcg gaattagtaa atcaaataat 3660
agaacaatta ataaaaaaag aaaaagtata tttagcgtgg gtaccggcgc ataaaggtat 3720
aggtggtaat gaacaagtag ataaattagt atcggcgggt atacgtaaag tattattttt 3780
agatggtata gataaagcgc aagatgaaca tgaaaaatat cattcgaatt ggcgtgcgat 3840
ggcgtcggat tttaatttac cgccggtagt agcgaaagaa atagtagcgt cgtgtgataa 3900
atgtcaatta aaaggtgaag cgatgcatgg tcaagtagat tgttcgccgg gtatatggca 3960
attagattgt acgcatttag aaggtaaagt aatattagta gcggtacatg tagcgtcggg 4020
ttatatagaa gcggaagtaa taccggcgga aacgggtcaa gaaacggcgt attttttatt 4080
aaaattagcg ggtcgttggc cggtaaaaac gatacatacg gataatggtt cgaattttac 4140
gggtgcgacg gtacgtgcgg cgtgttggtg ggcgggtata aaacaagaat ttggtatacc 4200
gtataatccg caatcgcaag gtgtagtaga atcgatgaat aaagaattaa aaaaaataat 4260
aggtcaagta cgtgatcaag cggaacattt aaaaacggcg gtacaaatgg cggtatttat 4320
acataatttt aaacgtaaag gtggtatagg tggttattcg gcgggtgaac gtatagtaga 4380
tataatagcg acggatatac aaacgaaaga attacaaaaa caaataacga aaatacaaaa 4440
ttttcgtgta tattatcgtg attcgcgtaa tccgttatgg aaaggtccgg cgaaattatt 4500
atggaaaggt gaaggtgcgg tagtaataca agataattcg gatataaaag tagtaccgcg 4560
tcgtaaagcg aaaataatac gtgattatgg aaaacagatg gcaggtgatg attgtgtggc 4620
aagtagacag gatgaggatt agaacgtgga aatcgttagt aaaacatcat atgtatgtat 4680
cgggtaaagc gcgtggttgg ttttatcgtc atcattatga atcgccgcat ccgcgtatat 4740
cgtcggaagt acatataccg ttaggtgatg cgcgtttagt aataacgacg tattggggtt 4800
tacatacggg tgaacgtgat tggcatttag gtcaaggtgt atcgatagaa tggcgtaaaa 4860
aacgttattc gacgcaagta gatccggaat tagcggatca attaatacat ttatattatt 4920
ttgattgttt ttcggattcg gcgatacgta aagcgttatt aggtcatata gtatcgccgc 4980
gttgtgaata tcaagcgggt cataataaag taggttcgtt acaatattta gcgttagcgg 5040
cgttaataac gccgaaaaaa ataaaaccgc cgttaccgtc ggtaacgaaa ttaacggaag 5100
atagatggaa caagccccag aagaccaagg gccacagagg gagccacaca atgaatggac 5160
actagagctt ttagaggagc ttaagaatga agctgttaga cattttccta ggatttggct 5220
ccatggctta gggcaacata tctatgaaac ttatggggat acttgggcag gagtggaagc 5280
cataataaga attctgcaac aactgctgtt tatccatttt cagaattggg tgtcgacata 5340
gcagaatagg cgttactcga cagaggagag caagaaatgg agccagtaga tcctagacta 5400
gagccctgga agcatccagg aagtcagcct aaaactgctt gtaccaattg ctattgtaaa 5460
aagtgttgct ttcattgcca agtttgtttc ataacaaaag ccttaggcat ctcctatggc 5520
aggaagaagc ggagacagcg acgaagagct catcagaaca gtcagactca tcaagcttct 5580
ctatcaaagc agtaagtagt acatgtaatg caacctatac caatagtagc aatagtagca 5640
ttagtagtag caataataat agcaatagtt gtgtggtcca tagtaatcat agaatatagg 5700
aaaatattaa gacaaagaaa aatagacagg ttaattgata gactaataga aagagcagaa 5760
gacagtggca atgagagtga aggagaaata tcagcacttg tggagatggg ggtggagatg 5820
gggcaccatg ctccttggga tgttgatgat ctgtagtgcg acggaaaaat tatgggtaac 5880
ggtatattat ggtgtaccgg tatggaaaga agcgacgacg acgttatttt gtgcgtcgga 5940
tgcgaaagcg tatgatacgg aagtacataa tgtatgggcg acgcatgcgt gtgtaccgac 6000
ggatccgaat ccgcaagaag tagtattagt aaatgtaacg gaaaatttta atatgtggaa 6060
aaatgatatg gtagaacaaa tgcatgaaga tataatatcg ttatgggatc aatcgttaaa 6120
accgtgtgta aaattaacgc cgttatgtgt atcgttaaaa tgtacggatt taaaaaatga 6180
tacgaatacg aattcgtcgt cgggtcgtat gataatggaa aaaggtgaaa taaaaaattg 6240
ttcgtttaat atatcgacgt cgatacgtgg taaagtacaa aaagaatatg cgttttttta 6300
taaattagat ataataccga tagataatga tacgacgtcg tataaattaa cgtcgtgtaa 6360
tacgtcggta ataacgcaag cgtgtccgaa agtatcgttt gaaccgatac cgatacatta 6420
ttgtgcgccg gcgggttttg cgatattaaa atgtaataat aaaacgttta atggtacggg 6480
tccgtgtacg aatgtatcga cggtacaatg tacgcatggt atacgtccgg tagtatcgac 6540
gcaattatta ttaaatggtt cgttagcgga agaagaagta gtaatacgtt cggtaaattt 6600
tacggataat gcgaaaacga taatagtaca attaaatacg tcggtagaaa taaattgtac 6660
gcgtccgaat aataatacgc gtaaacgtat acgtatacaa cgtggtccgg gtcgtgcgtt 6720
tgtaacgata ggtaaaatag gtaatatgcg tcaagcgcat tgtaatatat cgcgtgcgaa 6780
atggaataat acgttaaaac aaatagcgtc gaaattacgt gaacaatttg gtaataataa 6840
aacgataata tttaaacaat cgtcgggtgg tgatccggaa atagtaacgc attcgtttaa 6900
ttgtggtggt gaattttttt attgtaattc gacgcaatta tttaattcga cgtggtttaa 6960
ttcgacgtgg tcgacggaag gttcgaataa tacggaaggt tcggatacga taacgttacc 7020
gtgtcgtata aaacaaataa taaatatgtg gcaaaaagta ggtaaagcga tgtatgcgcc 7080
gccgatatcg ggtcaaatac gttgttcgtc gaatataacg ggtttattat taacgcgtga 7140
tggtggtaat tcgaataatg aatcggaaat atttcgtccg ggtggtggtg atatgcgtga 7200
taattggcgt tcggaattat ataaatataa agtagtaaaa atagaaccgt taggtgtagc 7260
gccgacgaaa gcgaaacgtc gtgtagtaca acgtgaaaaa cgtgcggtag gtataggtgc 7320
gttattttta ggttttttag gtgcggcggg ttcgacgatg ggtgcggcgt cgatgacgtt 7380
aacggtacaa gcgcgtcaat tattatcggg tatagtacaa caacaaaata atttattacg 7440
tgcgatagaa gcgcaacaac atttattaca attaacggta tggggtataa aacaattaca 7500
agcgcgtata ttagcggtag aacgttattt aaaagatcaa caattattag gtatatgggg 7560
ttgttcgggt aaattaatat gtacgacggc ggtaccgtgg aatgcgtcgt ggtcgaataa 7620
atcgttagaa caaatatgga atcatacgac gtggatggaa tgggatcgtg aaataaataa 7680
ttatacgtcg ttaatacatt cgttaataga agaatcgcaa aatcaacaag aaaaaaatga 7740
acaagaatta ttagaattag ataaatgggc gtcgttatgg aattggttta atataacgaa 7800
ttggttatgg tatataaaat tatttataat gatagtaggt ggtttagtag gtttacgtat 7860
agtatttgcg gtattatcga tagtaaatcg tgtacgtcaa ggttattcgc cgttatcgtt 7920
tcaaacccac ctcccaaccc cgaggggacc cgacaggccc gaaggaatag aagaagaagg 7980
tggagagaga gacagagaca gatccattcg attagtgaac ggatccttgg cacttatctg 8040
ggacgatctg cggagcctgt gcctcttcag ctaccaccgc ttgagagact tactcttgat 8100
tgtaacgagg attgtggaac ttctgggacg cagggggtgg gaagccctca aatattggtg 8160
gaatctccta cagtattgga gtcaggaact aaagaatagt gctgttagct tgctcaatgc 8220
cacagccata gcagtagctg aggggacaga tagggttata gaagtagtac aaggagcttg 8280
tagagctatt cgccacatac ctagaagaat aagacagggc ttggaaagga ttttgctata 8340
agatgggtgg taaatggtcg aaatcgtcgg taataggttg gccgacggta cgtgaacgta 8400
tgcgtcgtgc ggaaccggcg gcggatcgtg taggtgcggc gtcgcgtgat ttagaaaaac 8460
atggtgcgat aacgtcgtcg aatacggcgg cgacgaatgc ggcgtgtgcg tggttagaag 8520
cgcaagaaga agaagaagta ggttttccgg taacgccgca agtaccgtta cgtccgatga 8580
cgtataaagc ggcggtagat ttatcgcatt ttttaaaaga aaaaggtggt ttagaaggtt 8640
taatacattc gcaacgtcgt caagatatat tagatttatg gatatatcat acgcaaggtt 8700
attttccgga ttaacaaaat tatacgccgg gtccgggtgt acgttatccg ttaacgtttg 8760
gttggtgtta taaattagta ccggtagaac cggataaaat agaagaagcg aataaaggtg 8820
aaaatacgtc gttattacat ccggtatcgt tacatggtat ggatgatccg gaacgtgaag 8880
tattagaatg gcgttttgat tcgcgtttag cgtttcatca tgtagcgcgt gaattacatc 8940
cggaatattt taaaaattgt taacatcgag cttgctacaa gggactttcc gctggggact 9000
ttccagggag gcgtggcctg ggcgggactg gggagtggcg agccctcaga tcctgcatat 9060
aagcagctgc tttttgcctg tactgggtct ctctggttag accagatctg agcctgggag 9120
ctctctggct aactagggaa cccactgctt aagcctcaat aaagcttgcc ttgagtgctt 9180
c 9181
<210> 36
<211> 9181
<212> DNA
<213> unknown
<220>
<223> synthetic
<400> 36
ggtctctctg gttagaccag atctgagcct gggagctctc tggctaacta gggaacccac 60
tgcttaagcc tcaataaagc ttgccttgag tgcttcaagt agtgtgtgcc cgtctgttgt 120
gtgactctgg taactagaga tccctcagac ccttttagtc agtgtggaaa atctctagca 180
gtggcgcccg aacagggacc tgaaagcgaa agggaaacca gaggagctct ctcgacgcag 240
gactcggctt gctgaagcgc gcacggcaag aggcgagggg cggcgactgg tgagtacgcc 300
aaaaattttg actagcggag gctagaagga gagagatggg agctagagct agcgtactta 360
gcggaggcga actcgataga tgggaaaaaa ttagactgag accaggggga aaaaaaaaat 420
ataaactgaa acatatagta tgggctagta gagagttaga gagattcgca gtaaacccag 480
ggttactcga aactagcgaa gggtgtagac agatactggg acaattgcaa cctagtctgc 540
aaaccggatc cgaagagctt agatcactat ataatacagt cgcaacacta tattgtgtac 600
accaacgaat cgaaattaag gatacgaaag aggcattaga caaaatcgaa gaggaacaga 660
ataagtctaa aaaaaaagcg caacaggcag cagccgatac cggacatagt aatcaggtat 720
cgcaaaatta tccaatcgta cagaatatac agggacaaat ggtacaccaa gcgatatcac 780
ctagaacact taacgcatgg gttaaggtag tcgaagagaa agcatttagt ccagaggtaa 840
tacctatgtt tagcgcatta agcgaaggcg caacaccaca ggatctgaat actatgctta 900
ataccgtagg ggggcatcaa gccgcaatgc aaatgcttaa agagacaatt aacgaagagg 960
cagccgaatg ggatagagtg catcccgtac acgcaggacc aatcgcacca ggacaaatga 1020
gagaacctag gggatccgat atagccggaa ctactagtac attgcaggaa cagatagggt 1080
ggatgactaa taatccacct atacccgtag gcgaaatata caaaagatgg ataatactgg 1140
gactgaataa gatagttaga atgtatagtc caactagtat actcgatatt agacagggac 1200
ctaaagaacc ttttagggat tacgtagata gattctataa aacacttaga gccgaacagg 1260
ctagtcaaga ggttaagaat tggatgacag agacactatt agtgcaaaac gctaatcccg 1320
attgtaaaac tatacttaag gcactaggac cagcagcaac actcgaagaa atgatgacag 1380
catgtcaggg agtaggggga ccaggacata aagctagagt gttagccgaa gctatgtcac 1440
aggtaacgaa tagcgcaaca attatgatgc aaagaggtaa ttttagaaac caacgaaaaa 1500
tcgttaagtg ttttaattgc ggaaaagagg gacataccgc tagaaattgt agggcaccta 1560
gaaaaaaagg gtgttggaaa tgcggaaaag agggacatca aatgaaagat tgtaccgaaa 1620
gacaggctaa ttttttaggg aagatctggc cttcctacaa gggaaggcca gggaattttc 1680
ttcagagcag accagagcca acagccccac cagaagagag cttcaggtct ggggtagaga 1740
caacaactcc ccctcagaag caggagccga tagacaagga actgtatcct ttaacttccc 1800
tcaggtcact ctttggcaac gacccctcgt cacaataaag atagggggac aattgaaaga 1860
ggcactatta gacacaggag cagacgatac agtactcgaa gaaatgtcac taccaggtag 1920
atggaaacct aaaatgatag gggggatagg ggggtttata aaggtaagac aatacgatca 1980
gatactaatc gaaatttgcg gacataaagc aatcggaaca gtgttagtcg gacctacacc 2040
cgtaaacata atcggtagga atctgttaac acagataggg tgtacattga attttccaat 2100
tagtccaatc gaaaccgtac ccgtaaaact gaaaccaggt atggacggac ctaaggttaa 2160
gcaatggcca ttaaccgaag agaaaattaa ggcattagtc gaaatttgta ccgaaatgga 2220
aaaagagggt aagattagta agataggacc agagaatcca tataatacac ccgtattcgc 2280
aattaaaaaa aaagatagta cgaaatggag aaagttagtc gattttagag agttaaacaa 2340
aagaacacaa gacttttggg aggtacagtt agggatacca catccagcag gactgaaaaa 2400
aaaaaaaagc gtaaccgtat tagacgtagg agacgcatac tttagcgtac cattagacga 2460
agactttaga aagtataccg catttacgat acctagtatt aataacgaaa caccaggaat 2520
taggtatcaa tataacgtac tgccacaggg atggaaaggg tcaccagcta tattccaatc 2580
tagtatgact aagatactcg aaccttttag aaaacagaat ccagacatag tgatatacca 2640
atatatggac gatctatacg taggtagcga tctagagata gggcaacata gaacgaaaat 2700
cgaagagctt agacagcatc tgttaagatg gggattgact acacctgaca aaaaacacca 2760
aaaagaacca ccattcttat ggatgggata cgaattgcat cccgataaat ggacagtgca 2820
acctatagtg ttacccgaaa aagactcatg gacagtaaac gatatacaaa aactggtagg 2880
taagttgaat tgggctagtc agatatatcc cggaattaag gttaggcaat tgtgtaaact 2940
gttaagggga actaaggcac taaccgaagt gataccgtta accgaagagg cagagttaga 3000
gttagccgaa aatagagaga tacttaagga acccgtacac ggagtgtatt acgatcctag 3060
taaggatctg atagccgaaa tacaaaaaca gggacaggga caatggacat atcagatata 3120
tcaggaacct tttaaaaatc tgaaaaccgg taagtacgct agaatgaggg gagcacatac 3180
aaacgacgtt aagcaattga ccgaagccgt acaaaaaatt acaaccgaat caatcgtaat 3240
ttggggtaag acacctaaat ttaaattgcc tatacaaaaa gagacatggg aaacatggtg 3300
gactgagtat tggcaagcta catggatacc cgaatgggaa ttcgtaaata caccaccatt 3360
agtgaaattg tggtatcaac tcgaaaaaga accaatcgta ggagccgaaa cattttacgt 3420
agacggagca gctaataggg aaactaagtt aggtaaggca ggatacgtta cgaatagggg 3480
gagacagaaa gtcgttacac taaccgatac aactaaccaa aaaaccgaac tgcaagcgat 3540
atacttagcg ttacaggata gcggattaga ggtaaacata gtgacagact cacaatacgc 3600
attagggatt atacaggcac aacccgatca atccgaaagc gaactagtta atcagataat 3660
cgaacaattg attaaaaaag agaaagtgta tctagcatgg gtaccagcac ataagggaat 3720
agggggaaac gaacaggtag ataagttagt tagcgcagga attagaaagg tactgttttt 3780
agacggaata gacaaagcgc aagacgaaca cgaaaaatat catagtaatt ggagagctat 3840
ggctagcgat tttaatctac cacccgtagt cgctaaagag atagtcgcat catgtgataa 3900
gtgtcaattg aaaggcgaag ctatgcacgg acaggtcgat tgtagtccag ggatatggca 3960
attggattgt acacacttag agggtaaggt aatactagtc gcagtacacg tagctagcgg 4020
atatatcgaa gccgaagtga taccagccga aaccggacag gaaaccgcat actttctgtt 4080
aaagttagcc ggtagatggc cagttaagac tatacatacc gataacggat ctaattttac 4140
aggagcaacc gttagggcag catgttggtg ggcaggaatt aaacaggaat tcggaatacc 4200
atataatcca caatcacagg gagtagtcga atctatgaat aaagagttaa aaaaaattat 4260
cggacaggtt agagaccaag ccgaacacct taaaaccgca gtgcaaatgg ccgtattcat 4320
acataatttt aaaagaaaag gggggatagg ggggtatagc gcaggcgaaa gaatcgtaga 4380
cataatcgca actgacatac agactaaaga gttacagaaa cagattacta agatacagaa 4440
ttttagagtg tattatagag actctagaaa tccattatgg aaaggaccag ctaaactgtt 4500
atggaaaggc gaaggcgcag tagtgataca ggataatagc gatattaagg tagtgcctag 4560
acgaaaagcg aaaattatta gggattatgg aaaacagatg gcaggtgatg attgtgtggc 4620
aagtagacag gatgaggatt agaacatgga aatcactagt taagcatcat atgtacgtta 4680
gcggtaaggc taggggatgg ttttatagac atcattacga atcaccacat cctagaatat 4740
ctagcgaagt gcatataccg ttaggcgacg ctagattagt gataactaca tattggggat 4800
tgcatacagg cgaaagggat tggcatctag gacagggagt gtcaatcgaa tggcgaaaaa 4860
aaagatatag tacacaggta gacccagagt tagccgatca attgatacac ctatattatt 4920
tcgattgttt tagcgatagc gcaattagaa aggcactatt agggcatata gtgtcaccta 4980
gatgcgaata tcaagccgga cataataagg tagggtcact gcaatatcta gcattagccg 5040
cactaattac acctaaaaaa attaaaccac cactacctag cgtaactaag ttaaccgaag 5100
acagatggaa caagccccag aagaccaagg gccacagagg gagccacaca atgaatggac 5160
actagagctt ttagaggagc ttaagaatga agctgttaga cattttccta ggatttggct 5220
ccatggctta gggcaacata tctatgaaac ttatggggat acttgggcag gagtggaagc 5280
cataataaga attctgcaac aactgctgtt tatccatttt cagaattggg tgtcgacata 5340
gcagaatagg cgttactcga cagaggagag caagaaatgg agccagtaga tcctagacta 5400
gagccctgga agcatccagg aagtcagcct aaaactgctt gtaccaattg ctattgtaaa 5460
aagtgttgct ttcattgcca agtttgtttc ataacaaaag ccttaggcat ctcctatggc 5520
aggaagaagc ggagacagcg acgaagagct catcagaaca gtcagactca tcaagcttct 5580
ctatcaaagc agtaagtagt acatgtaatg caacctatac caatagtagc aatagtagca 5640
ttagtagtag caataataat agcaatagtt gtgtggtcca tagtaatcat agaatatagg 5700
aaaatattaa gacaaagaaa aatagacagg ttaattgata gactaataga aagagcagaa 5760
gacagtggca atgagagtga aggagaaata tcagcacttg tggagatggg ggtggagatg 5820
gggcaccatg ctccttggga tgttgatgat ctgtagtgca accgaaaaat tgtgggttac 5880
ggtatattac ggagtacccg tatggaaaga ggcaactact acactatttt gcgctagcga 5940
cgctaaagca tacgataccg aagtgcataa cgtatgggct acacacgcat gcgtacctac 6000
cgatcctaat ccacaagagg tagtgttagt taacgtaacc gaaaatttta atatgtggaa 6060
aaacgatatg gtcgaacaaa tgcacgaaga cataattagc ttatgggacc aatcacttaa 6120
accatgtgtt aagttgacac cactatgcgt aagtcttaag tgtacagacc ttaaaaacga 6180
tactaatact aactctagta gcggaagaat gattatggaa aagggagaga taaaaaattg 6240
ttcattcaat attagtacat caattagggg taaggtacaa aaagaatacg cattttttta 6300
taagttagac ataataccaa tcgataacga tacaacatca tataagttaa ctagttgtaa 6360
tactagcgta attacacagg catgtcctaa ggtatcattc gaacctatac cgatacacta 6420
ttgtgcacca gccggattcg caatactgaa atgtaataat aagacattta acggaaccgg 6480
accatgtact aacgtaagta cagtgcaatg tacacacgga attagacccg tagtgagtac 6540
gcaattactg ttaaacggat cattagccga agaggaagtg gtaattagat ccgttaattt 6600
taccgataac gctaaaacaa ttatagtgca attgaatact agcgtagaga ttaattgtac 6660
tagacctaat aataatacta gaaaacggat taggatacaa aggggaccag gtagggcatt 6720
cgtaacaatc ggtaagatag ggaatatgag acaggcacat tgtaatatta gtagggctaa 6780
atggaataat acacttaaac agatagctag taagcttaga gagcaattcg gtaataataa 6840
gacaattata ttcaaacaat ctagcggagg ggatccagaa atcgtaacac atagttttaa 6900
ttgcggaggc gaattttttt attgtaatag tacacaattg ttcaatagta catggtttaa 6960
tagtacatgg tcaaccgaag gatctaataa tacagaggga tccgatacaa ttacactacc 7020
atgtaggatt aaacagataa ttaatatgtg gcaaaaggta ggtaaggcaa tgtacgcacc 7080
acctattagc ggacaaatta gatgtagttc gaatataacc ggattactgt taactagaga 7140
cggagggaat tcgaataacg aatccgaaat ttttagacca ggggggggag atatgagaga 7200
caattggaga tccgaattgt ataagtataa agtcgttaaa atcgaaccat taggcgtagc 7260
acctacaaaa gcgaaaagac gggtagtgca acgcgaaaaa agagccgtag ggataggcgc 7320
actattctta gggtttttag gcgcagccgg atcaactatg ggagcagcta gtatgacatt 7380
gacagtgcaa gctagacaac tgttaagcgg aatagtgcaa caacagaata atctgttaag 7440
ggcaatcgaa gcacaacagc atctgttaca attgacagta tgggggatta agcaattgca 7500
ggctagaata ctcgcagtcg aacggtatct gaaagaccaa caactgttag ggatatgggg 7560
atgtagcggt aagttgatat gtacaaccgc agtaccatgg aacgctagtt ggtctaataa 7620
atcactcgaa cagatatgga atcatacaac atggatggaa tgggatagag agattaacaa 7680
ttatactagt ctgatacact cactaatcga agagtcacaa aaccaacagg aaaaaaacga 7740
acaggaactg ttagagttag acaaatgggc tagcttatgg aattggttta atattactaa 7800
ttggttatgg tatataaaac tgtttattat gatagtaggg gggttagtcg gattgagaat 7860
cgtattcgca gtactatcaa tcgttaatag ggttagacag ggatatagtc cactatcatt 7920
ccaaacccac ctcccaaccc cgaggggacc cgacaggccc gaaggaatag aagaagaagg 7980
tggagagaga gacagagaca gatccattcg attagtgaac ggatccttgg cacttatctg 8040
ggacgatctg cggagcctgt gcctcttcag ctaccaccgc ttgagagact tactcttgat 8100
tgtaacgagg attgtggaac ttctgggacg cagggggtgg gaagccctca aatattggtg 8160
gaatctccta cagtattgga gtcaggaact aaagaatagt gctgttagct tgctcaatgc 8220
cacagccata gcagtagctg aggggacaga tagggttata gaagtagtac aaggagcttg 8280
tagagctatt cgccacatac ctagaagaat aagacagggc ttggaaagga ttttgctata 8340
agatgggagg taagtggtct aaatctagcg taatcggatg gcctacagtt agggaaagaa 8400
tgcgtagagc cgaacctgca gccgataggg taggcgcagc tagtagggat ctcgaaaaac 8460
acggagcaat tactagtagt aatacagccg caactaacgc agcatgcgca tggttagagg 8520
cacaggaaga ggaagaggta gggtttcccg taacaccaca ggtaccactt agacctatga 8580
catataaagc cgcagtcgat ctatcacatt ttctgaaaga gaaagggggg ttagagggac 8640
tgatacattc acagagacga caagacatac tagacttatg gatatatcat acacagggat 8700
attttccaga ctagcaaaat tatacaccag gaccaggcgt aagatatcca ttgacattcg 8760
gatggtgtta taaactggta ccagtcgaac cagacaaaat cgaagaggct aacaaaggcg 8820
aaaatactag tctgttacat cccgtaagct tacacggaat ggacgatcca gaaagagagg 8880
tactcgaatg gagattcgat agtagactcg cattccatca cgtagctagg gaattgcatc 8940
cagagtattt taaaaattgt tgacatcgag cttgctacaa gggactttcc gctggggact 9000
ttccagggag gcgtggcctg ggcgggactg gggagtggcg agccctcaga tcctgcatat 9060
aagcagctgc tttttgcctg tactgggtct ctctggttag accagatctg agcctgggag 9120
ctctctggct aactagggaa cccactgctt aagcctcaat aaagcttgcc ttgagtgctt 9180
c 9181
<210> 37
<211> 3309
<212> DNA
<213> Rotavirus C
<400> 37
ggctaaaaaa aatggcgcaa tcgatagtag tagatggtga ttatgatgcg ttagcgtcgc 60
gttatttaaa atttgtatat gattttgaaa atgtaacgta tcaaaataat tattttgcga 120
cggataaatt taaaaaagat atagaacaat atttaaaatc gatacatgat ggtgaaaaaa 180
taacgcaatc gaaaatagat gaaaaagaaa aaatattatt agatcgtgta ccggcggaag 240
aacgttgttt aatatcgaaa ttagtatttg cgtatggtaa acatggtaat gtagaaaata 300
aattagtaaa atatggtgta aaagatgcgt tatcgcatgc gccgcaaaaa gatgcgaaac 360
cgtatgaaaa taatataata acgtcggaaa tatttaaaga aaaatcggaa tatacggata 420
tatatatgga tccgtcgata aatacgtcgt gtcaatcgaa ttgtcaagcg atgatgttta 480
cgatatcgga aatgaaatta aataatataa aaaatgcggc gcgtttagaa aaattattta 540
cgataatagc ggcgacgata aataaatatg gtatgccgcg tcataatacg cgttatcgtt 600
atgaatggga aacgatgaaa aataaaccgt atcatttagc ggcgtggata aattcgtcga 660
tagaaatgat agcgtgtgta gtagatcatc atacgtatat gatagcgcgt gaattaatag 720
taaaatcgtt tacgaatcgt acgtcgttag cgaaattagt atcgtcgccg atgacggtat 780
taacggcgat gttaccgata cgtggtacgt ttataacgac ggaaaattta gaattagaat 840
attcgaataa atcgataaat tatttaatat cgaaagaaat ggcggaagat tttatgcaag 900
cgataaaaca attacgtgat gaaggtttag aatatatacc ggattattat gaaaaatggt 960
ttaaatcgcc ggatccgtta acgtttccga atatagcgtt aatatattcg ttttcgtttc 1020
atgtaggtta tcgtaaacaa gcgttatcgg atgcggtata tgatcaaata acggtaacgt 1080
attcggataa tgtaaatatg gaaatgtata aagaatattc ggaacgtata gaaaatgaaa 1140
tatttacgat attaaaagat aaaataatac atgaagataa acgtttagaa gaatatgaat 1200
tatcggcgtt attatcgatg tcgtcggcgt cgaatggtat attacgtgaa ataaattttg 1260
gtggtcaaaa agtacgttcg acgaaaaaaa atatgcatgt aatagatgat atatatcata 1320
aaaaatatac gacggatata ccgccggtag atgcgcgtaa tccgataccg ttaggtcgtc 1380
gtgatgtacc gggtcgtcgt acgcgtgcga tatttatatt accgtatcaa tattttatag 1440
cgcaacattc gtttgcggaa ataatgttaa attatgcgaa acgtgaacgt gaatattcgg 1500
aattttattc gcaagcgaat caagtattat cgtatggtga tgtaacgcgt tatttagatt 1560
cgaattcgat attatgtttt acggatgtat cgcaatggga tgcgtcgcaa cataatacga 1620
aagtattacg tcgttcgata atacgtgcga tgaaacgttt aaaacaatta acgcataata 1680
taaatataca taaagcgata aatatatata tacaatcgca agaaaattta gaaaattcgt 1740
atgtattaat agataaaaaa gcgatacaat atggtgcgac ggcgtcgggt gaaaaacaaa 1800
cgaaaataat gaattcgata gcgaataaag cgttaataca aacggtatta ggtaaattaa 1860
tgacggatta tacgtttgat gtaaaaatga tacgtgtaga tggtgatgat aattatgcga 1920
tagtacgttt tccgatagcg ataacggaaa aattattatc ggaatttacg tcgaaattac 1980
gttcgtatta ttcggaaatg aatgtaaaag taaaagcgtt agcgtcgtta acgggttgtg 2040
aaatagcgaa acgttatgta gcgggtggta tgttattttt tcgtgcgggt gtaaatatat 2100
tacatcatga aaaacgtaat caagattcgg cgtatgatat ggcggcgacg ttatatgcga 2160
attatatagt aaatgcgtta cgtggtttaa cgatgtcgcg tacgtttata ttaacgaaaa 2220
tatgtcaaat gacgtcgata aaaataacgg gtacgttacg tttatttccg atgaaatcga 2280
tattagcgtt aaattcggcg tttaaagtat ttgatgaagt agattatgta ataaattatc 2340
cgatatcgaa tttatttata caattacaac gtaaattatc gtcgataaaa gcgaaatcga 2400
aaatagcgga taatatagcg aaatcgccgc aatttaaatc gtatgtagaa ttattaaata 2460
aatcgttaac gacggatgaa aatccgatag tatcggatgg tatacgttta acggaaaaag 2520
cgaaattaaa ttcgtatgcg ccgatagcgt tagaaaaacg tcgtgatcaa ttttcgataa 2580
tggtatcgtt tttacaaaat ccgacgacgt ttaaatcgga aacggtagta acgataaatg 2640
atgtattata ttttatatcg ggttttataa aaatagattc gtcgacggta ttaccgaaag 2700
aagaaaataa tacgatgccg ttattaccgg cgataataaa acgtacgtta tcgtattttg 2760
gtttacgtac gcatgattat gatataaaag gttcgtcgtc gacggtatcg aaaataataa 2820
aacaatattc ggtatatacg ccgggtatag aagaattata tgaaatagta aataaatcgg 2880
tagatacgat acgtggttat tttgcgtcgt ttaatgtacc gaaagcggat gtagatacgt 2940
atatatcgac gcaaatgtat aaacatgatc gttttaaaat attacaagcg tatatatata 3000
atttattatc ggtaaattat ggtatgtatc aattagtaga tttaaattcg gcgcgttttt 3060
ttgatcatgt aatacatacg ccgatggcga aaacgccgac ggcggtattt atgatagatt 3120
tagcgttacg tttaaaaata ataaatcatt gtatagaaaa aggtgaaata ataacggtat 3180
cggtacatgc gaataaaacg gattatttaa aattatggcg tatgttatgg aatgtaaaaa 3240
cgatgaattc gccgtattcg aaaaattcga tgtttgatga ataagagaag tggattgcat 3300
attgtggct 3309
<210> 38
<211> 3309
<212> DNA
<213> Unknown
<220>
<223> synthetic
<400> 38
ggctaaaaaa aatggcacaa tcaatcgtag ttgacggaga ttatgatgca ttagctagta 60
gatatctaaa attcgtatac gatttcgaaa acgtaactta tcagaataat tatttcgcaa 120
ctgataaatt taaaaaagat atcgaacaat atcttaaatc aatacacgat ggagaaaaaa 180
ttacgcaatc taagatagac gaaaaagaaa aaatactgtt agatagagta ccagctgaag 240
aaagatgtct aatatctaag ttagtattcg catatggtaa gcatggtaac gttgagaata 300
agttagttaa gtatggagtt aaggatgcac tatcacatgc accacaaaaa gacgctaaac 360
catacgaaaa taatataatt actagcgaaa tttttaaaga aaaatccgaa tatactgata 420
tatatatgga tccatcaatt aatacatcat gtcaatctaa ttgtcaagct atgatgttta 480
cgatatccga aatgaaattg aataatataa aaaacgctgc tagactcgaa aaattgttta 540
caattatagc cgctacaatt aataagtatg gtatgcctag acataatact agatatagat 600
atgaatggga aactatgaaa aataaaccat atcatttagc cgcatggatt aattcgtcaa 660
tcgaaatgat agcatgcgta gtcgatcatc atacatatat gatagctaga gagttaatcg 720
ttaaatcatt tactaataga acatcattag cgaaattagt gtcatcacct atgacagtgt 780
taaccgctat gttaccaatt agaggtacat ttataactac tgaaaatctc gaactcgaat 840
attctaataa atcaattaat tatctgatat cgaaagaaat ggctgaagat tttatgcaag 900
ctataaaaca attgagagac gaaggattag agtatatacc agattattac gaaaaatggt 960
ttaaatcacc agatccatta acttttccta atatagcgtt aatatattca ttttcatttc 1020
acgtagggta tagaaaacag gcactatctg atgcagtata cgatcagatt acggttacat 1080
attcagataa cgttaatatg gaaatgtata aagagtattc agaaagaatc gaaaacgaaa 1140
tttttacgat actgaaagat aaaattatac acgaagataa acggttagag gaatacgaac 1200
tatcagcatt actatctatg tcatcagcat caaacggaat acttagagaa attaatttcg 1260
gaggacaaaa agttagatca actaaaaaaa atatgcatgt aatcgatgat atatatcata 1320
aaaaatatac tactgatata ccaccagtag acgctagaaa tccgatacca ttaggtagaa 1380
gagacgtacc aggtagacga actagagcta tttttatact accatatcaa tattttatag 1440
cgcaacattc attcgcagaa attatgctta attatgctaa aagagaacgc gaatatagcg 1500
aattttattc acaggctaat caggtactat catacggaga tgtaactaga tatctagatt 1560
ctaattcgat actatgtttt acggatgtat cacaatggga tgctagtcag cataatacta 1620
aggtacttag acgatcaatt attagagcta tgaaaagatt gaaacaattg acacataata 1680
ttaatataca taaagcgata aatatatata tacaatcaca ggaaaatctc gaaaattcat 1740
atgtgttaat cgataaaaaa gcgatacaat acggagctac tgcatcaggc gaaaaacaga 1800
ctaaaattat gaattcaatc gctaataagg cattgataca gacagtgtta ggtaagttaa 1860
tgactgatta tacattcgat gttaaaatga ttagagtaga cggagatgat aattatgcta 1920
tagttagatt tccgatagcg ataaccgaaa aactgttaag cgaatttaca tctaaattgc 1980
gatcatatta ttcagaaatg aacgttaagg ttaaggcatt agcgtcatta acgggatgtg 2040
agatagcgaa aagatatgta gccggaggta tgttattttt tagagccgga gtgaatatat 2100
tgcatcatga aaaacgtaat caggatagtg catacgatat ggcagctaca ttatacgcta 2160
attatatagt taacgcactt agagggttaa ctatgtcacg aacttttata ttgactaaga 2220
tatgtcaaat gacatcaatt aaaattacgg gaacacttag attgtttcca atgaaatcaa 2280
tactcgcact taatagtgca tttaaggtat tcgatgaggt agattatgta attaattatc 2340
ctatatctaa tctatttata caattgcaac gaaaactatc atcaattaaa gcgaaatcta 2400
agatagccga taatatagcg aaatcaccac aatttaaatc atacgttgag ttactgaata 2460
aatcattgac tactgacgaa aatccgatag tgtcagacgg aatacggtta acggaaaaag 2520
ctaaattgaa ttcatacgca ccaatcgcat tagaaaaacg tagagatcaa ttttcaatta 2580
tggtatcatt tttacagaat cctactactt ttaaatccga aacagtagtt acaattaacg 2640
atgtattgta ttttatatca ggatttataa aaatcgattc tagtacagtg ttacctaaag 2700
aggaaaataa tactatgcca ctattaccag ctataattaa acgtacacta tcatatttcg 2760
gattgcgtac acatgattat gatattaagg gatcatctag tacagtatcg aaaattataa 2820
aacagtattc agtatataca ccaggaatcg aagagttata cgaaatcgtt aataaatcag 2880
tagatacaat taggggatat tttgctagtt ttaacgtacc taaagctgat gtagatacat 2940
atatatcgac acaaatgtat aaacatgata gatttaaaat actgcaagca tatatatata 3000
atctgttatc agttaattat ggtatgtatc aattagtcga tctgaattca gctagatttt 3060
ttgatcatgt aatacataca cctatggcta aaacacctac agcagttttt atgatagatt 3120
tagcgttaag attgaaaatt ataaatcatt gtatcgaaaa aggcgaaatt ataacagtta 3180
gcgtacacgc taataaaact gattatctta agttatggcg tatgttatgg aacgttaaga 3240
ctatgaatag tccatattct aaaaattcaa tgtttgacga ataagagaag tggattgcat 3300
attgtggct 3309
<210> 39
<211> 2736
<212> DNA
<213> Rotavirus C
<400> 39
ggcttaaaaa gatcagttga ggacaaatcg ttcaagatga tatcgcgtaa tcgtcgtcgt 60
aataatcaac aaaaaaatat agaaaaagaa aaacaattag aaacgataat aaataaagaa 120
gtaaaagaaa ataaagattc gatgaaagaa gataaattag tagtaacgga agaatcgaat 180
ggtgatgtaa cgacggcgaa agaacaatcg aataatataa atttacaaaa aaatgattta 240
gtaaaagaag taatgaatat acaaaatcaa acgttaaata cggtagtaac ggaaaataaa 300
gtagaaatag aagaaatagt aaaaaaatat ataccgtcgt ataatacgga ttcgttaata 360
gtaaaaaaat taacggaaat acaagaatcg tcggcgaaaa cgtataatac gttatttcgt 420
ttatttacgc cggtaaaatc gtatttatat gatataaatg gtgaaaaaaa attatcgacg 480
cgttggtatt ggaaattatt aaaagatgat ttaccggcgg gtgattattc ggtacgtcaa 540
ttttttttat cgttatattt aaatgtatta gaagaaatgc cggattatat aatgttacgt 600
gatatggcgg tagataatcc gtattcggcg gaagcgggta aaatagtaga tggtaaatcg 660
aaagaaatat taatagaatt atatcaagat caaatgacgg aaggttatat acgtcgttat 720
atgtcggaat tacgtcataa aatatcgggt gaaacgaata cggcgaaata tccggcgata 780
ttacatccgg tagataatga attaaatcaa tattttttag aacatcaatt aatacaaccg 840
ttaacgacgc gtaatatagc ggaattaata ccgacgcaat tatatcatga tccgaattat 900
gtatttaata tagatgcggc gtttttaacg aattcgcgtt ttgtaccgcc gtatttaacg 960
caagatcgta taggtttaca tgatggtttt gaatcgatat gggattcgaa aacgcatgcg 1020
gattatgtat cggcgcgtcg ttttataccg gatttaacgg aattagtaga tgcggaaaaa 1080
caaataaaag aaatggcggc gcatttacaa ttagaagcga taacggtaca agtagaatcg 1140
caatttttag cgggtatatc ggcggcggcg gcgaatgaag cgtttaaatt tataataggt 1200
tcggtattat cgacgcgtac gatagcggta gaatttataa cgtcgaatta tatgtcgtta 1260
gcgtcgtgta tgtatttaat gacgataatg ccgtcggaaa tatttttacg tgaatcgtta 1320
gtagcgatgc aattagcgat aataaatacg ttaatatatc cggcgttagg tttagcgcaa 1380
atgcattatc aagcgggtga agtacgtacg ccgtttgaat tagcggaaat gcaagtagcg 1440
aatcgttcga tacgtcaatg gttacatcat tgtaatacgt tacaatttgg tcgtcaaata 1500
acggaaggta taatacattt acgttttacg aatgatataa tgacgggtcg tatagtaaat 1560
ttattttcga cgatgttagt agcgttatcg tcgcaaccgt ttgcgacgta tccgttagat 1620
tataaacgtt cggtacaacg tgcgttacaa ttattatcga atcgtacggc gcaaatagcg 1680
gatttaacgc gtttaatagt atataattat acgacgttat cggcgtgtat agtaatgaat 1740
atgcatttag taggtacgtt aacggtagaa cgtatacaag cgacgtcgtt aacgtcgtta 1800
atgatgttaa tatcgaataa aacggtaata ccggaaccgt cgtcgttatt ttcgtatttt 1860
tcgtcgaata taaatttttt aacgaattat aatgaacaaa tagataatgt agtagcggaa 1920
ataatggcgg cgtatcgttt aaatttatat caacaaaaaa tgttaatgtt agtaacgcgt 1980
tttgtatcga aattatatat atttgatgcg ccgaaaatac cgccggatca aatgtatcgt 2040
ttacgtaatc gtttacgtaa tataccggta gaacgtcgtc gtgcggatgt atttcgtata 2100
ataatgaata atcgtgattt aatagaaaaa acgtcggaac gtatatgtca aggtgtatta 2160
ttatcgtata cgccgatgcc gttaacgtat gtagaagatg taggtttaac gaatgtaata 2220
aatgatacga attcgtttca aataataaat atagaagaaa tagaaaaaac gggtgattat 2280
tcggcgataa cgaatgcgtt attacgtgat acgccgataa tattaaaagg tgcgataccg 2340
tatgtaacga attcgtcggt aatagatgta ttatcgaaag tagatacgac ggtatttgcg 2400
tcgatagtaa aagatcgtga tatatcgaaa ttaaaaccga taaaatttat aataaattcg 2460
gattcgtcgg aatattattt agtacataat aataaatgga cgccgacgac gacgacggcg 2520
gtatataaag cgcgttcgca acaatttgat atacaacatt cggtatcgat gttagaatcg 2580
aatttatttt ttgtagtata taatgattta tttaaatata taaaaacgac gacggtatta 2640
ccgataaatg cggtatcgta tgatggtgcg cgtataatgc aagaaacgta aatgattgta 2700
tagtatcatc ttgtgacgac ctcaaacttt gtggct 2736
<210> 40
<211> 2736
<212> DNA
<213> Unknown
<220>
<223> synthetic
<400> 40
ggcttaaaaa gatcagttga ggacaaatcg ttcaagatga tatctagaaa tagacgtaga 60
aataatcagc aaaaaaatat cgaaaaagaa aaacagttag agacaattat taataaagag 120
gttaaagaga ataaggattc aatgaaagag gataagttag tggtaaccga agaatctaac 180
ggagacgtta caaccgctaa agagcaatct aataatatta atctgcaaaa aaacgattta 240
gttaaagagg ttatgaatat acagaatcag acacttaata cagtagttac cgaaaataag 300
gttgagatag aagagatagt taaaaaatat ataccgtcat ataatactga ttcattaatc 360
gttaaaaaat taaccgaaat acaggaatct agtgctaaaa cttataatac actatttaga 420
ttgtttacac cagttaaatc atacttatac gatattaatg gcgaaaaaaa actatctact 480
agatggtatt ggaaactgtt aaaagacgat ctaccagcag gtgattactc agttagacaa 540
ttttttctat cattatactt aaacgtatta gaggaaatgc cagattatat tatgcttaga 600
gatatggcag ttgataatcc atactcagct gaagcaggta agatagttga cggtaagtct 660
aaagagatat taatcgaatt gtatcaggat caaatgacag agggatatat tagacggtat 720
atgtcagaac ttagacataa aatttcaggc gaaactaata ccgctaaata tccagctata 780
ctgcatccag tagataacga attgaatcaa tattttctcg aacatcaatt gatacaacca 840
ttaactacta gaaatatagc cgaattgata ccgacacaat tgtatcatga tcctaattac 900
gtttttaata tagacgctgc atttttaact aattctagat tcgtaccacc atacttaacg 960
caagatagga tagggttaca tgacggattc gaatcaattt gggattctaa aacacatgct 1020
gattacgtat cagctagacg atttataccc gatttaaccg aattagttga cgctgaaaaa 1080
cagattaagg aaatggctgc acatttacaa ctcgaagcta ttacggtaca ggttgaatca 1140
caatttttag ccggtattag cgcagcagca gctaacgaag catttaaatt tattatagga 1200
tcagtgttat caactagaac tatagcagtc gaatttatta catctaatta tatgtcatta 1260
gctagttgta tgtatcttat gacaattatg cctagcgaaa tttttttacg cgaatcatta 1320
gtcgctatgc aattagctat tattaataca cttatatatc cagcattagg gttagcgcaa 1380
atgcattatc aggcaggtga ggttagaaca ccattcgaat tagccgaaat gcaagttgcg 1440
aatagatcaa ttagacaatg gttacatcat tgtaatacat tacaattcgg taggcaaatt 1500
accgaaggta ttatacatct tagatttact aacgatatta tgacaggtag gatagttaat 1560
ctattttcga ctatgttagt tgcgttatca tcacaaccat tcgctacata tccattagat 1620
tataaaagat cagtgcaacg agcattacaa ttgttatcta atagaaccgc tcaaatagct 1680
gatttaacta gactgatagt gtataattat actacattat ccgcatgcat agttatgaat 1740
atgcatttag tgggtacact tacagtcgaa cgtatacagg ctacatcatt aacatcatta 1800
atgatgttaa tttctaataa aacagttata cccgaaccat catcattatt ttcatatttt 1860
tcatctaata ttaatttttt aactaattat aacgaacaga tagataacgt agttgcggaa 1920
attatggctg catatagatt gaatctatat caacaaaaaa tgttaatgtt agtgactaga 1980
ttcgtaagta agttatatat attcgatgca cctaaaattc caccagatca aatgtataga 2040
cttagaaata gacttagaaa tataccagtc gaaagacgta gagcagacgt atttagaatt 2100
attatgaata atagggattt aatcgaaaaa actagcgaaa gaatttgtca gggagtgtta 2160
ctatcatata cacctatgcc attaacatac gttgaagacg taggattaac taacgtaatt 2220
aacgatacta attcgtttca aattattaat atcgaagaaa tcgaaaaaac aggtgattac 2280
tcagctatta ctaatgcact attaagggat acacctatta tacttaaggg agctatacca 2340
tacgttacga attcgtcagt gatagacgta ctatctaagg tagatactac agtattcgct 2400
agtatagtta aggataggga tatatctaag ttaaaaccaa ttaaatttat aattaattct 2460
gattctagcg aatattattt agtgcataat aataaatgga cacctactac tactactgca 2520
gtgtataaag ctagatcaca acaattcgat atacaacata gcgtatctat gctcgaatct 2580
aatctatttt tcgtagtgta taacgatcta tttaaatata ttaaaactac tacagtgtta 2640
ccaattaacg ctgtatcata cgatggagct agaattatgc aagaaacata aatgattgta 2700
tagtatcatc ttgtgacgac ctcaaacttt gtggct 2736
<210> 41
<211> 29751
<212> DNA
<213> coronavirus
<400> 41
atattaggtt tttacctacc caggaaaagc caaccaacct cgatctcttg tagatctgtt 60
ctctaaacga actttaaaat ctgtgtagct gtcgctcggc tgcatgccta gtgcacctac 120
gcagtataaa caataataaa ttttactgtc gttgacaaga aacgagtaac tcgtccctct 180
tctgcagact gcttacggtt tcgtccgtgt tgcagtcgat catcagcata cctaggtttc 240
gtccgggtgt gaccgaaagg taagatggaa tcgttagtat taggtgtaaa tgaaaaaacg 300
catgtacaat tatcgttacc ggtattacaa gtacgtgatg tattagtacg tggttttggt 360
gattcggtag aagaagcgtt atcggaagcg cgtgaacatt taaaaaatgg tacgtgtggt 420
ttagtagaat tagaaaaagg tgtattaccg caattagaac aaccgtatgt atttataaaa 480
cgttcggatg cgttatcgac gaatcatggt cataaagtag tagaattagt agcggaaatg 540
gatggtatac aatatggtcg ttcgggtata acgttaggtg tattagtacc gcatgtaggt 600
gaaacgccga tagcgtatcg taatgtatta ttacgtaaaa atggtaataa aggtgcgggt 660
ggtcattcgt atggtataga tttaaaatcg tatgatttag gtgatgaatt aggtacggat 720
ccgatagaag attatgaaca aaattggaat acgaaacatg gttcgggtgc gttacgtgaa 780
ttaacgcgtg aattaaatgg tggtgcggta acgcgttatg tagataataa tttttgtggt 840
ccggatggtt atccgttaga ttgtataaaa gattttttag cgcgtgcggg taaatcgatg 900
tgtacgttat cggaacaatt agattatata gaatcgaaac gtggtgtata ttgttgtcgt 960
gatcatgaac atgaaatagc gtggtttacg gaacgttcgg ataaatcgta tgaacatcaa 1020
acgccgtttg aaataaaatc ggcgaaaaaa tttgatacgt ttaaaggtga atgtccgaaa 1080
tttgtatttc cgttaaattc gaaagtaaaa gtaatacaac cgcgtgtaga aaaaaaaaaa 1140
acggaaggtt ttatgggtcg tatacgttcg gtatatccgg tagcgtcgcc gcaagaatgt 1200
aataatatgc atttatcgac gttaatgaaa tgtaatcatt gtgatgaagt atcgtggcaa 1260
acgtgtgatt ttttaaaagc gacgtgtgaa cattgtggta cggaaaattt agtaatagaa 1320
ggtccgacga cgtgtggtta tttaccgacg aatgcggtag taaaaatgcc gtgtccggcg 1380
tgtcaagatc cggaaatagg tccggaacat tcggtagcgg attatcataa tcattcgaat 1440
atagaaacgc gtttacgtaa aggtggtcgt acgcgttgtt ttggtggttg tgtatttgcg 1500
tatgtaggtt gttataataa acgtgcgtat tgggtaccgc gtgcgtcggc ggatataggt 1560
tcgggtcata cgggtataac gggtgataat gtagaaacgt taaatgaaga tttattagaa 1620
atattatcgc gtgaacgtgt aaatataaat atagtaggtg attttcattt aaatgaagaa 1680
gtagcgataa tattagcgtc gttttcggcg tcgacgtcgg cgtttataga tacgataaaa 1740
tcgttagatt ataaatcgtt taaaacgata gtagaatcgt gtggtaatta taaagtaacg 1800
aaaggtaaac cggtaaaagg tgcgtggaat ataggtcaac aacgttcggt attaacgccg 1860
ttatgtggtt ttccgtcgca agcggcgggt gtaatacgtt cgatatttgc gcgtacgtta 1920
gatgcggcga atcattcgat accggattta caacgtgcgg cggtaacgat attagatggt 1980
atatcggaac aatcgttacg tttagtagat gcgatggtat atacgtcgga tttattaacg 2040
aattcggtaa taataatggc gtatgtaacg ggtggtttag tacaacaaac gtcgcaatgg 2100
ttatcgaatt tattaggtac gacggtagaa aaattacgtc cgatatttga atggatagaa 2160
gcgaaattat cggcgggtgt agaattttta aaagatgcgt gggaaatatt aaaattttta 2220
ataacgggtg tatttgatat agtaaaaggt caaatacaag tagcgtcgga taatataaaa 2280
gattgtgtaa aatgttttat agatgtagta aataaagcgt tagaaatgtg tatagatcaa 2340
gtaacgatag cgggtgcgaa attacgttcg ttaaatttag gtgaagtatt tatagcgcaa 2400
tcgaaaggtt tatatcgtca atgtatacgt ggtaaagaac aattacaatt attaatgccg 2460
ttaaaagcgc cgaaagaagt aacgttttta gaaggtgatt cgcatgatac ggtattaacg 2520
tcggaagaag tagtattaaa aaatggtgaa ttagaagcgt tagaaacgcc ggtagattcg 2580
tttacgaatg gtgcgatagt aggtacgccg gtatgtgtaa atggtttaat gttattagaa 2640
ataaaagata aagaacaata ttgtgcgtta tcgccgggtt tattagcgac gaataatgta 2700
tttcgtttaa aaggtggtgc gccgataaaa ggtgtaacgt ttggtgaaga tacggtatgg 2760
gaagtacaag gttataaaaa tgtacgtata acgtttgaat tagatgaacg tgtagataaa 2820
gtattaaatg aaaaatgttc ggtatatacg gtagaatcgg gtacggaagt aacggaattt 2880
gcgtgtgtag tagcggaagc ggtagtaaaa acgttacaac cggtatcgga tttattaacg 2940
aatatgggta tagatttaga tgaatggtcg gtagcgacgt tttatttatt tgatgatgcg 3000
ggtgaagaaa atttttcgtc gcgtatgtat tgttcgtttt atccgccgga tgaagaagaa 3060
gaagatgatg cggaatgtga agaagaagaa atagatgaaa cgtgtgaaca tgaatatggt 3120
acggaagatg attatcaagg tttaccgtta gaatttggtg cgtcggcgga aacggtacgt 3180
gtagaagaag aagaagaaga agattggtta gatgatacga cggaacaatc ggaaatagaa 3240
ccggaaccgg aaccgacgcc ggaagaaccg gtaaatcaat ttacgggtta tttaaaatta 3300
acggataatg tagcgataaa atgtgtagat atagtaaaag aagcgcaatc ggcgaatccg 3360
atggtaatag taaatgcggc gaatatacat ttaaaacatg gtggtggtgt agcgggtgcg 3420
ttaaataaag cgacgaatgg tgcgatgcaa aaagaatcgg atgattatat aaaattaaat 3480
ggtccgttaa cggtaggtgg ttcgtgttta ttatcgggtc ataatttagc gaaaaaatgt 3540
ttacatgtag taggtccgaa tttaaatgcg ggtgaagata tacaattatt aaaagcggcg 3600
tatgaaaatt ttaattcgca agatatatta ttagcgccgt tattatcggc gggtatattt 3660
ggtgcgaaac cgttacaatc gttacaagta tgtgtacaaa cggtacgtac gcaagtatat 3720
atagcggtaa atgataaagc gttatatgaa caagtagtaa tggattattt agataattta 3780
aaaccgcgtg tagaagcgcc gaaacaagaa gaaccgccga atacggaaga ttcgaaaacg 3840
gaagaaaaat cggtagtaca aaaaccggta gatgtaaaac cgaaaataaa agcgtgtata 3900
gatgaagtaa cgacgacgtt agaagaaacg aaatttttaa cgaataaatt attattattt 3960
gcggatataa atggtaaatt atatcatgat tcgcaaaata tgttacgtgg tgaagatatg 4020
tcgtttttag aaaaagatgc gccgtatatg gtaggtgatg taataacgtc gggtgatata 4080
acgtgtgtag taataccgtc gaaaaaagcg ggtggtacga cggaaatgtt atcgcgtgcg 4140
ttaaaaaaag taccggtaga tgaatatata acgacgtatc cgggtcaagg ttgtgcgggt 4200
tatacgttag aagaagcgaa aacggcgtta aaaaaatgta aatcggcgtt ttatgtatta 4260
ccgtcggaag cgccgaatgc gaaagaagaa atattaggta cggtatcgtg gaatttacgt 4320
gaaatgttag cgcatgcgga agaaacgcgt aaattaatgc cgatatgtat ggatgtacgt 4380
gcgataatgg cgacgataca acgtaaatat aaaggtataa aaatacaaga aggtatagta 4440
gattatggtg tacgtttttt tttttatacg tcgaaagaac cggtagcgtc gataataacg 4500
aaattaaatt cgttaaatga accgttagta acgatgccga taggttatgt aacgcatggt 4560
tttaatttag aagaagcggc gcgttgtatg cgttcgttaa aagcgccggc ggtagtatcg 4620
gtatcgtcgc cggatgcggt aacgacgtat aatggttatt taacgtcgtc gtcgaaaacg 4680
tcggaagaac attttgtaga aacggtatcg ttagcgggtt cgtatcgtga ttggtcgtat 4740
tcgggtcaac gtacggaatt aggtgtagaa tttttaaaac gtggtgataa aatagtatat 4800
catacgttag aatcgccggt agaatttcat ttagatggtg aagtattatc gttagataaa 4860
ttaaaatcgt tattatcgtt acgtgaagta aaaacgataa aagtatttac gacggtagat 4920
aatacgaatt tacatacgca attagtagat atgtcgatga cgtatggtca acaatttggt 4980
ccgacgtatt tagatggtgc ggatgtaacg aaaataaaac cgcatgtaaa tcatgaaggt 5040
aaaacgtttt ttgtattacc gtcggatgat acgttacgtt cggaagcgtt tgaatattat 5100
catacgttag atgaatcgtt tttaggtcgt tatatgtcgg cgttaaatca tacgaaaaaa 5160
tggaaatttc cgcaagtagg tggtttaacg tcgataaaat gggcggataa taattgttat 5220
ttatcgtcgg tattattagc gttacaacaa ttagaagtaa aatttaatgc gccggcgtta 5280
caagaagcgt attatcgtgc gcgtgcgggt gatgcggcga atttttgtgc gttaatatta 5340
gcgtattcga ataaaacggt aggtgaatta ggtgatgtac gtgaaacgat gacgcattta 5400
ttacaacatg cgaatttaga atcggcgaaa cgtgtattaa atgtagtatg taaacattgt 5460
ggtcaaaaaa cgacgacgtt aacgggtgta gaagcggtaa tgtatatggg tacgttatcg 5520
tatgataatt taaaaacggg tgtatcgata ccgtgtgtat gtggtcgtga tgcgacgcaa 5580
tatttagtac aacaagaatc gtcgtttgta atgatgtcgg cgccgccggc ggaatataaa 5640
ttacaacaag gtacgttttt atgtgcgaat gaatatacgg gtaattatca atgtggtcat 5700
tatacgcata taacggcgaa agaaacgtta tatcgtatag atggtgcgca tttaacgaaa 5760
atgtcggaat ataaaggtcc ggtaacggat gtattttata aagaaacgtc gtatacgacg 5820
acgataaaac cggtatcgta taaattagat ggtgtaacgt atacggaaat agaaccgaaa 5880
ttagatggtt attataaaaa agataatgcg tattatacgg aacaaccgat agatttagta 5940
ccgacgcaac cgttaccgaa tgcgtcgttt gataatttta aattaacgtg ttcgaatacg 6000
aaatttgcgg atgatttaaa tcaaatgacg ggttttacga aaccggcgtc gcgtgaatta 6060
tcggtaacgt tttttccgga tttaaatggt gatgtagtag cgatagatta tcgtcattat 6120
tcggcgtcgt ttaaaaaagg tgcgaaatta ttacataaac cgatagtatg gcatataaat 6180
caagcgacga cgaaaacgac gtttaaaccg aatacgtggt gtttacgttg tttatggtcg 6240
acgaaaccgg tagatacgtc gaattcgttt gaagtattag cggtagaaga tacgcaaggt 6300
atggataatt tagcgtgtga atcgcaacaa ccgacgtcgg aagaagtagt agaaaatccg 6360
acgatacaaa aagaagtaat agaatgtgat gtaaaaacga cggaagtagt aggtaatgta 6420
atattaaaac cgtcggatga aggtgtaaaa gtaacgcaag aattaggtca tgaagattta 6480
atggcggcgt atgtagaaaa tacgtcgata acgataaaaa aaccgaatga attatcgtta 6540
gcgttaggtt taaaaacgat agcgacgcat ggtatagcgg cgataaattc ggtaccgtgg 6600
tcgaaaatat tagcgtatgt aaaaccgttt ttaggtcaag cggcgataac gacgtcgaat 6660
tgtgcgaaac gtttagcgca acgtgtattt aataattata tgccgtatgt atttacgtta 6720
ttatttcaat tatgtacgtt tacgaaatcg acgaattcgc gtatacgtgc gtcgttaccg 6780
acgacgatag cgaaaaattc ggtaaaatcg gtagcgaaat tatgtttaga tgcgggtata 6840
aattatgtaa aatcgccgaa attttcgaaa ttatttacga tagcgatgtg gttattatta 6900
ttatcgatat gtttaggttc gttaatatgt gtaacggcgg cgtttggtgt attattatcg 6960
aattttggtg cgccgtcgta ttgtaatggt gtacgtgaat tatatttaaa ttcgtcgaat 7020
gtaacgacga tggatttttg tgaaggttcg tttccgtgtt cgatatgttt atcgggttta 7080
gattcgttag attcgtatcc ggcgttagaa acgatacaag taacgatatc gtcgtataaa 7140
ttagatttaa cgatattagg tttagcggcg gaatgggtat tagcgtatat gttatttacg 7200
aaattttttt atttattagg tttatcggcg ataatgcaag tattttttgg ttattttgcg 7260
tcgcatttta tatcgaattc gtggttaatg tggtttataa tatcgatagt acaaatggcg 7320
ccggtatcgg cgatggtacg tatgtatata ttttttgcgt cgttttatta tatatggaaa 7380
tcgtatgtac atataatgga tggttgtacg tcgtcgacgt gtatgatgtg ttataaacgt 7440
aatcgtgcga cgcgtgtaga atgtacgacg atagtaaatg gtatgaaacg ttcgttttat 7500
gtatatgcga atggtggtcg tggtttttgt aaaacgcata attggaattg tttaaattgt 7560
gatacgtttt gtacgggttc gacgtttata tcggatgaag tagcgcgtga tttatcgtta 7620
caatttaaac gtccgataaa tccgacggat caatcgtcgt atatagtaga ttcggtagcg 7680
gtaaaaaatg gtgcgttaca tttatatttt gataaagcgg gtcaaaaaac gtatgaacgt 7740
catccgttat cgcattttgt aaatttagat aatttacgtg cgaataatac gaaaggttcg 7800
ttaccgataa atgtaatagt atttgatggt aaatcgaaat gtgatgaatc ggcgtcgaaa 7860
tcggcgtcgg tatattattc gcaattaatg tgtcaaccga tattattatt agatcaagcg 7920
ttagtatcgg atgtaggtga ttcgacggaa gtatcggtaa aaatgtttga tgcgtatgta 7980
gatacgtttt cggcgacgtt ttcggtaccg atggaaaaat taaaagcgtt agtagcgacg 8040
gcgcattcgg aattagcgaa aggtgtagcg ttagatggtg tattatcgac gtttgtatcg 8100
gcggcgcgtc aaggtgtagt agatacggat gtagatacga aagatgtaat agaatgttta 8160
aaattatcgc atcattcgga tttagaagta acgggtgatt cgtgtaataa ttttatgtta 8220
acgtataata aagtagaaaa tatgacgccg cgtgatttag gtgcgtgtat agattgtaat 8280
gcgcgtcata taaatgcgca agtagcgaaa tcgcataatg tatcgttaat atggaatgta 8340
aaagattata tgtcgttatc ggaacaatta cgtaaacaaa tacgttcggc ggcgaaaaaa 8400
aataatatac cgtttcgttt aacgtgtgcg acgacgcgtc aagtagtaaa tgtaataacg 8460
acgaaaatat cgttaaaagg tggtaaaata gtatcgacgt gttttaaatt aatgttaaaa 8520
gcgacgttat tatgtgtatt agcggcgtta gtatgttata tagtaatgcc ggtacatacg 8580
ttatcgatac atgatggtta tacgaatgaa ataataggtt ataaagcgat acaagatggt 8640
gtaacgcgtg atataatatc gacggatgat tgttttgcga ataaacatgc gggttttgat 8700
gcgtggtttt cgcaacgtgg tggttcgtat aaaaatgata aatcgtgtcc ggtagtagcg 8760
gcgataataa cgcgtgaaat aggttttata gtaccgggtt taccgggtac ggtattacgt 8820
gcgataaatg gtgatttttt acatttttta ccgcgtgtat tttcggcggt aggtaatata 8880
tgttatacgc cgtcgaaatt aatagaatat tcggattttg cgacgtcggc gtgtgtatta 8940
gcggcggaat gtacgatatt taaagatgcg atgggtaaac cggtaccgta ttgttatgat 9000
acgaatttat tagaaggttc gatatcgtat tcggaattac gtccggatac gcgttatgta 9060
ttaatggatg gttcgataat acaatttccg aatacgtatt tagaaggttc ggtacgtgta 9120
gtaacgacgt ttgatgcgga atattgtcgt catggtacgt gtgaacgttc ggaagtaggt 9180
atatgtttat cgacgtcggg tcgttgggta ttaaataatg aacattatcg tgcgttatcg 9240
ggtgtatttt gtggtgtaga tgcgatgaat ttaatagcga atatatttac gccgttagta 9300
caaccggtag gtgcgttaga tgtatcggcg tcggtagtag cgggtggtat aatagcgata 9360
ttagtaacgt gtgcggcgta ttattttatg aaatttcgtc gtgtatttgg tgaatataat 9420
catgtagtag cggcgaatgc gttattattt ttaatgtcgt ttacgatatt atgtttagta 9480
ccggcgtatt cgtttttacc gggtgtatat tcggtatttt atttatattt aacgttttat 9540
tttacgaatg atgtatcgtt tttagcgcat ttacaatggt ttgcgatgtt ttcgccgata 9600
gtaccgtttt ggataacggc gatatatgta ttttgtatat cgttaaaaca ttgtcattgg 9660
ttttttaata attatttacg taaacgtgta atgtttaatg gtgtaacgtt ttcgacgttt 9720
gaagaagcgg cgttatgtac gtttttatta aataaagaaa tgtatttaaa attacgttcg 9780
gaaacgttat taccgttaac gcaatataat cgttatttag cgttatataa taaatataaa 9840
tatttttcgg gtgcgttaga tacgacgtcg tatcgtgaag cggcgtgttg tcatttagcg 9900
aaagcgttaa atgatttttc gaattcgggt gcggatgtat tatatcaacc gccgcaaacg 9960
tcgataacgt cggcggtatt acaatcgggt tttcgtaaaa tggcgtttcc gtcgggtaaa 10020
gtagaaggtt gtatggtaca agtaacgtgt ggtacgacga cgttaaatgg tttatggtta 10080
gatgatacgg tatattgtcc gcgtcatgta atatgtacgg cggaagatat gttaaatccg 10140
aattatgaag atttattaat acgtaaatcg aatcattcgt ttttagtaca agcgggtaat 10200
gtacaattac gtgtaatagg tcattcgatg caaaattgtt tattacgttt aaaagtagat 10260
acgtcgaatc cgaaaacgcc gaaatataaa tttgtacgta tacaaccggg tcaaacgttt 10320
tcggtattag cgtgttataa tggttcgccg tcgggtgtat atcaatgtgc gatgcgtccg 10380
aatcatacga taaaaggttc gtttttaaat ggttcgtgtg gttcggtagg ttttaatata 10440
gattatgatt gtgtatcgtt ttgttatatg catcatatgg aattaccgac gggtgtacat 10500
gcgggtacgg atttagaagg taaattttat ggtccgtttg tagatcgtca aacggcgcaa 10560
gcggcgggta cggatacgac gataacgtta aatgtattag cgtggttata tgcggcggta 10620
ataaatggtg atcgttggtt tttaaatcgt tttacgacga cgttaaatga ttttaattta 10680
gtagcgatga aatataatta tgaaccgtta acgcaagatc atgtagatat attaggtccg 10740
ttatcggcgc aaacgggtat agcggtatta gatatgtgtg cggcgttaaa agaattatta 10800
caaaatggta tgaatggtcg tacgatatta ggttcgacga tattagaaga tgaatttacg 10860
ccgtttgatg tagtacgtca atgttcgggt gtaacgtttc aaggtaaatt taaaaaaata 10920
gtaaaaggta cgcatcattg gatgttatta acgtttttaa cgtcgttatt aatattagta 10980
caatcgacgc aatggtcgtt attttttttt gtatatgaaa atgcgttttt accgtttacg 11040
ttaggtataa tggcgatagc ggcgtgtgcg atgttattag taaaacataa acatgcgttt 11100
ttatgtttat ttttattacc gtcgttagcg acggtagcgt attttaatat ggtatatatg 11160
ccggcgtcgt gggtaatgcg tataatgacg tggttagaat tagcggatac gtcgttatcg 11220
ggttatcgtt taaaagattg tgtaatgtat gcgtcggcgt tagtattatt aatattaatg 11280
acggcgcgta cggtatatga tgatgcggcg cgtcgtgtat ggacgttaat gaatgtaata 11340
acgttagtat ataaagtata ttatggtaat gcgttagatc aagcgatatc gatgtgggcg 11400
ttagtaatat cggtaacgtc gaattattcg ggtgtagtaa cgacgataat gtttttagcg 11460
cgtgcgatag tatttgtatg tgtagaatat tatccgttat tatttataac gggtaatacg 11520
ttacaatgta taatgttagt atattgtttt ttaggttatt gttgttgttg ttattttggt 11580
ttattttgtt tattaaatcg ttattttcgt ttaacgttag gtgtatatga ttatttagta 11640
tcgacgcaag aatttcgtta tatgaattcg caaggtttat taccgccgaa atcgtcgata 11700
gatgcgttta aattaaatat aaaattatta ggtataggtg gtaaaccgtg tataaaagta 11760
gcgacggtac aatcgaaaat gtcggatgta aaatgtacgt cggtagtatt attatcggta 11820
ttacaacaat tacgtgtaga atcgtcgtcg aaattatggg cgcaatgtgt acaattacat 11880
aatgatatat tattagcgaa agatacgacg gaagcgtttg aaaaaatggt atcgttatta 11940
tcggtattat tatcgatgca aggtgcggta gatataaatc gtttatgtga agaaatgtta 12000
gataatcgtg cgacgttaca agcgatagcg tcggaatttt cgtcgttacc gtcgtatgcg 12060
gcgtatgcga cggcgcaaga agcgtatgaa caagcggtag cgaatggtga ttcggaagta 12120
gtattaaaaa aattaaaaaa atcgttaaat gtagcgaaat cggaatttga tcgtgatgcg 12180
gcgatgcaac gtaaattaga aaaaatggcg gatcaagcga tgacgcaaat gtataaacaa 12240
gcgcgttcgg aagataaacg tgcgaaagta acgtcggcga tgcaaacgat gttatttacg 12300
atgttacgta aattagataa tgatgcgtta aataatataa taaataatgc gcgtgatggt 12360
tgtgtaccgt taaatataat accgttaacg acggcggcga aattaatggt agtagtaccg 12420
gattatggta cgtataaaaa tacgtgtgat ggtaatacgt ttacgtatgc gtcggcgtta 12480
tgggaaatac aacaagtagt agatgcggat tcgaaaatag tacaattatc ggaaataaat 12540
atggataatt cgccgaattt agcgtggccg ttaatagtaa cggcgttacg tgcgaattcg 12600
gcggtaaaat tacaaaataa tgaattatcg ccggtagcgt tacgtcaaat gtcgtgtgcg 12660
gcgggtacga cgcaaacggc gtgtacggat gataatgcgt tagcgtatta taataattcg 12720
aaaggtggtc gttttgtatt agcgttatta tcggatcatc aagatttaaa atgggcgcgt 12780
tttccgaaat cggatggtac gggtacgata tatacggaat tagaaccgcc gtgtcgtttt 12840
gtaacggata cgccgaaagg tccgaaagta aaatatttat attttataaa aggtttaaat 12900
aatttaaatc gtggtatggt attaggttcg ttagcggcga cggtacgttt acaagcgggt 12960
aatgcgacgg aagtaccggc gaattcgacg gtattatcgt tttgtgcgtt tgcggtagat 13020
ccggcgaaag cgtataaaga ttatttagcg tcgggtggtc aaccgataac gaattgtgta 13080
aaaatgttat gtacgcatac gggtacgggt caagcgataa cggtaacgcc ggaagcgaat 13140
atggatcaag aatcgtttgg tggtgcgtcg tgttgtttat attgtcgttg tcatatagat 13200
catccgaatc cgaaaggttt ttgtgattta aaaggtaaat atgtacaaat accgacgacg 13260
tgtgcgaatg atccggtagg ttttacgtta cgtaatacgg tatgtacggt atgtggtatg 13320
tggaaaggtt atggttgttc gtgtgatcaa ttacgtgaac cgttaatgca atcggcggat 13380
gcgtcgacgt ttttaaatgg gtttgcggtg taagtgcggc gcgtttaacg ccgtgtggta 13440
cgggtacgtc gacggatgta gtatatcgtg cgtttgatat atataatgaa aaagtagcgg 13500
gttttgcgaa atttttaaaa acgaattgtt gtcgttttca agaaaaagat gaagaaggta 13560
atttattaga ttcgtatttt gtagtaaaac gtcatacgat gtcgaattat caacatgaag 13620
aaacgatata taatttagta aaagattgtc cggcggtagc ggtacatgat ttttttaaat 13680
ttcgtgtaga tggtgatatg gtaccgcata tatcgcgtca acgtttaacg aaatatacga 13740
tggcggattt agtatatgcg ttacgtcatt ttgatgaagg taattgtgat acgttaaaag 13800
aaatattagt aacgtataat tgttgtgatg atgattattt taataaaaaa gattggtatg 13860
attttgtaga aaatccggat atattacgtg tatatgcgaa tttaggtgaa cgtgtacgtc 13920
aatcgttatt aaaaacggta caattttgtg atgcgatgcg tgatgcgggt atagtaggtg 13980
tattaacgtt agataatcaa gatttaaatg gtaattggta tgattttggt gattttgtac 14040
aagtagcgcc gggttgtggt gtaccgatag tagattcgta ttattcgtta ttaatgccga 14100
tattaacgtt aacgcgtgcg ttagcggcgg aatcgcatat ggatgcggat ttagcgaaac 14160
cgttaataaa atgggattta ttaaaatatg attttacgga agaacgttta tgtttatttg 14220
atcgttattt taaatattgg gatcaaacgt atcatccgaa ttgtataaat tgtttagatg 14280
atcgttgtat attacattgt gcgaatttta atgtattatt ttcgacggta tttccgccga 14340
cgtcgtttgg tccgttagta cgtaaaatat ttgtagatgg tgtaccgttt gtagtatcga 14400
cgggttatca ttttcgtgaa ttaggtgtag tacataatca agatgtaaat ttacattcgt 14460
cgcgtttatc gtttaaagaa ttattagtat atgcggcgga tccggcgatg catgcggcgt 14520
cgggtaattt attattagat aaacgtacga cgtgtttttc ggtagcggcg ttaacgaata 14580
atgtagcgtt tcaaacggta aaaccgggta attttaataa agatttttat gattttgcgg 14640
tatcgaaagg tttttttaaa gaaggttcgt cggtagaatt aaaacatttt ttttttgcgc 14700
aagatggtaa tgcggcgata tcggattatg attattatcg ttataattta ccgacgatgt 14760
gtgatatacg tcaattatta tttgtagtag aagtagtaga taaatatttt gattgttatg 14820
atggtggttg tataaatgcg aatcaagtaa tagtaaataa tttagataaa tcggcgggtt 14880
ttccgtttaa taaatggggt aaagcgcgtt tatattatga ttcgatgtcg tatgaagatc 14940
aagatgcgtt atttgcgtat acgaaacgta atgtaatacc gacgataacg caaatgaatt 15000
taaaatatgc gatatcggcg aaaaatcgtg cgcgtacggt agcgggtgta tcgatatgtt 15060
cgacgatgac gaatcgtcaa tttcatcaaa aattattaaa atcgatagcg gcgacgcgtg 15120
gtgcgacggt agtaataggt acgtcgaaat tttatggtgg ttggcataat atgttaaaaa 15180
cggtatattc ggatgtagaa acgccgcatt taatgggttg ggattatccg aaatgtgatc 15240
gtgcgatgcc gaatatgtta cgtataatgg cgtcgttagt attagcgcgt aaacataata 15300
cgtgttgtaa tttatcgcat cgtttttatc gtttagcgaa tgaatgtgcg caagtattat 15360
cggaaatggt aatgtgtggt ggttcgttat atgtaaaacc gggtggtacg tcgtcgggtg 15420
atgcgacgac ggcgtatgcg aattcggtat ttaatatatg tcaagcggta acggcgaatg 15480
taaatgcgtt attatcgacg gatggtaata aaatagcgga taaatatgta cgtaatttac 15540
aacatcgttt atatgaatgt ttatatcgta atcgtgatgt agatcatgaa tttgtagatg 15600
aattttatgc gtatttacgt aaacattttt cgatgatgat attatcggat gatgcggtag 15660
tatgttataa ttcgaattat gcggcgcaag gtttagtagc gtcgataaaa aattttaaag 15720
cggtattata ttatcaaaat aatgtattta tgtcggaagc gaaatgttgg acggaaacgg 15780
atttaacgaa aggtccgcat gaattttgtt cgcaacatac gatgttagta aaacaaggtg 15840
atgattatgt atatttaccg tatccggatc cgtcgcgtat attaggtgcg ggttgttttg 15900
tagatgatat agtaaaaacg gatggtacgt taatgataga acgttttgta tcgttagcga 15960
tagatgcgta tccgttaacg aaacatccga atcaagaata tgcggatgta tttcatttat 16020
atttacaata tatacgtaaa ttacatgatg aattaacggg tcatatgtta gatatgtatt 16080
cggtaatgtt aacgaatgat aatacgtcgc gttattggga accggaattt tatgaagcga 16140
tgtatacgcc gcatacggta ttacaagcgg taggtgcgtg tgtattatgt aattcgcaaa 16200
cgtcgttacg ttgtggtgcg tgtatacgtc gtccgttttt atgttgtaaa tgttgttatg 16260
atcatgtaat atcgacgtcg cataaattag tattatcggt aaatccgtat gtatgtaatg 16320
cgccgggttg tgatgtaacg gatgtaacgc aattatattt aggtggtatg tcgtattatt 16380
gtaaatcgca taaaccgccg atatcgtttc cgttatgtgc gaatggtcaa gtatttggtt 16440
tatataaaaa tacgtgtgta ggttcggata atgtaacgga ttttaatgcg atagcgacgt 16500
gtgattggac gaatgcgggt gattatatat tagcgaatac gtgtacggaa cgtttaaaat 16560
tatttgcggc ggaaacgtta aaagcgacgg aagaaacgtt taaattatcg tatggtatag 16620
cgacggtacg tgaagtatta tcggatcgtg aattacattt atcgtgggaa gtaggtaaac 16680
cgcgtccgcc gttaaatcgt aattatgtat ttacgggtta tcgtgtaacg aaaaattcga 16740
aagtacaaat aggtgaatat acgtttgaaa aaggtgatta tggtgatgcg gtagtatatc 16800
gtggtacgac gacgtataaa ttaaatgtag gtgattattt tgtattaacg tcgcatacgg 16860
taatgccgtt atcggcgccg acgttagtac cgcaagaaca ttatgtacgt ataacgggtt 16920
tatatccgac gttaaatata tcggatgaat tttcgtcgaa tgtagcgaat tatcaaaaag 16980
taggtatgca aaaatattcg acgttacaag gtccgccggg tacgggtaaa tcgcattttg 17040
cgataggttt agcgttatat tatccgtcgg cgcgtatagt atatacggcg tgttcgcatg 17100
cggcggtaga tgcgttatgt gaaaaagcgt taaaatattt accgatagat aaatgttcgc 17160
gtataatacc ggcgcgtgcg cgtgtagaat gttttgataa atttaaagta aattcgacgt 17220
tagaacaata tgtattttgt acggtaaatg cgttaccgga aacgacggcg gatatagtag 17280
tatttgatga aatatcgatg gcgacgaatt atgatttatc ggtagtaaat gcgcgtttac 17340
gtgcgaaaca ttatgtatat ataggtgatc cggcgcaatt accggcgccg cgtacgttat 17400
taacgaaagg tacgttagaa ccggaatatt ttaattcggt atgtcgttta atgaaaacga 17460
taggtccgga tatgttttta ggtacgtgtc gtcgttgtcc ggcggaaata gtagatacgg 17520
tatcggcgtt agtatatgat aataaattaa aagcgcataa agataaatcg gcgcaatgtt 17580
ttaaaatgtt ttataaaggt gtaataacgc atgatgtatc gtcggcgata aatcgtccgc 17640
aaataggtgt agtacgtgaa tttttaacgc gtaatccggc gtggcgtaaa gcggtattta 17700
tatcgccgta taattcgcaa aatgcggtag cgtcgaaaat attaggttta ccgacgcaaa 17760
cggtagattc gtcgcaaggt tcggaatatg attatgtaat atttacgcaa acgacggaaa 17820
cggcgcattc gtgtaatgta aatcgtttta atgtagcgat aacgcgtgcg aaaataggta 17880
tattatgtat aatgtcggat cgtgatttat atgataaatt acaatttacg tcgttagaaa 17940
taccgcgtcg taatgtagcg acgttacaag cggaaaatgt aacgggttta tttaaagatt 18000
gttcgaaaat aataacgggt ttacatccga cgcaagcgcc gacgcattta tcggtagata 18060
taaaatttaa aacggaaggt ttatgtgtag atataccggg tataccgaaa gatatgacgt 18120
atcgtcgttt aatatcgatg atgggtttta aaatgaatta tcaagtaaat ggttatccga 18180
atatgtttat aacgcgtgaa gaagcgatac gtcatgtacg tgcgtggata ggttttgatg 18240
tagaaggttg tcatgcgacg cgtgatgcgg taggtacgaa tttaccgtta caattaggtt 18300
tttcgacggg tgtaaattta gtagcggtac cgacgggtta tgtagatacg gaaaataata 18360
cggaatttac gcgtgtaaat gcgaaaccgc cgccgggtga tcaatttaaa catttaatac 18420
cgttaatgta taaaggttta ccgtggaatg tagtacgtat aaaaatagta caaatgttat 18480
cggatacgtt aaaaggttta tcggatcgtg tagtatttgt attatgggcg catggttttg 18540
aattaacgtc gatgaaatat tttgtaaaaa taggtccgga acgtacgtgt tgtttatgtg 18600
ataaacgtgc gacgtgtttt tcgacgtcgt cggatacgta tgcgtgttgg aatcattcgg 18660
taggttttga ttatgtatat aatccgttta tgatagatgt acaacaatgg ggttttacgg 18720
gtaatttaca atcgaatcat gatcaacatt gtcaagtaca tggtaatgcg catgtagcgt 18780
cgtgtgatgc gataatgacg cgttgtttag cggtacatga atgttttgta aaacgtgtag 18840
attggtcggt agaatatccg ataataggtg atgaattacg tgtaaattcg gcgtgtcgta 18900
aagtacaaca tatggtagta aaatcggcgt tattagcgga taaatttccg gtattacatg 18960
atataggtaa tccgaaagcg ataaaatgtg taccgcaagc ggaagtagaa tggaaatttt 19020
atgatgcgca accgtgttcg gataaagcgt ataaaataga agaattattt tattcgtatg 19080
cgacgcatca tgataaattt acggatggtg tatgtttatt ttggaattgt aatgtagatc 19140
gttatccggc gaatgcgata gtatgtcgtt ttgatacgcg tgtattatcg aatttaaatt 19200
taccgggttg tgatggtggt tcgttatatg taaataaaca tgcgtttcat acgccggcgt 19260
ttgataaatc ggcgtttacg aatttaaaac aattaccgtt tttttattat tcggattcgc 19320
cgtgtgaatc gcatggtaaa caagtagtat cggatataga ttatgtaccg ttaaaatcgg 19380
cgacgtgtat aacgcgttgt aatttaggtg gtgcggtatg tcgtcatcat gcgaatgaat 19440
atcgtcaata tttagatgcg tataatatga tgatatcggc gggtttttcg ttatggatat 19500
ataaacaatt tgatacgtat aatttatgga atacgtttac gcgtttacaa tcgttagaaa 19560
atgtagcgta taatgtagta aataaaggtc attttgatgg tcatgcgggt gaagcgccgg 19620
tatcgataat aaataatgcg gtatatacga aagtagatgg tatagatgta gaaatatttg 19680
aaaataaaac gacgttaccg gtaaatgtag cgtttgaatt atgggcgaaa cgtaatataa 19740
aaccggtacc ggaaataaaa atattaaata atttaggtgt agatatagcg gcgaatacgg 19800
taatatggga ttataaacgt gaagcgccgg cgcatgtatc gacgataggt gtatgtacga 19860
tgacggatat agcgaaaaaa ccgacggaat cggcgtgttc gtcgttaacg gtattatttg 19920
atggtcgtgt agaaggtcaa gtagatttat ttcgtaatgc gcgtaatggt gtattaataa 19980
cggaaggttc ggtaaaaggt ttaacgccgt cgaaaggtcc ggcgcaagcg tcggtaaatg 20040
gtgtaacgtt aataggtgaa tcggtaaaaa cgcaatttaa ttattttaaa aaagtagatg 20100
gtataataca acaattaccg gaaacgtatt ttacgcaatc gcgtgattta gaagatttta 20160
aaccgcgttc gcaaatggaa acggattttt tagaattagc gatggatgaa tttatacaac 20220
gttataaatt agaaggttat gcgtttgaac atatagtata tggtgatttt tcgcatggtc 20280
aattaggtgg tttacattta atgataggtt tagcgaaacg ttcgcaagat tcgccgttaa 20340
aattagaaga ttttataccg atggattcga cggtaaaaaa ttattttata acggatgcgc 20400
aaacgggttc gtcgaaatgt gtatgttcgg taatagattt attattagat gattttgtag 20460
aaataataaa atcgcaagat ttatcggtaa tatcgaaagt agtaaaagta acgatagatt 20520
atgcggaaat atcgtttatg ttatggtgta aagatggtca tgtagaaacg ttttatccga 20580
aattacaagc gtcgcaagcg tggcaaccgg gtgtagcgat gccgaattta tataaaatgc 20640
aacgtatgtt attagaaaaa tgtgatttac aaaattatgg tgaaaatgcg gtaataccga 20700
aaggtataat gatgaatgta gcgaaatata cgcaattatg tcaatattta aatacgttaa 20760
cgttagcggt accgtataat atgcgtgtaa tacattttgg tgcgggttcg gataaaggtg 20820
tagcgccggg tacggcggta ttacgtcaat ggttaccgac gggtacgtta ttagtagatt 20880
cggatttaaa tgattttgta tcggatgcgg attcgacgtt aataggtgat tgtgcgacgg 20940
tacatacggc gaataaatgg gatttaataa tatcggatat gtatgatccg cgtacgaaac 21000
atgtaacgaa agaaaatgat tcgaaagaag gtttttttac gtatttatgt ggttttataa 21060
aacaaaaatt agcgttaggt ggttcgatag cggtaaaaat aacggaacat tcgtggaatg 21120
cggatttata taaattaatg ggtcattttt cgtggtggac ggcgtttgta acgaatgtaa 21180
atgcgtcgtc gtcggaagcg tttttaatag gtgcgaatta tttaggtaaa ccgaaagaac 21240
aaatagatgg ttatacgatg catgcgaatt atatattttg gcgtaatacg aatccgatac 21300
aattatcgtc gtattcgtta tttgatatgt cgaaatttcc gttaaaatta cgtggtacgg 21360
cggtaatgtc gttaaaagaa aatcaaataa atgatatgat atattcgtta ttagaaaaag 21420
gtcgtttaat aatacgtgaa aataatcgtg tagtagtatc gtcggatata ttagtaaata 21480
attaaacgaa catgtttata tttttattat ttttaacgtt aacgtcgggt tcggatttag 21540
atcgttgtac gacgtttgat gatgtacaag cgccgaatta tacgcaacat acgtcgtcga 21600
tgcgtggtgt atattatccg gatgaaatat ttcgttcgga tacgttatat ttaacgcaag 21660
atttattttt accgttttat tcgaatgtaa cgggttttca tacgataaat catacgtttg 21720
gtaatccggt aataccgttt aaagatggta tatattttgc ggcgacggaa aaatcgaatg 21780
tagtacgtgg ttgggtattt ggttcgacga tgaataataa atcgcaatcg gtaataataa 21840
taaataattc gacgaatgta gtaatacgtg cgtgtaattt tgaattatgt gataatccgt 21900
tttttgcggt atcgaaaccg atgggtacgc aaacgcatac gatgatattt gataatgcgt 21960
ttaattgtac gtttgaatat atatcggatg cgttttcgtt agatgtatcg gaaaaatcgg 22020
gtaattttaa acatttacgt gaatttgtat ttaaaaataa agatggtttt ttatatgtat 22080
ataaaggtta tcaaccgata gatgtagtac gtgatttacc gtcgggtttt aatacgttaa 22140
aaccgatatt taaattaccg ttaggtataa atataacgaa ttttcgtgcg atattaacgg 22200
cgttttcgcc ggcgcaagat atatggggta cgtcggcggc ggcgtatttt gtaggttatt 22260
taaaaccgac gacgtttatg ttaaaatatg atgaaaatgg tacgataacg gatgcggtag 22320
attgttcgca aaatccgtta gcggaattaa aatgttcggt aaaatcgttt gaaatagata 22380
aaggtatata tcaaacgtcg aattttcgtg tagtaccgtc gggtgatgta gtacgttttc 22440
cgaatataac gaatttatgt ccgtttggtg aagtatttaa tgcgacgaaa tttccgtcgg 22500
tatatgcgtg ggaacgtaaa aaaatatcga attgtgtagc ggattattcg gtattatata 22560
attcgacgtt tttttcgacg tttaaatgtt atggtgtatc ggcgacgaaa ttaaatgatt 22620
tatgtttttc gaatgtatat gcggattcgt ttgtagtaaa aggtgatgat gtacgtcaaa 22680
tagcgccggg tcaaacgggt gtaatagcgg attataatta taaattaccg gatgatttta 22740
tgggttgtgt attagcgtgg aatacgcgta atatagatgc gacgtcgacg ggtaattata 22800
attataaata tcgttattta cgtcatggta aattacgtcc gtttgaacgt gatatatcga 22860
atgtaccgtt ttcgccggat ggtaaaccgt gtacgccgcc ggcgttaaat tgttattggc 22920
cgttaaatga ttatggtttt tatacgacga cgggtatagg ttatcaaccg tatcgtgtag 22980
tagtattatc gtttgaatta ttaaatgcgc cggcgacggt atgtggtccg aaattatcga 23040
cggatttaat aaaaaatcaa tgtgtaaatt ttaattttaa tggtttaacg ggtacgggtg 23100
tattaacgcc gtcgtcgaaa cgttttcaac cgtttcaaca atttggtcgt gatgtatcgg 23160
attttacgga ttcggtacgt gatccgaaaa cgtcggaaat attagatata tcgccgtgtg 23220
cgtttggtgg tgtatcggta ataacgccgg gtacgaatgc gtcgtcggaa gtagcggtat 23280
tatatcaaga tgtaaattgt acggatgtat cgacggcgat acatgcggat caattaacgc 23340
cggcgtggcg tatatattcg acgggtaata atgtatttca aacgcaagcg ggttgtttaa 23400
taggtgcgga acatgtagat acgtcgtatg aatgtgatat accgataggt gcgggtatat 23460
gtgcgtcgta tcatacggta tcgttattac gttcgacgtc gcaaaaatcg atagtagcgt 23520
atacgatgtc gttaggtgcg gattcgtcga tagcgtattc gaataatacg atagcgatac 23580
cgacgaattt ttcgatatcg ataacgacgg aagtaatgcc ggtatcgatg gcgaaaacgt 23640
cggtagattg taatatgtat atatgtggtg attcgacgga atgtgcgaat ttattattac 23700
aatatggttc gttttgtacg caattaaatc gtgcgttatc gggtatagcg gcggaacaag 23760
atcgtaatac gcgtgaagta tttgcgcaag taaaacaaat gtataaaacg ccgacgttaa 23820
aatattttgg tggttttaat ttttcgcaaa tattaccgga tccgttaaaa ccgacgaaac 23880
gttcgtttat agaagattta ttatttaata aagtaacgtt agcggatgcg ggttttatga 23940
aacaatatgg tgaatgttta ggtgatataa atgcgcgtga tttaatatgt gcgcaaaaat 24000
ttaatggttt aacggtatta ccgccgttat taacggatga tatgatagcg gcgtatacgg 24060
cggcgttagt atcgggtacg gcgacggcgg gttggacgtt tggtgcgggt gcggcgttac 24120
aaataccgtt tgcgatgcaa atggcgtatc gttttaatgg tataggtgta acgcaaaatg 24180
tattatatga aaatcaaaaa caaatagcga atcaatttaa taaagcgata tcgcaaatac 24240
aagaatcgtt aacgacgacg tcgacggcgt taggtaaatt acaagatgta gtaaatcaaa 24300
atgcgcaagc gttaaatacg ttagtaaaac aattatcgtc gaattttggt gcgatatcgt 24360
cggtattaaa tgatatatta tcgcgtttag ataaagtaga agcggaagta caaatagatc 24420
gtttaataac gggtcgttta caatcgttac aaacgtatgt aacgcaacaa ttaatacgtg 24480
cggcggaaat acgtgcgtcg gcgaatttag cggcgacgaa aatgtcggaa tgtgtattag 24540
gtcaatcgaa acgtgtagat ttttgtggta aaggttatca tttaatgtcg tttccgcaag 24600
cggcgccgca tggtgtagta tttttacatg taacgtatgt accgtcgcaa gaacgtaatt 24660
ttacgacggc gccggcgata tgtcatgaag gtaaagcgta ttttccgcgt gaaggtgtat 24720
ttgtatttaa tggtacgtcg tggtttataa cgcaacgtaa ttttttttcg ccgcaaataa 24780
taacgacgga taatacgttt gtatcgggta attgtgatgt agtaataggt ataataaata 24840
atacggtata tgatccgtta caaccggaat tagattcgtt taaagaagaa ttagataaat 24900
attttaaaaa tcatacgtcg ccggatgtag atttaggtga tatatcgggt ataaatgcgt 24960
cggtagtaaa tatacaaaaa gaaatagatc gtttaaatga agtagcgaaa aatttaaatg 25020
aatcgttaat agatttacaa gaattaggta aatatgaaca atatataaaa tggccgtggt 25080
atgtatggtt aggttttata gcgggtttaa tagcgatagt aatggtaacg atattattat 25140
gttgtatgac gtcgtgttgt tcgtgtttaa aaggtgcgtg ttcgtgtggt tcgtgttgta 25200
aatttgatga agatgattcg gaaccggtat taaaaggtgt aaaattacat tatacgtaaa 25260
cgaacttatg gatttgttta tgagattttt tactcttaga tcaattactg cacagccagt 25320
aaaaattgac aatgcttctc ctgcaagtac tgttcatgct acagcaacga taccgctaca 25380
agcctcactc cctttcggat ggcttgttat tggcgttgca tttcttgctg tttttcagag 25440
cgctaccaaa ataattgcgc tcaataaaag atggcagcta gccctttata agggcttcca 25500
gttcatttgc aatttactgc tgctatttgt taccatctat tcacatcttt tgcttgtcgc 25560
tgcaggtatg gaggcgcaat ttttgtacct ctatgccttg atatattttc tacaatgcat 25620
caacgcatgt agaattatta tgagatgttg gctttgttgg aagtgcaaat ccaagaaccc 25680
attactttat gatgccaact actttgtttg ctggcacaca cataactatg actactgtat 25740
accatataac agtgtcacag atacaattgt cgttactgaa ggtgacggca tttcaacacc 25800
aaaactcaaa gaagactacc aaattggtgg ttattctgag gataggcact caggtgttaa 25860
agactatgtc gttgtacatg gctatttcac cgaagtttac taccagcttg agtctacaca 25920
aattactaca gacactggta ttgaaaatgc tacattcttc atctttaaca agcttgttaa 25980
agacccaccg aatgtgcaaa tacacacaat cgacggctct tcaggagttg ctaatccagc 26040
aatggatcca atttatgatg agccgacgac gactactagc gtgcctttgt aagcacaaga 26100
aagtgagtac gaacttatgt actcattcgt ttcggaagaa acaggtacgt taatagttaa 26160
tagcgtactt ctttttcttg ctttcgtggt attcttgcta gtcacactag ccatccttac 26220
tgcgcttcga ttgtgtgcgt actgctgcaa tattgttaac gtgagtttag taaaaccaac 26280
ggtttacgtc tactcgcgtg ttaaaaatct gaactcttct gaaggagttc ctgatcttct 26340
ggtctaaacg aactaactat tattattatt ctgtttggaa ctttaacatt gcttatcatg 26400
gcggataatg gtacgataac ggtagaagaa ttaaaacaat tattagaaca atggaattta 26460
gtaataggtt ttttattttt agcgtggata atgttattac aatttgcgta ttcgaatcgt 26520
aatcgttttt tatatataat aaaattagta tttttatggt tattatggcc ggtaacgtta 26580
gcgtgttttg tattagcggc ggtatatcgt ataaattggg taacgggtgg tatagcgata 26640
gcgatggcgt gtatagtagg tttaatgtgg ttatcgtatt ttgtagcgtc gtttcgttta 26700
tttgcgcgta cgcgttcgat gtggtcgttt aatccggaaa cgaatatatt attaaatgta 26760
ccgttacgtg gtacgatagt aacgcgtccg ttaatggaat cggaattagt aataggtgcg 26820
gtaataatac gtggtcattt acgtatggcg ggtcattcgt taggtcgttg tgatataaaa 26880
gatttaccga aagaaataac ggtagcgacg tcgcgtacgt tatcgtatta taaattaggt 26940
gcgtcgcaac gtgtaggtac ggattcgggt tttgcggcgt ataatcgtta tcgtataggt 27000
aattataaat taaatacgga tcatgcgggt tcgaatgata atatagcgtt attagtacaa 27060
taagtgacaa cagatgtttc atcttgttga cttccaggtt acaatagcag agatattgat 27120
tatcattatg aggactttca ggattgctat ttggaatctt gacgttataa taagttcaat 27180
agtgagacaa ttatttaagc ctctaactaa gaagaattat tcggagttag atgatgaaga 27240
acctatggag ttagattatc cataaaacga acatgaaaat tattctcttc ctgacattga 27300
ttgtatttac atcttgcgag ctatatcact atcaggagtg tgttagaggt acgactgtac 27360
tactaaaaga accttgccca tcaggaacat acgagggcaa ttcaccattt caccctcttg 27420
ctgacaataa atttgcacta acttgcacta gcacacactt tgcttttgct tgtgctgacg 27480
gtactcgaca tacctatcag ctgcgtgcaa gatcagtttc accaaaactt ttcatcagac 27540
aagaggaggt tcaacaagag ctctactcgc cactttttct cattgttgct gctctagtat 27600
ttttaatact ttgcttcacc attaagagaa agacagaatg aatgagctca ctttaattga 27660
cttctatttg tgctttttag cctttctgct attccttgtt ttaataatgc ttattatatt 27720
ttggttttca ctcgaaatcc aggatctaga agaaccttgt accaaagtct aaacgaacat 27780
gaaacttctc attgttttga cttgtatttc tctatgcagt tgcatatgca ctgtagtaca 27840
gcgctgtgca tctaataaac ctcatgtgct tgaagatcct tgtaaggtac aacactaggg 27900
gtaatactta tagcactgct tggctttgtg ctctaggaaa ggttttacct tttcatagat 27960
ggcacactat ggttcaaaca tgcacaccta atgttactat caactgtcaa gatccagctg 28020
gtggtgcgct tatagctagg tgttggtacc ttcatgaagg tcaccaaact gctgcattta 28080
gagacgtact tgttgtttta aataaacgaa caaattaaaa tgtctgataa tggaccccaa 28140
tcaaaccaac gtagtgcccc ccgcattaca tttggtggac ccacagattc aactgacaat 28200
aaccagaatg gaggacgcaa tggggcaagg ccaaaacagc gccgacccca aggtttaccc 28260
aataatactg cgtcttggtt cacagctctc actcagcatg gcaaggagga acttagattc 28320
cctcgaggcc agggcgttcc aatcaacacc aatagtggtc cagatgacca aattggctac 28380
taccgaagag ctacccgacg agttcgtggt ggtgacggca aaatgaaaga gctcagcccc 28440
agatggtact tctattacct aggaactggc ccagaagctt cacttcccta cggcgctaac 28500
aaagaaggca tcgtatgggt tgcaactgag ggagccttga atacacccaa agaccacatt 28560
ggcacccgca atcctaataa caatgctgcc accgtgctac aacttcctca aggaacaaca 28620
ttgccaaaag gcttctacgc agagggaagc agaggcggca gtcaagcctc ttctcgctcc 28680
tcatcacgta gtcgcggtaa ttcaagaaat tcaactcctg gcagcagtag gggaaattct 28740
cctgctcgaa tggctagcgg aggtggtgaa actgccctcg cgctattgct gctagacaga 28800
ttgaaccagc ttgagagcaa agtttctggt aaaggccaac aacaacaagg ccaaactgtc 28860
actaagaaat ctgctgctga ggcatctaaa aagcctcgcc aaaaacgtac tgccacaaaa 28920
cagtacaacg tcactcaagc atttgggaga cgtggtccag aacaaaccca aggaaatttc 28980
ggggaccaag acctaatcag acaaggaact gattacaaac attggccgca aattgcacaa 29040
tttgctccaa gtgcctctgc attctttgga atgtcacgca ttggcatgga agtcacacct 29100
tcgggaacat ggctgactta tcatggagcc attaaattgg atgacaaaga tccacaattc 29160
aaagacaacg tcatactgct gaacaagcac attgacgcat acaaaacatt cccaccaaca 29220
gagcctaaaa aggacaaaaa gaaaaagact gatgaagctc agcctttgcc gcagagacaa 29280
aagaagcagc ccactgtgac tcttcttcct gcggctgaca tggatgattt ctccagacaa 29340
cttcaaaatt ccatgagtgg agcttctgct gattcaactc aggcataaac actcatgatg 29400
accacacaag gcagatgggc tatgtaaacg ttttcgcaat tccgtttacg atacatagtc 29460
tactcttgtg cagaatgaat tctcgtaact aaacagcaca agtaggttta gttaacttta 29520
atctcacata gcaatcttta atcaatgtgt aacattaggg aggacttgaa agagccacca 29580
cattttcatc gaggccacgc ggagtacgat cgagggtaca gtgaataatg ctagggagag 29640
ctgcctatat ggaagagccc taatgtgtaa aattaatttt agtagtgcta tccccatgtg 29700
attttaatag cttcttagga gaatgacaaa aaaaaaaaaa aaaaaaaaaa a 29751
<210> 42
<211> 29751
<212> DNA
<213> Unknown
<220>
<223> synthetic
<400> 42
atattaggtt tttacctacc caggaaaagc caaccaacct cgatctcttg tagatctgtt 60
ctctaaacga actttaaaat ctgtgtagct gtcgctcggc tgcatgccta gtgcacctac 120
gcagtataaa caataataaa ttttactgtc gttgacaaga aacgagtaac tcgtccctct 180
tctgcagact gcttacggtt tcgtccgtgt tgcagtcgat catcagcata cctaggtttc 240
gtccgggtgt gaccgaaagg taagatggag tcattagtgt taggcgttaa cgaaaaaact 300
cacgttcaat tgtcactacc agtgttacag gttagagacg tactcgttag ggggttcggt 360
gattcagtcg aagaggcact atccgaagct agagagcatc ttaaaaacgg tacatgcgga 420
ttagtcgaac tcgaaaaagg cgtactacca caattggagc aaccatacgt ttttattaaa 480
cggtctgacg cacttagtac taatcacggt cataaggtag tcgagttagt cgccgaaatg 540
gacggtattc aatacggtag gtcaggtatt acactcggag tgttagtgcc acacgtaggc 600
gaaacaccta tcgcttatcg taacgttcta ttgcgtaaaa acggtaataa gggcgcaggc 660
ggacattcat acggtatcga tcttaagtca tacgatttag gcgacgaact cggtacggat 720
ccaatcgaag attacgaaca gaattggaat actaaacacg gatctggcgc attacgcgaa 780
cttacacgcg aacttaacgg aggcgcagtg actagatacg tcgataataa tttttgcggt 840
ccagacggat atccactcga ttgtattaag gattttctcg ctagggcagg taagtctatg 900
tgtacactta gcgaacaact cgattatatc gaatctaaaa gaggcgtata ttgttgtcgc 960
gatcacgaac acgaaatcgc ttggtttact gagcgatctg ataagtcata cgaacatcag 1020
actccattcg aaattaagtc tgctaaaaaa ttcgatactt ttaaaggcga atgtcctaaa 1080
ttcgtttttc cacttaactc taaggttaag gttattcaac ctagagtcga aaaaaaaaaa 1140
actgagggtt ttatgggtag gattaggtca gtgtatccag tcgctagtcc acaagagtgt 1200
aataatatgc atctatctac acttatgaaa tgtaatcatt gtgacgaagt gtcatggcaa 1260
acatgcgatt tccttaaggc tacatgcgaa cattgcggta ccgaaaatct cgtaatcgag 1320
ggacctacta catgcggata cttacctact aacgcagtcg ttaaaatgcc atgtccagct 1380
tgtcaggatc cagagatagg tccagagcat agcgttgccg attatcataa tcattctaat 1440
atcgaaacta gattgcgtaa aggcggtagg acacgttgtt tcggcggatg cgtattcgca 1500
tacgtaggtt gttataataa gagagcgtat tgggtgccta gagctagtgc cgatatcggt 1560
agcggacata ccggtattac aggcgataac gttgagacac ttaacgagga tctgttagag 1620
attctatcac gcgaacgcgt taatattaac atagtcggcg attttcatct taacgaagag 1680
gtcgctatta tactcgctag tttttccgct agtacatccg cttttatcga tactattaag 1740
tctcttgact ataagtcttt taaaactatc gttgagtcat gcggtaatta taaggttact 1800
aagggtaagc cagtgaaagg cgcatggaat atcggtcagc aacgttcagt gcttacacca 1860
ctatgcggtt ttcctagtca agccgcaggc gtaattagat ctattttcgc acgtacactt 1920
gacgctgcta atcattctat tcccgatctg caacgtgctg ccgttacgat actcgacggt 1980
attagcgaac agtcacttag actcgttgac gctatggtgt atacatccga tctgttaacg 2040
aatagtgtga ttattatggc ttacgttaca ggcggattag tgcaacagac tagtcaatgg 2100
ttgtctaatc tgttaggtac tacagtcgaa aaattgcgac ctattttcga atggattgag 2160
gctaaattgt ctgccggagt cgaattcctt aaagacgctt gggagatact taaatttctg 2220
attaccggcg tattcgatat cgttaagggt cagattcagg tcgctagcga taatattaag 2280
gattgcgtta agtgttttat cgacgtagtg aataaggcac tcgaaatgtg tatcgatcag 2340
gttacaattg ccggagctaa gcttagatca cttaacttag gcgaagtgtt tatcgctcaa 2400
tctaagggat tgtatcgtca atgtatacgc ggtaaggagc aattgcaatt gcttatgcca 2460
cttaaggctc ctaaagaggt tacattcctt gagggcgatt cacacgatac agtgcttact 2520
agcgaagagg ttgtgcttaa aaacggcgaa ctcgaagcac ttgagacacc agtcgattct 2580
tttactaacg gcgcaatcgt aggtacaccc gtatgcgtta acggtcttat gttgcttgag 2640
attaaggata aagagcaata ttgcgcactt agtccaggtc tgttagcgac taataacgtt 2700
tttagactta agggaggcgc acctattaaa ggcgttacat tcggtgagga tacagtttgg 2760
gaagtgcaag ggtataaaaa cgttaggatt acattcgaac tcgacgaacg tgtcgataag 2820
gtacttaacg aaaagtgtag cgtatataca gtcgaatccg gtactgaggt tactgagttc 2880
gcatgcgtag tcgctgaggc agtcgttaag acattgcaac cggttagcga tctgttaact 2940
aatatgggta tcgatcttga cgaatggtca gtcgctactt tttatctatt cgatgacgct 3000
ggcgaagaga atttttcgtc acgtatgtat tgttcttttt accctcctga cgaagaggaa 3060
gaggacgacg ctgaatgcga agaggaagag atagacgaaa catgcgaaca cgaatacggt 3120
acggaagacg attatcaggg attgccactc gaattcggcg ctagcgctga gactgttaga 3180
gtcgaagagg aagaggaaga ggattggtta gacgatacta ctgagcaatc cgaaatcgaa 3240
cccgaacccg aacctacacc tgaggaaccc gttaatcaat ttacagggta tcttaagctt 3300
accgataacg ttgcgattaa atgcgttgat atcgttaaag aggctcaatc cgctaatcct 3360
atggtaatcg ttaacgctgc taatatacat cttaagcatg gcggaggcgt tgcaggcgca 3420
cttaataagg ctactaacgg cgctatgcaa aaagagtctg acgattatat taagcttaac 3480
ggtccactta ccgtaggcgg atcatgtcta ttgtcaggtc ataatctcgc taaaaaatgt 3540
cttcacgtag tcggacctaa tcttaacgct ggcgaagaca tacaattgct taaagccgca 3600
tacgagaatt ttaattcgca agacatattg ctcgcaccac tgttatccgc aggtattttc 3660
ggagctaaac cattgcaatc attgcaggta tgcgttcaga cagtgcgtac acaggtatat 3720
atcgcagtta acgataaggc actatacgaa caggtcgtta tggattatct cgataatctt 3780
aagcctagag tcgaagctcc taaacaggaa gagccaccta atactgagga ttctaagact 3840
gaggaaaaat ccgttgtgca aaaaccagtc gacgttaagc ctaaaattaa ggcatgtatt 3900
gacgaagtga ctactacact tgaggagact aagtttctta ctaataagtt actgttattc 3960
gctgatatta acggtaagtt gtatcacgat tcacagaata tgcttagagg cgaagatatg 4020
tcttttctcg aaaaagacgc tccatatatg gtaggcgacg ttattacatc tggcgatatt 4080
acatgcgtag tgatacctag taaaaaagcc ggaggtacta ccgaaatgct atcacgtgca 4140
cttaaaaaag tgccagtcga cgaatacatt actacttatc ccggtcaggg atgcgcaggt 4200
tatacactcg aagaggctaa aaccgcactt aaaaaatgta aatccgcttt ttacgttctg 4260
ccatctgagg cacctaacgc taaagaggag atactcggta cagtgtcatg gaatttacgc 4320
gaaatgcttg cgcatgccga agagacacgt aagcttatgc ctatttgtat ggacgttagg 4380
gctattatgg ctactattca acgtaagtat aagggtatta agattcaaga gggtatagtc 4440
gattacggag tgagattttt tttttataca tctaaagagc cagtcgctag tattattact 4500
aagcttaact cacttaacga accattagtg actatgccta tcggatacgt tacacacggt 4560
tttaatctcg aagaggccgc tagatgtatg cgatcactta aggcaccagc cgtagtgtca 4620
gtgtcatcac ctgacgccgt tactacttat aacggatacc ttacatctag ttctaagact 4680
agtgaggaac atttcgttga gacagtgtca cttgccggtt catatcgcga ttggtcttat 4740
tcaggtcaac gtactgagtt aggcgttgag tttcttaaac gcggagataa gatagtgtat 4800
catacacttg agtcaccagt cgagtttcac ttagacggcg aagtgcttag tctcgataag 4860
cttaagtctc tattgtcact tagagaggtt aagactatta aagtgtttac tacagtcgat 4920
aatactaatc tgcatacaca gttagtcgat atgtctatga catacggtca gcaattcgga 4980
cctacttatc ttgacggtgc agacgttact aagattaagc ctcacgttaa tcacgaaggt 5040
aagacttttt tcgtattgcc atctgacgat acacttagat ccgaagcatt cgaatactat 5100
catacacttg acgaatcttt tctcggtagg tatatgtcag cacttaacca tacaaaaaaa 5160
tggaaattcc cacaggtagg cggacttaca tctattaaat gggccgataa taattgttat 5220
ctgtcatcag tgttactcgc attgcagcaa ctcgaagtga aatttaacgc tcctgcattg 5280
caagaggcat actatagggc tagagccggt gacgctgcta atttttgcgc acttatactc 5340
gcatactcta ataaaaccgt aggcgaactc ggtgacgtta gagagactat gacacatcta 5400
ttgcaacacg ctaatctcga atccgctaaa agagtgctta acgtagtgtg taaacattgc 5460
ggtcagaaaa ctactacact taccggagtc gaagccgtta tgtatatggg tacactatca 5520
tacgataatc ttaaaaccgg agtgtcaatt ccatgcgtat gcggtaggga cgctacacaa 5580
tacttagtgc aacaagagtc tagtttcgtt atgatgtcag ctccacctgc cgaatacaaa 5640
ttgcaacagg gtacattctt atgcgctaac gagtataccg gtaattatca atgcggtcat 5700
tatacacata ttaccgctaa agagacattg tatcgtatag acggtgcaca tcttactaaa 5760
atgtctgagt ataagggtcc agttactgac gttttttaca aagagactag ttatactact 5820
actattaaac cggttagtta taagttagac ggagtgactt ataccgaaat cgaacctaag 5880
ttagacggat actataaaaa agataacgct tattataccg aacagccaat cgatttagtg 5940
cctacacaac cattgcctaa cgctagtttc gataatttta agcttacatg ttctaatact 6000
aaattcgcag acgatcttaa tcagatgacc ggttttacta agcctgctag tagagagtta 6060
tccgttactt tttttcccga tcttaacggt gacgtagtcg caatcgatta tcgtcattac 6120
tctgctagtt ttaaaaaagg cgctaagcta ttgcataaac ctatcgtttg gcatattaat 6180
caggctacta ctaagactac ttttaaacct aatacttggt gtcttagatg tctttggtct 6240
actaagccag tcgatacatc taattcattc gaagtgcttg cagtcgagga tacacagggt 6300
atggataatc tcgcatgcga atcgcaacaa cctacatccg aagaggtagt cgagaatcct 6360
acaattcaga aagaggtaat cgaatgcgac gttaagacta ccgaagtggt aggtaacgtt 6420
atacttaaac cgtctgacga aggcgttaag gttacgcaag agttaggcca tgaggatctt 6480
atggccgcat acgttgagaa tacatctatt actattaaaa aacctaacga actatcactc 6540
gcattaggtc ttaagactat cgctacacac ggtatagccg ctattaattc ggttccatgg 6600
tctaagatac tcgcatacgt taagcctttt ctcggtcaag ccgctattac tacatctaat 6660
tgcgctaaac gacttgcgca acgcgttttt aataattata tgccatacgt ttttacattg 6720
ctttttcaat tgtgtacttt tactaagtct actaactcac gtatacgcgc tagtctacct 6780
actactatcg ctaaaaattc cgttaaatcc gttgcgaaat tgtgtcttga cgcaggtatt 6840
aattacgtta agtcacctaa attttctaaa ttgtttacaa tcgctatgtg gttactgtta 6900
ttgtctattt gtctcggttc attgatttgc gttaccgctg cattcggagt gttactatct 6960
aatttcggcg cacctagtta ttgtaacgga gtgagagagt tgtatctgaa tagttctaac 7020
gttactacta tggatttttg cgaaggatct tttccatgtt caatttgtct atctggtctc 7080
gattcactcg attcatatcc cgctctcgaa actattcagg ttacgattag ttcttataaa 7140
ctcgatctta ctatactcgg tctagccgct gaatgggtgt tagcgtatat gctttttact 7200
aagttttttt acttactcgg tctatccgct attatgcaag tgtttttcgg atatttcgct 7260
agtcatttta tttctaatag ttggcttatg tggtttatta tttcgattgt gcaaatggca 7320
ccagttagcg ctatggtacg tatgtatatt tttttcgcta gtttttacta tatttggaaa 7380
tcatacgttc atattatgga cggatgtaca tctagtacat gtatgatgtg ttataaacgt 7440
aatcgcgcta ctagagtcga gtgtactact atcgttaacg gtatgaaacg atctttttac 7500
gtttacgcta acggaggtag ggggttttgt aagactcata attggaattg tcttaattgc 7560
gatacttttt gtaccggtag tacttttatt tctgacgaag tcgcacgcga tctatcattg 7620
caatttaaac gtccaattaa ccctaccgat caatctagtt atatagtcga tagcgttgcg 7680
gttaaaaacg gcgcattgca tctatatttc gataaagccg gtcagaaaac atacgaacgt 7740
catccactat cacatttcgt taacttagac aatcttaggg ctaataatac taagggtagt 7800
ctgccaatta acgtaatcgt attcgacggt aagtctaaat gcgacgaatc cgctagtaag 7860
tctgctagtg tgtattactc tcagcttatg tgtcaaccta tactgttact cgatcaggca 7920
ttagtgtcag acgtaggcga tagtactgag gttagcgtta aaatgttcga cgcttacgtc 7980
gatactttta gcgctacatt ctcagtgcct atggagaaac ttaaggcatt agtcgctacc 8040
gctcattctg agttagcgaa aggcgttgcg ttagacggag tgctatctac attcgtatct 8100
gccgctagac agggcgtagt cgatactgac gtcgatacta aagacgtaat cgaatgtctt 8160
aagctatcac atcattccga tcttgaggtt acaggcgatt catgtaataa ttttatgctt 8220
acatataata aggtcgagaa tatgacacct agagacttag gcgcatgtat cgattgtaac 8280
gctagacata ttaacgctca ggttgcgaaa tcacataacg tatcattgat ttggaacgtt 8340
aaagactata tgtcactatc tgagcaattg cgtaaacaga tacgatccgc tgctaaaaaa 8400
aataatatac cgtttagact tacatgcgct actactagac aggtcgttaa cgttattact 8460
actaagatta gtcttaaggg aggtaagatc gttagtacat gttttaagct tatgcttaag 8520
gctacactgt tatgcgtact cgctgcactc gtatgttata tcgttatgcc agtgcataca 8580
ctatctattc acgacggata tactaacgaa attatcggat ataaggctat tcaagacgga 8640
gtgacacgcg atattattag tactgacgat tgtttcgcta ataaacacgc tggattcgac 8700
gcttggtttt cgcaacgcgg agggtcatat aaaaacgata agtcatgtcc agtcgttgcc 8760
gctattatta cacgcgaaat cggattcata gtgccagggt tacccggtac agtgttgcgt 8820
gctattaacg gcgatttttt gcattttctg ccacgcgttt ttagcgcagt cggtaatatt 8880
tgttatacac ctagtaagtt aatcgaatac tctgatttcg ctactagcgc atgcgtactt 8940
gccgctgagt gtactatttt taaagacgct atgggtaagc cagtgccata ttgttacgat 9000
actaatctgt tagagggatc tatttcatac tctgagttgc gacctgatac taggtacgta 9060
cttatggacg gatctattat tcaattccct aatacttatc ttgagggatc cgttagagtc 9120
gttactacat tcgacgctga gtattgtaga cacggtacat gcgaacgatc tgaggtcggt 9180
atttgtctat ctacatctgg tagatgggta cttaataacg aacattatcg cgcactatct 9240
ggcgtttttt gcggcgtaga cgctatgaat cttatcgcta atatttttac accattagtg 9300
caaccagtcg gcgcacttga cgtatccgct agcgtagtcg caggcggtat tatcgctata 9360
ctcgttacat gcgctgcata ctattttatg aaatttcgta gggtattcgg tgagtataat 9420
cacgtagtcg ctgctaacgc tctattattc cttatgtctt ttacgatact gtgtctcgta 9480
cctgcatact cttttctgcc aggcgtatac tctgtgtttt atctgtatct tacattttac 9540
tttactaacg acgtttcgtt tctcgcacat ctgcaatggt tcgctatgtt ttcacctata 9600
gtgccatttt ggattaccgc tatttacgtt ttttgtattt cgcttaagca ttgtcattgg 9660
ttttttaata attatttgcg taaacgcgtt atgtttaacg gagtgacttt ttcgacattc 9720
gaagaggccg cactttgtac ttttctgctt aataaagaga tgtatcttaa gttacggtct 9780
gagacactgt taccacttac acaatacaat aggtatctcg cactatataa taagtataag 9840
tatttttcag gcgcactcga tactacatct tatcgcgaag ccgcatgttg tcatctcgct 9900
aaagcgctta acgatttttc taactctggc gcagacgtac tgtatcaacc tccacaaaca 9960
tctattacgt ctgccgtact gcaatccggt tttcgtaaaa tggcttttcc atcaggtaag 10020
gtcgagggat gtatggtgca agttacatgc ggtactacta cacttaacgg tctatggtta 10080
gacgatacgg tttattgtcc tagacacgtt atttgtactg ccgaagatat gcttaaccct 10140
aattacgaag acttactgat acgtaaatct aatcactctt ttttagtgca agccggtaac 10200
gttcaattgc gcgttatcgg tcattctatg caaaattgtc tgttacgtct taaagtcgat 10260
acatctaatc ctaaaactcc taagtataaa ttcgttagga ttcaacccgg tcagacattc 10320
tcagtactcg catgttataa cggttcacct agcggagtgt atcaatgcgc tatgcgacct 10380
aatcatacaa ttaagggatc ttttcttaac ggttcatgcg gatcagtcgg ttttaatatc 10440
gattacgatt gcgttagttt ttgttatatg catcatatgg agttacctac aggcgtacac 10500
gctggtactg atcttgaggg taagttttac ggtccattcg ttgatcgtca aaccgctcaa 10560
gccgcaggta ccgatactac tattacactt aacgtactcg catggttata cgctgccgtt 10620
attaacggcg atagatggtt tcttaataga tttactacta cacttaacga ttttaactta 10680
gtcgctatga aatataatta cgaaccactt acacaggatc acgtcgatat actcggtcca 10740
cttagtgcgc aaaccggtat agccgtactc gatatgtgcg ctgcacttaa agagttactg 10800
caaaacggta tgaacggtag gactatactc ggtagtacta tactcgaaga cgaatttaca 10860
ccattcgacg tcgttagaca gtgttcaggc gttacatttc agggtaagtt taaaaaaatc 10920
gttaagggta cacatcattg gatgttgctt acattcctta ctagtctatt gatactcgta 10980
caatctacac aatggtcatt gttttttttc gtatacgaaa acgctttttt gccttttaca 11040
ctcggtatta tggctatagc cgcatgcgct atgttgttag tgaaacataa acacgcattc 11100
ttatgtctat tcctattgcc tagtctcgct acagtcgcat actttaatat ggtgtatatg 11160
cctgctagtt gggttatgcg tattatgact tggcttgagt tagccgatac atctctatct 11220
ggttatagac ttaaggattg cgttatgtac gctagtgcat tagtgttact gatacttatg 11280
actgcacgta cagtttacga cgacgctgct agacgcgttt ggacacttat gaacgttatt 11340
acacttgtgt ataaagtgta ttacggtaac gctctcgatc aggctattag tatgtgggca 11400
ttagtgatat ccgttacgtc taattactct ggagtcgtta cgactattat gtttctcgct 11460
agggctatcg tattcgtatg cgttgagtat tatccactat tgtttattac cggtaataca 11520
ttgcaatgta ttatgttagt gtattgtttt ttagggtatt gttgttgttg ttatttcgga 11580
ttgttttgtc tacttaatag gtattttaga cttacattag gcgtatacga ttatctcgtt 11640
agtacgcaag agtttagata tatgaattca cagggactgt taccacctaa atcttcaatc 11700
gacgctttta agcttaacat taagttactc ggtataggcg gtaagccttg tattaaggtt 11760
gcgacagtgc aatctaaaat gtctgacgtt aagtgtacta gtgtcgtact gttatcagtg 11820
ttacagcaat tgcgagtcga atctagttct aaattgtggg ctcaatgcgt tcaattgcat 11880
aacgatatct tactcgctaa ggatactact gaggcattcg aaaaaatggt tagtctgtta 11940
agcgtactgt tatctatgca aggcgcagtc gatattaatc gattatgcga agagatgtta 12000
gacaataggg ctacattgca ggctattgcg tcagagtttt ctagtctgcc atcatacgct 12060
gcatacgcta ccgctcaaga ggcatacgaa caggcagtcg ctaacggcga ttctgaggta 12120
gtgcttaaaa aacttaaaaa atcacttaac gttgcgaaat ctgagttcga tagagacgct 12180
gctatgcaac gtaaactcga aaaaatggcc gatcaggcta tgacacaaat gtataaacag 12240
gctagatctg aggataagcg tgctaaggtt acatccgcta tgcaaactat gttgtttact 12300
atgttgcgta aactcgataa cgacgcactt aacaatatta ttaataacgc tagagacgga 12360
tgcgtaccac ttaatattat accgcttact actgccgcta agcttatggt agtcgttccc 12420
gattacggta cttataagaa tacatgcgac ggtaatactt ttacatacgc tagtgcattg 12480
tgggagattc aacaggtcgt tgacgctgat tctaaaatcg ttcaattgtc tgagattaat 12540
atggataact cacctaatct cgcatggcca ttaatcgtta cagcgttacg cgctaactct 12600
gccgttaagt tacagaataa cgaattgtca ccagtcgcat tgcgtcaaat gtcatgcgct 12660
gccggtacta cacaaaccgc ttgtactgac gataacgctc tcgcatacta taataactct 12720
aaaggcggta gattcgtact cgcactatta tccgatcatc aggatcttaa atgggctaga 12780
ttccctaagt ctgacggtac aggtacaatt tataccgaac tcgaaccacc atgtagattc 12840
gttaccgata cacctaaggg acctaaggtt aagtatctat actttattaa gggactgaat 12900
aatctgaata ggggtatggt gttagggtca ctcgcagcta ccgttagatt gcaagccggt 12960
aacgctactg aggttcccgc taactcaacc gtacttagtt tttgcgcatt cgcagtcgat 13020
ccagctaagg cttataagga ttacttagct agcggaggtc aacctattac taattgcgtt 13080
aaaatgctat gtacacatac cggtacaggt caggctatta cggttacacc tgaggctaat 13140
atggatcagg agtcattcgg aggcgcatca tgttgtctat attgtagatg tcatatcgat 13200
catcctaatc ctaagggttt ttgcgatctt aagggtaagt acgttcagat tcctactaca 13260
tgcgctaacg atccagtcgg ttttacattg cgtaataccg tttgtacagt atgcggtatg 13320
tggaaaggtt acggatgttc atgcgatcag ttacgcgaac cacttatgca atccgctgac 13380
gctagtacat tccttaatgg gtttgcggtg taagtgccgc tagattgact ccatgcggta 13440
caggtactag tactgacgta gtgtatcgcg cattcgatat ttataacgaa aaggttgccg 13500
gattcgctaa attccttaag actaattgtt gtagatttca ggaaaaagac gaagagggta 13560
atctgttaga ctcatatttc gtagtgaaac gtcatactat gtctaattat caacacgaag 13620
agactattta taatctcgtt aaggattgtc cagccgttgc ggtacacgat ttttttaaat 13680
ttagagtcga cggtgatatg gtgccacata tttctagaca gagattgact aagtatacta 13740
tggccgatct agtttacgct cttagacatt tcgacgaagg taattgcgat acacttaaag 13800
agatactcgt tacatataat tgttgcgacg acgattactt taataaaaaa gattggtacg 13860
atttcgttga gaatcccgat atacttaggg tttacgctaa cttaggcgaa cgcgttagac 13920
agtcattgct taagacagtg caattttgcg acgctatgcg tgacgcaggt atagtcggcg 13980
tacttacact cgataatcag gatcttaacg gtaattggta cgatttcggc gatttcgttc 14040
aggtcgcacc aggttgcgga gtgcctatag tcgattcata ctattcattg cttatgccta 14100
tacttacact tacacgtgca cttgccgctg agtcacatat ggacgctgat ctcgctaaac 14160
cattgattaa atgggatcta cttaaatacg attttactga ggaacgattg tgtctattcg 14220
ataggtattt taagtattgg gatcagactt atcatcctaa ttgtattaat tgtcttgacg 14280
atagatgtat actgcattgc gctaatttta acgtattgtt ctcaaccgta ttcccaccta 14340
catcattcgg tccactcgta cgtaagattt tcgttgacgg cgtaccattc gtagtgtcaa 14400
ccggttatca ttttagagag ttaggcgtag tgcataatca ggacgttaat ctgcattcta 14460
gtagactatc ttttaaagag ttgttagtgt acgctgccga tccagctatg catgccgcta 14520
gcggtaatct gttactcgat aagcgtacta catgttttag cgttgccgca cttactaata 14580
acgttgcgtt tcagactgtt aaacccggta attttaataa ggatttttac gatttcgcag 14640
tgagtaaggg tttttttaaa gagggatcta gcgttgagct taagcatttt tttttcgctc 14700
aagacggtaa cgctgctatt agcgattacg attactatag atataatctg ccaactatgt 14760
gcgatatacg tcaattgttg ttcgtcgttg aggtagtcga taagtatttc gattgttacg 14820
acggaggttg tattaacgct aatcaggtaa tcgttaataa tctcgataag tctgccggat 14880
tcccattcaa taaatggggt aaggctagat tgtattacga ttctatgtca tacgaggatc 14940
aggacgctct attcgcatat actaagcgta acgttatacc gacaattacg caaatgaatc 15000
ttaaatacgc tattagcgct aaaaatcgtg cacgtacagt cgcaggcgta tcaatttgta 15060
gtactatgac taatcgtcaa tttcaccaaa aattgcttaa gtctattgcc gctactagag 15120
gcgctacagt cgttatcggt acatctaaat tttacggagg ttggcataat atgcttaaga 15180
cagtgtattc tgacgttgag actccacatc ttatgggttg ggattaccct aaatgcgata 15240
gggctatgcc taatatgttg cgtattatgg ctagtctcgt actcgcacgt aaacataata 15300
catgttgtaa tctatcacat agattctata gactcgctaa cgaatgcgct caagtgctta 15360
gcgaaatggt tatgtgtggc ggatcacttt acgttaagcc tggcggtaca tctagcggag 15420
acgctactac cgcttacgct aattccgttt ttaatatttg tcaagccgtt accgctaacg 15480
ttaacgctct attgtctact gacggtaata agattgccga taaatacgta cgtaatctgc 15540
aacatagatt gtacgaatgt ctgtatcgta atcgcgatgt cgatcacgaa ttcgttgacg 15600
aattttacgc ttacttacgt aaacattttt ctatgatgat tctatctgac gacgcagtcg 15660
tttgttataa ctctaattac gctgcacagg ggttagtcgc tagtattaag aattttaaag 15720
ccgtactgta ttatcagaat aacgttttta tgtctgaggc taagtgttgg accgaaaccg 15780
atctgactaa gggtccacac gaattttgtt cacagcatac tatgctcgtt aaacagggtg 15840
acgattacgt ttatctacca tatcccgatc cgtcacgtat attaggcgca ggttgtttcg 15900
ttgacgatat cgttaagact gacggtacac ttatgattga gagattcgtt agtctcgcaa 15960
tcgacgctta tccattgact aagcatccta atcaggaata cgctgacgtt tttcacttat 16020
acttacagta tatacgtaaa ttgcacgacg aacttacagg gcatatgctt gatatgtatt 16080
cggttatgct tactaacgat aatactagta ggtattggga acctgagttt tacgaagcta 16140
tgtatacacc acataccgta ctgcaagccg taggcgcatg cgtactatgt aattcacaga 16200
ctagtcttag atgtggcgca tgtatacgta gaccattctt atgttgtaag tgttgttacg 16260
atcacgttat tagtacatca cataagttag tgttatccgt taacccatac gtttgtaacg 16320
ctccaggttg cgacgttact gacgttacgc aattgtactt aggcggtatg tcatactatt 16380
gtaaatcaca taaacctcct attagttttc cgttatgcgc taacggtcag gtattcggtc 16440
tatataagaa tacatgcgta gggtctgata acgttaccga ttttaacgct atcgctacat 16500
gcgattggac taacgctggc gattatatac tcgctaatac atgtactgag cgacttaagt 16560
tattcgcagc cgaaacactt aaggctaccg aagagacttt taaattgtca tacggtatcg 16620
ctaccgtacg cgaagtgctt agcgatagag agttgcatct atcatgggag gtcggtaagc 16680
ctagaccacc acttaatcgt aattacgttt ttacagggta tcgggttact aagaattcga 16740
aagtgcaaat tggcgaatat acattcgaaa aaggcgatta cggtgacgcc gtagtgtata 16800
gaggtactac tacttataag cttaacgtag gcgattattt cgtacttaca tcacataccg 16860
ttatgccatt atccgctcct acattagtgc cacaagagca ttacgttagg attaccggat 16920
tgtatcctac acttaatatt tctgacgaat tttcatctaa cgttgcgaat tatcagaaag 16980
tgggtatgca aaaatactct acattgcagg gacctcccgg taccggtaag tctcatttcg 17040
caatcggact cgcattgtat tatcctagtg ctaggattgt gtataccgct tgttcacacg 17100
ctgcagtcga cgctctatgc gaaaaagctc ttaagtatct accaatcgat aagtgttcac 17160
gtattatacc cgctagggct agagtcgaat gtttcgataa gtttaaagtg aattcgacac 17220
tcgaacaata cgttttttgt acggttaacg ctctaccaga gactactgcc gatatcgtag 17280
tgttcgacga aatttctatg gctactaatt acgatctatc agtcgttaac gctagactta 17340
gggctaagca ttacgtttat ataggcgatc cagcgcaatt gcctgcacca cgtacattgt 17400
tgactaaggg tacactcgaa cctgagtatt ttaattcagt gtgtagactt atgaaaacta 17460
tcggacctga tatgtttctc ggtacatgtc gtagatgtcc tgccgaaata gtcgatacag 17520
ttagcgcact cgtatacgat aataagctta aggcacataa ggataagtct gcgcaatgtt 17580
ttaaaatgtt ttacaaaggc gtaattacac acgacgttag ttccgctatt aatagaccac 17640
agataggcgt agtgagagag tttcttacac gtaatcccgc ttggcgtaaa gccgttttta 17700
ttagtccata taactctcaa aacgcagtcg ctagtaagat actcggattg cctacacaga 17760
cagtcgattc tagtcagggt agcgaatacg attacgttat ttttacgcaa actaccgaaa 17820
ccgctcattc atgtaacgtt aatagattta acgttgcgat tactagggct aaaatcggta 17880
ttctatgtat tatgtctgat cgcgatctat acgataagtt gcaatttaca tcacttgaga 17940
tacctagacg taacgttgcg acattgcaag ccgaaaacgt taccggattg tttaaggatt 18000
gttctaagat tattaccgga ttgcatccta cacaggcacc tacacatcta tcagtcgata 18060
ttaagtttaa gactgagggt ctatgcgttg acatacccgg tatacctaag gatatgactt 18120
atcgtagatt gattagtatg atgggtttta aaatgaatta tcaggttaac ggttatccta 18180
atatgtttat tacacgcgaa gaggctatta gacacgttag ggcttggata gggttcgacg 18240
ttgagggatg tcacgctaca cgtgacgcag tcggtactaa tctgccattg caattagggt 18300
tttcgacagg cgttaatctg gttgccgtac ctaccggata cgtcgatact gagaataata 18360
ctgagtttac tagggttaac gctaaacctc cacctggcga tcaatttaaa catctgattc 18420
cacttatgta taagggattg ccttggaacg tagtgcgtat taagattgtg caaatgctta 18480
gcgatacact taagggattg tctgataggg ttgtgttcgt actttgggct cacggattcg 18540
aattgacatc tatgaaatat ttcgttaaaa tcggacctga gcgtacatgt tgtctatgcg 18600
ataagcgtgc tacatgtttt agtacatcta gcgatacata cgcttgttgg aatcattcag 18660
tcggattcga ttacgtttat aatcctttta tgattgacgt tcagcaatgg gggtttaccg 18720
gtaatctgca atctaatcac gatcagcatt gtcaggtaca cggtaacgct cacgttgcgt 18780
catgcgacgc tattatgact agatgtcttg ccgtacacga atgtttcgtt aagagagtcg 18840
attggtcagt cgaataccct attataggcg acgaacttag ggttaattcc gcttgtcgta 18900
aagtgcaaca tatggtcgtt aagtctgctc tattagccga taagtttccc gtattgcacg 18960
atatcggtaa tcctaaagcg attaaatgcg taccacaagc cgaagtcgaa tggaaatttt 19020
acgacgctca accatgttct gataaggcat acaaaatcga agagttgttt tactcatacg 19080
ctacacatca cgataagttt actgacggcg tatgtctgtt ttggaattgt aacgttgata 19140
ggtatcccgc taacgctatc gtttgtagat tcgatactag ggttctatct aatctgaatc 19200
tgccaggttg cgatggcgga tcactatacg ttaataaaca cgcttttcat acacctgcat 19260
tcgataaatc cgcttttacg aatcttaagc aattgccttt tttttattac tctgatagtc 19320
catgcgaatc tcacggtaag caagtcgtta gcgatatcga ttacgttcca cttaaatccg 19380
ctacatgtat tacacgttgt aatctcggag gcgcagtttg tagacatcac gctaacgaat 19440
atcgtcaata cttagacgct tataatatga tgattagtgc cggtttttca ttgtggattt 19500
ataagcaatt cgatacttat aatctatgga atacttttac tagattgcaa tctctcgaaa 19560
acgttgcgta taacgtcgtt aataagggtc atttcgacgg tcacgctggc gaagctcccg 19620
tatcaattat taataacgca gtgtatacta aggtcgacgg tattgacgtc gagattttcg 19680
aaaataagac tacattaccc gttaacgttg cattcgaatt gtgggctaaa cgtaatatta 19740
aaccagtgcc agagattaag atacttaata acttaggcgt tgatatcgct gctaataccg 19800
ttatttggga ttataaacgc gaagctcctg cacatgtgtc aactataggc gtatgtacta 19860
tgactgatat cgctaaaaaa cctaccgaat ccgcttgttc atcacttaca gtgttattcg 19920
acggtagggt tgagggtcag gtcgatctgt ttcgtaacgc acgtaacggc gtactgatta 19980
ctgagggatc ggttaaggga ttgacaccta gtaagggacc tgctcaagct agcgttaacg 20040
gagtgacact tataggcgaa tcagttaaga ctcaatttaa ttactttaaa aaagtcgacg 20100
gtattattca acagttacca gagacttatt ttacacaatc acgcgatctt gaggatttta 20160
aacctagatc tcaaatggag actgattttc tcgaactcgc tatggacgaa tttattcaac 20220
gatataagct tgagggatac gcattcgaac atatcgttta cggcgatttt tcacacggtc 20280
agttaggcgg attgcatctt atgatcggtc tagctaaacg atcacaggat agtccactta 20340
agcttgagga ttttatacct atggattcaa ccgttaagaa ttactttatt accgatgcgc 20400
aaaccggttc atctaaatgc gtttgtagcg taatcgattt actgttagac gatttcgttg 20460
agattattaa gtctcaggat ctatcagtga ttagtaaggt agtgaaagtg acaatcgatt 20520
acgctgagat ttcttttatg ctttggtgta aagacggtca cgttgagact ttttacccta 20580
aattgcaggc tagtcaggca tggcaacctg gagtcgctat gcctaatttg tataaaatgc 20640
aacgtatgtt actcgaaaaa tgcgatctgc aaaattacgg tgagaacgca gtgataccta 20700
agggtattat gatgaacgtc gctaagtata cacaattgtg tcaatacctt aatacactta 20760
cacttgccgt accatataat atgcgagtga tacatttcgg agccggatct gataagggcg 20820
ttgcgccagg tactgccgta ttgcgtcaat ggttgcctac cggtacactg ttagtcgatt 20880
ccgatcttaa cgatttcgta tctgacgctg atagtacact tataggcgat tgcgctacag 20940
tgcataccgc taataaatgg gatctgatta ttagcgatat gtacgatcca cgtactaaac 21000
acgttacgaa agagaacgat tctaaagagg gtttttttac atatctatgc ggttttatta 21060
aacagaaact cgcattaggc ggatctattg ccgttaagat tactgagcat agttggaacg 21120
ctgatctgta taagcttatg ggtcatttta gttggtggac cgcattcgtt actaacgtta 21180
acgctagttc tagcgaagca ttcttaatcg gcgctaatta tctcggtaag cctaaagagc 21240
aaatcgacgg atatactatg cacgctaatt atattttttg gcgtaatact aatcctattc 21300
aattgtctag ttattcattg ttcgatatgt ctaaatttcc acttaagtta cgcggtactg 21360
ccgttatgtc acttaaagag aatcagatta acgatatgat ttactcttta ctcgaaaagg 21420
gtaggttgat tatacgcgaa aataataggg tagtcgttag ttctgacata ctcgttaata 21480
attaaacgaa catgtttatt tttctgttat tccttacact tacatccggt tcagatctcg 21540
atagatgtac tacattcgac gacgttcagg cacctaatta tacacagcat acatctagta 21600
tgagaggcgt atactatcct gacgaaattt ttagatccga tacattgtat cttacacagg 21660
atctattctt acctttttac tctaacgtta cagggtttca tacaattaat catacattcg 21720
gtaatcccgt tataccgttt aaagacggta tttatttcgc agctaccgaa aaatctaacg 21780
tagtgagagg ttgggtattc ggtagtacta tgaataataa gtctcaatca gtgattatta 21840
ttaataattc gactaacgta gtgatacgcg catgtaattt cgaattgtgc gataatcctt 21900
ttttcgcagt gtctaaacct atgggtacac agactcatac tatgattttc gataacgctt 21960
ttaattgtac attcgaatat atttctgacg ctttttcact tgacgtatcc gaaaaatctg 22020
gtaattttaa acacttacgc gaattcgttt ttaaaaataa agacggtttt ttgtacgttt 22080
ataagggata ccaacctatc gacgtcgtta gggatctgcc atcaggtttt aatacactta 22140
agcctatttt taagttaccg ttaggcatta atattactaa ttttagagct atacttaccg 22200
cttttagtcc agctcaggat atttggggta ctagcgctgc cgcatatttc gtcggatatc 22260
ttaaacctac tacttttatg cttaaatacg acgaaaacgg tacaattact gacgcagtcg 22320
attgttcaca gaatccatta gccgaactta agtgttcagt taagtcattc gaaatcgata 22380
agggtattta tcagactagt aattttagag tcgtacctag cggtgacgta gtgagattcc 22440
ctaatattac gaatctatgt ccattcggcg aagtgtttaa cgctactaaa ttccctagcg 22500
tatacgcttg ggagcgtaaa aaaattagta attgcgttgc cgattactct gtgttgtata 22560
attcgacttt ttttagtact tttaagtgtt acggagtgtc agctactaag cttaacgatc 22620
tatgtttttc taacgtatac gctgattcat tcgtagtgaa aggcgatgac gttaggcaaa 22680
tcgctcccgg tcagactggc gtaatcgctg attataatta taagttacct gacgatttta 22740
tgggttgcgt actcgcatgg aatacacgta atatcgacgc tactagtacc ggtaattata 22800
attataagta tagatatctt agacacggta agcttagacc attcgaacgc gatatttcta 22860
acgtaccatt ctcacctgac ggtaagcctt gtacacctcc tgcacttaat tgttattggc 22920
cacttaacga ttacggtttt tacactacta ccggtatagg gtatcaacct tatagggtag 22980
tcgttctatc attcgaattg cttaacgctc cagctaccgt atgcggacct aaattgtcaa 23040
ccgatctgat taagaatcaa tgcgttaatt ttaattttaa cggtcttacc ggtacaggcg 23100
tacttacacc tagttctaaa cggtttcaac cttttcagca attcggtagg gacgttagcg 23160
attttaccga tagcgttagg gatcctaaaa ctagtgagat actcgatatt agtccatgcg 23220
cattcggagg cgtaagtgtg attactcccg gtactaacgc tagttctgag gttgccgtac 23280
tgtatcagga cgttaattgt actgacgtat caaccgctat acacgctgat caattgacac 23340
ctgcatggcg tatatactct accggtaata acgtttttca gacacaagcc ggttgtctga 23400
taggcgcaga gcatgtcgat acatcatacg aatgcgatat accgataggc gcaggtattt 23460
gcgctagtta tcatacagtg tcattgctta gatctactag tcagaaatca atcgttgcgt 23520
atactatgtc attaggcgct gatagttcaa tcgcatactc taataatact atcgctatac 23580
ctactaattt ttcaatttcg attactactg aggttatgcc agtgtctatg gctaagacta 23640
gtgtcgattg taatatgtat atttgtggcg attcaaccga atgcgctaat ctgttattgc 23700
aatacggatc tttttgtacg caattgaatc gtgcactatc aggtatagcc gctgaacagg 23760
atcgtaatac tagagaggta ttcgcacagg ttaaacagat gtataagact cctacactta 23820
agtatttcgg agggtttaat ttttcacaga ttttacccga tccacttaaa cctactaaac 23880
gatcttttat tgaggatctg ttattcaata aggttacact cgcagacgca ggttttatga 23940
aacaatacgg cgaatgttta ggcgatatta acgctaggga tctgatttgc gctcaaaaat 24000
ttaacggtct tacagtgtta ccaccactat tgactgacga tatgatagcc gcatatactg 24060
ccgcattagt gtcaggtacc gctaccgcag gttggacatt cggtgccggt gccgcattgc 24120
agattccatt cgctatgcaa atggcttata gatttaacgg tataggcgtt acgcaaaacg 24180
tactttacga gaatcagaaa caaatcgcta accaatttaa taaggctatt agtcagattc 24240
aagagtcact tactactact agtaccgcac tcggtaagtt gcaagacgtc gttaatcaga 24300
acgctcaggc acttaataca ctcgttaagc aattgtctag taatttcgga gctattagtt 24360
cagtgcttaa cgatattcta tctagactcg ataaggtcga agccgaagtg caaatcgata 24420
gattgattac cggtaggttg caatctctgc aaacatacgt tacgcaacaa ttgatacgcg 24480
ctgctgagat tagggctagc gctaatctcg cagctactaa aatgtctgag tgcgtactcg 24540
gtcaatctaa aagagtcgat ttttgcggta aggggtatca tcttatgtct tttccacaag 24600
ccgcaccaca cggagtggtt tttttacacg ttacatacgt acctagtcag gaacgtaatt 24660
ttactaccgc tccagctatt tgtcacgaag gtaaggcata ctttccacgc gaaggcgtat 24720
tcgtttttaa cggtacatca tggtttatta cgcaacgtaa tttttttagt ccacaaatta 24780
ttactactga taatacattc gttagcggta attgcgatgt cgttatcggt attattaata 24840
ataccgttta cgatccattg caacctgagt tagactcttt taaagaggaa ctcgataagt 24900
attttaaaaa tcatacatca cctgacgttg acttaggcga tatttcaggt attaacgctt 24960
cagtcgttaa tattcagaaa gagattgata gacttaacga agtcgctaaa aatcttaacg 25020
aatcacttat cgatctgcaa gagttaggta agtacgaaca gtatattaaa tggccttggt 25080
acgtttggtt agggtttata gccggtctaa tcgctatcgt tatggttacg atactgttat 25140
gttgtatgac atcatgttgt tcatgtctta aaggcgcatg ttcatgcgga tcatgttgta 25200
aattcgacga agacgattct gagccagtgc ttaagggagt gaaattgcat tatacataaa 25260
cgaacttatg gatttgttta tgagattttt tactcttaga tcaattactg cacagccagt 25320
aaaaattgac aatgcttctc ctgcaagtac tgttcatgct acagcaacga taccgctaca 25380
agcctcactc cctttcggat ggcttgttat tggcgttgca tttcttgctg tttttcagag 25440
cgctaccaaa ataattgcgc tcaataaaag atggcagcta gccctttata agggcttcca 25500
gttcatttgc aatttactgc tgctatttgt taccatctat tcacatcttt tgcttgtcgc 25560
tgcaggtatg gaggcgcaat ttttgtacct ctatgccttg atatattttc tacaatgcat 25620
caacgcatgt agaattatta tgagatgttg gctttgttgg aagtgcaaat ccaagaaccc 25680
attactttat gatgccaact actttgtttg ctggcacaca cataactatg actactgtat 25740
accatataac agtgtcacag atacaattgt cgttactgaa ggtgacggca tttcaacacc 25800
aaaactcaaa gaagactacc aaattggtgg ttattctgag gataggcact caggtgttaa 25860
agactatgtc gttgtacatg gctatttcac cgaagtttac taccagcttg agtctacaca 25920
aattactaca gacactggta ttgaaaatgc tacattcttc atctttaaca agcttgttaa 25980
agacccaccg aatgtgcaaa tacacacaat cgacggctct tcaggagttg ctaatccagc 26040
aatggatcca atttatgatg agccgacgac gactactagc gtgcctttgt aagcacaaga 26100
aagtgagtac gaacttatgt actcattcgt ttcggaagaa acaggtacgt taatagttaa 26160
tagcgtactt ctttttcttg ctttcgtggt attcttgcta gtcacactag ccatccttac 26220
tgcgcttcga ttgtgtgcgt actgctgcaa tattgttaac gtgagtttag taaaaccaac 26280
ggtttacgtc tactcgcgtg ttaaaaatct gaactcttct gaaggagttc ctgatcttct 26340
ggtctaaacg aactaactat tattattatt ctgtttggaa ctttaacatt gcttatcatg 26400
gccgataacg gtacaattac cgttgaggaa cttaaacagt tactcgaaca atggaatctc 26460
gtaatcggtt ttctgtttct cgcatggatt atgctattgc aattcgcata ctctaatcgt 26520
aatcggtttt tgtatattat taaactcgta ttcttatggt tattgtggcc agttacactc 26580
gcatgtttcg tactcgcagc cgtttatcgt attaattggg ttacaggcgg tatcgctatc 26640
gctatggctt gtatagtcgg acttatgtgg ttgtcttatt tcgttgcgtc atttagattg 26700
ttcgcacgta ctagatctat gtggtctttt aatcccgaaa ctaatatact gcttaacgta 26760
ccacttagag gtacaatcgt tactagacca cttatggagt ctgagttagt gataggcgca 26820
gtgattatta gggggcattt gcgtatggcc ggtcatagtc taggtagatg cgatattaag 26880
gatctaccta aagagattac cgttgcgact agtcgtacac tatcttatta taagttaggc 26940
gctagtcaac gtgtcggtac tgatagcgga ttcgcagctt ataataggta tcgtatcggt 27000
aattataagc ttaataccga tcacgctgga tctaacgata atatcgcatt actcgtacag 27060
taagtgacaa cagatgtttc atcttgttga cttccaggtt acaatagcag agatattgat 27120
tatcattatg aggactttca ggattgctat ttggaatctt gacgttataa taagttcaat 27180
agtgagacaa ttatttaagc ctctaactaa gaagaattat tcggagttag atgatgaaga 27240
acctatggag ttagattatc cataaaacga acatgaaaat tattctcttc ctgacattga 27300
ttgtatttac atcttgcgag ctatatcact atcaggagtg tgttagaggt acgactgtac 27360
tactaaaaga accttgccca tcaggaacat acgagggcaa ttcaccattt caccctcttg 27420
ctgacaataa atttgcacta acttgcacta gcacacactt tgcttttgct tgtgctgacg 27480
gtactcgaca tacctatcag ctgcgtgcaa gatcagtttc accaaaactt ttcatcagac 27540
aagaggaggt tcaacaagag ctctactcgc cactttttct cattgttgct gctctagtat 27600
ttttaatact ttgcttcacc attaagagaa agacagaatg aatgagctca ctttaattga 27660
cttctatttg tgctttttag cctttctgct attccttgtt ttaataatgc ttattatatt 27720
ttggttttca ctcgaaatcc aggatctaga agaaccttgt accaaagtct aaacgaacat 27780
gaaacttctc attgttttga cttgtatttc tctatgcagt tgcatatgca ctgtagtaca 27840
gcgctgtgca tctaataaac ctcatgtgct tgaagatcct tgtaaggtac aacactaggg 27900
gtaatactta tagcactgct tggctttgtg ctctaggaaa ggttttacct tttcatagat 27960
ggcacactat ggttcaaaca tgcacaccta atgttactat caactgtcaa gatccagctg 28020
gtggtgcgct tatagctagg tgttggtacc ttcatgaagg tcaccaaact gctgcattta 28080
gagacgtact tgttgtttta aataaacgaa caaattaaaa tgtctgataa tggaccccaa 28140
tcaaaccaac gtagtgcccc ccgcattaca tttggtggac ccacagattc aactgacaat 28200
aaccagaatg gaggacgcaa tggggcaagg ccaaaacagc gccgacccca aggtttaccc 28260
aataatactg cgtcttggtt cacagctctc actcagcatg gcaaggagga acttagattc 28320
cctcgaggcc agggcgttcc aatcaacacc aatagtggtc cagatgacca aattggctac 28380
taccgaagag ctacccgacg agttcgtggt ggtgacggca aaatgaaaga gctcagcccc 28440
agatggtact tctattacct aggaactggc ccagaagctt cacttcccta cggcgctaac 28500
aaagaaggca tcgtatgggt tgcaactgag ggagccttga atacacccaa agaccacatt 28560
ggcacccgca atcctaataa caatgctgcc accgtgctac aacttcctca aggaacaaca 28620
ttgccaaaag gcttctacgc agagggaagc agaggcggca gtcaagcctc ttctcgctcc 28680
tcatcacgta gtcgcggtaa ttcaagaaat tcaactcctg gcagcagtag gggaaattct 28740
cctgctcgaa tggctagcgg aggtggtgaa actgccctcg cgctattgct gctagacaga 28800
ttgaaccagc ttgagagcaa agtttctggt aaaggccaac aacaacaagg ccaaactgtc 28860
actaagaaat ctgctgctga ggcatctaaa aagcctcgcc aaaaacgtac tgccacaaaa 28920
cagtacaacg tcactcaagc atttgggaga cgtggtccag aacaaaccca aggaaatttc 28980
ggggaccaag acctaatcag acaaggaact gattacaaac attggccgca aattgcacaa 29040
tttgctccaa gtgcctctgc attctttgga atgtcacgca ttggcatgga agtcacacct 29100
tcgggaacat ggctgactta tcatggagcc attaaattgg atgacaaaga tccacaattc 29160
aaagacaacg tcatactgct gaacaagcac attgacgcat acaaaacatt cccaccaaca 29220
gagcctaaaa aggacaaaaa gaaaaagact gatgaagctc agcctttgcc gcagagacaa 29280
aagaagcagc ccactgtgac tcttcttcct gcggctgaca tggatgattt ctccagacaa 29340
cttcaaaatt ccatgagtgg agcttctgct gattcaactc aggcataaac actcatgatg 29400
accacacaag gcagatgggc tatgtaaacg ttttcgcaat tccgtttacg atacatagtc 29460
tactcttgtg cagaatgaat tctcgtaact aaacagcaca agtaggttta gttaacttta 29520
atctcacata gcaatcttta atcaatgtgt aacattaggg aggacttgaa agagccacca 29580
cattttcatc gaggccacgc ggagtacgat cgagggtaca gtgaataatg ctagggagag 29640
ctgcctatat ggaagagccc taatgtgtaa aattaatttt agtagtgcta tccccatgtg 29700
attttaatag cttcttagga gaatgacaaa aaaaaaaaaa aaaaaaaaaa a 29751
Claims (81)
- 유래의 기원이 되는 모(parent) 단백질 코딩 서열의 코돈 쌍 편향보다 작은 코돈 쌍 편향을 가지는 변형된 단백질 코딩 서열이 포함된 바이러스 게놈을 포함하는 약독화(attenuated) 바이러스.
- 제1항에 있어서, 상기 변형된 단백질 코딩 서열이 상기 모 단백질 코딩 서열의 코돈 쌍 편향보다 약 0.05 이상 더 작은 코돈 쌍 편향을 가지는 것인 약독화 바이러스.
- 제1항에 있어서, 상기 변형된 단백질 코딩 서열이 상기 모 단백질 코딩 서열의 코돈 쌍 편향보다 약 0.1 이상 더 작은 코돈 쌍 편향을 가지는 것인 약독화 바이러스.
- 제1항에 있어서, 상기 변형된 단백질 코딩 서열이 상기 모 단백질 코딩 서열의 코돈 쌍 편향보다 약 0.2 이상 더 작은 코돈 쌍 편향을 가지는 것인 약독화 바이러스.
- 제1항에 있어서, 상기 변형된 단백질 코딩 서열이 약 -0.05 이하의 코돈 쌍 편향을 가지는 것인 약독화 바이러스.
- 제1항에 있어서, 상기 변형된 단백질 코딩 서열이 약 -0.1 이하의 코돈 쌍 편향을 가지는 것인 약독화 바이러스.
- 제1항에 있어서, 상기 변형된 단백질 코딩 서열이 약 -0.3 이하의 코돈 쌍 편향을 가지는 것인 약독화 바이러스.
- 제1항에 있어서, 상기 변형된 단백질 코딩 서열이 약 -0.4 이하의 코돈 쌍 편향을 가지는 것인 약독화 바이러스.
- 제1항에 있어서, 상기 변형된 단백질 코딩 서열이 상기 모 바이러스의 단백질 코딩 서열과 90% 미만 동일한 것인 약독화 바이러스.
- 제1항에 있어서, 상기 변형된 단백질 코딩 서열이 상기 모 바이러스의 단백질 코딩 서열과 80% 미만 동일한 것인 약독화 바이러스.
- 제1항에 있어서, 상기 변형된 단백질 코딩 서열과 상기 모 단백질 코딩 서열이 동일한 단백질을 코딩하는 것인 약독화 바이러스.
- 제1항에 있어서, 상기 변형된 단백질 코딩 서열이 천연 분리주와 약 10개 이 하의 아미노산이 다른 단백질을 코딩하는 것인 약독화 바이러스.
- 제1항에 있어서, 상기 변형된 단백질 코딩 서열이 천연 분리주와 약 20개 이하의 아미노산이 다른 단백질을 코딩하는 것인 약독화 바이러스.
- 제1항에 있어서, 상기 변형된 단백질 코딩 서열이 약 100개 이상의 뉴클레오티드의 길이에 걸쳐 변형된 것인 약독화 바이러스.
- 제1항에 있어서, 상기 변형된 단백질 코딩 서열이 약 500개 이상의 뉴클레오티드의 길이에 걸쳐 변형된 것인 약독화 바이러스.
- 제1항에 있어서, 상기 변형된 단백질 코딩 서열이 약 1000개 이상의 뉴클레오티드의 길이에 걸쳐 변형된 것인 약독화 바이러스.
- 제1항에 있어서, 상기 바이러스가 동물 또는 식물을 감염시키는 것인 약독화 바이러스.
- 제1항에 있어서, 상기 동물이 인간인 약독화 바이러스.
- 제1항에 있어서, 상기 바이러스가 동물 숙주에서 보호 면역 반응을 유발하는 것인 약독화 바이러스.
- 제1항에 있어서, 숙주에서 증식될 때 상기 변형된 단백질 코딩 서열의 복귀(reversion)가 실질적으로 억제되는 것인 약독화 바이러스.
- 제1항에 있어서, 상기 바이러스가 DNA, RNA, 이중 가닥 또는 단일 가닥 바이러스인 약독화 바이러스.
- 제1항에 있어서, 상기 단백질 코딩 서열이 다단백질을 코딩하는 것인 약독화 바이러스.
- 제1항에 있어서, 뉴클레오티드 서열이 캡시드 단백질을 코딩하는 것인 약독화 바이러스.
- 제1항에 있어서, 상기 바이러스가 폴리오바이러스, 리노바이러스, 인플루엔자 바이러스, 중증 급성 호흡기 증후군(SARS) 코로나바이러스, 인간 면역결핍 바이러스(HIV), C형 간염 바이러스(HCV), 감염성 기관지염 바이러스, 에볼라바이러스, 말부르크 바이러스, 뎅기열 바이러스, 웨스트 나일병 바이러스, 엡스타인-바 바이러스(EBV), 또는 황열 바이러스인 약독화 바이러스.
- 제1항에 있어서, 상기 바이러스가 수두 바이러스, 헤르페스 바이러스, 유두종 바이러스, 또는 아데노바이러스인 약독화 바이러스.
- 제24항에 있어서, 상기 약독화 폴리오바이러스가 폴리오바이러스 1형[마호니(Mahoney)], 폴리오바이러스 2형[랜싱(Lansing)], 폴리오바이러스 3형[레온(Leon)], 1가 경구용 폴리오바이러스 백신(OPV) 바이러스, 또는 3가 OPV 바이러스로부터 유래되는 것인 약독화 바이러스.
- 제1항에 있어서, 상기 변형된 단백질 코딩 서열 전반에 걸쳐 뉴클레오티드 치환이 분포되는 것인 약독화 바이러스.
- 제1항에 있어서, 상기 변형된 단백질 코딩 서열의 일부에 뉴클레오티드 치환이 한정되는 것인 약독화 바이러스.
- 제27항에 있어서, 상기 일부가 캡시드의 하나 이상의 단백질을 코딩하는 것인 약독화 바이러스.
- 제1항 내지 제29항 중 어느 한 항에 있어서, 상기 바이러스가 피코나바이러스인 약독화 바이러스.
- 제30항에 있어서, 상기 피코나바이러스가 폴리오바이러스인 약독화 바이러스.
- 제31항에 있어서, 상기 바이러스 게놈의 뉴클레오티드 서열이 서열 번호 4 또는 그 일부를 포함하는 것인 약독화 바이러스.
- 제31항에 있어서, 상기 바이러스 게놈의 뉴클레오티드 서열이 서열 번호 6을 포함하는 것인 약독화 바이러스.
- 제30항에 있어서, 상기 피코나바이러스가 리노바이러스인 약독화 바이러스.
- 제34항에 있어서, 상기 바이러스 게놈의 뉴클레오티드 서열이 서열 번호 30 또는 서열 번호 32, 또는 이들의 일부를 포함하는 것인 약독화 바이러스.
- 제1항 내지 제29항 중 어느 한 항에 있어서, 상기 바이러스가 오르토믹소바이러스인 약독화 바이러스.
- 제36항에 있어서, 상기 오르토믹소바이러스가 인플루엔자 바이러스인 약독화 바이러스.
- 제37항에 있어서, 상기 바이러스 게놈의 뉴클레오티드 서열이 서열 번호 14, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 28, 및 이들의 일부 중 하나 이상을 포함하는 것인 약독화 바이러스.
- 제37항에 있어서, 상기 바이러스 게놈의 뉴클레오티드 서열이 서열 번호 23을 포함하는 것인 약독화 바이러스.
- 제37항에 있어서, 상기 바이러스 게놈의 뉴클레오티드 서열이 서열 번호 15 및 서열 번호 21을 포함하는 것인 약독화 바이러스.
- 제1항 내지 제29항 중 어느 한 항에 있어서, 상기 바이러스가 플라비바이러스인 약독화 바이러스.
- 제41항에 있어서, 상기 플라비바이러스가 뎅기 바이러스인 약독화 바이러스.
- 제42항에 있어서, 상기 바이러스 게놈의 뉴클레오티드 서열이 서열 번호 34를 포함하는 것인 약독화 바이러스.
- 제1항 내지 제29항 중 어느 한 항에 있어서, 상기 바이러스가 레트로바이러 스인 약독화 바이러스.
- 제44항에 있어서, 상기 레트로바이러스가 인간 면역결핍 바이러스(HIV)인 약독화 바이러스.
- 제45항에 있어서, 상기 바이러스 게놈의 뉴클레오티드 서열이 서열 번호 36을 포함하는 것인 약독화 바이러스.
- 제1항 내지 제29항 중 어느 한 항에 있어서, 상기 바이러스가 레오바이러스인 약독화 바이러스.
- 제47항에 있어서, 상기 레오바이러스가 로타바이러스인 약독화 바이러스.
- 제48항에 있어서, 상기 바이러스 게놈의 뉴클레오티드 서열이 서열 번호 38 및/또는 서열 번호 40을 포함하는 것인 약독화 바이러스.
- 제1항 내지 제29항 중 어느 한 항에 있어서, 상기 바이러스가 코로나바이러스인 약독화 바이러스.
- 제50항에 있어서, 상기 코로나바이러스가 중증 급성 호흡기 증후군(SARS) 바 이러스인 약독화 바이러스.
- 제51항에 있어서, 상기 바이러스 게놈의 뉴클레오티드 서열이 서열 번호 42를 포함하는 것인 약독화 바이러스.
- (a) 모 바이러스의 단백질 코딩 영역의 뉴클레오티드 서열을 얻는 단계;(b) 상기 뉴클레오티드 서열의 코돈을 재배열하여,i) 모 바이러스의 코딩 영역과 동일한 아미노산 서열을 코딩하고,ii) 모 바이러스의 코딩 영역에 비해 감소된 코돈 쌍 편향을 가지는돌연변이된 뉴클레오티드 서열을 얻는 단계; 및(c) 상기 돌연변이된 뉴클레오티드 서열의 전부 또는 일부를 모 바이러스의 뉴클레오티드 서열 내로 치환하는 단계를 포함하는 약독화 바이러스 게놈의 제조 방법.
- 제53항에 있어서, 코돈의 재배열이 동일한 아미노산을 코딩하는 코돈 쌍을 무작위로 선택하여 교환하고, 상기 교환에 의해 코돈 쌍 편향이 감소되는지를 확인하는 단계를 포함하는 것인 제조 방법.
- 제54항에 있어서, 상기 단계를, 코돈 쌍 편향이 원하는 양만큼 감소될 때까지 반복하는 것인 제조 방법.
- 제54항에 있어서, 상기 단계를, 코돈 쌍 편향이 최적 값 또는 그 부근에 수렴할 때까지 반복하는 것인 제조 방법.
- 제53항 내지 제56항 중 어느 한 항에 있어서, 단계 (a) 및 (b)를 컴퓨터에서 실행하는 것인 제조 방법.
- 제53항에 있어서, 단계 (c)를 돌연변이된 뉴클레오티드 서열의 신생 합성에 의해 수행하는 것인 제조 방법.
- 제58항에 있어서, 전체 게놈을 합성 DNA로 치환하는 것인 제조 방법.
- 제58항에 있어서, 상기 바이러스 게놈의 일부를 합성 DNA로 치환하는 것인 제조 방법.
- 제49항에 있어서, 상기 모 바이러스가 천연 분리주인 제조 방법.
- 제49항에 있어서, 상기 모 바이러스가 천연 분리주의 돌연변이체인 제조 방법.
- 제53항의 방법에 의해 제조된 약독화 바이러스 게놈을 숙주 생물체 내에 삽입함으로써 약독화 바이러스를 생성하는 단계를 포함하는, 약독화 바이러스의 제조 방법.
- 제1항 내지 제52항 중 어느 한 항의 약독화 바이러스 및 약학적으로 허용되는 담체를 포함하는, 피험체에서 보호 면역 반응을 유발하기 위한 백신 조성물.
- 제64항에 있어서, 상기 약독화 바이러스가 (i) 감염된 세포에서의 바이러스 단백질의 합성 및 가공을 실질적으로 변경하지 않고/않거나; (ii) 감염된 세포당 비리온의 양을 야생형 바이러스와 유사한 양으로 생성하고/생성하거나; (iii) 야생형 바이러스보다 실질적으로 더 낮은 비리온 특이적 감염력을 나타내는 것인 백신 조성물.
- 제64항에 있어서, 상기 약독화 바이러스가 숙주 동물에서 상응하는 야생형 바이러스와 실질적으로 유사한 면역 반응을 유발하는 것인 백신 조성물.
- 피험체에게 예방적 또는 치료적 유효량의 제64항의 백신 조성물을 투여하는 단계를 포함하는, 피험체에서 보호 면역 반응을 유발하는 방법
- 제67항에 있어서, 상기 피험체가 병원성 바이러스에 노출된 적이 있는 것인 방법.
- 피험체에게 예방적 유효량의 제64항의 백신 조성물을 투여하는 단계를 포함하는, 피험체가 바이러스 관련 질환을 앓게 되는 것을 예방하는 방법.
- 제69항에 있어서, 상기 피험체가 병원성 바이러스에 노출된 적이 있는 것인 방법.
- 피험체에게 치료적 유효량의 제64항의 백신 조성물을 투여하는 단계를 포함하는, 바이러스 감염 피험체에서 바이러스 관련 질환의 발병을 지연시키거나 진행 속도를 늦추는 방법.
- 제67항 내지 제71항 중 어느 한 항에 있어서, 상기 피험체에게 1종 이상의 면역보조제를 투여하는 것을 추가로 포함하는 방법.
- 제67항 내지 제71항 중 어느 한 항에 있어서, 상기 피험체가 포유동물 또는 조류인 방법.
- 제73항에 있어서, 상기 포유동물이 인간인 방법.
- 제73항에 있어서, 상기 조류가 가축화된 가금 종인 방법.
- 제73항에 있어서, 상기 포유동물이 가축화된 가축 종인 방법.
- 제73항에 있어서, 상기 포유동물이 소인 방법.
- 제73항에 있어서, 상기 포유동물이 돼지인 방법.
- 제73항에 있어서, 상기 포유동물이 양인 방법.
- 제73항에 있어서, 상기 포유동물이 말인 방법.
- 제73항에 있어서, 상기 포유동물이 외래 동물원 동물인 방법.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US90938907P | 2007-03-30 | 2007-03-30 | |
US60/909,389 | 2007-03-30 | ||
US6866608P | 2008-03-07 | 2008-03-07 | |
US61/068,666 | 2008-03-07 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20100019423A true KR20100019423A (ko) | 2010-02-18 |
KR101621100B1 KR101621100B1 (ko) | 2016-05-13 |
Family
ID=39808891
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020097022782A KR101621100B1 (ko) | 2007-03-30 | 2008-03-31 | 백신에 유용한 약독화 바이러스 |
Country Status (13)
Country | Link |
---|---|
US (4) | US9476032B2 (ko) |
EP (3) | EP3431099B1 (ko) |
JP (2) | JP5733976B2 (ko) |
KR (1) | KR101621100B1 (ko) |
CN (1) | CN103476425B (ko) |
AU (1) | AU2008232491B2 (ko) |
BR (1) | BRPI0809600B1 (ko) |
CA (1) | CA2682089C (ko) |
DK (1) | DK2139515T4 (ko) |
HR (1) | HRP20181319T4 (ko) |
MX (2) | MX349825B (ko) |
PL (1) | PL2139515T5 (ko) |
WO (1) | WO2008121992A2 (ko) |
Families Citing this family (50)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BRPI0809600B1 (pt) * | 2007-03-30 | 2023-01-24 | The Research Foundation Of State University Of New York | Vírus atenuado útil para vacinas |
WO2010039649A2 (en) * | 2008-10-03 | 2010-04-08 | The United States Of America, As Represented By The Secretary, Department Of Health & Human Services | Flavivirus-based system for production of hepatitis c virus (hcv) |
EP2391713A1 (en) | 2009-01-30 | 2011-12-07 | The Board Of Regents For Oklahoma State University | Immunogenic compositions, vaccines and diagnostics based on canine distemper viruses circulating in north american dogs |
EP2403527A4 (en) * | 2009-03-06 | 2012-11-14 | Sinai School Medicine | LIVELY WEAKED INFLUENZA VIRUS VACCINES WITH MICRORNA REACTION ELEMENTS |
WO2011044561A1 (en) * | 2009-10-09 | 2011-04-14 | The Research Foundation Of State University Of New York | Attenuated influenza viruses and vaccines |
EP2490268A1 (en) * | 2011-02-03 | 2012-08-22 | Imec | Method for fabricating photovoltaic cells |
EP2751260A2 (en) * | 2011-09-02 | 2014-07-09 | Westfälische Wilhelms-Universität Münster | Live attenuated influenza virus |
CN104204196A (zh) * | 2011-12-16 | 2014-12-10 | 纽约州州立大学研究基金会 | 新型减毒脊髓灰质炎病毒:PV-1单-cre-X |
US20140363469A1 (en) * | 2012-01-19 | 2014-12-11 | Alnylam Pharmaceuticals, Inc. | Viral attenuation and vaccine production |
EP4190895A1 (en) * | 2013-02-08 | 2023-06-07 | The U.S.A. As Represented By The Secretary, Department Of Health And Human Services | Attenuation of human respiratory syncytial virus by genome scale codon-pair deoptimization |
CN105189756B (zh) * | 2013-03-14 | 2021-06-11 | 爱默蕾大学 | 具有沉默突变的重组rsv、其相关疫苗和方法 |
DK2969005T3 (da) * | 2013-03-15 | 2020-01-20 | The Resaerch Foundation For The State Univ Of New York | Attenuerede influenzavira og -vacciner |
CN104056276B (zh) * | 2013-03-20 | 2017-05-10 | 上海生物制品研究所有限责任公司 | 一种流感病毒减毒活疫苗及其制备方法 |
CN104419687B (zh) * | 2013-09-03 | 2017-03-15 | 中国农业大学 | 重组PRRS病毒HV‑nsp29及其应用 |
US10400220B2 (en) | 2014-09-05 | 2019-09-03 | The Research Foundation For The State University Of New York | Attenuated virus having multiple hosts |
US10731227B2 (en) | 2014-12-12 | 2020-08-04 | The Trustees Of The University Of Pennsylvania | Compositions, kits, and methods to detect HIV virus |
WO2017099801A1 (en) * | 2015-12-11 | 2017-06-15 | The Trustees Of The University Of Pennsylvania | Compositions, kits, and methods to detect hiv virus |
EP3050962A1 (en) | 2015-01-28 | 2016-08-03 | Institut Pasteur | RNA virus attenuation by alteration of mutational robustness and sequence space |
EP3303571A4 (en) * | 2015-06-04 | 2018-10-17 | The University of Hong Kong | Live-attenuated virus and methods of production and use |
EP3355899A4 (en) * | 2015-09-30 | 2019-04-03 | Ramot at Tel-Aviv University Ltd. | In place of EVOLUTIONARY PRESERVED RNA STRUCTURE MUTATED APPROVED VIRUS |
US11235050B2 (en) | 2015-10-29 | 2022-02-01 | Emory University | Chimeric RSV, immunogenic compositions, and methods of use |
CN105821009B (zh) * | 2016-04-05 | 2019-07-26 | 中国人民解放军第三〇二医院 | 靶向肝癌溶瘤流感病毒的构建及其应用 |
EP3472319B1 (en) | 2016-06-15 | 2024-03-27 | President and Fellows of Harvard College | Methods for rule-based genome design |
EP3488239A1 (en) * | 2016-07-22 | 2019-05-29 | Verily Life Sciences LLC | Quantitative massively parallel proteomics |
US11149255B2 (en) * | 2016-09-06 | 2021-10-19 | Bioventures, Llc | Compositions and methods for generating reversion free attenuated and/or replication incompetent vaccine vectors |
CN106650307B (zh) * | 2016-09-21 | 2019-04-05 | 武汉伯远生物科技有限公司 | 一种基于密码子对使用频度的基因密码子优化方法 |
WO2018057950A1 (en) | 2016-09-23 | 2018-03-29 | The Usa, As Represented By The Secretary, Dept. Of Health And Human Services | Vaccine candidates for human respiratory syncytial virus (rsv) having attenuated phenotypes |
CN106520832B (zh) * | 2016-11-17 | 2020-02-18 | 新乡医学院 | 双顺反子表达载体、表达系统、制备方法及应用 |
EA201991319A1 (ru) * | 2016-11-30 | 2019-11-29 | Вакцины аттенуированного свиного гриппа и способы их изготовления и применения | |
AR111770A1 (es) | 2017-05-05 | 2019-08-21 | Elanco Us Inc | Vacuna para enfermedad respiratoria bovina |
JP2020530765A (ja) * | 2017-07-17 | 2020-10-29 | グラクソスミスクライン バイオロジカルズ ソシエテ アノニム | リサウイルス抗原構築物 |
CN111511397A (zh) * | 2017-12-22 | 2020-08-07 | 科达金尼克斯有限公司 | 具有密码子对去优化区域的重组病毒及其用于治疗癌症的用途 |
CN108586608A (zh) * | 2018-04-13 | 2018-09-28 | 四川农业大学 | 一种dhav-1 2c蛋白多克隆抗体、重组融合蛋白及其制备方法 |
CN109504662B (zh) * | 2018-11-09 | 2022-06-10 | 浙江天元生物药业有限公司 | 一种柯萨奇病毒减毒株及其应用 |
CA3121430A1 (en) | 2018-12-14 | 2020-06-18 | Glaxosmithkline Biologicals Sa | Heterologous prime boost vaccine compositions and methods |
EP4096712A4 (en) * | 2020-01-28 | 2024-05-08 | Codagenix Inc. | DE-OPTIMIZED SARS-COV-2 AND METHODS OF USE |
CN111321125B (zh) * | 2020-02-03 | 2022-07-19 | 广州医科大学 | 重组流感病毒及其在疫苗中的应用 |
CN111269895B (zh) * | 2020-02-03 | 2022-09-27 | 广州医科大学 | 甲型流感病毒减毒株及其作为骨架病毒和疫苗的应用 |
WO2021191342A1 (de) * | 2020-03-27 | 2021-09-30 | Reinmueller Johannes | Virustatisches mittel |
CN111481663B (zh) * | 2020-04-09 | 2022-12-09 | 广州医科大学 | 一种流感病毒活疫苗及其制备方法 |
US20230143228A1 (en) * | 2020-04-21 | 2023-05-11 | Emory University | Coronavirus vaccines, compositions, and methods related thereto |
PE20230833A1 (es) * | 2020-05-27 | 2023-05-19 | Us Agriculture | Cepas vivas atenuadas de la fiebre aftosa modificadas por desoptimizacion y usos de estas |
EP4179074A1 (en) * | 2020-07-07 | 2023-05-17 | Codagenix Inc. | Method of producing modified virus genomes and producing modified viruses |
EP4181956A1 (en) * | 2020-07-16 | 2023-05-24 | Griffith University | Live-attenuated virus vaccine |
US20240018609A1 (en) * | 2020-08-19 | 2024-01-18 | City Of Hope | Lamp detection of sars-cov-2 in saliva for the rapid diagnosis of covid-19 |
CN112662633A (zh) * | 2020-12-28 | 2021-04-16 | 中国水产科学研究院珠江水产研究所 | II型草鱼呼肠孤病毒冷适应株GCRV-GD108ca及其应用 |
CA3223318A1 (en) * | 2021-06-23 | 2022-12-29 | Muhammad Munir | Virus attenuation |
US20230274791A1 (en) * | 2021-11-29 | 2023-08-31 | The Chinese University Of Hong Kong | Codon de-optimization or optimization using genetic architecture |
WO2024036331A2 (en) * | 2022-08-12 | 2024-02-15 | Fred Hutchinson Cancer Center | Barcoded influenza viruses and mutational scanning libraries including the same |
CN117153270B (zh) * | 2023-10-30 | 2024-02-02 | 吉林华瑞基因科技有限公司 | 一种基因二代测序数据处理方法 |
Family Cites Families (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU6829494A (en) | 1993-08-02 | 1995-02-28 | Chiron Corporation | Recombinant constructs using replacement sequences in hypervariable regions |
US6537776B1 (en) | 1999-06-14 | 2003-03-25 | Diversa Corporation | Synthetic ligation reassembly in directed evolution |
US6352842B1 (en) | 1995-12-07 | 2002-03-05 | Diversa Corporation | Exonucease-mediated gene assembly in directed evolution |
US6238884B1 (en) | 1995-12-07 | 2001-05-29 | Diversa Corporation | End selection in directed evolution |
US20040023327A1 (en) | 1995-12-07 | 2004-02-05 | Short Jay M. | End selection in directed evolution |
US6171820B1 (en) | 1995-12-07 | 2001-01-09 | Diversa Corporation | Saturation mutagenesis in directed evolution |
US6562594B1 (en) | 1999-09-29 | 2003-05-13 | Diversa Corporation | Saturation mutagenesis in directed evolution |
US6764835B2 (en) | 1995-12-07 | 2004-07-20 | Diversa Corporation | Saturation mutageneis in directed evolution |
EP2112220A3 (en) | 1996-07-15 | 2010-01-06 | The Government of the United States of America, as represented by The Department of Health and Human Services | Production of attenuated respiratory syncytial virus vaccines from cloned nucleotide sequences |
GB9705669D0 (en) † | 1997-03-19 | 1997-05-07 | British Tech Group | Attenuated polioviruses |
US6410023B1 (en) | 1997-05-23 | 2002-06-25 | United States Of America | Recombinant parainfluenza virus vaccines attenuated by deletion or ablation of a non-essential gene |
EP0966538A1 (en) * | 1997-08-07 | 1999-12-29 | Altwell Biotech. Inc. | Replication-competent recombinant sabin type 1 strain of poliovirus |
EP1690868A1 (en) | 1997-10-31 | 2006-08-16 | Maxygen, Inc. | Modification of virus tropism and host range by viral genome shuffling |
GB9817082D0 (en) † | 1998-08-06 | 1998-10-07 | Btg Int Ltd | Attenuated poliovirus vaccine |
AU1199000A (en) | 1998-09-29 | 2000-04-17 | Maxygen, Inc. | Shuffling of codon altered genes |
CA2361927A1 (en) | 1999-03-09 | 2000-09-14 | Diversa Corporation | End selection in directed evolution |
AU4039400A (en) | 1999-03-26 | 2000-10-16 | Diversa Corporation | Exonuclease-mediated nucleic acid reassembly in directed evolution |
CA2291367A1 (en) * | 1999-12-06 | 2001-06-06 | Isabelle Henry | Genetic constructions having a reduced or an increased number of epigenetic control regions and methods of use thereof |
US20020076415A1 (en) | 1999-12-14 | 2002-06-20 | Jing-Hsiung Ou | Hepatitis C virus gene products |
AUPQ776100A0 (en) | 2000-05-26 | 2000-06-15 | Australian National University, The | Synthetic molecules and uses therefor |
GB0017990D0 (en) | 2000-07-21 | 2000-09-13 | Glaxo Group Ltd | Papilloma virus sequences |
WO2002008435A1 (en) | 2000-07-21 | 2002-01-31 | Glaxo Group Limited | Codon-optimized papilloma virus sequences |
IL155154A0 (en) | 2000-09-30 | 2003-10-31 | Diversa Corp | Whole cell engineering by mutagenizing a substantial portion of a starting genome, combining mutations, and optionally repeating |
ATE403152T1 (de) | 2000-10-17 | 2008-08-15 | Besst Test Aps | Test zum direkten nachweisen einer biologischen zelle in einer körperflüssigkeitsprobe |
US20030041354A1 (en) | 2000-10-17 | 2003-02-27 | Novozymes A/S | Transgenic plants |
AU2002326303A1 (en) * | 2001-05-25 | 2002-12-03 | Tao Biosciences, Llc | Methods for attenuation of virulence in bacteria |
ATE471335T1 (de) * | 2002-12-23 | 2010-07-15 | Vical Inc | Impfstoffe gegen infektionen mit dem humanen zytomegalivirus auf grundlage von codonoptimierten polynukleotiden |
CA2517394A1 (en) | 2003-02-28 | 2005-02-17 | The Government Of The United States Of America As Represented By The Sec Retary Of The Department Of Health And Human Services | Recombinant human metapneumovirus and its use |
WO2005024012A1 (en) | 2003-09-11 | 2005-03-17 | Novozymes A/S | Increased expression of a modified polypeptide |
EP1735451B1 (en) | 2004-04-07 | 2009-10-28 | Novozymes A/S | Mutated prokaryotic cells with high secretion-levels |
EP2644696B1 (en) | 2004-05-24 | 2015-07-15 | MedImmune, LLC | Method of increasing replication of a reassortant influenza virus in eggs. |
JP2008504839A (ja) | 2004-07-02 | 2008-02-21 | ヘンリー, エル. ニーマン, | コピーチョイス組換え及びその使用法 |
EP1781785B1 (en) | 2004-07-20 | 2010-11-10 | Novozymes, Inc. | Methods of producing mutant polynucleotides |
EP1773995B1 (en) | 2004-08-03 | 2009-10-07 | The Regents Of The University Of California | Site specific system for generating diversity protein sequences |
DK3312272T3 (da) * | 2004-10-08 | 2019-12-02 | Us Gov Health & Human Services | Modulering af replikationstilpasning ved brug a mindre optrædende synonyme kodoner |
US8168771B2 (en) | 2005-01-31 | 2012-05-01 | The Johns Hopkins University | Use of consensus sequence as vaccine antigen to enhance recognition of virulent viral variants |
AU2006304268B2 (en) | 2005-10-14 | 2011-09-29 | The Government Of The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services, Centers For Disease Control And Prevention | Rabies virus vector systems and compositions and methods thereof |
CN106148288A (zh) | 2006-08-25 | 2016-11-23 | 美国国有健康与人类服务部(马里兰州) | 重组修饰的安卡拉痘苗病毒及其应用、质粒载体及其应用 |
US8216844B2 (en) | 2006-08-29 | 2012-07-10 | Danisco Us Inc. | Compositions and methods for improved protein production |
WO2008049782A1 (en) | 2006-10-24 | 2008-05-02 | Basf Se | Method of increasing gene expression using modified codon usage |
PL2082045T3 (pl) | 2006-10-24 | 2015-07-31 | Basf Se | Sposób zmniejszania ekspresji genów poprzez modyfikację częstości występowania kodonów |
US8298541B2 (en) | 2007-03-29 | 2012-10-30 | The United States Of America, As Represented By The Secretary, Department Of Health & Human Services | Live attenuated virus vaccines for La Crosse virus and other Bunyaviridae |
BRPI0809600B1 (pt) | 2007-03-30 | 2023-01-24 | The Research Foundation Of State University Of New York | Vírus atenuado útil para vacinas |
WO2009049351A1 (en) | 2007-10-15 | 2009-04-23 | The University Of Queensland | Construct system and uses therefor |
EP3355899A4 (en) | 2015-09-30 | 2019-04-03 | Ramot at Tel-Aviv University Ltd. | In place of EVOLUTIONARY PRESERVED RNA STRUCTURE MUTATED APPROVED VIRUS |
JP7250520B2 (ja) | 2016-04-13 | 2023-04-03 | ヤンセン ファーマシューティカルズ,インコーポレーテッド | 組換えアルテリウイルスレプリコン系およびその使用 |
US11821111B2 (en) | 2019-11-15 | 2023-11-21 | Fred Hutchinson Cancer Center | Barcoded influenza viruses and deep mutational scanning libraries including the same |
-
2008
- 2008-03-31 BR BRPI0809600-7A patent/BRPI0809600B1/pt active IP Right Grant
- 2008-03-31 HR HRP20181319TT patent/HRP20181319T4/hr unknown
- 2008-03-31 KR KR1020097022782A patent/KR101621100B1/ko active IP Right Grant
- 2008-03-31 MX MX2014010788A patent/MX349825B/es unknown
- 2008-03-31 PL PL08799746.6T patent/PL2139515T5/pl unknown
- 2008-03-31 US US12/594,173 patent/US9476032B2/en active Active
- 2008-03-31 WO PCT/US2008/058952 patent/WO2008121992A2/en active Search and Examination
- 2008-03-31 CN CN200880018001.1A patent/CN103476425B/zh active Active
- 2008-03-31 DK DK08799746.6T patent/DK2139515T4/da active
- 2008-03-31 JP JP2010501289A patent/JP5733976B2/ja active Active
- 2008-03-31 EP EP18177156.9A patent/EP3431099B1/en active Active
- 2008-03-31 EP EP23219605.5A patent/EP4368202A2/en active Pending
- 2008-03-31 MX MX2009010549A patent/MX2009010549A/es active IP Right Grant
- 2008-03-31 EP EP08799746.6A patent/EP2139515B2/en active Active
- 2008-03-31 CA CA2682089A patent/CA2682089C/en active Active
- 2008-03-31 AU AU2008232491A patent/AU2008232491B2/en active Active
-
2014
- 2014-12-19 JP JP2014257141A patent/JP2015091247A/ja active Pending
-
2016
- 2016-09-07 US US15/258,584 patent/US10023845B2/en active Active
-
2018
- 2018-07-16 US US16/036,348 patent/US11162080B2/en active Active
-
2021
- 2021-10-28 US US17/513,032 patent/US20220298492A1/en not_active Abandoned
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101621100B1 (ko) | 백신에 유용한 약독화 바이러스 | |
CN111560354B (zh) | 重组新型冠状病毒及其制备方法和应用 | |
CN103540614B (zh) | 包装流感病毒载体的信号 | |
ES2523587T3 (es) | Virus influenza B que tienen alteraciones en el polipéptido hemaglutinina | |
AU2020244533B2 (en) | Recombinant RSV with silent mutations, vaccines, and methods related thereto | |
EP1736539A1 (en) | Attenuated SARS-CoV vaccines | |
WO2018157454A1 (zh) | 一种流感病毒弱毒活疫苗毒株的筛选和鉴定方法 | |
CN112543806A (zh) | 合成嵌合痘苗病毒 | |
CN118215499A (zh) | 去优化的sars-cov-2变异株及其方法和用途 | |
WO2022245888A1 (en) | Seasonal flu rna vaccines and methods of use | |
JP2023532735A (ja) | 組み換えエンテロウイルスおよびその使用 | |
KR101835989B1 (ko) | 인플루엔자 바이러스의 다중 아형 h3 및 h7 에 대한 다중 교차 면역반응을 형성하는 신규한 재조합 인플루엔자 바이러스 및 이를 포함하는 백신 | |
US20240100150A1 (en) | Reverse genetics-based compositions of recombinant sars-cov-2 | |
KR101908905B1 (ko) | 인플루엔자 바이러스의 h9 및 h5의 다중 아형에 대한 교차 면역반응을 형성하는 신규한 재조합 인플루엔자 바이러스 및 이를 포함하는 백신 | |
KR20230038205A (ko) | 키메라 rsv 및 코로나바이러스 단백질, 면역원성 조성물, 및 사용 방법 | |
CN106929486A (zh) | 重组猪流感病毒及其应用 | |
CA2713400A1 (en) | Flaviviridae mutants comprising a deletion in the capsid protein for use as vaccines | |
Inayoshi et al. | Bacterial artificial chromosome-based reverse genetics system for cloning and manipulation of the full-length genome of infectious bronchitis virus | |
US20240228981A1 (en) | Attenuated viruses useful for vaccines | |
WO2023196914A1 (en) | Influenza nucleic acid compositions and uses thereof | |
JP2023525623A (ja) | 核酸構築物、組み換えインフルエンザウイルス、組み換えインフルエンザウイルスを調製するための方法、組成物、および使用 | |
PENG | MURINE MODELS TO STUDY IMMUNITY AND IMMUNISATION AGAINST RESPIRATORY VIRAL PATHOGENS | |
Karkashan | Generation of influenza A virus vectors for the delivery of antigenic proteins | |
Janowicz | Molecular determinants of bluetongue virus virulence | |
LT et al. | INVESTIGACIONES CIENTIFICAS |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |