KR101621100B1 - 백신에 유용한 약독화 바이러스 - Google Patents

백신에 유용한 약독화 바이러스 Download PDF

Info

Publication number
KR101621100B1
KR101621100B1 KR1020097022782A KR20097022782A KR101621100B1 KR 101621100 B1 KR101621100 B1 KR 101621100B1 KR 1020097022782 A KR1020097022782 A KR 1020097022782A KR 20097022782 A KR20097022782 A KR 20097022782A KR 101621100 B1 KR101621100 B1 KR 101621100B1
Authority
KR
South Korea
Prior art keywords
virus
influenza
codon
attenuated
attenuated virus
Prior art date
Application number
KR1020097022782A
Other languages
English (en)
Other versions
KR20100019423A (ko
Inventor
에카르트 위머
스티브 스키나
슈테펜 뮐러
브루스 풋처
디미트리스 파파미하일
존 로버트 콜먼
제로니모 첼로
Original Assignee
더 리서치 파운데이션 오브 스테이트 유니버시티 오브 뉴욕
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=39808891&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=KR101621100(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by 더 리서치 파운데이션 오브 스테이트 유니버시티 오브 뉴욕 filed Critical 더 리서치 파운데이션 오브 스테이트 유니버시티 오브 뉴욕
Publication of KR20100019423A publication Critical patent/KR20100019423A/ko
Application granted granted Critical
Publication of KR101621100B1 publication Critical patent/KR101621100B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • A61K39/125Picornaviridae, e.g. calicivirus
    • A61K39/13Poliovirus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • A61K39/145Orthomyxoviridae, e.g. influenza virus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • A61P31/16Antivirals for RNA viruses for influenza or rhinoviruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • A61P31/18Antivirals for RNA viruses for HIV
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/20Antivirals for DNA viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/20Antivirals for DNA viruses
    • A61P31/22Antivirals for DNA viruses for herpes viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • A61P37/04Immunostimulants
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/525Virus
    • A61K2039/5254Virus avirulent or attenuated
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2720/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsRNA viruses
    • C12N2720/00011Details
    • C12N2720/12011Reoviridae
    • C12N2720/12311Rotavirus, e.g. rotavirus A
    • C12N2720/12361Methods of inactivation or attenuation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/15011Lentivirus, not HIV, e.g. FIV, SIV
    • C12N2740/15061Methods of inactivation or attenuation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2760/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
    • C12N2760/00011Details
    • C12N2760/16011Orthomyxoviridae
    • C12N2760/16061Methods of inactivation or attenuation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2760/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
    • C12N2760/00011Details
    • C12N2760/16011Orthomyxoviridae
    • C12N2760/16111Influenzavirus A, i.e. influenza A virus
    • C12N2760/16121Viruses as such, e.g. new isolates, mutants or their genomic sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2760/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
    • C12N2760/00011Details
    • C12N2760/16011Orthomyxoviridae
    • C12N2760/16111Influenzavirus A, i.e. influenza A virus
    • C12N2760/16134Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2760/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
    • C12N2760/00011Details
    • C12N2760/16011Orthomyxoviridae
    • C12N2760/16111Influenzavirus A, i.e. influenza A virus
    • C12N2760/16161Methods of inactivation or attenuation
    • C12N2760/16162Methods of inactivation or attenuation by genetic engineering
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20061Methods of inactivation or attenuation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/24011Flaviviridae
    • C12N2770/24111Flavivirus, e.g. yellow fever virus, dengue, JEV
    • C12N2770/24161Methods of inactivation or attenuation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/32011Picornaviridae
    • C12N2770/32061Methods of inactivation or attenuation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/32011Picornaviridae
    • C12N2770/32611Poliovirus
    • C12N2770/32621Viruses as such, e.g. new isolates, mutants or their genomic sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/32011Picornaviridae
    • C12N2770/32611Poliovirus
    • C12N2770/32634Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/32011Picornaviridae
    • C12N2770/32611Poliovirus
    • C12N2770/32661Methods of inactivation or attenuation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/32011Picornaviridae
    • C12N2770/32611Poliovirus
    • C12N2770/32661Methods of inactivation or attenuation
    • C12N2770/32662Methods of inactivation or attenuation by genetic engineering
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/32011Picornaviridae
    • C12N2770/32611Poliovirus
    • C12N2770/32671Demonstrated in vivo effect
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/32011Picornaviridae
    • C12N2770/32711Rhinovirus
    • C12N2770/32721Viruses as such, e.g. new isolates, mutants or their genomic sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/32011Picornaviridae
    • C12N2770/32711Rhinovirus
    • C12N2770/32761Methods of inactivation or attenuation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/32011Picornaviridae
    • C12N2770/32711Rhinovirus
    • C12N2770/32761Methods of inactivation or attenuation
    • C12N2770/32762Methods of inactivation or attenuation by genetic engineering
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Abstract

본 발명은 게놈 내 다수 위치에서 조작된 뉴클레오티드 치환을 가지는 변형된 바이러스 게놈을 포함하는 약독화 바이러스로서, 상기 치환이 동의 역최적화 코돈을 게놈 내에 도입하는 것인 약독화 바이러스를 제공한다. 본 약독화 바이러스는 피험체에서 보호 면역 반응을 유발하기 위한 백신 조성물에 사용될 수 있다. 본 발명은 또한 본 약독화 바이러스의 합성 방법도 제공한다. 또한, 본 발명은 피험체에게 본 약독화 바이러스를 포함하는 예방적 유효량의 백신 조성물을 투여하는 단계를 포함하는, 피험체가 바이러스 관련 질환을 앓게 되는 것을 예방하는 방법을 추가로 제공한다.

Description

백신에 유용한 약독화 바이러스{ATTENUATED VIRUSES USEFUL FOR VACCINES}
관련 출원에 대한 상호 참조
본원은 전문이 본원에 각기 참조 인용되는, 미국 특허 출원 제60/909,389호(2007년 3월 30일 출원) 및 미국 특허 출원 제61/068,666호(2008년 3월 7일 출원)에 대해 우선권을 주장한다.
연방 자금지원
본 발명은, 미국립보건원으로부터 승인 번호 제AI15122호 하에, 미국립과학재단으로부터 EIA0325123 하에, 또한 미국립암연구소로부터 T32-CA009176 하에 미정부 지지를 받아 이루어졌다. 따라서, 미정부는 본 발명에 있어 일부 권리를 가진다.
저작권 공고
본 특허 문헌의 개시내용의 일부는 저작권 보호의 대상이 되는 요지를 포함한다. 저작권 소유자는, 미특허상표청 특허 파일 또는 기록에 나와 있을 때, 특허 문헌 또는 특허 개시내용이 혹자에 의해서 팩스로 재현됨에 대해 이의를 제기하지 않으나, 그와 다른 방식으로는 일체의 모든 저작권 권리를 보유한다.
기술 분야
본 발명은 복수개의 뉴클레오티드 치환을 가지는 변형된 바이러스 게놈을 포 함하는 약독화 바이러스의 생성에 관한 것이다. 뉴클레오티드 치환은 코돈의 다른 동의 코돈으로의 교환 및/또는 코돈 재배열 및 코돈 쌍 편향(codon pair bias)의 변화를 초래한다.
DNA 합성 기술에 있어서의 급진적 향상은 분명 바이러스학에 이용되는 종래 방법을 혁신하게 될 것이다. 바이러스 게놈의 상이한 영역의 기능을 제거하는 데 종래 사용되는 방법들 중 하나는, 바이러스 균주의 게놈 내 작은 서열 변화의 영향을 탐색하기 위해 부위 지정 돌연변이유발을 광대하나 수고스럽게도 사용한다. 그러나, 바이러스 게놈, 특히 RNA 바이러스의 바이러스 게놈은 비교적 작은데, 종종 10,000개 미만의 염기 길이를 가지며, 이에 따라 현재 이용 가능한 기술을 이용하는 전체 게놈 합성에 순응적이다. 최근 개발된 마이크로유체 칩 기반 기술은, 각기 수백 달러만으로 사양에 맞게 설계되는 새 게놈의 신생 합성(de novo synthesis)을 수행할 수 있다. 이는 전체적으로 신규한 코딩 서열을 생성하도록 하거나, 현존 서열을 종래 클로닝 방법으로는 실제로 불가능했던 정도까지 조절하도록 한다.
설계의 그러한 자유는, (1) 바이러스 번역 및 복제 효율에 대한 코돈 편향, 코돈 쌍 편향 및 RNA 2차 구조와 같은 파라미터들의 변화의 영향을 연구하고; (2) 성공적인 바이러스 재생에 필요한 미지의 조절 요소 및 기타 신호를 위한, 효율적 완전 게놈 스캔을 수행하며; (3) 바이러스 균주의 유전적 조작 및 항바이러스 백신의 설계를 위한 신규 생물공학을 발달시키기 위해, DNA/RNA 코딩 서열의 대규모 재설계를 수행하도록 하는 거대한 추진력을 제공한다.
유전 암호 축퇴성의 결과로서, 단백질 코딩 서열 내 2개의 아미노산을 제외한 모든 것은 하나 초과의 코돈에 의해 코딩될 수 있다. 그러한 동의 코돈이 사용되는 빈도는 동일하지 않고, 드물거나 다른 경우에서라면 불리하게 되는 tRNA에 종종 상응하는 차선적 코돈의 과다 사용을 피하기 위해 세포의 번역 기구와 공진화하였다(coevolved)(문헌 [Gustafsson et al., 2004]). 이는 "동의 코돈 편향"으로 칭해지는 현상을 초래하는데, 이 현상은 진화적으로 거리가 있는 종들 간에, 또한 가능하게는 동일한 종 내 상이한 조직들 간에 크게 다양하다(문헌 [Plotkin et al., 2004]).
재조합 방법에 의한 코돈 최적화(즉, 유전자의 동의 코돈 사용빈도(codon usage)를 숙주 세포의 코돈 편향에 상응하도록 함)는 교차-종 발현을 향상시키기 위해 널리 사용되어 왔다(예를 들어, 문헌 [Gustafsson et al., 2004] 참조). 차선적 동의 코돈을 의도적으로 도입함으로써 발현을 감소시키는 반대 목적이 심의 연구되지는 않았으나, 별도의 보고는 희소 코돈에 의한 천연 코돈의 치환이 상이한 생물체들에서의 유전자 발현 수준을 감소시킬 수 있음을 가리킨다. 예를 들어, 문헌 [Robinson et al., 1984]; 문헌 [Hoekema et al., 1987]; 문헌 [Carlini and Stephan, 2003]; 문헌 [Zhou et al., 1999]을 참조한다. 따라서, 역최적화 동의 코돈(deoptimized synonymous codon)이 바이러스 게놈 내로 도입됨은 단백질 번역에 부정적 영향을 줄 수 있고, 이에 의해 바이러스성 질환에 대항하는 백신을 제조하는 데 유용할 약독화 바이러스를 생성하는 생성 방법을 제공한다.
바이러스성 질환 및 백신
바이러스는 항상 인간에서의 사망 및 질환의 주요 원인들 중 하나였다. 세균성 질환과 달리, 바이러스성 질환은 항생제가 잘 듣지 않아, 치료하기 어렵다. 따라서, 백신접종이 바이러스에 저항한 인류의 주되고 가장 강한 방어책이었다. 오늘날, 가장 오래되고 가장 심각한 바이러스성 질환들 중 일부, 예컨대 천연두 및 급성 회백수염(소아마비)가 전세계적 면역화 프로그램에 의해 근절되어(또는 거의 근절되어) 왔다. 그러나, 다른 많은 오랜 바이러스들, 예컨대 리노바이러스 및 인플루엔자 바이러스는 잘 억제되지 않고, 여전히 실질적 문제들을 발생시키는데, 이들 문제는 해를 거듭할수록, 또한 국가별로 다양하다. 부가적으로, 새 바이러스, 예컨대 인간 면역결핍 바이러스(HIV) 및 중증 급성 호흡기 증후군(SARS) 바이러스가 인간 집단에서 정규적으로 나타나고, 종종 치명적 전염병을 유발한다. 또한, 인간에 의해 제조되거나 인간에 의해 변경된 치명적 바이러스가 전쟁 또는 테러의 수단으로서 의도적으로 도입될 가능성이 있다.
백신의 효과적 제조가 예측 불가능한 과업으로 남아 있다. 백신에는 3가지 주된 종류가 있는데, 이는 즉, 서브유닛 백신, 불활성화된(사멸된) 백신 및 약독화 생백신이다. 서브유닛 백신의 경우, 바이러스로부터의 하나 또는 수가지의 단백질(예를 들어, 재조합 DNA 기술을 이용하에 제조된 캡시드 단백질)이 백신으로 사용된다. 에쉐리키아 콜라이(Escherichia coli) 또는 효모에서 생성된 서브유닛 백신이 매우 안전하고, 바이러스성 질환의 위협도 주지 않는다. 그러나, 면역원성 바이러스 단백질 모두가 존재하는 것도 아니고 존재하는 것들도 이들의 본래 형태로 존재하지 않을 수 있기 때문에, 상기 백신들의 효능은 낮을 수 있다.
불활성화된(사멸된) 백신은 다소 야생형(wt)인 바이러스를 증식시킨 후, 그것을 예를 들어 (소크(Salk) 소아마비 백신에서와 같이) 포름알데히드로 불활성화함으로써 제조된다. 바이러스 모두를 사멸시키나 입자의 면역원성은 저해하지 않는 불활성화 처리법을 찾기 위해서는 상당의 실험이 요해진다. 부가적으로, 바이러스를 증식시키는 시설이 독성 바이러스가 빠져나가도록 할 수 있거나, 불활성화가 실패할 수 있다는 나머지 안전 과제가 남아 있다.
약독화 생백신은, 돌연변이가 일어나도록 하여 덜 독성이도록 한 것이면서 면역화를 위해 사용가능한 바이러스를 포함한다. 약독화 생바이러스는 백신과 같이 많은 이점들을 가지는데: 즉, 이는 종종 제조하기 용이하고 빠르고 저렴하며; 종종 투여하기 용이하며(예를 들어, 세이빈(Sabin) 소아마비 백신은 각설탕을 통해 경구 투여됨); 때때로 약독화 바이러스의 잔여 증식은 "군집" 면역화(일차 환자와 근접하게 접촉된 사람들의 면역화)를 허용한다. 이 이점들은 특히 백신이 조속히 필요한 긴급상황에 중요하다. 약독화 백신의 주요 결점은, 그것이 wt 독성(virulence)으로의 복귀(reversion) 빈도가 다소 상당하다는 점이다. 이러한 이유로, 세이빈 백신이 미국에서는 더 이상 사용되지 않는다.
따라서, 복귀 가능성이 실제로 없고, 이에 따라 백신을 제조하기에 빠르고 효율적이며 안전한 방법을 제공하는 약독화 생바이러스의 계통적 생성 방법에 대한 필요성이 여전히 존재한다. 본 발명은 수백개 또는 수천개의 작은 결손들을 가지고 있기 때문에 복귀 가능성이 본질적으로 가지고 있지 않은 약독화 생바이러스를 생성하기 위한 계통적 방법인 합성 약독화 바이러스 조작(SAVE)을 제공함으로써, 상 기 필요성을 충족한다. 이 방법은 다종 다양한 바이러스들에 광범위하게 적용 가능하고, 다종 다양한 항바이러스 백신을 제조하기 위한 효과적 방법을 제공한다.
발명의 개요
본 발명은, 게놈 내 다수 위치에서 조작된 뉴클레오티드 치환을 가지는 변형된 바이러스 게놈을 포함하는 약독화 바이러스로서, 상기 치환이 동의 역최적화 코돈을 게놈 내에 도입하는 것인 약독화 바이러스를 제공한다. 이러한 동의 코돈의 치환은 게놈 내의 코돈 편향, 코돈 쌍 편향, 역최적화 코돈 및 역최적화 코돈 쌍의 밀도, RNA 2차 구조, CpG 디뉴클레오티드 함량, C+G 함량, 번역 틀이동 부위, 번역 휴지 부위, 조직 특이적 마이크로RNA 인식 서열의 존재 또는 부재, 또는 이들의 조합을 포함한 각종 파라미터들을 변경시킨다. 본 발명의 약독화 바이러스는 관련된 다수의 결손으로 인해, 매우 다양한 바이러스성 질환들에 대항한 안정하게 약독화된 생백신을 생성하는 수단을 제공한다.
한 실시양태에서, 모(parent) 바이러스의 상응하는 서열과 동일한, 바이러스 단백질을 코딩하는 핵산 서열 또는 이의 일부를 포함하는 약독화 바이러스가 제공되는데, 여기에서 약독화 바이러스의 뉴클레오티드 서열은 유래의 기원이 되는 모 서열의 코돈을 가지고, 뉴클레오티드 서열은 모 바이러스의 뉴클레오티드 서열과 90% 미만 동일하다. 또 다른 실시양태에서, 뉴클레오티드 서열은 모 바이러스의 서열과 80% 미만 동일하다. 약독화를 제공하는 치환된 뉴클레오티드 서열은 100개 이상의 뉴클레오티드로 된 길이를 가지거나, 250개 이상의 뉴클레오티드로 된 길이를 가지거나, 500개 이상의 뉴클레오티드로 된 길이를 가지거나, 1000개 이상의 뉴클레오티드로 된 길이를 가진다. 약독화 서열의 코돈 쌍 편향은 모 바이러스의 코돈 쌍 편향보다 작고, 약 0.05 이상, 또는 약 0.1 이상, 또는 약 0.2 이상 감소된다.
약독화할 바이러스는 동물 또는 식물 바이러스일 수 있다. 특정 실시양태들에서, 바이러스는 인간 바이러스이다. 또 다른 실시양태에서, 바이러스는 다수 종들을 감염시킨다. 특정 실시양태들에는 폴리오바이러스, 인플루엔자 바이러스, 뎅기(Dengue) 바이러스, HIV, 로타바이러스 및 SARS가 포함되나, 이들에 국한되지 않는다.
본 발명은 또한 본 약독화 바이러스 및 약학적으로 허용되는 담체를 포함하는, 피험체에서 보호 면역 반응을 유발하기 위한 백신 조성물을 제공한다. 본 발명은 야생형 숙주 세포 내에 비생존성인 약독화 바이러스에 대해 침해성이 되도록 특수 조작된 변형 숙주 세포주를 추가로 제공한다.
부가적으로, 본 발명은 (a) 바이러스 게놈의 하나 이상의 비조절 부분 내 다수 위치에서, 동의 코돈으로 치환할 코돈을 동정하는 단계; (b) 각각의 동정된 코돈을 치환할 동의 코돈을 선택하는 단계; 및 (c) 각각의 동정된 코돈을 동의 코돈으로 치환하는 단계를 포함하는, 본 약독화 바이러스의 합성 방법을 제공한다.
또한, 본 발명은 코돈 쌍 편향을 조절하기 위해, 동일한 아미노산을 코딩하는 현존 코돈의 코딩 영역 내에서의 순서를 변화시키는 단계를 포함하는, 본 약독화 바이러스의 합성 방법을 제공한다.
또한, 본 발명은 이전의 두 방법을 조합하는, 본 약독화 바이러스의 합성 방법을 제공한다.
본 발명에 따라, 약독화 바이러스 입자는, 바이러스 게놈을 숙주 세포 내로 형질감염시킴으로써 약독화 바이러스 입자를 생성시킴에 의해 만들어진다. 본 발명은 면역화에 적당한 약독화 바이러스를 포함하는 약학적 조성물을 추가로 제공한다.
본 발명은 피험체에게 예방적 또는 치료적 유효량의 본 백신 조성물을 투여하는 단계를 포함하는, 피험체에서 보호 면역 반응을 유발하는 방법, 피험체가 바이러스 관련 질환을 앓게 되는 것을 예방하기 위한 방법, 및 바이러스 감염 피험체에서의 바이러스 관련 질환의 발병을 지연시키거나 진행 속도를 늦추는 방법을 추가로 제공한다.
본 발명은 게놈 내 다수 위치에서 조작된 뉴클레오티드 치환을 가지는 변형된 바이러스 게놈을 포함하는 약독화 바이러스로서, 상기 치환은 복수개의 동의 코돈을 게놈 내에 도입하는 것이고, 상기 뉴클레오티드 치환은 먼저 각각의 아미노산 허용 위치에 동의 코돈을 무작위 정렬함으로써 코딩 서열을 생성하고, (a) 동일한 아미노산을 코딩하는 코돈 쌍을 무작위 선택하고 교환하거나, (b) 모의 어닐링 최적화에 따라 동의 코돈을 치환하고, 추가적 향상(쌍 스코어 또는 편향의 변화)이 솔루션이 최적 또는 근최적 값에 수렴할 때까지 특정수 또는 충분수로 반복함에 대해 관찰되지 않을 때까지 이전 단계를 반복하는 단계를 포함하는 과정에 의해 선택되는 것인 약독화 바이러스를 추가로 제공한다.
도면의 간단한 설명
도 1. 합성 P1 캡시드 설계에서의 코돈 사용 통계. PV-SD는 서열 내 코돈 위치 변화를 최대화하면서, wt 대비 거의 동일한 코돈 빈도를 유지한다. PV-AB 캡시드에서, 바람직하지 않은 코돈의 사용을 최대화하였다. 막대의 길이 및 각 막대 뒤의 수는 서열 내의 각 코돈의 출현(occurrence)을 가리킨다. 참조로, 각 아미노산에 대한 정상 인간 동의 코돈 빈도(백분율로서 표현되는 "Freq.")가 세 번째 열에 제시되어 있다.
도 2. PV(M), PV-AB 및 PV-SD 캡시드 코딩 영역의 서열 정렬. 멀트알린(MultAlin) 온라인 소프트웨어 툴을 이용하여, PV(M)(서열 번호 1), PV-AB(서열 번호 2) 및 PV-SD(서열 번호 3)의 뉴클레오티드 서열을 정렬하였다(문헌 [Corpet, 1988]). 서열 위의 수는 캡시드 서열 내의 위치를 가리킨다. 뉴클레오티드 1은 PV(M) 바이러스 게놈 내의 뉴클레오티드 743에 상응한다. 일치 서열에서, 3개의 모든 서열 내 동일한 뉴클레오티드의 출현은 대문자로 표시되어 있고; 3개의 서열 중 2개의 서열 내 동일한 뉴클레오티드의 출현은 소문자로 표시되어 있으며; 3개의 서열 내 3개의 상이한 뉴클레오티드의 출현은 점으로 표시되어 있다.
도 3. 코돈 역최적화 바이러스 표현형. (A) 본 연구에 사용된 바이러스 작제물의 개요. (B) HeLa 세포 단층에서의 1단계 증식 동역학 특성. (C 내지 H) 인큐베이션 48시간 후(C 내지 F) 및 72시간(G 및 H)의 코돈 역최적화 바이러스의 플라크 표현형; 항3Dpo1 항체로 염색하여, 감염 세포를 가시화함. (C) PV(M), (D) PV-SD, (E) PV-AB, (F) PV-AB755-1513, (G 및 H) PV-AB2470-2954. 클리어된 플라크 부위가 감염 세포의 테두리에 의해 표시되어 있다(C 및 D). (H) 패널 G에 나타낸 웰의 후속 크리스탈바이올렛 염색 후, PV-AB2470-2954에 대해서는 플라크가 나타나지 않는다. (I 및 J) 48시간 동안의 감염 후, PV(M)에 의해 생성된 면역염색된 플라크의 말단(I) 또는 PV-AB2470-2954에 의해 생성된 감염 병소(J)의 현미경사진.
도 4. 코돈 역최적화는 특이적 감염력(specific infectivity)의 감소를 초래한다. (A) PV(M)(레인 1), PV-AB755-1513(레인 2), 및 PV-AB2470-2954(레인 3)의 정제된 바이러스 입자로부터 단리된 비리온 게놈 RNA의 아가로스 겔 전기영동. (B) 정제된 PV(M)(레인 1), PV-AB755-1513(레인 2), 및 PV-AB2470-2954(레인 3) 바이러스 입자의 은-염색 SDS-PAGE 단백질 겔. 4가지 캡시드 단백질 중 보다 큰 3가지(VP1, VP2, 및 VP3)가 나와 있고, 바이러스 제제의 순도 및 상대량을 나타낸다. (C) 폴리오바이러스 수용체-알칼리성 포스파타제(CD155-AP) 융합 단백질 프로브를 이용한 바이러스 포착 ELISA의 개발. 바이러스 특이적 항체를 사용하여, ELISA 플레이트를 코팅하였고, 미지의 바이러스 농도를 가지는 샘플을 적용한 후, CD155-AP로 검출하였다. 기지량의 정제된 wt 바이러스와 병행하여, 표준 곡선을 이용하여 바이러스 농도를 계산하였다(E). (D) 정제된 바이러스 및 추출된 비리온 RNA의 양을 분광광도법으로 정량하였고, 입자 또는 게놈 등가물(1 게놈 = 1 비리온)의 수를 계산하였다. 부가적으로, ELISA에 의해 비리온 농도를 측정하였다. 플라크/감염 병소 검정법에 의해, 각 바이러스의 감염성 역가를 측정하였고, 특이적 감염력을 PFU/입자 또는 FFU/입자로서 계산하였다.
도 5. 코돈 역최적화 바이러스 및 야생형 바이러스의 시험관내 번역. 게놈 번역의 수준으로 PV-AB 표현형을 결정한다. (A) 외인성 부가 아미노산 및 tRNA의 존재 하에서의 HeLa S10 추출물에 있어서의 표준 시험관내 번역은, PV(M) wt 대비, 코돈 역최적화 게놈의 번역 용량의 차이를 나타내지 않는다. 12.5% SDS-PAGE 겔 상에 분리된 [35S]메티오닌 표지 번역 산물의 방사능 사진이 나와 있다. 이상 밴드(*)의 동일성이 알려져 있지 않다. (B) 외인성 아미노산 및 tRNA 없이, 또한 경쟁 세포 mRNA의 존재 하, 비투석 HeLa S10 추출물에 있어서의 시험관내 번역은 코돈 역최적화 PV 게놈의 번역 용량에 있어서의 결손을 드러낸다. 10% SDS-PAGE 겔 상에서 분리된 폴리오바이러스 2C 반응성 번역 산물(2CATP아제, 2BC 및 P2)의 웨스턴 블롯이 나와 있다. 2BC 번역 산물의 상대량이 wt 밴드의 백분율로서 각 레인 아래에 표시되어 있다.
도 6. 디시스트론성 리포터 레플리콘을 이용한 생체내 번역의 분석에 의해, PV 번역에 대한 코돈 역최적화의 유해한 영향이 확인된다. (A) 디시스트론성 레플리콘의 개략도. 각종 P1 캡시드 코딩 서열을 반딧불 루시퍼라제 유전자(F-Luc)의 업스트림에 삽입하였다. 내부 대조군(R-Luc) 대비, F-Luc의 변화 수준을 측정하면, P1 캡시드 영역을 통한 리보솜 전이가 정량된다. (B) 레플리콘 RNA를 HeLa 세포 내로 형질감염시키고, 2 mM 구아니딘-염산염의 존재 하에 7시간 동안 인큐베이션하여, RNA 복제를 차단하였다. P1 영역을 통한 상대적 번역 속도는 코돈 역최적화 정도에 반비례하였다. 2개의 생존 가능한 바이러스 작제물, PV-AB2470-2954 및 PV-AB2954-3386의 캡시드 코딩 서열이 60 내지 80%의 wt 번역을 허용하는 반면, 20% 미만의 번역 효율은 PV-AB, PV-AB2470-3386 및 PV-AB1513-2470 게놈으로 관찰되는 치사 표현형과 관련된다. 값은 3가지 독립적 실험의 6가지 검정법의 평균을 나타낸다.
도 7. 인간 및 바이러스 ORF의 코돈 쌍 편향의 결정. 도트는 길이에 대해 플로팅된 한 ORF에 대한 코돈 쌍 당, 평균 코돈 쌍 스코어를 나타낸다. 14,795개의 주석(annotated) 인간 유전자에 대해 코돈 쌍 편향(CPB)을 계산하였다. 과소표시된 코돈 쌍은 음의 스코어를 산출한다. CPB가, 화살표를 갖는 기호에 의해 표시되어 있는 바, 각종 폴리오바이러스 P1 작제물에 대해 플로팅되어 있다. 본 도면은 인간 유전자의 벌크가 0.1 주위에 군집화됨을 도시한다. CPB가 PV(M)-wt("WT"로 표지)(-0.02), 맞춤화 합성 폴리오바이러스 캡시드 PV-Max(+0.25), PV-Min(-0.48), 및 PV(M)-wt:PV-Min 키메라 캡시드 PV-Min755-2470(="PV-MinXY")(-0.31) 및 PV-Min2470-3386(="PV-MinZ")(-0.20)에 대해 나와 있다. 바이러스 PV-SD 및 PV-AB는 변경되지 않은 코돈 쌍 편향의 결과가 아니라, 변경된 코돈 편향에 대한 결과이다.
도 8. 코돈 쌍 역최적화 폴리오의 특성. 1단계 증식 동역학 특성은, PV(M)-wt와 대비하여, 약 2.5 차수 등급으로 감소된 PV-Min755-2470 및 PV-Min2470-3385에 대한 PFU 생성을 나타낸다. 그러나, 모든 바이러스들이 유사한 수의 바이러스 입자를 생성시킨다(본 도면에는 나와 있지 않음). 그 결과, 코돈 역최적화 바이러스 PV-AB755-1513 및 PV-AB2470-2954와 마찬가지로, PFU/입자 비가 감소된다(도 3B)(PFU는 "플라크 형성 단위"임).
도 9. 키메라 바이러스 게놈의 어셈블리. 표적 게놈(적색)을 통해 "스캔"하기 위해, 소분절을 증폭시키거나 합성하여, 중첩 PCR에 의해 wt 게놈(흑색) 내로 도입한다.
도 10. 인플루엔자 A 바이러스의 생성을 위한 8개 플라스미드 pol I-pol II 시스템. 인간 pol I 프로모터와 pol II 프로모터 사이에 삽입된 8개의 바이러스 cDNA를 가지는 8개의 발현 플라스미드를 진핵생물 세포 내에 형질감염시킨다. 각 플라스미드가 2개의 상이한 프로모터를 보유하기 때문에, 세포 pol I 및 pol II 모두가, 추정컨대 상이한 핵 구획에서, 플라스미드 주형을 전사할 것이며, 그 결과, 바이러스 mRNA 및 vRNA가 합성되게 된다. 바이러스 중합효소 복합체 단백질(PB1, PB2, PA, 핵단백질)의 합성 후, 바이러스 복제 사이클이 개시된다. 궁극적으로, 세포 전사 및 번역 기구(machinery)로부터 직접적으로(pol II 전사) 또는 간접적으로(pol I 전사 및 바이러스 복제) 유래된 모든 바이러스 분자의 어셈블리는, 모든 합성된 분자(vRNP 및 구조 단백질 HA, NA, M1, M2, NS2/NEP)의 상호작용을 초래하여, 감염성 인플루엔자 A 바이러스를 발생시킨다. (문헌 [Reproduced from Neumann et al., 2000.]) (주: 인플루엔자의 신생 합성을 위한 다른 방법들도 있다).
도 11. 폴리오바이러스 게놈 및 합성 바이러스 작제물. 폴리오바이러스 게놈 및 키메라 바이러스 작제물의 개방 해독틀. 상단은 전장 PV(M)-wt 게놈 RNA의 개략도이고, 하단은 PV(M)-wt, CPB 맞춤화 합성 바이러스 PV-Max, PV-Min, 및 PV(M)-wt:PV-Min 키메라 바이러스의 개방 해독틀이다. 흑색은 PV(M)-wt 서열에 해당하고, 회색은 PV-Min 합성 서열에 해당하며, 이엉모양(Thatched)은 PV-Max에 해당한다. 강조된 바이러스 작제물들이, PV-Min755-2470(PV-MinXY) 및 PV-Min2470-3385(PV-MinZ)가 현저히 약독화된 표현형으로 인해 더욱 특징화되었다.
도 12. 1단계 증식 곡선은 감소된 감염력과 함께 유사한 양의 입자를 생성하는, 유사한 동역학적 특성을 나타낸다. (A) 2의 MOI를 사용하여, HeLa R19 세포의 단층을 감염시키고, 주어진 시점(0, 2, 4, 7, 10, 24, 48시간)에서의 PFU를 플라크 검정법에 의해 측정하였다. 상응 기호: (□) PV(M)-wt, (●) PV-Max, (◇) PV-Min755-1513, (×) PV-Min1513-2470, (◆) PV-MinXY, (△) PV-MinZ. (B)는 각 시점에서의 계산된 PFU/ml를 입자/ml로 전환시킴을 나타낸다. 이는 PFU/ml를 개별 바이러스 특이적 감염력과 곱함으로써 수득되었다. 상응 기호는 (A)에서와 같다.
도 13. CPB의 변경에 의한 번역의 생체내 조절. (A) CPB의 생체내 영향을 정량하기 위해 사용되는 디시스트론성 RNA 작제물은 번역 시에 있다. 첫 번째 시스트론은 레닐라(Renilla) 루스퍼라제(R-Luc)의 번역을 유도하는 C형 간염 바이러스(HCV) 내부 리보솜 부착 부위(IRES)를 이용한다. 이 첫 번째 시스트론은 투입 RNA의 양을 정규화하기 위해 사용되는 내부 대조군이다. PV(M)-wt IRES에 의해 조절되는 두 번째 시스트론은 반딧불 루스퍼라제(F-Luc)의 번역을 유도한다. 작제물에서의 "P1"으로 표지된 영역은 개별 바이러스 P1의 cDNA에 의해 치환되었다. (B) 각 개별 RNA 작제물을 2 mM 구아니딘 염산염의 존재 하에 HeLa R19 세포 내로 형질감염시켰고, 6시간 후, R-LucF-Luc를 측정하였다. F-Luc/R-Luc 값을 PV(M)-wt 번역(100%) 대비 정규화하였다.
도 14. 합성 바이러스의 열 불활성화 프로파일은 변하지 않는다. 캡시드 단백질이 미스폴딩된 경우에 기대할 수 있는 바와 같이, 대규모 코돈 쌍 편향이 비리온의 총 형태를 변경시키는 것을 배제하기 위해, PVMinXY 및 PV-MinZ의 열 안정성을 시험하였다. 동일한 수의 입자들을 50℃에서 인큐베이션하였고, 잔존 감염력을 주어진 시간 후에 플라크 검정법을 통해 정량하였다. 합성 바이러스의 캡시드가 탈안정화되면, wt PV(M) 대비, 50℃에서의 생존력의 손실이 증가할 것으로 본 발명자들은 예상한다. 여기에서는 그러하지 않았다. 양 합성 바이러스 모두의 열 불활성화 동역학 특성이 wt와 동일하였다. 대조적으로, 세이빈-1 바이러스는 캡시드를 코딩하는 게놈 내에 다수의 돌연변이를 가지며, 이는 적합하게도 이 바이러스를 wt PV1(M) 대비 덜 열 안정화하도록 만들었다.
도 15. 백신접종 후의 중화 항체 역가. 8마리의 CD155 tg 마우스(그 중 7마리는 처방을 완료함)로 된 한 군에, 각기 PV-MinZ(
Figure 112009066775576-pct00001
) 및 PV-MinXY(◆)의 108개 입자를 주 간격으로 3회 복강내 주사에 의해 접종하였고, 혈청 전환율을 백신접종 후 10일에 측정하였다. 각 데이터 집합에 횡단하는 수평선은, 각 바이러스 작제물에 대한 평균 중화 항체를 표시한다. 마이크로중화 검정법을 통해, 항폴리오바이러스 항체 역가를 측정하였다. (*) 모의 백신접종(mock-vaccination)된 동물에 대한 바이러스 중화가 최저 시험 1:8에서 검출되지 않았다.
도 16. 코돈 쌍-역최적화 NP 분절을 가지는 인플루엔자 바이러스. (A) A/PR8-NPMin 바이러스는 생존력이 있고, A/PR8 wt에 비해, MDCK 세포 상에 보다 작은 플라크를 생성시킨다. (B) A/PR8-NPMin 바이러스는 지연된 증식 동역학 특성을 나타내고, 최종 역가는 야생형 A/PR8에 비해 3 내지 5배 더 낮다.
도 17. 코돈 쌍-역최적화 PB1 또는 HA 및 NP 분절을 가지는 인플루엔자 바이러스. (A) A/PR8-PB1Min-RR 및 A/PR8-HAMin/NPMin 바이러스는 생존력이 있고, A/PR8 야생형에 비해, MDCK 세포 상에 보다 작은 플라크를 생성시킨다. (B) A/PR8-PB1Min-RR 및 A/PR8-HAMin/NPMin 바이러스는 지연된 증식 동역학 특성을 나타내고, 최종 역가는 야생형 A/PR8에 비해 약 10배 더 낮다.
도 18. BALB/c 마우스 모델에서의 A/PR8-NP Min 의 약독화. (A) A/PR8-NPMin 바이러스는 백신접종 시 체중 손실에 의해 결정할 때, 야생형 A/PR8 바이러스에 비해 감소된 병원성을 가진다. (B) A/PR8-NPMin 바이러스로 백신접종된 모든 마우스들(8마리 중 8마리)이 생존한 반면, A/PR8로 감염된 단지 25%(8마리 중 2마리) 마우스만이 백신접종 후 13일째에 생존하였다. (C) A/PR8-NPMin 바이러스로 백신접종된 마우스는 A/PR8 야생형 바이러스의 LD50의 100배를 이용한 공격접종(challenge)으로부터 보호된다.
발명의 상세한 설명
본 발명은 바이러스 감염 및 질환으로부터 보호하기 위한 백신으로서 사용될 수 있는 약독화 바이러스의 제조에 관한 것이다. 따라서, 본 발명은, 게놈 내 다수 위치에서 조작된 뉴클레오티드 치환을 가지는 변형된 바이러스 게놈을 포함하는 약독화 바이러스로서, 상기 치환이 복수개의 동의 코돈 및/또는 동일한 아미노산에 대한 현존 코돈의 순서의 변화(코돈 쌍 이용의 변화)를 게놈 내에 도입하는 것인 약독화 바이러스를 제공한다. 양 경우 모두에서, 바이러스 유전자 산물의 원래의 야생형 아미노산 서열이 보유된다.
대부분의 아미노산이 1개 초과의 코돈에 의해 코딩된다. 표 1에 있는 유전 암호를 참조한다. 예를 들어, 알라닌은 GCU, GCC, GCA 및 GCG에 의해 코딩된다. 3개의 아미노산(Leu, Ser 및 Arg)이 6개의 상이한 코돈에 의해 코딩되는 반면, 단지 Trp 및 Met만이 독특한 코돈을 가진다. "동의(synonymous)" 코돈은 동일한 아미노산을 코딩하는 코돈이다. 따라서, 예를 들어, CUU, CUC, CUA, CUG, UUA 및 UUG는 Leu를 코딩하는 동의 코돈이다. 동의 코돈은 동등한 빈도로 사용되지 않는다. 일반적으로, 한 특정 생물체에서 가장 빈번히 사용되는 코돈은 동족 tRNA가 풍부한 코돈이며, 이러한 코돈의 사용은 단백질 번역의 속도 및/또는 정확도를 증진시킨다. 역으로, 희소하게 사용되는 코돈에 대한 tRNA는 비교적 낮은 수준으로 발견되고, 희소 코돈의 사용은 번역 속도 및/또는 정확도를 감소시키는 것으로 사료된다. 따라서, 핵산 내 주어진 코돈을 동의적이나 덜 빈번하게 사용되는 코돈에 의해 치환하는 것은, "역최적화" 코돈을 핵산 내로 치환하는 것이다.
Figure 112009066775576-pct00002
a 한 특정 아미노산을 코딩하는 각 코돈 내의 첫 번째 뉴클레오티드가 최좌측에 있는 열에 나와 있고; 두 번째 뉴클레오티드가 상단 행에 나와 있으며; 세 번째 뉴클레오티드가 최우측의 열에 나와 있다.
부가적으로, 주어진 생물체는 주어진 코돈 A의 최근접 코돈 이웃에 대한 선호를 가지는데, 이는 코돈 쌍 이용에서의 편향으로 칭해진다. 현존 코돈을 변화시키지 않으면서 코돈 쌍 편향을 변화시키는 것은, 단백질 합성 및 단백질 생성의 속도에 영향을 줄 수 있다.
본 발명의 각종 실시양태들에서, 바이러스는 DNA, RNA, 이중 가닥 또는 단일 가닥의 바이러스이다. 추가 실시양태들에서, 바이러스는 동물 또는 식물을 감염시킨다. 바람직한 실시양태들에서, 동물은 인간이다. 다수의 동물 바이러스들이 질환을 유발하는 것으로 공지되어 있다(이하 참조). 일부 의학적으로 중요한 바이러스, 예컨대 공수병, 중증 급성 호흡기 증후군(SARS) 및 조류 독감을 유발하는 바이러스가 또한 그것들의 정상 비인간 숙주로부터 인간에게 전파될 수 있다.
바이러스는 또한 식물 병원체의 주요군을 구성하고, 유전자도입 식물의 생성을 위한 바이러스 벡터를 개발하기 위한 연구가 진행 중이다. 그러한 벡터의 이점에는, 식물의 형질전환 용이성, 단일 형질전환 세포로부터 유전자도입 식물의 재생 필요를 사전 방지하는 성숙 식물을 형질전환하는 능력, 및 세포당 다수의 카피수의 바이러스로부터의 외래 유전자의 높은 발현 수준이 포함된다. 그러나, 이러한 벡터의 주요 결점들 중 하나는, 바이러스의 병원성 오염물질로부터 필수 바이러스 복제 기능을 분리할 수 없었다는 점이다. 본원에 개시된 SAVE 기법은 식물 형질전환을 위한 비병원성 바이러스 벡터의 조작 수단을 제공할 수 있다.
인간에서의 주요 바이러스 병원체
바이러스 병원체는 인간 및 기타 동물들에 있어 많은 질환들의 원인적 작용제이다. 인간에 있어서의 바이러스성 질환의 공지된 예에는, 일반 감기(인간 리노바이러스, HRV에 의해 유발됨), 인플루엔자(인플루엔자 바이러스), 수두(바리셀라-조스터(varicella-zoster) 바이러스), 홍역(파라믹소(Paramyxo) 바이러스), 유행성 이하선염(파라믹소 바이러스), 급성 회백수염(폴리오바이러스, PV), 공수병(리싸(Lyssa) 바이러스), 단순성 포진(단순 포진 바이러스[HSV] 1형), 및 생식기 헤르페스(HSV 2형)가 포함된다. 아동을 위한 백신접종 프로그램을 도입하기 전에, 이들 중 다수가 전세계 통상의 아동기 질환이었고, 여전히 일부 개발도상국가에서 유의적인 위협 요소이다. 바이러스성 질환에는 또한 인간 면역결핍 바이러스(HIV)에 의해 유발되는 후천성 면역결핍 증후군(AIDS), SARS 코로나바이러스에 의해 유발되는 중증 급성 호흡기 증후군(SARS), 조류 독감(인플루엔자 A 바이러스의 H5N1 서브타입), 에볼라(Ebola)(에볼라바이러스), 말부르크 출혈 열(Marburg haemorrhagic fever)(말부르크 바이러스), 뎅기열 열(플라비바이러스 혈청형), 웨스트나일 뇌염(West Nile encephalitis)(플라비바이러스(flavivirus)), 감염성 단핵구증(엡스타인-바(Epstein-Barr) 바이러스, EBV), 간염(C형 간염 바이러스, HCV; 간염 B 바이러스, HBV), 및 황열(플라비바이러스)과 같은 더욱 심각한 질환들도 포함된다. 일부 유형의 암도 또한 바이러스에 의해 유발될 수 있다. 예를 들어, 인간 유두종 바이러스(HPV)에 의한 대부분의 감염은 양성이나, HPV는 자궁경부암과 관련된 것으로 나타났고, AIDS 환자에서 우세하게 나타나는 종양인 카포시 육종(KS)은 카포시 육종 관련 헤르페스바이러스(KSHV)에 의해 유발된다.
바이러스가 세포 내에 서식하고 재생을 위해 숙주 세포의 기구를 이용하기 때문에, 이는 숙주 세포을 사멸시키지 않고는 제거되기 어렵다. 바이러스성 질환에 대항하기 위한 가장 효과적인 방법은, 감염에 대한 내성을 제공하기 위해 감염의 위험에 놓인 대상의 백신접종이었다. 일부 질환들(예를 들어, 수두, 홍역, 유행성 이하선염, 황열)에 대해, 효과적인 백신이 이용 가능하다. 그러나, 다른 많은 바이러스성 질환들에 대한 백신을 개발하기 위한 필요성이 절박하다. 본원에 기재된 백신의 제조를 위한 SAVE(합성 약독화 바이러스 조작) 방법은, 원칙적으로 역유전학(reverse genetics) 시스템(이하 참조)이 이용 가능한 모든 바이러스들에 대해 적용 가능하다. 이 방법은 급성 회백수염, 일반 감기, 및 인플루엔자를 위한 약독화 바이러스 백신을 개발하기 위해 SAVE의 적용에 초점을 두는 것으로 본원에서 예시된다.
임의의 바이러스가 본원에 개시된 방법에 의해 약독화될 수 있다. 바이러스는 dsDNA 바이러스(예를 들어, 아데노바이러스, 헤르페스바이러스, 수두 바이러스), 단일 가닥의 "플러스(plus)" 센스 DNA 바이러스(예를 들어, 파르보바이러스), 이중 가닥의 RNA 바이러스(예를 들어, 레오바이러스), 단일 가닥의 + 센스 RNA 바이러스(예를 들어, 피코나바이러스, 토가바이러스), 단일 가닥의 "마이너스(minus)" 센스 RNA 바이러스(예를 들어, 오르토믹소바이러스, 랍도바이러스), DNA 중간체를 갖는 단일 가닥의 + 센스 RNA 바이러스(예를 들어, 레트로바이러스), 또는 이중 가닥의 역전사 바이러스(예를 들어, 헤파드나바이러스)일 수 있다. 본 발명의 일부 비제한 실시양태들에서, 바이러스는 폴리오바이러스(PV), 리노바이러스, 인플루엔자 바이러스, 예를 들어 조류 독감(예를 들어, 인플루엔자 A 바이러스의 H5N1 서브타입), 중증 급성 호흡기 증후군(SARS) 코로나바이러스, 인간 면역결핍 바이러스(HIV), 간염 B 바이러스(HBV), C형 간염 바이러스(HCV), 감염성 기관지염 바이러스, 에볼라바이러스, 말부르크 바이러스, 뎅기열 바이러스(플라비바이러스 혈청형), 웨스트 나일병 바이러스, 엡스타인-바 바이러스(EBV), 황열 바이러스, 에볼라(에볼라바이러스), 수두(바리셀라-조스터 바이러스), 홍역(파라믹소바이러스), 유행성 이하선염(파라믹소바이러스), 공수병(리싸바이러스), 인간 유두종 바이러스, 카포시 육종 관련 헤르페스바이러스, 단순 포진 바이러스(HSV 1형) 또는 생식기 헤르페스 (HSV 2형)이다.
용어 "모(parent)" 바이러스 또는 "모" 단백질 코딩 서열은 다소 약독화될 수 있는 신규 서열의 유래의 기원이 되는 바이러스 게놈 및 단백질 코딩 서열을 지칭하기 위해 본원에서 사용된다. 모 바이러스 및 서열은 통상 더욱 더 약독화된 바이러스를 수득하고자 하는, "야생형" 또는 "천연 발생" 원형(prototype) 또는 변이체의 분리주이다. 그러나, 모 바이러스에는 또한 실제 성질 또는 인지된 바람직한 성질에 기초하여 실험실에서 특이적으로 생성되거나 선택된 돌연변이체도 포함된다. 따라서, 약독화를 위한 후보물질인 모 바이러스에는 결실, 삽입, 아미노산 치환 등을 가지는 야생형 또는 천연 발생 바이러스의 돌연변이체가 포함되고, 또한 코돈 치환을 갖는 돌연변이체도 포함된다. 한 실시양태에서, 그러한 모 서열은 약 30개 이하의 아미노산만큼 천연 분리주와 차이가 있다. 또 다른 실시양태에서, 모 서열은 약 20개 이하의 아미노산만큼 천연 분리주와 차이가 있다. 또 다른 실시양태에서, 모 서열은 약 10개 이하의 아미노산만큼 천연 분리주와 차이가 있다.
약독화 PV는 폴리오바이러스 1형[마호니(폴리오바이러스 1형(Mahoney); "PV(M)"], 폴리오바이러스 2형[랜싱(Lansing)], 폴리오바이러스 3형[레온(Leon)], 1가 경구용 폴리오바이러스 백신(OPV) 바이러스, 또는 3가 OPV 바이러스로부터 유래될 수 있다. 특정 실시양태들에서, 폴리오바이러스는 서열 번호 2에 나와 있는 게놈 서열을 가지는 PV-AB, 또는 PV-AB755-1513, PV-AB755-2470, PV-AB1513-3386, PV-AB2470-3386, PV-AB1513-2470, PV-AB2470-2954, 또는 PV-AB2954-3386이다. 명명법은 게놈의 부분이 PV-AB의 뉴클레오티드로 치환된 PV(M) 게놈을 반영한다. 위첨자는 치환된 PV-AB의 뉴클레오티드의 번호를 제공한다.
각종 실시양태들에서, 약독화 리노바이러스는 HR V2, HRV14로부터 유래된 인간 리노바이러스(HRV), 인간 리노바이러스 10 인간 리노바이러스 100; 인간 리노바이러스 11; 인간 리노바이러스 12; 인간 리노바이러스 13; 인간 리노바이러스 15; 인간 리노바이러스 16; 인간 리노바이러스 18; 인간 리노바이러스 19; 인간 리노바이러스 1A; 인간 리노바이러스 1B; 인간 리노바이러스 2; 인간 리노바이러스 20; 인간 리노바이러스 21; 인간 리노바이러스 22; 인간 리노바이러스 23; 인간 리노바이러스 24; 인간 리노바이러스 25; 인간 리노바이러스 28; 인간 리노바이러스 29; 인간 리노바이러스 30; 인간 리노바이러스 31; 인간 리노바이러스 32; 인간 리노바이러스 33; 인간 리노바이러스 34; 인간 리노바이러스 36; 인간 리노바이러스 38; 인간 리노바이러스 39; 인간 리노바이러스 40; 인간 리노바이러스 41; 인간 리노바이러스 43; 인간 리노바이러스 44; 인간 리노바이러스 45; 인간 리노바이러스 46; 인간 리노바이러스 47; 인간 리노바이러스 49; 인간 리노바이러스 50; 인간 리노바이러스 51; 인간 리노바이러스 53; 인간 리노바이러스 54; 인간 리노바이러스 55; 인간 리노바이러스 56; 인간 리노바이러스 57; 인간 리노바이러스 58; 인간 리노바이러스 59; 인간 리노바이러스 60; 인간 리노바이러스 61; 인간 리노바이러스 62; 인간 리노바이러스 63; 인간 리노바이러스 64; 인간 리노바이러스 65; 인간 리노바이러스 66; 인간 리노바이러스 67; 인간 리노바이러스 68; 인간 리노바이러스 7; 인간 리노바이러스 71; 인간 리노바이러스 73; 인간 리노바이러스 74; 인간 리노바이러스 75; 인간 리노바이러스 76; 인간 리노바이러스 77; 인간 리노바이러스 78; 인간 리노바이러스 8; 인간 리노바이러스 80; 인간 리노바이러스 81; 인간 리노바이러스 82; 인간 리노바이러스 85; 인간 리노바이러스 88; 인간 리노바이러스 89; 인간 리노바이러스 9; 인간 리노바이러스 90; 인간 리노바이러스 94; 인간 리노바이러스 95; 인간 리노바이러스 96 인간 리노바이러스 98; 인간 리노바이러스 14; 인간 리노바이러스 17; 인간 리노바이러스 26; 인간 리노바이러스 27; 인간 리노바이러스 3; 인간 리노바이러스 8001 핀랜드 Nov1995; 인간 리노바이러스 35; 인간 리노바이러스 37;+ 인간 리노바이러스 6253 핀랜드 Sep1994; 인간 리노바이러스 9166 핀랜드 Sep1995; 인간 리노바이러스 4; 인간 리노바이러스 42; 인간 리노바이러스 48; 인간 리노바이러스 9864 핀랜드 Sep1996; 인간 리노바이러스 5; 인간 리노바이러스 52; 인간 리노바이러스 6; 인간 리노바이러스 7425 핀랜드 Dec1995; 인간 리노바이러스 69; 인간 리노바이러스 5928 핀랜드 May1995; 인간 리노바이러스 70; 인간 리노바이러스 72; 인간 리노바이러스 79; 인간 리노바이러스 83; 인간 리노바이러스 84; 인간 리노바이러스 8317 핀랜드 Aug1996; 인간 리노바이러스 86; 인간 리노바이러스 91; 인간 리노바이러스 7851 핀랜드 Sep1996; 인간 리노바이러스 92; 인간 리노바이러스 93; 인간 리노바이러스 97; 인간 리노바이러스 99; 앤트워프 리노바이러스 98/99; 인간 리노바이러스 263 베를린 2004; 인간 리노바이러스 3083/리노/효고/2005; 인간 리노바이러스 NY-003; 인간 리노바이러스 NY-028; 인간 리노바이러스 NY-041; 인간 리노바이러스 NY-042; 인간 리노바이러스 NY-060; 인간 리노바이러스 NY-063; 인간 리노바이러스 NY-074; 인간 리노바이러스 NY-1085; 인간 리노바이러스 균주 행크스; 유형 비정식 인간 리노바이러스 OK88-8162; 인간 엔테로바이러스 sp. ex 텍사스진드기(Amblyomma americanum); 인간 리노바이러스 sp. 또는 인간 리노바이러스 UC이다.
다른 실시양태들에서, 약독화 인플루엔자 바이러스는 인플루엔자 바이러스 A, 인플루엔자 바이러스 B, 또는 인플루엔자 바이러스 C로부터 유래된다. 추가 실시양태들에서, 인플루엔자 바이러스 A는 서브타입 H10N7, H10N1, H10N2, H10N3, H10N4, H10N5, H10N6, H10N7, H10N8, H10N9, H11N1, H11N2, H11N3, H11N4, H11N6, H11N8, H11N9, H12N1, H12N2, H12N4, H12N5, H12N6, H12N8, H12N9, H13N2, H13N3, H13N6, H13N9, H14N5, H14N6, H15N2, H15N8, H15N9, H16N3, H1N1, H1N2, H1N3, H1N5, H1N6, H1N8, H1N9, H2N1, H2N2, H2N3, H2N4, H2N5, H2N6, H2N7, H2N8, H2N9, H3N1, H3N2, H3N3, H3N4, H3N5, H3N6, H3N8, H3N9, H4N1, H4N2, H4N3, H4N4, H4N5, H4N6, H4N7, H4N8, H4N9, H5N1, H5N2, H5N3, H5N4, H5N6, H5N7, H5N8, H5N9, H6N1, H6N2, H6N3, H6N4, H6N5, H6N6, H6N7, H6N8, H6N9, H7N1, H7N2, H7N3, H7N4, H7N5, H7N7, H7N8, H7N9, H8N2, H8N4, H8N5, H9N1, H9N2, H9N3, H9N4, H9N5, H9N6, H9N7, H9N8, H9N9 및 미확인 서브타입에 속하나, 이들에 국한되지 않는다.
추가 실시양태들에서, 인플루엔자 바이러스 B는 서브타입 인플루엔자 B 바이러스(B/아이치/186/2005), 인플루엔자 B 바이러스(B/아이치/5/88), 인플루엔자 B 바이러스(B/아키타/27/2001), 인플루엔자 B 바이러스(B/아키타/5/2001), 인플루엔자 B 바이러스(B/알라바마/1/2006), 인플루엔자 B 바이러스(B/알라바마/2/2005), 인플루엔자 B 바이러스(B/알라스카/03/1992), 인플루엔자 B 바이러스(B/알라스카/12/1996), 인플루엔자 B 바이러스(B/알라스카/16/2000), 인플루엔자 B 바이러스(B/알라스카/16/2003), 인플루엔자 B 바이러스(B/알라스카/1777/2005), 인플루엔자 B 바이러스(B/알라스카/2/2004), 인플루엔자 B 바이러스(B/알라스카/6/2005), 인플루엔자 B 바이러스(B/앤 아버/1/1986), 인플루엔자 B 바이러스(B/앤 아버/1994), 인플루엔자 B 바이러스(B/아르젠티나/132/2001), 인플루엔자 B 바이러스(B/아르젠티나/3640/1999), 인플루엔자 B 바이러스(B/아르젠티나/69/2001), 인플루엔자 B 바이러스(B/아리조나/1/2005), 인플루엔자 B 바이러스(B/아리조나/12/2003), 인플루엔자 B 바이러스(B/아리조나/13/2003), 인플루엔자 B 바이러스(B/아리조나/135/2005), 인플루엔자 B 바이러스(B/아리조나/14/2001), 인플루엔자 B 바이러스(B/아리조나/14/2005), 인플루엔자 B 바이러스(B/아리조나/140/2005), 인플루엔자 B 바이러스(B/아리조나/146/2005), 인플루엔자 B 바이러스(B/아리조나/148/2005), 인플루엔자 B 바이러스(B/아리조나/15/2005), 인플루엔자 B 바이러스(B/아리조나/16/2005), 인플루엔자 B 바이러스(B/아리조나/162/2005), 인플루엔자 B 바이러스(B/아리조나/163/2005), 인플루엔자 B 바이러스(B/아리조나/164/2005), 인플루엔자 B 바이러스(B/아리조나/2/2000), 인플루엔자 B 바이러스(B/아리조나/2/2005), 인플루엔자 B 바이러스(B/아리조나/2e/2006), 인플루엔자 B 바이러스(B/아리조나/3/2006), 인플루엔자 B 바이러스(B/아리조나/4/2002), 인플루엔자 B 바이러스(B/아리조나/4/2006), 인플루엔자 B 바이러스(B/아리조나/48/2005), 인플루엔자 B 바이러스(B/아리조나/5/2000), 인플루엔자 B 바이러스(B/아리조나/59/2005), 인플루엔자 B 바이러스(B/아리조나/7/2000), 인플루엔자 B 바이러스(B/오클랜드/01/2000), 인플루엔자 B 바이러스(B/방콕/141/1994), 인플루엔자 B 바이러스(B/방콕/143/1994), 인플루엔자 B 바이러스(B/방콕/153/1990), 인플루엔자 B 바이러스(B/방콕/163/1990), 인플루엔자 B 바이러스(B/방콕/163/90), 인플루엔자 B 바이러스(B/방콕/34/99), 인플루엔자 B 바이러스(B/방콕/460/03), 인플루엔자 B 바이러스(B/방콕/54/99), 인플루엔자 B 바이러스(B/바르셀로나/215/03), 인플루엔자 B 바이러스(B/베이징/15/84), 인플루엔자 B 바이러스(B/베이징/184/93), 인플루엔자 B 바이러스(B/베이징/243/97), 인플루엔자 B 바이러스(B/베이징/43/75), 인플루엔자 B 바이러스(B/베이징/5/76), 인플루엔자 B 바이러스(B/베이징/76/98), 인플루엔자 B 바이러스(B/벨기에/WV106/2002), 인플루엔자 B 바이러스(B/벨기에/WV107/2002), 인플루엔자 B 바이러스(B/벨기에/WV109/2002), 인플루엔자 B 바이러스(B/벨기에/WV114/2002), 인플루엔자 B 바이러스(B/벨기에/WV122/2002), 인플루엔자 B 바이러스(B/본/43), 인플루엔자 B 바이러스(B/브라질/017/00), 인플루엔자 B 바이러스(B/브라질/053/00), 인플루엔자 B 바이러스(B/브라질/055/00), 인플루엔자 B 바이러스(B/브라질/064/00), 인플루엔자 B 바이러스(B/브라질/074/00), 인플루엔자 B 바이러스(B/브라질/079/00), 인플루엔자 B 바이러스(B/브라질/110/01), 인플루엔자 B 바이러스(B/브라질/952/2001), 인플루엔자 B 바이러스(B/브라질/975/2000), 인플루엔자 B 바이러스(B/브리스번/32/2002), 인플루엔자 B 바이러스(B/부쿠레슈티/311/1998), 인플루엔자 B 바이러스(B/부쿠레슈티/795/03), 인플루엔자 B 바이러스(B/부에노스아이레스/161/00), 인플루엔자 B 바이러스(B/부에노스아이레스/9/95), 인플루엔자 B 바이러스(B/부에노스아이레스/SW16/97), 인플루엔자 B 바이러스(B/부에노스아이레스/VL518/99), 인플루엔자 B 바이러스(B/캘리포니아/01/1995), 인플루엔자 B 바이러스(B/캘리포니아/02/1994), 인플루엔자 B 바이러스(B/캘리포니아/02/1995), 인플루엔자 B 바이러스(B/캘리포니아/1/2000), 인플루엔자 B 바이러스(B/캘리포니아/10/2000), 인플루엔자 B 바이러스(B/캘리포니아/11/2001), 인플루엔자 B 바이러스(B/캘리포니아/14/2005), 인플루엔자 B 바이러스(B/캘리포니아/2/2002), 인플루엔자 B 바이러스(B/캘리포니아/2/2003), 인플루엔자 B 바이러스(B/캘리포니아/3/2000), 인플루엔자 B 바이러스(B/캘리포니아/3/2004), 인플루엔자 B 바이러스(B/캘리포니아/6/2000), 인플루엔자 B 바이러스(B/캘리포니아/7/2005), 인플루엔자 B 바이러스(B/캐나다/16188/2000), 인플루엔자 B 바이러스(B/캐나다/464/2001), 인플루엔자 B 바이러스(B/캐나다/464/2002), 인플루엔자 B 바이러스(B/차코/366/00), 인플루엔자 B 바이러스(B/차코/R113/00), 인플루엔자 B 바이러스(B/찬타부리/218/2003), 인플루엔자 B 바이러스(B/제주/303/03), 인플루엔자 B 바이러스(B/치바/447/98), 인플루엔자 B 바이러스(B/칠레/3162/2002), 인플루엔자 B 바이러스(B/충칭/3/2000), 인플루엔자 B 바이러스(B/임상 분리주 SA1태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA10 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA100 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA101 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA102 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA103 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA104 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA105 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA106 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA107 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA108 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA109 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA11 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA110 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA112 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA113 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA114 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA115 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA116 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA12 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA13 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA14 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA15 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA16 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA17 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA18 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA19 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA2 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA20 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA21 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA22 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA23 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA24 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA25 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA26 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA27 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA28 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA29 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA3 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA30 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA31 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA32 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA33 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA34 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA37 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA38 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA39 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA40 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA41 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA42 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA43 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA44 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA45 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA46 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA47 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA5 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA50 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA51 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA52 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA53 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA57 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA58 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA59 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA6 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA60 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA61 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA62 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA63 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA64 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA65 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA66 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA67 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA68 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA69 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA7 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA70 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA71 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA73 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA74 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA76 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA77 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA78 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA79 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA8 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA80 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA81 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA82 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA83 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA84 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA85 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA86 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA87 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA88 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA89 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA9 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA90 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA91 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA92 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA93 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA94 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA95 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA96 태국/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA97 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA98 필리핀/2002), 인플루엔자 B 바이러스(B/임상 분리주 SA99 필리핀/2002), 인플루엔자 B 바이러스(B/CNIC/27/2001), 인플루엔자 B 바이러스(B/콜로라도/04/2004), 인플루엔자 B 바이러스(B/콜로라도/11e/2004), 인플루엔자 B 바이러스(B/콜로라도/12e/2005), 인플루엔자 B 바이러스(B/콜로라도/13/2004), 인플루엔자 B 바이러스(B/콜로라도/13e/2004), 인플루엔자 B 바이러스(B/콜로라도/15/2004), 인플루엔자 B 바이러스(B/콜로라도/16e/2004), 인플루엔자 B 바이러스(B/콜로라도/17e/2004), 인플루엔자 B 바이러스(B/콜로라도/2/2004), 인플루엔자 B 바이러스(B/콜로라도/2597/2004), 인플루엔자 B 바이러스(B/콜로라도/4e/2004), 인플루엔자 B 바이러스(B/콜로라도/5/2004), 인플루엔자 B 바이러스(B/코넥티컷/02/1995), 인플루엔자 B 바이러스(B/코넥티컷/07/1993), 인플루엔자 B 바이러스(B/코르도바/2979/1991), 인플루엔자 B 바이러스(B/코르도바/VA418/99), 인플루엔자 B 바이러스(B/체코슬로바키아/16/89), 인플루엔자 B 바이러스(B/체코슬로바키아/69/1990), 인플루엔자 B 바이러스(B/체코슬로바키아/69/90), 인플루엔자 B 바이러스(B/대구/10/97), 인플루엔자 B 바이러스(B/대구/45/97), 인플루엔자 B 바이러스(B/대구/47/97), 인플루엔자 B 바이러스(B/대구/9/97), 인플루엔자 B 바이러스(B/델라웨어/1/2006), 인플루엔자 B 바이러스(B/Du/4/78), 인플루엔자 B 바이러스(B/더반/39/98), 인플루엔자 B 바이러스(B/더반/43/98), 인플루엔자 B 바이러스(B/더반/44/98), 인플루엔자 B 바이러스(B/더반/52/98), 인플루엔자 B 바이러스(B/더반/55/98), 인플루엔자 B 바이러스(B/더반/56/98), 인플루엔자 B 바이러스(B/이집트/2040/2004), 인플루엔자 B 바이러스(B/잉글랜드/1716/2005), 인플루엔자 B 바이러스(B/잉글랜드/2054/2005), 인플루엔자 B 바이러스(B/잉글랜드/23/04), 인플루엔자 B 바이러스(B/에스피리토산토/55/01), 인플루엔자 B 바이러스(B/에스피리토산토/79/99), 인플루엔자 B 바이러스(B/핀랜드/154/2002), 인플루엔자 B 바이러스(B/핀랜드/159/2002), 인플루엔자 B 바이러스(B/핀랜드/160/2002), 인플루엔자 B 바이러스(B/핀랜드/161/2002), 인플루엔자 B 바이러스(B/핀랜드/162/03), 인플루엔자 B 바이러스(B/핀랜드/162/2002), 인플루엔자 B 바이러스(B/핀랜드/162/91), 인플루엔자 B 바이러스(B/핀랜드/164/2003), 인플루엔자 B 바이러스(B/핀랜드/172/91), 인플루엔자 B 바이러스(B/핀랜드/173/2003), 인플루엔자 B 바이러스(B/핀랜드/176/2003), 인플루엔자 B 바이러스(B/핀랜드/184/91), 인플루엔자 B 바이러스(B/핀랜드/188/2003), 인플루엔자 B 바이러스(B/핀랜드/190/2003), 인플루엔자 B 바이러스(B/핀랜드/191/2003), 인플루엔자 B 바이러스(B/핀랜드/192/2003), 인플루엔자 B 바이러스(B/핀랜드/193/2003), 인플루엔자 B 바이러스(B/핀랜드/199/2003), 인플루엔자 B 바이러스(B/핀랜드/202/2003), 인플루엔자 B 바이러스(B/핀랜드/203/2003), 인플루엔자 B 바이러스(B/핀랜드/204/2003), 인플루엔자 B 바이러스(B/핀랜드/205/2003), 인플루엔자 B 바이러스(B/핀랜드/206/2003), 인플루엔자 B 바이러스(B/핀랜드/220/2003), 인플루엔자 B 바이러스(B/핀랜드/223/2003), 인플루엔자 B 바이러스(B/핀랜드/225/2003), 인플루엔자 B 바이러스(B/핀랜드/227/2003), 인플루엔자 B 바이러스(B/핀랜드/231/2003), 인플루엔자 B 바이러스(B/핀랜드/235/2003), 인플루엔자 B 바이러스(B/핀랜드/239/2003), 인플루엔자 B 바이러스(B/핀랜드/244/2003), 인플루엔자 B 바이러스(B/핀랜드/245/2003), 인플루엔자 B 바이러스(B/핀랜드/254/2003), 인플루엔자 B 바이러스(B/핀랜드/254/93), 인플루엔자 B 바이러스(B/핀랜드/255/2003), 인플루엔자 B 바이러스(B/핀랜드/260/93), 인플루엔자 B 바이러스(B/핀랜드/268/93), 인플루엔자 B 바이러스(B/핀랜드/270/2003), 인플루엔자 B 바이러스(B/핀랜드/275/2003), 인플루엔자 B 바이러스(B/핀랜드/767/2000), 인플루엔자 B 바이러스(B/핀랜드/84/2002), 인플루엔자 B 바이러스(B/핀랜드/886/2001), 인플루엔자 B 바이러스(B/핀랜드/WV4/2002), 인플루엔자 B 바이러스(B/핀랜드/WV5/2002), 인플루엔자 B 바이러스(B/플로리다/02/1998), 인플루엔자 B 바이러스(B/플로리다/02/2006), 인플루엔자 B 바이러스(B/플로리다/1/2000), 인플루엔자 B 바이러스(B/플로리다/1/2004), 인플루엔자 B 바이러스(B/플로리다/2/2004), 인플루엔자 B 바이러스(B/플로리다/2/2005), 인플루엔자 B 바이러스(B/플로리다/2/2006), 인플루엔자 B 바이러스(B/플로리다/7e/2004), 인플루엔자 B 바이러스(B/푸젠/36/82), 인플루엔자 B 바이러스(B/제네바/5079/03), 인플루엔자 B 바이러스(B/제노아/11/02), 인플루엔자 B 바이러스(B/제노아/2/02), 인플루엔자 B 바이러스(B/제노아/21/02), 인플루엔자 B 바이러스(B/제노아/33/02), 인플루엔자 B 바이러스(B/제노아/41/02), 인플루엔자 B 바이러스(B/제노아/52/02), 인플루엔자 B 바이러스(B/제노아/55/02), 인플루엔자 B 바이러스(B/제노아/56/02), 인플루엔자 B 바이러스(B/제노아/7/02), 인플루엔자 B 바이러스(B/제노아/8/02), 인플루엔자 B 바이러스(B/제노아l2/02), 인플루엔자 B 바이러스(B/제노아3/02), 인플루엔자 B 바이러스(B/제노아48/02), 인플루엔자 B 바이러스(B/제노아49/02), 인플루엔자 B 바이러스(B/제노아5/02), 인플루엔자 B 바이러스(B/제노아53/02), 인플루엔자 B 바이러스(B/제노아6/02), 인플루엔자 B 바이러스(B/제노아65/02), 인플루엔자 B 바이러스(B/제노바/1294/03), 인플루엔자 B 바이러스(B/제노바/1603/03), 인플루엔자 B 바이러스(B/제노바/2/02), 인플루엔자 B 바이러스(B/제노바/20/02), 인플루엔자 B 바이러스(B/제노바/2059/03), 인플루엔자 B 바이러스(B/제노바/26/02), 인플루엔자 B 바이러스(B/제노바/30/02), 인플루엔자 B 바이러스(B/제노바/54/02), 인플루엔자 B 바이러스(B/제노바/55/02), 인플루엔자 B 바이러스(B/죠지아/02/1998), 인플루엔자 B 바이러스(B/죠지아/04/1998), 인플루엔자 B 바이러스(B/죠지아/09/2005), 인플루엔자 B 바이러스(B/죠지아/1/2000), 인플루엔자 B 바이러스(B/죠지아/1/2005), 인플루엔자 B 바이러스(B/죠지아/2/2005), 인플루엔자 B 바이러스(B/죠지아/9/2005), 인플루엔자 B 바이러스(B/광동/05/94), 인플루엔자 B 바이러스(B/광동/08/93), 인플루엔자 B 바이러스(B/광동/5/94), 인플루엔자 B 바이러스(B/광동/55/89), 인플루엔자 B 바이러스(B/광동/8/93), 인플루엔자 B 바이러스(B/광저우/7/97), 인플루엔자 B 바이러스(B/광저우/86/92), 인플루엔자 B 바이러스(B/광저우/87/92), 인플루엔자 B 바이러스(B/경기/592/2005), 인플루엔자 B 바이러스(B/하노버/2/90), 인플루엔자 B 바이러스(B/하얼삔/07/94), 인플루엔자 B 바이러스(B/하와이/1/2003), 인플루엔자 B 바이러스(B/하와이/10/2001), 인플루엔자 B 바이러스(B/하와이/10/2004), 인플루엔자 B 바이러스(B/하와이/11/2004), 인플루엔자 B 바이러스(B/하와이/11e/2004), 인플루엔자 B 바이러스(B/하와이/11e/2005), 인플루엔자 B 바이러스(B/하와이/12e/2005), 인플루엔자 B 바이러스(B/하와이/13/2004), 인플루엔자 B 바이러스(B/하와이/13e/2004), 인플루엔자 B 바이러스(B/하와이/17/2001), 인플루엔자 B 바이러스(B/하와이/18e/2004), 인플루엔자 B 바이러스(B/하와이/1990/2004), 인플루엔자 B 바이러스(B/하와이/1993/2004), 인플루엔자 B 바이러스(B/하와이/19e/2004), 인플루엔자 B 바이러스(B/하와이/2/2000), 인플루엔자 B 바이러스(B/하와이/2/2003), 인플루엔자 B 바이러스(B/하와이/20e/2004), 인플루엔자 B 바이러스(B/하와이/21/2004), 인플루엔자 B 바이러스(B/하와이/26/2001), 인플루엔자 B 바이러스(B/하와이/31e/2004), 인플루엔자 B 바이러스(B/하와이/32e/2004), 인플루엔자 B 바이러스(B/하와이/33e/2004), 인플루엔자 B 바이러스(B/하와이/35/2001), 인플루엔자 B 바이러스(B/하와이/36/2001), 인플루엔자 B 바이러스(B/하와이/37/2001), 인플루엔자 B 바이러스(B/하와이/38/2001), 인플루엔자 B 바이러스(B/하와이/4/2006), 인플루엔자 B 바이러스(B/하와이/43/2001), 인플루엔자 B 바이러스(B/하와이/44/2001), 인플루엔자 B 바이러스(B/하와이/9/2001), 인플루엔자 B 바이러스(B/허베이/19/94), 인플루엔자 B 바이러스(B/허베이/3/94), 인플루엔자 B 바이러스(B/허베이/4/95), 인플루엔자 B 바이러스(B/하남/22/97), 인플루엔자 B 바이러스(B/히로시마/23/2001), 인플루엔자 B 바이러스(B/홍콩/02/1993), 인플루엔자 B 바이러스(B/홍콩/03/1992), 인플루엔자 B 바이러스(B/홍콩/05/1972), 인플루엔자 B 바이러스(B/홍콩/06/2001), 인플루엔자 B 바이러스(B/홍콩/110/99), 인플루엔자 B 바이러스(B/홍콩/1115/2002), 인플루엔자 B 바이러스(B/홍콩/112/2001), 인플루엔자 B 바이러스(B/홍콩/123/2001), 인플루엔자 B 바이러스(B/홍콩/1351/02), 인플루엔자 B 바이러스(B/홍콩/1351/2002), 인플루엔자 B 바이러스(B/홍콩/1434/2002), 인플루엔자 B 바이러스(B/홍콩/147/99), 인플루엔자 B 바이러스(B/홍콩/156/99), 인플루엔자 B 바이러스(B/홍콩/157/99), 인플루엔자 B 바이러스(B/홍콩/167/2002), 인플루엔자 B 바이러스(B/홍콩/22/1989), 인플루엔자 B 바이러스(B/홍콩/22/2001), 인플루엔자 B 바이러스(B/홍콩/22/89), 인플루엔자 B 바이러스(B/홍콩/28/2001), 인플루엔자 B 바이러스(B/홍콩/293/02), 인플루엔자 B 바이러스(B/홍콩/310/2004), 인플루엔자 B 바이러스(B/홍콩/329/2001), 인플루엔자 B 바이러스(B/홍콩/330/2001 에그 적응화), 인플루엔자 B 바이러스(B/홍콩/330/2001), 인플루엔자 B 바이러스(B/홍콩/330/2002), 인플루엔자 B 바이러스(B/홍콩/335/2001), 인플루엔자 B 바이러스(B/홍콩/336/2001), 인플루엔자 B 바이러스(B/홍콩/497/2001), 인플루엔자 B 바이러스(B/홍콩/542/2000), 인플루엔자 B 바이러스(B/홍콩/548/2000), 인플루엔자 B 바이러스(B/홍콩/553a/2003), 인플루엔자 B 바이러스(B/홍콩/557/2000), 인플루엔자 B 바이러스(B/홍콩/6/2001), 인플루엔자 B 바이러스(B/홍콩/666/2001), 인플루엔자 B 바이러스(B/홍콩/692/01), 인플루엔자 B 바이러스(B/홍콩/70/1996), 인플루엔자 B 바이러스(B/홍콩/8/1973), 인플루엔자 B 바이러스(B/홍콩/9/89), 인플루엔자 B 바이러스(B/휴스턴/1/91), 인플루엔자 B 바이러스(B/휴스턴/1/92), 인플루엔자 B 바이러스(B/휴스턴/1/96), 인플루엔자 B 바이러스(B/휴스턴/2/93), 인플루엔자 B 바이러스(B/휴스턴/2/96), 인플루엔자 B 바이러스(B/휴스턴/B 15/1999), 인플루엔자 B 바이러스(B/휴스턴/B56/1997), 인플루엔자 B 바이러스(B/휴스턴/B57/1997), 인플루엔자 B 바이러스(B/휴스턴/B58/1997), 인플루엔자 B 바이러스(B/휴스턴/B59/1997), 인플루엔자 B 바이러스(B/휴스턴/B60/1997), 인플루엔자 B 바이러스(B/휴스턴/B61/1997), 인플루엔자 B 바이러스(B/휴스턴/B63/1997), 인플루엔자 B 바이러스(B/휴스턴/B65/1998), 인플루엔자 B 바이러스(B/휴스턴/B66/2000), 인플루엔자 B 바이러스(B/휴스턴/B67/2000), 인플루엔자 B 바이러스(B/휴스턴/B68/2000), 인플루엔자 B 바이러스(B/휴스턴/B69/2002), 인플루엔자 B 바이러스(B/휴스턴/B70/2002), 인플루엔자 B 바이러스(B/휴스턴/B71/2002), 인플루엔자 B 바이러스(B/휴스턴/B720/2004), 인플루엔자 B 바이러스(B/휴스턴/B74/2002), 인플루엔자 B 바이러스(B/휴스턴/B745/2005), 인플루엔자 B 바이러스(B/휴스턴/B75/2002), 인플루엔자 B 바이러스(B/휴스턴/B756/2005), 인플루엔자 B 바이러스(B/휴스턴/B77/2002), 인플루엔자 B 바이러스(B/휴스턴/B787/2005), 인플루엔자 B 바이러스(B/휴스턴/B79/2003), 인플루엔자 B 바이러스(B/휴스턴/B81/2003), 인플루엔자 B 바이러스(B/휴스턴/B84/2003), 인플루엔자 B 바이러스(B/휴스턴/B846/2005), 인플루엔자 B 바이러스(B/휴스턴/B850/2005), 인플루엔자 B 바이러스(B/휴스턴/B86/2003), 인플루엔자 B 바이러스(B/휴스턴/B87/2003), 인플루엔자 B 바이러스(B/휴스턴/B88/2003), 인플루엔자 B 바이러스(B/허난/4/72), 인플루엔자 B 바이러스(B/이바라키/2/85), 인플루엔자 B 바이러스(B/아이다호/1/2005), 인플루엔자 B 바이러스(B/일리노이/1/2004), 인플루엔자 B 바이러스(B/일리노이/13/2004), 인플루엔자 B 바이러스(B/일리노이/13/2005), 인플루엔자 B 바이러스(B/일리노이/13e/2005), 인플루엔자 B 바이러스(B/일리노이/3/2001), 인플루엔자 B 바이러스(B/일리노이/3/2005), 인플루엔자 B 바이러스(B/일리노이/33/2005), 인플루엔자 B 바이러스(B/일리노이/36/2005), 인플루엔자 B 바이러스(B/일리노이/4/2005), 인플루엔자 B 바이러스(B/일리노이/47/2005), 인플루엔자 B 바이러스(B/인천/297/2005), 인플루엔자 B 바이러스(B/인도/3/89), 인플루엔자 B 바이러스(B/인도/7526/2001), 인플루엔자 B 바이러스(B/인도/7569/2001), 인플루엔자 B 바이러스(B/인도/7600/2001), 인플루엔자 B 바이러스(B/인도/7605/2001), 인플루엔자 B 바이러스(B/인도/77276/2001), 인플루엔자 B 바이러스(B/인디아나/01/1995), 인플루엔자 B 바이러스(B/인디아나/3/2006), 인플루엔자 B 바이러스(B/인디아나/5/2006), 인플루엔자 B 바이러스(B/아이오와/03/2002), 인플루엔자 B 바이러스(B/아이오와/1/2001), 인플루엔자 B 바이러스(B/아이오와/1/2005), 인플루엔자 B 바이러스(B/이스라엘/95/03), 인플루엔자 B 바이러스(B/이스라엘/WV124/2002), 인플루엔자 B 바이러스(B/이스라엘/WV126/2002), 인플루엔자 B 바이러스(B/이스라엘/WV133/2002), 인플루엔자 B 바이러스(B/이스라엘/WV135/2002), 인플루엔자 B 바이러스(B/이스라엘/WV137/2002), 인플루엔자 B 바이러스(B/이스라엘/WV142/2002), 인플루엔자 B 바이러스(B/이스라엘/WV143/2002), 인플루엔자 B 바이러스(B/이스라엘/WV145/2002), 인플루엔자 B 바이러스(B/이스라엘/WV146/2002), 인플루엔자 B 바이러스(B/이스라엘/WV150/2002), 인플루엔자 B 바이러스(B/이스라엘/WV153/2002), 인플루엔자 B 바이러스(B/이스라엘/WV158/2002), 인플루엔자 B 바이러스(B/이스라엘/WV161/2002), 인플루엔자 B 바이러스(B/이스라엘/WV166/2002), 인플루엔자 B 바이러스(B/이스라엘/WV169/2002), 인플루엔자 B 바이러스(B/이스라엘/WV170/2002), 인플루엔자 B 바이러스(B/이스라엘/WV174/2002), 인플루엔자 B 바이러스(B/이스라엘/WV183/2002), 인플루엔자 B 바이러스(B/이스라엘/WV187/2002), 인플루엔자 B 바이러스(B/이스탄불/CTF-132/05), 인플루엔자 B 바이러스(B/일본/1224/2005), 인플루엔자 B 바이러스(B/일본/1905/2005), 인플루엔자 B 바이러스(B/장쑤/10/03), 인플루엔자 B 바이러스(B/장쑤/10/2003(재조합)), 인플루엔자 B 바이러스(B/장쑤/10/2003), 인플루엔자 B 바이러스(B/길림/20/2003), 인플루엔자 B 바이러스(B/요하네스버그/05/1999), 인플루엔자 B 바이러스(B/요하네스버그/06/1994), 인플루엔자 B 바이러스(B/요하네스버그/1/99), 인플루엔자 B 바이러스(B/요하네스버그/113/010), 인플루엔자 B 바이러스(B/요하네스버그/116/01), 인플루엔자 B 바이러스(B/요하네스버그/119/01), 인플루엔자 B 바이러스(B/요하네스버그/123/01), 인플루엔자 B 바이러스(B/요하네스버그/163/99), 인플루엔자 B 바이러스(B/요하네스버그/187/99), 인플루엔자 B 바이러스(B/요하네스버그/189/99), 인플루엔자 B 바이러스(B/요하네스버그/2/99), 인플루엔자 B 바이러스(B/요하네스버그/27/2005), 인플루엔자 B 바이러스(B/요하네스버그/33/01), 인플루엔자 B 바이러스(B/요하네스버그/34/01), 인플루엔자 B 바이러스(B/요하네스버그/35/01), 인플루엔자 B 바이러스(B/요하네스버그/36/01), 인플루엔자 B 바이러스(B/요하네스버그/41/99), 인플루엔자 B 바이러스(B/요하네스버그/5/99), 인플루엔자 B 바이러스(B/요하네스버그/69/2001), 인플루엔자 B 바이러스(B/요하네스버그/77/01), 인플루엔자 B 바이러스(B/요하네스버그/94/99), 인플루엔자 B 바이러스(B/요하네스버그/96/01), 인플루엔자 B 바이러스(B/가도마/1076/99), 인플루엔자 B 바이러스(B/가도마/122/99), 인플루엔자 B 바이러스(B/가도마/122/99-V1), 인플루엔자 B 바이러스(B/가도마/122/99-V10), 인플루엔자 B 바이러스(B/가도마/122/99-V11), 인플루엔자 B 바이러스(B/가도마/122/99-V2), 인플루엔자 B 바이러스(B/가도마/122/99-V3), 인플루엔자 B 바이러스(B/가도마/122/99-V4), 인플루엔자 B 바이러스(B/가도마/122/99-V5), 인플루엔자 B 바이러스(B/가도마/122/99-V6), 인플루엔자 B 바이러스(B/가도마/122/99-V7), 인플루엔자 B 바이러스(B/가도마/122/99-V8), 인플루엔자 B 바이러스(B/가도마/122/99-V9), 인플루엔자 B 바이러스(B/가도마/136/99), 인플루엔자 B 바이러스(B/가도마/409/2000), 인플루엔자 B 바이러스(B/가도마/506/99), 인플루엔자 B 바이러스(B/가도마/642/99), 인플루엔자 B 바이러스(B/가도마/647/99), 인플루엔자 B 바이러스(B/가고시마/15/94), 인플루엔자 B 바이러스(B/가나가와/73), 인플루엔자 B 바이러스(B/캔사스/1/2005), 인플루엔자 B 바이러스(B/캔사스/22992/99), 인플루엔자 B 바이러스(B/켄터키/4/2005), 인플루엔자 B 바이러스(B/카즈코브/224/91), 인플루엔자 B 바이러스(B/키수무/2036/2006), 인플루엔자 B 바이러스(B/키수무/2037/2006), 인플루엔자 B 바이러스(B/키수무/2038/2006), 인플루엔자 B 바이러스(B/키수무/2039/2006), 인플루엔자 B 바이러스(B/키수무/2040/2006), 인플루엔자 B 바이러스(B/키수무/7/2005), 인플루엔자 B 바이러스(B/고베/1/2002), 인플루엔자 B 바이러스(B/고베/1/2002-V1), 인플루엔자 B 바이러스(B/고베/1/2002-V2), 인플루엔자 B 바이러스(B/고베/1/2003), 인플루엔자 B 바이러스(B/고베/1/94), 인플루엔자 B 바이러스(B/고베/2/2002), 인플루엔자 B 바이러스(B/고베/2/2003), 인플루엔자 B 바이러스(B/고베/25/2003), 인플루엔자 B 바이러스(B/고베/26/2003), 인플루엔자 B 바이러스(B/고베/28/2003), 인플루엔자 B 바이러스(B/고베/3/2002), 인플루엔자 B 바이러스(B/고베/3/2003), 인플루엔자 B 바이러스(B/고베/4/2002), 인플루엔자 B 바이러스(B/고베/4/2003), 인플루엔자 B 바이러스(B/고베/5/2002), 인플루엔자 B 바이러스(B/고베/6/2002), 인플루엔자 B 바이러스(B/고베/64/2001), 인플루엔자 B 바이러스(B/고베/65/2001), 인플루엔자 B 바이러스(B/고베/69/2001), 인플루엔자 B 바이러스(B/고베/7/2002), 인플루엔자 B 바이러스(B/고베/79/2001), 인플루엔자 B 바이러스(B/고베/83/2001), 인플루엔자 B 바이러스(B/고베/87/2001), 인플루엔자 B 바이러스(B/고우치/193/1999), 인플루엔자 B 바이러스(B/고우치/193/99), 인플루엔자 B 바이러스(B/라지오/1/02), 인플루엔자 B 바이러스(B/리/40), 인플루엔자 B 바이러스(B/레닌그라드/129/91), 인플루엔자 B 바이러스(B/레닌그라드/148/91), 인플루엔자 B 바이러스(B/리스본/02/1994), 인플루엔자 B 바이러스(B/리사본/2/90), 인플루엔자 B 바이러스(B/로스엔젤레스/1/02), 인플루엔자 B 바이러스(B/루사카/270/99), 인플루엔자 B 바이러스(B/루사카/432/99), 인플루엔자 B 바이러스(B/리옹/1271/96), 인플루엔자 B 바이러스(B/말레이지아/83077/2001), 인플루엔자 B 바이러스(B/마푸투/1/99), 인플루엔자 B 바이러스(B/마푸투/2/99), 인플루엔자 B 바이러스(B/마드델플라타/595/99), 인플루엔자 B 바이러스(B/마드델플라타/VL373/99), 인플루엔자 B 바이러스(B/마드델플라타/VL385/99), 인플루엔자 B 바이러스(B/메릴랜드/1/01), 인플루엔자 B 바이러스(B/메릴랜드/1/2002), 인플루엔자 B 바이러스(B/메릴랜드/2/2001), 인플루엔자 B 바이러스(B/메릴랜드/7/2003), 인플루엔자 B 바이러스(B/메사츄세츠/1/2004), 인플루엔자 B 바이러스(B/메사츄세츠/2/2004), 인플루엔자 B 바이러스(B/메사츄세츠/3/2004), 인플루엔자 B 바이러스(B/메사츄세츠/4/2001), 인플루엔자 B 바이러스(B/메사츄세츠/5/2003), 인플루엔자 B 바이러스(B/멤피스/1/01), 인플루엔자 B 바이러스(B/멤피스/10/97), 인플루엔자 B 바이러스(B/멤피스/11/2006), 인플루엔자 B 바이러스(B/멤피스/12/2006), 인플루엔자 B 바이러스(B/멤피스/12/97), 인플루엔자 B 바이러스(B/멤피스/12/97-MA), 인플루엔자 B 바이러스(B/멤피스/13/03), 인플루엔자 B 바이러스(B/멤피스/18/95), 인플루엔자 B 바이러스(B/멤피스/19/96), 인플루엔자 B 바이러스(B/멤피스/20/96), 인플루엔자 B 바이러스(B/멤피스/21/96), 인플루엔자 B 바이러스(B/멤피스/28/96), 인플루엔자 B 바이러스(B/멤피스/3/01), 인플루엔자 B 바이러스(B/멤피스/3/89), 인플루엔자 B 바이러스(B/멤피스/3/93), 인플루엔자 B 바이러스(B/멤피스/4/93), 인플루엔자 B 바이러스(B/멤피스/5/93), 인플루엔자 B 바이러스(B/멤피스/7/03), 인플루엔자 B 바이러스(B/멤피스/8/99), 인플루엔자 B 바이러스(B/멕시코/84/2000), 인플루엔자 B 바이러스(B/미시간/04/2006), 인플루엔자 B 바이러스(B/미시간/1/2005), 인플루엔자 B 바이러스(B/미시간/1/2006), 인플루엔자 B 바이러스(B/미시간/2/2004), 인플루엔자 B 바이러스(B/미시간/20/2005), 인플루엔자 B 바이러스(B/미시간/22572/99), 인플루엔자 B 바이러스(B/미시간/22587/99), 인플루엔자 B 바이러스(B/미시간/22596/99), 인플루엔자 B 바이러스(B/미시간/22631/99), 인플루엔자 B 바이러스(B/미시간/22659/99), 인플루엔자 B 바이러스(B/미시간/22687/99), 인플루엔자 B 바이러스(B/미시간/22691/99), 인플루엔자 B 바이러스(B/미시간/22721/99), 인플루엔자 B 바이러스(B/미시간/22723/99), 인플루엔자 B 바이러스(B/미시간/2e/2006), 인플루엔자 B 바이러스(B/미시간/3/2004), 인플루엔자 B 바이러스(B/미시간/4/2006), 인플루엔자 B 바이러스(B/미시간/e3/2006), 인플루엔자 B 바이러스(B/미코나/1/1989), 인플루엔자 B 바이러스(B/미에/01/1993), 인플루엔자 B 바이러스(B/미에/1/93), 인플루엔자 B 바이러스(B/밀라노/1/01), 인플루엔자 B 바이러스(B/밀라노/1/02), 인플루엔자 B 바이러스(B/밀라노/5/02), 인플루엔자 B 바이러스(B/밀라노/6/02), 인플루엔자 B 바이러스(B/밀라노/66/04), 인플루엔자 B 바이러스(B/밀라노/7/02), 인플루엔자 B 바이러스(B/미네소타/1/1985), 인플루엔자 B 바이러스(B/미네소타/14/2001), 인플루엔자 B 바이러스(B/미네소타/2/2001), 인플루엔자 B 바이러스(B/민스크/318/90), 인플루엔자 B 바이러스(B/미시시피/1/2001), 인플루엔자 B 바이러스(B/미시시피/2/2005), 인플루엔자 B 바이러스(B/미시시피/3/2001), 인플루엔자 B 바이러스(B/미시시피/3/2005), 인플루엔자 B 바이러스(B/미시시피/4/2003), 인플루엔자 B 바이러스(B/미시시피/4e/2005), 인플루엔자 B 바이러스(B/미주리/1/2006), 인플루엔자 B 바이러스(B/미주리/11/2003), 인플루엔자 B 바이러스(B/미주리/2/2005), 인플루엔자 B 바이러스(B/미주리/20/2003), 인플루엔자 B 바이러스(B/미주리/6/2005), 인플루엔자 B 바이러스(B/몬타나/1/2003), 인플루엔자 B 바이러스(B/몬타나/1/2006), 인플루엔자 B 바이러스(B/몬타나/1e/2004), 인플루엔자 B 바이러스(B/모스크바/16/2002), 인플루엔자 B 바이러스(B/모스크바/3/03), 인플루엔자 B 바이러스(B/나고야/20/99), 인플루엔자 B 바이러스(B/나이로비/2032/2006), 인플루엔자 B 바이러스(B/나이로비/2033/2006), 인플루엔자 B 바이러스(B/나이로비/2034/2006), 인플루엔자 B 바이러스(B/나이로비/2035/2006), 인플루엔자 B 바이러스(B/나이로비/351/2005), 인플루엔자 B 바이러스(B/나이로비/670/2005), 인플루엔자 B 바이러스(B/난창/1/00), 인플루엔자 B 바이러스(B/난창/1/2000), 인플루엔자 B 바이러스(B/난창/12/98), 인플루엔자 B 바이러스(B/난창/15/95), 인플루엔자 B 바이러스(B/난창/15/97), 인플루엔자 B 바이러스(B/난창/195/94), 인플루엔자 B 바이러스(B/난창/2/97), 인플루엔자 B 바이러스(B/난창/20/96), 인플루엔자 B 바이러스(B/난창/26/93), 인플루엔자 B 바이러스(B/난창/3/95), 인플루엔자 B 바이러스(B/난창/4/97), 인플루엔자 B 바이러스(B/난창/480/94), 인플루엔자 B 바이러스(B/난창/5/97), 인플루엔자 B 바이러스(B/난창/560/94), 인플루엔자 B 바이러스(B/난창/560a/94), 인플루엔자 B 바이러스(B/난창/560b/94), 인플루엔자 B 바이러스(B/난창/6/96), 인플루엔자 B 바이러스(B/난창/6/98), 인플루엔자 B 바이러스(B/난창/630/94), 인플루엔자 B 바이러스(B/난창/7/98), 인플루엔자 B 바이러스(B/난창/8/95), 인플루엔자 B 바이러스(B/나쉬빌/107/93), 인플루엔자 B 바이러스(B/나쉬빌/3/96), 인플루엔자 B 바이러스(B/나쉬빌/34/96), 인플루엔자 B 바이러스(B/나쉬빌/45/91), 인플루엔자 B 바이러스(B/나쉬빌/48/91), 인플루엔자 B 바이러스(B/나쉬빌/6/89), 인플루엔자 B 바이러스(B/네브라스카/1/01), 인플루엔자 B 바이러스(B/네브라스카/1/2005), 인플루엔자 B 바이러스(B/네브라스카/2/01), 인플루엔자 B 바이러스(B/네브라스카/4/2001), 인플루엔자 B 바이러스(B/네브라스카/5/2003), 인플루엔자 B 바이러스(B/네팔/1078/2005), 인플루엔자 B 바이러스(B/네팔/1079/2005), 인플루엔자 B 바이러스(B/네팔/1080/2005), 인플루엔자 B 바이러스(B/네팔/1087/2005), 인플루엔자 B 바이러스(B/네팔/1088/2005), 인플루엔자 B 바이러스(B/네팔/1089/2005), 인플루엔자 B 바이러스(B/네팔/1090/2005), 인플루엔자 B 바이러스(B/네팔/1092/2005), 인플루엔자 B 바이러스(B/네팔/1098/2005), 인플루엔자 B 바이러스(B/네팔/1101/2005), 인플루엔자 B 바이러스(B/네팔/1103/2005), 인플루엔자 B 바이러스(B/네팔/1104/2005), 인플루엔자 B 바이러스(B/네팔/1105/2005), 인플루엔자 B 바이러스(B/네팔/1106/2005), 인플루엔자 B 바이러스(B/네팔/1108/2005), 인플루엔자 B 바이러스(B/네팔/1114/2005), 인플루엔자 B 바이러스(B/네팔/1117/2005), 인플루엔자 B 바이러스(B/네팔/1118/2005), 인플루엔자 B 바이러스(B/네팔/1120/2005), 인플루엔자 B 바이러스(B/네팔/1122/2005), 인플루엔자 B 바이러스(B/네팔/1131/2005), 인플루엔자 B 바이러스(B/네팔/1132/2005), 인플루엔자 B 바이러스(B/네팔/1136/2005), 인플루엔자 B 바이러스(B/네팔/1137/2005), 인플루엔자 B 바이러스(B/네팔/1138/2005), 인플루엔자 B 바이러스(B/네팔/1139/2005), 인플루엔자 B 바이러스(B/네팔/1331/2005), 인플루엔자 B 바이러스(B/네덜란드/2781/90), 인플루엔자 B 바이러스(B/네덜란드/6357/90), 인플루엔자 B 바이러스(B/네덜란드/800/90), 인플루엔자 B 바이러스(B/네덜란드/801/90), 인플루엔자 B 바이러스(B/네덜란드/1/97), 인플루엔자 B 바이러스(B/네덜란드/13/94), 인플루엔자 B 바이러스(B/네덜란드/2/95), 인플루엔자 B 바이러스(B/네덜란드/31/95), 인플루엔자 B 바이러스(B/네덜란드/32/94), 인플루엔자 B 바이러스(B/네덜란드/384/95), 인플루엔자 B 바이러스(B/네덜란드/429/98), 인플루엔자 B 바이러스(B/네덜란드/580/89), 인플루엔자 B 바이러스(B/네덜란드/6/96), 인플루엔자 B 바이러스(B/네바다/1/2001), 인플루엔자 B 바이러스(B/네바다/1/2002), 인플루엔자 B 바이러스(B/네바다/1/2005), 인플루엔자 B 바이러스(B/네바다/1/2006), 인플루엔자 B 바이러스(B/네바다/2/2003), 인플루엔자 B 바이러스(B/네바다/2/2006), 인플루엔자 B 바이러스(B/네바다/3/2006), 인플루엔자 B 바이러스(B/네바다/5/2005), 인플루엔자 B 바이러스(B/뉴저지/1/2002), 인플루엔자 B 바이러스(B/뉴저지/1/2004), 인플루엔자 B 바이러스(B/뉴저지/1/2005), 인플루엔자 B 바이러스(B/뉴저지/1/2006), 인플루엔자 B 바이러스(B/뉴저지/3/2001), 인플루엔자 B 바이러스(B/뉴저지/3/2005), 인플루엔자 B 바이러스(B/뉴저지/4/2001), 인플루엔자 B 바이러스(B/뉴저지/5/2005), 인플루엔자 B 바이러스(B/뉴저지/6/2005), 인플루엔자 B 바이러스(B/뉴멕시코/1/2001), 인플루엔자 B 바이러스(B/뉴멕시코/1/2006), 인플루엔자 B 바이러스(B/뉴멕시코/2/2005), 인플루엔자 B 바이러스(B/뉴멕시코/9/2003), 인플루엔자 B 바이러스(B/뉴욕/1/2001), 인플루엔자 B 바이러스(B/뉴욕/1/2002), 인플루엔자 B 바이러스(B/뉴욕/1/2004), 인플루엔자 B 바이러스(B/뉴욕/1/2006), 인플루엔자 B 바이러스(B/뉴욕/10/2002), 인플루엔자 B 바이러스(B/뉴욕/11/2005), 인플루엔자 B 바이러스(B/뉴욕/12/2001), 인플루엔자 B 바이러스(B/뉴욕/12/2005), 인플루엔자 B 바이러스(B/뉴욕/12e/2005), 인플루엔자 B 바이러스(B/뉴욕/14e/2005), 인플루엔자 B 바이러스(B/뉴욕/17/2004), 인플루엔자 B 바이러스(B/뉴욕/18/2003), 인플루엔자 B 바이러스(B/뉴욕/19/2004), 인플루엔자 B 바이러스(B/뉴욕/2/2000), 인플루엔자 B 바이러스(B/뉴욕/2/2002), 인플루엔자 B 바이러스(B/뉴욕/2/2006), 인플루엔자 B 바이러스(B/뉴욕/20139/99), 인플루엔자 B 바이러스(B/뉴욕/24/1993), 인플루엔자 B 바이러스(B/뉴욕/2e/2005), 인플루엔자 B 바이러스(B/뉴욕/3/90), 인플루엔자 B 바이러스(B/뉴욕/39/1991), 인플루엔자 B 바이러스(B/뉴욕/40/2002), 인플루엔자 B 바이러스(B/뉴욕/47/2001), 인플루엔자 B 바이러스(B/뉴욕/6/2004), 인플루엔자 B 바이러스(B/뉴욕/7/2002), 인플루엔자 B 바이러스(B/뉴욕/8/2000), 인플루엔자 B 바이러스(B/뉴욕/9/2002), 인플루엔자 B 바이러스(B/뉴욕/9/2004), 인플루엔자 B 바이러스(B/뉴욕/C10/2004), 인플루엔자 B 바이러스(B/NIB/48/90), 인플루엔자 B 바이러스(B/닝샤/45/83), 인플루엔자 B 바이러스(B/노쓰캐롤라이나/1/2005), 인플루엔자 B 바이러스(B/노쓰캐롤라이나/3/2005), 인플루엔자 B 바이러스(B/노쓰캐롤라이나/4/2004), 인플루엔자 B 바이러스(B/노쓰캐롤라이나/5/2004), 인플루엔자 B 바이러스(B/노르웨이/1/84), 인플루엔자 B 바이러스(B/오하이오/1/2005), 인플루엔자 B 바이러스(B/오하이오/1/X-19/2005), 인플루엔자 B 바이러스(B/오하이오/1e/2005), 인플루엔자 B 바이러스(B/오하이오/1e4/2005), 인플루엔자 B 바이러스(B/오하이오/2/2002), 인플루엔자 B 바이러스(B/오하이오/2e/2005), 인플루엔자 B 바이러스(B/오이타/15/1992), 인플루엔자 B 바이러스(B/오클라호마/1/2006), 인플루엔자 B 바이러스(B/오클라호마/2/2005), 인플루엔자 B 바이러스(B/오만/16291/2001), 인플루엔자 B 바이러스(B/오만/16296/2001), 인플루엔자 B 바이러스(B/오만/16299/2001), 인플루엔자 B 바이러스(B/오만/16305/2001), 인플루엔자 B 바이러스(B/오레곤/1/2005), 인플루엔자 B 바이러스(B/오레곤/1/2006), 인플루엔자 B 바이러스(B/오레곤/5/80), 인플루엔자 B 바이러스(B/오사카/1036/97), 인플루엔자 B 바이러스(B/오사카/1058/97), 인플루엔자 B 바이러스(B/오사카/1059/97), 인플루엔자 B 바이러스(B/오사카/1146/1997), 인플루엔자 B 바이러스(B/오사카/1169/97), 인플루엔자 B 바이러스(B/오사카/1201/2000), 인플루엔자 B 바이러스(B/오사카/547/1997), 인플루엔자 B 바이러스(B/오사카/547/97), 인플루엔자 B 바이러스(B/오사카/710/1997), 인플루엔자 B 바이러스(B/오사카/711/97), 인플루엔자 B 바이러스(B/오사카/728/1997), 인플루엔자 B 바이러스(B/오사카/755/1997), 인플루엔자 B 바이러스(B/오사카/820/1997), 인플루엔자 B 바이러스(B/오사카/837/1997), 인플루엔자 B 바이러스(B/오사카/854/1997), 인플루엔자 B 바이러스(B/오사카/983/1997), 인플루엔자 B 바이러스(B/오사카/983/1997-M1), 인플루엔자 B 바이러스(B/오사카/983/1997-M2), 인플루엔자 B 바이러스(B/오사카/983/97-V1), 인플루엔자 B 바이러스(B/오사카/983/97-V2), 인플루엔자 B 바이러스(B/오사카/983/97-V3), 인플루엔자 B 바이러스(B/오사카/983/97-V4), 인플루엔자 B 바이러스(B/오사카/983/97-V5), 인플루엔자 B 바이러스(B/오사카/983/97-V6), 인플루엔자 B 바이러스(B/오사카/983/97-V7), 인플루엔자 B 바이러스(B/오사카/983/97-V8), 인플루엔자 B 바이러스(B/오사카/c19/93), 인플루엔자 B 바이러스(B/오슬로/1072/2001), 인플루엔자 B 바이러스(B/오슬로/1329/2002), 인플루엔자 B 바이러스(B/오슬로/1510/2002), 인플루엔자 B 바이러스(B/오슬로/1846/2002), 인플루엔자 B 바이러스(B/오슬로/1847/2002), 인플루엔자 B 바이러스(B/오슬로/1862/2001), 인플루엔자 B 바이러스(B/오슬로/1864/2001), 인플루엔자 B 바이러스(B/오슬로/1870/2002), 인플루엔자 B 바이러스(B/오슬로/1871/2002), 인플루엔자 B 바이러스(B/오슬로/2293/2001), 인플루엔자 B 바이러스(B/오슬로/2295/2001), 인플루엔자 B 바이러스(B/오슬로/2297/2001), 인플루엔자 B 바이러스(B/오슬로/238/2001), 인플루엔자 B 바이러스(B/오슬로/3761/2000), 인플루엔자 B 바이러스(B/오슬로/47/2001), 인플루엔자 B 바이러스(B/오슬로/668/2002), 인플루엔자 B 바이러스(B/오슬로/71/04), 인플루엔자 B 바이러스(B/오슬로/801/99), 인플루엔자 B 바이러스(B/오슬로/805/99), 인플루엔자 B 바이러스(B/오슬로/837/99), 인플루엔자 B 바이러스(B/파나마/45/1990), 인플루엔자 B 바이러스(B/파나마/45/90), 인플루엔자 B 바이러스(B/파라과이/636/2003), 인플루엔자 B 바이러스(B/파리/329/90), 인플루엔자 B 바이러스(B/파리/549/1999), 인플루엔자 B 바이러스(B/파마/1/03), 인플루엔자 B 바이러스(B/파마/1/04), 인플루엔자 B 바이러스(B/파마/13/02), 인플루엔자 B 바이러스(B/파마/16/02), 인플루엔자 B 바이러스(B/파마/2/03), 인플루엔자 B 바이러스(B/파마/2/04), 인플루엔자 B 바이러스(B/파마/23/02), 인플루엔자 B 바이러스(B/파마/24/02), 인플루엔자 B 바이러스(B/파마/25/02), 인플루엔자 B 바이러스(B/파마/28/02), 인플루엔자 B 바이러스(B/파마/3/04), 인플루엔자 B 바이러스(B/파마/4/04), 인플루엔자 B 바이러스(B/파마/5/02), 인플루엔자 B 바이러스(B/펜실베니아/1/2006), 인플루엔자 B 바이러스(B/펜실베니아/2/2001), 인플루엔자 B 바이러스(B/펜실베니아/2/2006), 인플루엔자 B 바이러스(B/펜실베니아/3/2003), 인플루엔자 B 바이러스(B/펜실베니아/3/2006), 인플루엔자 B 바이러스(B/펜실베니아/4/2004), 인플루엔자 B 바이러스(B/퍼스/211/2001), 인플루엔자 B 바이러스(B/퍼스/25/2002), 인플루엔자 B 바이러스(B/페루/1324/2004), 인플루엔자 B 바이러스(B/페루/1364/2004), 인플루엔자 B 바이러스(B/페루자/4/03), 인플루엔자 B 바이러스(B/필리핀/5072/2001), 인플루엔자 B 바이러스(B/필리핀/93079/2001), 인플루엔자 B 바이러스(B/부산/250/99), 인플루엔자 B 바이러스(B/부산/255/99), 인플루엔자 B 바이러스(B/부산/270/99), 인플루엔자 B 바이러스(B/부산/285/99), 인플루엔자 B 바이러스(B/퀘벡/1/01), 인플루엔자 B 바이러스(B/퀘벡/162/98), 인플루엔자 B 바이러스(B/퀘벡/173/98), 인플루엔자 B 바이러스(B/퀘벡/2/01), 인플루엔자 B 바이러스(B/퀘벡/3/01), 인플루엔자 B 바이러스(B/퀘벡/4/01), 인플루엔자 B 바이러스(B/퀘벡/452/98), 인플루엔자 B 바이러스(B/퀘벡/453/98), 인플루엔자 B 바이러스(B/퀘벡/465/98), 인플루엔자 B 바이러스(B/퀘벡/51/98), 인플루엔자 B 바이러스(B/퀘벡/511/98), 인플루엔자 B 바이러스(B/퀘벡/514/98), 인플루엔자 B 바이러스(B/퀘벡/517/98), 인플루엔자 B 바이러스(B/퀘벡/6/01), 인플루엔자 B 바이러스(B/퀘벡/7/01), 인플루엔자 B 바이러스(B/퀘벡/74199/99), 인플루엔자 B 바이러스(B/퀘벡/74204/99), 인플루엔자 B 바이러스(B/퀘벡/74206/99), 인플루엔자 B 바이러스(B/퀘벡/8/01), 인플루엔자 B 바이러스(B/퀘벡/9/01), 인플루엔자 B 바이러스(B/라밧/41/97), 인플루엔자 B 바이러스(B/라밧/45/97), 인플루엔자 B 바이러스(B/라밧/61/97), 인플루엔자 B 바이러스(B/리오데자네이루/200/02), 인플루엔자 B 바이러스(B/리오데자네이루/209/02), 인플루엔자 B 바이러스(B/리오데자이네루/315/01), 인플루엔자 B 바이러스(B/리오데자네이루/353/02), 인플루엔자 B 바이러스(B/리오데자네이루/354/02), 인플루엔자 B 바이러스(B/리오그란데술/337/01), 인플루엔자 B 바이러스(B/리오그란데도술/357/02), 인플루엔자 B 바이러스(B/리오그란데도술/374/01), 인플루엔자 B 바이러스(B/로마/1/03), 인플루엔자 B 바이러스(B/로마/2/03), 인플루엔자 B 바이러스(B/로마/3/03), 인플루엔자 B 바이러스(B/로마/4/02), 인플루엔자 B 바이러스(B/로마/7/02), 인플루엔자 B 바이러스(B/루마니아/217/1999), 인플루엔자 B 바이러스(B/루마니아/318/1998), 인플루엔자 B 바이러스(B/러시아/22/1995), 인플루엔자 B 바이러스(B/사가/S172/99), 인플루엔자 B 바이러스(B/씨일/네덜란드/1/99), 인플루엔자 B 바이러스(B/서울/1/89), 인플루엔자 B 바이러스(B/서울/1163/2004), 인플루엔자 B 바이러스(B/서울/12/88), 인플루엔자 B 바이러스(B/서울/12/95), 인플루엔자 B 바이러스(B/서울/13/95), 인플루엔자 B 바이러스(B/서울/16/97), 인플루엔자 B 바이러스(B/서울/17/95), 인플루엔자 B 바이러스(B/서울/19/97), 인플루엔자 B 바이러스(B/서울/21/95), 인플루엔자 B 바이러스(B/서울/232/2004), 인플루엔자 B 바이러스(B/서울/28/97), 인플루엔자 B 바이러스(B/서울/31/97), 인플루엔자 B 바이러스(B/서울/37/91), 인플루엔자 B 바이러스(B/서울/38/91), 인플루엔자 B 바이러스(B/서울/40/91), 인플루엔자 B 바이러스(B/서울/41/91), 인플루엔자 B 바이러스(B/서울/6/88), 인플루엔자 B 바이러스(B/산둥/7/97), 인플루엔자 B 바이러스(B/산둥/7/97), 인플루엔자 B 바이러스(B/상하이/1/77), 인플루엔자 B 바이러스(B/상하이/10/80), 인플루엔자 B 바이러스(B/상하이/24/76), 인플루엔자 B 바이러스(B/상하이/35/84), 인플루엔자 B 바이러스(B/상하이/361/03), 인플루엔자 B 바이러스(B/상하이/361/2002), 인플루엔자 B 바이러스(B/선전/423/99), 인플루엔자 B 바이러스(B/시가/51/98), 인플루엔자 B 바이러스(B/시가/N18/98), 인플루엔자 B 바이러스(B/시가/T30/98), 인플루엔자 B 바이러스(B/시가/T37/98), 인플루엔자 B 바이러스(B/시즈오카/15/2001), 인플루엔자 B 바이러스(B/시즈오카/480/2000), 인플루엔자 B 바이러스(B/쓰촨/281/96), 인플루엔자 B 바이러스(B/쓰촨/317/2001), 인플루엔자 B 바이러스(B/쓰촨/379/99), 인플루엔자 B 바이러스(B/쓰촨/38/2000), 인플루엔자 B 바이러스(B/쓰촨/8/92), 인플루엔자 B 바이러스(B/시에나/1/02), 인플루엔자 B 바이러스(B/싱가포르/04/1991), 인플루엔자 B 바이러스(B/싱가포르/11/1994), 인플루엔자 B 바이러스(B/싱가포르/22/1998), 인플루엔자 B 바이러스(B/싱가포르/222/79), 인플루엔자 B 바이러스(B/싱가포르/31/1998), 인플루엔자 B 바이러스(B/싱가포르/35/1998), 인플루엔자 B 바이러스(B/사우쓰오스트레일리아/5/1999), 인플루엔자 B 바이러스(B/사우쓰캐롤라이나/04/2003), 인플루엔자 B 바이러스(B/사우쓰캐롤라이나/25723/99), 인플루엔자 B 바이러스(B/사우쓰캐롤라이나/3/2003), 인플루엔자 B 바이러스(B/사우쓰캐롤라이나/4/2003), 인플루엔자 B 바이러스(B/사우쓰다코타/1/2000), 인플루엔자 B 바이러스(B/사우쓰다코타/3/2003), 인플루엔자 B 바이러스(B/사우쓰다코타/5/89), 인플루엔자 B 바이러스(B/스페인/WV22/2002), 인플루엔자 B 바이러스(B/스페인/WV26/2002), 인플루엔자 B 바이러스(B/스페인/WV27/2002), 인플루엔자 B 바이러스(B/스페인/WV29/2002), 인플루엔자 B 바이러스(B/스페인/WV33/2002), 인플루엔자 B 바이러스(B/스페인/WV34/2002), 인플루엔자 B 바이러스(B/스페인/WV36/2002), 인플루엔자 B 바이러스(B/스페인/WV41/2002), 인플루엔자 B 바이러스(B/스페인/WV42/2002), 인플루엔자 B 바이러스(B/스페인/WV43/2002), 인플루엔자 B 바이러스(B/스페인/WV45/2002), 인플루엔자 B 바이러스(B/스페인/WV50/2002), 인플루엔자 B 바이러스(B/스페인/WV51/2002), 인플루엔자 B 바이러스(B/스페인/WV56/2002), 인플루엔자 B 바이러스(B/스페인/WV57/2002), 인플루엔자 B 바이러스(B/스페인/WV65/2002), 인플루엔자 B 바이러스(B/스페인/WV66/2002), 인플루엔자 B 바이러스(B/스페인/WV67/2002), 인플루엔자 B 바이러스(B/스페인/WV69/2002), 인플루엔자 B 바이러스(B/스페인/WV70/2002), 인플루엔자 B 바이러스(B/스페인/WV73/2002), 인플루엔자 B 바이러스(B/스페인/WV78/2002), 인플루엔자 B 바이러스(B/세인트 피터스버그/14/2006), 인플루엔자 B 바이러스(B/산타카타리나/308/02), 인플루엔자 B 바이러스(B/산타카타리나/315/02), 인플루엔자 B 바이러스(B/산타카타리나/318/02), 인플루엔자 B 바이러스(B/산타카타리나/345/02), 인플루엔자 B 바이러스(B/스톡홀름/10/90), 인플루엔자 B 바이러스(B/스즈카/18/2005), 인플루엔자 B 바이러스(B/스즈카/28/2005), 인플루엔자 B 바이러스(B/스즈카/32/2005), 인플루엔자 B 바이러스(B/스즈카/58/2005), 인플루엔자 B 바이러스(B/스위스/4291/97), 인플루엔자 B 바이러스(B/스위스/5219/90), 인플루엔자 B 바이러스(B/스위스/5241/90), 인플루엔자 B 바이러스(B/스위스/5441/90), 인플루엔자 B 바이러스(B/스위스/5444/90), 인플루엔자 B 바이러스(B/스위스/5812/90), 인플루엔자 B 바이러스(B/스위스/6121/90), 인플루엔자 B 바이러스(B/대만/0002/03), 인플루엔자 B 바이러스(B/대만/0114/01), 인플루엔자 B 바이러스(B/대만/0202/01), 인플루엔자 B 바이러스(B/대만/0409/00), 인플루엔자 B 바이러스(B/대만/0409/02), 인플루엔자 B 바이러스(B/대만/0562/03), 인플루엔자 B 바이러스(B/대만/0569/03), 인플루엔자 B 바이러스(B/대만/0576/03), 인플루엔자 B 바이러스(B/대만/0600/02), 인플루엔자 B 바이러스(B/대만/0610/03), 인플루엔자 B 바이러스(B/대만/0615/03), 인플루엔자 B 바이러스(B/대만/0616/03), 인플루엔자 B 바이러스(B/대만/0654/02), 인플루엔자 B 바이러스(B/대만/0684/03), 인플루엔자 B 바이러스(B/대만/0699/03), 인플루엔자 B 바이러스(B/대만/0702/02), 인플루엔자 B 바이러스(B/대만/0722/02), 인플루엔자 B 바이러스(B/대만/0730/02), 인플루엔자 B 바이러스(B/대만/0735/03), 인플루엔자 B 바이러스(B/대만/0833/03), 인플루엔자 B 바이러스(B/대만/0874/02), 인플루엔자 B 바이러스(B/대만/0879/02), 인플루엔자 B 바이러스(B/대만/0880/02), 인플루엔자 B 바이러스(B/대만/0927/02), 인플루엔자 B 바이러스(B/대만/0932/02), 인플루엔자 B 바이러스(B/대만/0993/02), 인플루엔자 B 바이러스(B/대만/1013/02), 인플루엔자 B 바이러스(B/대만/1013/03), 인플루엔자 B 바이러스(B/대만/102/2005), 인플루엔자 B 바이러스(B/대만/103/2005), 인플루엔자 B 바이러스(B/대만/110/2005), 인플루엔자 B 바이러스(B/대만/1103/2001), 인플루엔자 B 바이러스(B/대만/114/2001), 인플루엔자 B 바이러스(B/대만/11515/2001), 인플루엔자 B 바이러스(B/대만/117/2005), 인플루엔자 B 바이러스(B/대만/1197/1994), 인플루엔자 B 바이러스(B/대만/121/2005), 인플루엔자 B 바이러스(B/대만/12192/2000), 인플루엔자 B 바이러스(B/대만/1243/99), 인플루엔자 B 바이러스(B/대만/1265/2000), 인플루엔자 B 바이러스(B/대만/1293/2000), 인플루엔자 B 바이러스(B/대만/13/2004), 인플루엔자 B 바이러스(B/대만/14/2004), 인플루엔자 B 바이러스(B/대만/1484/2001), 인플루엔자 B 바이러스(B/대만/1502/02), 인플루엔자 B 바이러스(B/대만/1503/02), 인플루엔자 B 바이러스(B/대만/1534/02), 인플루엔자 B 바이러스(B/대만/1536/02), 인플루엔자 B 바이러스(B/대만/1561/02), 인플루엔자 B 바이러스(B/대만/1574/03), 인플루엔자 B 바이러스(B/대만/1584/02), 인플루엔자 B 바이러스(B/대만/16/2004), 인플루엔자 B 바이러스(B/대만/1618/03), 인플루엔자 B 바이러스(B/대만/165/2005), 인플루엔자 B 바이러스(B/대만/166/2005), 인플루엔자 B 바이러스(B/대만/188/2005), 인플루엔자 B 바이러스(B/대만/1949/02), 인플루엔자 B 바이러스(B/대만/1950/02), 인플루엔자 B 바이러스(B/대만/202/2001), 인플루엔자 B 바이러스(B/대만/2026/99), 인플루엔자 B 바이러스(B/대만/2027/99), 인플루엔자 B 바이러스(B/대만/217/97), 인플루엔자 B 바이러스(B/대만/21706/97), 인플루엔자 B 바이러스(B/대만/2195/99), 인플루엔자 B 바이러스(B/대만/2551/03), 인플루엔자 B 바이러스(B/대만/2805/01), 인플루엔자 B 바이러스(B/대만/2805/2001), 인플루엔자 B 바이러스(B/대만/3143/97), 인플루엔자 B 바이러스(B/대만/31511/00), 인플루엔자 B 바이러스(B/대만/31511/2000), 인플루엔자 B 바이러스(B/대만/34/2004), 인플루엔자 B 바이러스(B/대만/3532/03), 인플루엔자 B 바이러스(B/대만/39/2004), 인플루엔자 B 바이러스(B/대만/41010/00), 인플루엔자 B 바이러스(B/대만/41010/2000), 인플루엔자 B 바이러스(B/대만/4119/02), 인플루엔자 B 바이러스(B/대만/4184/00), 인플루엔자 B 바이러스(B/대만/4184/2000), 인플루엔자 B 바이러스(B/대만/43/2005), 인플루엔자 B 바이러스(B/대만/4602/02), 인플루엔자 B 바이러스(B/대만/473/2005), 인플루엔자 B 바이러스(B/대만/52/2004), 인플루엔자 B 바이러스(B/대만/52/2005), 인플루엔자 B 바이러스(B/대만/54/2004), 인플루엔자 B 바이러스(B/대만/61/2004), 인플루엔자 B 바이러스(B/대만/635/2005), 인플루엔자 B 바이러스(B/대만/637/2005), 인플루엔자 B 바이러스(B/대만/68/2004), 인플루엔자 B 바이러스(B/대만/68/2005), 인플루엔자 B 바이러스(B/대만/69/2004), 인플루엔자 B 바이러스(B/대만/70/2005), 인플루엔자 B 바이러스(B/대만/74/2004), 인플루엔자 B 바이러스(B/대만/75/2004), 인플루엔자 B 바이러스(B/대만/77/2005), 인플루엔자 B 바이러스(B/대만/81/2005), 인플루엔자 B 바이러스(B/대만/872/2005), 인플루엔자 B 바이러스(B/대만/97271/2001), 인플루엔자 B 바이러스(B/대만/98/2005), 인플루엔자 B 바이러스(B/대만/H96/02), 인플루엔자 B 바이러스(B/대만/M214/05), 인플루엔자 B 바이러스(B/대만/M227/05), 인플루엔자 B 바이러스(B/대만/M24/04), 인플루엔자 B 바이러스(B/대만/M244/05), 인플루엔자 B 바이러스(B/대만/M251/05), 인플루엔자 B 바이러스(B/대만/M53/05), 인플루엔자 B 바이러스(B/대만/M71/01), 인플루엔자 B 바이러스(B/대만/N1013/99), 인플루엔자 B 바이러스(B/대만/N1115/02), 인플루엔자 B 바이러스(B/대만/N1207/99), 인플루엔자 B 바이러스(B/대만/N1316/01), 인플루엔자 B 바이러스(B/대만/N1549/01), 인플루엔자 B 바이러스(B/대만/N1582/02), 인플루엔자 B 바이러스(B/대만/N16/03), 인플루엔자 B 바이러스(B/대만/N1619/04), 인플루엔자 B 바이러스(B/대만/N1848/02), 인플루엔자 B 바이러스(B/대만/N1902/04), 인플루엔자 B 바이러스(B/대만/N200/05), 인플루엔자 B 바이러스(B/대만/N2050/02), 인플루엔자 B 바이러스(B/대만/N230/01), 인플루엔자 B 바이러스(B/대만/N232/00), 인플루엔자 B 바이러스(B/대만/N2333/02), 인플루엔자 B 바이러스(B/대만/N2335/01), 인플루엔자 B 바이러스(B/대만/N253/03), 인플루엔자 B 바이러스(B/대만/N2620/04), 인플루엔자 B 바이러스(B/대만/N2986/02), 인플루엔자 B 바이러스(B/대만/N3688/04), 인플루엔자 B 바이러스(B/대만/N371/05), 인플루엔자 B 바이러스(B/대만/N376/05), 인플루엔자 B 바이러스(B/대만/N384/03), 인플루엔자 B 바이러스(B/대만/N3849/02), 인플루엔자 B 바이러스(B/대만/N404/02), 인플루엔자 B 바이러스(B/대만/N473/00), 인플루엔자 B 바이러스(B/대만/N511/01), 인플루엔자 B 바이러스(B/대만/N559/05), 인플루엔자 B 바이러스(B/대만/N612/01), 인플루엔자 B 바이러스(B/대만/N701/01), 인플루엔자 B 바이러스(B/대만/N767/01), 인플루엔자 B 바이러스(B/대만/N798/05), 인플루엔자 B 바이러스(B/대만/N860/05), 인플루엔자 B 바이러스(B/대만/N872/04), 인플루엔자 B 바이러스(B/대만/N913/04), 인플루엔자 B 바이러스(B/대만/S117/05), 인플루엔자 B 바이러스(B/대만/S141/02), 인플루엔자 B 바이러스(B/대만/S76/02), 인플루엔자 B 바이러스(B/대만/S82/02), 인플루엔자 B 바이러스(B/대만/103/2005), 인플루엔자 B 바이러스(B/테헤란/80/02), 인플루엔자 B 바이러스(B/템플/B10/1999), 인플루엔자 B 바이러스(B/템플/B1166/2001), 인플루엔자 B 바이러스(B/템플/B1181/2001), 인플루엔자 B 바이러스(B/템플/B1182/2001), 인플루엔자 B 바이러스(B/템플/B1188/2001), 인플루엔자 B 바이러스(B/템플/B1190/2001), 인플루엔자 B 바이러스(B/템플/B1193/2001), 인플루엔자 B 바이러스(B/템플/B17/2003), 인플루엔자 B 바이러스(B/템플/B18/2003), 인플루엔자 B 바이러스(B/템플/B19/2003), 인플루엔자 B 바이러스(B/템플/B20/2003), 인플루엔자 B 바이러스(B/템플/B21/2003), 인플루엔자 B 바이러스(B/템플/B24/2003), 인플루엔자 B 바이러스(B/템플/B3/1999), 인플루엔자 B 바이러스(B/템플/B30/2003), 인플루엔자 B 바이러스(B/템플/B7/1999), 인플루엔자 B 바이러스(B/템플/B8/1999), 인플루엔자 B 바이러스(B/템플/B9/1999), 인플루엔자 B 바이러스(B/텍사스/06/2000), 인플루엔자 B 바이러스(B/텍사스/1/2000), 인플루엔자 B 바이러스(B/텍사스/1/2004), 인플루엔자 B 바이러스(B/텍사스/1/2006), 인플루엔자 B 바이러스(B/텍사스/1/91), 인플루엔자 B 바이러스(B/텍사스/10/2005), 인플루엔자 B 바이러스(B/텍사스/11/2001), 인플루엔자 B 바이러스(B/텍사스/12/2001), 인플루엔자 B 바이러스(B/텍사스/14/1991), 인플루엔자 B 바이러스(B/텍사스/14/2001), 인플루엔자 B 바이러스(B/텍사스/16/2001), 인플루엔자 B 바이러스(B/텍사스/18/2001), 인플루엔자 B 바이러스(B/텍사스/2/2006), 인플루엔자 B 바이러스(B/텍사스/22/2001), 인플루엔자 B 바이러스(B/텍사스/23/2000), 인플루엔자 B 바이러스(B/텍사스/3/2001), 인플루엔자 B 바이러스(B/텍사스/3/2002), 인플루엔자 B 바이러스(B/텍사스/3/2006), 인플루엔자 B 바이러스(B/텍사스/37/1988), 인플루엔자 B 바이러스(B/텍사스/37/88), 인플루엔자 B 바이러스(B/텍사스/4/2006), 인플루엔자 B 바이러스(B/텍사스/4/90), 인플루엔자 B 바이러스(B/텍사스/5/2002), 인플루엔자 B 바이러스(B/텍사스/57/2002), 인플루엔자 B 바이러스(B/텍사스/6/2000), 인플루엔자 B 바이러스(B/도꾸시마/101/93), 인플루엔자 B 바이러스(B/동경/6/98), 인플루엔자 B 바이러스(B/트렌토/3/02), 인플루엔자 B 바이러스(B/트리에스테/1/02), 인플루엔자 B 바이러스(B/트리에스테/1/03), 인플루엔자 B 바이러스(B/트리에스테/15/02), 인플루엔자 B 바이러스(B/트리에스테/17/02), 인플루엔자 B 바이러스(B/트리에스테/19/02), 인플루엔자 B 바이러스(B/트리에스테/2/03), 인플루엔자 B 바이러스(B/트리에스테/25/02), 인플루엔자 B 바이러스(B/트리에스테/27/02), 인플루엔자 B 바이러스(B/트리에스테/28/02), 인플루엔자 B 바이러스(B/트리에스테/34/02), 인플루엔자 B 바이러스(B/트리에스테/37/02), 인플루엔자 B 바이러스(B/트리에스테/4/02), 인플루엔자 B 바이러스(B/트리에스테/8/02), 인플루엔자 B 바이러스(B/트리에스테 14/02), 인플루엔자 B 바이러스(B/트리에스테 18/02), 인플루엔자 B 바이러스(B/트리에스테23/02), 인플루엔자 B 바이러스(B/트리에스테24/02), 인플루엔자 B 바이러스(B/트리에스테7/02), 인플루엔자 B 바이러스(B/울란우데/4/02), 인플루엔자 B 바이러스(B/울란우데/6/2003), 인플루엔자 B 바이러스(B/울란우데/4/02), 인플루엔자 B 바이러스(B/영국/34304/99), 인플루엔자 B 바이러스(B/영국/34520/99), 인플루엔자 B 바이러스(B/우루과이/19/02), 인플루엔자 B 바이러스(B/우루과이/19/05), 인플루엔자 B 바이러스(B/우루과이/2/02), 인플루엔자 B 바이러스(B/우루과이/28/05), 인플루엔자 B 바이러스(B/우루과이/33/05), 인플루엔자 B 바이러스(B/우루과이/4/02), 인플루엔자 B 바이러스(B/우루과이/5/02), 인플루엔자 B 바이러스(B/우루과이/65/05), 인플루엔자 B 바이러스(B/우루과이/7/02), 인플루엔자 B 바이러스(B/우루과이/74/04), 인플루엔자 B 바이러스(B/우루과이/75/04), 인플루엔자 B 바이러스(B/우루과이/NG/02), 인플루엔자 B 바이러스(B/우슈아이아/15732/99), 인플루엔자 B 바이러스(B/USSR/100/83), 인플루엔자 B 바이러스(B/유타/1/2005), 인플루엔자 B 바이러스(B/유타/20139/99), 인플루엔자 B 바이러스(B/유타/20975/99), 인플루엔자 B 바이러스(B/버몬트/1/2006), 인플루엔자 B 바이러스(B/빅토리아/02/1987), 인플루엔자 B 바이러스(B/빅토리아/103/89), 인플루엔자 B 바이러스(B/빅토리아/19/89), 인플루엔자 B 바이러스(B/빅토리아/2/87), 인플루엔자 B 바이러스(B/빅토리아/504/2000), 인플루엔자 B 바이러스(B/비엔나/1/99), 인플루엔자 B 바이러스(B/버지니아/1/2005), 인플루엔자 B 바이러스(B/버지니아/1/2006), 인플루엔자 B 바이러스(B/버지니아/11/2003), 인플루엔자 B 바이러스(B/버지니아/2/2006), 인플루엔자 B 바이러스(B/버지니아/3/2003), 인플루엔자 B 바이러스(B/버지니아/3/2006), 인플루엔자 B 바이러스(B/버지니아/9/2005), 인플루엔자 B 바이러스(B/워싱턴/1/2004), 인플루엔자 B 바이러스(B/워싱턴/2/2000), 인플루엔자 B 바이러스(B/워싱턴/2/2004), 인플루엔자 B 바이러스(B/워싱턴/3/2000), 인플루엔자 B 바이러스(B/워싱턴/3/2003), 인플루엔자 B 바이러스(B/워싱턴/5/2005), 인플루엔자 B 바이러스(B/웰링턴/01/1994), 인플루엔자 B 바이러스(B/위스콘신/1/2004), 인플루엔자 B 바이러스(B/위스콘신/1/2006), 인플루엔자 B 바이러스(B/위스콘신/10/2006), 인플루엔자 B 바이러스(B/위스콘신/15e/2005), 인플루엔자 B 바이러스(B/위스콘신/17/2006), 인플루엔자 B 바이러스(B/위스콘신/2/2004), 인플루엔자 B 바이러스(B/위스콘신/2/2006), 인플루엔자 B 바이러스(B/위스콘신/22/2006), 인플루엔자 B 바이러스(B/위스콘신/26/2006), 인플루엔자 B 바이러스(B/위스콘신/29/2006), 인플루엔자 B 바이러스(B/위스콘신/3/2000), 인플루엔자 B 바이러스(B/위스콘신/3/2004), 인플루엔자 B 바이러스(B/위스콘신/3/2005), 인플루엔자 B 바이러스(B/위스콘신/3/2006), 인플루엔자 B 바이러스(B/위스콘신/31/2006), 인플루엔자 B 바이러스(B/위스콘신/4/2006), 인플루엔자 B 바이러스(B/위스콘신/5/2006), 인플루엔자 B 바이러스(B/위스콘신/6/2006), 인플루엔자 B 바이러스(B/위스콘신/7/2002), 인플루엔자 B 바이러스(B/우한/2/2001), 인플루엔자 B 바이러스(B/우한/356/2000), 인플루엔자 B 바이러스(B/W194/2002), 인플루엔자 B 바이러스(B/와이오밍/15/2001), 인플루엔자 B 바이러스(B/와이오밍/16/2001), 인플루엔자 B 바이러스(B/와이오밍/2/2003), 인플루엔자 B 바이러스(B/쉬엔우/1/82), 인플루엔자 B 바이러스(B/쉬엔우/23/82), 인플루엔자 B 바이러스(B/야마가타/1/73), 인플루엔자 B 바이러스(B/야마가타/115/2003), 인플루엔자 B 바이러스(B/야마가타/1246/2003), 인플루엔자 B 바이러스(B/야마가타/1311/2003), 인플루엔자 B 바이러스(B/야마가타/16/1988), 인플루엔자 B 바이러스(B/야마가타/16/88), 인플루엔자 B 바이러스(B/야마가타/222/2002), 인플루엔자 B 바이러스(B/야마가타/K198/2001), 인플루엔자 B 바이러스(B/야마가타/K246/2001), 인플루엔자 B 바이러스(B/야마가타/K270/2001), 인플루엔자 B 바이러스(B/야마가타/K298/2001), 인플루엔자 B 바이러스(B/야마가타/K320/2001), 인플루엔자 B 바이러스(B/야마가타/K354/2001), 인플루엔자 B 바이러스(B/야마가타/K386/2001), 인플루엔자 B 바이러스(B/야마가타/K411/2001), 인플루엔자 B 바이러스(B/야마가타/K461/2001), 인플루엔자 B 바이러스(B/야마가타/K490/2001), 인플루엔자 B 바이러스(B/야마가타/K500/2001), 인플루엔자 B 바이러스(B/야마가타/K501/2001), 인플루엔자 B 바이러스(B/야마가타/K508/2001), 인플루엔자 B 바이러스(B/야마가타/K513/2001), 인플루엔자 B 바이러스(B/야마가타/K515/2001), 인플루엔자 B 바이러스(B/야마가타/K519/2001), 인플루엔자 B 바이러스(B/야마가타/K520/2001), 인플루엔자 B 바이러스(B/야마가타/K521/2001), 인플루엔자 B 바이러스(B/야마가타/K535/2001), 인플루엔자 B 바이러스(B/야마가타/K542/2001), 인플루엔자 B 바이러스(B/야마나시/166/1998), 인플루엔자 B 바이러스(B/야마나시/166/98), 인플루엔자 B 바이러스(B/윈난/123/2001), 인플루엔자 B 바이러스(균주 B/알라스카/12/96), 인플루엔자 B 바이러스(균주 B/앤 아버/1/66[저온-적응화]), 인플루엔자 B 바이러스(균주 B/앤 아버/1/66[야생형]), 인플루엔자 B 바이러스(균주 B/BA/78), 인플루엔자 B 바이러스(균주 B/베이징/1/87), 인플루엔자 B 바이러스(균주 B/잉글랜드/222/82), 인플루엔자 B 바이러스(균주 B/핀랜드/145/90), 인플루엔자 B 바이러스(균주 B/핀랜드/146/90), 인플루엔자 B 바이러스(균주 B/핀랜드/147/90), 인플루엔자 B 바이러스(균주 B/핀랜드/148/90), 인플루엔자 B 바이러스(균주 B/핀랜드/149/90), 인플루엔자 B 바이러스(균주 B/핀랜드/150/90), 인플루엔자 B 바이러스(균주 B/핀랜드/151/90), 인플루엔자 B 바이러스(균주 B/핀랜드/24/85), 인플루엔자 B 바이러스(균주 B/핀랜드/56/88), 인플루엔자 B 바이러스(균주 B/후쿠오카/80/81), 인플루엔자 B 바이러스(균주 B/GA/86), 인플루엔자 B 바이러스(균주 B/GL/54), 인플루엔자 B 바이러스(균주 B/홍콩/8/73), 인플루엔자 B 바이러스(균주 B/HT/84), 인플루엔자 B 바이러스(균주 B/ID/86), 인플루엔자 B 바이러스(균주 B/레닌그라드/179/86), 인플루엔자 B 바이러스(균주 B/메릴랜드/59), 인플루엔자 B 바이러스(균주 B/멤피스/6/86), 인플루엔자 B 바이러스(균주 B/나가사키/1/87), 인플루엔자 B 바이러스(균주 B/오사카/491/97), 인플루엔자 B 바이러스(균주 B/PA/79), 인플루엔자 B 바이러스(균주 B/RU/69), 인플루엔자 B 바이러스(균주 B/싱가포르/64), 인플루엔자 B 바이러스(균주 B/동경/942/96), 인플루엔자 B 바이러스(균주 B/빅토리아/3/85), 인플루엔자 B 바이러스(균주 B/빅토리아/87), 인플루엔자 B 바이러스(B/로체스터/02/2001), 및 기타 서브타입에 속하나, 이들에 국한되지 않는다. 추가 실시양태들에서, 인플루엔자 바이러스 C는 서브타입 인플루엔자 C 바이러스(C/아이치/1/81), 인플루엔자 C 바이러스(C/아이치/1/99), 인플루엔자 C 바이러스(C/앤 아버/1/50), 인플루엔자 C 바이러스(C/아오모리/74), 인플루엔자 C 바이러스(C/캘리포니아/78), 인플루엔자 C 바이러스(C/잉글랜드/83), 인플루엔자 C 바이러스(C/후쿠오카/2/2004), 인플루엔자 C 바이러스(C/후쿠오카/3/2004), 인플루엔자 C 바이러스(C/후쿠시마/1/2004), 인플루엔자 C 바이러스(C/그리스/79), 인플루엔자 C 바이러스(C/히로시마/246/2000), 인플루엔자 C 바이러스(C/히로시마/247/2000), 인플루엔자 C 바이러스(C/히로시마/248/2000), 인플루엔자 C 바이러스(C/히로시마/249/2000), 인플루엔자 C 바이러스(C/히로시마/250/2000), 인플루엔자 C 바이러스(C/히로시마/251/2000), 인플루엔자 C 바이러스(C/히로시마/252/2000), 인플루엔자 C 바이러스(C/히로시마/252/99), 인플루엔자 C 바이러스(C/히로시마/290/99), 인플루엔자 C 바이러스(C/히로시마/4/2004), 인플루엔자 C 바이러스(C/효고/1/83), 인플루엔자 C 바이러스(C/요하네스버그/1/66), 인플루엔자 C 바이러스(C/요하네스버그/66), 인플루엔자 C 바이러스(C/가나가와/1/76), 인플루엔자 C 바이러스(C/가나가와/2/2004), 인플루엔자 C 바이러스(C/캔사스/1/79), 인플루엔자 C 바이러스(C/교토/1/79), 인플루엔자 C 바이러스(C/교토/41/82), 인플루엔자 C 바이러스(C/미시시피/80), 인플루엔자 C 바이러스(C/미야기/1/90), 인플루엔자 C 바이러스(C/미야기/1/93), 인플루엔자 C 바이러스(C/미야기/1/94), 인플루엔자 C 바이러스(C/미야기/1/97), 인플루엔자 C 바이러스(C/미야기/1/99), 인플루엔자 C 바이러스(C/미야기/12/2004), 인플루엔자 C 바이러스(C/미야기/2/2000), 인플루엔자 C 바이러스(C/미야기/2/92), 인플루엔자 C 바이러스(C/미야기/2/93), 인플루엔자 C 바이러스(C/미야기/2/94), 인플루엔자 C 바이러스(C/미야기/2/96), 인플루엔자 C 바이러스(C/미야기/2/98), 인플루엔자 C 바이러스(C/미야기/3/2000), 인플루엔자 C 바이러스(C/미야기/3/91), 인플루엔자 C 바이러스(C/미야기/3/92), 인플루엔자 C 바이러스(C/미야기/3/93), 인플루엔자 C 바이러스(C/미야기/3/94), 인플루엔자 C 바이러스(C/미야기/3/97), 인플루엔자 C 바이러스(C/미야기/3/99), 인플루엔자 C 바이러스(C/미야기/4/2000), 인플루엔자 C 바이러스(C/미야기/4/93), 인플루엔자 C 바이러스(C/미야기/4/96), 인플루엔자 C 바이러스(C/미야기/4/97), 인플루엔자 C 바이러스(C/미야기/4/98), 인플루엔자 C 바이러스(C/미야기/42/2004), 인플루엔자 C 바이러스(C/미야기/5/2000), 인플루엔자 C 바이러스(C/미야기/5/91), 인플루엔자 C 바이러스(C/미야기/5/93), 인플루엔자 C 바이러스(C/미야기/6/93), 인플루엔자 C 바이러스(C/미야기/6/96), 인플루엔자 C 바이러스(C/미야기/7/91), 인플루엔자 C 바이러스(C/미야기/7/93), 인플루엔자 C 바이러스(C/미야기/7/96), 인플루엔자 C 바이러스(C/미야기/77), 인플루엔자 C 바이러스(C/미야기/8/96), 인플루엔자 C 바이러스(C/미야기/9/91), 인플루엔자 C 바이러스(C/미야기/9/96), 인플루엔자 C 바이러스(C/나라/1/85), 인플루엔자 C 바이러스(C/나라/2/85), 인플루엔자 C 바이러스(C/나라/82), 인플루엔자 C 바이러스(C/뉴저지/76), 인플루엔자 C 바이러스(C/니가카/1/2004), 인플루엔자 C 바이러스(C/오사카/2/2004), 인플루엔자 C 바이러스(C/돼지/베이징/115/81), 인플루엔자 C 바이러스(C/사이타마/1/2000), 인플루엔자 C 바이러스(C/사이타마/1/2004), 인플루엔자 C 바이러스(C/사이타마/2/2000), 인플루엔자 C 바이러스(C/사이타마/3/2000), 인플루엔자 C 바이러스(C/삿뽀로/71), 인플루엔자 C 바이러스(C/시즈오카/79), 인플루엔자 C 바이러스(C/야마가타/1/86), 인플루엔자 C 바이러스(C/야마가타/1/88), 인플루엔자 C 바이러스(C/야마가타/10/89), 인플루엔자 C 바이러스(C/야마가타/13/98), 인플루엔자 C 바이러스(C/야마가타/15/2004), 인플루엔자 C 바이러스(C/야마가타/2/2000), 인플루엔자 C 바이러스(C/야마가타/2/98), 인플루엔자 C 바이러스(C/야마가타/2/99), 인플루엔자 C 바이러스(C/야마가타/20/2004), 인플루엔자 C 바이러스(C/야마가타/20/96), 인플루엔자 C 바이러스(C/야마가타/21/2004), 인플루엔자 C 바이러스(C/야마가타/26/81), 인플루엔자 C 바이러스(C/야마가타/27/2004), 인플루엔자 C 바이러스(C/야마가타/3/2000), 인플루엔자 C 바이러스(C/야마가타/3/2004), 인플루엔자 C 바이러스(C/야마가타/3/88), 인플루엔자 C 바이러스(C/야마가타/3/96), 인플루엔자 C 바이러스(C/야마가타/4/88), 인플루엔자 C 바이러스(C/야마가타/4/89), 인플루엔자 C 바이러스(C/야마가타/5/92), 인플루엔자 C 바이러스(C/야마가타/6/2000), 인플루엔자 C 바이러스(C/야마가타/6/98), 인플루엔자 C 바이러스(C/야마가타/64), 인플루엔자 C 바이러스(C/야마가타/7/88), 인플루엔자 C 바이러스(C/야마가타/8/2000), 인플루엔자 C 바이러스(C/야마가타/8/88), 인플루엔자 C 바이러스(C/야마가타/8/96), 인플루엔자 C 바이러스(C/야마가타/9/2000), 인플루엔자 C 바이러스(C/야마가타/9/88), 인플루엔자 C 바이러스(C/야마가타/9/96), 인플루엔자 C 바이러스(균주 C/베를린/1/85), 인플루엔자 C 바이러스(균주 C/영국/892/83), 인플루엔자 C 바이러스(균주 C/오대호/1167/54), 인플루엔자 C 바이러스(균주 C/JJ/50), 인플루엔자 C 바이러스(균주 C/돼지/베이징/10/81), 인플루엔자 C 바이러스(균주 C/돼지/베이징/439/82), 인플루엔자 C 바이러스(균주 C/테일러/1233/47), 인플루엔자 C 바이러스(균주 C/야마가타/10/81), 이사바이러스(Isavirus) 또는 감염성 연어 빈혈증 바이러스, 토고토바이러스(Thogotovirus) 또는 도리(Dhori) 바이러스, 바트켄(Batken) 바이러스, 도리 바이러스(균주 인디안/1313/61) 또는 토고토 바이러스, 토고토 바이러스(분리주 SiAr 126) 또는 미분류 토고토바이러스, 아라구아리(Araguari) 바이러스, 미분류 오르토믹소비리대 또는 가금 페스트 바이러스 또는 돼지 인플루엔자 바이러스 또는 미확인 인플루엔자 바이러스 및 기타 서브타입에 속하나, 이들에 국한되지 않는다.
각종 실시양태들에서, 약독화 바이러스는 델타 바이러스 과 및 이의 모든 관련 속에 속한다.
각종 실시양태들에서, 약독화 바이러스는 아데노비리대 바이러스 과, 및 이의 모든 관련 속, 균주, 형 및 분리주, 예를 들어 단, 이들에 국한되는 것은 아니나, 인간 아데노바이러스 A, B, C에 속한다.
각종 실시양태들에서, 약독화 바이러스는 헤르페스비리대 바이러스 과 및 이의 모든 관련 속, 균주, 형 및 분리주 예를 들어 단, 이들에 국한되는 것은 아니나, 단순 포진 바이러스에 속한다.
각종 실시양태들에서, 약독화 바이러스는 레오비리대 바이러스 과 및 이의 모든 관련 속, 균주, 형 및 분리주에 속한다.
각종 실시양태들에서, 약독화 바이러스는 유두종 비리대 바이러스 과 및 이의 모든 관련 속, 균주, 형 및 분리주에 속한다.
각종 실시양태들에서, 약독화 바이러스는 폭스비리대(Poxviridae) 바이러스 과 및 이의 모든 관련 속, 균주, 형 및 분리주에 속한다.
각종 실시양태들에서, 약독화 바이러스는 레트로비리대 바이러스 과 및 이의 모든 관련 속, 균주, 형 및 분리주에 속한다. 예를 들어 단, 이들에 국한되는 것은 아니나, 인간 면역결핍 바이러스에 속한다.
각종 실시양태들에서, 약독화 바이러스는 필로비리대(Filoviridae) 바이러스 과 및 이의 모든 관련 속, 균주, 형 및 분리주에 속한다.
각종 실시양태들에서, 약독화 바이러스는 파라믹소비리대 바이러스 과 및 이의 모든 관련 속, 균주, 형 및 분리주에 속한다.
각종 실시양태들에서, 약독화 바이러스는 오르토믹소비리대 바이러스 과 및 이의 모든 관련 속, 균주, 형 및 분리주에 속한다.
각종 실시양태들에서, 약독화 바이러스는 피코나비리대 바이러스 과 및 이의 모든 관련 속, 균주, 형 및 분리주에 속한다.
각종 실시양태들에서, 약독화 바이러스는 버냐비리대(Bunyaviridae) 바이러스 과 및 이의 모든 관련 속, 균주, 형 및 분리주에 속한다.
각종 실시양태들에서, 약독화 바이러스는 니도비랄레스(Nidovirales) 바이러스 과 및 이의 모든 관련 속, 균주, 형 및 분리주에 속한다.
각종 실시양태들에서, 약독화 바이러스는 칼리시비리대(Caliciviridae) 바이러스 과 및 이의 모든 관련 속, 균주, 형 및 분리주에 속한다.
특정 실시양태들에서, 동의 코돈 치환은 게놈 내, 코돈 편향, 코돈 쌍 편향, 역최적화 코돈 및 역최적화 코돈 쌍의 밀도, RNA 2차 구조, CpG 디뉴클레오티드 함량, C+G 함량, 번역 틀이동 부위, 번역 휴지 부위, 마이크로RNA 인식 서열의 존재 또는 부재, 또는 이들의 임의의 조합을 변경시킨다. 코돈 치환은 게놈 전반에 걸쳐 분포된 다수 위치에서, 또는 게놈의 부분에 국한된 다수 위치에서 조작될 수 있다. 추가 실시양태들에서, 게놈의 부분은 캡시드 코딩 영역이다.
본 발명의 바람직한 실시양태들에서, 바이러스는 동물 숙주에서 보호 면역 반응을 유발하는 능력을 보유한다. 다른 바람직한 실시양태들에서, 바이러스의 독성은 야생형으로 복귀되지 않는다.
폴리오바이러스, 리노바이러스 및 인플루엔자 바이러스
피코나바이러스 과의 한 구성원인 폴리오바이러스는 길이가 7.5 kb인 단일 가닥의 (+) 센스 RNA 게놈을 가지고 외피를 가지지 않은 작은 바이러스이다(문헌 [Kitamura et al., 1981]). 세포 침투 시, 게놈 RNA는, 자체가 촉매 절단 이벤트들의 캐스케이드 후에, 기능성 폴리오바이러스 단백질의 완전 상보를 일어나도록 하는 단일 다단백질을 코딩하는 mRNA로서 작용한다. 동일한 게놈 RNA는 자손 비리온 내로 이입되게 되는 mRNA, 복제 주형 또는 게놈 RNA로 작용하는 새 (+) 나선의 합성을 위한 중간자적인 (-) 센스 RNA의 합성을 위한 주형으로서 작용한다(문헌 [Mueller et al., 2005]). 본원에 기재된 바와 같이, 잘 확립된 PV 시스템을 사용하여, 약독화 합성 바이러스의 생성을 위한 설계 기법의 최적화의 일반 문제를 해결하였다. PV는 항바이러스 기법을 개발하기 위한, 가장 중요하고 가장 잘 이해되는 분자 모델들 중 하나를 제공한다. 특히, 바이러스 핵산이 완전히 합성적인 방법에 의해 시험관내 합성된 후 감염성 비리온으로 전환될 수 있도록 하는 역유전학 시스템이 존재한다(이하 참조). 또한, 전술된 바와 같은 합성 PV 설계의 약독화를 시험하기 위해 편리한 마우스 모델(소아마비를 위한 인간 수용체를 발현하는 CD155tg 마우스)이 이용 가능하다(문헌 [Cello et al., 2002]).
리노 바이러스도 또한 피코나바이러스 과의 구성원이고, PV와 관련된다. 인간 리노바이러스(HRV)는 일반 감기의 통상적 원인 작용제이고, 이에 따라 이는 다른 어떠한 감염성 작용제보다 더 많은 병환 에피소드의 원인이 된다(문헌 [Hendley, 1999]). 일반 감기에 부가하여, HRV는 또한 귀 및 공동(sinus) 감염, 천식성 공격, 및 기타 질환들과 관련된다. PV와 유사하게, HRV는 자가 처리 다단백질을 코딩하는 게놈을 갖는, 단일 가닥의 양성 센스 RNA 바이러스를 포함한다. RNA는, 2가지 바이러스 프로테아제인 2A 및 3C, 및 RNA 의존성 중합효소와 같은 비구조 단백질뿐만 아니라, 캡시드를 형성하는 구조 단백질을 생성하기 위해 내부 리보솜 부착 부위(IRES)를 이용한 내부 개시 기전을 통해 번역된다(문헌 [Jang et al., 1989]; 문헌 [Pelletier et al., 1988]). 또한, PV와 같이, HRV는 60개 카피수의 4가지 캡시드 단백질 VP1-4에 의해 형성되는 외피를 가지지 않은 20면체형 캡시드를 가진다(문헌 [Savolainen et al., 2003]). HRV의 복제 사이클도 또한 폴리오바이러스의 복제 사이클과 동일하다. 인간 건강에 대해 유의적이고 거의 편재하는 영향과 함께, PV와의 근접 유사성은 HRV가 면역화에 유용한 신규 약독화 바이러스의 생성을 위해 극히 선호적인 후보물질이 되도록 한다.
제약 회사들에 의한 수십가지 연구에도 불구하고, HRV에 대한 성공적인 약물이 개발되지 않았다. 이는 부분적으로는 대체로 심각하지 않은 감염을 치료하는 약물에 대한 대중 및 연방 제어단체의 비교적 낮은 위험 내인성(tolerance)으로 인한 것이다. 즉, 심지어 작은 부작용도 허용되지 않는다. 따라서, 약물의 부재 하에, 안전하고 효과적인 항리노바이러스 백신에 대한 명료한 요망이 있다. 그러나, 항리노바이러스 백신의 개발은 극히 도전적인데, 이는 HRV에는 100개 초과의 혈청형이 있기 때문이며, 이 중 대략 30개는 널리 순환하고 인간을 정규적으로 감염시킨다. 한 효과적인 백신은 면역계가 진정한 면역을 부여하기 위해 모든 단일 혈청형을 인식할 수도 있도록 해야 한다. 본원에 기재된 SAVE 방법은 효과적인 리노바이러스 백신의 개발에 대한 실질적 솔루션을 제공한다. SAVE 설계 과정의 예측 가능성에 기초하여, 조합하여 백신을 구성하는, 100개 이상의 SAVE-약독화 리노 바이러스를 설계하고 합성하는 것이 저렴하게 된다.
인플루엔자 바이러스 - 1990년과 1999년 사이에, 인플루엔자 바이러스는 미국 내에서 매년 대략 35,000 사망을 초래하였다(문헌 [Thompson et al., 2003]). 대략 200,000건의 입원과 함께, 미국 경제에 대한 영향은 매년 2백3십억 달러를 초과하는 것으로 평가되었다(문헌 [Cram et al., 2001]). 전세계적으로, 300,000명 내지 500,000명 사람들이 인플루엔자 바이러스 감염으로 인해 매년 사망한다(문헌 [Kamps et al., 2006]). 바이러스가 모든 연령 군들 간에 질환을 유발하나, 심각한 합병증의 발병율은 어린이 및 65세 초과의 사람들에게 가장 높다. 인플루엔자는, 약 3천만명 사람들이 사망한 1918년의 대형 인플루엔자 유행병 보급 중에 일어났었던 바와 같이 극히 치명적인 형태로 돌연변이되거나 재조합할 가능성을 가진다. 이는 가능히 인간 역사에 있어 단일의 가장 치명적인 1년 유행병이었다.
인플루엔자 바이러스는 A, B 및 C의 3가지 유형으로 나뉜다. 항원성은 외피를 가진 비리온의 표면에 있는 2가지 당단백질, 즉 헤마글루티닌(HA) 및 뉴라미니다제(NA)에 의해 결정된다. 양 당단백질 모두는 체액성 면역을 면하기 위해 자체의 항원성을 연속적으로 변화시킨다. 당단백질을 변경하면, 바이러스 균주가 백신접종된 개체를 계속 감염시키게 되고, 이는 고위험군의 매년 백신접종의 원인이다. 부가적으로, 인간 인플루엔자 바이러스는 HA 또는 NA 당단백질을 새 및 돼지의 그 단백질로 치환할 수 있는데, 이는 유전 이동으로 알려진 유전자 분절의 재정렬로서, 새로운 바이러스(H1N1 내지 H2N2 또는 H3N2 등)을 초래한다(문헌 [Steinhauer and Skehel, 2002]). 세계 인구가 면역학적으로 나이브(naive)인 상기 신규 바이러스는 수백만 사람들을 사멸시킨 전염병의 원인이다(문헌 [Kilbourne, 2006]; 문헌 [Russell and Webster, 2005]). 인플루엔자 바이러스의 역사는, 고병원성 조류 인플루엔자 바이러스, H5N1의 현 위협과 함께(문헌 [Stephenson and Democratis, 2006]), 인플루엔자 바이러스성 질환의 예방에 대한 필요성을 강조한다.
현재, 2가지 인플루엔자 백신, 즉 약독화 생백신(저온 적응형; "FluMist") 및 불활성화 바이러스가 사용 중에 있다. 약독화 백신의 적용은 5세 내지 49세 연령의 건강한 어린이, 청소년 및 성인(임신한 여성 제외)에 국한된다. 이 연령 제한은 인플루엔자의 최고 위험에 처한 자들을 정확히 제외한다. 또한, 약독화 FluMist 바이러스는 생바이러스에 대해 통상적인 복귀 가능성을 가진다. 두 번째의 더욱 통상적으로 투여되는 불활성화 인플루엔자 바이러스 백신의 생성은 복잡하다. 또한, 이 백신은 노인(65세 초과의 연령) 집단에 있어 사망을 방지하기 위해 희망되는 것보다 덜 효과적인 것으로 보인다(문헌 [Simonson et al., 2005]). 이 사실은 인플루엔자 바이러스 백신의 생성을 위한 신규 기법에 대한 필요성을 강조한다.
피코나바이러스의 역유전학
역유전학이란, 일반적으로 정통 유전학의 소위 전방 유전적 방법과 반대되는 방향으로 진전하는, 유전자의 기능을 발견하는 실험적 방법을 지칭한다. 즉, 전방 유전학 방법은 표현형 특색의 유전적 기초를 밝힘으로써 유전자의 기능을 결정하도록 모색하는 것에 반해, 역유전학에 기초하는 기법은 단리된 유전자로 시작하여, wt 또는 돌연변이된 유전자의 발현에 의해 생성된 가능한 표현형을 조사함으로써 그 기능을 발견하도록 모색한다. 바이러스 시스템의 문맥에서 본원에 사용되는 "역유전학" 시스템이란, RNA로 된 바이러스 게놈의 유전적 조작을 허용하는 기법의 이용 가능성을 지칭한다. 간략히 말해, 바이러스 게놈은 비리온 또는 감염된 세포로부터 단리되어, 효소 역전사효소에 의해 DNA("cDNA")로 전환되고, 이는 가능히 필요에 따라 변형되고, 다시 감염성 바이러스 입자로 통상 RNA 중간체를 통해 복귀된다. 피코나바이러스에서의 이 과정은 극히 단순하고; 실제로, 임의의 동물 RNA 바이러스를 위해 개발된 첫 번째 역유전학 시스템은 PV에 대한 것이었다(문헌 [Racaniello and Baltimore, 1981]). 바이러스 역유전학 시스템은, 네이키드 바이러스 게놈 RNA이 적당한 포유동물 세포에 형질감염될 대 감염성이라는 역사적 발견사실에 기초한다(문헌 [Alexander et al., 1958]). 1970년대의 역전사효소의 발견 및 분자 클로닝 기법의 개발로 인해, 과학자들이 RNA 바이러스 게놈의 cDNA 카피를 생성하고 조작할 수 있게 되었다. 가장 통상적으로, 게놈의 전체 cDNA 카피는 게놈 RNA의 시험관내 합성을 허용하는 파지 T7 RNA 중합효소 프로모터의 바로 다운스트림에 클로닝된 후, 바이러스 생성을 위해 세포 내로 형질감염된다(문헌 [van der Wert, et al., 1986]). 대안적으로, 동일한 DNA 플라스미드는 세포질에서 T7 RNA 중합효소를 발현하는 세포 내로 형질감염될 수 있다. 이 시스템은 PV 및 HRV 양자 모두를 포함한 각종 바이러스 병원체들을 위해 사용될 수 있다.
인플루엔자 바이러스의 분자 바이러스학 및 역유전학
인플루엔자 바이러스는 피코나바이러스 PV 및 HRV와 같이, RNA 바이러스이나, 다른 방식으로는 PV와 관련없고 그와 매우 상이하다. 피코나바이러스와 대조적으로, 인플루엔자는 마이너스 가닥 바이러스이다. 또한, 인플루엔자는 890 내지 2341 뉴클레오티드 범위의 8가지 분리된 유전자 분절로 구성된다(문헌 [Lamb and Krug, 2001]). 부분적 이유로 마이너스 가닥 조직화로 인해, 또한 또 다른 부분적 이유로는 8가지 분리된 유전자 분절로 인해, 역유전학 시스템이 PV에 대해서보다 더욱 복잡하다. 그럼에도 불구하고, 인플루엔자 바이러스에 대한 역유전학 시스템이 개발되었다(문헌 [Enami et al., 1990]; 문헌 [Fodor et al., 1999]; 문헌 [Garcia-Sastre and Palese, 1993]; 문헌 [Hoffman et al., 2000]; 문헌 [Luytjes et al., 1989]; 문헌 [Neumann et al., 1999]). 각각의 8가지 유전자 분절이, 분리된 플라스미드로부터 발현된다. 이 역유전학 시스템은, 가장 긴 개별 유전자 분절이 3 kb 미만이기 때문에, 본원에 기재된 SAVE 기법에 사용하기에 극히 편리하고, 이에 따라 합성하고 조작하기 용이하다. 또한, 상이한 유전자 분절들은, 상이한 플라스미드를 혼합함으로써 간단히 조합되고 재조합될 수 있다. 따라서, SAVE 방법의 적용은 가능히 PV에 대해서보다 인플루엔자 바이러스에 대해 더욱 더 개연성이 있다.
바이러스 역유전학에 있어서의 한 최근의 패러다임 이동은 본 발명자의, 합성 DNA 올리고뉴클레오티드로부터의 어셈블리에 의한 감염성 바이러스 게놈의 첫 번째 화학적 합성과 함께 일어났다(문헌 [Cello et al., 2002]). 이러한 성취는, 역유전학 시스템이 이용 가능한 대부분 또는 모든 바이러스가 단지 자체의 게놈 서열 정보로부터 합성될 수 있다는 것을 명료하게 만들었고, 요망되는 기준을 충족하도록 상기 바이러스를 재합성하고 변형시킴에 있어 전례없는 유연성을 보장한다.
바이러스 게놈의 신생 합성
바이러스 게놈의 신규 설계 및 합성을 위해, 컴퓨터 기반 알고리즘이 사용된다. 본원에 기재된 약독화 PV의 합성으로 예시되는, 상기 합성된 게놈은 야생형(wt) 바이러스와 정확히 동일한 단백질을 코딩하나, 단 치환 동의 코돈을 이용하여, 코돈 편향, 코돈 쌍 편향, RNA 2차 구조, 및/또는 디뉴클레오티드 함량을 포함한 각종 파라미터들이 변경된다. 제시된 데이터는, 이러한 코딩-비의존성 변화가 종종 단백질의 불량한 번역으로 인해, 매우 약독화된 바이러스를 생성한다는 것을 보여준다. 모든 바이러스의 기본적 기능, 즉 단백질 번역을 표적화함으로써, 백신 제조에 유용한, 예측 가능하게, 안전하게, 빠르게, 또한 저렴하게 약독화 바이러스를 생성하기 위한 매우 일반적인 방법이 개발되었다. "SAVE"(합성 약독화 바이러스 조작)이라고도 하는 이 방법은 새 백신에 대한 의료적 필요성이 있는 PV 이외의 매우 다양한 바이러스들에 대해 적용 가능하다. 이 바이러스에는 리노바이러스, 인플루엔자 바이러스, SARS 및 기타 코로나바이러스, HIV, HCV, 감염성 기관지염 바이러스, 에볼라바이러스, 말부르크 바이러스, 뎅기열 바이러스, 웨스트 나일병 바이러스, EBV, 황열 바이러스, 폴리오바이러스 외의 엔테로바이러스, 예컨대 에코바이러스, 콕사키(coxsackie) 바이러스, 및 엔트로바이러스71; 간염 A 바이러스, 아프토바이러스, 예컨대 수족구병 바이러스, 믹소바이러스, 예컨대 인플루엔자 바이러스, 파라믹소바이러스, 예컨대 홍역 바이러스, 유행성 이하선염 바이러스, 호흡기 세포융합 바이러스, 플라비바이러스, 예컨대 뎅기열 바이러스, 황열 바이러스, 세인트루이스 뇌염 바이러스 및 진드기-매개 바이러스, 알파바이러스, 예컨대 서부 및 동부 뇌염 바이러스, 간염 B 바이러스, 및 소 설사 바이러스, 및 에볼라바이러스가 포함되나, 이들에 국한되지 않는다.
PV 캡시드 코딩 영역 내 코돈 및 코돈 쌍 역최적화의 양자 모두는 PV 적응도(fitness)를 급격히 감소시키는 것으로 본원에 나와 있다. 본 발명은 동의 코돈의 치환을 통한 바이러스 약독화의 기저를 이루는 임의의 특정 분자 기전에 제한되지 않는다. 그럼에도 불구하고, 약독화 바이러스의 생성에 있어서의 코돈 및 코돈 쌍 역최적화의 기저 분자 기전을 보다 잘 이해하기 위한 실험들이 진행 중에 있다. 특히, 코돈 역최적화 및 코돈 쌍 역최적화가 비효율적 번역을 초래할 수 있음을 가리키는 증거가 본원에 제공되어 있다. 다수의 바이러스 작제물의 급속 생성 및 선별을 위한 고효율(high-throughout) 방법이 또한 개발되고 있다.
대규모 DNA 어셈블리
근년, 급락하는 원가 및 증가하는 품질의 올리고뉴클레오티드 합성으로 인해, 합성 올리고뉴클레오티드로부터 큰 분절의 DNA(적어도 약 10 kb에 달함)를 어셈블리하는 것이 실제화되었다. 블루 헤론 바이오테크놀로지 인코포레이션(Blue Heron Biotechnology, Inc.)(미국 워싱턴주 보쓰웰 소재)(및 기타 많은 판매자들)와 같은 상업적 판매자들은 현재 염기 당 약 1.50 달러의 비교적 적은 비용으로 기지의 서열로 합성 DNA의 큰 분절을 합성하고, 어셈블리하며, 클로닝하고, 서열확인하고, 전달한다. 따라서, 상업적 공급자로부터의 합성된 바이러스 게놈의 판매는 편리하고 비용효과적인 선택안이고, 비용이 계속해서 급격히 감소한다. 또한, 극히 낮은 원가로 매우 큰 DNA 분자를 합성하고 어셈블리하는 새 방법이 출현하고 있다(문헌 [Tian et al., 2004]). 처치랩(Church lab)은, (예를 들어, 광-프로그래밍가능한 마이크로유체 칩 또는 님블젠 시스템즈 인코포레이티드(Agilent Technologies, Inc.)(미국 캘리포니아주 산타클라라 소재)로부터 입수가능한 마이크로어레이 상에서) 수천개의 올리고뉴클레오티드의 병렬 합성을 이용한 후, 에러를 감소시키고, 중첩 PCR에 의해 어셈블리하는 방법을 개척하였다. 이 방법은 큰 합성 DNA의 원가를 염기 당, 1 센트 미만으로 감소시킬 수 있는 가능성을 가진다. 대규모 DNA 합성의 향상된 효율 및 정확도, 및 급감 원가는 SAVE 기법의 발달 및 광범위한 적용을 위한 원동력을 제공한다.
대안적 코딩, 코돈 편향, 및 코돈 쌍 편향
대안적 코딩
주어진 펩티드는 다수의 핵산 서열에 의해 코딩될 수 있다. 예를 들어, 심지어 전형적인 짧은 10량체 올리고펩티드를 대략 410(약 106)개의 상이한 핵산에 의해 코딩할 수 있고, PV의 단백질을 약 10442개의 상이한 핵산에 의해 코딩할 수 있다. 자연 선택은 궁극적으로 가능한 이들 10442개의 핵산 중 하나를 PV 게놈으로 선택하였다. 일차 아미노산 서열이 주어진 mRNA에 의해 코딩되는 가장 중요한 정보 수준인 반면, 상이한 종류의 RNA 서열 내에 부가적 종류의 정보가 있다. 이에는 구분된 기능의 RNA 구조 요소(예를 들어, PV에 경우, 시스 작용성 복제 요소, 또는 CRE(문헌 [Goodfellow et al., 2000]; 문헌 [McKnight, 2003]), 번역 동역학 신호(휴지 부위, 틀이동 부위 등), 폴리아데닐화 신호, 스플라이스 신호, 효소 기능(리보솜), 및 매우 가능히는 아직 미확인된 정보 및 신호와 같은 기타 요소들)이 포함된다.
CRE와 같은 신호가 보존되어야 한다는 주의사항에도, 10442개의 가능한 코딩 서열은 동일한 단백질을 코딩하는 능력을 보존하면서 소아마비의 RNA의 서열을 급격한 변화를 일으키는 거대한 유연성을 제공한다. 코돈 편향 또는 코돈 쌍 편향을 변화시킬 수 있고, RNA에서의 핵산 신호 및 2차 구조를 부가하거나 제거할 수 있다. 부가적 또는 신규 단백질을 대체 틀에서 동시에 코딩할 수 있다(예를 들어, 문헌 [Wang et al., 2006] 참조).
코돈 편향
대부분의 아미노산이 수가지 상이한 코돈에 의해 코딩될 수 있으나, 모든 코돈들이 동등한 빈도로 사용되는 것은 아니며: 일부 코돈은 "희소" 코돈인 반면, 다른 코돈은 "빈번한(frequent)" 코돈이다. 본원에 사용되는 "희소" 코돈은 한 특정 아미노산을 위해 가장 빈번하게 사용되는 코돈에 비해 유의적으로 더 낮은 빈도로 mRNA 내에 존재하는, 그 아미노산을 코딩하는 2개 이상의 동의 코돈 중 하나이다. 따라서, 희소 코돈은 가장 빈번하게 사용되는 코돈보다 약 2배 더 낮은 빈도로 존재할 수 있다. 바람직하게, 희소 코돈은 아미노산을 위해 가장 빈번하게 사용되는 코돈보다 3배 이상, 더욱 바람직하게는 5배 이상 더 낮은 빈도로 존재한다. 역으로, "빈번한" 코돈은 한 특정 아미노산을 위해 가장 덜 빈번하게 사용되는 코돈보다 유의적으로 더 높은 빈도로 mRNA 내에 존재하는, 그 아미노산을 코딩하는 2개 이상의 동의 코돈 중 하나이다. 빈번한 코돈은 그 아미노산을 위해 가장 덜 빈번하게 사용되는 코돈에 비해 약 2배, 바람직하게는 3배 이상, 더욱 바람직하게는 5배 이상 더 높은 빈도로 존재할 수 있다. 예를 들어, 인간 유전자는 시간 기준 40%로 루이신 코돈 CTG을 사용하나, 시간 기준 단지 7%만으로 동의 CTA를 사용한다(표 2 참조). 따라서, CTG는 빈번한 코돈인 반면, CTA는 희소 코돈이다. 이러한 사용 빈도와 대략 일관되게도, CTG를 인식하는 tRNA에 대한 유전자는 게놈에 6개 카피가 있는 반면, CTA를 인식하는 tRNA에 대한 유전자는 단지 2개의 카피가 있다. 유사하게, 인간 유전자는 세린에 대해, 각기 시간 기준 18% 및 22%로, 빈번한 코돈 TCT 및 TCC를 사용하나, 시간 기준 단지 5%로 희소 코돈 TCG를 사용한다. TCT 및 TCC는, 게놈 내에 그 유전자의 10개 카피를 가지는, 동일한 tRNA에 의해, 워블(wobble)을 통해, 해독되고, 한편 TCG는 단지 4개 카피만으로 tRNA에 의해 해독된다. 매우 활발히 번역되는 상기 mRNA는 단지 가장 빈번한 코돈만을 사용하도록 강하게 편향되어짐이 공지되어 있다. 이에는 리보솜 단백질 및 해당 효소를 위한 유전자가 포함된다. 한편, 비교적 풍부하지 않은 단백질을 위한 mRNA가 희소 코돈을 사용할 수 있다.
Figure 112009066775576-pct00003
고발현 유전자가 빈번한 코돈을 사용하는 성향을 "코돈 편향"으로 부른다. 리보솜 단백질에 대한 유전자는 61개 코돈 중 가장 빈번한 단지 20 내지 25개만을 사용할 수도 있고, 높은 코돈 편향(1에 근접하는 코돈 편향)을 가질 수 있는 반면, 불량하게 발현된 유전자는 60개 모두의 코돈을 사용하고, 코돈 편향이 없거나 거의 없을 수 있다(0에 근접한 코돈 편향). 빈번하게 사용되는 코돈은, 보다 많은 양의 동족 tRNA가 발현되는 코돈이며, 이들 코돈의 사용은 번역이 더욱 급속히 또는 더욱 정확히, 또는 더욱 급속하면서도 더욱 정확히 진행되도록 하는 것으로 사료된다. PV 캡시드 단백질은 매우 활발하게 번역되고, 높은 코돈 편향을 가진다.
코돈 쌍 편향
코딩 서열의 한 구분된 특성인 그것의 코돈 쌍 편향이다. 이는 8개의 상이한 코돈 쌍에 의해 코딩될 수 있는 아미노산 쌍 Ala-Glu을 고려함으로써 설명될 수 있다. (표 2에 나와 있는 바와 같은) 각 개별 코돈의 빈도 이외의 어떠한 인자도 코돈 쌍의 빈도의 원인이지 않을 경우, 각각의 8개 코딩의 예상 빈도는 2개의 관련 코돈의 빈도를 곱함으로써 계산될 수 있다. 예를 들어, 이 계산에 의해, 코돈 쌍 GCA-GAA은 모든 Ala-Glu 코딩 쌍 중 0.097(0.23×0.42; 표 2에서의 빈도에 기초함)의 빈도로 일어날 것으로 예상된다. 각 코돈 쌍의 예상(가설) 빈도를 인간 게놈에서 실제로 관찰되는 빈도와 상관시키기 위해, 총 14,795개 인간 유전자를 가지는, 일관된 주석의 인간 코딩 영역의 일치 CDS(CCDS) 데이터베이스가 사용되었다. 이 유전자 집합은 인간 코딩 서열 중 가장 보편적인 표시이다. 이 유전자 집합을 사용하여, 코돈 사용빈도의 빈도는, 코돈의 출현수를 동일한 아미노산을 코딩하는 모든 동의 코돈의 수로 나눔으로써 재계산될 수 있다. 예상된 바와 같이, 빈도는 표 2에 제시된 것들과 같이 이전에 공개된 것들과 밀접히 상관되었다. 84949개 인간 코딩 서열이 계산이 포함된(인간 유전자의 실제수보다 훨씬 많음) 가즈사 DNA 연구원(Kazusa DNA Research Institute)(http://www.kazusa.or.jp/codon/codon.html)에서의 코돈 사용빈도 데이터베이스에 의해 제공되는 데이터에 있어, 약간의 빈도 변동은 가능히 오버샘플링 효과로 인한 것일 수 있다. 이처럼 계산되는 코돈 빈도를 이어서 사용하여, 먼저 2개의 관련 코돈의 빈도를 서로 곱한 후(표 3의 예상 빈도 참조), 이 결과를 관심 코돈 쌍에 의해 코딩되는 아미노산 쌍이 일어나게 되는 (전체 CCDS 데이터 집합에서의) 관찰 빈도와 곱함으로써, 예상 코돈 쌍 빈도를 계산하였다. 코돈 쌍 GCA-GAA의 예에서, 이 두 번째 계산으로 (가즈사 데이터 집합을 이용한 첫 계산에서의 0.97과 대비하여) 0.098의 예상 빈도가 수득된다. 마지막으로, 14,795개 인간 유전자 집합에서 관찰되는 실제 코돈 쌍 빈도는, 집합 내 각 코돈 쌍의 총 출현 수를 계수하여, 그것을 동일한 아미노산 쌍을 코딩하는 집합 내 모든 동의 코딩 쌍의 수로 나눔으로써 결정되었다(표 3; 관찰 빈도). 14,795개 인간 유전자 집합에 기초한 3721(612)개 코돈 쌍의 완전 집합에 대한 빈도 및 관찰/예상 값이 보충 표 1로서 여기에 제공된다.
Figure 112009066775576-pct00004
코돈 쌍의 관찰 빈도/예상 빈도의 비가 1 초과인 경우, 코돈 쌍은 과대표시된다고 말해진다. 그 비가 1 미만인 경우, 그것은 과소표시된다고 말해진다. 그 예에서, 코돈 쌍 GCA-GAA는 1.65배 과대표시되는 반면, 코딩 쌍 GCC-GAA는 5배 초과 과소표시된다.
많은 다른 코돈 쌍들이 매우 강한 편향을 나타내고; 일부 쌍은 과소표시되는 반면, 다른 쌍은 과대표시된다. 예를 들어, 코돈 쌍 GCCGAA(AlaGlu) 및 GATCTG(AspLeu)는 3배 내지 6배 과소표시되는(바람직한 쌍은 각기 GCAGAG 및 GACCTG임) 반면, 코돈 쌍 GCCAAG(AlaLys) 및 AATGAA(AsnGlu)는 약 2배 과대표시된다. 코돈 쌍 편향이 아미노산의 쌍의 빈도 및 개별 코돈의 빈도 모두와 관계없음을 주목할만하다. 예를 들어, 과소표시된 쌍 GATCTG(AspLeu)는 가장 빈번한 Leu 코돈(CTG)을 사용하게 되는 일이 있다.
코돈 쌍 편향이 원핵생물 세포에서도 발견되었으나(문헌 [Greve et al., 1989] 참조), 인간을 포함한, 모든 다른 조사 종들에서도 줄곧 나타났다. 효과는 매우 높은 통계학적 유의성을 가지며, 분명히 단지 노이즈는 아니다. 그러나, 그것의 기능적 유의성이 있다면, 그것은 신비한 것이다. 한 제안은, tRNA의 일부 쌍들이 이들이 리보솜 상에 함께 모이면 잘 상호작용하나, 다른 쌍들은 불량하게 상호작용한다는 것이다. 상이한 코돈들이 통상 상이한 tRNA에 의해 해독되기 때문에, 코돈 쌍은 비상용성 tRNA의 쌍을 함께 조합되는 것을 막도록 편향될 수 있다(문헌 [Greve et al., 1989]). 많은(단, 모두는 아닌) 과소표시된 쌍들이 중심 CG 디뉴클레오티드(예를 들어, GCCGAA, AlaGlu를 코딩함)를 가지고, CG 디뉴클레오티드가 포유동물에서 계통적으로 과소표시된다는 또 다른 사상도 있다(문헌 [Buchan et al., 2006]; 문헌 [Curran et al., 1995]; 문헌 [Fedorov et al., 2002]). 따라서, 코돈 쌍 편향의 영향으로는 2가지가 있을 수 있는데, 그 중 하나는 포유동물의 게놈 내 CG의 과소표시의 간접적 영향이고, 다른 하나는 번역의 효율, 속도 및/또는 정확도와 관계가 있다. 본 발명은 코돈 쌍 편향의 기저가 되는 임의의 특정 분자 기전에 국한되지 않음이 강조된다.
이하 더욱 충분히 논의되는 바와 같이, 코돈 쌍 편향은 코딩 서열의 전체 길이에 걸쳐 평균을 구한 코딩 서열 내 각 코돈 쌍에 대한 스코어를 고려한다. 본 발명에 따라, 코돈 쌍 편향은
Figure 112009066775576-pct00005
에 의해 결정된다.
따라서, 코딩 서열에 대한 유사한 코돈 쌍 편향은 예를 들어, 부분서열에 걸친 최소화된 코돈 쌍 스코어, 또는 코딩 서열의 전장에 걸친 적당히 감소된 코돈 쌍 스코어에 의해 수득될 수 있다.
모든 61개의 센스 코돈 및 모든 센스 코돈 쌍이 분명히 사용될 수 있으나, 빈번한 코돈을 단일 희소 코돈으로 치환하는 것, 또는 빈번한 코돈 쌍을 희소 코돈 쌍으로 치환하는 것이 큰 효과를 가질 것으로 예상되지는 않는다. 그러므로, 코돈 및 코돈 쌍 편향에 대한 과거 많은 연구들이 실험이 아닌 정보학을 통해 이루어졌다. 실험 작업에 기초한 코돈 쌍 편향에 대한 한 연구는 문헌 [Irwin et al. (1995)]의 연구였는데, 그 저자는 일부 과대표시된 코돈 쌍이 보다 느린 번역을 유발한다는 것을 반직관적으로 밝혀냈다. 그러나, 이 결과는 두 번째 그룹에 의해 재현될 수 없었고(문헌 [Cheng and Goldman, 2001]), 또한 이하 보고되는 결과와 상충된다. 따라서, 현 결과(이하 참조)는 코돈 쌍 편향의 기능적 역할에 대한 첫 번째 실험 증거일 수 있다.
본원에 개시된 일부 실험들은, 불량한 코돈 편향 및 불량한 코돈 쌍 편향 모두를 게놈에 분리하여 도입하기 위해, 약 1000개 코돈을 포함하는 바이러스 게놈 서열, 예컨대 PV의 전체 캡시드 영역을 재코딩하는 것과 관련된다. 이 실험에 기저를 이루는 근본적 이유는, 각 치환이 작은 영향을 발생시키면, 모든 치환들이 함께 큰 영향을 일으키게 된다는 것이다. 실제로, 역최적화 코돈 편향과 역최적화 코돈 쌍 편향 모두 분리하여 비생존성 바이러스를 발생시키는 것으로 나타났다. 실시예에서 더욱 상세히 논의되는 바와 같이, 예비 데이터는 비효율적 번역이 불량한 코돈 편향 또는 코돈 쌍 편향으로 바이러스 생존력을 감소시키는 주요 기전임을 제시한다. 정확한 기전과 상관없이, 데이터는 동의 역최적화 코돈의 바이러스 게놈 내로의 대규모 치환이 심하게 약독화된 바이러스를 초래한다는 것을 가리킨다. 약독화 바이러스를 생성하기 위한 이 절차는 SAVE(합성 약독화 바이러스 조작)으로 칭해졌다.
본 발명에 따라, 바이러스 약독화는 코돈 편향뿐만 아니라, 코돈 쌍 편향을 변화시키는 것에 의해 이루어질 수 있다. 그러나, 코돈 쌍 편향을 조정하는 것이 특히 유리할 것으로 예상된다. 예를 들어, 바이러스를 코돈 편향을 통해 약독화하는 것은 일반적으로 공통된 코돈을 제거하는 것을 요하고, 이에 따라 뉴클레오티드 서열의 복잡성이 감소된다. 이와는 달리, 코돈 쌍 편향 감소 또는 최소화는 보다 큰 서열 밀도 및 이에 따른 핵산 2차 구조의 보다 큰 조절, 어닐링 온도, 및 기타 물리적 및 생화학적 성질을 유지하면서 이루어질 수 있다. 본원에 개시된 연구는, 코돈은 셔플링되나 코돈 사용빈도 프로파일은 변화되지 않는 약독화 코돈 쌍 편향이 감소되거나 최소화된 서열을 포함한다.
바이러스 약독화는 당업자에게 공지된 방식으로 확인될 수 있다. 비제한적 예에는 시험 동물에 있어서의 플라크 검정법, 증식 측정 및 감소된 치사율이 포함된다. 본원은 약독화 바이러스가 숙주에서 보호 면역 반응을 유발할 수 있음을 입증한다.
합성 약독화 바이러스 조작(SAVE)
SAVE는 특수 설계된 컴퓨터 소프트웨어, 및 바이러스의 게놈을 재코딩하고 재합성하기 위한 핵산 합성 및 어셈블리의 근대적 방법을 이용한다. 이 기법은 효능적 백신이 모색되는, 각종 의학적으로 중요한 바이러스에 대한 백신을 생성하는 효율적 방법을 제공한다.
2가지 효과적인 소아마비 백신인, [Jonas Salk]에 의해 개발된 불활성화된 소아마비 백신(IPV) 및 [Albert Sabin]에 의해 개발된 약독화 생바이러스를 포함하는 경구용 소아마비 백신(OPV)은 각기 1950년 이후로 이용 가능하였다. 실제로, 1988년에 시작하여 세계보건기구(WHO)에 의해 선도되어온, 급성 회백수염을 근절하기 위한 세계적 노력은 세계 대부분의 국가들로부터 소아마비를 근절하는 데 성공을 거두었다. 매년 진단된 사례의 수가 수십만에서 2005년에는 인도 및 나이지리아에서 주로 발생한 수인 2천 미만으로 감소하였다. 그러나, OPV의 광범위 사용에 관한 우려는, 그것이 독성 형태로 복귀될 수 있다는 것이며, 백신에서 유래되는 소아마비의 발병이 희소 이벤트인 것으로 판단되기는 하나 보고된 바 있다(문헌 [Georgescu et al., 1997]; 문헌 [Kew et al., 2002]; 문헌 [Shimizu et al., 2004]). 사실상, 각각 7개 미만의 약독화 돌연변이를 가지는 생 폴리오바이러스 백신 균주가 사용되는 한, 상기 균주가 wt로 복귀될 가능성이 있고, 그러한 복귀는 소아마비의 완전 근절에 대해 심각한 위협을 제기한다. 따라서, WHO는 소아마비 근절을 위한 노력을 마감하는 단계에서 복귀 가능성을 저지하기 위한 신규 소아마비 백신을 필요로 하는 것도 당연하며, 이는 SAVE를 PV에 적용함에 관한 본원에 개시된 연구에 대한 한 근본적 이유를 제공한다. 그러나, PV는, 그것이 SAVE를 개발하기 위한 우수한 모델 시스템이기 때문에 일차적으로 선택된 것이었다.
재코딩 중에, 바이러스 게놈 내의 필수 핵산 신호가 보존되나, 단백질 번역의 효율은 코돈 편향, 코돈 쌍 편향, 및 RNA 2차 구조 및 CpG 디뉴클레오티드 함량, C+G 함량, 번역 틀이동 부위, 번역 휴지 부위, 또는 이들의 임의의 조합과 같은 기타 파라미터들을 역최적화함으로써 계통적으로 감소된다. 이 역최적화는 각기 작은 효과를 가지는 수백가지 또는 수천가지 변화를 수반할 수 있다. 일반적으로, 역최적화는, 바이러스가 일부 세포주(한 특정 바이러스에 대해 허용되도록 특수 조작된 세포주 포함)에서는 여전히 증식할 수 있으나, 바이러스가 정상 동물 또는 인간 내에서는 비독성인 지점까지 수행된다. 그러한 비독성 바이러스는, 완전 독성 바이러스와 정확히 동일한 단백질을 코딩하고 이에 따라 완전 독성 바이러스와 정확히 동일한 면역 반응을 일으키기 때문에, 사멸된 백신 또는 생백신 중 어느 하나의 우수한 후보물질이다. 부가적으로, SAVE 과정은 약독화 수준을 미세 조정하기 위한 전망을 제공하며; 즉 그것은 대략 예측 가능한 정도로 역최적화되는 합성 바이러스를 설계하는 능력을 제공한다. 바이러스 입자의 설계, 합성 및 생성은 일단 게놈 서열이 알려지면 수주의 시간틀 내에 달성 가능하고, 이는 가능한 위급상황에서 백신을 생성시킴에 관한 중요한 이점을 가진다. 또한, 약독화 바이러스는 극히 큰 수의 유해한 뉴클레오티드 변화가 수반되기 때문에, 독성으로 복귀할 가능성이 사실상 없을 것으로 예상된다. 이 방법은 일반적으로, 광범위한 바이러스에 적용 가능할 수 있고, 이는 임의의 특정 바이러스에 대한 바이러스 게놈 서열 및 역유전학 시스템의 지식만을 요한다.
코돈 편향의 역최적화에 의한 바이러스 약독화
상기 기재된 대조군 세포/시험 세포 방법의 IC50 비를 사용할 경우, 1 이하의 CSG 값을 갖는 화합물은 양호한 임상 후보 화합물로 간주되지 않는 반면, 대략 10 초과의 CSG 값을 갖는 화합물은 매우 유망하고 더욱 고려할 가치가 있을 것이다.
약독화 바이러스를 조작하는 한 수단으로서, 폴리오바이러스 1형 마호니[PV(M)]의 캡시드 코딩 영역을, 동의 코돈 사용빈도를 변화시킴으로써 재조작하였다. 캡시드 영역은 바이러스의 약 1/3을 구성하고, 매우 활발하게 번역된다. 최대 가능한 수의 빈번하게 사용되는 코돈을 동의 희소 코돈으로 치환함으로 인해 매우 낮은 코돈 편향을 갖는, 한 돌연변이체 바이러스(바이러스 PV-AB)를 생성시켰다. 대조군으로서, 본래의 코돈 편향을 유지하면서 최대의 가능한 수의 동의 코돈 변화를 가지는 또 다른 바이러스(PV-SD)를 생성시켰다. 따라서, PV-SD는 wt와 본질적으로 동일한 코돈을 셔플링된 위치에 가지면서 정확히 동일한 단백질을 코딩하는 바이러스이다. PV-SD에서, 셔플링 절차에 의해 코돈 쌍 편향을 증가시키거나 감소시키기 위한 노력은 이루어지지 않았다. 실시예 1을 참조한다. 캡시드 코딩 영역에서의 934개 뉴클레오티드 변화에도 불구하고, PV-SD RNA는 wt와 구분불가능한 특성을 갖는 바이러스를 생성시켰다. 그와 대조적으로, 680개 침묵 돌연변이를 가지는 PV-AB로부터는 생존 가능한 바이러스가 회수되지 않았다. 실시예 2를 참조한다.
PV-AB의 비생존성의 진부한 설명은, 뉴클레오티드 변화들 중 단지 한 개는 어떻게든 치사적이긴 하나, 다른 679개는 무해하는 것이다. 예를 들어, 뉴클레오티드 변화는 일부 극적인, 다만 인정받지 못하는 이유로 인해, 예컨대 복제 예방으로 인해 치사적일 수 있다. 그러나, 이러한 설명은 개연성있지 않다. PV가 CRE와 같은, 그것의 RNA 내에 중요한 조절 요소를 포함하나, 그러한 요소는 캡시드 코딩 영역 내에 존재하지 않는 것으로 알려져 있다. 이는, 전체 캡시드 코딩 영역이 세포 내의 잔여 게놈의 정상 복제에 영향을 주지 않으면서 결실될 수 있으나, 물론 바이러스 입자가 형성될 수 없다는 입증사실에 의해 지지된다(문헌 [Kaplan and Racamiello, 1988]).
일부 재조작된 바이러스의 비생존성에 관한 문제를 해결하기 위해, 바이러스 PV-AB의 캡시드 영역의 부분분절을 야생형 바이러스 내에 클로닝하였다. 실시예 1 및 도 3을 참조한다. 서브클로닝된 큰 분절(비중첩 분절 포함)의 도입은 치사적인 것으로 입증되었으나, 서브클로닝된 작은 분절은 생존력을 지니나(단 한 예외가 있음) 병약한 바이러스를 생성시켰다. "병약함(sickness)"은 많은 검정법들에 의해 밝혀지는데: 예를 들어, 불량한 코돈 편향의 분절은 불량한 역가(도 3B) 및 작은 플라크(도 3C-H)를 유발한다. 일반적으로, 큰 치사적인 분절은 2개의 부분분절로 나뉠 수 있고, 이 양 부분분절 모두는 살아있으나 병약하다는 것이 특히 주목할만하다(도 3). 이 결과는, 생존력이 단지 하나의 변화로 인한 것이며; 그 대신 최소한, 많은 변화들이 표현형에 기여하는 것이어야 한다는 가설을 배제한다.
위치 1513 내지 2470의 예외적 분절이 있다. 이 분절은 매우 작으나, PV 게놈 내의 그것의 혼입은 비생존성을 유발한다. 이 단편이 단지 병약성을 유발하고 바이러스를 불활성화하지 않는 부분단편으로 세분될 수 있는지의 여부는 현재 알려져 있지 않다. 이 분절은 매우 유해한 변화, 가능하게는 번역 틀이동 부위를 포함하는 것으로 생각할 수 있다.
불량한 코돈 편향이 본래 번역에 대한 영향을 미치나, 바이러스 PV-AB에 의해 코딩되는 단백질의 번역을 시험하였다. 실시예 5 및 도 5를 참조한다. 실제로, 모든 병약한 바이러스가 캡시드 단백질을 불량하게 번역하였다(도 5B). 불량한 번역이 병약성의 원인이라는 것과 일관되게도, 번역은 보다 병약한 바이러스에서 보다 덜 효율적이었다. 희소 코돈의 인식율이 제한적이라는 것과 일관되게도, 번역은 과잉 tRNA 및 아미노산으로 보충된 반응에서의 wt 수준까지 본질적으로 향상되었다.
역최적화 코돈 편향이 비효율적 번역을 유발하는지의 여부에 관한 두 번째 시험으로서, wt 및 역최적화 캡시드의 부분을 디시스트론성 리포터 작제물 내 반딧불 루시퍼라제의 N-말단에 융합시켰다. 실시예 5 및 도 6을 참조한다. 이 융합 작제물에서, 루시퍼라제의 번역은 N-말단에 융합된 캡시드 단백질의 번역에 의존한다. 또한, 역최적화 코돈을 갖는 캡시드 단백질의 번역이 불량하였고, 보다 병약한 바이러스에서 더 좋지 않았다는 것이 밝혀졌고, 이는 원인과 결과의 관계를 제시한다. 따라서, 데이터는, PV-AB 바이러스 내의 수백개의 희소 코돈이 대체로 불량한 번역으로 인해 비생존성을 유발한다는 것을 제시한다. 또한, 시험관내 관측되는 불량한 번역 및 배양된 세포 내 관측되는 바이러스 병약성은 또한 동물의 감염에서도 반영된다. 심지어 가장 덜 쇠약화된 역최적화 바이러스 중 하나인 PV-AB2470-2954의 경우에서도, 마우스에서 질환을 유발하는 데 필요한 바이러스 입자의 수가 약 100배만큼 증가되었다. 실시예 4 및 표 4를 참조한다.
문헌 [Burns et al. (2006)]은 최근 PV의 세이빈 2형 백신 균주를 이용한 일부 유사한 실험을 기재하였고, 유사한 결론에 도달하였다. [Burns 등]은 완전히 상이한 코돈 역최적화 바이러스(즉, 본원에 기재된 PV-AB 바이러스의 뉴클레오티드 서열, 및 이들의 "abcd" 바이러스는 매우 상이함)를 합성하였으나, 유사한 검정법을 이용하여 유사한 쇠약화 정도를 얻었다. [Burns 등]은 약독화에 대해 숙주 생물체에서의 그들의 바이러스 작제물을 시험하지 않았다. 그러나, 그 결과는, SAVE가 예측 가능하고, 그 결과가 정확한 뉴클레오티드 서열에 크게 의존하지 않는 견해를 입증한다.
코돈 쌍 편향의 역최적화에 의한 바이러스 약독화
본 발명에 따라, 코돈 쌍 편향은 코돈 사용빈도와 무관하게 변경될 수 있다. 예를 들어, 관심 단백질 코돈 서열에서, 코돈 쌍 편향은 간단히 그것의 코돈의 지정된 재배열에 의해 변경될 수 있다. 특히, 숙주 생물체에서 빈도가 다양할 수 있는, 모 서열에서 나타나는 동일한 코돈이 변경된 서열에, 다만 상이한 위치에서 사용된다. 가장 간단한 형태로, 동일한 코돈이 모 서열에서와 같이 사용되므로, 단백질 코딩 영역에 걸친 코돈 사용빈도는, (코딩된 아미노산 서열과 마찬가지로) 변화되지 않은 채로 남는 것으로 간주된다. 그럼에도 불구하고, 일부 코돈은 새 부문에서, 즉 상이한 뉴클레오티드 삼중체를 이용하기는 하나 모 서열에서와 같이 동일한 아미노산을 코딩하는 코돈이 선행 및/또는 후행되는 부문에 나타난다. 이상적으로는, 코돈의 재배열은 모 서열에서보다 덜 빈번한 코돈 쌍을 초래한다. 실제로, 코돈의 재배열이 종종 한 위치에서 덜 빈번한 코돈 쌍을 초래하고, 두 번째 위치에서 더 빈번한 쌍을 초래한다. 코돈의 적절한 재배열에 의해, 주어진 길이의 코딩 서열에 걸친 코돈 쌍 사용빈도 편향이 모 서열에 비해 감소될 수 있다. 대안적으로, 코돈은 모 서열에서보다 숙주 세포에서 더 빈번한 코돈 쌍을 이용하는 서열을 생성하기 위해 재배열될 수 있다.
코돈 쌍 편향은, 본원에 개시된 바와 같이, 각 코돈 쌍을 차례로 고려하고, 코돈 쌍이 숙주 세포의 단백질 코딩 서열에서 관찰되는 빈도에 따라 각 쌍을 스코어링한 후, 서열에 대한 코돈 쌍 편향을 결정함으로써 평가된다. 혹자는 동일한 코돈 쌍 편향을 가지는 많은 상이한 서열들을 발생시킬 수 있음이 인지될 것이다. 또한, 코돈 쌍 편향은, 코돈이 재배열되는 방식에 따라 다소의 정도로 변경될 수 있다. 코딩 서열의 코돈 쌍 편향은 전체 코딩 서열을 재코딩하거나, 하나 이상의 부분서열을 재코딩함으로써 변경될 수 있다. 본원에 사용되는 "코돈 쌍 편향"은, 서열의 단지 일부만이 돌연변이될 수 있을지라도, 코딩 서열의 길이에 걸쳐 평가ㄷ된. 코돈 쌍이 숙주 생물체의 코돈 사용빈도의 부문에서 스코어링되기 때문에, 코돈 쌍 편향 값은 야생형 바이러스 서열 및 돌연변이체 바이러스 서열에 배당될 수 있다. 본 발명에 따라, 바이러스는 자체의 코돈 쌍 편향을 감소시키기 위해, 바이러스의 단백질 코딩 서열의 전부 또는 일부를 재코딩함으로써 약독화될 수 있다.
본 발명에 따라, 코돈 쌍 편향은 숙주의 코돈 쌍 사용빈도로부터 결정되는 정량적 성질이다. 따라서, 절대적 코돈 쌍 편향 값을 임의의 주어진 바이러스 단백질 코딩 서열에 대해 결정할 수 있다. 대안적으로, 역최적화 바이러스 단백질 코딩 서열을 유래의 기원이 되는 "모" 서열과 상관시키는 코돈 쌍 편향 값의 상대적 변화를 결정할 수 있다. 바이러스가 각종 유형들(즉, 발티모어(Baltimore) 분류법에 의해 I형 내지 VII형)의 것이 되고, 상이한 바이러스의 천연(즉, 독성) 분리주가 절대 코돈 쌍 편향의 상이한 값을 생성하기 때문에, 원하는 약독화 수준을 결정하는 것과 통상 더욱 관련된 것은 코돈 쌍의 상대적 변화이다. 따라서, 본 발명은 하나 이상의 단백질 코딩 뉴클레오티드 서열이 돌연변이에 의해 감소된 코돈 쌍 편향을 가지는 바이러스 게놈을 포함하는 약독화 바이러스 및 그것의 제조 방법을 제공한다. 단지 단일 단백질(즉, 다단백질)을 코딩하는 바이러스에서, 다단백질의 전부 또는 일부는 요망되는 정도로 코돈 쌍 편향을 감소시키도록 돌연변이될 수 있고, 돌연변이된 서열의 전부 또는 일부가 재조합 바이러스 작제물 내에 제공될 수 있다. 다중 단백질을 분리하여 코딩하는 바이러스의 경우, 혹자는 단백질 코딩 서열의 코돈 쌍 편향을 동시에 감소시키거나, 변형을 위한 단백질 코딩 서열의 단지 하나 또는 수개를 선택할 수 있다. 코돈 쌍 편향의 감소는 단백질 코딩 서열의 길이에 걸쳐 결정되고, 약 0.05 이상, 또는 약 0.1 이상, 또는 약 0.15 이상, 또는 약 0.2 이상, 또는 약 0.3 이상, 또는 약 0.4 이상이다. 바이러스에 따라, 숙주의 코돈 쌍 사용빈도에 기초하는, 절대적 코돈 쌍 편향은 약 -0.05 이하, 또는 약 -0.1 이하, 또는 약 -0.15 이하, 또는 약 -0.2 이하, 또는 약 -0.3 이하, 또는 약 -0.4 이하일 수 있다.
코돈 쌍 편향은 또한 다른 서열 변화에 중첩될 수 있음이 명백할 것이다. 예를 들어, 코딩 서열은 하나 이상의 아미노산 변화를 가지는 단백질 또는 폴리펩티드를 코딩하기 위해, 또한 변경된 코돈 쌍 편향을 가지도록 하기 위해 변경될 수 있다. 또한, 일부 경우에서, 혹자는 모 단백질 코딩 서열에서와 같이 코돈 편향 감소 단백질 코딩 서열에서 정확히 동일한 코돈 사용빈도 프로파일을 유지하기 위해 코돈을 셔플링할 수 있다. 이 절차는 코돈 쌍 편향 변화의 위력을 강조하나 이에 집착할 필요는 없다. 대안적으로, 코돈 선택은 코딩 서열에서의 코돈 사용빈도의 전체 변화를 초래할 수 있다. 이와 관련하여, 본원에 제공된 일부 실시예(예를 들어, PV-Min의 설계)에서, 코돈 사용빈도 프로파일이 코돈 쌍 편향 최소화 서열을 생성하는 과정에서 변화되지 않더라도, 그 서열의 일부가 돌연변이되지 않은 서열에 서브클로닝될 때(예를 들어, PV-MinXY 또는 PV-MinZ), 서브클로닝된 부분 상 및 생성된 하이브리드 내 코돈 사용빈도 프로파일은 본래의 돌연변이되지 않은 단백질 코딩 서열의 프로파일이 부합하지 않음을 주목한다. 그러나, 코돈 사용빈도 프로파일의 이러한 변화는 코돈 쌍 편향의 최소의 영향을 가진다.
마찬가지로, 하나 또는 다수의 아미노산 치환을 갖는 단백질 또는 폴리펩티드를 코딩하기 위해 뉴클레오티드 서열을 변화시키는 것도 또한 그 자체로 코돈 쌍 편향의 유의적 변화를 가지는 서열을 생성시킬 가능성이 매우 낮다는 것을 주목한다. 궁극적으로, 코돈 쌍 편향 변경은 돌연변이된 아미노산 서열을 코딩하기 위해 추가 변형된 뉴클레오티드 서열에서도 인식될 수 있다. 또한, 코돈 편향을 증가시키는 자체 의미의 돌연변이는 코돈 쌍 편향에 대한 작은 정도 이상의 영향을 미치기 쉽지 않음을 주목말한 만하다. 예를 들어, 본원에 개시된 바와 같이, 바람직하지 않은 코돈(PV-AB)의 사용을 최대화하기 위해 재코딩된 폴리오바이러스 돌연변이체에 대한 코돈 쌍 편향은, 야생형(PV-I(M))에서 단지 약 0.05만큼 감소된다. 또한, 그러한 단백질 코딩 서열이 크게 감소된 서열 다양성을 가진다는 것도 주목할만하다. 그와 반대로, 실질적 서열 다양성은 본 발명의 코돈 쌍 편향 변형 서열에서 유지된다. 또한, 희소 코돈의 사용 증가없이 수득가능한 코돈 쌍 편향의 유의적 감소는, PV-AB에서와 같이 바람직하지 않은 코돈의 사용을 최대화하는 대신, 코돈 쌍 편향을 더욱 효과적으로 감소시키기 위해 바람직하지 않은 코돈을 충분한 수의 바람직한 코돈으로 재배열하는 것이 유익할 것이다.
돌연변이의 정도 및 강도는 단백질 코딩 핵산의 길이, 전부 또는 일부가 돌연변이될 수 있는지의 여부, 및 코돈 쌍 편향의 요망되는 감소에 따라 다양할 수 있다. 본 발명의 한 실시양태에서, 단백질 코딩 서열은 약 100개 이상의 뉴클레오티드, 또는 약 200개 이상의 뉴클레오티드, 또는 약 300개 이상의 뉴클레오티드, 또는 약 500개 이상의 뉴클레오티드, 또는 약 1000개 이상의 뉴클레오티드의 길이에 걸쳐 변형된다.
상기 논의된 바와 같이, 용어 "모" 바이러스 또는 "모" 단백질 코딩 서열은, 다소 약독화될 수 있는 새 서열이 유래되는 기원이 되는 바이러스 게놈 및 단백질 코딩 서열을 지칭하기 위해 본원에 사용된다. 따라서, 모 바이러스는 "야생형" 또는 "천연 발생" 원형 또는 분리주, 또는 실제 또는 인식되는 바람직한 성질에 기초하여 특수 발생되거나 선택된 변이체 또는 돌연변이체일 수 있다.
신생 DNA 합성을 이용하여, 야생형 바이러스의 코돈 편향을 보존하면서, 최대 가능한 수의 희소하게 사용되는 코돈 쌍(바이러스 PV-Min)(서열 번호 4) 또는 최대 가능한 수의 빈번하게 사용되는 코돈 쌍(바이러스 PV-Max)(서열 번호 5)을 도입하도록, PV(M)의 캡시드 코딩 영역(뉴클레오티드 755 내지 뉴클레오티드 3385의 P1 영역)을 재설계하였다. 실시예 7를 참조한다. 즉, 설계된 서열은 모 서열과 동일한 코돈을 사용하나, 그것은 상이한 순서로 나타난다. PV-Max 바이러스는 1단계 증식 동역학 특성, 및 야생형 바이러스와 본질적으로 동일한 감염된 세포의 사멸을 나타냈다. (증식 동역학 특성이 야생형에 비해 코돈 쌍 최대화 바이러스에 대해 증가되지 않는다는 점은 다른 바이러스에 대해서도 유효한 것으로 나타낸다.) 역으로, PV-Min 돌연변이체 RNA로 형질감염된 세포는 사멸되지 않았고, 생존 가능한 바이러스가 회수될 수 없었다. PV-Min의 캡시드 영역의 단편(PV-Min755-2470, PV-Min2470-3386)의 wt 백그라운드로의 서브클로닝은, 매우 쇠약화되었으나 사멸하지 않은 바이러스를 생성시켰다. 실시예 7 및 도 8를 참조한다. 이 결과는, 유해한 코돈 변화가 바람직하게 널리 분포되어 있다는 가설을 입증하고, 전체 서열에 대한 코돈 쌍 편향 및 바이러스 산물의 약독화를 다양하게 하기 위해 야생형 모 바이러스 게놈 내로 치환된 코돈 쌍 역최적화 서열의 정도를 다양하게 함의 단순성 및 유효성을 증명한다. PV-AB 바이러스에서 관측되는 바와 같이, PV-Min 바이러스의 표현형은 자손 바이러스의 보다 적은 생성보다는, 바이러스 입자의 감소된 특이적 감염력의 결과이다.
역최적화 코돈 쌍 편향을 갖는 바이러스가 약독화된다. 이하 예시된 바와 같이(실시예 8 및 표 5 참조), CD155tg 마우스는 야생형 바이러스에 대해 치사적인 양보다 1000배 더 큰 양으로 약독화 바이러스를 뇌내 주사함에 의한 공격접종에도 생존하였다. 이러한 발견사실은, 바이러스에 대한 치사성을 최소화하기 위한 코돈 쌍 편향의 역최적화의 위력을 입증한다. 또한, 코돈 쌍 편향 역최적화 정도를 선택함으로써, 바이러스의 생존력이 감염력 감소와 균형을 이룰 수 있다. 또한, 일단 요망되는 약독화 성질을 제공하는 코돈 쌍 편향 역최적화의 정도 또는 범위가 결정되면, 그러한 코돈 쌍 편향 정도를 얻기 위한 부가적 서열을 설계할 수 있다. 예를 들어, 서열 번호 6은 갖는 폴리오바이러스 서열에 약 -0.2의 코돈 쌍 편향, 및 PV-MinXY 및 PV-MinZ의 돌연변이된 부분을 포괄하는 영역(즉, PV755-3385)에 걸쳐 분포한 돌연변이를 제공한다.
서열 설계를 위한 알고리즘
본 발명자들은 주어진 아미노산 서열을 코딩함과 동시에 특정의 요망되는 성질을 위해 DNA 서열을 최적화하는 유전자 설계를 위한 수가지 신규 알고리즘을 개발하였다. 특히, 패턴의 특정 집합을 최대로 부가 및/또는 제거함과 더불어(문헌 [Skiena, 2001]), 서열 내 요망되는 RNA 2차 구조를 최대화 또는 최소화하기 위한 알고리즘(문헌 [Cohen and Skiena, 2003])이 개발되었다. 전자 문제는 생존성 바이러스의 설계에 있어 제기되는 한편, 후자는 기술적 이유로 인해 제한효소 분위를 최적으로 삽입하는 데 유용하다. 교대 해독틀에서 2개 이상의 유전자를 동시에 코딩하는 중첩 유전자가 설계될 수 있는 정도가 연구되었다(문헌 [Wang et al., 2006]). 단일 핵산의 상이한 해독틀에서 코딩되는 상이한 기능성 폴리펩티드의 이러한 성질은 바이러스에 있어 공통적이고, 항생제 내성 유전자에서의 위빙(weaving)과 같은 기술적 목적을 위해 이용될 수 있다.
문헌 [Jayaraj et al. (2005)] 및 문헌 [Richardson et al. (2006)]에 기재되어 있는 바와 같이, 합성 생물학을 위한 설계 툴의 제1 세대가 확립되었다. 이는 생물학적 활성을 위한 서열 최적화 대신에 제조능을 위한 설계 최적화(즉, 국소 2차 구조 및 말단 반복체를 갖는 올리고뉴클레오티드)에 주로 초점을 두고 있다. 이 제1 세대 툴은, 고차원 설계 원리를 지지하기 보다는, 그 대신에 설계 원칙을 체킹하는 것과 관련하여 확립된 초기 VLSI CAD 툴과 유사한 것으로 볼 수 있다.
본원에 예시된 바와 같이, 임의의 코딩 영역의 코돈 쌍 편향을 조작하기 위해, 컴퓨터 기반 알고리즘이 사용될 수 있다. 알고리즘은 현존 코돈을 셔플링하고 생성되는 CPB를 평가한 후, 그 서열, 임의적으로는 특히 "중요(valuable)" 코돈 쌍에 고정된 서열을 리셔플링하는 능력을 가진다. 알고리즘은 또한 국부 최소점에 끼워지게 되지 않도록 "모의 어닐링"을 이용한다. RNA 폴딩의 자유 에너지와 같은 다른 파라미터들이 또한 임의적으로, 요망되지 않는 2차 구조의 발생을 막기 위한 알고리즘의 조절 하에 놓일 수 있다. 최소의 코돈 쌍 편향을 가지는 서열을 찾기 위해 알고리즘을 사용할 수 있고, 그러한 서열이 생존성 바이러스를 제공하지 않는 경우, 편향이 감소되었으나 최소화되지는 않은 서열을 찾기 위해 알고리즘을 조정할 수 있다. 물론, 생존성 바이러스 서열은 또한 컴퓨터 최소화 서열의 부분서열만을 이용하여 생성될 수 있다.
예를 들어 구배 강하, 또는 모의 어닐링을 이용한 컴퓨터로 보조하여, 또는 다른 최소화 통상적 절차로 수행하는지의 여부. 출발 서열 내에 존재하는 코돈을 재배열하는 절차의 한 예가 하기 단계들에 의해 나타내어질 수 있다:
1) 야생형 바이러스 게놈 서열을 얻는 단계.
2) 약독화 설계를 위해 표적화하는 단백질 코딩 서열을 선택하는 단계.
3) 비코딩 기능을 갖는, 알려지거나 추측된 DNA 분절을 잠그는(lock down) 단계.
4) 재설계된 단백질 내 잔존 아미노산의 요망되는 코돈 분포를 선택하는 단계.
5) 잠그어지지 않은 코돈 위치의 무작위 셔플을 수행하고, 코돈 쌍 스코어를 계산하는 단계.
6) 모의 어닐링 절차를 임의적으로 이용하여, 코돈 쌍 스코어를 더욱 감소(또는 증가)시키는 단계.
7) 수득된 설계를 과다 2차 구조 및 원치 않는 제한효소 부위에 대해 조사하는 단계:
"예"이면, 단계 (5)로 가거나, 문제있는 영역을 야생형 서열로 치환함으로써 설계를 수정하고, 단계 (8)로 감.
8. 바이러스 설계에 상응하는 DNA 서열을 합성하는 단계.
9. 바이러스 작제물을 생성하고, 발현을 평가하는 단계:
지나치게 약독화된 경우, 서브클론 작제물을 제조하고, 9로 가고;
불충분하게 약독화되면, 2로 감.
컴퓨터 기반 모의 어닐링의 일반 절차의 소스 암호(PERL 스크립트)가 제공된다.
대안적으로, 혹자는 코돈이 단백질 코딩 서열 내 다른 임의의 곳으로부터 스와핑되어야 한다는 요건없이 코돈 쌍을 선택함으로써 아미노산의 각 쌍이 역최적화되도록 하는 절차를 고안할 수 있다.
바이러스 약독화의 분자 기전: 고효율 방법을 이용한 약독화 PV 의 특성 분석
상기 기재되고 실시예에서 더욱 상세히 기재되는 바와 같이, 야생형 바이러스와 정확히 동일한 단백질을 코딩하나 변경된 코돈 편향 또는 변경된 코돈 쌍 편향을 가지는 2개의 합성 약독화 폴리오바이러스를 작제하였다. 한 바이러스는 역최적화 코돈을 이용하고; 다른 한 바이러스는 역최적화 코돈 쌍을 이용한다. 각 바이러스는 wt 바이러스에 대해 많은 수백개의 뉴클레오티드 변화를 가진다.
본원에 제시된 데이터는, 이들 바이러스가 불량한 번역으로 인해 약독화됨을 제시한다. 이러한 발견사실은 수정이 된다면 중요한 결과를 가진다. 첫 째로, 각 바이러스의 감소된 적응도/독성은 게놈에 걸쳐 확산되어 있는 수백개 위치에서의 작은 결손으로 인한 것이다. 따라서, 본질적으로 바이러스가 야생형으로 복귀될 가능성이 없고, 이에 따라 바이러스는 생백신 또는 사멸된 백신 중 어느 하나에 대한 좋은 출발점이다. 두 번째로, 감소된 적응도/독성이 번역에서의 수백개의 결손의 부가적 영향으로 인한 것인 경우, 복귀의 위험이 최소이면서 적응도를 감소시키는 상기 방법이 다른 많은 바이러스들에 대해 적용 가능해야 한다.
본 발명이 임의의 특정 작용 방식 또는 기저를 이루는 분자 기전에 국한되지 않음이 강조될지라도, 현재 진행 중인 연구는 이러한 대체 가설을 특징화하는 것에 목적을 둔다. 현재 진행 중인 검토는, 코돈 및 코돈 쌍 역최적화 폴리오바이러스 및 인플루엔자 바이러스와 같은 각종 약독화 바이러스 설계의 게놈을 통해 스캔하고, 또한 각 돌연변이체 바이러스의 중첩 300 bp 부분을 wt 부문에 둠으로써 키메라를 작제하는 고효율 방법을 이용하는 것을 수반한다. 실시예 11을 참조한다. 이어서, 이러한 키메라 바이러스의 기능을 검정한다. 본원에 개시된 예비 데이터에 의해 제시된 바와 같이, 대부분의 키메라가 야생형보다 급진적이지는 않으나 약간 덜 적합하다는 발견사실은, 많은 유해 돌연변이가 키메라에 의해 커버되는 영역 전반에 걸쳐 분포되어 있다는 "기능의 점증 손실"을 상관시킨다. 이와 역으로, 대부분의 키메라가 wt와 유사하거나 동일한 반면, 하나 또는 단지 몇 개의 키메라만 모 돌연변이체와 같이 약독화된다는 발견사실은, 돌연변이가 약독화를 초래하는 서열 위치가 비교적 소수로 있음과 그 위치에서의 약독화가 유의적임을 제시한다.
실시예 12에 기재된 바와 같이, 코돈 및 코돈 쌍 역최적화가 RNA 안정성 및 풍부도에 어떻게 영향을 미치는지 결정하고, 재조작된 바이러스 게놈의 번역을 저해하는 파라미터를 지적하기 위해, 실험을 수행한다. 분자에 기초한 이러한 저해의 이해는 SAVE 방법의 광범위한 바이러스로의 적용 가능성을 더욱 증진시킬 것이다. 번역 저해의 기저를 이루는 것으로 생각해 볼 수 있는 또 다른 기전은, 리보솜이 상이한 해독틀을 번역하기 시작하여, 그것이 인-프레임 정지 코돈을 만나게 되는 지점까지 의사적(spurious)이나, 전형적으로는 절단된(truncated) 폴리펩티드를 발생시키는 번역 틀이동이다. 잔기 1513 내지 2470로부터의 AB 돌연변이체 분절을 가지는 PV 게놈은 비생존성일 뿐만 아니라, 대략 42-44 kDa의 시험관내 번역 중에 신규 단백질 밴드를 생성시킨다(도 5A 참조). 신규 단백질의 생성을 유도하는 능력뿐만 아니라, PV를 불활성화하는 상기 AB1513-2470 단편의 능력은 틀이동 이벤트의 출현을 반영할 수 있고, 이 가능성도 또한 조사 중이다. 틀이동 부위의 도입을 막기 위한 필터가 SAVE 설계 소프트웨어 내에 만들어진다.
번역 결손에 대한 보다 상세한 조사가, 실시예 12에 기재된 바와 같이, 폴리솜 프로파일링, 토우프린팅(toeprinting), 및 융합 단백질의 루시퍼라제 검정법을 포함하나, 이들에 국한되지 않는 각종 기법들을 이용하여 수행된다.
폴리오바이러스의 분자 생물학
SAVE에 의해 바이러스 약독화에 기저를 이루는 기전을 파악하기 위해 연구가 진행 중이나, PV 캡시드 코딩 영역의 대규모 코돈 역최적화는 PV 그 자체의 생물학에 흥미로운 식견을 밝혀내었다. 무엇이 바이러스의 PFU/입자 비(특이적 감염력)을 결정하는지는 오래 지속되어 온 질문이다. 일반적으로, 생산적 감염의 확립 전의 감염성 라이프 사이클 중의 임의의 단계에서의 실패는 부전형(abortive) 감염을 초래할 것이며, 이에 따라 감염 입자의 소멸을 초래할 것이다. PV의 경우, 대략 100개의 비리온이 배양된 세포에서 한 감염성 이벤트를 초래하도록 할 것이 요구되어지는 것으로 나타났다(문헌 [Joklik and Darnell, 1961]; 문헌 [Schwerdt and Fogh, 1957]). 즉, 접종한 100개의 입자들 중 단지 대략 1개만이, 수용체 결합(단계 1), 및 이에 이은 내재화 및 탈피(단계 2), 게놈 번역의 개시(단계 3), 다단백질 번역(단계 4), RNA 복제(단계 5), 및 자손의 이입(단계 6)의 수준에서 모든 단계를 성공적으로 완성하기 쉽다.
본원에 기재된 AB-형 바이러스의 감염성 사이클에서, 자신의 캡시드가 동일한 경우, 단계 1 및 2는 PV(M) 감염과 동일하게 되어야 한다. 마찬가지로, 동일한 5' 미번역 영역은 번역 복합체의 어셈블리(단계 3)에서 동등하게 잘 수행하여야 한다. 한편, 바이러스 다단백질 번역(단계 4)은 캡시드 영역 내 다수의 차선적 동의 코돈의 도입으로 인해 심하게 쇠약화된다(도 5 및 6). 질량 작용의 법칙에 의해, 희소 아미노아실-tRNA가 리보솜 상의 A 부위 내로 확산되는 데에 더 오래 걸리기 때문에, 번역 기작에 의한 희소 코돈의 반복 출현은 리보솜의 막힘(stalling)을 초래하게 되는 것으로 사료된다. 펩티드가 큰 정도로 신장하는 것이 이용 가능한 아미노아실-tRNA의 농도에 의해 유도되기 때문에, 많은 희소 tRNA에 대한 mRNA의 의존성은 궁극적으로 번역 시간을 증가시킨다(문헌 [Gustafsson et al., 2004]). 대안적으로, 리보솜의 과다 막힘은 번역 복합체의 RNA로부터의 조기 해체를 유발하여, 분해되게 될 예정인 절단된 단백질을 초래할 수 있다. 양 과정 모두는 단위 시간 당, mRNA 분자 당 단백질 합성 속도를 더 낮게 만든다. 본원에 제시된 데이터가 코돈 역최적화 바이러스의 표현형이 게놈 번역 속도에 의해 결정되는 것으로 제시하나, 다른 기전적 설명도 가능할 수 있다. 예를 들어, 간염 A 바이러스 내 바이러스 캡시드 서열 전반에 걸친 희소 동의 코돈의 보존된 위치가, 필수적인 번역 휴지의 도입에 의한 초기 폴리펩티드의 적절한 폴딩을 위해 작용적으로 중요한 것으로 제시되었다(문헌 [Sanchez et al., 2003]). 따라서, 코돈 조성물의 대규모 변경은 상기 휴지 부위들 중 일부를 변화시켜, 미스폴딩된 캡시드 단백질의 증가를 초래할 수 있다고 생각할 수 있을 것이다.
이들 고려사항이 또한 PV 캡시드에도 적용되는지의 여부는 불분명하다. 그와 같이 적용될 경우, 변경된 표현형은, wt 코돈은 보존되나 캡시드 전반에 걸친 그 위치가 완전히 변화된 PV-SD 설계를 가질 것으로 예상될 것이다. 즉, 주장되는 휴지 부위 중 어느 것도 단백질 서열에 대해 적절한 위치에 있지 않을 것이다. 그러나, 표현형의 변화가 관찰되지 않았고, PV-SD가 야생형 수준으로 번역되어 복제되었다(도 3B).
또 다른 가능성은, 시험한 설계에 있어서의 대규모 코돈 변경이 우연의 우세-음성 RNA 요소, 예컨대 안정한 2차 구조, 또는 게놈의 다른 영역과 분열성 장기 상호작용을 겪을 수 있는 서열을 발생시킬 수 있다는 것이다.
바이러스 탈피 전 단계들 및 바이러스 탈피를 포함한 모든 단계들은, 본원에 기재된 wt 및 돌연변이체 바이러스를 비교해 볼 때 변화되지 않는 것으로 가정한다. 이는, 이들 모두의 분리주에 대한 암흑기(eclipse period)가 유사하다는 관찰에 의해 지지된다(도 3B). 그러므로, PFU/입자 비의 급격한 감소는 역최적화 게놈의 감소된 번역 능력의 결과일 가능성이 큰데, 즉 돌연변이체 바이러스의 핸디캡은 세포 내에서 결정된다.
일반적으로, 1/100 내지 1/1,000의 피코나바이러스의 비교적 낮은 PFU/입자 비(문헌 [Rueckert, 1985])는 세포 침투 전, 또는 세포 침투의 수준에서, 수용체 결합 단계에서의 구조적 변경에 의해 주로 결정되는 것으로 가정된다. 거의 감염성이 아닌 135S 입자의 형성은 폴리오바이러스 감염력의 비효율성의 주요 배후 요인일 수 있다(문헌 [Hogle, 2002]). 그러나, 일부 바이러스 돌연변이체는 보다 높은 특이적 감염력을 초래하지 않으면서 단계 A 입자 전환을 부정하기 쉽고, 관찰은 다른 침투후 기전이 낮은 PFU/입자 비의 원인일 수 있음이 제시된다(문헌 [Dove and Racaniello, 1997]).
본 데이터는 바이러스와 세포 사이의 그러한 침투후 상호작용에 대한 명료한 증거를 제공하고, 침투전이 아닌 이러한 이벤트는 폴리오바이러스의 구분된 PFU/입자 비에 기여함을 제시한다. 폴리오바이러스 내의 모든 복제 단백질이 다단백질 상의 P1의 다운스트림에 위치하기 때문에, 그것들은 결정적으로 P1 번역의 성공적 완성에 의존한다. 그러므로, P1 번역 속도의 저하는 모든 복제 단백질의 번역을 동일한 정도로 저하시킨다. 이는 다시, 생산적 감염의 확립에 필요한 숙주 세포에의 필수 변형, 예컨대 숙주 세포 번역의 정지 또는 숙주 세포 본유의 반응의 방지를 수행하는 바이러스의 능력을 감소시키게 되기 쉽다. 코돈 역최적화가 본원에 기재된 바와 같이, 펩티드 신장 단계에서 번역을 수행하기 쉬우나, 번역 개시의 감소도 또한 폴리오바이러스의 세이빈 백신 균주 내 내부 리보솜 부착 부위에서의 돌연변이에 대해 나타난 바와 같이, 강력한 약독화 결정자일 수 있다(문헌 [Svitkin et al., 1993; 1985]).
이러한 고려사항들에 기초하여, 게놈 번역 또는 조기 게놈 복제에서의 결손에 기인하는 많은 돌연변이체 표현형들이 실제로 PFU/입자 비를 저하시킴으로써 자체를 표명하는 것으로 예측된다. 이는, 결손이 부전형 감염의 가능성을 증가시키게 되는 한, 사실이다. 거의 모든 연구들에서, 어디에서도 사용되는 플라크 검정법이 선택되는 바이러스 검출 방법이기 때문에, 겉보기 바이러스 역가의 감소는 종종 그 자체의 바이러스 생성 감소와 동등화된다. 이는 단일 세포 수준에서 바이러스 성질을 특징화하는 곤란성으로 해명될 수 있는 고유의 문제점일 수 있다. 그 대신, 대부분의 검정법들은 큰 세포 집단에 대해 행해진다. 바이러스를 생성하는 세포의 수가 감소되더라도 세포 내 바이러스 생성이 정상적일 수 있는 것으로는 간주하지 않으면서, 선택된 시험의 보다 낮은 해독정보(단백질 합성, RNA 복제, PFU로 측정되는 바이러스 생성)는 한 세포를 기준으로 할 때 보다 낮은 생성의 지시자로서의 액면값으로 취해진다.
코돈 역최적화 바이러스에 의한 세포당 입자의 근접하게 동일한 생성은, 연장 시간 후에 생성된 총 단백질이 심하게 영향을 받지 않는 반면, 단백질의 생성 속도는 급격히 감소되었음을 가리킨다. 이는 지연된 CPE 출현으로 반영되며, 이는 유사한 세포내 바이러스 단백질 농도를 구축하기 위해 더 많은 RNA 복제 사이클을 통과해야 한다는 표시일 수 있다. 코돈 역최적화 바이러스는, 유입되는 감염 게놈의 조기 번역 속도가 감소되기 때문에, 생산적 감염을 확립함에 있어 심하게 저해되어지는 것으로 보인다. 이러한 보다 낮은 번역 속도의 결과, 세포의 항바이러스 반응을 불능화하는 데 필수적인 PV 단백질(가장 가능하게는 프로테나제 2Apro 및 3Cpro)은 수명 사이클에서의 상기 중대한 장애를 충분히 빨리 통과하도록 하기에 충분한 양으로 합성되지 않는다. 궁극적으로, 바이러스 복제가 전개되어 세포를 인수할 수 있기 전에, 세포가 감염을 제거할 가능성이 더 크다. 따라서, 생산적 감염 이벤트에 대한 가능성이 감소되고, 부전형 감염 속도가 증가된다. 그러나, 코돈 역최적화 바이러스가 세포 불능화에 성공하는 경우, 이 바이러스는 야생형과 거의 동일한 양의 자손을 생성시킬 것이다. 본 데이터는, 세포의 자체 번역이 대체로 중지될 때, 복제 상태 중에 조기 번역(유입 RNA 게놈으로부터)과 후기 번역 사이에 근본적 차이가 존재할 수 있다는 것을 제시한다. 이는 일반적 현상일 수 있으나, 그것은 특히 코돈 역최적화 게놈의 경우에 중요할 수 있다. 숙주 세포 차단은 유리 아미노아실-tRNA의 과풍부도를 초래할 가능성이 매우 큰데, 이는 PV 게놈이 더 이상 번역 자원을 위해 세포 RNA와 경쟁해야 할 필요가 없기 때문에, 차선적 코돈 사용빈도의 부과된 영향을 극복할 수 있다. 이는 실제로 본원에 기재된 변형된 시험관내 번역 시스템에서의 관찰과 유사할 수 있다(도 5B). 뉴클레아제로 처리되지 않고(이에 따라 세포 mRNA를 함유함), 외인성 아미노산 또는 tRNA로 보충되지 않은 번역 추출물을 이용할 때, 상이한 캡시드 설계 돌연변이체의 번역 능력에서 명료한 차이가 관찰된다. 이러한 조건 하에서, 바이러스 게놈은 공급이 제한된 환경에서 세포 mRNA와 경쟁해야 한다. 그와 대조적으로, 내인성 mRNA가 제거되고 과잉 tRNA 및 아미노산이 부가된 종래 번역 추출물에서는, 모든 PV RNA가 코돈 편향과 상관없이 잘 균등하게 번역되었다(도 5A). 이 두 가지 상이한 시험관내 조건은 PV 감염 세포에서의 조기 상태 및 후기 상태 중에 생체내 번역과 유사할 수 있다.
본 연구의 한 핵심적 발견사실은, 물리적 상호작용 및 바이러스 입수 동안의 단계 외에서는, PFU/입자 비도 또한 숙주 세포 항바이러스 반응을 극복하기 위한 바이러스의 능력을 대체로 반영한다는 것을 인식한 것이다. 이는, 피코나바이러스가 실제로 이 대항을 이겨나감에 있어 매우 비효율적이고, 세포가 효과적으로 반응할 수 있기 전에 빨리 복제할 수 있는 작은 게놈을 진화하는 경로를 택한 것으로 보인다. 데이터에서 나타나는 바와 같이, PV-AB2470-2954에서 번역 속도를 단지 30% 감속시키는 것(도 6 참조)은, 보다 낮은 특이적 감염력으로 반영되는 바와 같이 1,000배 보다 높은 부전형 감염 속도를 초래한다(도 4D). 피코나바이러스는 분명히 에러 카타스트로피(error catastrophe)의 시초(threshold)에서 복제할 뿐만 아니라(문헌 [Crotty et al., 2001]; 문헌 [Holland et al., 1990]), 숙주 세포의 항바이러스 방어에 의해 제거의 시초에서도 복제한다. 이러한 효과는 피코나바이러스의 병원성 표현형에 대해 심오한 결과를 가질 수 있다. 코돈 역최적화 바이러스에 의한 부전 감염의 속도 증가의 원인이 되는 세포 항바이러스 과정은 현재 완전히 이해되어지고 있지 않다. PV는 아포프토시스를 유도함은 물론 억제하는 것으로 나타났다(문헌 [Belov et al., 2003]; 문헌 [Girard et al., 1999]; 문헌 [Tolskaya et al., 1995]). 유사하게, PV는 NF-κB을 절단함으로써 인터페론 경로를 간섭한다(문헌 [Neznanov et al., 2005]). 조기 게놈 번역의 속도가 감소된 PV가 여전히 wt 바이러스와 동일한 방식으로 항바이러스 반응을 유도하나(디폴트에 의한 인터페론 및 아포프토시스의 유도), 이어서 낮은 단백질 합성으로 인해, 상기 과정을 억제하는 가능성이 감소될 소지가 있다. 이러한 개요는 세포가 초기 감염을 부전이 되게 할 가능성을 증가시키고, 관찰된 현상을 설명할 수 있다. 개별 세포 수준에서, PV 감염은 전부가 아니면 무(all-or-nothing)인 현상이기 쉽다. 바이러스 단백질 및 RNA 합성은 생산적 감염을 확보하기 위해 최대 범위 내에 있을 필요가 있을 것으로 보인다.
약독화 바이러스 백신 조성물
본 발명은 본원에 기재된 약독화 바이러스 중 임의의 것 및 약학적으로 허용되는 담체를 포함하는, 피험체에서 보호 면역 반응을 유발하는 백신 조성물을 제공한다.
본 발명의 약독화 바이러스는 피험체에서 보호 면역 반응을 도출하거나 피험체가 바이러스 관련 질환을 앓게 되지 않도록 예방하기 위해 사용될 경우, 약학적으로 허용되는 담체를 부가적으로 포함하는 조성물의 형태로 피험체에게 투여된다는 것을 이해해야 한다. 약학적으로 허용되는 담체는 당업자에게 공지되어 있고, 이에는 0.01 내지 0.1 M 및 바람직하게는 0.05 M 인산염 완충액, 인산염 완충 염수(PBS), 또는 0.9% 염수 중 하나 이상이 포함되나, 이들에 국한되지 않는다. 그러한 담체에는 또한 수용액 또는 비수용액, 현탁액 및 유화액이 포함된다. 수성 담체에는 물, 알코올 용액/수용액, 유화액 또는 현탁액, 염수 및 완충 매질이 포함된다. 비수성 용매의 예는 프로필렌 글리콜, 폴리에틸렌 글리콜, 식물성 오일, 예컨대 올리브 오일, 및 주사용 유기 에스테르, 예컨대 에틸 올레에이트가 포함된다. 비경구 비히클에는 염화나트륨 용액, 링거 덱스트로스, 덱스트로스 및 염화나트륨, 유산 링거액 및 고정 오일이 포함된다. 정맥내 비히클에는 체액 및 영양소 보충물, 전해질 보충물, 예컨대 링거 덱스트로스에 기초한 전해질 보충물 등이 포함된다. 고체 조성물은 예를 들어, 글루코스, 수크로스, 만니톨, 소르비톨, 락토스, 전분, 스테아르산마그네슘, 셀룰로스 또는 셀룰로스 유도체, 탄산나트륨 및 탄산마그네슘과 같은 비독성 고체 담체를 포함할 수 있다. 에어로졸 내 투여를 위해, 예컨대 폐 전달 및/또는 비강내 전달을 위해, 작용제 또는 조성물은 바람직하게 비독성 계면활성제, 예를 들어, C6-C22 지방산 또는 천연 글리세리드의 에스테르 또는 부분 에스테르, 및 추진제와 함께 제형된다. 비강내 전달을 촉진하기 위해, 레시틴과 같은 부가적 담체가 포함될 수 있다. 약제학적으로 허용되는 담체는, 활성 성분의 반감기 및/또는 효능을 증진시키는 소량의 보조 물질, 예컨대 습윤제 또는 유화제, 보존제, 및 예를 들어 항미생물제, 산화방지제 및 킬레이트화제와 같은 기타 첨가제를 추가로 포함할 수 있다. 본 조성물은, 당업계에 공지되어 있는 바와 같이, 피험체에게 투여된 후 활성 성분의 속방출, 서방출, 또는 지연방출을 제공하도록 제형될 수 있다.
본 백신 조성물의 각종 실시양태들에서, 약독화 바이러스는 (i) 감염 세포 내 바이러스 단백질의 합성 및 처리를 실질적으로 변경시키지 않고/않거나; (ii) 감염된 세포당 비리온을 wt 바이러스와 유사한 양으로 생성하고/생성하거나; (iii) wt 바이러스보다 실질적으로 더 낮은 비리온 특이적 감염력을 나타낸다. 추가 실시양태들에서, 약독화 바이러스는 숙주 동물에서 상응하는 wt 바이러스에서와 실질적으로 유사한 면역 반응을 유발한다.
본 발명은 또한 야생형 숙주 세포에서 비생존성인 약독화 바이러스에 대해 침해성이 되도록 특수 단리되거나 조작된 변형 숙주 세포주를 제공한다. 약독화 바이러스는 성장(야생형) 세포에서 증식할 수 없기 때문에, 그것은 증식을 위해 특정 헬퍼 세포주에 절대적으로 의존한다. 이는 백신 생성용 바이러스를 생성하는 데 매우 높은 안전 수준을 제공한다. 본 변형 세포주의 각종 실시양태들은 약독화 바이러스의 증식을 허용하게 되며, 여기에서 상기 세포주의 게놈은 희소 tRNA를 코딩하는 유전자의 수를 증가시키도록 변형되었다.
바람직한 실시양태들에서, 희소 코돈은 CTA(Leu 코딩), TCG(Ser), 및 CCG(Pro)이다. 상이한 실시양태들에서, 이들 희소 코돈의 1, 2 또는 3개는 바이러스 게놈에서 동의 빈번한 코돈을 위해 치환된다. 예를 들어, 단일 바이러스에서, 바이러스 내 모든 Leu 코돈이 CTA로 변화될 수 있거나; 모든 Ser 코돈이 TCG로 변화될 수 있거나; 모든 Pro 코돈이 CCG로 변화될 수 있거나; Leu 및 Ser, 또는 Leu 및 Pro, 또는 Ser 및 Pro 코돈이 동정된 희소 코돈에 의해 대체될 수 있거나; 모든 Leu, Ser, 및 Pro 코돈이 CTA, TCG 및 CCG로 각기 바뀔 수 있다. 또한, 관련 코돈의 분율, 즉 100% 미만이 희소 코돈으로 변화될 수 있다. 따라서, 치환된 코돈의 분율은 코돈의 총 수의 약 20%, 40%, 60%, 80% 또는 100%일 수 있다.
일부 실시양태들에서, 이들 치환은 바이러스의 캡시드 영역에서만 이루어지며, 여기에서는 높은 번역 속도가 가장 중요하다. 다른 실시양태들에서, 치환은 바이러스 전반에 걸쳐 이루어진다. 추가 실시양태들에서, 세포주는 희소 코돈에 결합하는 tRNA를 과다발현한다.
본 발명은, (a) 바이러스 게놈의 하나 이상의 비조절 부분 내 다수 위치에서의 코돈을 동정하는 단계(상기 코돈은 동의 코돈으로 치환될 수 있음); (b) 각각의 동정된 코돈을 치환하기 위한 동의 코돈을 선택하는 단계; 및 (c) 각각의 동정된 코돈을 동의 코돈으로 치환하는 단계를 포함하는, 본원에 기재된 약독화 바이러스 중 임의의 것을 합성하는 방법을 추가로 제공한다.
본 발명의 특정 실시양태들에서, 단계 (a) 및 (b)는 바람직한 한도 내에서 역최적화 코돈 분포 및/또는 역최적화 코돈 쌍 분포의 특정화 패턴 집합을 다양화함으로써, 바이러스 게놈의 설계를 허용하는 합성 약독화 바이러스 조작(SAVE)을 위한 컴퓨터 기반 알고리즘에 의해 주도된다. 본 발명은 또한 패턴 집합이 역최적화 코돈 및 역최적화 코돈 쌍의 밀도, RNA 2차 구조, CpG 디뉴클레오티드 함량, C+G 함량, 중첩 코딩 틀, 제한효소 부위 분포, 틀이동 부위, 또는 이들의 임의의 조합을 대안적으로 또는 부가적으로 포함하는 방법을 제공한다.
다른 실시양태들에서, 단계 (c)는 동의 코돈 및/또는 코돈 쌍을 가지는 DNA를 신생 합성하고, 게놈의 상응하는 영역을 합성 DNA로 치환함으로써 수행한다. 추가 실시양태들에서, 전체 게놈은 합성된 DNA로 치환된다. 또 다른 실시양태들에서, 게놈의 부분은 합성된 DNA로 치환된다. 또 다른 실시양태들에서, 게놈의 상기 부분은 캡시드 코딩 영역이다.
부가적으로, 본 발명은 피험체에게 예방적 또는 치료적 유효량의 본원에 기재된 백신 조성물들 중 임의의 것을 투여하는 단계를 포함하는, 피험체에서 보호 면역 반응을 유발하는 방법을 제공한다. 본 발명은 또한 피험체에게 예방적 유효량의 본 백신 조성물들 중 임의의 것을 투여하는 단계를 포함하는, 피험체가 바이러스 관련 질환을 앓게 되는 것을 예방하는 방법도 제공한다. 상기 방법의 실시양태에서, 피험체는 병원성 바이러스에 노출되었다. 병원성 바이러스에 "노출된다"라는 것은, 감염이 초래되도록 바이러스와 접촉되는 것을 의미한다.
본 발명은 피험체에게 치료적 유효량의 본 백신 조성물들 중 임의의 것을 투여하는 단계를 포함하는, 바이러스 감염 피험체에서의 바이러스 관련 질환의 발병을 지연시키거나 진행 속도를 늦추는 방법을 추가로 제공한다.
본원에 사용되는 "투여한다"는 것은, 당업자에게 공지된 각종 방법 및 전달 시스템 중 임의의 것을 이용하여 전달함을 의미한다. 투여는 예를 들어, 복강내, 뇌내, 정맥내, 경구, 경점막, 피하, 경피, 피내, 근육내, 국소, 비경구, 임플란트를 통해, 지주막하강내, 림프관내, 병변내, 심막, 또는 경막외를 통해 수행될 수 있다. 작용제 또는 조성물은 또한 에어로졸 내, 예컨대 폐 및/또는 비강내 전달을 위해 투여될 수 있다. 투여는 예를 들어, 1회, 복수회, 및/또는 1회 초과의 연장 기간 수행될 수 있다.
피험체에서 보호 면역 반응을 유발하는 것은, 예를 들어 피험체에게 일차 용량의 백신을 투여하고, 이어서 적당한 시간 후에 백신을 1회 이상 후속 투여함으로써 수행할 수 있다. 백신 투여 사이의 적당한 시간은 당업자에 의해 용이하게 결정될 수 있고, 통상 대략 수주 내지 수개월이다. 그러나, 본 발명은 어떠한 투여 방법, 경로 또는 빈도에도 국한되지 않는다.
"피험체"는 임의의 동물 또는 인공적으로 변형된 동물을 의미한다. 동물에는 인간, 비인간 영장동물, 소, 말, 양, 돼지, 개, 고양이, 토끼, 흰족제비, 설치류, 예컨대 마우스, 래트 및 기니아피그, 및 새가 포함되나, 이들에 국한되지 않는다. 인공적으로 변형된 동물에는 인간 면역계를 갖는 SCID 마우스, 및 인간 폴리오바이러스 수용체 CD155를 발현하는 CD155tg 유전자도입 마우스가 포함되나, 이들에 국한되지 않는다. 한 바람직한 실시양태에서, 피험체는 인간이다. 새의 바람직한 실시양태는 닭, 칠면조, 오리 및 거위를 포함하나 이에 국한되지 않는 가축화된 가금 종이다.
"예방적 유효량"은, 바이러스 감염에 걸리기 쉽거나 바이러스 관련 장애를 앓기 쉬운 피험체에게 투여될 때, 피험체에서 피험체가 바이러스에 의해 감염되게 되거나 장애를 앓게 되는 것을 보호하는 면역 반응을 유발하도록 하는, 백신의 임의의 양이다. 피험체를 "보호한다"는 것은, 2배 이상, 바람직하게는 10배 이상만큼, 피험체가 바이러스에 의해 감염되게 될 가능성을 감소시키거나, 피험체에서의 장애의 발병 가능성을 저하시키는 것을 의미한다. 예를 들어, 피험체가 바이러스에 의해 감염되게 되는 가능성이 1%인 경우, 피험체가 바이러스에 감염될 경향의 2배 감소는 피험체가 바이러스에 의해 감염되게 되는 가능성이 0.5%가 되도록 하는 것이다. 가장 바람직하게는, "예방적 유효량"은 피험체에서 피험체가 바이러스에 의해 감염되게 되는 것으로부터 완전히 방지하거나 피험체에서의 장애 발병을 전체적으로 방지하는 면역 반응을 유발한다.
본원에 사용되는 "치료적 유효량"은, 백신이 대항 효과를 가지는 장애를 앓는 피험체에게 투여될 때, 피험체에서 피험체로 하여금 장애 및/또는 그것의 증상의 감소, 경감 또는 퇴보를 유발하는 면역 반응을 유발하도록 하는, 백신의 임의의 양이다. 바람직한 실시양태들에서, 장애 및/또는 그것의 증상의 재발이 예방된다. 다른 바람직한 실시양태들에서, 피험체는 장애 및/또는 그것의 증상이 치유된다.
본 면역화 및 치료 방법 중 임의의 것의 일부 실시양태들은, 피험체에게 1종 이상의 면역보조제(adjuvant)를 투여하는 단계를 추가로 포함한다. "면역보조제"는 피험체에서 항원의 면역원성을 증진시키고 면역 반응을 증대시키는 데 적당한 임의의 작용제를 의미할 것이다. 단백질에 기초한 백신 및 핵산에 기초한 백신 모두와 함께 사용하기에 적당한, 입상 면역보조제를 포함한 다수의 면역보조제들, 및 면역보조제를 항원과 조합하는 방법이 당업자에게 공지되어 있다. 핵산에 기초한 백신을 위해 적당한 면역보조제에는, 정제된 단백질 또는 핵산 형태로 전달되는, 퀼(Quil) A, 이미퀴모드(imiquimod), 레시퀴모드(resiquimod), 및 인터루킨(interleukin)-12가 포함되나, 이들에 국한되지 않는다. 단백질 면역화와 함께 사용하기에 적당한 면역보조제에는 알룸(alum), 프로인트 불완전 면역보조제(FIA), 사포닌, 퀼 A, 및 QS-21이 포함되나, 이들에 국한되지 않는다.
본 발명은 또한 본 발명의 약독화 바이러스로 피험체를 면역화하기 위한 키트를 제공한다. 키트는 약독화 바이러스, 약학적으로 허용되는 담체, 애플리케이터(applicator), 및 이의 사용에 대한 사용설명 자료를 포함한다. 추가 실시양태들에서, 약독화 바이러스는 하나 이상의 폴리오바이러스, 하나 이상의 리노바이러스, 하나 이상의 인플루엔자 바이러스 등일 수 있다. 한 특정 바이러스의 다수의 상이한 분리주에 대해 숙주를 면역화하는 데 바람직한 경우, 1개 초과의 바이러스가 바람직할 수 있다. 본 발명은 당업자에게 공지된 다른 실시양태의 키트들도 포함한다. 사용설명서는 약독화 바이러스의 투여를 지시하는 데 유용한 임의의 정보를 제공할 수 있다.
물론, 본원에 개시된 본 발명의 원칙의 변화가 당업자에 의해 수행될 수 있고, 그러한 변형도 본 발명의 범주 내에 포함되는 것으로 이해하고 예상한다. 하기 실시예는 본 발명을 추가로 설명하나, 어떠한 식으로도 본 발명의 범주를 제한하는 것으로 간주되어서는 안된다. 통상적 방법들, 예컨대 재조합 플라스미드의 작제, 숙주 세포의 바이러스 작제물로의 형질감염, 중합효소 연쇄 반응(PCR), 및 면역학적 기법에 이용되는 방법들에 대한 상세한 설명은, 문헌 [Sambrook et al. (1989)] 및 문헌 [Coligan et al. (1994)]을 포함한 다수의 발행물로부터 수득될 수 있다. 본원에 언급된 모든 참조문헌들은 본원에 전문이 참조 인용된다.
본원 전반에 걸쳐 인용되는 각종 발행물들에 대한 전체 상세내용이 청구범위 직전에 있는 명세서 말미에 제공되어 있다. 이 발행물들의 개시내용은 본원에 전문이 참조 인용된다. 그러나, 본원의 참조문헌의 인용은 그러한 참조문헌이 본 발명에 대한 종래 기술임을 인정하는 것으로 간주되어서는 안된다.
실시예 1
코돈 편향을 변경시킴에 의한 폴리오바이러스의 캡시드 영역의 재조작
세포, 바이러스, 플라스미드 및 세균
HeLa R19 세포 단층을 37℃에서 10% 우태 혈청(BCS)으로 보충된 둘베코 변형 이글 배지(DMEM) 중에 유지시켰다. 모든 PV 감염성 cDNA 작제물들은 PV1(M) cDNA 클론 pT7PVM에 기초한다(문헌 [Cao et al., 1993]; 문헌 [van der Werf et al., 1986]). pHRPF-Luc를 이용하여, 디시스트론성 리포터 플라스미드를 작제하였다(문 헌 [Zhao and Wimmer, 2001]). 플라스미드 형질전환 및 증식을 위해, 에쉐리키아 콜라이 DH5α를 사용하였다. HeLa R19 세포 단층을 5 PFU/세포로 감염시킴으로써 바이러스를 증폭시켰다. 감염된 세포를, 완전 세포병변 효과(CPE)가 명백해질 때까지, 또는 감염후 적어도 4일 동안, 37℃에서 DMEM(2% BCS) 중에서 인큐베이션하였다. 3회 냉동 및 해동 후, 저속 원심분리에 의해 용해물로부터 세포 잔해물을 제거하였고, 바이러스를 포함하는 상등액을 추가 계대배양 또는 분석을 위해 사용하였다.
합성 캡시드 대체 및 디시스트론성 리포터 레플리콘의 클로닝
진메이커(GeneMaker)
Figure 112009066775576-pct00006
기술(블루 헤론 바이오테크놀리지(Blue Heron Biotechnology))를 이용하여, SD 및 AB로 칭해지는, 뉴클레오티드 495와 3636 사이의 게놈에 걸쳐 있는 2개의 PV 게놈 cDNA 단편을 합성하였다. PflMI 분해에 의해 판매업자의 클로닝 벡터로부터 치환 카세트를 방출하고, 상응하는 PflMI 단편이 제거된 pT7PVM 벡터에 삽입함으로써, pPV-SD 및 pPV-AB를 생성시켰다. pPV-AB755-1513 및 pPV-AB2470-3386은, pPV-AB로부터의 BsmI 단편 또는 NheI-EcoRI 단편을 동등하게 분해된 pT7PVM 벡터 내로 각기 삽입함으로써 생성되었다. pPV-AB1513-3386 및 pPV-AB755-2470에서, pT7PVM의 BsmI 단편 또는 NheI-EcoRI 단편은 각기 pPV-AB 벡터의 각 단편을 치환한다. pPV-AB1513-3386의 pT7PVM의 단편으로 NheI-EcoRI 단편을 치환함으로써, pPV-AB2470-3386이 생성되었다. 마지막으로, pPV-AB2470-3386 및 pT7PVM의 SnaBI-EcoRI 단편을 상호 치환함으로써, pPV-AB2954-3386 및 pPV-AB2470-2954가 각기 생성되었다.
올리고뉴클레오티드 Fluc-mutRI(+)/Fluc-mutRI(-)를 이용한 부위 지정 돌연변이유발에 의해 pHRPF-Luc 내에 침묵 돌연변이를 도입하여, 반딧불 루시퍼라제 개방 해독틀 내에 EcoRI 부위를 돌연변이시키고 pdiLuc-mRI를 생성시킴으로써, 디시스트론성 리포터 작제물의 클로닝을 수행하였다. pT7PVM, pPV-AB1513-2470, 및 pPV-AB2470-2954의 캡시드 영역을, 올리고뉴클레오티드 RI-2A-P1wt(+)/P1wt-2A-RI(-)를 이용하여 PCR 증폭시켰다. pPV-AB2470-3386 및 pPV-AB2954-3386 또는 pPV-AB의 캡시드 서열을 RI-2A-P1wt(+)/P1AB-2A-RI(-) 또는 RI-2A-P1AB(+)/P1AB-2A-RI(-)로 각기 증폭시켰다. PCR 산물을 EcoRI로 분해하고, pdiLuc-mRI 내 현재 독특한 EcoRI 부위에 삽입하여, pdiLuc-PV, pdiLuc-AB1513-2470, pdiLuc-AB2470-2954, pdiLuc-AB2470-3386, pdiLuc-AB2954-3386 및 pdiLuc-AB를 각기 초래하였다.
올리고뉴클레오티드
하기 올리고뉴클레오티드들을 사용하였다:
Fluc-mutRI(+), 5'-GCACTGATAATGAACTCCTCTGGATCTACTGG-3'(서열 번호 6); Fluc-mutRI(-), 5'-CCAGTAGATCCAGAGGAGTTCATTATCAGTGC-3'(서열 번호 7); RI-2A-P1wt(+), 5'-CAAGAATTCCTGACCACATACGGTGCTCAGGTTTCATCACAGAAAGTGGG-3'(서열 번호 8); RI-2A-P1AB(+), 5'-CAAGAATTCCTGACCACATACGGTGCGCAAGTATCGTCGCAAAAAGTAGG-3(서열 번호 9); P1wt-2A-RI(-), 5'-TTCGAATTCTCCATATGTGGTCAGATCCTTGGTGG-AGAGG-3'(서열 번호 10); 및 P1AB-2A-RI(-), 5'-TTCGAATTCTCCATACGTCGTTAAATCTTTCGTCGATAACG-3'(서열 번호 11).
시험관내 전사 및 RNA 형질감염
T7 프로모터에 의해 유도되는, 2 ㎍의 EcoRI 선형화 플라스미드 DNA를 37℃에서 1시간 동안 T7 RNA 중합효소(스트라타젠(Stratagene))에 의해 전사시켰다. 1 마이크로그램의 바이러스 또는 디시스트론성 전사체 RNA를 사용하여, DEAE-덱스트란 방법의 변형에 따라 직경 35 mm 플레이트 상에서 106개 HeLa R19 세포를 감염시켰다(문헌 [van der Werf et al., 1986]). 실온에서 30분 동안 인큐베이션한 후, 상등액을 제거하였고, 세포를 CPE가 나타날 때까지 2% BCS 함유의 2 ml의 DMEM 중에 37℃에서 인큐베이션하거나, 세포를 추가 계대배양을 위해 형질감염후 4일에 냉동시켰다. 최소 이글 배지에서 0.6% 트래거캔스 검(시그마-알드리치(Sigma-Aldrich))의 반고체 오버레이를 이용하여, HeLa R19 세포 상에서 표준 플라크 검정법에 의해 바이러스 역가를 측정하였다.
코돈 역최적화 폴리오바이러스의 설계 및 합성
폴리오바이러스 P1 캡시드 영역의 2가지 상이한 동의 코딩을 생성시켰으며, 이 코딩은 각기 상이한 설계 기준에 의해 지배된다. 전체 캡시드 코딩 서열이 생성되는 부분게놈 레플리콘의 복제에 영향을 주지 않으면서 외인성 서열로 치환되거나 PV 게놈으로부터 제거될 수 있다는 것으로 궁극적으로 나타난 바, 상기 설계는 캡시드에 국한되었다(문헌 [Johansen and Morrow, 2000]; 문헌 [Kaplan and Racaniello, 1988]). 그러므로, 미확인 중대 조절 RNA 요소가 캡시드 영역에 위치하지 않았음이 매우 확실하며, 이는 RNA 서열의 조절에 의해 우연히 영향을 받을 수 있다.
첫 번째 설계(PV-SD)는 야생형 P1 영역의 정확한 코돈 사용빈도 분포를 보존하면서 RNA 염기 변화의 수를 최대화고자 모색하였다(도 1). 이를 수행하기 위해, 동의 코돈 위치를, 그 위치와 코돈 사이의 최대 중량 이분 매칭(문헌 [Gabow, 1973])을 찾음으로써 각 아미노산과 교환하였고, 여기에서 각 위치-코돈 쌍의 중량은 원래의 코돈과 그것을 치환하기 위한 동의 후보 코돈 사이의 염기 변화의 수이다. 매칭 알고리즘으로부터 임의의 위치 편향을 피하기 위해, 동의 코돈 위치를 삽입 그래프를 생성하기 전에 무작위로 변경시켰고, 그 위치를 후속하여 복원하였다. 로쓰버그(Rothberg)의 최대 이분 매칭 프로그램(문헌 [Rothberg, 1985])을 이용하여, 매칭을 연산하였다. 각기 6개 뉴클레오티드로 된, 총 11개의 유용한 제한효소 부위를 바이러스 게놈 서열 내에 잠금하여, 코돈 위치 교환에 관여하지 않도록 하였다. 코돈 셔플링 기법은 잠재적으로 생성되는 재구성 전장 게놈 내에 바람직하게 독특하게 남아야 하는 부가적 제한효소 부위를 생성시킨다. 이러한 이유로, 요망되지 않는 부위를 제거하도록 코돈을 치환함으로써, 서열을 추가로 가공하였다. 이는 코돈 빈도 분포를 약간 변경시킨 부가적 9개의 동의 코돈 변화를 초래하였다. 그러나, 코돈은 야생형 서열에 걸친 빈도 변화가 1개를 초과하지 않았다. 총체적으로, 캡시드 코딩 도메인의 동일한 단백질 서열을 유지하면서, wt P1 서열에 비해 PV-SD 캡시드 설계에서 변화된 것은 2,643개 뉴클레오티드 중 934개가 있었다(도 1 및 2 참조). 코돈 사용빈도가 변화하지 않았으므로, PVM-SD 캡시드 코딩 서열 내 GC 함량은 49%로 wt 내 GC 함량과 동일하게 한 채로 남았다.
두 번째 설계인 PV-AB는 wt P1 영역에 걸쳐 코돈 사용빈도 분포를 급격히 변화시키고자 모색하였다. 이 설계는, 코돈 편향이 조직 특이적 발현에 영향을 줄 수 있다는 것을 제시하는 최근 연구에 의해 영향을 받았다(문헌 [Plotkin et al., 2004]). 요망되는 코돈 사용빈도 분포는 전술된 뇌 특이적 유전자의 집합에서 관찰되는 가장 바람직하지 않은 코돈으로부터 유래되었다(문헌 [Hsiao et al., 2001]; 문헌 [Plotkin et al., 2004]). 본 유전자 집합에서 관찰되는 각 특정 아미노산에 대한 가장 희소한 동의 코돈의 사용빈도를 최대화함으로써, 캡시드 코딩 영역을 합성하였다(도1). 단 하나(Leu)를 제외한 모든 아미노산에 있어, 뇌 내의 가장 희소한 코돈은 대체로 모든 인간 유전자들 중의 가장 희소한 코돈에 상응하기 때문에, 실제로 이 설계는 또한 다른 인간 조직에서의 발현과 차별되는 것으로 예상된다. 아울러, PV-AB 캡시드는 680 뉴클레오티드 위치에서 wt 캡시드와 상이하다(도 2 참조). PVM-AB 캡시드 영역 내의 GC 함량은, wt에서는 49%로 감소된 것에 비해, 43%로 감소되었다.
실시예 2
폴리오바이러스의 증식 및 감염력에 대한 코돈 역최적화의 영향
감염 병소 검정법에 의한 바이러스 역가의 결정
표준 플라크 검정법에서와 같이 감염을 수행하였다. 48시간 또는 72시간 동안의 인큐베이션 후, 트래거캔스 검 오버레이를 제거하였고, 웰을 인산염 완충 염수(PBS)로 2회 세정하고, 30분 동안 냉 메탄올/아세톤으로 고정하였다. 웰을 10% BCS 함유의 PBS 중에 블록킹한 후, 항3D 마우스 단클론성 항체 125.2.3의 1:20 희석액과 함께 37℃에서 1시간 동안 인큐베이션하였다(문헌 [Paul et al., 1998]). 세정 후, 세포를 호스래디쉬 퍼옥시다제 표지 염소 항마우스 항체와 함께 인큐베이션하였고(문헌 [Jackson ImmunoResearch, West Grove, PA]), 감염된 세포를 벡터 VIP 기질 키트(벡터 라보라토리즈(Vector Laboratories), 미국 캘리포니아주 벌링게임 소재)를 이용하여 가시화하였다. wt 바이러스로 수득된 플라크와 동등한 염색된 병소를 계수하였고, 플라크 검정법 절차에서와 같이 역가를 계산하였다.
코돈 역최적화 폴리오바이러스는 심한 성장 표현형을 표시한다.
2가지 초기 캡시드 ORF 치환 설계들 중(도 3A), 단지 PV-SD만이 생존성 바이러스를 생성시켰다. 이와 대조적으로, 3회 계대배양 후에도, PV-AB RNA를 이용한 4가지 독립적 형질감염으로부터 생존성 바이러스가 회수되지 않았다(도 3E). PV-AB 게놈 내로 도입된 코돈 편향이 지나치게 심한 것으로 나타났다. 따라서, PV-AB 캡시드 코딩 서열의 보다 작은 부분이 PV(M) 백그라운드 내로 서브클로닝되어, 바람직하지 않은 코돈의 유해한 영향을 감소시켰다. 이들 서브클론 중, PV-AB2954-3386은 RNA 형질감염 후 40시간에 CPE를 생성시킨 반면, PV-AB755-1513 및 PV-AB2470-2954은 각기 형질감염 후 1 또는 2회 부가 계대배양을 필요로 하였다(야생형 바이러스의 경우 24시간인 것과 대비됨). 흥미롭게도, 이 키메라 바이러스들은 원래의 AB 서열의 가장 작은 부분을 갖는 3개 서브클론을 나타내고, 관찰은 바람직하지 않은 코돈의 수와 바이러스의 적응도 간의 직접적 상관관계를 제시한다.
감염 중복지수(MOI)가 2인 HeLa 단층을, RNA 형질감염 후 최대 2 계대배양 후에 수득된 바이러스 세포 용해물로 감염시킴으로써, 모든 생존성 바이러스 변이체의 1단계 증식 동역학 특성을 결정하였다(도 3B). PV-AB2470-2954의 보다 낮은 역가로 인해, 또한 접종물을 농축하고 정제하는 데 필요한 추가 계대배양의 필요를 제거하도록 MOI를 선택하였다. 사용 조건 하에서, 모든 바이러스들이 감염후 24시간까지 완전 또는 근완전 CPE를 생성시켰다.
자체의 캡시드 영역 내 934개 단일-점 돌연변이에도 불구하고, PV-SD는 wt 역량으로 복제하였고(도 3B), wt와 유사한 크기의 플라크를 생성시켰다(도 3D). PV-AB2954-3386가 근야생형 동역학 특성을 가지며 증식하였고(도 3B), PV-AB755-1513은 미세한 플라크 및 대략 22배 적은 감염성 바이러스를 생성시켰다(각기 도 2, 3B 및 F). 매우 지연되기는 하나 고MOI 감염에서 CPE를 유발할 수 있으나(20 내지 24시간 후, 80 내지 90% CPE), PV-AB2470-2954는 표준 플라크 검정법의 조건 하에서 플라크를 전혀 생성하지 않았다(도 3H). 그러므로, 항체를 이용하여 바이러스 중합효소 3D로 면역화학적으로 염색한 후, 플라크 검정법 조건 하에 72시간 동안 인큐베이션한 후에 감염된 세포 병소를 계수하는 병소 형성 검정법을 이용하여, 상기 바이러스를 정량하였다(도 3G). 48시간 동안의 감염 후, PV-AB2470-2954 감염 병소는, wt의 경우에는 병소 3 mm 플라크인 것에 비해, 통상 단지 수십개 내지 수백개의 세포만이(도 3J) 병소 직경이 0.2 내지 0.5 mm이 되었다(도 3C 및 D). 그러나, 부가적 24시간 후에, 병소의 직경은 유의적으로 증가되었다(2 내지 3 mm; 도 3G). HeLa 세포를 1의 MOI로 PV-AB755-1513 및 PV-AB2470-2954로 감염시켰을 때, CPE는, wt의 경우는 8시간인 것에 비해, 각기 12시간 내지 18시간, 및 3일 내지 4일인 것으로 나타났다(데이터는 나와 있지 않음).
단백질 코딩 서열 내 한 특정 코돈 편향의 누적 효과를 정량하기 위해, 인간 게놈 내 일반 코돈 분포에 대한 비교 측정값인 상대 코돈 역최적화 지수(RCDI)를 계산하였다. 1/코돈의 RCDI는, 유전자가 정상 인간 코돈 빈도를 따르나, 정상 인간 코돈 편향으로부터의 임의의 이탈은 RCDI이 1 초과가 되도록 함을 나타낸다. 하기 식을 이용하여, RCDI을 유도하였다:
Figure 112009066775576-pct00007
C i F a 는 동일한 아미노산에 대한 모든 동의 코돈들 중 각 코돈 i의 시험 서열에서의 관찰된 상대 빈도(0 내지 1)이고; C i F h 는 그 아미노산에 대한 모든 동의 코돈들 중 각 코돈 i의 인간 게놈 내에서 관찰되는 정상 상대 빈도(0.06 내지 1)이며; N Ci 는 서열 내 그 코돈 i의 출현 수이고; N은 서열 내 코돈(아미노산)의 총 수이다.
따라서, 서열 내 희소 코돈의 수가 높으면 지수가 높아지게 된다. 이 식을 이용하여, 각종 캡시드 코딩 서열의 RCDI 값이 PV(M) 및 PV-SD의 경우 1.14인 것으로 계산되었는데, 이는 정상 인간 분포에 매우 근접한다. AB 작제물에 대한 RCDI 값은 PV-AB755-1513에 대해서는 1.73이고, PV-AB2470-2954에 대해서는 1.45이며, 모 PV-AB에 대해서는 6.51이다. 비교하자면, 원래의 아에쿠오라 빅토리아(Aequora vicoria) gfp 유전자의 RCDI는 1.68인 것에 비해, 아마도 가장 잘 알려져 있는 코돈-최적화 단백질인 "인간화" 녹색 형광 형광 단백질(GFP)의 RCDI은 1.31이었다(문헌 [Zolotukhin et al., 1996]). 이 계산들에 따라, RCDI가 <2인 캡시드 코딩 서열은 생존성 바이러스 표현형과 관련되는 반면, RCDI가 >2이면(PV-AB = 6.51, PV-AB1513-3386 = 4.04, PV-AB755-2470 = 3.61), 치사적 표현형을 초래한다.
실시예 3
폴리오바이러스의 특이적 감염력에 대한 코돈 역최적화의 영향
바이러스 입자의 분자적 정량: 직접적 OD 260 흡광도 방법
완전 CPE가 발생될 때까지(하룻밤 대 4일), 0.5의 MOI에서, HeLa 세포(4×107개 세포)의 15 cm 디쉬를 PV(M), PV-AB755-1513 또는 PV-AB2470-2954로 감염시켰다. 세포 결합 바이러스를 3회 연속 냉동/해동 사이클에 의해 방출시켰다. 세포 용해물을, 2,000×g로 10분간 원심분리한 후, 10분간 14,000×g에서 두 번째 10분 원심분리를 함으로써 제거하였다. 상등액을 10 ㎍/ml RNase A(로쉐(Roche))의 존재 하에 실온에서 1시간 동안 인큐베이션하여, 임의의 바이러스외 또는 세포내 RNA를 분해하였다. 0.5% 도데실황산나트륨(SDS) 및 2 mM EDTA를 첨가한 후, 바이러스 함유 상등액을 6 ml 수크로스 쿠션(행크스 밸런스 염용액 [HBSS] 중 30% 수크로스; 인비트로겐(Invitrogen), 미국 캘리포니아주 칼스배드 소재) 상에 두었다. 바이러스 입자를 SW28 스윙 버켓 회전자를 이용하여 28,000 rpm에서 4시간 동안 초원심분리함으로써 침강시켰다. 상등액을 폐기하였고, 원심분리관을 HBSS로 2회 헹구면서, 수크로스 쿠션은 비변형 상태로 남겼다. 마지막 세정액 및 수크로스 쿠션을 제거한 후, 바이러스 펠렛을 0.2% SDS 및 5 mM EDTA를 함유하는 PBS 중에 재현탁시켰다. 플라크 검정법/감염 병소 검정법에 의해 바이러스 감염성 역가를 측정하였다(상기 참조). 260 nm에서의 흡광도(OD260)에서 나노드롭(NanoDrop) 분광광도계(나노드롭 테크놀로지즈 인코포레이티드(NanoDrop Technologies, Inc.), 미국 델라웨어주 윌밍턴 소재)를 이용하여 바이러스 입자 농도를 측정하여, 식 [1 OD260 단위 = 9.4×1012 입자/ml]를 이용하여 계산하였다(문헌 [Rueckert, 1985]). 부가적으로, 3회 페놀 추출 및 1회 클로로포름 추출에 의해 비리온 RNA를 추출하였다. RNA를 에탄올 석출시켜, 초순수 중에 재현탁하였다. TAE 완충 아가로스 겔 분석에 의해 RNA 순도를 확인하였고, 농도를 분광광도법으로 측정하였다. 측정된 RNA 농도 및 RNA의 분자량을 통해, 상응하는 바이러스 제제의 게놈 등가물의 총수를 계산하였다. 따라서, 한 RNase 보호 바이러스 게놈 등가물이 한 바이러스 입자에 상응하는 것으로 가정하여, 감염성 단위 당 비리온의 상대량을 계산하였다.
바이러스 입자의 분자적 정량: ELISA 방법
Nunc 맥시소브(Maxisorb) 96웰 플레이트를 37℃에서 2시간 동안, 또한 부가적으로 4℃에서 14시간 동안, 100 ㎕ PBS 중에서 10 ㎍의 토끼 항PV(M) 항체(문헌 [Murdin and Wimmer, 1989])으로 코팅한 후, 플레이트를 350 ㎕의 PBS으로 간략히 3회 세정하고, 37℃에서 1시간 동안 350 ㎕의 PBS 중 10% 우태 혈청으로 블록킹하였다. PBS로 3회 간략히 세정한 후, 웰을 실온에서 4시간 동안 2% BCS 보충의 DMEM 중 100 ㎕의 바이러스 함유 세포 용해물 또는 대조군과 함께 인큐베이션하였다. 웰을 각기 5분 동안 350 ㎕의 PBS로 3회 세정하였다. 이어서, 웰을 100 ㎕의 DMEM-10% BCS 중의 2 ㎍의 CD155-알칼리성 포스파타제(AP) 융합 단백질(문헌 [He et al., 2000])과 함께 실온에서 4시간 동안 인큐베이션하였다. PBS를 이용한 5회 세정 중 마지막 세정 후, 100 ㎕의 10 mM 트리스(Tris)(pH 7.5)를 첨가하였고, 플레이트를 65℃에서 1시간 동안 인큐베이션하였다. 100 ㎕의 9 mg/ml 파라-니트로페닐인산염(2 M 디에탄올아민 중, 1 mM MgCl2, pH 9.8)을 첨가함으로써, 비색(colorimetric) 알칼리성 포스파타제 측정을 수행하였다. 알칼리성 포스파타제 활성을 측정하였고, 기지 농도의 정제된 PV(M) 바이러스 스톡의 2배 일련의 희석액을 이용하여 병렬 제조된 표준 곡선에서, 405-nm 파장에서 효소 결합 면역흡수 검정법(ELISA) 플레이트 리더(몰레큘러 디바이시스(Molecular Devices), 미국 캘리포니아주 서니베일 소재) 상에서, 바이러스 입자 농도를 계산하였다.
PFU/입자 비가 코돈 역최적화 바이러스에서 감소된다.
세포 배양액 중 PV-AB2470-2954의 극히 불량한 성장 표현형 및 그것의 플라크 형성 불능은, 개별 바이러스 입자의 보다 낮은 특이적 감염력과 일관될 수 있는 세포 대 세포 확산의 결손을 제기하였다.
이 가설을 시험하기 위해, PV(M), PV-AB755-1513 및 PV-AB2470-2954 바이러스를 정제하여, 바이러스 입자의 양을 분광광도법에 의해 측정하였다. 정제된 바이러스 제제를, OD260를 측정함으로써 직접적으로 정량하였고, 식 [1 OD260 단위 = 9.4×1012 입자/ml]에 따라 입자 농도를 계산하였다(도 4D)(문헌 [Rueckert, 1985]). 부가적으로, 게놈 RNA를 그 비리온으로부터 추출하고(도 4A), OD260에서 정량하였다(데이터는 나와 있지 않음). 이어서, 게놈 RNA에 대한 2.53×106 g/mol의 분자 크기를 통해, 비리온의 수(1 비리온 = 1 게놈)을 측정하였다. 구체적으로, 상기 기재된 바와 같이, 완전 CPE가 나타날 때까지, 0.5 MOI의 바이러스로 감염된 4×107개 HeLa 세포로부터 바이러스를 제조하였다. 양 입자 결정의 방법 모두가 유사한 결과를 산출하였다(도 4D). 실제로, PV(M) 및 PV-AB755-1513는 대략 동일한 양의 비리온을 생성한 반면, PV-AB2470-2954는, PV(M)(게놈 RNA 방법에 의함[데이터는 나와 있지 않음])에 비해, 비리온의 수의 1/3(직접적 UV 방법에 의함(도 4D)) 내지 1/8을 생성시킨 것으로 밝혀졌다. 이와 대조적으로, wt 바이러스 샘플은 각기 PV-AB755-1513 및 PV-AB2470- 2954보다 대략 30배 및 3,000배 더 많은 감염성 단위에 상응하였다(도 4D). 부가적으로, 정제된 비리온의 캡시드 단백질을 SDS-폴리아크릴아미드 겔 전기영동(PAGE)에 의해 분리하고, 은 염색에 의해 가시화하였다(도 4B). 이 데이터는 또한 세포당 기준으로 하여, PV-AB2470-2954 및 PV-AB755-1513이 세포당 유사하거나 약간 감소된 양의 자손을 생성하는 반면(도 4B, 레인 3), 그것의 PFU/입자 비는 감소된다는 결론을 지지한다. 바이러스에 대한 PFU/입자 비는, 플라크(플라크 검정법 및 특정 플라크 검정 기법에 대한 세포 유형) 또는 입자 계수(분광광도법 또는 전자현미경법)를 측정하는 방법에 상당히 의존하여, 다양할 수 있다. 본원에 기재된 방법을 이용하여, PV1(M)에 대한 1/115의 PFU/입자 비를 결정하였고, 이는 1/272(문헌 [Joklik and Darnell, 1961])(HeLa 세포에서 행해짐) 및 1/87(문헌 [Schwerdt and Fogh, 1957])(일차적 원숭이 신장 세포에서)의 이전 결정값과 잘 대비된다.
비리온 특이적 ELISA의 개발
코돈 역최적화 폴리오바이러스에 대해 관찰되는 감소된 PFU/입자 비를 확인하기 위해, 생물학적 변수인 감염성 역가가 아닌 샘플 내 비변형 바이러스 입자의 물리적 양을 측정하기 위한 한 방법으로서 신규 비리온 특이적 ELISA를 개발하였다(도 4C 및 E). 그 검정법은 열안정성 태반 알칼리성 포스파타제(CD155-AP)에 융합된 PV 수용체 CD155의 엑토도메인이 매우 단단히 또한 특이적으로 비변형 160S 입자에 결합한다는 기존 관찰에 기초한다(문헌 [He et al., 2000]). PV 130S 입자(A 입자)가 효율적으로 CD155에 결합하는 능력을 소실한다는 점(문헌 [Hogle, 2002])을 고려해 볼 때, 다른 어떤 캡시드 중간체나 캡시드 서브유닛도 CD155-AP와 상호작용하지 않을 것으로 예상되며, 이에 비변형 입자에 대한 특이성을 확실히 한다. 이 개념을 지지하는 것으로서, P1 캡시드 전구체를 발현하는 우두 바이러스 균주로 감염된 세포로부터의 용해물(문헌 [Ansardi et al., 1993])은 정량 가능한 신호를 초래하지 않았다(데이터는 나와 있지 않음).
ELISA 방법은 감염 후의 세포 용해물과 같은 조 샘플 내의 바이러스 입자를 정량하도록 하고, 이는 샘플 취급 및 정제 중의 다른 기전(열/화학적 불활성화, 산화, 분해 등)에 의한 PFU/입자 비의 가능한 변경을 최소화하게 된다. 현 조건 하에서, 이 검정법의 감도는, 신호 증폭 단계가 수반되지 않는 바, 대략 107개 바이러스 입자이다. 이는 다시, 매우 낮은 백그라운드를 초래하였다. 이 ELISA로써, PV 입자 농도는 기지의 농도의 정제된 PV(M)으로 제조된 표준 곡선 상에서 역계산에 의해 샘플에서 결정될 수 있다(도 4E). ELISA에 의한 입자 결정은 직접적 UV 방법에 의해 수득되는 결과와 잘 일치하였다(도 4D).
결과의 의미
본 연구는 약독화 바이러스를 생성하기 위한 신생 유전자 합성에 의한 PV 캡시드 코딩 서열의 대규모 코돈 역최적화의 유용성을 입증한다. 초기 목적은, 약독화 바이러스 생백신을 발생시키기 위한 툴로서의 상기 기술의 가능성을 탐색하고자 하는 것이었다. 코돈 역최적화 바이러스는 매우 낮은 특이적 감염력을 가지는 것을 밝혀졌다(도 4). 낮은 특이적 감염력(단일 바이러스 입자가 성공적으로 세포 내에 서 감염성 사이클을 개시하는 가능성)은 숙주 내에서의 바이러스 감염이 더욱 천천히 퍼지도록 한다. 이는 다시, 숙주 생물체가 면역 반응을 시작하고 감염을 소거하는 데 더 많은 시간을 소요하도록 하며, 이는 약독화 바이러스 백신에 있어 가장 바람직한 특성이다. 한편, 코돈 역최적화 바이러스는 야생형 바이러스에 비해 세포당 유사량의 자손을 생성시켰고, 한편 감염성은 2 내지 3등급 더 적었다(도 4). 이는 wt 바이러스 그 자체의 생성과 같이 효과적이고도 비용효율적으로 wt와 항원성의 측면에서 비슷한 바이러스 입자가 생성되도록 한다. 그러나, 낮은 특이적 감염력으로 인해, 상기 바이러스 제제의 실제 취급 및 가공이 더 안전하다. 그 후, 고도의 감금 조건 하에서의 충분량의 독성 바이러스의 생성과 이와 연관되어 우연히 또는 악의적으로 생성 시설로부터 바이러스가 방출될 관련 위험이 증가하고 있다. 본원에 기재된 바이러스는 불활성화된 바이러스 백신의 생성에 있어 보다 안전한 대체물로서 매우 유용한 것으로 입증될 수 있다. 이들은 단백질 수준에서 wt 바이러스와 100% 동일하기 때문에, 불활성화된 바이러스를 주입한 숙주 내에서의 동일한 면역 반응이 보장된다.
실시예 4
폴리오바이러스의 신경병원성에 대한 코돈 역최적화의 영향
마우스 신경병원성 시험
4 내지 5마리의 6 내지 8주령 CD155tg 마우스(균주 Tg21)(문헌 [Koike et al., 1991])로 된 군에 30 ㎕ PBS 중 102 내지 106 PFU/병소 형성 단위(FFU)의 바이 러스 희석액을 뇌내 주사하였다. 문헌 [Reed and Muench (1938)]의 방법에 의해, 50% 치사 용량(LD50) 값을 계산하였다. 플라크 또는 감염 병소 검정법에 의해, 사망 또는 마비 시의 척수 조직 내 바이러스 역가를 측정하였다.
코돈 역최적화 폴리오바이러스는 입자에 기초할 때 CD155tg 마우스에서 신경약독화된다.
본 연구에서 작제된 바이러스의 병원성 가능성을 시험하기 위해, CD155 유전자도입 마우스(문헌 [Koike et al., 1991])에 PV(M), PV-SD, PV-AB755-1513, 및 PV-AB2470-2954를 102 내지 105 PFU/FFU의 용량으로 뇌내 주사하였다. 매우 반직관적으로는 PV-AB755-1513, 또한 특별하게는 PV-AB2470-2954가 초기에는 wt 바이러스와 같은 신경병원성이거나 그것보다 약간 더 신경병원성인 것으로 밝혀졌기 때문에, 초기 결과는 혼동스러웠다. 표 4를 참조한다.
Figure 112009066775576-pct00008
a LD50는 플라크 또는 감염 병소 검정법에 의한 측정 시, 뇌내 접종 후 50% 치사율을 초래하는 감염성 단위의 수로 표시됨.
b LD50는 OD260 측정에 의해 측정 시, 뇌내 접종 후 50% 치사율을 초래하는 바이러스 입자의 수로 표시됨.
c 사망 또는 마비 시의 감염된 마우스의 척수로부터 회수한 바이러스; 플라크 또는 감염 병소 검정법에 의해 측정 시, PFU 또는 FFU/g 조직으로 표시됨.
d 사망 또는 마비 시, 감염된 마우스의 척수로부터 회수한 바이러스, 세 번째 열에 있는 값을 각 바이러스에 대한 특성인 입자/PFU 비와 곱함으로써 유도한 입자/조직의 g로 표시됨(도 4D).
부가적으로, PV-AB755-1513 및 PV-AB2470-2954로 감염시킨 후 마비 개시 시간은 wt 바이러스의 마비 개시 시간에 필적하였다(데이터는 나와 있지 않음). 유사하게, 사망 또는 마비 시에, 플라크 검정법에 의해 측정 시, PV-AB755-1513 및 PV-AB2470-295로 감염된 마우스의 척수 내 바이러스 부하는, wt 바이러스로 감염된 마우스에서의 그 값에 비해 각기 30배 및 300배 더 낮다는 관찰도 유사하게 혼동스러웠다(표 4). 따라서, 명백히 wt 바이러스의 단지 0.3%로 복제하는 PV-AB2470-2954가 wt와 동일한 신경병원성 가능성을 가질 것으로 보이지 않는다. 그러나, PV-AB755-1513 및 PV-AB2470-2954에 있어 변경된 PFU/입자에서의 관계를 확립한 후(실시예 3 참조), 접종물의 양은 이제 접종된 입자의 실제 수와 상관될 수 있게 되었다. 이러한 보정을 행한 후, 입자에 기초하여, PV-AB755-1513 및 PV-AB2470-2954가 wt에 비해 20배 및 100배 신경약독화된다는 것이 확립되었다. 표 4를 참조한다. 또한, 입자에 기초하여, 마비된 마우스의 척수에서의 바이러스 부하는 3개의 모든 바이러스와 매우 유사하였다(표 4).
또한, 중추신경계에서의 발현과 특이적으로 구별되게 되는 동의 코돈을 이용하여 PV 캡시드 유전자를 재설계할 수 없다고 결론이 내려졌다. 이는, 다른 이들에 의해 기재된 코돈 편향(문헌 [Plotkin et al., 2004])에 있어서의 조직 특이적 차이가 너무 작아, 조직-제한적 바이러스 표현형이 발생되지 않기 때문일 수 있다. 문헌 [Plotkin et al.]에 의해 사용된 것보다 더 큰 집합의 뇌 특이적 유전자에서, 인식가능한 조직 특이적 코돈 편향이 검출되지 않았다(데이터는 나와 있지 않음). 그러나, 이 결론은, 본 발명의 방법에 의해 생성된 폴리오바이러스가 실제로 100배 이하의 인자로 마우스에서 신경약독화된다는 사실과 상충되지 않는다. 즉, 중추 신경계에서 wt 바이러스와 동일한 손상을 초래하기 위해서는, 100배 더 많은 코돈 또는 코돈 쌍 역최적화 바이러스 입자가 필요하다.
실시예 5
폴리오바이러스의 게놈 번역에 대한 코돈 역최적화의 영향
시험관내 및 생체내 번역
본 연구에 2개의 상이한 HeLa 세포 S10 세포질 추출물을 사용하였다. 문헌 [Molla et al. (1991)]의 방법에 의해, 표준 추출물을 제조하였다. [35S]메티오닌 표지 번역 산물을 겔 방사선촬영에 의해 분석하였다. 두 번째 추출물을, 기존에 기재된 바대로(문헌 [Kaplan and Racaniello, 1988]), 단 그 추출물을 투석하지 않았고 내인성 세포 mRNA를 포도상구균 뉴클레아제로 제거하지 않으면서, 제조하였다. 변형 추출물과의 반응은 외인성 아미노산 또는 tRNA로 보충되지 않았다. 항2C 단클론성 항체 91.23를 이용한 웨스턴 블로팅에 의해 번역 산물을 분석하였다(문헌 [Pfister and Wimmer, 1999]). NIH-이미지를 이용한, 스캔 겔 이미지 1.62 소프트웨어의 픽셀 계수에 의해, 2BC 밴드의 상대 강도를 측정하였다. 모든 경우들에서, 번역 반응을 200 ng의 각종 시험관내-전사 바이러스 게놈 RNA으로 프로그래밍하였다.
생체내 번역의 분석을 위해, HeLa 세포를 상기 기재된 바와 같이 시험관내-전사된 디시스트론성 레플리콘 RNA로 형질감염시켰다. RNA 복제로부터 단리된 번역을 평가하기 위해, 2 mM 구아니딘 염산염의 존재 하에 형질감염을 수행하였다. 부동 세포용해 완충액(프로메가(Promega), 미국 위스콘신주 매디슨 소재) 중에 7시간 둔 후 세포를 용해시키고, 이어서 이중 반딧불 (F-Luc) 및 레닐라(R-Luc) 루시퍼라제 검정법(프로메가)을 행하였다. 두 번째 시스트론(P1-Fluc-P2-P3 다단백질)의 번역 효율을, C형 간염 바이러스(HCV) 내부 리보솜 부착 부위(IRES)의 조절 하에 발현되는 첫 번째 시스트론의 레닐라 루시퍼라제 활성으로 나눔으로써, 정규화하였다.
코돈 역최적화 바이러스는 게놈 번역 수준에서 결함이 있다.
합성 바이러스 및 wt PV(M)가 이들의 단백질 구성에 있어서는 구분불가능하고 공지된 RNA에 기초한 조절 요소가 변형 RNA 게놈에서 변경되지 않았기 때문에, 본 설계는 바이러스의 세포 및 조직 향성(tropism) 또는 면역학적 성질에 영향을 주지 않으면서 약독화에 감소된 게놈 번역/복제가 미치는 영향의 연구를 가능하게 하였다. 많은 차선적 코돈의 캡시드 코딩 서열 내로의 도입이 게놈 번역의 감소를 초래한다는 가설 하에, PV-AB 게놈을 설계하였다. P1 영역이 다단백질의 N-말단에 있기 때문에, 모든 다운스트림 비구조 단백질의 합성은 P1 영역을 통한 번역 속도에 의해 결정된다. 실제로 번역이 영향을 받는지에 대한 여부를 시험하기 위해, 시험관내 번역을 수행하였다(도 5).
예기치 못하게도, 표준 HeLa 세포에 기초한 세포질 S10 추출물(문헌 [Molla et al., 1991]) 내 초기 번역은 시험한 게놈 중 임의의 것에 대한 번역 능력의 차이를 나타내지 않았다(도 5A). 그러나, 이 번역 시스템이 최대 번역을 위해 최적화되기 때문에, 유전적으로 조작된 코돈 편향에 대해 보상할 수 있을 것으로 생각할 수 있는 과잉 아미노산 및 tRNA의 외인 부가를 포함한다. 그러므로, 시험관내 번역을, 투석하지 않았고 세포 mRNA를 포도상구균 뉴클레아제 처리에 의해 제거하지 않은 변형된 HeLa 세포 추출물을 이용하여 반복하였다(도 5B). 외인성 tRNA 또는 아미노산을 첨가하지 않고 이 추출물에서의 번역을 수행하였다. 따라서, PV 게놈의 번역이 세포 mRNA를 갖는 자원을 위해 경쟁하면서 세포성 공급에만 의존하는, 감염 세포에서의 환경과 더욱 근접하게 유사한 환경을 생성시켰다. 세포 mRNA로부터의 고 백그라운드 번역 및 비투석 추출물 내 낮은 [35S]Met 도입으로 인해, 바이러스 특이적 번역 산물의 집합을, 항2C 항체를 이용한 웨스턴 블로팅에 의해 검출하였다(문헌 [Pfister and Wimmer, 1999]). 이 변형 조건은 역최적화 서열 정도와 상관되는 변형된 게놈의 번역 효율의 급격한 감소를 초래하였다. PV-SD의 번역이 wt의 그 번역에 필적하는 반면, 3개의 비감염성 게놈, 즉 PV-AB, PV-AB1513-3386, 및 PV-AB755-2470의 번역은 대략 90% 감소하였다(도 5B).
문헌 [Burns et al. (2006)]은 최근 본원에 기재된 것들과 관련된 실험들을 보고하였다. 이 저자들은 코돈 사용빈도를 본 연구에서보다 더욱 더 제한된 정도로 변경시켰고, 그들의 돌연변이체 바이러스 중 어느 것도 치사 표현형을 발현하지 않았다. 흥미롭게도, [Burns 등]은, 번역이 그들의 돌연변이체 바이러스의 변경된 표현형에 주된 역할을 하지 않았다고 결정하였는데, 이는 본원에 제시된 데이터와 일치하지 않은 결론이다. 비감염 HeLa 세포 추출물 및 과잉 아미노산으로 보충된 뉴클레아제-처리 토끼 망상적혈구 해물을 이용한, 문헌 [Burns et al. (2006)]에 의해 사용된 시험관내 번역 검정은, 이들이 번역의 어떠한 유의적 감소도 검출하지 못했음을 설명하는 것으로 보인다. 도 5A를 참조한다.
시험관내 번역 시스템의 궁극적으로 인위적인 성질을 고려하여, 세포 내 번역에 대한 각종 캡시드 설계의 영향도 또한 조사하였다. 이 목적을 위해, 이전에 보고된 디시스트론성 레플리콘(문헌 [Zhao and Wimmer, 2001])에 기초하여, 디시스트론성 폴리오바이러스 리포터 레플리콘을 작제하였다(도 6A). 각종 P1 카세트를 반딧불 루시퍼라제(F-Luc) 유전자의 바로 업스트림에 인-프레임으로 삽입하였다. 따라서, 폴리오바이러스 IRES는, 캡시드와 2Apro 프로테나제 사이의 반딧불 루시퍼라제 단백질을 제외한, 바이러스 게놈 내의 것과 유사한 단일 바이러스 다단백질의 발현을 유도한다. HCV IRES의 조절 하에서의 레닐라 루시퍼라제(R-Luc) 유전자의 발현은 내부 대조군을 제공한다. 모든 실험들을 게놈 복제를 완전히 차단하는 2 mM 구아니딘 염산염의 존재 하에 수행하였다(문헌 [Wimmer et al., 1993]). 이 유형의 작제물의 사용은, F-Luc/R-Luc 비를 계산함으로써 두 번째 시스테론의 상대 발현을 정확히 결정할 수 있도록 하였다. F-Luc 발현이 업스트림 P1 영역을 통한 리보솜의 성공적 전이에 의존하기 때문에, 다단백질 번역 속도에 대한 삽입된 P1 서열의 영향의 척도를 제공한다. 이 방법을 이용하여, 실제로 바이러스 백그라운드에서의 치사 표현형(예를 들어, PV-AB, PV-AB1513-2470, 및 PV-AB2470-3386)과 관련된 변형된 캡시드 코딩 영역이 번역 속도를 대략 80 내지 90% 감소시켰다는 것이 밝혀졌다(도 6B). 2개의 생존성 바이러스 작제물, 즉 PV-AB2470-2954 및 PV-AB2954-3386로부터의 캡시드는 각기 wt 수준의 68% 및 83%로 번역을 허용하였다. 첫 번째 시스트론의 생체내 번역 속도는 3 내지 12시간의 기간에 걸쳐 모든 작제물에서 일정하게 유지되었는데, 이는 RNA 안정성이 코돈 변경에 의해 영향을 받지 않음을 제시한다(데이터는 나와 있지 않음). 결론적으로, 본 실험들의 결과는, PV-AB2470-2954에서 보여지는 바와 같은, 30%라는 P1 영역을 통한 상대적으로 적은 번역 효율 하락이 심한 바이러스 복제 표현형을 초래함에 따라, 폴리오바이러스가 매우 효율적인 번역에 상당히 의존한다는 것을 제시한다.
실시예 6
코돈 역최적화 폴리오바이러스의 유전적 안정성
표현형에 기여하는 큰 게놈 분절에 걸친 많은 돌연변이들의 분포된 영향으로 인해, 코돈 역최적화 바이러스는 유전적으로 안정한 표현형을 가져야 한다. 코돈 역최적화 바이러스의 유전적 안정성을 연구하고 이 바이러스가 유전적으로 안정하다는 전제를 시험하기 위해, 바이러스를 적당한 숙주 세포에서 계대배양한다. 백신 설계의 본 "1000 컷에 의한 사망(death by 1000 cuts)" 이론의 한 이점은, 야생형으로의 복귀 위험이 감소된 것이다. 전형적인 백신 균주는 wt 바이러스와 단지 극소수의 점 돌연변이만을 차이로 하고, 이의 단지 작은 부분집합만이 실제로 약독화에 기여할 수 있다. 바이러스 진화는 그러한 소수의 활성 돌연변이를 복귀시키기 위해 급속히 이루어진다. 실제로, 그러한 복귀는 전세계로부터 폴리오바이러스를 근절하기 위한 세계보건기구(WHO) 프로젝트에 심각한 위험을 제기한다. 생백신 균주가 사용되는 한, 이 균주가 wt로 복귀할 실제 가능성이 매우 크다. 그러한 복귀는 이미 새 소아마비 발생의 공급원으로서 관찰되었다(문헌 [Georgescu et al., 1997]; 문헌 [Kew et al., 2002]; 문헌 [Shimizu et al., 2004]).
본 합성 설계에서의 수십만가지 점 돌연변이들에서는, wt 균주로의 복귀 위험이 거의 없다. 그러나, 천연 선택이 강력하고, 또한 계대배양 시, 합성 바이러스가 불가피하게 진화한다. 이 진화의 종점을 결정하기 위한 연구가 진행 중에 있으나, 가능한 성과는 그것들이 원래의 설계에서 크게 벗어나지 않은 국부 최적점에서 포획된다는 것이다.
이 이론을 입증하기 위해, 대표적인 재조작 바이러스를 숙주 세포 내에서 50회 이하 계대배양한다. 진화된 바이러스의 게놈을 10, 20 및 50회 계대배양 후에 시퀀싱한다. 더욱 구체적으로, 각 유형의 역최적화 바이러스로부터 하나 이상의 예의 키메라를 선택한다. 출발 키메라는 매우 쇠약화되나 사멸하지 않는다. 예를 들어, PV의 경우, 키메라는 PV-AB2470-2954 및 PV-Min755-2470일 수 있다. 각 출발 바이러스로부터, 10개의 플라크가 선택된다. 각각의 10개의 플라크에서 유래된 바이러스 집단을 총 50회 벌크로 계대배양한다. 10, 20 및 50번째 계대배양 후, 10개 플라크로 정제된 바이러스를 다시 선택하고, 그것의 게놈을 10개의 모 바이러스의 게놈과 함께 시퀀싱한다. 계대배양 후, 40(모 바이러스 당, 30 + 10)개의 선택된 바이러스의 적응도를, 플라크 크기를 조사하고 1단계 증식 동역학 특성으로서 플라크 형성 단위/ml를 결정함으로써, 상기 바이러스의 모(parents)의 적응도와 비교한다. 선택 계대배양 단리주를 적절한 숙주 생물체 내 그 병원성에 대해 시험한다. 예를 들어, 폴리오바이러스의 병원성을 CD155tg 마우스에서 시험한다.
게놈을 시퀀싱할 때, 10개 모두의 10 바이러스주가 공통적으로 일부 돌연변이를 가진다는 발견사실은, 상기 변화가 바이러스 적응도를 위해 특히 중요하다는 것을 제시한다. 이 변화를 주요 휴지 부위로서 토우프린팅에 의해 확인되는 부위와 비교할 수 있고(실시예 9 참조); 2가지 종류 이상의 검정법의 조합은 바이러스 적응도에 가장 유해한 돌연변이체 코돈을 동정할 수 있다. 이와 역으로, 상이한 주들이 모든 상이한 돌연변이들을 가진다는 발견사실은, 많은 돌연변이체 코돈 변화들이 적응도에 대한 그 영향에 있어 매우 유사하다는 견해를 지지한다. 따라서, HeLa 세포 중에서의 10회 계대배양 후, PV-AB755-1513 및 PV-AB2470-2954는 어떠한 인식가능한 적응도 증가도 겪지 않았다. 바이러스 감염성 역가는 계대배양 실험의 초기와 같이 낮은 상태로(107 PFU/ml 및 106 FFU /ml) 남았고, 플라크 표현형은 변화하지 않았다(데이터는 나와 있지 않음). 계대배양 중에 유전적 변화가 일어나는지, 또한 어떠한 종류의 유전적 변화가 일어나는지를 결정하기 위해, 상기 계대배양된 바이러스의 서열 분석이 현재 진행 중이다.
문헌 [Burns et al. (2006)]은, 그것의 변경된 코돈 조성물이 HeLa 세포에서 25회 일련 계대배양 중에 대체로 보존되었음을 보고하였다. 이들은, 비변형 세이빈 2 바이러스 및 코돈 치환 바이러스 모두의 HeLa 세포 내 복제에 대한 적응도가 계대배양 수가 커질수록 증가한 반면, 변형된 바이러스의 상대 적응도는 비변형 바이러스의 상대 적응도보다 낮은 상태로 남았음을 밝혀내었다. 따라서, 모두 SAVE에 의해 재설계된 바이러스가 유전적으로 매우 안정적임을 나타냈다. 본 발명의 코돈 및 코돈 쌍 역최적화 바이러스의 예비 데이터는, 많은 수의 코돈 상에 걸쳐 분포된 덜 심한 코돈 변화가 개별 바이러스 표현형의 유전적 안정성을 향상시키고, 이에 따라 백신에서의 그것의 사용 가능성을 향상시킴을 제시한다.
실시예 7
코돈 쌍의 역최적화에 의한 폴리오바이러스의 캡시드 영역의 재조작
코돈 쌍 편향의 계산
코돈 쌍(예를 들어, GTT-GCT)을 갖는 가능한 3721 비"STOP"의 모든 개별 코돈 쌍은 유전자의 주어진 "훈련 집합"에 대해 특이적인 배당된 "코돈 쌍 스코어" 또는 "CPS"를 지닌다. 주어진 코돈 쌍의 CPS는, 본 유전자 집합(본 실시예에서, 인간 게놈)에서 예상되는 수에 대한 관찰된 출현 수의 로그 비로 정의된다. 특정 코돈 쌍의 실제 출현 수(또는 달리 말하면, 한 특정 아미노산이 한 특정 코돈 쌍에 의해 코딩될 가능성)의 결정은, 단순히 코딩 서열의 한 특정 집합 내 코돈 쌍의 실제 출현 수를 계수하는 문제이다. 그러나, 예상 수를 결정하기 위해서는 부가적 계산이 필요하다. 그러나, 문헌 [Gutman and Hatfield]와 유사하게, 아미노산 빈도 및 코돈 편향 모두에 대해 독립적이게 되도록 예상 수를 계산한다. 즉, 예상 빈도는, 아미노산이 한 특정 코돈에 의해 코딩되는 횟수의 상대 분율에 기초하여 계산된다. 양의 CPS 값은, 인간 게놈에 있어 주어진 코돈 쌍이 통계학적으로 과대표시됨을 의미하고, 음의 CPS는 쌍이 통계학적으로 과소표시됨을 의미한다.
인간 부문 내에서 상기 계산을 수행하기 위해, 가장 최근의 일치 CDS(CCDS) 데이터베이스는 총 14,795개 유전자를 가지는 일관된 주석의 인간 코딩 영역을 사용하였다. 이 데이터 집합은 코돈 및 코돈 쌍, 및 이에 따라 게놈 규모에서의 아미노산 및 아미노산 쌍 빈도를 제공하였다.
문헌 [Federov et al. (2002)]의 패러다임을 이용하여, 문헌 [Gutman and Hatfield (1989)]의 방법을 더욱 증진시켰다. 이는 한 특정 아미노산 쌍을 코딩하는 이웃 코돈의 비무작위 결합 및 코돈 빈도와 무관한 주어진 코돈 쌍의 예상 빈도를 계산할 수 있도록 하였다.
Figure 112009066775576-pct00009
계산에서, P ij 는 그것의 동의 군에서 N 0 (P ij )의 빈도로 일어나는 코돈 쌍이다. C i C j 는 그것의 동의 군에서 빈도 F(C i )F(C j )로 일어나는, P ij 를 포함하는 2개의 코돈이다. 더욱 명백히, F(C i )는 상응하는 아미노산 X i 이 모든 코딩 영역에 걸쳐 코돈 C i 에 의해 코딩되는 빈도이고, F(C i )=No(C i )ZNo(X i )(여기에서, N 0 (C i )N 0 (X i )는 각각의 코돈 C i 및 아미노산 X i 의 관찰된 출현 수임)이다. 이에 따라 F(C j )도 계산된다. 또한, N 0 (X ij )는 모든 코딩 영역 전반에 걸친 아미노산 쌍 Xij의 출현 수이다. P ij 의 코돈 쌍 편향 스코어 S(P ij )를, N e (P ij )의 예상 출현 수에 대한 관찰 빈도 N 0 (P ij )의 로그-오즈(log-odds) 비로서 계산하였다.
이어서, 상기 식을 이용하여, 개별 코딩 서열 내 개별 코돈 쌍이 전체 인간 CCDS 데이터 집합을 이용하여 계산한 상응하는 게놈 N e (P ij ) 값에 비해 과대표시 또는 과소표시되는지의 여부를 결정하였다. 이 계산은 인간 코딩 영역 내 과대표시된 코돈 쌍에서는 양의 S(Pij) 스코어 값을 초래하였고, 과소표시된 코돈 쌍에 대해서는 음의 값을 초래하였다(도 7).
하기 식에 따라, 모든 코돈 쌍 스코어들의 평균을 구함으로써 개별 코딩 서열의 "조합된" 코돈 쌍 편향을 계산하였다:
Figure 112009066775576-pct00010
이에 따라, 영역을 포함하는 개별 코돈 쌍 스코어의 모두를 더하고, 이 총합을 코딩 서열의 길이로 나눔으로써, 전체 코딩 영역의 코돈 쌍 편향을 계산한다.
코돈 쌍 편향의 변화
PV(M)의 캡시드 코딩 영역을 코돈 쌍 편향을 변화시키도록 재조작하였다. wt 바이러스 게놈의 코돈 편향 및 다른 모든 특성을 보존하면서, 최대 가능한 수의 희소하게 사용되는 코돈 쌍(바이러스 PV-Min 생성) 또는 최대 가능한 수의 광범위하게 사용되는 코돈 쌍(바이러스 PV-Max 생성)을 도입하였다. 이하는 본 발명자들의 방법을 상세히 설명한다.
양의 방향(PV-Max; 서열 번호 4) 및 음의 방향(PV-Min; 서열 번호 5)으로 폴리오바이러스 P1 영역 코돈 쌍 스코어를 다양하게 하도록, 2개의 서열을 설계하였다. 아미노산 서열을 변경되지 않도록 남기고 코돈 편향을 최소한으로 변형시킴으로써, P1 캡시드 영역에 대한 최소 또는 최대 코돈 쌍 스코어의 최적화를 목적으로 하여, 모의 어닐링 알고리즘을 코돈 셔플링을 위해 사용하였다. 스플라이스 부위의 제거 및 국소화 2차 구조의 감소를 위해, 생성되는 서열을 가공하였다. 이어서, 이 서열을 상업적 판매업자인 블루 헤론 바이오테크놀로지에 의해 합성하고, 서열 확인하였다. 새 캡시드 유전자를 이용하여, 2개의 PflMI 제한효소 부위를 통해 wt PV의 감염성 cDNA 클론 내 동등한 wt 서열을 치환하였다. 실시예 1에 기재된 바대로, 바이러스를 유도하였다.
PV-Max 바이러스에 대해, 감염된 세포의 사멸이 24시간 후에 나타났고, 이는 wt 바이러스로 수득된 결과와 유사한 결과이다. PV-Max의 최대 바이러스 역가 및 1단계 증식 동역학 특성도 wt와 동일하였다. 이와 대조적으로, 세포 사멸은 세포의 PV-Min 돌연변이체 RNA로의 형질감염을 초래하지 않았고, 생존성 바이러스가 회수될 수 없었다. 형질감염을 다수 반복하였고, 결과는 동일하였다. PV-Min 형질감염된 세포의 용해물을 4회 연속 맹검 계대배양하였고, 여전히 바이러스가 수득되지 않았다.
PV-Min의 캡시드 영역을, PV-AB(불량한 코돈 편향)에 대해 행한 바와 같이 보다 작은 부분단편(PV-Min755-2470 및 PV-Min2470-3386)으로 나누었고, 부분단편을 wt 백그라운드 내로 클로닝하였다. PV-AB 서브클론에 대해서는, PV-Min의 서브클론이 매우 병약하였으나 사멸하지는 않았다(도 8). PV-AB 바이러스에서 관찰되는 바와 같이, PV-Min 바이러스의 표현형은 자손 바이러스의 생성 저하가 아닌, 바이러스 입자의 감소된 특이적 감염력의 결과이다. 진행 중에 있는 연구는 CD155tg 마우스 내의 코돈 쌍-약독화 키메라를 시험하여 그것의 병원성을 결정하는 것을 수반한다. 또한, PV-Min cDNA의 서브클론을 포함하는 부가적 키메라 바이러스가 만들어지고 있고, 그것의 복제 능력을 결정하고 있다(이하 실시예 8 및 9 참조). 또한, 보다 긴 서열에 걸친 중간양의 코돈 쌍 편향을 분포시키는 것의 영향을 확인하고 있다. 예를 들어, 폴리오바이러스 유도체가 약 -0.2(PV-0.2; 서열 번호 6)의 코돈 쌍 편향을 가지도록 설계되고, 야생형으로부터의 돌연변이가 P1 캡시드 영역의 전장에 걸쳐 분포된다. 이는 유사한 코돈 쌍 편향을 가지나, 코돈 변화가 보다 짧은 서열에 걸쳐 분포되어 있는, PV-MinZ(PV-Min2470-3386)와 대조적이다.
PV-Min 및 PV-0.2이 야생형 대비 코돈 사용빈도가 거의 변화하지 않은 서열임을 지적하는 것은 주목할만하다. 대부분의 경우, 서열은 야생형 PV(M) 바이러스에서 나타나는 동일한 코돈을 이용한다. PV-MinZ는 PV(M) 내로 서브클로닝된 PV-Min의 부분을 포함한다는 점에서 다소 차이가 있다. PV-Min 및 PV-0.2에 대해, 코딩된 단백질 서열은 변화가 없으나, 서브클로닝된 영역 내에 또는 전체 P1 캡시드 영역에 걸쳐 결정되는 코돈 사용빈도는 PV-Min(또는 PV-0.2)와 동일하지 않으며, 이는 단지 (전장에 걸쳐 동일한 코돈을 가지나 보다 작은 분절에서는 그러하지 않은) 코돈 재배열 서열의 일부만이 PV(M) 야생형 서열 내로 치환되었기 때문이다. 물론, 뉴클레오티드 2470-3386으로부터의 영역 내에서만 코돈을 셔플링하면서, 전체 P1 캡시드 영역에 걸쳐 코돈 쌍 편향을 가지도록 돌연변이된 캡시드 서열을 설계할 수 있다.
실시예 8
코돈 쌍 편향의 변화에 의해 작제된 바이러스가 CD155 tg 마우스에서 약독화된다.
마우스 뇌내 주사, 생존율
동물 모델에서의 PV-Min755-2470 및 PV-Min2470-3385의 약독화를 시험하기 위해, 이 바이러스들을 정제하여, CD155(PVR/폴리오바이러스 수용체) 유전자도입 마우스 내로 뇌내 주사하였다(표 5 참조). 실제로, 상기 바이러스는 본 발명자들의 알고리즘을 이용하여 코돈 쌍 편향의 맞춤으로 인해 유의적으로 약독화된 표현형을 나타냈다. PVM-wt로 인해 10e5 비리온로 공격접종된 모든 마우스가 사망하였기 때문에, PVM-wt를 보다 높은 용량으로 주사하지 않았다. 이 약독화 표현형은 본 발명자들의 알고리즘을 이용한 코돈 쌍 편향의 맞춤으로 인한 것이다. 이는 코돈 쌍 편향의 맞춤이 생백신 발생의 한 수단으로 적용 가능하다는 것을 재확인시켜준다.
마우스 뇌내 주사, 생존율
바이러스 10e4 비리온 10e5 비리온 10e6 비리온 10e7 비리온
PV-Min755-2470 4/4 3/4 3/5 3/4
PV-Min2470-3385 4/4 4/4 5/5 3/4
PVM-wt 3/4 0/4 - -
이 발견사실은 두가지 측면에서 의미가 있다. 첫 번째로, 그것은 코돈 쌍 편향이 기능적으로 중요하다는 것, 즉 코돈 쌍 편향의 분포로 인해 유해한 표현형이 생성될 수 있다는 최초의 명백한 실험 증거이다. 두 번째로, 그것은 바이러스를 약독화하기 위해 사용될 수 있는 부가적 크기의 동의 코돈 변화를 제공한다. 이 코돈 쌍 약독화 키메라의 생체내 병원성이 CD155tg에서 시험되었고, 약독화된 표현형을 나타냈다(표 5 참조). PV-Min 캡시드 cDNA의 서브클론을 포함하는 부가적 키메라 바이러스를 감염된 세포에서의 복제에 대해 검정하였고, 이 또한 약독화 표현형을 나타냈다.
실시예 9
변경된 코돈 쌍 편향을 갖는 합성 폴리오바이러스의 작제 : 백신 개발의 의미
코돈 쌍 편향의 계산, 코돈 쌍 역최적화 서열을 생성하기 위한 알고리즘의 실행
본 발명자들은 코돈 쌍 편향을 정량하기 위한 알고리즘을 개발하였다. 모든 가능한 개별 코돈 쌍에는 "코돈 쌍 스코어", 또는 "CPS"가 주어졌다. 본 발명자들은 CPS를 모든 인간 코딩 영역 상에 걸친 각 코돈 쌍의 예상 출현 수에 대한 관찰 출현 수의 비의 자연 로그로서 정의한다.
Figure 112009066775576-pct00011
한 특정 코돈 쌍의 관찰 출현의 계산은 직접적이나(유전자 집합 내의 실제 계수), 코돈 쌍의 예상 출현 수는 부가적 계산을 요한다. 본 발명자들은 문헌 [Gutman and Hatfield]와 유사하게, 아미노산 빈도 및 코돈 편향 모두와 무관하게 상기 예상 수를 계산한다. 즉, 예상 빈도는, 아미노산이 한 특정 코돈에 의해 코딩되는 횟수의 상대 분율에 기초하여 계산된다. 인간 게놈에 있어, 양의 CPS 값은, 주어진 코돈 쌍이 통계학적으로 과대표시됨을 의미하고, 음의 CPS는 쌍이 통계학적으로 과소표시됨을 의미한다.
이어서, 이 계산된 CPS를 이용하여, 임의의 코딩 영역이, 코돈 쌍 스코어들의 평균을 취해 전체 유전자에 대한 코돈 쌍 편향(CPB)을 수득함으로써, 과대표시 또는 과소표시된 코돈 쌍을 이용하는 것으로 간주될 수 있다.
Figure 112009066775576-pct00012
나와 있는 방정식을 이용하여 모든 주석 인간 유전자에 대해 CPB를 계산하여 플로팅하였다(도 7). 그래프 내 각 점은 단일 인간 유전자의 CPB에 상응한다. 분포의 피크는 모든 주석 인간 유전자에 대한 평균 스코어인 0.07이라는 양의 코돈 쌍 편향을 가진다. 또한, 음의 코돈 쌍 편향을 갖는 유전자는 극소수이다. 이어서, CPB를 정의하고 계산하기 위해 확립된 방정식을 이용하여, 이 편향을 조작하였다.
코돈 쌍 역최적화 서열을 생성하기 위한 컴퓨터 기반 알고리즘의 개발 및 실행
본 발명자들은 이어서 상기 식을 이용하여, 원래의 아미노산 서열을 유지하면서 임의의 코딩 영역의 CPB를 조작하기 위한 컴퓨터 기반 알고리즘을 개발하였다. 알고리즘은 유전자의 코돈 사용빈도를 유지하나(즉, 각 기존 코돈의 사용의 빈도를 보존하나), 현존 코돈을 "셔플링"하여, CPB가 증가 또는 감소될 수 있도록 하는 중요 능력을 가진다. 알고리즘은 전장 최적화에 적당한 수학 과정인 모의 어닐링을 이용한다(문헌 [Park, S. et al., 2004]). 다른 파라미터들도 또한 이 알고리즘의 조절 하에 있으며; 예를 들어, RNA의 폴딩 자유 에너지가 그러하다. 이 자유 에너지는 좁은 범위 내에서 유지되어, 코돈 재배열의결과로서 2차 구조의 큰 변화를 방지한다. 최적화 과정은 큰 2차 구조, 예컨대 헤어핀 또는 줄기 루프(이는 다른 방식으로라면 맞춤화 RNA에서 일어나게 됨)를 가지는 임의의 영역이 발생되는 것을 특별히 배제한다. 이 컴퓨터 소프트웨어를 이용하여, 사용자는 단순히 주어진 유전자의 cDNA 서열을 입력할 필요가 있고, 유전자의 CPB는 실험자가 적합하다고 볼 때, 맞춤화될 수 있다.
과대표시 또는 과소표시된 코돈 쌍에 의해 코딩되는 P1의 신생 합성
P1이 과대표시 또는 과소표시된 코돈 쌍에 의해 코딩되는 신규의 합성 폴리오바이러스를 수득하기 위해, 본 발명자들은 폴리오바이러스 I형 마호니(PV(M)-wt)의 P1 구조 영역에 상응하는 DNA 서열을 본 발명자들의 프로그램에 입력하여, 과대표시된 코돈 쌍(566개 돌연변이)을 이용하는 PV-Max-P1 및 과소표시된 코돈 쌍(631개 돌연변이)을 이용하는 PV-Min-P1를 산출하였다. 이 맞춤화된 신규 합성 P-1 영역의 CPB 스코어는 PV-Max = +0.25 및 PV-Min = -0.48인 반면, PV(M)-wt의 CPB는 -0.02이다(도 7).
부가적 맞춤화는, P1 영역의 서브클로닝을 허용하도록 주어진 간격으로 양 합성 서열 내로 설계되어 들어간 제한효소 주위를 포함시키는 것을 포함한다. 이 합성 P1 단편을 블루 헤론 코포레이션에 의해 신생 합성하여, 폴리오바이러스의 전장 cDNA 작제물 내에 도입하였다(도 11)(문헌 [Karlin et al., 1994]). PV(M)-wt 서열의 작은 단편(3개 코돈, 9개 뉴클레오티드)을 양 작제물 내에서 AUG 출발 코돈 뒤에 두어, 모든 합성 바이러스들에 대해 동등하게 번역이 개시되도록 하였고; 이에 따라 번역의 신장 상태에 대한 CPB의 영향의 더욱 정확한 측정을 제공하였다.
DNA 합성, 플라스미드, 합성 캡시드의 서브클로닝 및 세균
PV 게놈의 뉴클레오티드 495 내지 3636에 상응하는 큰 코돈 쌍 변경 PV cDNA 단편을 블루 헤론 코포레이션에 의해, 그 회사의 자산 진메이커
Figure 112009066775576-pct00013
시스템을 이용하여 합성하였다(http://www.blueheronbio.com/). 독특한 제한효소 부위를 이용하여, PV1(M) cDNA 클론 pT7PVM으로부터 모든 후속 폴리오바이러스 cDNA 클론/서브클론을 작제하였다(문헌 [van der Wert, et al., 1986]). 전장 PV-Min, PV-Max 카세트를 PflMI 분해 및 pT7PVM 벡터 내로의 삽입을 통해 블루 헤론의 담체 벡터로부터 분리시켰고, 그것의 PflMI 단편을 제거하였다. NheI 및 BgIII를 동시에 분해한 후, 이 단편을, 유사하게 분해한 pT7PVM 벡터로 치환함으로써, PV-MinXY 및 PV-MinZ 작제물을 수득하였다. BsmI 분해하고, 그 단편/벡터를 유사하게 분해된 pT7PVM과 교환하여, PV-MinXY 및 PV-MinZ을 작제하였다. PV-MinXY 작제물을 BsmI로 분해하고, 이 단편을 분해된 pT7PVM에 대한 BsmI 단편과 치환함으로써, PV-MinY를 작제하였다. 플라스미드 형질전환 및 증폭은 모두 에쉐리키아 콜라이 DH5α를 통해 수행되었다.
CPB 변경 캡시드 영역을 가지는 키메라 바이러스의 생성: P1 전반에 걸친 과소표시된 코돈 쌍 편향은 무효(null) 표현형을 초래한다.
폴리오바이러스 게놈 서열의 업스트림에 있는 T7 RNA 중합효소 프로모터를 이용하여, 포지티브 센스 RNA를 전사하였다. 상기의 것으로부터의 1.5 ㎍의 주어진 플라스미드 cDNA 클론을 EcoRI 분해를 통해 선형화한 후, 37℃에서 2시간 동안 cDNA의 업스트림에 있는 자신의 프로모터에 의해 유도되는 T7 RNA 중합효소(스트라타젠(Stratagene))를 통해 RNA 내로 전사하였다(문헌 [van der Werf et al., 1986]). 이 RNA를 DEAE-덱스트란 방법을 이용하여 1×106 HeLa R19 세포 내로 형질감염시켰다(문헌 [van der Werf et al., 1986]). 이어서, 이 세포를 실온(RT)에서 30분 동안 인큐베이션하였다. 형질감염 상등액을 제거하고, 2% 우태 혈청(BCS) 함유의 둘베코 변형 이글 배지(DMEM)를 첨가하였으며, 세포를 37℃에서 인큐베이션하고, 세포병변 효과(CPE)의 개시에 대해 관찰하였다(4일까지).
PV-Max RNA 형질감염은 24시간 후 90% 세포병변 효과(CPE)를 발생시켰고, 이는 PV(M)-wt RNA의 형질감염에 필적한다. PV-Max 바이러스는 야생형과 동일한 크기의 플라크를 생성시켰다. 이와 대조적으로, PV-Min RNA는 96시간 후에 가시적인 세포병변 효과를 발생시키지 않았고, 형질감염된 세포로부터의 상등액의 4회 맹검 계대배양 후에도 생존성 바이러스가 단리되지 않았다.
또한, PV-Max RNA 형질감염시킨 세포로부터의 상등액의 후속 사용으로도 12시간 후에 95% CPE를 생성시켰고, 따라서 이는 형질감염된 게놈 물질이 PV-Max 폴리오바이러스 비리온을 성공적으로 생성시켰음을 가리킨다. 이와 대조적으로, PV-Min 바이러스 RNA는 96시간 후에 가시적 CPE를 산출하지 않았고, 또한 가능히 극히 낮은 수준의 바이러스를 함유했을 수 있는 상등액을 4회 맹검 계대배양한 경우에도 CPE가 생성되지 않았다. 그러므로, P1 영역 내 과소표시된 코돈 쌍을 이용하는 전장 PV-Min 합성 서열은 생존성 바이러스를 생성시킬 수 없고, 이에 따라 그것은 서브클로닝될 필요가 있다.
HeLa R19 세포를 10% BCS를 함유하는 DMEM 중에서 단층으로서 유지시켰다. 1 M.O.I를 이용하여 (1.0×108 세포) HeLa R19 단층 상에서 바이러스 증폭을 수행하였다. 감염된 세포를 3일 동안 또는 CPE가 관찰될 때까지, 2% BCS를 갖는 DMEM 중에서 37℃에서 인큐베이션하였다. 3회 냉동/해동 사이클 후에, 저속 원심분리를 통해 용해물로부터 세포 잔해물을 제거하였고, 바이러스를 함유하는 상등액을 추가 실험을 위해 사용하였다.
HeLa R19 세포의 단층을 5 M.O.I의 주어진 바이러스로 감염시키고, 접종물을 제거하였으며, 세포를 PBS로 2회 세정한 후, 37℃에서 0, 2, 4, 7, 10, 24, 및 48시간 동안 인큐베이션함으로써, 1단계 증식 곡선을 얻었다. 이어서, 이 시점을 플라크 검정법을 통해 분석하였다. HeLa R19 세포의 단층에서 모든 플라크 검정법을 수행하였다. 이 세포를 주어진 성장 곡선 시점의 일련 희석액 또는 정제된 바이러스로 감염시켰다. 이어서, 이 세포에 2% BCS 함유의 변형 이글 배지 중에서 0.6% 트래거캔스 검을 부가한 후, 그 세포를 PV(M)-wt 및 PV-Max 바이러스의 경우에는 2일간, 또는 PV-Min(X, Y, XY, 또는 Z) 바이러스의 경우에는 3일 동안 37℃에서 인큐베이션하였다. 이어서, 그것을 크리스탈바이올렛 염색을 통해 전개하여, 가시적 플라크를 계수함으로써 PFU/ml 역가를 계산하였다.
과소표시된 코돈 쌍 편향의 작은 영역이 생존성을 복구시키나, 바이러스를 약독화한다.
PV-Min 서열 내에 설계된 제한효소 부위를 이용하여, 본 발명자들은 PV-Min P1 영역의 부분을 이와 다른 방식으로 야생형인 바이러스 내로 서브클로닝하여, P1의 단지 부분영역만이 불량한 코돈 쌍 편향을 가진 키메라 바이러스를 생성시켰다(도 11)(문헌 [van der Werf et al., 1986]). 각각의 이 서브클론으로부터, RNA를 시험관내 전사를 통해 생성시킨 후, HeLa R19 세포 내로 형질감염시켜, 다양한 약독화 정도를 갖는 바이러스를 산출시켰다(생존성 스코어, 도 11). P1 단편 X 및 Y는 각기 약간 약독화되나; 그것들은 함께 첨가될 때, 실질적으로 약독화된 바이러스(PV-Min755-2470, PV-MinXY)를 산출시킨다(도 3, 4). 바이러스 PVMin2470-3385(PV-MinZ)는 PV-MinXY와 대략 유사하게 약독화된다. 작제물 PV-Min1513-3385(YZ)는 플라크를 산출하지 않았고, 따라서 매우 약독화되어 생존성 바이러스를 산출하지 못함이 명백하다. 다양한 약독화 정도를 나타낸 상기 바이러스 작제물을 더욱 연구하여, 그것의 실제 증식 동역학 특성을 결정하였다.
1단계 증식 동역학 특성 및 약독화의 기전: 특이적 감염력이 감소된다.
각 생존성 작제물에 대해, 1 단계 증식 동역학 특성을 조사하였다. 이 동역학 특성은 동일한 기본 방식으로 진행된다는 점에서, 야생형의 동역학 특성과 일반적으로 유사하다(즉, 암흑 상태 후에, 급속한 지수 성장이 이어짐). 그러나, 모든 PV-Min 작제물들에 대해, 플라크 형성 단위(PFU) 측면에서의 최종 역가는 전형적으로 야생형 바이러스의 최종 역가에 비해 1 내지 3 등급 더 낮았다(도 12A).
바이러스를 PFU 대신에 바이러스 입자/ml로 측정할 때(도 12B), 약간 상이한 결과가 수득되며, 이는 이 바이러스가 감염 사이클 당, 야생형 바이러스와 거의 균등한 세포당 입자 수를 생성시킴을 제시한다. 바이러스 입자/ml의 측면에서, 가장 약독화된 바이러스는 단지 78%(PV-MinXY) 또는 82%(PV-MinZ) 약독화되고, 이 정도는 로그 규모로 약 1 등급 미만이다. 따라서, 이 바이러스는 이의 특이적 감염력(플라크 생성에 필요한 비리온 수)에 있어 약 2 등급만큼 약독화되는 것으로 보여진다.
특이적 감염력이 감소되었음을 확인하기 위해, 본 발명자들은 매우 정제된 바이러스 입자를 이용하여, PFU 당 바이러스 입자의 비를 재측정하였다. 선택된 바이러스를 108개 HeLa R19 세포 상에서 증폭시켰다. 바이러스 용해물을 RNAse A로 처리하여, OD 값을 모호하게 하는 노출된 바이러스 게놈 및 임의 세포 RNA를 파괴하였다. 또한, 이어서 바이러스 용해물을 0.2% SDS 및 2 mM EDTA와 함께 1시간 동안 인큐베이션하여, 세포내 및 비비리온 바이러스 단백질을 변성시켰다. 적절히 폴딩되어 형성된 폴리오바이러스 캡시드는, 알파 입자는 생존하지 못했던, 이 격한 SDS 처리에 남아 생존하였다(문헌 [Mueller et al., 2005]). 이 처리된 용해물로부터의 비리온을 이어서 수크로스 구배로 초원심분리를 통해 정제하였다. 식 [9.4×1012 입자/ml = 1 OD260 단위]를 이용하여, 260 nm에서의 흡광도에 의해, 바이러스 입자 농도를 측정하였다(문헌 [Rueckert, 1985]). 각각의 4가지 바이러스에 대해 유사한 수의 입자가 생성되었다(표 6). 이어서, 이 정제된 비리온을 이용하여, 플라크 검정법을 수행하였다. 다시, PV-MinXY 및 PV-MinZ는, 플라크의 생성을 위해 야생형보다 더 많은 바이러스 입자들을 요하였다(표 6).
야생형 바이러스에 있어서, 특이적 감염력은 문헌들(문헌 [Mueller et al., 2006]; 문헌 [Schwerdt 및 Fogh, 1957]; 문헌 [Joklik 및 Darnell, 1961])과 일관되게도, 137 입자 당 1 PFU인 것으로 계산되었다(표 6). 바이러스 PV-MinXY 및 PV-MinZ의 특이적 감염력은 1 PFU/10,000개 입자 부근이다(표 6).
부가적으로, 합성 바이러스의 열 안정성을 PV(M)-wt의 열 안정성과 비교하여, 신규 RNA의 부분을 갖는 상기 입자들이 동등하게 안정하다는 SDS 처리 데이터를 재확인하였다. 실제로, 이 합성 바이러스는 50℃에서 인큐베이션하여 시간 코스로 정량할 때, PV(M)-wt와 동일한 온도 프로파일을 가졌다(데이터는 나와 있지 않음).
과소표시된 코돈 쌍은 번역 효율을 감소시키는 반면, 과대표시된 쌍은 번역을 증진시킨다.
코돈 쌍 편향의 존재에 대한 한 가설은, 과소표시된 쌍의 이용이 불량하거나 낮은 번역 속도를 유발한다는 것이다. 본 발명자들의 합성 바이러스는, 본 발명자의 지견에 따르면, 고농도의 과소표시된 코돈 쌍을 함유하는 첫 번째 분자이며, 이에 따라 첫 번째 분자는 그 번역 가설의 시험에 적당하다.
번역에 대한 코돈 쌍 편향의 영향을 측정하기 위해, 본 발명자들은 디시스트론성 리포터를 사용하였다(문헌 [Mueller et al., 2006])(도 13). 첫 번째 시스트론은 C형 간염 바이러스 내부 리보솜 부착 부위(IRES)의 조절 하에서 레닐라 루시퍼라제(R-Luc)를 발현시키고, 정규화 대조군으로서 사용된다. 두 번째 시스트론은 폴리오바이러스 IRES의 조절 하에 반딧불 루시퍼라제(F-Luc)를 발현한다. 그러나, 이 두 번째 시스트론에서는, F-Luc 앞에 폴리오바이러스의 P1 영역이 있고, 이 P1 영역은 본원에 기재된 합성 서열 변이체들 중 임의의 것에 의해 코딩될 수 있다. F-Luc가 P1 영역의 단백질로 융합 단백질로서 번역되기 때문에, P1 영역의 번역능은 생성되는 F-Luc 단백질의 양에 직접적으로 영향을 준다. 따라서, F-Luc 발광도(luminescence) 대 R-Luc 발광도의 비는 각종 P1 코딩의 번역능의 척도이다.
야생형, PV-Max, PV-Min, PV-MinXY 및 PV-MinZ의 P1 영역을 "P1"로 표지된 영역에 삽입하였다(도 13A). PV-MinXY, PV-MinZ, 및 PV-Min은 야생형 P1 영역에 비해 R-Luc의 단위 당 훨씬 더 적은 F-Luc를 생성하고, 이는 과소표시된 코돈 쌍이 불량하거나 낮은 번역 속도를 유발하고 있음을 강하게 제시한다(도 13). 이와 대조적으로, PV-Max P1(과대표시된 코돈 쌍을 사용함)은 R-Luc의 단위 당 더 많은 F-Luc를 생성시켰고, 이는 번역이 PV(M)-wt P1에 비해 PV-Max P1에서 더 잘 이루어짐을 제시한다.
디시스트론성 리포터 작제 및 생체내 번역
pdiLuc-PV에 기초하여 디시스트론성 리포터 작제물을 모두 작제하였다(문헌 [Mueller et al., 2006]). 올리고뉴클레오티드 P1max-2A-RI(+)/P1max-2A-RI(-) 또는 P1min-2A-RI(+)/P1min-2A-RI(-)를 각기 이용하여, PCR을 통해 PV-Max 및 PV-Min 캡시드 영역을 증폭시켰다. PCR 단편을 겔 정제한 후, 중간 벡터 pCR-
Figure 112009066775576-pct00014
-XL-TOPO
Figure 112009066775576-pct00015
(인비트로겐)에 삽입하였다. 이어서 이 중간 벡터를 원샷(One Shot)
Figure 112009066775576-pct00016
토피오(TOPlO) 화학적 경쟁 세포 내에서 증폭시켰다. 키아겐 미니프렙(Quiagene miniprep)을 통해 플라스미드를 제조한 후, PV-Min를 포함하는 중간 벡터를 EcoRI로 분해하였고, 이 단편들을 EcoRI로 동일하게 분해된 pdiLuc-PV 벡터 내로 결찰시켰다(문헌 [Mueller et al., 2006]). 이 플라스미드를 또한 원샷
Figure 112009066775576-pct00017
토피오 화학적 경쟁 세포(인비트로겐)에 삽입하였다. pdiLuc-PV-MinXY 및 pdiLuc-PV-MinZ를 작제하기 위해, pdiLuc-PV 및 pdiLuc-PV-Min을 NheI로 동일하게 분해하였고, 생성되는 제한효소 단편을 각 벡터 간에 교환하였다. 이어서, 이것을 원샷
Figure 112009066775576-pct00018
토피오 화학적 경쟁 세포 내로 형질전환한 후, 증폭시켰다. 4개 모두의 이 클론들로부터, RNA을 T7 중합효소 방법을 통해 전사시켰다(문헌 [van der Werf et al., 1986]).
합성 캡시드의 생체내 번역 효율을 분석하기 위해, 디시스트론성 리포터 작제물의 RNA를, 리포펙타민(Lipofectamine) 2000(인비트로겐)을 통해 12웰 디쉬 상에서 2×105개 HeLa R19 세포 내로 형질감염시켰다. 단지 투입된 RNA의 번역을 정량하기 위해, 형질감염을 2 mM 구아니딘 염산염(GuHCL)의 존재 하에 수행하였다. 형질감염한지 6시간 후, 세포를 부동 세포용해 완충액(프로메가)를 통해 용해시킨 후, 이 용해물을 이중 반딧불(F-Luc) 레닐라(R-Luc) 루시퍼라제 검정법(프로메가)에 의해 분석하였다.
PV-MinXY 및 PV-MinZ의 유전적 안정성
PV-MinXY 및 PV-MinZ가 각기 수백개의 돌연변이(이들 각 돌연변이는 전체 코돈 쌍 편향의 미소한 감소를 유발함)를 가지기 때문에(각각 407개 및 224개), 본 발명자들은 이 바이러스들이 야생형 독성으로 복귀하기는 매우 어려울 것으로 판단한다. 이 사상의 직접적 시험으로서, 바이러스 PV-MinXY 및 PV-MinZ를 0.5의 MOI로 각기 15회 일련 계대배양하였다. 역가를 표현형 복귀에 대해 모니터링하였고, 계대배양된 바이러스의 서열을 복귀 또는 돌연변이에 대해 모니터링하였다. 15회 계대배양 후, 바이러스에 있어 표현형 변화가 없었고(즉, 동일한 역가, CPE 유도), 합성 영역에 고정된 돌연변이가 없었다.
열 안정성 및 계대배양
합성 바이러스인 PV-MinXY 및 PV-MinZ의 안정성을 시험하여, PV(M)-wt와 비교하였다. 이는, PBS 중에 현탁된 1×108개 입자를 60분 동안 50℃로 가열한 후, 5, 15, 30 및 60분에서 플라크 검정법을 통해 비변형 바이러스 입자의 감소를 측정함으로써 수행되었다(도 14). 바이러스 PV-MinXY 및 PV-MinZ의 P1 영역의 합성 부분의 유전적 안정성을 시험하기 위해, 이 바이러스들을 일련 계대배양하였다. 이는, 1×106개 HeLa R19 세포의 단층을 0.5 MOI의 바이러스, PV-MinXY 및 PV-MinZ로 감염시킨 후, CPE의 유도를 대기함으로써 수행되었다. CPE가 일단 개시되면, 계대배양 전반에 걸쳐 일정하게 남는데, 용해물을 사용하여 HeLa R19 세포의 새 단층을 감염시켰다. 역가 및 서열을 계대배양 5, 9, 및 15에서 모니터링하였다(데이터는 나와 있지 않음).
바이러스 정제, 및 OD 260 흡광도를 통한 바이러스 입자의 결정
CPE가 관찰될 때까지, 15 cm 디쉬(1×108개 세포) 상에서의 HeLa R19 세포의 단층을 PV(M)-wt, PV-Max, PV-MinXY 또는 PV-MinZ로 감염시켰다. 3회 냉동/해동 사이클 후, 세포 용해물을 3,000×g에서 15분 동안, 이어서 10,000×g에서 15분 동안 2회 초기 원심분리하였다. 이어서, 10 ㎍/ml의 RNAse A(로쉐)를 상등액에 첨가하여, 1시간 동안 실온에서 인큐베이션하였으며; 후속하여, 0.5% 도데실황산나트륨(SDS) 및 2 mM EDTA를 상등액에 첨가하여, 완만하게 혼합하고, 30분 동안 실온에서 인큐베이션하였다. 바이러스 입자를 함유하는 이 상등액을 6 ml 수크로스 쿠션[행크스 완충 염액(HBSS) 중 30% 수크로스] 위에 두었다. SW28 스윙-버킷 회전자를 이용하여 28,000 rpm에서 3.5시간 동안 수크로스 구배를 통해 초원심분리하여, 바이러스 입자의 침강을 수행하였다.
원심분리 후, 수크로스 쿠션을 비변형 상태로 두었고, 상등액을 제거하였으며, 관을 HBBS로 2회 세정하였다. 세정 후, 수크로스를 제거하였고, 바이러스 "펄(pearl)"을 0.1% SDS 함유의 PBS 중에 재현탁하였다. 플라크 검정법(상기 참조)을 통해, 바이러스 역가를 측정하였다. 식 [9.4×1012 입자/ml = 1 OD260 단위]을 이용하여, 나노드롭 분광광도계(나노드롭 테크놀로지즈 인코포레이티드)를 통해 용액의 260 nm에서의 흡광도를 3회 측정하여 평균을 구함으로써, 바이러스 입자 농도를 측정하였다(문헌 [Mueller et al., 2006]; 문헌 [Rueckert, 1985]).
CD155tg 마우스에서의 PV-MinXY 및 PV-MinZ의 신경약독화
야생형 폴리오바이러스의 감염의 일차 부위는 인두 중앙부 및 위이나, 이 감염은 비교적 무증상이다. 그러나, 감염이 PV(M)-wt 감염의 1%로 CNS 내에 운동 뉴런에 퍼지면, 바이러스는 뉴런을 파괴하여, 사망, 또는 급성 회백수염으로 알려진 바와 같은 급성 이완성 마비를 유발한다(문헌 [Landsteiner 및 Popper, 1909]; 문헌 [Mueller et al., 2005]). 운동 뉴런 및 CNS가 폴리오바이러스의 중요 표적이므로, 본 발명자들은 합성 바이러스가 이 조직들에서 약독화되었는지의 여부를 알기 원한다. 그러므로, 이 바이러스들을 뇌내 주사를 통해 CD155tg 마우스(폴리오바이러스 수용체를 발현하는 유전자도입 마우스)에 투여하였다(문헌 [Koike et al., 1991]). 각 바이러스에 대해 PLD50 값을 계산하였고, PV-MinXY 및 PV-MinZ 바이러스는 입자 기준 1,000배 약독화 또는 PFU 기준 10배 약독화되었다(표 6)(문헌 [Reed and Muench, 1938]). 바이러스들은 신경약독화를 나타냈으므로, 가능한 백신으로 사용될 수 있다.
CD155tg 마우스에서의 감소된 특이적 감염력 및 신경약독화
바이러스 A260 정제된 입자/ml a 정제된 PFU/ml 특이적 감염력 b PLD50(입자) c PLD50(PFU) d
PV-M(wt) 0.956 8.97×1012 6.0×1010 1/137 104.0 101.9
PV-Max 0.842 7.92×1012 6.0×1010 1/132 104.1 101.9
PV-MinXY 0.944 8.87×1012 9.6×108 1/9,200 107.1 103.2
PV-MinZ 0.731 6.87×1012 5.1×108 1/13,500 107.3 103.2

a) A260를 사용하여, 식 [9.4×1012개 입자/ml = 1 OD260]을 통해 입자/ml를 구함
b) 정제된 바이러스의 PFU/ml를 입자/ml로 나눔으로써 계산됨
c, d) 바이러스를, 각종 용량으로 CD155tg 마우스에 뇌내 주사로 투여한 후에 계산됨
CD155tg 마우스의 백신접종은 면역성 및 치사 공격접종으로부터의 보호를 제공한다.
4-6, 6-8주령 CD155tg 마우스(Tg21 균주)의 군에, 30 ㎕ PBS 중의 102개 입자 내지 109개 입자의 정제된 바이러스 희석물을 뇌내 주사하여, 신경병원성을 결정하였다(문헌 [Koike, et al., 1991]).
[Reed 및 Muench] 방법에 의해, 치사 용량(LD50)을 계산하였다(문헌 [Reed and Muench, 1938]). 플라크 검정법에 의해, 척수 및 뇌에서의 바이러스 역가를 정량하였다(데이터는 나와 있지 않음).
PV-MinZ 및 PV-MinXY는 야생형 바이러스와 정확히 동일한 단백질을 코딩하나, 감소된 특이적 감염력 및 신경약독화 모두에 대해, 수가지 면에서 약독화된다.
백신으로서의 PV-MinZ, PV-MinXY를 시험하기 위해, 3가지 부분치사 용량(108개 입자)의 이 바이러스를 100 ㎕의 PBS 중에서 8, 6-8주령 CD155tg 마우스에 뇌내 주사를 통해 3주 동안 매주 1회 투여하였다. 백신 코호트로부터의 한 마우스는 병약으로 인해 백신 처방을 완료하지 못했다. 또한, 대조군 마우스의 집합에 100 ㎕ PBS를 이용하여 3회 모의 백신접종을 실시하였다. 최종 백신접종한 지 대략 1주 후에, 30 ㎕의 혈액을 꼬리정맥으로부터 추출하였다. 이 혈액을 저속 원심분리하였고, 혈청을 회수하였다. WHO의 권장사항에 따라 수행되는, 공격접종 바이러스의 100 플라크 형성 단위(PFU)를 이용한 미세중화 검정법을 통해, PV(M)-wt에 대한 혈청 전환을 분석하였다(문헌 [Toyoda et al., 2007]; 문헌 [Wahby, A.F., 2000]). 최종 백신접종한 지 대략 2주 후에, 백신접종된 마우스 및 대조군 마우스를, 100 ㎕의 PBS 중의 106 PFU로 뇌내 주사함으로써 치사 용량의 PV(M)-wt로 공격접종하였다(문헌 [Toyoda et al., 2007]). CD155tg 마우스를 이용한 모든 실험들을, 연방 지침뿐만 아니라, 스토니 브루크 유니버시티(Stony Brook University)의 IACUC에 따라 수행하였다. 14마리 모두의 백신접종된 마우스가 생존하였고, 마비 또는 파라시아(Parasia)의 어떠한 표시도 나타내지 않았으며; 이와 대조적으로, 모든 모의 백신접종된 마우스는 사망하였다(표 7). 이 데이터는, 실제로 역최적화 코돈 쌍을 갖는 CPB 바이러스가 야생형 바이러스에 대해 면역화할 수 있어, 양자 모두에게 강한 상박골 반응을 제공하고, 또한 공격접종 후 완전한 생존을 허용하였다.
치사적 공격접종으로부터의 보호
바이러스 a 보호된 마우스(7마리 중의 마리수) b
PV-MinZ 7
PV-MinXY 7
모의 백신접종 0

a) CD155tg 마우스에 3가지 백신접종 용량(108개 입자)의 각 바이러스를 투입함
b) 뇌내 주사를 통해 106 PFU의 PV(M)-wt로 공격접종함

실시예 10
인플루엔자 바이러스에의 SAVE의 적용
인플루엔자 바이러스는 8개의 분리된 게놈 분절을 가진다. 인플루엔자 A 바이러스(A/푸에르토리코/8/34/시나이(H1N1))에 대한 분절 서열을 개시하는 유전자은행 수탁에는, AF389115(분절 1, 중합효소 PB2), AF389116(분절 2, 중합효소 PB1), AF389117(분절 3, 중합효소 PA), AF389118(분절 4, 헤마글루티닌 HA), AF389119(분절 5, 핵단백질 NP), AF389120(분절 6, 뉴라미니다제 NA), AF389121(분절 7, 매트릭스 단백질 M1 및 M2), 및 AF389122(분절 8, 비구조 단백질 NS1)이 포함된다.
초기 연구에서, 전장 바이러스 RNA에 단량체로서 결합하여 코일링된 리보핵단백질을 형성하게 되는 비리온의 주요 구조 단백질이자 두 번째로 풍부한 단백질(입자 당, 1,000개 카피)인 핵단백질 NP을 코딩하는 균주 A/PR/8/34의 게놈 분절(본원에서 A/PR8로도 칭해짐)을 역최적화를 위해 선택하였다. (모 및 역최적화 서열에 대해 이하 표 8을 참조한다). 또한, NP는 mRNA에서 주형으로의 중대 전환 및 비리온 RNA 합성에 관여한다(문헌 [Palese and Shaw, 2007]). 2개의 동의 코딩을 합성하였는데, 첫 번째는 빈번하게 사용되는 코돈을 희소 동의 코돈(NPCD)으로 치환하는 것이고(즉, 역최적화 코돈 편향), 두 번째는 코돈 쌍(NPCPmin)을 역최적화하는 것이다. 분절의 어느 한 끝에 있는 말단 120개 뉴클레오티드를, 복제 및 이입을 저해하지 않도록 변경하였다. NPCP는 338개 침묵 돌연변이를 포함하고, NPCPmin(서열 번호 23)는 314개 침묵 돌연변이를 포함한다. 돌연변이체 NP 분절을 (이하) 기재된 바와 같이, 또한 293T/MDCK 동시 배양된 세포 내로 동시 형질감염된 다른 7개의 wt 인플루엔자 플라스미드와 함께, 앰비센스(ambisense) 벡터에 도입하였다. 대조군으로서, 세포를 모든 8개의 wt A/PR8 플라스미드로 형질감염시켰다. NPCD 분절 및 NPCPmin 분절로 형질감염된 세포는 야생형 NP로 형질감염된 세포와 유사하게, 생존성 인플루엔자 바이러스를 생성시켰다. 각기 A/PR8-NPCD 또는 A/PR8-NPCPmin로 칭해지는, 이 새로운 역최적화 바이러스들은 약독화되는 것으로 보여지며; 즉, 역가(PFU 단위)가 야생형 바이러스에 비해 3 내지 10배 더 적고, 양 돌연변이체 바이러스 모두가 작은 플라크를 만든다.
역최적화 인플루엔자 바이러스가 유사한 수의 역최적화 코돈을 갖는 폴리오바이러스와 같이 심하게 약독화되지 않으나, 두 바이러스의 번역 기법에는 차이가 있다. 폴리오바이러스는 단일 다단백질로 번역되는, 단일의 긴 mRNA를 가진다. (본 발명자들의 캡시드 역최적화 바이러스에서와 같은) 이 긴 mRNA를 시작으로 한 저속 번역은 전체 메시지의 번역을 감소시키고, 이에 따라 모든 단백질들에 영향을 준다. 이와 대조적으로, 인플루엔자는 8개의 분리된 분절을 가지고, 하나의 역최적화는 다른 것들의 번역에 대해 영향을 가진다해도 거의 가지지 않을 것이다. 또한, NP 단백질의 발현은 특히 인플루엔자 바이러스 감염에서 일찍 우세하게 일어난다(문헌 [Palese and Shaw, 2007]).
코돈 쌍 역최적화 NP 분절을 가지는 인플루엔자 바이러스의 특성 분석
0.001 감염 다중도(MOI)로 100 mm 디쉬에서 개의 원위세뇨관 세포(Madin Darby Canine Kidney Cells)(MDCK 세포)의 컨플루언트 단층을 감염시킴으로써, A/PR8-NPCPmin의 성장 특성을 분석하였다. 바이러스 접종물을 록킹 플랫폼 상에서 30분 동안 실온에서 흡착되도록 한 후, 0.2% 우태 혈청 알부민(BSA) 및 2 ㎍/ml TPCK 처리 트립신을 함유하는 10 ml의 둘베코 변형 이글 배지(DMEM)로 보충하고, 37℃에서 인큐베이션하였다. 0, 3, 6, 9, 12, 24 및 48시간 후, 100 ㎕의 바이러스를 함유하는 배지를 제거하고, 플라크 검정법에 의해 바이러스 역가를 측정하였다.
35 mm 6웰 플레이트에서 MDCK 세포의 컨플루언트 단층에 플라크 검정법을 g행하여, 바이러스 역가 및 플라크 표현형을 결정하였다. 바이러스의 10배 일련 희석액을, 0.2% 우태 혈청 알부민(BSA) 및 2 ㎍/ml TPCK 처리 트립신을 함유하는 둘베코 변형 이글 배지(DMEM)에서 제조하였다. 바이러스 희석액을 MDCK 세포 상에 도말하고, 록킹 플랫폼에서 30분 동안 실온에서 흡착하도록 한 후, 세포 배양 인큐베이터에서 37℃에서 1시간 동안 인큐베이션하였다. 이어서, 접종물을 제거하였고, 0.6% 트래거캔스 검(시그마-알드리치) 0.2 % BSA 및 2 ㎍/ml TPCK 처리 트립신을 함유하는 3 ml의 최소 이글 배지로 보충하였다. 37℃에서 72시간 동안 인큐베이션한 후, 웰을 크리스탈바이올렛으로 염색함으로써 플라크를 가시화하였다.
A/PR8-NPMin는 A/PR8 wt에 비해, MDCK 세포 상에서 보다 작은 플라크를 생성시킨 생존성 바이러스를 생성시켰다(도 16A). 또한, 낮은 MOI 감염 시, A/PR8-NPMin는 감염후 3 내지 12시간에 지연된 증식 동역학 특성을 나타내고, 여기에서 A/PR8-NPMin 역가는 A/PR8에 비해 1.5 로그 지체된다(도 16B). 최종 역가는 A/PR8의 최종 역가보다 3 내지 5배 더 낮았다(3개의 상이한 실험들의 평균).
코돈 쌍 역최적화 PB1, HA, 또는 HA 및 NP 분절을 가지는 인플루엔자 바이러스 A/PR8-PB1 Min-RR , A/PR8-HA Min 및 A/PR8-HA Min /NP Min 의 특성 분석
헤마글루티닌 단백질 HA 및 중합효소 서브유닛 PB1을 코딩하는 균주 A/PR/8/34의 코돈 쌍 역최적화 게놈 분절을 생성시켰다. HA는 바이러스 표면 매개 수용체 부착 및 바이러스 침투로부터 나오는 바이러스 구조 단백질이다. PB1은 바이러스 RNA 복제 기구의 중요 성분이다. 구체적으로, 야생형 코돈 사용빈도(PB1Min-RR)를 보유하면서 코돈 190 내지 488(PB1 분절의 뉴클레오티드 531 내지 1488)의 코돈 쌍을 역최적화함으로써, PB1의 동의 코딩(서열 번호 15)을 합성하였다. 분절 PB1Min-RR은 wt PB1 분절에 비해 236개 침묵 돌연변이를 포함하였다.
야생형 코돈 사용빈도(HAMin)를 보유하면서 코돈 50 내지 541(HA 분절의 뉴클레오티드 180 내지 1655)의 코돈 쌍을 역최적화함으로써, HA의 두 번째 동의 코딩(서열 번호 21)을 합성하였다. HAMin은 wt PB1 분절에 비해 355개 침묵 돌연변이를 포함하였다.
돌연변이체 PB1Min-RR 및 HAMin 분절을, 상기 기재된 바와 같이, 앰비센스 벡터 내로, 또한 293T/MDCK 동시 배양된 세포 내로 동시 형질감염된 다른 7개의 wt 인플루엔자 플라스미드와 함께 도입하였다. NPMin 분절 및 나머지 6개 wt 플라스미드와 함께 HAMin 분절을 동시 형질감염시켰다. 대조군으로서, 세포를 모든 8개의 wt A/PR8 플라스미드로 형질감염시켰다. PB1Min-RR 또는 HAMin 분절로 형질감염된 세포는, 코돈 쌍 역최적화 분절 HAMin 및 NPMin의 조합과 마찬가지로, 생존성 바이러스를 생성시켰다. 새 역최적화 바이러스는 각기 A/PR8-PB1Min-RR, A/PR8-HAMin 및 A/PR8-HAMin/NPMin로 칭해진다.
성장 특성 및 플라크 표현형을 상기 기재된 바대로 평가하였다.
A/PR8-PB1Min-RR, A/PR8-HAMin, 및 A/PR8-HAMin/NPMin은 모든 생존성 바이러스를 생성시켰다. A/PR8-PB1Min-RR 및 A/PR8-HAMin/NPMin는 A/PR8 wt에 비해 MDCK 세포 상에서 보다 작은 플라크를 생성시켰다(도 17A). 또한, MDCK 세포 상에서의 낮은 MOI 감염 시, A/PR8-HAMin 및 A/PR8-HAMin/NPMin은 매우 감소된 증식 동역학 특성을, 특히 감염후 3 내지 12시간에 나타냈고, 여기에서 A/PR8-HAMin/NPMin 역가는 A/PR8보다 1 내지 2 등급 지체된다(도 17B). A/PR8-HAMin 및 A/PR8-HAMin/NPMin의 양자 모두에 대한 최종 역가는 A/PR8의 최종 역가보다 10배 더 낮았다. A/PR8-HAMin/NPMin이 A/PR8-HAMin보다 더 심하게 증식이 지체되는 바, 두 분절을 역최적화하는 효과는 부가적인 것으로 결론내릴 수 있다.
BALB/c 마우스 모델에서의 A/PR8-NP Min 의 약독화
6 내지 8마리의 마취한 6주령의 BALB/c 마우스로 된 군에, 102 및 106 PFU의 바이러스의 10배 일련 희석액을 함유하는 12.5 ㎕의 A/PR8 또는 A/PR8-NPMin 바이러스 용액을 콧구멍으로 주입하였다. 치사율 및 질병율(체중 감소, 감소된 활성, 사망)을 모니터링하였다. [Reed 및 Muench]의 방법(문헌 [Reed, L. J., and M. Muench. 1938. Am. J. Hyg. 27:493-497])에 의해 치사 용량 50, LD50을 계산하였다.
8마리의 마우스에, 102 PFU의 A/PR8-NPMin 바이러스를 비강내 접종함으로써 한 번 백신접종하였다. 6마리의 마우스로 된 대조군에는 어떠한 바이러스도 백신접종하지 않았다(모의). 이 초기 백신접종을 한 지 28일 후, 마우스를 LD50의 100배에 상응하는, 치사 용량의 wt 바이러스 A/PR8으로 공격접종하였다.
A/PR8에 대한 LD50은 4.6×101 PFU인 반면, A/PR8-NPMin에 대한 LD50은 1×103 PFU이었다. 102의 용량에서, 모든 A/PR8-NPMin 감염 마우스들이 생존하였다. A/PR8-NPMin이 wt A/PR8 바이러스에 비해 10배 초과만큼 마우스에서 약독화된 것으로 결론내릴 수 있다. 이에 따라, 백신접종 실험을 위해 상기 농도를 선택하였다. 마우스에 102 A/PR8-NPMin를 백신접종하면, 10% 미만의 상대적 체중 감소로 나타나는 바와 같이, 보통 정도의 짧은 병약이 초래되었다(도 18A). 8마리의 백신접종된 마우스들 중 8마리 모두가 생존하였다. 동일한 용량의 A/PR8로 감염된 마우스는 심한 질환으로 급속한 체중 감소를 겪었다. A/PR8로 감염된 8마리 마우스 중 6마리가 감염후 10 내지 13일에 사망하였다(도 18B). 두 마리의 마우스가 생존하여, 야생형 감염으로부터 회복하였다.
wt 바이러스의 LD50의 100배로 공격접종했을 때, 백신접종된 모든 A/PR8-NPMin이 보호되었고, 질환 증상 또는 체중 감소없이 공격접종에 살아 남았다(도 18C). 모의 백신접종된 마우스는 한편 심각한 증상을 나타냈고, 공격접종 9 내지 11일 후 감염에 굴복당했다. A/PR8-NPMin가 마우스에서 보호 면역을 유도하였고, 이에 따라 약독화 인플루엔자 생백신으로서의 가능성을 가지는 것으로 결론내릴 수 있다. 마우스에서 역시 시험하고자 하는 A/PR8-PB1Min-RR 및 A/PR8-HAMin/NPMin와 같은 다른 바이러스도 또한 백신으로서의 코돈 쌍 역최적화 인플루엔자 바이러스의 유익한 성질을 추가로 향상시키게 될 수 있다.
실시예 11
바이러스 키메라를 제조하고 특성 분석하기 위한 고효율 방법의 개발
중첩 PCR에 의한 키메라 바이러스의 작제
각 약독화 돌연변이체 바이러스를 통한 "스캔"은, 중첩 PCR을 이용하여 각 돌연변이체 바이러스로부터의 대략 300 bp 단편을 wt 부분에 둠으로써 수행된다. 임의의 주어진 300 bp 분절은 ~200 bp만큼 선행 분절과 중첩되나(즉, 스캐닝 창이 ~300 bp 길이임), 각 키메라 바이러스에 대해 ~100 bp만큼 진행된다. 따라서, (단지 ~3000 bp의 캡시드 영역이 변경된) 한 돌연변이체 바이러스를 통한 스캔은 약 30 키메라 바이러스를 필요로 한다. 동시에 두 바이러스의 분석에 충분한 용량을 초과하는 용량을 가지는 96웰 포맷으로 스캔을 수행한다.
출발 물질은 두 플라스미드의 피코그램 양으로서, 이때 한 플라스미드는 wt 바이러스의 서열을 포함하고, 다른 하나는 돌연변이체 바이러스의 서열을 포함한다. 플라스미드는 T7 RNA 중합효소 프로모터, 해머헤드 리보솜(문헌 [Herold and Aldino, 2000]), 및 DNA 코딩 폴리(A) 꼬리를 포함한, PV 역유전학 시스템(문헌 [van der Werf et al., 1986])을 위한 모든 필수 요소를 포함한다. PCR 프라이머의 3 쌍, 즉 A, M(돌연변이체의 경우), 및 B 쌍을 사용한다. 도 9를 참조한다. M 쌍은 돌연변이체 바이러스의 요망되는 300 bp 분절을 증폭시키고; 그것은 wt를 증복시키지 않는데, 이는 M 프라이머 쌍이 돌연변이체 내에서 유의적으로 변경된 서열에 기초하여 설계되기 때문이다. A 및 B 쌍은 wt 바이러스 게놈의 요망되는 측면(flank)을 증폭시킨다. 중요하게도, 약 20 내지 25 bp의 중첩 서열이 각기 A2 및 B1뿐만 아니라 각 M 프라이머의 5' 말단 내에 만들어지고; 이 20 내지 25 bps가 A 분절의 3' 말단 및 B 분절의 5' 말단과 각기 중첩한다(100% 상보성).
중첩 PCR을 수행하기 위해, 1개의 96웰 디쉬는 30가지 상이한 웰에 wt 플라스미드 DNA, 및 30개의 상이한 A 및 B 쌍을 포함한다. 분리되어 있으나 매칭되는 96웰 플레이트는 돌연변이체 플라스미드 DNA 및 30개의 상이한 M 프라이머 쌍을 포함한다. PCR는 매우 절차적이고 낮은 오류율을 가지는 열안정성 중합효소로 수행된다. PCR의 1회 번째 수행 후, 각 반응물을, 메틸화 GmATC 부위에서 절단에 의해 주형 플라스미드를 파괴하는 DpnI로 처리한다. 각 wt 및 매칭 돌연변이체 반응물로부터의 분취량을 이어서 세 번째 96웰 디쉬에서 PCR 반응 완충액 중에 혼합한다. 이때, 전체 작제물에 측면에 있는 프라이머를 사용한다(즉, A1 및 B2 프라이머). 각 분절(A, M, 및 B)이 각 인접한 분절과 20 bp 이상 중첩되도록 설계되고, 또한 반응이 단지 전장 산물을 증폭시킬 수 있는 프라이머에 의해 유도되고 있기 때문에, 분절들은 어닐링하고 상호 확장하여, 2 또는 3 사이클 후에 전장 산물을 생성시킨다. 이는 "1 튜브"(1개의 96웰 디쉬) 설계로 압축될 수 있는 "3 튜브"(3개의 96웰 디쉬) 설계이다.
키메라 바이러스의 특성 분석
T7 RNA 중합효소와 함께 인큐베이션할 때, 모든 필요한 업스트림 및 다운스트림 조절 요소를 갖는, 상기 생성된 전장 선형 키메라 DNA 게놈은 활성 바이러스 RNA를 생성하고, 이는 HeLa S10 세포 추출물 중 인큐베이션할 때(문헌 [Molla et al., 1991]), 또는 HeLa 세포 내로 형질감염시킬 때, 바이러스 입자를 생성시킨다. 대안적으로, DNA 작제물을 세포질 내 T7 RNA 중합효소를 발현하는 HeLa 세포 내로 직접 형질감염시키는 것도 가능하다.
이어서, 96웰 포맷으로 바이러스-유도 CPE를 평가하기 위한 세포의 시각적 조사; ELISA를 이용한 바이러스 생성의 평가; 일련의 96웰 플레이트에서 세포 내로 접종된 동등량의 바이러스 입자의 증식 동역학 특성의 정량적 측정; 및 특이적 감염력(감염성 단위/입자 [IU/P] 비)의 측정을 포함한, 각종 비교적 고효율인 검정법들을 이용하여, 각 키메라 바이러스의 기능성을 검정한다.
이어서, 각 키메라 바이러스의 기능성을 검정할 수 있다. 다수의 비교적 고효율인 검정법들이 이용 가능하다. 첫 번째 검정법은 96웰 포맷에서 바이러스-유도 CPE(세포 사멸)을 찾기 위해 현미경을 이용하여 세포를 시각적으로 조사하는 것일 수 있다. 이는 바이탈 염료를 이용하여 자동화 96웰 검정법으로 수행될 수 있으나, CPE를 위한 96웰 플레이트의 시각적 조사가 1시간 미만의 실체험(hands-on) 시간을 요하며, 이는 대부분의 목적들에 있어 충분히 빠른 시간이다.
두 번째로, 형질감염한지 3 내지 4일 후, 실시예 3에 기재된 ELISA 방법을 이용하여 바이러스 생성을 검정할 수 있다. 대안적으로, 캡시드 특이적 항체와 함께 ELISA를 이용하여 입자 역가를 측정한다. 이 검정으로, 비생존성 작제물(바이러스 입자가 없음)을 확인할 수 있고, 작제물(소수 입자)을 불량하게 복제할 수 있으며, 작제물(다수 입자)을 효율적으로 복제할 수 있으며, 이들의 영향을 정량할 수 있다.
세 번째로, 더욱 정량적인 측정을 위해, 상기 결정된 동등량의 바이러스 입자를 일련의 프레쉬 96웰 플레이트에 접종하여, 증식 동역학 특성을 측정한다. 각종 시점들(감염한지 0, 2, 4, 6, 8, 12, 24, 48, 72시간 후)에서, 1개의 96웰 플레이트를 제거하여, 냉동-해동 사이클에 적용하여, 세포 결합 바이러스를 유리시킨다. 각 시점에서 각 작제물로부터 생성된 바이러스 입자의 수를 상기와 같은 ELISA에 의해 결정한다.
네 번째로, IU/P 비를 측정할 수 있다(실시예 3 참조).
고해상도 스캔
바이러스의 치명성은 예비 데이터가 가리키는 바와 같이, 캡시드 영역을 통해 퍼져 있는 많은 결손으로 인한 것인 경우, 키메라의 다수 또는 대부분이 병약하고, 단지 소수만이 비생존성이다. 이것이 사실인 경우, 보다 고도의 해상력을 갖는 스캔이 아마 필요하지 않을 것이다. 이와 역으로, (이하 기재된 바와 같이 본 분절의 강한 표현형에 기여하는 번역 틀이동 신호를 가질 수 있는, 1513 내지 2470의 분절에서의 코돈 역최적화 바이러스에서 가능한 바와 같은) 300개의 bp 분절들 중 하나 이상이 치사성을 유발하는 경우, 게놈 스캔을 고해상도로 반복하는데, 예를 들어 30 bp 창을 300 bp 분절 상에서 작제물들 간에 10 bp로 이동한 후, 표현형 분석을 행한다. 30 bp 스캔은 돌연변이체 바이러스의 PCR을 수반하지 않고; 그 대신, wt 바이러스의 경우 변경된 30 bp 분절을 PCR 프라이머 내에 들어가도록 설계한다. 이는 치사성의 원인이 되는 변화를 정확히 나타내도록 한다.
실시예 12
SAVE의 근거가 되는 분자 기전에 대한 진행 중의 연구
키메라의 선택
각각의 모 비생존성 바이러스(즉, 4 내지 8개의 총 바이러스)로부터 2 내지 4개의 예시 키메라를 하기 실험들에 사용한다. 돌연변이체 DNA의 비교적 작은 분절을 가지나 강한 표현형을 가지는 생존성 키메라를 선택한다. 예를 들어, 역최적화 코돈 바이러스로부터의 바이러스 PV-AB755-1513, PVAB2470-2954 및 PV-AB2954-3386(실시예 1 참조), 및 PV-Min755-2470 및 PV-Min2470-3386(실시예 7 참조)이 적당하다. 분석을 더욱 용이하게 만들 보다 작은 삽입물과 함께, 더욱 양호한 출발 키메라가 또한 상기 기재된 실험으로부터 수득될 수 있다(실시예 8).
RNA 풍부성/안정성
변경된 게놈 서열이 바이러스 RNA를 탈안정화하는 것도 생각해 볼 수 있다. 그러한 탈안정화는 신규 서열의 직접적 영향이거나, 번역 중 휴지 또는 번역 중 다른 결손의 간접적 영향일 수 있다(예를 들어, 문헌 [Doma and Parker, 2006] 참조). 그러므로, 돌연변이체 바이러스 RNA의 풍부성을 조사한다. 키메라 돌연변이체 바이러스 및 wt 바이러스로부터의 동등량의 RNA를 혼합하여, HeLa 세포 내로 형질감염시킨다. 2, 4, 8, 및 12시간 후에 샘플을 취하여, 수백개의 뉴클레오티드 차이가 있어 용이하게 구분가능한 2개의 상이한 바이러스 RNA에 대해 노던 블로팅 또는 정량적 PCR을 행함으로써 분석한다. PV-SD(wt 표현형을 가지는 코돈-셔플링된 바이러스) 대비, wt 바이러스 RNA로의 조절도 또한 행한다. wt 바이러스 RNA에 대한 돌연변이체의 감소된 비는, 키메라가 탈안정화된 RNA를 가진다는 것을 가리킨다.
시험관내 번역
번역은 코돈 역최적화 바이러스 및 이의 유도체들 중 일부에 있어서 감소되는 것으로 나타났다. 실시예 5를 참조한다. 코돈 쌍-역최적화 바이러스(PV-Min) 및 그것의 선택된 키메라를 이용하여, 시험관내 번역 실험을 반복한다. 역최적화 코돈 쌍이 바이러스 비생존성을 초래하는 이유에 대한 적절한 이론도 없고, 어떠한 증거도 매우 적기 때문에, 번역에 대한 영향에 관한 조사가 이의 기저를 이루는 기전을 조명하는데 도움이 될 수 있다.
실시예 5에서의 2종의 추출물에서 시험관내 번역을 수행하였다. 하나는 "숩업(souped up)" 추출물이었는데(문헌 [Molla et al., 1991]), 여기에서는 심지어 코돈 역최적화 바이러스도 명백히 양호한 번역을 제공하였다. 다른 하나는 정상적 생체내 조건에 더욱 근접한 추출물인데, 여기에서 역최적화-코돈 바이러스가 비효율적으로 번역되었다. 추출물들 간에는 4가지 차이가 있었는데: 이는, 더욱 "네이티브(native)"한 추출물을 투석하지 않았고; 내인성 세포 mRNA를 포도상구균 뉴클레아제로 파괴하지 않았으며; 추출물을 외인성 아미노산으로 보충하지 않았고; 추출물을 외인성 tRNA로 보충하지 않았다는 것이다. 본 연구에서, 이러한 4가지 파라미터들을 동시에(또는 필요에 따라서는 쌍으로) 변경하여, 무엇이 번역에 가장 유의적인 영향을 미치는지를 찾는다. 예를 들어, 코돈 역최적화 바이러스의 번역을 허용하는 것이 아미노산 및 tRNA의 첨가라는 발견사실은, 단순히 희소 아미노아실-tRNA이 제한적이기 때문에 번역이 비효율적이라는 가설을 강하게 지지한다. 그러한 발견사실은, 다른 종류의 바이러스들에까지 SAVE 방법을 확장시킨다는 관점으로 볼 때 중요하다.
번역 틀이동
또 다른 가능한 결손은, 코돈 변화가 번역 틀이동을 추진할 수 있다는 것; 즉 일부 코돈 쌍에서, 리보솜이 상이한 해독틀 내로 이동한 후, 의사적 펩티드 서열을 번역한 후에 인-프레임 정지 코돈에 도달할 수 있다는 것이다. 이 유형의 틀이동은 일부 바이러스에서 중요한 조절 이벤트이다. 현 데이터는, 잔기 1513 내지 2470로부터의 AB 돌연변이체 분절을 가지는 모든 PV 게놈이 비생존성이라는 것을 밝혀낸다. 또한, 이 돌연변이체 영역을 가지는 모든 게놈은 대략 42-44 kDa의 시험관내 번역 중에 신규 단백질 밴드를 생성시킨다(도 5A 참조, 별표로 표시됨). 이 신규 단백질은 틀이동의 결과일 수 있다.
1513-2470 간격의 서열 조사는, 진핵생물에서의 -1 틀이동에 대한 불안정한(slippery) 7량체성 일치 서열(X-XXY-YYZ)에 순응하는 3개의 가능한 후보 부위를 밝혀낸다(문헌 [Farabaugh, 1996]). 이 부위는 위치 1885 및 1948에서는 A-AAA-AAT이고, 위치 2119에서는 T-TTA-TTT이다. 그 후, 각기 1929, 1986 또는 2149에서 -1 프레임에 정지 코돈이 이어진다. 전자 2가지는 관찰된 크기의 밴드를 생성하기 위해 더욱 가능성있는 후보물질인 것으로 보인다.
틀이동이 일어나고 있는지의 여부를 결정하기 위해, 각각의 3개의 후보 영역은 분리하여 돌연변이되어, 틀이동을 위해 바람직하지 않게 된다. 또한, 각각의 후보 정지 코돈은 센스 코돈으로 분리하여 돌연변이된다. 이 6개의 새 점 돌연변이체를 시험관내 번역에 의해 시험한다. 틀이동 부위의 바람직하지 못한 서열로의 돌연변이 시, 신규 42-44 kDa 단백질의 손실, 및 정지 코돈의 제거 시의 단백질 밴드의 분자량 증가는, 틀이동이 일어나고 있음을 가리킨다. 틀이동이 이상 번역 산물의 원인인 경우, 틀이동 부위가 결핍된 새 돌연변이체의 생존성을 1513 내지 2470 돌연변이체 분절의 부문에서 시험한다. 명백히, 그러한 발견사실은 향후 게놈 설계를 위해 중요할 것이며, 필요하다면, 틀이동 필터가 잠재적 틀이동 부위를 피하기 위해 소프트웨어 알고리즘에 도입될 수 있다.
융합 단백질의 폴리솜 프로파일링, 토우프린팅, 및 루시퍼라제 검정법을 포함하나 이에 국한되지 않는 각종 기법들을 이용하여, 번역 결손의 보다 상세한 조사를 수행한다.
폴리솜 프로파일링
폴리솜 프로파일링은 한 전통적 번역 조사 방법이다. 그것은 고효율은 아니나, 매우 잘 개발되어 있고 이해되어져 있다. 폴리솜 프로파일링을 위해, (시클로헥시미드로) 번역을 정지시키고 자체의 개별 mRNA를 번역하는 작용 중에 있는 리보솜 집합("폴리솜")을 보존하는 방식으로, 세포 추출물을 제조한다. 이 폴리솜을 수크로스 구배로 분획화하고, 이로써 보다 다수의 리보솜이 결합된 메시지가 바닥쪽으로 침강한다. 구배의 분획화, 및 UV 흡수를 이용한 RNA 함량의 분석 후에, 연속되는 흡수 피크가 N+1 리보솜을 갖는 mRNA에 상응하는 폴리솜 프로파일이 나타나고; 전형적으로 피크가 흐려지기 전에, 10 내지 15개의 구분된 피크(단일 mRNA 상에서의 4OS 리보솜 서브유닛, 60S 서브유닛, 및 1, 2, 3, ... 12, 13 리보솜을 나타냄)가 식별될 수 있다. 이어서, 수크로스 구배로부터의 각종 분획들을 겔에 적용하여 막까지 블로팅하고, 특정 mRNA에 대해 노던 분석으로 분석한다. 이어서, 이는 그 특정 mRNA가 가령 10 내지 15개 리보솜(잘 번역됨), 또는 1 내지 4개 리보솜(불량하게 번역됨)과 일차적으로 결착되는지의 여부를 보여준다.
본 연구에서, 예를 들어 wt 바이러스, PV-AB(코돈 역최적화) 바이러스, 및 그것의 유도체 PV-AB755-1513, 및 PV-AB2954-3386(이들은 각기 일차적으로 N-말단 또는 C-말단 역최적화 분절을 가짐)을 비교한다. N-말단 및 C-말단 돌연변이체 분절 간의 비교는 특히 유의적이다. 코돈 역최적화가 번역을 감속시키거나 휴지시키면, N-말단 돌연변이체 RNA가 비교적 소수인 리보솜과 결합한다(이는 리보솜이 N-말단 영역을 통해 매우 천천히 이동하여 다른 리보솜이 로딩되는 것을 막고, 이어서 역최적화 영역을 횡단한 후, 메시지의 나머지를 통해 진전하기 때문임). 이와 대조적으로, C-말단 돌연변이체 RNA는 비교적 많은 수의 리보솜과 결합하는데, 이는 많은 리보솜들이 로딩할 수 있기 때문이나, 이들은 C-말단 부근에서 방해를 받기 때문에(hindered), 전사체를 이탈시킬 수 없고 결합된 리보솜의 수가 크다.
폴리솜 분석은, 얼마나 많은 리보솜들이 상이한 종류의 돌연변이체 RNA와 활발히 결합하는지를 나타내고, 예를 들어 번역이 저속으로 일어나는 모델과 리보솜이 실제로 RNA를 조기에 이탈시키는 모델을 구별할 수 있다. 다른 종의 모델들도 시험할 수 있다.
토우프린팅
토우프린팅은 리보솜이 느리고 휴지하는 mRNA 상의 위치를 확인하는 기법이다. 폴리솜 프로파일링에서와 같이, 활발히 번역하는 mRNA가 수득되고, 이때 이들의 리보솜은 시클로헥시미드로 고정되나 여전히 결합되어 있고; mRNA는 종종 시험관내 번역 반응으로부터 수득된다. mRNA의 일부 비교적 3'인 부분에 상보적인 DNA 올리고뉴클레오티드 프라이머를 사용한 후, 역전사효소에 의해 연장시킨다. 역전사효소는 그것이 리보솜과 충돌할 때까지 연장된다. 따라서, 번역 mRNA 분자의 집단은 프라이머의 부위에서 최근방 리보솜으로 연장하는 DNA 단편의 집단이다. 리보솜이 휴지하는 경향이 있는 부위 또는 영역(가령, 프라이머로부터의 200개 염기)이 있는 경우, 이 부위 또는 영역은 불균형 수의 DNA 단편들(이 경우, 200개 염기 길이의 단편)을 제공할 것이다. 이어서, 이는 고해상도 겔 상에서 "토우프린트"(밴드 또는 어두운 부위)로 나타난다. 이는 mRNA 상에서 (수개 뉴클로에티드 내로) 리보솜 휴지 부위를 매핑하기 위한 표준 방법이다.
역최적화 코돈 또는 코돈 쌍의 분절을 갖는 키메라로서, 상이한 키메라들에서 분절이 약간 5' 또는 3'로 이동하는 키메라를 분석한다. 역최적화 분절이 리보솜이 저속이거나 휴지되도록 유발하는 경우, 토우프린트는 5' 또는 3' 이동하여, 역최적화 분절의 위치에 매칭된다. 대조군에는 wt 바이러스 RNA 및 수가지 (무해하게) 셔플링된 바이러스 RNA가 포함된다. 대조군에는 또한 역전사 시에 신규 서열의 리보솜과 무관한 영향을 배제하기 위한 순수 돌연변이체 바이러스 RNA(즉, 번역에 결부되지 않음)가 포함된다.
토우프린트 검정법은 2가지 이상의 이점을 가진다. 첫 째로, 그것은 휴지 리보솜에 대한 직접적 증거를 제공할 수 있다. 두 번째로, 그것은 수개의 뉴클레오티드 분리를 행하여, 정확히 어떠한 역최적화 코돈 또는 역최적화 코돈 쌍이 휴지를 유발하고 있는지를 확인할 수 있다. 즉, 이는 역최적화 코돈 또는 코돈 쌍 중 소수만이 대부분의 그러한 효과에 원인이 될 수 있고, 토우프린팅이 그것을 나타낼 수 있다.
융합 단백질의 이중 루스퍼라제 리포터 검정법
상기 실험은, 일부 코돈 또는 코돈 쌍이 번역에 특히 유해하다는 것을 제시할 수 있다. 번역에 대한 특정 코돈 및 코돈 쌍의 영향을 분석하기 위한 고효율 방식으로서, 작은 시험 펩티드를 설계하여 바다팬지 루시퍼라제의 N-말단에 융합시킨다. 이어서, 루스퍼라제 활성을 펩티드의 번역능의 검정으로서 측정한다. 즉, N-말단 펩티드가 불량하게 번역되면, 적은 루시퍼라제가 생성될 것이다.
일련의 8개 25량체 펩티드를 상기 실험들에 기초하여 설계한다. 관심 희소 코돈 및/또는 희소 코돈 쌍의 각종 순열을 이용하여, 각각의 8개 25량체를 12가지 상이한 방식으로 코딩한다. 어셈블리 PCR을 이용하여, 이 96개 작제물(8개의 25량체×12 코딩)을, 상기 기재된 디시스트론성 이중 루시퍼라제 벡터에서 반딧불 루시퍼라제(F-luc)의 N-말단에 융합한다(실시예 5 및 도 6 참조). 이중 루시퍼라제 시스템은 반딧불 루시퍼라제(F-Luc) 및 바다팬지(레닐라) 루시퍼라제(R-Luc)를 모두 이용하고; 이는 상이한 생화학 조건 하에서 발광하고, 이에 따라 단일 관 또는 웰로부터 분리하여 검정될 수 있다. 디시스트론성 리포터는 단일 mRNA로 발현되나, 대조군 루시퍼라제(R-Luc)는 한 내부 리보솜 부착 부위(IRES)로부터 번역되는 한편, 실험 루시퍼라제(F-luc)(N-말단에 융합된 시험 펩티드를 가짐)는 그 자체의 IRES로부터 독립적으로 번역된다. 따라서, R-Luc 활성에 대한 F-Luc 활성의 비는 시험 펩티드의 번역능을 가리킨다. 도 6을 참조한다.
생성되는 96개의 디시스트론성 리포터 작제물을, PCR 반응으로부터 HEK293 또는 HeLa 세포의 96웰에 직접적으로 형질감염시킨다. 업스트림 시스트론의 반딧불 루시퍼라제는 내부 형질감염 대조군으로 작용한다. 두 번째 시스트론에서 바다팬지 루시퍼라제의 코돈- 또는 코돈 쌍 의존적 발현을, R-Luc와 F-Luc 간의 비로서 정확히 결정할 수 있다. 이 검정법은 본래 고효율이고, 필요에 따라서는 수백개 또는 심지어는 수천개 시험 서열을 검정할 수 있다.
실시예 13
신규한 대안적 코돈 기법을 이용한 약독화 바이러스의 설계 및 합성
백신 생성을 위해 바이러스를 재조작하기 위한 SAVE 방법은, 바이러스 단백질의 번역을 감소시키기 위해 대규모 동의 코돈 치환에 의존한다. 이는, 코돈 및 코돈 쌍 편향, 및 RNA 2차 구조 및 CpG 함량과 같은 다른 파라미터를 적절히 조절함으로써 수행될 수 있다. 4가지 신규 PV 설계들 중, 2가지(셔플링된 코돈 바이러스, PV-SD, 및 우선적 코돈 쌍 바이러스, PV-Max)는 wt 바이러스에 비해 적은 표현형 변화를 초래한다. 다른 2가지 신규 설계(PV-AB 및 PV-Min)는 2가지 상이한 기전(각각 코돈 편향 및 코돈 쌍 편향의 급격한 변화)을 통해 단지 동의 치환을 이용하여 바이러스를 사멸시키는 데 성공하였다. 불활성화된 바이러스 균주로부터의 영역을 wt에 서브클로닝함으로써, 살아있으나 약독화된 균주를 작제하였다.
대규모 동의 치환을 이용하는 바이러스 약독화의 기저 기전을 보다 잘 이해하면, 합성 바이러스의 표현형 및 발현 수준을 용이하게 예측할 수 있다. 진행 중인 연구는 번역 효율에 대한 총 변경 수 또는 변경 밀도의 영향; 코돈 및 코돈 쌍 편향의 상호작용; 및 게놈 내로 다수의 좁은 범위의 RNA 2차 구조를 조작하여 넣는 효과와 관련된 문제를 해소한다. wt와 불활성화된 균주 사이의 연속성이 있고, 임의의 요망되는 약독화 수준이 약화된 균주 내로 조작되어 들어갈 수 있음이 가능하다. 그러나, 임의의 감염이 자기지체되고 이에 따라 검출될 수 있도록 하는, 달성 가능한 약독화 수준에는 엄한 한계가 있을 수 있다. PV 단백질의 15442개 코딩은 탐색하고자 하는 큰 서열 공간을 구성하고, 이 서열 공간을 더욱 계통적으로 탐색하기 위해 각종 방법들이 이용되고 있다. 이 방법들에는 첫 번째로, 신규 약독화 바이러스의 설계를 돕는 소프트웨어 플랫폼을 개발하는 것, 및 두 번째로는 이 소프트웨어를 이용하여, 더 많은 서열 공간을 탐색하는 다수의 신규 바이러스를 설계한 후, 합성하고, 특성 분석하며. 어떻게 대안적 코딩이 약독화를 유발하는지에 대한 특정 질의에 답을 구하는 것이 포함된다. 부가적으로, 고려해야 할 중요 관건은, 동의 코돈의 명백히 유해한 셔플링에 의해 위험한 바이러스가 우연히 발생될 수 있는지의 여부이다.
바이러스 게놈의 컴퓨터 기반 설계를 위한 소프트웨어의 개발 및 데이터 분석
합성 바이러스의 설계는 (1) 코돈 및 코돈 쌍 사용빈도를 최적화하고, 서열 특이적 서열을 보존, 삽입 또는 제거하면서 RNA 2차 구조를 모니터링하는 것, 또한 (2) 서열을 올리고뉴클레오티드 내로 분획화하여, 정확한 서열 어셈블리를 확보하는 것을 목적으로 하는 실질적 소프트웨어 지지를 필요로 한다. 원형 합성 게놈 설계 소프트웨어 툴은 합성 게놈 설계를 위해 전체 환경으로 확장되고 있다. 이 확장된 소프트웨어에서, 유전자 에디터가 서열 대신에 제약 주위에 구성되는 것으로 생각해 볼 수 있다. 유전자 설계자는 요망되는 유전자(예를 들어, 아미노산 서열, 코돈/코돈 쌍 분포, 제한효소 부위의 분포, 및 RNA 2차 구조 제약)의 특성을 구체화하는 수준으로 작업하고, 유전자 에디터는 이 제약을 실현하는 DNA를 알고리즘 방식으로 설계한다. 아미노산 서열, 코돈 편향, 코돈 쌍 편향, CG 디뉴클레오티드 함량, RNA 2차 구조, 시스 작용성 핵산 신호, 예컨대 CRE, 스플라이스 부위, 폴리아데닐화 부위, 및 제한효소 효소 인식 부위를 포함하나 이에 국한되지 않는, 종종 서로 상호작용하는, 많은 제약들이 있다. 유전자 설계자는 이 제약들의 존재를 인식하고, 모든 제약을 예비구체화 수준으로 자동적으로 만족하면서 요망되는 특성을 갖는 유전자를 설계한다.
패턴, 2차 구조, 중첩 코딩 틀을 삽입/제거하고, 코돈/코돈 쌍 분포에 부착하기 위해 이전에 개발된 합성 알고리즘이 에디터의 일부로 실행되나, 더욱 중요한 것은 그러한 우선사항들의 이종적 조합을 실현하는 알고리즘이다. 그러한 조합이 연산적으로 처치곤란한(NP-완전) 문제를 초래하기 때문에, 발견법적인 최적화가 필수적으로 에디터에서 중요한 역할을 한다. 그러한 설계를 실현하기 위해 모의 어닐링 기법이 이용되고; 이는 모의 어닐링이 초기 VLSI 설계 툴에서 최초로 실용화를 달성한 바, 특히 적절하다.
통합 특성(full-featured) 유전자 설계 프로그래핑 환경은, 리눅스(Linux), 윈도우(Windows) 및 맥(Mac) OS에서 수행 시, 플랫폼에 의존하지 않는다. 시스템은 세균 또는 진균류(효모) 규모에서 게놈과 함께 작용하도록 설계되고, 이하 기재되는 신규 약독화 바이러스 설계의 합성 및 평가를 통해 입증된다.
1개 또는 수개의 아미노산에서의 극한 코돈 편향을 갖는 바이러스 설계
생백신의 경우, 바이러스는 불활성화가 부족하여, 가능한 한 쇠약화되어야 하고, 이 경우에 바이러스를 증식시키고 제조할 방법이 없다. 최적의 쇠약화를 달성하는 한 방식은, 단지 1개 또는 수개의 아미노산의 치환을 조작하는 것과, 상기 희소 코돈에 결합하는 희소 tRNA를 과다발현하는 상응 세포주를 발생시키는 것이다. 이에, 바이러스는 특수 침해성(permissive) 세포주에서 효율적으로 증식할 수 있으나, 정상 숙주 세포주에서는 비생존성이다. 바이러스는 침해성 세포주를 이용하여 증식시키고 제조되는데, 이는 매우 편리할 뿐만 아니라 약독화 생백신의 제조를 위해 현재 사용되는 방법보다 더 안전하다.
인간 게놈을 시퀀싱하면서, 희소 코돈을 해독하는 각종 tRNA 유전자의 카피수에 관한 정보가 입수가능하다. 문헌(예를 들어, 문헌 [Lavner and Kotlar, 2005])에 기초하여, 본 목적을 위해 최량인 희소 코돈은 단지 2 카피의 동족 tRNA 유전자를 가지는 극희소 코돈인 CTA(Leu); 4 카피의 동족 tRNA 유전자를 가지는 희소 코돈인 TCG(Ser); 및 4 카피의 동족 tRNA 유전자를 가지는 희소 코돈인 CCG(Pro)이다(문헌 [Lavner and Kotlar, 2005]). 특정 유형의 tRNA 유전자의 평균 카피 수는 9이고, 한편 범위는 2 내지 33개 카피이다(문헌 [Lavner and Kotlar, 2005]). 따라서, CTA 코돈은 단지 희소 코돈이 아니고, 이는 또한 가장 적은 수의 동족 tRNA 유전자를 갖는 그러한 코돈이다. 이 코돈은 어떠한 다른 tRNA에 의해서도 해독되지 않고; 예를 들어, 이는 워블 염기 쌍형성을 통해 해독되지 않는다.
Leu(180개 코돈), Ser(153개 코돈), 및 Pro(119개 코돈)을 코딩하는 바이러스 게놈 전반에 걸친 모든 코돈을 각기 희소 동의 코돈 CTA, TCG, 또는 CCG로 바꿀 경우, 심하게 쇠약화되거나 심지어 비생존성인 바이러스가 생성될 것으로 예상된다. 이어서, 상응하는 희소 tRNA를 과다발현하는 헬퍼 세포가 생성될 수 있다. 상응하는 바이러스는 이 인공 배양 시스템에서만 증식하는 것에 절대적으로 의존하고, 이에 백신 생성을 위한 바이러스를 생성함에 있어 최고의 안전성을 제공한다.
4가지 고우선순위(high-priority) 바이러스가 설계되고 합성되는데, 단일 바이러스에서, 모든 Leu 코돈은 CTA로 바뀌고; 모든 Ser 코돈은 TCG로 바뀌며; 모든 Pro 코돈은 CCG로 바뀌고; 모든 Leu, Ser 및 Pro 코돈은 각기 CTA, TCG 및 CCG로 바뀐다. 한 실시양태에서, 이 치환들은 바이러스의 캡시드 영역에서만 이루어지고, 이때 높은 번역 속도가 가장 중요하다. 또 다른 실시양태에서, 치환은 바이러스 전반에 걸쳐 이루어진다.
CG 디뉴클레오티드 편향 바이러스
예외가 거의 없이, 바이러스 게놈은 디뉴클레오티드 CpG를 과소표시하나, GpC에 대해서는 그러하지 않다(문헌 [Karlin et al., 1994]). 이 현상은 게놈의 전체 G+C 함량과 무관하다. CpG는 통상 인간 게놈에서 메틸화되어, 세균 및 DNA 바이러스에 종종 존재하는, 비메틸화 CpG 디뉴클레오티드를 포함하는 단일 가닥의 DNA는 톨(Toll)유사 수용체 9에 의해 병원체 기호로 인식되게 된다. 이는 선천적 면역계의 활성화를 초래한다. 유사한 시스템이 RNA 바이러스에 대해 작용하는 것으로 나타나지 않았으나, PV 게놈의 조사는, PV가 인간에서의 CpG 디뉴클레오티드의 유의적 과소표시보다 더욱 더 큰 정도로 CpG를 함유하는 동의 코돈에 대항하여 선택하였음을 제시한다. 이는 특히 아르기닌 코돈에 대해 현저하다. 6개의 동의 Arg 코돈들 중, 4개의 CG 함유 코돈(CGA, CGC CGG, CCU)이 모든 96 Arg 코돈들 중 단지 24개에만 해당되고, 한편 나머지 2가지(AGA, AGG)는 72개에 해당된다. 이는 65개의 CG 함유 코돈 및 31개의 AGA/AGO 코돈을 예측하는 평균 인간 코돈 사용빈도와 대조적이다. 실제로, PV에서 과소표시되는 코돈 중 2개가 인간 세포에 빈번하게 사용된다(CGC, CGG). CG가 PV에서 불리한 디뉴클레오티드일 수 있음을 나타내는 2가지 다른 암시도 있다. 첫 번째로, 코돈 쌍-역최적화 바이러스에서, 도입된 희소 코돈 쌍들 중 상당수가 코돈 쌍 헥사머의 중심 디뉴클레오티드로서 CG를 포함한다. 두 번째로, [Burns et al. (2006)]가 그들의 코돈 편향-역최적화 바이러스를 계대배양하고 게놈을 시퀀싱했을 때, 이 바이러스들이 일부 CG 디뉴클레오티드를 제거하도록 진화하였다는 것이 관찰되었다.
따라서, 한 고순위 재설계된 바이러스에서, 대부분 또는 모든 Arg 코돈들이 CGC 또는 CGG(2개의 빈번한 인간 코돈)로 바뀌었다. 이는 번역에 부정적 영향을 주지 않고, 바이러스 증식에 대한 CpG 디뉴클레오티드 편향의 영향을 평가할 수 있도록 한다. 생성되는 바이러스의 증가된 C+G 함량은 2차 구조의 주의깊은 모니터링을 요하는데; 즉, Arg 코돈의 변화가 현저한 2차 구조의 생성을 허용하지 않는다.
코돈 편향 및 코돈 쌍 편향의 동시 조절.
코돈 편향 및 코돈 쌍 편향은 번역 수준에서 서로 상호작용할 수 있을 것으로 생각해 볼 수 있다. 이 상호작용을 이해하면, 가능히 극한 범위에 걸쳐, 임의의 주어진 단백질의 번역능을 예측 가능하게 조절할 수 있을 것이다.
본 발명자들이 야생형 소아마비 코돈 편향 및 코돈 쌍 편향을 0으로 나타내고, 가장 좋지 않은 가능한 코돈 편향 및 코돈 쌍 편향을 -1로 나타낼 경우, 4개의 고순위 바이러스는 (-0.3, -0.3), (-0.3, -0.6), (-0.6, -0.3), 및 (-0.6, -0.6) 바이러스이다. 이 바이러스들은 어떻게 보통으로 불량하거나 매우 불량한 코돈 편향이 보통으로 불량하거나 매우 불량한 코돈 쌍 바이러스와 상호작용하는지를 보여줄 것이다. 이 바이러스는 야생형 및 극한 PV-AB(-1, 0) 및 PV-Min(0, -1) 설계와 비교된다.
RNA 2차 구조의 조절
상기 합성 설계는 과다 2차 구조로부터 보호한다. 2가지 부가적 설계는 2차 구조를 계통적으로 막는다. 이 바이러스들은, (1) 입증가능하게 최소인 2차 구조, 및 (2) 번역을 감속시키는 데 충분한 많은 작은 2차 구조를 갖는 wt 코돈 및 코돈 쌍 편향을 가지도록 조작된다.
부가적 바이러스 설계
부가적 바이러스 설계에는 완전-게놈 코돈 편향 및 코돈 쌍 편향 설계; 비CG 코돈 쌍 편향 설계; 감소된 밀도 희소 코돈 설계; 및 캡시드 영역에 걸쳐 퍼져있거나 캡시드의 N-말단에 군집화되거나 캡시드의 C-말단에 군집화된 약 150개 희소 코돈을 갖는 바이러스가 포함된다.
실시예 14
독성이 증가된 바이러스를 우연히 생성할 수 있는 가능성에 대한 시험
이 바이러스를 약독화할 목적으로 바이러스 게놈을 재설계하는 것이 우연히 바이러스를 wt 바이러스보다 더 독성으로 만들 수 있음이 이론적으로 가능하다. 단백질 서열이 SAVE 절차에서 변경되지 않기 때문에, 이러한 성과는 있음직하지 않다. 그럼에도 불구하고, SAVE 방법이 포지티브하다는 것을 실험적으로 입증하는 것이 바람직하다.
PV 단백질을 가능히 코딩할 수 있는 가능한 10442개 서열들 중, 일부 합당히 적합한 양태의 PV는 과거에는 일부 지점에서 발생하여, 국부 최적점(전역 최적점과 반대됨)까지 진화되었다. 동일한 단백질 코딩 용량을 가지나 매우 상이한 코돈 집합을 가지는 새 양태의 PV를 생성시킴은, 상기 새 바이러스를 wt PV와 상이한 국부 최적점에 근접한 것으로 생각해 볼 수 있는, 전역 적응도 범위 상에의 상이한 위치에 둔다. 구상가능하게는, 이 새 국부 최적점은 야생형 국부 최적점보다 양호할 수 있다. 따라서, 동의 코돈의 셔플링이 보다 적합한 바이러스를 발생시킬 수 있음은 거의 가능하지 않다.
이 가능성을 조사하기 위해, 13개 PV 게놈을 재설계하고 합성하였는데: 한 바이러스는 최량의 가능한 코돈 편향을 가지고; 한 바이러스는 최량의 가능한 코돈 쌍 편향을 가지며(즉, PV-Max); 한 바이러스는 최량의 가능한 코돈 및 코돈 쌍 편향을 가지고; 10개의 부가적 바이러스는 wt 코돈 및 코돈 쌍 편향을 가지나 셔플링된 동의 코돈을 가지는 것이다. 2차 구조, C+G 함량, 및 CG 디뉴클레오티드 함량과 같은 다른 파라미터들이 가능한 wt 수준에 근접하게 유지된다.
이 13개 바이러스는 각기 서로에 비해, 또한 야생형에 비해, 전역 적응도 범위의 매우 상이한 위치에 있을 수 있다. 그러나, 이들 중 어느 것도 선택을 받지 않았으므로 국부 최적점에 있지 않다. 13개 바이러스 및 wt를 계대배양하고, 샘플 바이러스를 1, 10, 20, 및 50번째 계대배양에서 취한다. 이들의 적응도를, 플라크 크기, 1단계 증식 곡선에서의 플라크-형성 단위/ml, 및 세포당 형성되는 입자 수를 평가함으로써, 서로 간에 또한 wt와 비교한다. 실시예 1을 참조한다. 각각의 13개 바이러스 중 5개의 예를 10, 20 및 50 계대배양 후에 시퀀싱한다. 선택 계대배양 단리주를 CD155tg 마우스에서 병원성에 대해 시험하고, LD50을 결정한다. 이 검정법은, 바이러스 중 임의의 것이 wt보다 적합한지의 여부를 밝혀내고, 특히 독성인 바이러스가 우연히 생성되는 위험을 정량적으로 측정하도록 한다. wt 수준의 코돈 및 코돈 쌍 편향을 가지는 10개 바이러스가 또한 코딩 수준에서의 적응도 범위의 가변성에 대한 정보를 제공한다.
보다 적합한 바이러스가 출현할 수 있는 가능성 및 보다 적합한 바이러스가 더 위험한 바이러스가 될 수 있는 가능성의 측면에서, 상기 실험들을 BSL3 실험실에서 행한다. 10번째 계대배양 후, 표현형 및 서열을 평가하고, 출현 바이러스가 PV 특이적 항체에 의해 중화되는 것에 대한 감수성을 입증한다. 실험을 중단하고, 유의적으로 보다 적합한 바이러스로의 진화를 가리키거나 항체 중화를 회피하는 새 단백질 서열로의 계통적 진화를 나타내는 임의의 증가가 수득되는지의 여부를 다시 고려한다. 계대배양 20 후, 계대배양 50로 진행하기 전에, 표현형 및 서열을 유사하게 평가한다. wt 바이러스와 정확히 동일한 단백질을 코딩하는 합성 바이러스가 생성되기 때문에, (약간) 증가된 적합도로의 진화가 관찰되지라도, 증가된 독성에 대한 범주가 매우 제한적인 것으로 보인다.
실시예 15
폴리오바이러스 이외의 바이러스 시스템으로의 SAVE 방법의 확장
소아마비 근절을 위한 세계적 노력의 마지막 단계에서 복귀 가능성을 막기 위한 새 소아마비 백신에 대한 가능한 필요성에도 불구하고, PV는 SAVE를 개발하기 위한 모델 시스템으로서 일차적으로 본 연구에서 선택되었다. 그러나, SAVE는, 이 방법이 백신이 필요한 다른 바이러스에까지 확장될 수 있다는 기대로 개발되었다. 이러한 SAVE 기법의 확장은 본원에서 리노바이러스, 일반 감기의 원인 작용제, 및 인플루엔자 바이러스로의 적용에 의해 예시된다.
폴리오바이러스와 밀접한 관련이 있는 바이러스인 인간 리노바이러스에 대한 SAVE의 적응화
수가지 이유에서 SAVE 방법을 시험하기 위해, 2개의 모델 리노바이러스인 HRV2 및 HRV14를 선택하였는데: 즉, 그 이유들은 (1) HRV2 및 HRV14는 2개의 상이한 유전적 하위군 A 및 B의 2개의 구성원을 나타내고(문헌 [Ledford et al., 2004]); (2) 이 2개의 모델 바이러스는 상이한 수용체인 LDL-수용체 및 ICAM-1을 각기 사용하며(문헌 [Greve et al., 1989]; 문헌 [Hofer et al., 1994]); 양 바이러스 모두 및 이들의 감염성 cDNA 클론을 광위적으로 사용하였고, 대부분의 적용 가능한 재료 및 방법이 확립되었으며(문헌 [Altmeyer et al., 1991]; 문헌 [Gerber et al., 2001]); (4) 리노바이러스의 상당한 이용 가능한 분자 정보가 이 두 혈청형의 연구로부터 비롯된다는 것이다.
PV 실험을 통해 개발된 가장 유망한 SAVE 기법을 HRV2 및 HRV14의 게놈에 적용한다. 예를 들어, 코돈, 코돈 쌍, 2차 구조 또는 이들의 조합이 역최적화된다. 각 유전형에 대해, 다양한 약독화 정도를 가지는 3개의 게놈들 중 2개를 합성한다. 약 60개 뉴클레오티드의 결정적 RNA 2차 구조인 CRE를 변경시키지 않도록 주의한다(문헌 [Gerber et al., 2001]; 문헌 [Goodfellow et al., 2000]; 문헌 [McKnight, 2003]). 이 요소는 피코나바이러스의 복제에 대해 중요하고, 이에 따라 그 구조 자체가 게놈 재설계 시에 유지되어야 한다. 게놈 내의 CRE의 위치는 상이한 피코나바이러스별로 다양하나, 대부분의 패밀리에 대해 알려져 있으며(문헌 [Gerber et al., 2001]; 문헌 [Goodfellow et al., 2000]; 문헌 [McKnight, 2003]), 실험적 증가가 결여되어 있는 다른 것들에 대한 상동성 모델링에 의해 추론될 수 있다. HRV2의 경우, CRE는 비구조 단백질 2Apro에 상응하는 RNA 서열 내에 위치하고; HRV14의 CRE는 VP1 캡시드 단백질 영역 내에 위치한다(문헌 [Gerber et al., 2001]; 문헌 [McKnight, 2003]).
DNA 게놈 등가물로부터 리노바이러스를 유도하기 위한 역유전학 시스템은 PV에 대해 사기 기재된 바와 본질적으로 동일하나, 단 예외적으로 바이러스 캡시드를 안정화하기 위해, 형질감염을 3 mM Mg++ 함유 헤페스 완충액 배지 중 34℃에서 HeLa-H1 세포에서 행한다. 생성되는 합성 바이러스를 조직 매질에서 검정하여, PFU/IU 비를 결정한다. 실시예 3를 참조한다. 플라크 크기 및 1단계 증식 곡선에서의 동역학 특성도 또한 상기 기재된 바대로 검정한다. 실시예 2를 참조한다. SAVE 과정이 모든 100개 또는 이와 관련된 리노바이러스에 비교적 저렴하게 적용될 수 있으므로, 이 방법을 이용하여 일반 감기를 위한 안전하고 효과적인 백신을 생성할 수 있을 것이다.
폴리오바이러스와 관련이 없는 바이러스인 인플루엔자 A 바이러스에 대한 SAVE의 적응화
PV 실험으로부터 확인된 가장 유망한 SAVE 설계 기준을 사용하여, 코돈 역최적화 양태의 인플루엔자 바이러스를 합성한다. 인플루엔자 바이러스는 8개의 분리된 RNA 분절들로 구성된 "분절화된" 바이러스이고; 이들 각각은 코돈 변형될 수 있다. 잘 확립된 앰비센스 플라스미드 역유전학 시스템을 사용하여, 인플루엔자 바이러스 균주 A/PR/8/34의 변이체를 생성시킨다. 이 8-플라스미드 시스템은 이전에 기재된 것의 변화이고(문헌 [Hoffmann et al., 2000]), [박사 P. Palese] 및 [박사 A. Garcia-S astre]에 의해 친절히 제공되었다. 간략히 말해, 분리된 플라스미드 내에 각기 함유된, 인플루엔자의 8개 게놈 분절은 안티센스 가닥에서는 3' 말단에 PoL I 프로모터가 접해 있고, 5' 말단에서는 Pol I 종결서열이 접해 있다. 이 카세트는 다시 전방 가닥에서는 5' 말단에 사이토메갈로바이러스 프로모터(Pol II 프로모터)가 접해 있고, 3' 말단에 폴리아데닐화 신호가 접해 있다(문헌 [Hoffmann et al., 2000]). 동시 배양된 293T 및 MDCK 세포 내로의 동시 형질감염 시에, 각 앰비센스 발현 카세트는 2 종류의 RNA 분자를 생성시킨다. 전방 가닥에서의 Pol II 전사 단위는, 바이러스 단백질의 단백질 합성에 필수적인 모든 인플루엔자 mRNA를 생성시킨다. 역방 가닥에서의 Pol I 전사 단위는 리보뉴클레오단백질 복합체의 어셈블리 및 이입에 필수적인 (-) 센스 게놈 RNA 분절을 생성시킨다. 따라서, 감염성 인플루엔자 A/PR/8/34 입자가 형성된다(도 10). H1N1 혈청형의 이 특정 균주는 인간에 대해 상대적으로 양성이다. 그것은 조직 배양 세포에서의 증식을 위해 적응되었고, 이는 BALB/c 마우스 내에서 병원성이므로, 병인 연구에 특히 유용하다.
택일적으로 스플라이싱되는 분절(NS 및 M)을 합성할 때, 스플라이스 부위 및 대체 해독틀을 파괴하지 않도록 주의한다. 모든 경우들에 있어서, 이 서열들이 RNA 복제 및 바이러스 어셈블리를 위한 신호를 포함하는 것으로 알려져 있는 바, 각 분절의 어느 한 말단에 있는 말단 120 nt는 제외한다. 적어도 두 양태의 각 단편을 합성한다(보통 및 최대 역최적화). 단지 하나의 분절만이 변형된 바이러스가 생성되고, 더욱 변형된 분절이 필요에 따라 도입된다. 이는, 각 분절이 분리된 플라스미드 상에 있기 때문에, 본 시스템에서 용이하다.
바이러스 감염력은 1 ㎍/ml(TPCK)-트립신의 존재 하에 MDCK 세포 상에서 플라크 검정법에 의해 역가 측정된다. 대안적으로, 상이한 바이러스 작제물의 수에 따라, 96웰 ELISA를 사용하여, 본질적으로 PV에 대해 상기 기재된 바와 같이, MDCK 세포 상의 세포 감염성 단위로서 각종 바이러스의 역가를 측정한다. 실시예 3을 참조한다. 유일한 차이는, 이제 HA 특이적 항체가 감염된 세포를 염색하는 데 사용된다는 것이다. 부가적으로, 표준 프로토콜(문헌 [Kendal et al., 1982])을 이용하여, 닭 적혈 세포(RBC)를 이용하는 응집(hemagglutination; HA) 검정법을 통해 비리온의 상대 농도를 측정한다(문헌 [Charles River Laboratories]). 간략히 말해, 바이러스 현탁액을 V-바닥 96웰 플레이트에서 PBS 중에 2배 일련 희석한다. PBS 단독을 검정 대조군으로 사용한다. 표준화된 양의 RBC를 각 웰에 첨가하고, 플레이트를 간략히 교반하며, 실온에서 30분 동안 인큐베이션한다. HA 역가를, 완전 응집과 함께 마지막 웰에서의 바이러스의 상호 희석으로 해독한다. HA 역가 존재하는 입자의 양의 직접적 결과인 반면, PFU 역가는 감염력의 기능적 측정값이다. 양 측정값을 결정함으로써, PV 실험에 기재된 PFU/입자 비와 유사하게, 상대적 PFU/HA 단위 비를 계산한다. 실시예 3을 참조한다. 이는, 코돈- 및 코돈 쌍-역최적화 인플루엔자 바이러스가 또한 PV에 대해 관찰되는 바와 같이, 더 낮은 PFU/입자를 나타내는지의 여부에 관한 질의를 해결한다.
독성 시험
먼저 마우스에 대해 모 NPR/8/34 바이러스의 치사 용량 50(LD50)을 결정하고, 비강내 감염에 의한 BALB/c 마우스의 감염을 위해 합성 인플루엔자 바이러스를 선택한다. LD50 값을 결정하는 방법은 당업자에게 공지되어 있다(문헌 [Reed and Muench, 1938], 및 실시예 4 참조). 이상적 후보 바이러스는 높은 비리온 농도(고HA 역가)와 함께 낮은 감염력(저 PFU 역가)를 나타낸다. 마취된 마우스에 102 내지 107 PFU의 바이러스의 10배 일련 희석액을 함유하는, PBS 중 25 ㎕의 바이러스 용액을 콧구멍으로 투여한다. 치사율 및 질병율(체중 감소, 감소된 활성)을 3주 이하 동안 매일 2회 모니터링한다. 문헌 [Reed and Muench (1938)]의 방법에 의해 LD50를 계산한다. A/PR/8/34 wt 바이러스에 대해, 예상 LD50는 약 10 PFU이나(문헌 [Talon et al., 2000]), 바이러스의 역가를 측정하는 특정 실험실 조건에 따라 다양할 수 있다.
뎅기열, HIV, 로타바이러스 및 SARS에 대한 SAVE의 적응화
SAVE 방법을 추가로 시험하기 위해, 수개의 바이러스를 선택하였다. 표 8은 각각의 뎅기열, HIV, 로타바이러스(2개 분절) 및 SARS의 코딩 영역을 규명하고, 모 바이러스에 대한 뉴클레오티드 서열 및 역최적화 코돈 쌍 편향을 갖는 예시적 바이러스 게놈 서열을 제공한다. 상기 기재된 바와 같이, 단지 일부분(부분서열)만이 역최적화 돌연변이를 포함할 수 있을지라도, 코딩 서열에 대해 코돈 쌍 편향을 결정한다.
Figure 112009066775576-pct00019
* - CPB는 완전 코딩 서열보다 작은 내부 분절을 역최적화함으로써 감소될 수 있다. 그럼에도 불구하고, 완전 CDS에 대해 CPB를 계산한다.
실시예 16
마우스에서의 폴리오바이러스 및 인플루엔자 바이러스 백신 후보물질의 평가
소아마비 또는 인플루엔자에 대해 마우스를 백신접종하는 역최적화 바이러스의 능력을 시험한다.
폴리오바이러스 면역화, 항체 역가, 및 wt 공격접종 실험
작용 가설은, 양호한 백신 후보물질이 낮은 감염력 역가를 높은 비리온 역가와 조합한다는 것이다. 이는, 많은 양의 바이러스 입자(즉, 항원)가 낮은 위험 프로파일을 동시에 가지면서 주입될 수 있음을 확실히 한다. 따라서, 5마리의 CD155tg 마우스로 된 군에, 103, 104, 105, 및 106 PFU의 PV(마호니)(즉, 야생형), PV1 세이빈 백신 균주, PVAB2470-2954, PV-Min755-2470, 또는 본 연구 중에 개발된 다른 유망한 약독화 폴리오바이러스를 복강내 주사할 것이다 야생형의 경우, 1 PFU는 약 100개 바이러스 입자인 반면, 약독화 바이러스의 경우에는 1 PFU가 대략 5,000 내지 100,000개 입자이다. 따라서, 동등수의 PFU의 주사란, 50 내지 1000배 더 많은 입자의 약독화 바이러스를 주사하고 있음을 의미한다. 복강내 주사하는 wt 바이러스의 경우, LD50는 약 106 PFU, 또는 약 108개 입자이다. 따라서, 최고 용량에서 일부 사멸이 예상되나, 보다 낮은 용량에서는 그러하지 않다.
동일한 용량의 추가투여 접종(booster shots)을 1주일 후 및 초기 접종한지 4주 후에 주입한다. 두 번째 추가투여로부터 1주일 후, PV 중화 항체 역가를 플라크 감소 검정법에 의해 측정한다. 이 목적을 위해, 100 PFU의 wt PV(M) 바이러스를 면역화된 마우스로부터의 혈청의 2배 일련 희석액과 함께 인큐베이션한다. PFU의 잔류 수를 플라크 검정법에 의해 결정한다. 중화 항체 역가는 플라크가 관찰되지 않는 최저 혈청 희석액의 역수로 표시된다.
마지막 추가투여로부터 4주 후, 면역화된 마우스 및 면역화되지 않은 대조군을 치사 용량의 PV(M) wt 바이러스(106 PFU)로 복강내 공격접종하고; 이는 LD50의 100배이고, 생존율을 모니터링한다.
인플루엔자 면역화, 항체 역가 , 및 wt 공격접종 실험
백신접종 실험에 대해, 5마리의 BALB/c 마우스로 된 군에 wt 및 약독화 인플루엔자 바이러스를 0.001, 0.01, 0.1, 및 1.0 LD50의 용량으로 복강내 주사한다. 추가투여 백신접종을 PV에 대해 상기 기재된 바와 동일한 간격으로 주입한다. 두 번째 추가투여로부터 1주일 후의 인플루엔자 항체 역가를, 표준 프로토콜에 따라 응집(HI) 억제 검정법에 의해 결정한다(문헌 [Kendal et al., 1982]). 간략히 말해, 수용체 파괴 효소(RDE; 시그마(Sigma), 미국 미주리주 세인트루이스 소재)로 처리한 면역화 마우스 및 대조군 마우스로부터의 혈청을 2배 일련 희석하고, V-바닥 웰에서 5 HA 단위의 A/PR/8/34 바이러스와 혼합한다. 이어서, RBC를 첨가하고, 플레이트를 표준 HA 검정법에 대해 상기 기재한 바대로 가공한다. 항체 역가는 응집의 완전 억제를 초래하는 희석율의 역수로 표시된다.
마지막 추가투여 백신접종으로부터 3주 후, 마우스를 100 또는 1000 LD50의 A/PR/8/34 모 바이러스(대략 105 및 106 PFU)로 비강내 공격접종하고, 생존율을 모니터링한다.
동물 취급
인간 폴리오바이러스 수용체 CD155를 발현하는 유전자도입 마우스(CD155tg)를, 동경대 [박사 Nomoto]로부터 입수하였다. CD155tg 마우스 콜로니를 뉴욕주립대학(SUNY) 동물 시설에 의해 관라한다. BALB/c 마우스를 타코닉(Taconic)(미국 뉴욕주 저먼타운 소재)으로부터 입수한다. 마취된 마우스에 정맥내, 복강내 또는 뇌내 경로에 의해 25 게이지 피하 주사침을 이용하여 30 ㎕의 바이러스 현탁액을, 또는 비강내 경로에 의해서는 50 ㎕를 접종한다. 양 성별의 6 내지 24주령 마우스를 사용한다. 마우스가 폴리오바이러스 및 인플루엔자 바이러스 연구를 위한 가장 경제적인 모델 시스템이다. 부가적으로, PV의 경우, CD155tg 마우스주가 비인간 영장류를 제외한 유일한 동물 모델이다. 마우스는 또한, 바이러스가 폴리오바이러스 및 인플루엔자 바이러스 모두에 대해 동물들 사이에 일어나지 않기 때문에 가장 안전한 동물 모델이다.
모든 마우스들을 실험실 동물 연구부(DLAR) 및 이의 수의학 직원들의 발기 하에 아트 동물 시설의 SUNY 부서에 사육한다. 모든 동물들을 수의학 직원들에 의해 매주 2회 체크한다. 바이러스 감염 동물을 연구원에 의해 매주 2회 체크하고, 수의학 직원에 의해 매일 체크한다. 모든 감염 실험들을 동물 시설 내 특수 설계된 최대 격리실에서 수행한다. 실험을 마친 후, 생존 마우스를 마취하고, 시체는 고압살균에 의해 무균화한다. 어떤 마우스도 바이러스실에 살아남지 않게 된다.
본 연구에서, 정맥내, 뇌내, 복강내, 근육내 또는 비강내 접종, 마취제 주사, 및 혈액 샘플 수집을 제외한 어떠한 외과술 절차도 마우스에 행하지 않는다. 백신접종 실험을 위해, 혈액 샘플을 바이러스 특이적 항체의 검출을 위해 백신접종 전 및 후에 취한다. 이러한 취지에서, 50 내지 100 ㎕를 주사 전날, 및 두 번째 추가투여 백신접종으로부터 1주 후에 마우스로부터 수집한다. 개별 동물에서의 최대 2개 혈액 샘플을 적어도 4주 간격을 두고 수집한다. 동물을 마취하고, 날카로운 외과용 메스(scalpel)를 사용하여 꼬리의 2 mm를 절개해낸다. 혈액을 모세관으로 수집한다. 꼬리에 있는 딱지를 제거함으로써, 후속 샘플링을 수득한다. 꼬리가 치유되면, 꼬리의 새 2 mm 절개를 반복한다.
모든 동물 실험들을, SUNY 실험동물사용관리위원회(Institutional Animal Care and Use Committee)(IACUC)에 의해 승인된 프로토콜에 따라 수행한다. 미수의학협회(American Veterinary Medical Association)의 권장사항에 따라 CO2 기체실에서 훈련된 인원에 의해 안락사를 수행한다. 미질병통제예방센터(Centers for Disease Control 및 Prevention)(CDC)에 의해 발행된 최신 ABSL 2/소아마비 권장사항 하에 감염 실험을 수행한다.
실시예 17
코돈 쌍 편향 알고리즘 - 코돈 쌍 편향 및 스코어 매트릭스
대부분의 생물체에서, 아미노산의 우선성이 종종 다른 것들에 비해 특정 코돈에 의해 코딩된다는 것을 설명하는, 구분된 코돈 편향이 존재한다. 코돈 편향이 단백질 번역 속도와 연관된다는 것이 널리 믿어지고 있다. 또한, 각 종은 주어진 코돈 쌍이 유전자 서열 내 이웃으로서 나타나는지의 여부에 대해 특정 우선성을 가지는데, 이는 코돈 쌍 편향으로 불리우는 것이다.
코돈 쌍 편향을 정량하기 위해, 본 발명자들은 코돈 쌍 거리를 생물체의 유전자 내 코돈 쌍의 출현 수(빈도)에 대한 관찰 출현 수의 로그 비로서 정의한다. 유전자 집합 내 코돈 쌍의 관찰 빈도의 계산이 직접적이나, 코돈 쌍의 예상 빈도는 문헌 [Gutman and Hatfield, Proc. Natl. Acad. Sci. USA, 86:3699-3703, 1989]에서와 같이 계산되고, 이는 아미노산 및 코돈 편향과 무관하다. 이를 달성하기 위해, 예상 빈도를 아미노산이 한 특정 코돈에 의해 코딩되는 횟수의 상대 분율에 기초하여 계산한다. 간략히 말해, 이하와 같다:
Figure 112009066775576-pct00020
(식 중에서, 코돈 쌍 AB는 아미노산 쌍 XY를 코딩하고, F는 빈도(출현 수)를 나타낸다).
이 반응식에서, 본 발명자들은 상기 정의된 바와 같은 모든 쌍별 비용으로 64×64 코돈 쌍 거리 매트릭스를 정의할 수 있다. 임의의 m-잔기 단백질은 자체의 코딩을 포함하는 코돈 쌍 스코어의 평균에 의해 과대표시 또는 과소표시된 코돈 쌍을 이용하여 평가될 수 있다.
코돈 쌍 편향에 기초한 유전자 코딩의 최적화
특정 단백질의 번역에 대한 코돈 쌍 편향의 영향을 조사하기 위해, 본 발명자들은 동일한 코돈 분포를 유지하면서 코돈 쌍을 변화시키기로 결정하였다. 따라서, 본 발명자들은 하기 문제를 정의한다: 아미노산 서열 및 코돈 빈도 집단(코돈 분포)이 주어지면, 코돈 쌍 스코어가 최적화(통상은 최소화 또는 최대화)되도록, 서열의 DNA 코딩을 변화시킨다.
상기 정의된 바와 같은 본 발명자들의 문제는, 판매원 순회 문제(Traveling Salesman Problem)(TSP)와 관련된다. 판매원 순회 문제는 가장 악명높은 NP-완전 문제이다. 이는 그것의 일반적 유용성의 함수이며, 이는 대체로 공중에게 설명하기 용이하기 때문이다. 차로 각각의 주어진 도시 집합을 방문해야 하는 순회 판매원을 상상해보라. 그가 순회를 하고 집에 돌아오도록 할 수 있는 최단 거리로서, 그의 총 운전거리를 최소화하는 경로는 무엇일까?
TSP 발견법(heuristics)
TSP의 실질적으로 임의의 이점은 NP-완전일 것이며, 이에 따라 올바른 진행 방식은 발견법을 이용한다. 이는 종종 매우 성공적이며, 전형적으로 대부분의 용도들에 대해 또한 특히 본 발명자들의 최적화 코딩을 위해 충분히 근접하는, 최적 해결책의 몇 퍼센트 내에 포함된다.
최소 신장 트리(Minimum spanning trees) - 한 간단하고 보편적인 발견법, 특히 부위가 평면 내 점을 나타내는 발견법은 점의 최소 신장 트리에 기초한다. 이 트리의 깊이-우선(depth-first) 연구를 행함으로써, 본 발명자들은 트리의 각 선단(edge)을 두 번 지나는데, 한 번은 본 발명자들이 새 정점을 발견할 때 내려가고, 또 한 번은 본 발명자들이 되돌아갈 때 올라간다. 이어서, 본 발명자들은 정점이 발견되는 순서에 따라 정점의 행로(tour)을 정의하여, 이 순서로 정점의 각 이웃 쌍들 간의 최단 거리를 이용하여, 이들을 연결할 수 있다. 이 경로는, 평면에 있는 점들에서와 같이, 그래프가 완전하고 삼각 부등을 따르는 경우 단일 선단이어야 한다. 생성되는 행로는 항상 최소 TSP 행로 길이의 2배 이하이다. 실제로, 그것이 통상 최적보다 더 양호한데, 전형적으로는 15% 내지 20% 더 양호하다. 또한, 알고리즘의 시간은 평면 내 점들의 경우에는 단지 O(n 1g n)인, 최소 신장 트리를 연산하는 시간에 의해 국한된다.
점증 삽입 방법 - 한 상이한 부류의 발견법은, 행로가 완성될 때까지, (단일 정점으로부터 시작하여) 한 시점에서 새 점들을 새로운 부분 행로 점에 삽입한다. 최량으로 작용하는 것으로 보이는 이 발견법의 양태는 최원점 삽입법인데: 나머지 모든 점들 중, 이하와 같이 되도록 점 v를 부분 행로 T에 삽입한다:
Figure 112009066775576-pct00021
최소점은, 본 발명자들이 행로에의 최소 양의 거리를 부가하는 위치에 정점을 삽입하는 것을 확실히 하고, 한편 최대점은 본 발명자들이 가장 좋지 않은 그러한 정점을 먼저 채택하도록 확실히 한다. 이는, 먼저 상세히 채우기 전에, 먼저 "개략적으로 그리기" 때문에, 잘 작용하는 것으로 보인다. 전형적으로, 그러한 행로는 최적보다 단지 5% 내지 10% 더 길다.
k-최적 행로 - 커닝건-린(Kernighan-Lin) 또는 k-opt 부류의 발견법이 실질적으로 더 강력하다. 임의적 행로에서 시작하여, 본 방법은 그것을 향상시키고자 하는 희망에서 행로에 국부 개량을 적용한다. 특히, k≥2 선단의 부분집단을 행로에서 결실시키고, k 잔존 부분사슬은 생성되는 행로가 개선책인지의 여부를 확인하기 위해 상이한 방식으로 재배선된다. 한 행로는, 행로의 비용을 감소시키도록 결실되고 재배선될 수 없는 k 선단의 부분집합이 없을 때, k-최적이 된다. 연장 실험은, 3 최적 행로가 통상 최적 행로의 수 % 이내에 있음을 제시한다. K>3이 경우, 연산 시간은 솔루션 품질보다 상당히 더 빨리 증가한다. 행로를 2-선택(two-opting)하는 것이 임의의 다른 발견법을 향상시키기 위한 빠르고 효과적인 방식이다. 모의 어닐링은 발견법 행로를 향상시키기 위한 선단 플립을 이용하는 대안적 기전을 제공한다.
최적의 코딩 문제를 해결하기 위한 알고리즘
정의된 바와 같은 본 발명자들의 문제는, 64개국 계량 하에 순회 판매원 경로(행로가 아님)를 찾는 문제와 연관된다. 이 공식화에서, 각각의 64개 가능한 코돈은 국가와 동종성을 가지고, 코돈 다중도는 국가 내 도시들의 수로서 모델링된다. 코돈 쌍 편향 측정은 국가 거리 매트릭스로서 반영된다.
코돈 쌍 편향 측정 하에서 유전자/DNA 서열을 최적화하기 위해 주어진 코돈 다중도 집합을 이용하여 특정 단백질을 코딩하는 유전자를 설계하는 실제 생물학적 문제는 약간 상이하다. 국가 TSP 모델에서 본 발명자들의 모델에 없는 것은, 특정 단백질을 코딩할 필요성이다. DNA 삼중체 암호는 64개 코돈을 21개 균등 부류(각각의 20개의 가능한 아미노산 및 중지 기호에 대한 코딩)로 분획화한다. 임의의 주어진 단백질/아미노산 서열은 그것을 코딩하는 관련 코돈 등가물의 임의적 대표를 선택함으로써 구체화될 수 있다.
본 발명자들의 문제의 특수 제한 및 성질, 및 최적화에서의 부가적 기준의 적용에 대한 적합성으로 인해, 본 발명자들은 서열을 최적화하기 위해 모의 어닐링 발견법을 선택하였다. 기법이 이하에 요약되어 있다.
모의 어닐링 발견법
모의 어닐링은, 더욱 고가인 (이에 따라 더 열등한) 솔루션을 초래하는 우발적 전이를 허용하는 발견법적 검색 절차이다. 이는 성공적인 것으로 들리지 않을 수 있으나, 본 발명자들의 연구가 국부 최적점에 고착되는 것으로부터 보호하는 것을 돕는 작용을 하는 것이기도 하다.
모의 어닐링에 대한 영감은 용융된 물질을 고체 상태로 냉각시키는 물리적 과정으로부터 나온다. 열역학적 이론에서, 시스템의 에너지 상태는 시스템을 구성하는 각각의 입자의 에너지 상태에 의해 설명된다. 각 입자의 에너지 상태는 대략 무작위로 뛰어오르고, 이때 그러한 전이는 시스템의 온도에 의해 지배된다. 특히, 온도 T 에서 에너지 e i 에서 e j 로의 전이의 확률 P(e i , e j , T)는 하기와 같이 주어진다:
Figure 112009066775576-pct00022
(여기에서, kB는 볼츠만 상수로 일컬어지는 상수이다). 이 식이 의미하는 바는 무엇일까? 상이한 조건 하에 지수의 값을 고려해보라. 고에너지 상태에서 저에너지 상태로의 이동 가능성은 매우 높다. 그러나, 고에너지 상태로의 전이를 수용하는 비영점 확률이 또한 있고, 이에 작은 에너지는 큰 에너지보다 훨씬 더 가능하게 뛰어오른다. 온도가 높을수록, 그러한 에너지가 뛰어오를 가능성이 더 클 것이다.
이는 조합 최적화를 위해 무슨 관련성을 가질까? 물리적 시스템은, 그것이 냉각될 때, 최소-에너지 상태로 가려고 한다. 임의의 구분된 입자 집합에서, 총 에너지의 최소화는 조합 최적화 문제이다. 상기 확률 분포에 따라 발생되는 무작위 전이를 통해, 본 발명자들은 임의적 조합 최적화 문제를 해결하기 위해 물리학을 모의할 수 있다.
국부적 연구에서와 같이, 문제 표시는 솔루션 공간의 표시와, 주어진 솔루션의 품질을 측정하는, 적절하고 용이하게 연산가능한 비용 함수 C(s)를 모두 포함한다. 새로운 요소는, 본 발명자들이 어떻게 가능히 시간의 함수로서 좋지 않은 전이를 수용할지를 지배하는 파라미터를 가지는 냉각 스케줄이다.
연구 개시 시에, 본 발명자들은 연구 공간을 넓게 탐색하기 위해 무작위성을 이용하고자 열망하여, 부정적 전이를 수용하는 확률이 높게 된다. 연구가 진행됨에 따라, 본 발명자들은 국부 개량 및 최적화로의 전이를 제한하고자 한다. 냉각 스케줄은 하기 파라미터들에 의해 조절될 수 있다:
초기 시스템 온도 - 전형적으로, t 1 =1.
온도 감소분 함수 - 전형적으로, t k =αㆍt k -1(여기에서, 0.8≤α≤0.99임). 이는 선형 쇠퇴와 반대되는, 온도의 지수적 쇠퇴를 의미한다.
온도 변화 간의 반복 수 - 전형적으로, 온도를 저하시키기 전에 100 내지 1,000회 반복이 허용될 수 있다.
수용 기준 - 한 전형적 기준은, C(s i +1)<C(s i )일 때, s i 에서 s j +1로의 임의의 전이를 수용하고, 이하를 만족하는 임의의 경우에 음의 전이를 수용하는 것이다:
Figure 112009066775576-pct00023
(여기에서, r은 0≤r<1의 무작위 수이다). 상수 c는 이 비용 함수를 정규화하며, 이로써 거의 모든 전이가 출발 온도에서 수용된다.
중지 기준 - 전형적으로, 현 솔루션의 값이 마지막 반복 정도 이내에서 변화되거나 향상되지 않았을 때, 연구를 종료하고, 현 솔루션을 보고한다.
전문가의 능력에서, TSP에 대한 최량의 문제 특이적 발견법이 모의 어닐링보다 약간 성능이 우월할 수 있으나, 모의 어닐링 솔루션이 용이하고도 훌륭하게 작용한다.
참조문헌
Figure 112009066775576-pct00024
Figure 112009066775576-pct00025
Figure 112009066775576-pct00026
Figure 112009066775576-pct00027
Figure 112009066775576-pct00028
Figure 112009066775576-pct00029
Figure 112009066775576-pct00030
Figure 112009066775576-pct00031
SEQUENCE LISTING <110> The Research Foundation of State University of New York SUNY at Stony Brook Colman, John R Cello, Jeronimo Futcher, Bruce Mueller, Steffen Papamichail, Dimitris Skiena, Steven Wimmer, Eckard <120> Attenuated Viruses Useful For Vaccines <130> 14421/46276 <140> not assigned <141> 2008-03-31 <150> 60/909,389 <151> 2007-03-30 <150> 61/068,666 <151> 2008-03-07 <160> 42 <170> PatentIn version 3.3 <210> 1 <211> 2643 <212> DNA <213> Human poliovirus 1 Mahoney <400> 1 atgggtgctc aggtttcatc acagaaagtg ggcgcacatg aaaactcaaa tagagcgtat 60 ggtggttcta ccattaatta caccaccatt aattattata gagattcagc tagtaacgcg 120 gcttcgaaac aggacttctc tcaagaccct tccaagttca ccgagcccat caaggatgtc 180 ctgataaaaa cagccccaat gctaaactcg ccaaacatag aggcttgcgg gtatagcgat 240 agagtactgc aattaacact gggaaactcc actataacca cacaggaggc ggctaattca 300 gtagtcgctt atgggcgttg gcctgaatat ctgagggaca gcgaagccaa tccagtggac 360 cagccgacag aaccagacgt cgctgcatgc aggttttata cgctagacac cgtgtcttgg 420 acgaaagagt cgcgagggtg gtggtggaag ttgcctgatg cactgaggga catgggactc 480 tttgggcaaa atatgtacta ccactaccta ggtaggtccg ggtacaccgt gcatgtacag 540 tgtaacgcct ccaaattcca ccagggggca ctaggggtat tcgccgtacc agagatgtgt 600 ctggccgggg atagcaacac cactaccatg cacaccagct atcaaaatgc caatcctggc 660 gagaaaggag gcactttcac gggtacgttc actcctgaca acaaccagac atcacctgcc 720 cgcaggttct gcccggtgga ttacctcctt ggaaatggca cgttgttggg gaatgccttt 780 gtgttcccgc accagataat aaacctacgg accaacaact gtgctacact ggtactccct 840 tacgtgaact ccctctcgat agatagtatg gtaaagcaca ataattgggg aattgcaata 900 ttaccattgg ccccattaaa ttttgctagt gagtcctccc cagagattcc aatcaccttg 960 accatagccc ctatgtgctg tgagttcaat ggattaagaa acatcaccct gccacgctta 1020 cagggcctgc cggtcatgaa cacccctggt agcaatcaat atcttactgc agacaacttc 1080 cagtcaccgt gtgcgctgcc tgaatttgat gtgaccccac ctattgacat acccggtgaa 1140 gtaaagaaca tgatggaatt ggcagaaatc gacaccatga ttccctttga cttaagtgcc 1200 acaaaaaaga acaccatgga aatgtatagg gttcggttaa gtgacaaacc acatacagac 1260 gatcccatac tctgcctgtc actctctcca gcttcagatc ctaggttgtc acatactatg 1320 cttggagaaa tcctaaatta ctacacacac tgggcaggat ccctgaagtt cacgtttctg 1380 ttctgtggat tcatgatggc aactggcaaa ctgttggtgt catacgcgcc tcctggagcc 1440 gacccaccaa agaagcgtaa ggaggcgatg ttgggaacac atgtgatctg ggacatagga 1500 ctgcagtcct catgtactat ggtagtgcca tggattagca acaccacgta tcggcaaacc 1560 atagatgata gtttcaccga aggcggatac atcagcgtct tctaccaaac tagaatagtc 1620 gtccctcttt cgacacccag agagatggac atccttggtt ttgtgtcagc gtgtaatgac 1680 ttcagcgtgc gcttgttgcg agataccaca catatagagc aaaaagcgct agcacagggg 1740 ttaggtcaga tgcttgaaag catgattgac aacacagtcc gtgaaacggt gggggcggca 1800 acatctagag acgctctccc aaacactgaa gccagtggac caacacactc caaggaaatt 1860 ccggcactca ccgcagtgga aactggggcc acaaatccac tagtcccttc tgatacagtg 1920 caaaccagac atgttgtaca acataggtca aggtcagagt ctagcataga gtctttcttc 1980 gcgcggggtg catgcgtgac cattatgacc gtggataacc cagcttccac cacgaataag 2040 gataagctat ttgcagtgtg gaagatcact tataaagata ctgtccagtt acggaggaaa 2100 ttggagttct tcacctattc tagatttgat atggaactta cctttgtggt tactgcaaat 2160 ttcactgaga ctaacaatgg gcatgcctta aatcaagtgt accaaattat gtacgtacca 2220 ccaggcgctc cagtgcccga gaaatgggac gactacacat ggcaaacctc atcaaatcca 2280 tcaatctttt acacctacgg aacagctcca gcccggatct cggtaccgta tgttggtatt 2340 tcgaacgcct attcacactt ttacgacggt ttttccaaag taccactgaa ggaccagtcg 2400 gcagcactag gtgactccct ttatggtgca gcatctctaa atgacttcgg tattttggct 2460 gttagagtag tcaatgatca caacccgacc aaggtcacct ccaaaatcag agtgtatcta 2520 aaacccaaac acatcagagt ctggtgcccg cgtccaccga gggcagtggc gtactacggc 2580 cctggagtgg attacaagga tggtacgctt acacccctct ccaccaagga tctgaccaca 2640 tat 2643 <210> 2 <211> 7521 <212> DNA <213> Unknown <220> <223> synthetic <400> 2 ttaaaacagc tctggggttg tacccacccc agaggcccac gtggcggcta gtactccggt 60 attgcggtac ccttgtacgc ctgttttata ctcccttccc gtaacttaga cgcacaaaac 120 caagttcaat agaagggggt acaaaccagt accaccacga acaagcactt ctgtttcccc 180 ggtgatgtcg tatagactgc ttgcgtggtt gaaagcgacg gatccgttat ccgcttatgt 240 acttcgagaa gcccagtacc acctcggaat cttcgatgcg ttgcgctcag cactcaaccc 300 cagagtgtag cttaggctga tgagtctgga catccctcac cggtgacggt ggtccaggct 360 gcgttggcgg cctacctatg gctaacgcca tgggacgcta gttgtgaaca aggtgtgaag 420 agcctattga gctacataag aatcctccgg cccctgaatg cggctaatcc caacctcgga 480 gcaggtggtc acaaaccagt gattggcctg tcgtaacgcg caagtccgtg gcggaaccga 540 ctactttggg tgtccgtgtt tccttttatt ttattgtggc tgcttatggt gacaatcaca 600 gattgttatc ataaagcgaa ttggattggc catccggtga aagtgagact cattatctat 660 ctgtttgctg gatccgctcc attgagtgtg tttactctaa gtacaatttc aacagttatt 720 tcaatcagac aattgtatca taatgggtgc tcaggtttcg tcgcaaaaag taggtgcgca 780 tgaaaactcg aatcgtgcgt atggttcgtc gacgataaat tatacgacga taaattatta 840 tcgtgattcg gcgtctaatg cggcttcgaa acaagatttt tcgcaagatc cgtcgaaatt 900 tacggaaccg ataaaagatg tattaataaa aacggcgccg atgttaaatt cgccgaatat 960 agaagcgtgt ggttattcgg atcgtgtatt acaattaacg ttaggtaatt cgacgataac 1020 gacgcaagaa gcggctaatt cggtagtagc gtatggtcgt tggccggagt atttacgtga 1080 ttcggaagcg aatccggtag atcaaccgac ggaaccggac gtcgcggcgt gtcgttttta 1140 tacgttagat acggtatcgt ggacgaaaga atcgcgaggt tggtggtgga aattaccgga 1200 tgcgttacgt gatatgggtt tatttggtca aaatatgtat tatcattatt taggtcgttc 1260 gggttatacg gtacatgtac aatgtaatgc gtcgaaattt catcaaggtg cgttaggtgt 1320 atttgcggta ccggaaatgt gtttagcggg tgactcgaat acgacgacga tgcatacgtc 1380 gtatcaaaat gcgaatccgg gtgaaaaagg tggtacgttt acgggtacgt ttacgccgga 1440 taataatcaa acgtcgccgg cgcgtcgttt ttgtccggta gattatttat taggtaatgg 1500 tacgttatta gggaatgcct ttgtatttcc gcatcaaata ataaatttgc gtacgaataa 1560 ttgtgcgacg ttagtattac cgtatgtaaa ttcgttatcg atagattcga tggtaaaaca 1620 taataattgg ggtatagcaa tattaccgtt agcgccgtta aattttgcgt cggaatcgtc 1680 gccggaaata ccgataacgt taacgatagc gccgatgtgt tgtgaattta atggtttgcg 1740 taatataacg ttaccgcgtt tacaaggttt accggtaatg aatacgccgg gctcgaatca 1800 gtatttaacg gcggataatt ttcaatcgcc gtgtgcgtta ccggaatttg atgtaacgcc 1860 gccgatagat ataccgggtg aagtaaaaaa tatgatggaa ttagcggaaa tagatacgat 1920 gataccgttt gatttatcgg cgacgaaaaa aaatacgatg gaaatgtatc gtgtacgttt 1980 atcggataaa ccgcatacgg atgatccgat attatgttta tcgttatcgc cggcgtcgga 2040 tcctaggtta tcgcatacga tgttaggtga gatattaaat tattatacgc attgggcggg 2100 ttcgttaaaa tttacgtttt tattttgtgg ttcgatgatg gcgacgggta aattattagt 2160 atcgtatgcg ccgccgggtg cggatccgcc gaaaaaacgt aaagaagcga tgttaggtac 2220 gcatgtaata tgggatatag gtttacaatc gtcgtgtacg atggtagtac cgtggatatc 2280 gaatacgacg tatcgtcaaa cgatagatga ttcgtttacg gaaggtggtt atatatcggt 2340 attttatcaa acgcgtatag tagtaccgtt atcgacgccg cgtgaaatgg atatattagg 2400 ttttgtatcg gcgtgtaatg atttttcggt acgtttatta cgtgatacga cgcatataga 2460 acaaaaagcg ctagcacaag gtttaggtca aatgttagaa tcgatgatag ataatacggt 2520 acgtgaaacg gtaggtgcgg ctacgtcgcg tgatgcgtta ccgaatacgg aagcgtcggg 2580 tccgacgcac tcgaaagaaa taccggcgtt aacggcggta gaaacgggtg cgacgaatcc 2640 actagtcccg tcggatacgg tacaaacgcg tcatgtagta caacatcgtt cgcgttcgga 2700 atcgtcgata gaatcgtttt ttgcgcgtgg tgcgtgtgta acgataatga cggtagataa 2760 tccggcgtcg acgacgaata aagataaatt atttgcggta tggaaaataa cgtataaaga 2820 tacggtacaa ttacgtcgta aattagaatt tttcacgtat tcgcgttttg atatggaatt 2880 aacgtttgta gtaacggcga attttacgga aacgaataat ggtcatgcgt taaatcaagt 2940 atatcaaata atgtacgtac cgccgggtgc gccggtaccc gaaaaatggg atgattatac 3000 gtggcaaacg tcgtcgaatc cgtcgatatt ttacacgtat ggtacggcgc cggcgcgtat 3060 atcggtaccg tatgtaggta tatctaatgc gtattcgcat ttttatgatg gtttctcgaa 3120 agtaccgtta aaagatcaat cggcggcgtt aggtgattcg ttatatggtg cggcgtcgtt 3180 aaatgatttt ggtatattag cggtacgtgt agtaaatgat cataatccga cgaaggtcac 3240 ctcgaaaata cgtgtatatt taaaaccgaa acatatacgt gtatggtgtc cgcgtccgcc 3300 gcgtgcggta gcgtattatg gtccgggtgt agattataaa gatggtacgt taacgccgtt 3360 atcgacgaaa gatttaacga cgtatggatt cggacaccaa aacaaagcgg tgtacactgc 3420 aggttacaaa atttgcaact accacttggc cactcaggat gatttgcaaa acgcagtgaa 3480 cgtcatgtgg agtagagacc tcttagtcac agaatcaaga gcccagggca ccgattcaat 3540 cgcaaggtgc aattgcaacg caggggtgta ctactgcgag tctagaagga aatactaccc 3600 agtatccttc gttggcccaa cgttccagta catggaggct aataactatt acccagctag 3660 gtaccagtcc catatgctca ttggccatgg attcgcatct ccaggggatt gtggtggcat 3720 actcagatgt caccacgggg tgatagggat cattactgct ggtggagaag ggttggttgc 3780 attttcagac attagagact tgtatgccta cgaagaagaa gccatggaac aaggcctcac 3840 caattacata gagtcacttg gggccgcatt tggaagtgga tttactcagc agattagcga 3900 caaaataaca gagttgacca atatggtgac cagtaccatc actgaaaagc tacttaagaa 3960 cttgatcaag atcatatcct cactagttat tataactagg aactatgaag acaccacaac 4020 agtgctcgct accctggccc ttcttgggtg tgatgcttca ccatggcagt ggcttagaaa 4080 gaaagcatgc gatgttctgg agatacctta tgtcatcaag caaggtgaca gttggttgaa 4140 gaagtttact gaagcatgca acgcagctaa gggactggag tgggtgtcaa acaaaatctc 4200 aaaattcatt gattggctca aggagaaaat tatcccacaa gctagagata agttggaatt 4260 tgtaacaaaa cttagacaac tagaaatgct ggaaaaccaa atctcaacta tacaccaatc 4320 atgccctagt caggaacacc aggaaattct attcaataat gtcagatggt tatccatcca 4380 gtctaagagg tttgcccctc tttacgcagt ggaagccaaa agaatacaga aactcgagca 4440 tactattaac aactacatac agttcaagag caaacaccgt attgaaccag tatgtttgct 4500 agtacatggc agccccggaa caggtaaatc tgtagcaacc aacctgattg ctagagccat 4560 agctgaaaga gaaaacacgt ccacgtactc gctacccccg gatccatcac acttcgacgg 4620 atacaaacaa cagggagtgg tgattatgga cgacctgaat caaaacccag atggtgcgga 4680 catgaagctg ttctgtcaga tggtatcaac agtggagttt ataccaccca tggcatccct 4740 ggaggagaaa ggaatcctgt ttacttcaaa ttacgttcta gcatccacaa actcaagcag 4800 aatttccccc cccactgtgg cacacagtga cgcgttagcc aggcgctttg cgttcgacat 4860 ggacattcag gtcatgaatg agtattctag agatgggaaa ttgaacatgg ccatggctac 4920 tgaaatgtgt aagaactgtc accaaccagc aaactttaag agatgctgtc ctttagtgtg 4980 tggtaaggca attcaattaa tggacaaatc ttccagagtt agatacagta ttgaccagat 5040 cactacaatg attatcaatg agagaaacag aagatccaac attggcaatt gtatggaggc 5100 tttgtttcaa ggaccactcc agtataaaga cttgaaaatt gacatcaaga cgagtccccc 5160 tcctgaatgt atcaatgact tgctccaagc agttgactcc caggaggtga gagattactg 5220 tgagaagaag ggttggatag ttaacatcac cagccaggtt caaacagaaa ggaacatcaa 5280 cagggcaatg acaattctac aagcggtgac aaccttcgcc gcagtggctg gagttgtcta 5340 tgtcatgtat aaactgtttg ctggacacca gggagcatac actggtttac caaacaaaaa 5400 acccaacgtg cccaccattc ggacagcaaa ggtacaagga ccagggttcg attacgcagt 5460 ggctatggct aaaagaaaca ttgttacagc aactactagc aagggagagt tcactatgtt 5520 aggagtccac gacaacgtgg ctattttacc aacccacgct tcacctggtg aaagcattgt 5580 gatcgatggc aaagaagtgg agatcttgga tgccaaagcg ctcgaagatc aagcaggaac 5640 caatcttgaa atcactataa tcactctaaa gagaaatgaa aagttcagag acattagacc 5700 acatatacct actcaaatca ctgagacaaa tgatggagtc ttgatcgtga acactagcaa 5760 gtaccccaat atgtatgttc ctgtcggtgc tgtgactgaa cagggatatc taaatctcgg 5820 tgggcgccaa actgctcgta ctctaatgta caactttcca accagagcag gacagtgtgg 5880 tggagtcatc acatgtactg ggaaagtcat cgggatgcat gttggtggga acggttcaca 5940 cgggtttgca gcggccctga agcgatcata cttcactcag agtcaaggtg aaatccagtg 6000 gatgagacct tcgaaggaag tgggatatcc aatcataaat gccccgtcca aaaccaagct 6060 tgaacccagt gctttccact atgtgtttga aggggtgaag gaaccagcag tcctcactaa 6120 aaacgatccc aggcttaaga cagactttga ggaggcaatt ttctccaagt acgtgggtaa 6180 caaaattact gaagtggatg agtacatgaa agaggcagta gaccactatg ctggccagct 6240 catgtcacta gacatcaaca tagaacaaat gtgcttggag gatgccatgt atggcactga 6300 tggtctagaa gcacttgatt tgtccaccag tgctggctac ccttatgtag caatgggaaa 6360 gaagaagaga gacatcttga acaaacaaac cagagacact aaggaaatgc aaaaactgct 6420 cgacacatat ggaatcaacc tcccactggt gacttatgta aaggatgaac ttagatccaa 6480 aacaaaggtt gagcagggga aatccagatt aattgaagct tctagtttga atgactcagt 6540 ggcaatgaga atggcttttg ggaacctata tgctgctttt cacaaaaacc caggagtgat 6600 aacaggttca gcagtggggt gcgatccaga tttgttttgg agcaaaattc cggtattgat 6660 ggaagagaag ctgtttgctt ttgactacac agggtatgat gcatctctca gccctgcttg 6720 gttcgaggca ctaaagatgg tgcttgagaa aatcggattc ggagacagag ttgactacat 6780 cgactaccta aaccactcac accacctgta caagaataaa acatactgtg tcaagggcgg 6840 tatgccatct ggctgctcag gcacttcaat ttttaactca atgattaaca acttgattat 6900 caggacactc ttactgaaaa cctacaaggg catagattta gaccacctaa aaatgattgc 6960 ctatggtgat gatgtaattg cttcctaccc ccatgaagtt gacgctagtc tcctagccca 7020 atcaggaaaa gactatggac taactatgac tccagctgac aaatcagcta catttgaaac 7080 agtcacatgg gagaatgtaa cattcttgaa gagattcttc agggcagacg agaaataccc 7140 atttcttatt catccagtaa tgccaatgaa ggaaattcat gaatcaatta gatggacaaa 7200 agatcctagg aacactcagg atcacgttcg ctctctgtgc cttttagctt ggcacaatgg 7260 cgaagaagaa tataacaaat tcctagctaa aatcaggagt gtgccaattg gaagagcttt 7320 attgctccca gagtactcaa cattgtaccg ccgttggctt gactcatttt agtaacccta 7380 cctcagtcga attggattgg gtcatactgg tgtaggggta aatttttctt taattcggag 7440 gaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 7500 aaaaaaaaaa aaaaaaaaaa a 7521 <210> 3 <211> 7521 <212> DNA <213> Unknown <220> <223> synthetic <400> 3 ttaaaacagc tctggggttg tacccacccc agaggcccac gtggcggcta gtactccggt 60 attgcggtac ccttgtacgc ctgttttata ctcccttccc gtaacttaga cgcacaaaac 120 caagttcaat agaagggggt acaaaccagt accaccacga acaagcactt ctgtttcccc 180 ggtgatgtcg tatagactgc ttgcgtggtt gaaagcgacg gatccgttat ccgcttatgt 240 acttcgagaa gcccagtacc acctcggaat cttcgatgcg ttgcgctcag cactcaaccc 300 cagagtgtag cttaggctga tgagtctgga catccctcac cggtgacggt ggtccaggct 360 gcgttggcgg cctacctatg gctaacgcca tgggacgcta gttgtgaaca aggtgtgaag 420 agcctattga gctacataag aatcctccgg cccctgaatg cggctaatcc caacctcgga 480 gcaggtggtc acaaaccagt gattggcctg tcgtaacgcg caagtccgtg gcggaaccga 540 ctactttggg tgtccgtgtt tccttttatt ttattgtggc tgcttatggt gacaatcaca 600 gattgttatc ataaagcgaa ttggattggc catccggtga aagtgagact cattatctat 660 ctgtttgctg gatccgctcc attgagtgtg tttactctaa gtacaatttc aacagttatt 720 tcaatcagac aattgtatca taatgggtgc tcaggtttcg tctcagaagg taggtgctca 780 cgaaaatagc aacagggcat acggatcatc cacaatcaac tatacaacaa tcaactacta 840 ccgggactcc gcctccaatg cagcttcgaa acaagatttt agccaggatc catctaaatt 900 tactgaacca attaaagacg tgctcatcaa gactgcacct atgttgaata gccctaacat 960 tgaagcctgt ggctactcag accgggtgct tcagctgacc ctcggtaatt caaccatcac 1020 aacgcaagaa gctgcaaaca gcgtggtggc atacggaagg tggccagagt acttaagaga 1080 ttctgaggca aaccctgtcg atcaaccaac cgagccggac gtcgcggcgt gtcgattcta 1140 caccctcgat actgtaagct ggaccaagga atcgcgaggt tggtggtgga aacttccaga 1200 cgccctacgc gatatgggtt tgttcggtca gaacatgtat tatcattatt tgggacgctc 1260 tggatataca gtccacgtgc aatgcaatgc ttcaaagttt catcagggag ctttgggtgt 1320 gttcgcggtg ccggaaatgt gcttagcagg agactcaaat acgaccacaa tgcatacttc 1380 ttaccagaac gcaaaccccg gagaaaaggg cggtacgttt accgggacct ttaccccaga 1440 taataatcaa acctccccag caagacgttt ttgtccagtt gactatttgt tgggcaacgg 1500 tacactacta gggaatgcct tcgtatttcc tcatcagatt atcaatctta gaactaataa 1560 ttgcgcaact ctcgtgttgc catatgtaaa ttctctgtcc atcgactcga tggtgaaaca 1620 taacaactgg gggatagcaa tattacctct cgcgcctctg aacttcgcgt cagaatcaag 1680 tccggaaatc ccgataacac ttactatcgc tcccatgtgt tgcgagttca acgggctcag 1740 gaatataaca ctacccaggc tgcaagggct accagttatg aatacaccag gatctaacca 1800 gtacttaacc gccgataact tccaatcccc atgcgcctta ccagagttcg atgtcacgcc 1860 gcccatcgat atccctgggg aggtgaaaaa tatgatggag cttgccgaga ttgatacaat 1920 gataccattc gatctgtccg caactaagaa aaatacaatg gagatgtacc gtgtgagact 1980 ttccgataag cctcacaccg acgacccaat tctgtgtctc agtctatctc ctgcaagtga 2040 ccctaggctt agccacacca tgctgggcga gatattgaac tattataccc actgggcggg 2100 cagtcttaaa ttcaccttct tattttgtgg gtcaatgatg gctacgggta agttgctagt 2160 aagctacgct ccaccaggcg cagatcctcc gaagaaaagg aaagaagcta tgcttgggac 2220 ccacgtcatt tgggatattg gtttacaatc ttcgtgcacc atggtggttc cttggatatc 2280 aaatacgacc tacagacaga caatcgacga ctcctttacg gagggtggtt atatatcagt 2340 gttttatcag acccgtattg tggtgccact gtctacccca cgggaaatgg atattctggg 2400 attcgtctcc gcctgcaacg acttctcagt caggctccta agggacacga cccacattga 2460 acagaaggcg ctagcacaag gactgggtca aatgttggag tcaatgatag ataataccgt 2520 aagggagacc gtaggagctg ccacttcacg ggatgcactg ccgaatacag aggcatcagg 2580 gcccacccat tcaaaagaga tcccagctct gacagctgta gagaccggtg caaccaaccc 2640 actagtccca tcggacactg ttcagacacg gcacgtggtg cagcacagaa gtagatccga 2700 atcctcgatt gaaagctttt tcgccagagg cgcctgtgta acaataatga cggtagacaa 2760 tcccgcaagt actaccaaca aagacaaact gttcgctgtc tggaaaataa catacaagga 2820 caccgtacaa ctgagaagaa agcttgaatt ttttacttac agcaggttcg acatggagtt 2880 aacattcgta gtgaccgcta acttcaccga aaccaataac gggcacgccc tgaaccaggt 2940 ttatcagata atgtacgtac cgccgggtgc ccccgtaccc gaaaagtggg atgattatac 3000 ttggcagact agctccaacc cttccatatt ctatacttat ggcaccgcgc cggcgagaat 3060 ttcagttcca tacgtgggaa tatcaaatgc atactctcat ttctatgatg gcttctcaaa 3120 ggtgccttta aaagaccaat cagcggccct gggagattcg ttgtacgggg ccgcctcctt 3180 gaacgatttt gggatcctag cagtgagggt ggtgaacgac cataatccaa cgaaggtcac 3240 cagtaagata cgggtctact tgaagcctaa gcatattcgt gtgtggtgtc caagacctcc 3300 acgcgccgtc gcatattatg gacccggtgt cgactataaa gacgggacct tgaccccact 3360 gagtacaaaa gacctcacaa cttacggatt cggacaccaa aacaaagcgg tgtacactgc 3420 aggttacaaa atttgcaact accacttggc cactcaggat gatttgcaaa acgcagtgaa 3480 cgtcatgtgg agtagagacc tcttagtcac agaatcaaga gcccagggca ccgattcaat 3540 cgcaaggtgc aattgcaacg caggggtgta ctactgcgag tctagaagga aatactaccc 3600 agtatccttc gttggcccaa cgttccagta catggaggct aataactatt acccagctag 3660 gtaccagtcc catatgctca ttggccatgg attcgcatct ccaggggatt gtggtggcat 3720 actcagatgt caccacgggg tgatagggat cattactgct ggtggagaag ggttggttgc 3780 attttcagac attagagact tgtatgccta cgaagaagaa gccatggaac aaggcctcac 3840 caattacata gagtcacttg gggccgcatt tggaagtgga tttactcagc agattagcga 3900 caaaataaca gagttgacca atatggtgac cagtaccatc actgaaaagc tacttaagaa 3960 cttgatcaag atcatatcct cactagttat tataactagg aactatgaag acaccacaac 4020 agtgctcgct accctggccc ttcttgggtg tgatgcttca ccatggcagt ggcttagaaa 4080 gaaagcatgc gatgttctgg agatacctta tgtcatcaag caaggtgaca gttggttgaa 4140 gaagtttact gaagcatgca acgcagctaa gggactggag tgggtgtcaa acaaaatctc 4200 aaaattcatt gattggctca aggagaaaat tatcccacaa gctagagata agttggaatt 4260 tgtaacaaaa cttagacaac tagaaatgct ggaaaaccaa atctcaacta tacaccaatc 4320 atgccctagt caggaacacc aggaaattct attcaataat gtcagatggt tatccatcca 4380 gtctaagagg tttgcccctc tttacgcagt ggaagccaaa agaatacaga aactcgagca 4440 tactattaac aactacatac agttcaagag caaacaccgt attgaaccag tatgtttgct 4500 agtacatggc agccccggaa caggtaaatc tgtagcaacc aacctgattg ctagagccat 4560 agctgaaaga gaaaacacgt ccacgtactc gctacccccg gatccatcac acttcgacgg 4620 atacaaacaa cagggagtgg tgattatgga cgacctgaat caaaacccag atggtgcgga 4680 catgaagctg ttctgtcaga tggtatcaac agtggagttt ataccaccca tggcatccct 4740 ggaggagaaa ggaatcctgt ttacttcaaa ttacgttcta gcatccacaa actcaagcag 4800 aatttccccc cccactgtgg cacacagtga cgcgttagcc aggcgctttg cgttcgacat 4860 ggacattcag gtcatgaatg agtattctag agatgggaaa ttgaacatgg ccatggctac 4920 tgaaatgtgt aagaactgtc accaaccagc aaactttaag agatgctgtc ctttagtgtg 4980 tggtaaggca attcaattaa tggacaaatc ttccagagtt agatacagta ttgaccagat 5040 cactacaatg attatcaatg agagaaacag aagatccaac attggcaatt gtatggaggc 5100 tttgtttcaa ggaccactcc agtataaaga cttgaaaatt gacatcaaga cgagtccccc 5160 tcctgaatgt atcaatgact tgctccaagc agttgactcc caggaggtga gagattactg 5220 tgagaagaag ggttggatag ttaacatcac cagccaggtt caaacagaaa ggaacatcaa 5280 cagggcaatg acaattctac aagcggtgac aaccttcgcc gcagtggctg gagttgtcta 5340 tgtcatgtat aaactgtttg ctggacacca gggagcatac actggtttac caaacaaaaa 5400 acccaacgtg cccaccattc ggacagcaaa ggtacaagga ccagggttcg attacgcagt 5460 ggctatggct aaaagaaaca ttgttacagc aactactagc aagggagagt tcactatgtt 5520 aggagtccac gacaacgtgg ctattttacc aacccacgct tcacctggtg aaagcattgt 5580 gatcgatggc aaagaagtgg agatcttgga tgccaaagcg ctcgaagatc aagcaggaac 5640 caatcttgaa atcactataa tcactctaaa gagaaatgaa aagttcagag acattagacc 5700 acatatacct actcaaatca ctgagacaaa tgatggagtc ttgatcgtga acactagcaa 5760 gtaccccaat atgtatgttc ctgtcggtgc tgtgactgaa cagggatatc taaatctcgg 5820 tgggcgccaa actgctcgta ctctaatgta caactttcca accagagcag gacagtgtgg 5880 tggagtcatc acatgtactg ggaaagtcat cgggatgcat gttggtggga acggttcaca 5940 cgggtttgca gcggccctga agcgatcata cttcactcag agtcaaggtg aaatccagtg 6000 gatgagacct tcgaaggaag tgggatatcc aatcataaat gccccgtcca aaaccaagct 6060 tgaacccagt gctttccact atgtgtttga aggggtgaag gaaccagcag tcctcactaa 6120 aaacgatccc aggcttaaga cagactttga ggaggcaatt ttctccaagt acgtgggtaa 6180 caaaattact gaagtggatg agtacatgaa agaggcagta gaccactatg ctggccagct 6240 catgtcacta gacatcaaca tagaacaaat gtgcttggag gatgccatgt atggcactga 6300 tggtctagaa gcacttgatt tgtccaccag tgctggctac ccttatgtag caatgggaaa 6360 gaagaagaga gacatcttga acaaacaaac cagagacact aaggaaatgc aaaaactgct 6420 cgacacatat ggaatcaacc tcccactggt gacttatgta aaggatgaac ttagatccaa 6480 aacaaaggtt gagcagggga aatccagatt aattgaagct tctagtttga atgactcagt 6540 ggcaatgaga atggcttttg ggaacctata tgctgctttt cacaaaaacc caggagtgat 6600 aacaggttca gcagtggggt gcgatccaga tttgttttgg agcaaaattc cggtattgat 6660 ggaagagaag ctgtttgctt ttgactacac agggtatgat gcatctctca gccctgcttg 6720 gttcgaggca ctaaagatgg tgcttgagaa aatcggattc ggagacagag ttgactacat 6780 cgactaccta aaccactcac accacctgta caagaataaa acatactgtg tcaagggcgg 6840 tatgccatct ggctgctcag gcacttcaat ttttaactca atgattaaca acttgattat 6900 caggacactc ttactgaaaa cctacaaggg catagattta gaccacctaa aaatgattgc 6960 ctatggtgat gatgtaattg cttcctaccc ccatgaagtt gacgctagtc tcctagccca 7020 atcaggaaaa gactatggac taactatgac tccagctgac aaatcagcta catttgaaac 7080 agtcacatgg gagaatgtaa cattcttgaa gagattcttc agggcagacg agaaataccc 7140 atttcttatt catccagtaa tgccaatgaa ggaaattcat gaatcaatta gatggacaaa 7200 agatcctagg aacactcagg atcacgttcg ctctctgtgc cttttagctt ggcacaatgg 7260 cgaagaagaa tataacaaat tcctagctaa aatcaggagt gtgccaattg gaagagcttt 7320 attgctccca gagtactcaa cattgtaccg ccgttggctt gactcatttt agtaacccta 7380 cctcagtcga attggattgg gtcatactgg tgtaggggta aatttttctt taattcggag 7440 gaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 7500 aaaaaaaaaa aaaaaaaaaa a 7521 <210> 4 <211> 2643 <212> DNA <213> Unknown <220> <223> synthetic <400> 4 atgggagctc aggtgtcatc ccaaaaagta ggcgcacacg aaaactcgaa tcgggcatac 60 ggatctagta cgattaacta tactacaatc aattactata gggactccgc ctctaacgcc 120 gcttcgaaac aggacttttc gcaagaccct agcaagttta ccgaaccgat taaggacgtg 180 ttgatcaaaa ccgcacctat gcttaactca cctaacatag aggcatgcgg atactccgat 240 agggtgttgc aactgacact cggcaatagt acgattacga cacaggaagc cgctaatagc 300 gtagtcgcat acggaaggtg gcccgaatac cttagagact ccgaagcgaa tccagtcgat 360 cagcctaccg aacctgacgt cgccgcatgt cggttttaca cactcgatac cgtgtcatgg 420 actaaggaat cgcgagggtg gtggtggaaa ctgccagacg cattgcgcga tatggggttg 480 ttcggacaga atatgtacta tcactatctc ggaagatccg ggtataccgt acacgtgcaa 540 tgtaacgcct ctaagtttca ccagggagcg ttaggcgtat tcgcagtgcc agagatgtgt 600 ctagccggag actccaatac gactactatg catacctcat accaaaacgc taacccaggc 660 gaaaaggggg ggacatttac cggaacattc acacccgata acaatcagac atcccccgct 720 agacggtttt gcccagtcga ctatctactc ggaaacggta cactgttagg gaatgccttc 780 gtattcccac accagataat taacttacgg actaacaatt gcgcaaccct agtgttgcca 840 tacgttaact cactgtcaat cgatagtatg gtgaaacata acaattgggg gatcgcaata 900 ttaccgttag cgccactgaa tttcgccagc gaatcgtcac ctgagatacc gattaccctt 960 acaatcgcac ctatgtgttg cgagttcaac ggattgcgta atataaccct accacggttg 1020 caggggttgc ccgttatgaa taccccaggg tctaaccaat accttaccgc cgataatttc 1080 caatcccctt gcgcactgcc agagttcgac gtaacccctc caatcgacat acccggcgag 1140 gttaagaata tgatggagtt agccgaaatc gatactatga taccgttcga tctatccgct 1200 acgaaaaaga atactatgga gatgtatcgc gtgagattgt ccgataagcc acataccgac 1260 gatccgatac tgtgtctgtc actgtcaccc gccagcgatc ctaggttgtc ccatacaatg 1320 ttaggcgaga tactgaatta ctatacccat tgggccggta gtctgaaatt cacatttctg 1380 ttttgcggat ctatgatggc gaccggaaag ctgttagtgt catacgctcc acccggagcc 1440 gatccaccta aaaaacgcaa ggaagcgatg ctcggtacac acgtgatatg ggatatcgga 1500 ctgcaatcgt catgtactat ggtcgtgcca tggatatcga atacgactta tagacagaca 1560 atcgacgata gctttaccga gggggggtat attagcgtat tctatcagac acgtatcgta 1620 gtgccactgt caacccctag agagatggac atactcggat tcgtatccgc atgtaacgac 1680 tttagcgtga gactgttacg cgatactacc catatcgaac agaaagcgct agcacagggg 1740 ttagggcaaa tgctagagtc aatgatcgac aatactgtac gcgaaaccgt aggcgcagcg 1800 accagtaggg acgcactacc gaataccgaa gcgagcggac ctacccactc taaagagata 1860 ccggcactaa ccgccgtcga aaccggagcg actaacccac tagtcccatc cgataccgtg 1920 caaaccagac acgtagtgca acatcggtct agatccgagt catcaatcga atcctttttc 1980 gctagaggcg catgcgttac gattatgacc gtcgataacc cagcgtcaac gactaacaaa 2040 gacaaattgt tcgccgtatg gaaaattacc tataaggata ccgtgcaatt gcgacgtaaa 2100 ctagagttct ttacatactc tagattcgat atggagctta cattcgtagt gaccgctaac 2160 tttaccgaga ctaataacgg tcacgccctt aatcaggtgt atcagattat gtacgtaccg 2220 ccaggcgcac cagtgcccga aaaatgggac gactatacat ggcagactag ctctaatccg 2280 tcaattttct atacatacgg taccgcacca gctaggatta gcgtgccata cgtcggtata 2340 tcgaacgctt actcacactt ttacgacgga ttctctaaag tgccacttaa ggaccaatcc 2400 gccgcactag gcgatagcct atacggagcc gctagtctta acgatttcgg tatactcgcc 2460 gttagggtcg tgaacgacca taaccctact aaggtcacct ctaagattag ggtgtatctt 2520 aagcctaagc atattagggt gtggtgtcct agaccgccta gagccgttgc gtattacgga 2580 ccaggcgtcg actataagga cggtacattg accccactgt caacgaaaga ccttacgacg 2640 tac 2643 <210> 5 <211> 2643 <212> DNA <213> Unknown <220> <223> synthetic <400> 5 atgggagctc aagtatcttc acaaaaagtt ggtgctcatg aaaattcaaa cagagcatat 60 ggttcttcaa caataaacta caccacaata aattattaca gggacagtgc ttcaaatgca 120 gcttcgaaac aagatttttc tcaagatcct tccaagttca cagagcccat caaagatgtt 180 ttaataaaaa cagcacccat gctgaacagc cccaacattg aagcatgtgg ttatagtgac 240 agagttctac agctcacgct gggaaattca acaataacaa ctcaagaagc agcaaattct 300 gtggtggcct atggtcgttg gccagagtat ctgcgggact cggaggcaaa tcctgtggac 360 cagccaacag agccggacgt cgctgcctgc cgcttctaca cgttagacac ggtctcctgg 420 accaaggagt cgcgaggctg gtggtggaaa cttccagatg ctctgcggga catgggcctc 480 tttgggcaga acatgtacta tcattatttg ggaagaagtg gctacacggt ccatgtgcag 540 tgtaatgcat ccaagtttca tcaaggtgcc ctgggcgtgt tcgcggttcc tgagatgtgt 600 ttggctgggg acagcaacac caccaccatg cacacgtcct accaaaatgc aaatccagga 660 gaaaaaggtg gcaccttcac gggcaccttc actccagaca acaaccagac ctcgccggcg 720 cgccgcttct gcccagtaga ttatcttctt ggaaatggca cgctgctggg gaatgccttt 780 gtatttcctc atcaaataat aaatttgagg accaacaact gtgccacctt ggttcttcct 840 tatgtcaaca gcctctccat tgactccatg gtgaagcaca acaactgggg aatagcaata 900 ttacctttgg cacctttaaa ttttgcctcg gagagttctc cagagatccc catcaccctc 960 accatcgcgc cgatgtgctg cgagttcaat gggctgagga acatcaccct gcccaggcta 1020 caaggtcttc ctgtcatgaa cacaccaggt tcaaatcagt atttaacagc agacaacttc 1080 cagtctccat gtgctttgcc agaatttgat gtcactccac caatagatat tccaggagaa 1140 gtaaagaaca tgatggaact agcagaaata gacaccatga ttccatttga tctttcagcc 1200 accaagaaga acaccatgga gatgtaccgt gtcaggcttt cagataaacc acacacagat 1260 gatccaattc tctgcctcag tctttctcca gcctcggacc ctaggctcag ccacaccatg 1320 ctaggagaga tattaaatta ttacacgcac tgggcaggct ccctgaagtt caccttcctc 1380 ttctgtggct ccatgatggc aactggaaaa ttattagtat catatgcgcc gccgggggca 1440 gatcctccaa agaagaggaa ggaggccatg ctaggaactc atgtaatatg ggacattggg 1500 ttgcagagca gctgcaccat ggttgttccc tggatctcca acaccaccta caggcagacc 1560 attgatgaca gcttcacaga aggtggttat atttctgtct tctaccagac aagaattgtg 1620 gtgccgctgt ccactccaag agaaatggat attcttggat ttgtatcagc ctgcaatgac 1680 ttctctgtga ggctgctgcg ggacaccact catattgagc agaaggcgct agcacaagga 1740 cttggacaaa tgctggagtc catgattgac aacactgtgc gggagactgt gggggcggcc 1800 acctcaagag atgctttgcc aaatacagag gcttcggggc caacacacag caaagaaata 1860 ccagctttga cagcagtaga aactggagca acaaatccac tagtcccttc agatactgta 1920 caaacaagac atgtggtgca gcacagatca agaagtgaaa gttcaataga atccttcttt 1980 gctcgtgggg cctgtgtcac catcatgact gtggacaacc cagcctccac caccaacaaa 2040 gataaattat ttgctgtgtg gaagatcacc tacaaagata ctgtgcagct aagaagaaaa 2100 ctagagttct tcacctactc aagatttgac atggaactaa cttttgtggt cacagccaac 2160 ttcacagaga ccaacaatgg acatgctttg aatcaagtct accagattat gtacgtacca 2220 ccaggggctc ctgtgcccga aaaatgggat gactacacgt ggcagacttc atcaaatcct 2280 tccatcttct acacatatgg aacagcgccg gccaggatat cagttcctta tgtgggcatc 2340 tcaaatgctt acagccactt ctatgatggc ttctccaaag tacctttgaa ggaccagtcg 2400 gcggcgctgg gggacagttt atatggtgca gcatctctaa atgattttgg aattttggct 2460 gtccgtgtag taaatgacca caaccccacc aaggtcacca gcaagatccg agtatattta 2520 aaaccaaagc acatccgagt gtggtgtccg agaccgccaa gagctgtagc gtattacggt 2580 cctggtgtgg actataaaga tgggactttg actcctttgt ccaccaaaga cctcaccacg 2640 tac 2643 <210> 6 <211> 7441 <212> DNA <213> Unknown <220> <223> synthetic <400> 6 ttaaaacagc tctggggttg tacccacccc agaggcccac gtggcggcta gtactccggt 60 attgcggtac ccttgtacgc ctgttttata ctcccttccc gtaacttaga cgcacaaaac 120 caagttcaat agaagggggt acaaaccagt accaccacga acaagcactt ctgtttcccc 180 ggtgatgtcg tatagactgc ttgcgtggtt gaaagcgacg gatccgttat ccgcttatgt 240 acttcgagaa gcccagtacc acctcggaat cttcgatgcg ttgcgctcag cactcaaccc 300 cagagtgtag cttaggctga tgagtctgga catccctcac cggtgacggt ggtccaggct 360 gcgttggcgg cctacctatg gctaacgcca tgggacgcta gttgtgaaca aggtgtgaag 420 agcctattga gctacataag aatcctccgg cccctgaatg cggctaatcc caacctcgga 480 gcaggtggtc acaaaccagt gattggcctg tcgtaacgcg caagtccgtg gcggaaccga 540 ctactttggg tgtccgtgtt tccttttatt ttattgtggc tgcttatggt gacaatcaca 600 gattgttatc ataaagcgaa ttggattggc catccggtga aagtgagact cattatctat 660 ctgtttgctg gatccgctcc attgagtgtg tttactctaa gtacaatttc aacagttatt 720 tcaatcagac aattgtatca taatgggcgc gcaagtgtcg tctcaaaagg ttggagccca 780 cgagaatagt aacagagcat acggatcaag cacaataaat tatacgacga tcaattacta 840 ccgtgactcg gcatccaacg ccgctagcaa acaggacttt tctcaggatc catctaaatt 900 cacggaaccc ataaaagacg tgcttattaa gaccgcacct atgctgaatt caccgaatat 960 cgaagcctgt ggttactctg accgggtgct acagctgaca cttggcaact caacgatcac 1020 aacccaagag gccgcaaatt ccgtagtagc gtacggtagg tggccagagt acctacgtga 1080 ttcagaggct aaccctgtag atcaacctac cgaaccggac gtggcagctt gtcgtttcta 1140 cactcttgat accgtgtcct ggaccaagga aagtaggggt tggtggtgga aactccccga 1200 cgcccttagg gatatggggc tgttcggtca gaacatgtac tatcactatc tgggacgctc 1260 aggctatacg gtacacgtgc aatgcaacgc aagtaagttt catcagggcg cgctgggagt 1320 gttcgcagtt ccggaaatgt gcctagctgg cgactcaaat acaacgacta tgcatacaag 1380 ttatcagaac gcgaacccag gagaaaaggg gggaacattt acaggcacat ttaccccaga 1440 taataaccaa acctccccag cacggagatt ctgtcctgta gactacttgt tggggaacgg 1500 aaccctactt ggtaacgcat tcgtttttcc acatcaaatt atcaatctta gaactaataa 1560 ttgtgcaact ctcgtgttgc catatgtcaa ttccttgtcg atagactcca tggtcaaaca 1620 taacaactgg ggcatagcca ttctaccgct cgcaccactg aacttcgcat ccgaatcctc 1680 acccgaaatc cccataacac tcacaatcgc accaatgtgt tgcgaattta acggactgcg 1740 gaatataacc ctaccgagac tccagggttt acccgtaatg aatacgccag gatcaaatca 1800 gtacttaacc gccgataatt tccaatcccc atgcgcctta ccagaattcg acgtaacgcc 1860 tccaattgat attccaggag aggtgaaaaa tatgatggag ctcgcagaga ttgatactat 1920 gataccgttc gatctttccg ctaccaagaa aaatacgatg gagatgtacc gcgtgagact 1980 gtccgataag ccacacaccg atgacccaat actgtgttta agtttgtctc cagcttccga 2040 cccacgtctc tctcatacca tgttagggga gatacttaac tattatactc attgggccgg 2100 gtcattaaag tttaccttcc tgttttgcgg gtctatgatg gccaccggga agctgctagt 2160 tagctatgcc ccacctggtg cggatcctcc taaaaagaga aaagaagcaa tgctcggtac 2220 ccacgtaatt tgggatattg gactgcaatc gagctgcacc atggtggtgc cttggatatc 2280 taatacaacc tacagacaga caatcgacga ctcattcaca gagggtgggt atatatcggt 2340 gttttatcag acccgaatcg ttgtgccatt gtccacccct cgggaaatgg atatccttgg 2400 cttcgtgagt gcttgcaacg acttttcagt gagactacta agggacacta cgcatattga 2460 acagaaggca ctggctcaag gcctgggcca aatgctcgag tcaatgatcg ataataccgt 2520 gagagagacc gtaggtgcag cgacctcaag ggacgcgttg cctaataccg aggcgtccgg 2580 gccgactcac agtaaagaga taccagcgtt aacagcagtc gaaaccggtg cgactaatcc 2640 cttggtgcca agcgatacag tgcaaacaag gcacgtagtc cagcaccgat ccaggtcgga 2700 aagctctatc gagtcctttt ttgctagggg ggcttgtgtc actataatga cagtcgacaa 2760 tccggcatca acaaccaaca aagacaagtt attcgctgta tggaaaatta cctacaagga 2820 caccgtccaa ctgagacgga agttagaatt ctttacatac tcacggttcg acatggaatt 2880 gactttcgta gtgaccgcta actttaccga aaccaataac ggtcacgccc tgaatcaggt 2940 ataccagatc atgtacgtcc ctcctggggc accagttccg gagaaatggg atgactatac 3000 ttggcagaca tctagcaacc ctagcatttt ctacacttat ggtaccgccc ccgctagaat 3060 tagtgtgcct tacgtaggaa tttcaaacgc atatagccat ttctacgacg gattctcaaa 3120 ggtgccatta aaggatcaga gcgcggcctt gggggattcg ttgtacggag ccgcttcatt 3180 gaacgatttc gggatactag cagtcagggt cgtgaacgac cataacccta ctaaagtgac 3240 atcgaagata cgcgtctacc ttaagccaaa acacatcagg gtgtggtgtc ctaggccgcc 3300 aagagccgtc gcctattatg gtcccggtgt cgattataaa gacggaaccc tgaccccatt 3360 gtcaactaaa gacctaacca cttatggatt cggacaccaa aacaaagcgg tgtacactgc 3420 aggttacaaa atttgcaact accacttggc cactcaggat gatttgcaaa acgcagtgaa 3480 cgtcatgtgg agtagagacc tcttagtcac agaatcaaga gcccagggca ccgattcaat 3540 cgcaaggtgc aattgcaacg caggggtgta ctactgcgag tctagaagga aatactaccc 3600 agtatccttc gttggcccaa cgttccagta catggaggct aataactatt acccagctag 3660 gtaccagtcc catatgctca ttggccatgg attcgcatct ccaggggatt gtggtggcat 3720 actcagatgt caccacgggg tgatagggat cattactgct ggtggagaag ggttggttgc 3780 attttcagac attagagact tgtatgccta cgaagaagaa gccatggaac aaggcctcac 3840 caattacata gagtcacttg gggccgcatt tggaagtgga tttactcagc agattagcga 3900 caaaataaca gagttgacca atatggtgac cagtaccatc actgaaaagc tacttaagaa 3960 cttgatcaag atcatatcct cactagttat tataactagg aactatgaag acaccacaac 4020 agtgctcgct accctggccc ttcttgggtg tgatgcttca ccatggcagt ggcttagaaa 4080 gaaagcatgc gatgttctgg agatacctta tgtcatcaag caaggtgaca gttggttgaa 4140 gaagtttact gaagcatgca acgcagctaa gggactggag tgggtgtcaa acaaaatctc 4200 aaaattcatt gattggctca aggagaaaat tatcccacaa gctagagata agttggaatt 4260 tgtaacaaaa cttagacaac tagaaatgct ggaaaaccaa atctcaacta tacaccaatc 4320 atgccctagt caggaacacc aggaaattct attcaataat gtcagatggt tatccatcca 4380 gtctaagagg tttgcccctc tttacgcagt ggaagccaaa agaatacaga aactcgagca 4440 tactattaac aactacatac agttcaagag caaacaccgt attgaaccag tatgtttgct 4500 agtacatggc agccccggaa caggtaaatc tgtagcaacc aacctgattg ctagagccat 4560 agctgaaaga gaaaacacgt ccacgtactc gctacccccg gatccatcac acttcgacgg 4620 atacaaacaa cagggagtgg tgattatgga cgacctgaat caaaacccag atggtgcgga 4680 catgaagctg ttctgtcaga tggtatcaac agtggagttt ataccaccca tggcatccct 4740 ggaggagaaa ggaatcctgt ttacttcaaa ttacgttcta gcatccacaa actcaagcag 4800 aatttccccc cccactgtgg cacacagtga cgcgttagcc aggcgctttg cgttcgacat 4860 ggacattcag gtcatgaatg agtattctag agatgggaaa ttgaacatgg ccatggctac 4920 tgaaatgtgt aagaactgtc accaaccagc aaactttaag agatgctgtc ctttagtgtg 4980 tggtaaggca attcaattaa tggacaaatc ttccagagtt agatacagta ttgaccagat 5040 cactacaatg attatcaatg agagaaacag aagatccaac attggcaatt gtatggaggc 5100 tttgtttcaa ggaccactcc agtataaaga cttgaaaatt gacatcaaga cgagtccccc 5160 tcctgaatgt atcaatgact tgctccaagc agttgactcc caggaggtga gagattactg 5220 tgagaagaag ggttggatag ttaacatcac cagccaggtt caaacagaaa ggaacatcaa 5280 cagggcaatg acaattctac aagcggtgac aaccttcgcc gcagtggctg gagttgtcta 5340 tgtcatgtat aaactgtttg ctggacacca gggagcatac actggtttac caaacaaaaa 5400 acccaacgtg cccaccattc ggacagcaaa ggtacaagga ccagggttcg attacgcagt 5460 ggctatggct aaaagaaaca ttgttacagc aactactagc aagggagagt tcactatgtt 5520 aggagtccac gacaacgtgg ctattttacc aacccacgct tcacctggtg aaagcattgt 5580 gatcgatggc aaagaagtgg agatcttgga tgccaaagcg ctcgaagatc aagcaggaac 5640 caatcttgaa atcactataa tcactctaaa gagaaatgaa aagttcagag acattagacc 5700 acatatacct actcaaatca ctgagacaaa tgatggagtc ttgatcgtga acactagcaa 5760 gtaccccaat atgtatgttc ctgtcggtgc tgtgactgaa cagggatatc taaatctcgg 5820 tgggcgccaa actgctcgta ctctaatgta caactttcca accagagcag gacagtgtgg 5880 tggagtcatc acatgtactg ggaaagtcat cgggatgcat gttggtggga acggttcaca 5940 cgggtttgca gcggccctga agcgatcata cttcactcag agtcaaggtg aaatccagtg 6000 gatgagacct tcgaaggaag tgggatatcc aatcataaat gccccgtcca aaaccaagct 6060 tgaacccagt gctttccact atgtgtttga aggggtgaag gaaccagcag tcctcactaa 6120 aaacgatccc aggcttaaga cagactttga ggaggcaatt ttctccaagt acgtgggtaa 6180 caaaattact gaagtggatg agtacatgaa agaggcagta gaccactatg ctggccagct 6240 catgtcacta gacatcaaca tagaacaaat gtgcttggag gatgccatgt atggcactga 6300 tggtctagaa gcacttgatt tgtccaccag tgctggctac ccttatgtag caatgggaaa 6360 gaagaagaga gacatcttga acaaacaaac cagagacact aaggaaatgc aaaaactgct 6420 cgacacatat ggaatcaacc tcccactggt gacttatgta aaggatgaac ttagatccaa 6480 aacaaaggtt gagcagggga aatccagatt aattgaagct tctagtttga atgactcagt 6540 ggcaatgaga atggcttttg ggaacctata tgctgctttt cacaaaaacc caggagtgat 6600 aacaggttca gcagtggggt gcgatccaga tttgttttgg agcaaaattc cggtattgat 6660 ggaagagaag ctgtttgctt ttgactacac agggtatgat gcatctctca gccctgcttg 6720 gttcgaggca ctaaagatgg tgcttgagaa aatcggattc ggagacagag ttgactacat 6780 cgactaccta aaccactcac accacctgta caagaataaa acatactgtg tcaagggcgg 6840 tatgccatct ggctgctcag gcacttcaat ttttaactca atgattaaca acttgattat 6900 caggacactc ttactgaaaa cctacaaggg catagattta gaccacctaa aaatgattgc 6960 ctatggtgat gatgtaattg cttcctaccc ccatgaagtt gacgctagtc tcctagccca 7020 atcaggaaaa gactatggac taactatgac tccagctgac aaatcagcta catttgaaac 7080 agtcacatgg gagaatgtaa cattcttgaa gagattcttc agggcagacg agaaataccc 7140 atttcttatt catccagtaa tgccaatgaa ggaaattcat gaatcaatta gatggacaaa 7200 agatcctagg aacactcagg atcacgttcg ctctctgtgc cttttagctt ggcacaatgg 7260 cgaagaagaa tataacaaat tcctagctaa aatcaggagt gtgccaattg gaagagcttt 7320 attgctccca gagtactcaa cattgtaccg ccgttggctt gactcatttt agtaacccta 7380 cctcagtcga attggattgg gtcatactgg tgtaggggta aatttttctt taattcggag 7440 g 7441 <210> 7 <211> 32 <212> DNA <213> Unknown <220> <223> synthetic <400> 7 gcactgataa tgaactcctc tggatctact gg 32 <210> 8 <211> 32 <212> DNA <213> Unknown <220> <223> synthetic <400> 8 ccagtagatc cagaggagtt cattatcagt gc 32 <210> 9 <211> 50 <212> DNA <213> Unknown <220> <223> synthetic <400> 9 caagaattcc tgaccacata cggtgctcag gtttcatcac agaaagtggg 50 <210> 10 <211> 50 <212> DNA <213> synthetic <400> 10 caagaattcc tgaccacata cggtgcgcaa gtatcgtcgc aaaaagtagg 50 <210> 11 <211> 40 <212> DNA <213> Unknown <220> <223> synthetic <400> 11 ttcgaattct ccatatgtgg tcagatcctt ggtggagagg 40 <210> 12 <211> 41 <212> DNA <213> Unknown <220> <223> synthetic <400> 12 ttcgaattct ccatacgtcg ttaaatcttt cgtcgataac g 41 <210> 13 <211> 2341 <212> DNA <213> Influenza virus <400> 13 agcgaaagca ggcaaaccat ttgaatggat gtcaatccga ccttactttt cttaaaagtg 60 ccagcacaaa atgctataag cacaactttc ccttatactg gagaccctcc ttacagccat 120 gggacaggaa caggatacac catggatact gtcaacagga cacatcagta ctcagaaaag 180 ggaagatgga caacaaacac cgaaactgga gcaccgcaac tcaacccgat tgatgggcca 240 ctgccagaag acaatgaacc aagtggttat gcccaaacag attgtgtatt ggaagcaatg 300 gctttccttg aggaatccca tcctggtatt tttgaaaact cgtgtattga aacgatggag 360 gttgttcagc aaacacgagt agacaagctg acacaaggcc gacagaccta tgactggact 420 ctaaatagaa accaacctgc tgcaacagca ttggccaaca caatagaagt gttcagatca 480 aatggcctca cggccaatga gtctggaagg ctcatagact tccttaagga tgtaatggag 540 tcaatgaaaa aagaagaaat ggggatcaca actcattttc agagaaagag acgggtgaga 600 gacaatatga ctaagaaaat gataacacag agaacaatag gtaaaaagaa gcagagattg 660 aacaaaagga gttatctaat tagagcattg accctgaaca caatgaccaa agatgctgag 720 agagggaagc taaaacggag agcaattgca accccaggga tgcaaataag ggggtttgta 780 tactttgttg agacactggc aaggagtata tgtgagaaac ttgaacaatc agggttgcca 840 gttggaggca atgagaagaa agcaaagttg gcaaatgttg taaggaagat gatgaccaat 900 tctcaggaca ccgaactttc tttcaccatc actggagata acaccaaatg gaacgaaaat 960 cagaatcctc ggatgttttt ggccatgatc acatatatga caagaaatca gcccgaatgg 1020 ttcagaaatg ttctaagtat tgctccaata atgttctcaa acaaaatggc gagactggga 1080 aaagggtata tgtttgagag caagagtatg aaacttagaa ctcaaatacc tgcagaaatg 1140 ctagcaagca tcgatttgaa atatttcaat gattcaacaa gaaagaagat tgaaaaaatc 1200 cgaccgctct taatagaggg gactgcatca ttgagccctg gaatgatgat gggcatgttc 1260 aatatgttaa gcactgtatt aggcgtctcc atcctgaatc ttggacaaaa gagatacacc 1320 aagactactt actggtggga tggtcttcaa tcctctgacg attttgctct gattgtgaat 1380 gcacccaatc atgaagggat tcaagccgga gtcgacaggt tttatcgaac ctgtaagcta 1440 cttggaatca atatgagcaa gaaaaagtct tacataaaca gaacaggtac atttgaattc 1500 acaagttttt tctatcgtta tgggtttgtt gccaatttca gcatggagct ccccagtttt 1560 ggggtgtctg ggatcaacga gtcagcggac atgagtattg gagttactgt catcaaaaac 1620 aatatgataa acaatgatct tggtccagca acagctcaaa tggcccttca gttgttcatc 1680 aaagattaca ggtacacgta ccgatgccat agaggtgaca cacaaataca aacccgaaga 1740 tcatttgaaa taaagaaact gtgggagcaa acccgttcca aagctggact gctggtctcc 1800 gacggaggcc caaatttata caacattaga aatctccaca ttcctgaagt ctgcctaaaa 1860 tgggaattga tggatgagga ttaccagggg cgtttatgca acccactgaa cccatttgtc 1920 agccataaag aaattgaatc aatgaacaat gcagtgatga tgccagcaca tggtccagcc 1980 aaaaacatgg agtatgatgc tgttgcaaca acacactcct ggatccccaa aagaaatcga 2040 tccatcttga atacaagtca aagaggagta cttgaagatg aacaaatgta ccaaaggtgc 2100 tgcaatttat ttgaaaaatt cttccccagc agttcataca gaagaccagt cgggatatcc 2160 agtatggtgg aggctatggt ttccagagcc cgaattgatg cacggattga tttcgaatct 2220 ggaaggataa agaaagaaga gttcactgag atcatgaaga tctgttccac cattgaagag 2280 ctcagacggc aaaaatagtg aatttagctt gtccttcatg aaaaaatgcc ttgtttctac 2340 t 2341 <210> 14 <211> 2341 <212> DNA <213> unknown <220> <223> synthetic <400> 14 agcgaaagca ggcaaaccat ttgaatggat gtcaatccga ccttactttt cttaaaagtg 60 ccagcacaaa atgctataag cacaactttc ccttatactg gagaccctcc ttacagccat 120 gggacaggaa caggatacac catggatact gtcaacagga cacatcagta ctcagaaaag 180 ggaagatgga caacaaacac cgaaactgga gcaccgcaac tcaacccgat tgatgggcca 240 ctgccagaag acaatgaacc aagtggttat gcccaaacag attgtgtatt ggaagcaatg 300 gctttccttg aggaatccca tcctggtatt tttgaaaact cgtgtattga aacgatggag 360 gttgttcagc aaacacgagt agacaagctg acacaaggcc gacagaccta tgactggact 420 ctaaatagaa accaacctgc tgcaacagca ttggccaaca caatagaagt gttcagatca 480 aatggcctca cggccaatga gtctggaagg ctcatagact tccttaagga cgttatggag 540 tctatgaaaa aagaggaaat ggggattacg acacattttc aacgaaaaag acgggttagg 600 gataatatga caaaaaaaat gattacgcaa cgaacaatcg gaaagaaaaa acagagactg 660 aataagcgat catacttgat tagggcactt acacttaaca ctatgactaa ggacgccgaa 720 aggggaaagc taaagcgtag agcaattgca acacccggaa tgcaaattag ggggttcgta 780 tacttcgtcg agacactcgc tagatccata tgcgaaaagt tagagcaatc cggactgcca 840 gtcgggggga acgaaaaaaa agcgaaactc gctaacgtcg ttagaaaaat gatgactaat 900 agtcaggata ccgaactgtc atttacgatt accggcgata atactaagtg gaacgagaat 960 cagaatccta gaatgtttct cgcaatgatc acatatatga cacgtaacca acccgaatgg 1020 tttagaaacg tactgtcaat cgcaccaatt atgtttagca ataagatggc tagattgggc 1080 aaggggtata tgtttgaatc taagagtatg aaattgcgaa cacagatacc tgccgaaatg 1140 ctagcatcaa tcgatctaaa gtactttaac gatagtacac gaaaaaaaat cgaaaagatt 1200 agaccgttac tgatagaggg aaccgccagc ctatcccccg gaatgatgat ggggatgttt 1260 aatatgctta gtaccgtgtt aggcgttagc atacttaact tagggcaaaa acgttatact 1320 aagactacat attggtggga cggactgcaa tctagcgacg atttcgcact aatcgttaac 1380 gcacctaacc atgaggggat acaagccgga gtcgatagat tctatagaac atgcaaactg 1440 ttagggatta atatgtctaa aaaaaagtca tacataaata gaaccggaac atttgaattc 1500 actagctttt tttacagata cggattcgtt gctaatttta gtatggagtt acctagtttc 1560 ggagttagcg gaattaacga atccgccgat atgtcaatcg gcgtaaccgt tattaagaat 1620 aatatgatta ataacgatct agggccagca accgcacaaa tggcattgca gttgttcata 1680 aaggattatc gttatacata tagatgtcat agaggcgata cacagataca gactagacga 1740 tcatttgaaa tcaaaaaatt gtgggagcaa actaggtcta aagccggact gttagtgtcc 1800 gacggagggc ctaatctata caatattagg aatctgcata tacccgaagt gtgtctaaag 1860 tgggagctta tggacgaaga ctatcagggg agattgtgca atccgcttaa cccattcgtt 1920 agccataaag agatagagtc aatgaataac gccgttatga tgccagcaca cggacccgct 1980 aagaatatgg aatacgacgc agtcgcaact acacatagtt ggataccgaa acggaatcga 2040 tccatactga atacatccca aagaggcgta ctcgaagacg aacaaatgta ccaacggtgt 2100 tgcaatctat ttgaaaaatt ttttcctagt agtagctata gacgaccagt cgggatatcc 2160 agtatggtgg aggctatggt ttccagagcc cgaattgatg cacggattga tttcgaatct 2220 ggaaggataa agaaagaaga gttcactgag atcatgaaga tctgttccac cattgaagag 2280 ctcagacggc aaaaatagtg aatttagctt gtccttcatg aaaaaatgcc ttgtttctac 2340 t 2341 <210> 15 <211> 2341 <212> DNA <213> unknown <220> <223> synthetic <400> 15 agcgaaagca ggcaaaccat ttgaatggat gtcaatccga ccttactttt cttaaaagtg 60 ccagcacaaa atgctataag cacaactttc ccttatactg gagaccctcc ttacagccat 120 gggacaggaa caggatacac catggatact gtcaacagga cacatcagta ctcagaaaag 180 ggaagatgga caacaaacac cgaaactgga gcaccgcaac tcaacccgat tgatgggcca 240 ctgccagaag acaatgaacc aagtggttat gcccaaacag attgtgtatt ggaagcaatg 300 gctttccttg aggaatccca tcctggtatt tttgaaaact cgtgtattga aacgatggag 360 gttgttcagc aaacacgagt agacaagctg acacaaggcc gacagaccta tgactggact 420 ctaaatagaa accaacctgc tgcaacagca ttggccaaca caatagaagt gttcagatca 480 aatggcctca cggccaatga gtctggaagg ctcatagact tccttaagga cgttatggag 540 tctatgaaaa aagaggaaat ggggattacg acacattttc aacgaaaaag acgggttagg 600 gataatatga caaaaaaaat gattacgcaa cgaacaatcg gaaagaaaaa acagagactg 660 aataagcgat catacttgat tagggcactt acacttaaca ctatgactaa ggacgccgaa 720 aggggaaagc taaagcgtag agcaattgca acacccggaa tgcaaattag ggggttcgta 780 tacttcgtcg agacactcgc tagatccata tgcgaaaagt tagagcaatc cggactgcca 840 gtcgggggga acgaaaaaaa agcgaaactc gctaacgtcg ttagaaaaat gatgactaat 900 agtcaggata ccgaactgtc atttacgatt accggcgata atactaagtg gaacgagaat 960 cagaatccta gaatgtttct cgcaatgatc acatatatga cacgtaacca acccgaatgg 1020 tttagaaacg tactgtcaat cgcaccaatt atgtttagca ataagatggc tagattgggc 1080 aaggggtata tgtttgaatc taagagtatg aaattgcgaa cacagatacc tgccgaaatg 1140 ctagcatcaa tcgatctaaa gtactttaac gatagtacac gaaaaaaaat cgaaaagatt 1200 agaccgttac tgatagaggg aaccgccagc ctatcccccg gaatgatgat ggggatgttt 1260 aatatgctta gtaccgtgtt aggcgttagc atacttaact tagggcaaaa acgttatact 1320 aagactacat attggtggga cggactgcaa tctagcgacg atttcgcact aatcgttaac 1380 gcacctaacc atgaggggat acaagccgga gtcgatagat tctatagaac atgcaaactg 1440 ttagggatta atatgtctaa aaaaaagtca tacataaata gaaccggaac atttgaattc 1500 acaagttttt tctatcgtta tgggtttgtt gccaatttca gcatggagct ccccagtttt 1560 ggggtgtctg ggatcaacga gtcagcggac atgagtattg gagttactgt catcaaaaac 1620 aatatgataa acaatgatct tggtccagca acagctcaaa tggcccttca gttgttcatc 1680 aaagattaca ggtacacgta ccgatgccat agaggtgaca cacaaataca aacccgaaga 1740 tcatttgaaa taaagaaact gtgggagcaa acccgttcca aagctggact gctggtctcc 1800 gacggaggcc caaatttata caacattaga aatctccaca ttcctgaagt ctgcctaaaa 1860 tgggaattga tggatgagga ttaccagggg cgtttatgca acccactgaa cccatttgtc 1920 agccataaag aaattgaatc aatgaacaat gcagtgatga tgccagcaca tggtccagcc 1980 aaaaacatgg agtatgatgc tgttgcaaca acacactcct ggatccccaa aagaaatcga 2040 tccatcttga atacaagtca aagaggagta cttgaagatg aacaaatgta ccaaaggtgc 2100 tgcaatttat ttgaaaaatt cttccccagc agttcataca gaagaccagt cgggatatcc 2160 agtatggtgg aggctatggt ttccagagcc cgaattgatg cacggattga tttcgaatct 2220 ggaaggataa agaaagaaga gttcactgag atcatgaaga tctgttccac cattgaagag 2280 ctcagacggc aaaaatagtg aatttagctt gtccttcatg aaaaaatgcc ttgtttctac 2340 t 2341 <210> 16 <211> 2341 <212> DNA <213> Influenza virus <400> 16 agcgaaagca ggtcaattat attcaatatg gaaagaataa aagaactaag aaatctaatg 60 tcgcagtctc gcacccgcga gatactcaca aaaaccaccg tggaccatat ggccataatc 120 aagaagtaca catcaggaag acaggagaag aacccagcac ttaggatgaa atggatgatg 180 gcaatgaaat atccaattac agcagacaag aggataacgg aaatgattcc tgagagaaat 240 gagcaaggac aaactttatg gagtaaaatg aatgatgcag gatcagaccg agtgatggta 300 tcacctctgg ctgtgacatg gtggaatagg aatggaccaa taacaaatac agttcattat 360 ccaaaaatct acaaaactta ttttgaaaga gtcgaaaggc taaagcatgg aacctttggc 420 cctgtccatt ttagaaacca agtcaaaata cgtcggagag ttgacataaa tcctggtcat 480 gcagatctca gtgccaagga ggcacaggat gtaatcatgg aagttgtttt ccctaacgaa 540 gtgggagcca ggatactaac atcggaatcg caactaacga taaccaaaga gaagaaagaa 600 gaactccagg attgcaaaat ttctcctttg atggttgcat acatgttgga gagagaactg 660 gtccgcaaaa cgagattcct cccagtggct ggtggaacaa gcagtgtgta cattgaagtg 720 ttgcatttga ctcaaggaac atgctgggaa cagatgtata ctccaggagg ggaagtgagg 780 aatgatgatg ttgatcaaag cttgattatt gctgctagga acatagtgag aagagctgca 840 gtatcagcag atccactagc atctttattg gagatgtgcc acagcacaca gattggtgga 900 attaggatgg tagacatcct taggcagaac ccaacagaag agcaagccgt ggatatatgc 960 aaggctgcaa tgggactgag aattagctca tccttcagtt ttggtggatt cacatttaag 1020 agaacaagcg gatcatcagt caagagagag gaagaggtgc ttacgggcaa tcttcaaaca 1080 ttgaagataa gagtgcatga gggatatgaa gagttcacaa tggttgggag aagagcaaca 1140 gccatactca gaaaagcaac caggagattg attcagctga tagtgagtgg gagagacgaa 1200 cagtcgattg ccgaagcaat aattgtggcc atggtatttt cacaagagga ttgtatgata 1260 aaagcagtca gaggtgatct gaatttcgtc aatagggcga atcagcgatt gaatcctatg 1320 catcaacttt taagacattt tcagaaggat gcgaaagtgc tttttcaaaa ttggggagtt 1380 gaacctatcg acaatgtgat gggaatgatt gggatattgc cagacatgac tccaagcatc 1440 gagatgtcaa tgagaggagt gagaatcagc aaaatgggtg tagatgagta ctccagcacg 1500 gagagggtag tggtgagcat tgaccgtttt ttgagaatcc gggaccaacg aggaaatgta 1560 ctactgtctc ccgaggaggt cagtgaaaca cagggaacag agaaactgac aataacttac 1620 tcatcgtcaa tgatgtggga gattaatggt cctgaatcag tgttggtcaa tacctatcaa 1680 tggatcatca gaaactggga aactgttaaa attcagtggt cccagaaccc tacaatgcta 1740 tacaataaaa tggaatttga accatttcag tctttagtac ctaaggccat tagaggccaa 1800 tacagtgggt ttgtaagaac tctgttccaa caaatgaggg atgtgcttgg gacatttgat 1860 accgcacaga taataaaact tcttcccttc gcagccgctc caccaaagca aagtagaatg 1920 cagttctcct catttactgt gaatgtgagg ggatcaggaa tgagaatact tgtaaggggc 1980 aattctcctg tattcaacta taacaaggcc acgaagagac tcacagttct cggaaaggat 2040 gctggcactt taactgaaga cccagatgaa ggcacagctg gagtggagtc cgctgttctg 2100 aggggattcc tcattctggg caaagaagac aagagatatg ggccagcact aagcatcaat 2160 gaactgagca accttgcgaa aggagagaag gctaatgtgc taattgggca aggagacgtg 2220 gtgttggtaa tgaaacggaa acgggactct agcatactta ctgacagcca gacagcgacc 2280 aaaagaattc ggatggccat caattagtgt cgaatagttt aaaaacgacc ttgtttctac 2340 t 2341 <210> 17 <211> 2341 <212> DNA <213> unknown <220> <223> synthetic <400> 17 agcgaaagca ggtcaattat attcaatatg gagagaatca aagagcttag gaatcttatg 60 tcacaatcta gaactagaga gatactgact aagactacag tcgatcatat ggctataatc 120 aaaaaatata ctagcggaag acaggaaaaa aatcccgcac ttagaatgaa atggatgatg 180 gctatgaaat accctattac agccgataag cgaattaccg aaatgatacc agagagaaac 240 gaacagggac agacattgtg gtctaaaatg aacgacgccg gatccgatag agtgatggtt 300 tcgccactag ccgtaacatg gtggaataga aacggaccta ttacgaatac agtgcattac 360 cctaagatat acaaaacata tttcgaaaga gtcgagagac tgaaacacgg aacattcgga 420 ccagtgcatt ttcggaatca ggttaagatt agacgtagag tcgatattaa tccagggcat 480 gcagatctct ccgctaaaga ggcacaagac gttattatgg aggtcgtgtt tcctaacgag 540 gtcggcgcta ggatactgac tagcgaatcg caattgacaa ttacgaaaga gaaaaaagag 600 gaactccagg attgcaaaat tagcccactt atggtcgcat atatgctcga acgcgaattg 660 gttagaaaga ctagattcct accagtcgca ggcggaacgt ctagcgtgta tatcgaagtg 720 ttgcatctaa cacagggaac atgttgggag caaatgtata ctccaggagg cgaagtgaga 780 aacgacgacg ttgatcaatc gctaatcata gccgctagga atatagtgag aagggcagcc 840 gttagcgcag acccacttgc gtcactactc gaaatgtgcc atagtacgca aatcggaggg 900 attagaatgg tcgatatcct taggcagaat cctacagagg aacaggccgt agacatatgc 960 aaagccgcaa tgggattgcg aattagctca tcattctcat tcggagggtt tacgtttaaa 1020 cggactagcg gatctagcgt aaaacgcgaa gaggaagtgc ttactggcaa tctgcaaaca 1080 ctaaagatta gggtgcatga gggatacgaa gagtttacaa tggtcggacg tagagcaacc 1140 gctatactta gaaaagcgac taggagactg atacaattga tcgttagcgg aagggacgaa 1200 cagtcaatcg ccgaagcgat aatagtcgca atggtgtttt cgcaagagga ttgcatgatt 1260 aaggccgtta ggggggatct gaatttcgtt aatagggcta atcagagact gaatcctatg 1320 catcaattgc ttagacattt tcagaaagac gctaaagtgt tgtttcagaa ttggggagtc 1380 gaacctatcg ataacgttat gggtatgata gggatactgc cagatatgac accatcaatc 1440 gaaatgtcaa tgagaggcgt taggattagt aagatgggcg tagacgaata ctccagcact 1500 gagagagtgg tagtgtcaat cgatagattt cttaggatta gggatcagag aggcaacgta 1560 ctgctatcac ccgaagaagt tagcgaaaca cagggaaccg aaaaattgac aattacgtat 1620 agtagtagta tgatgtggga gattaacgga ccagagtcag tgttagtgaa tacatatcaa 1680 tggataatac ggaattggga gacagtgaaa atacaatggt cacagaatcc tacaatgcta 1740 tacaataaga tggagttcga accttttcaa tcgttagtgc ctaaggccat aagaggccaa 1800 tatagtgggt tcgttagaac attgtttcag caaatgagag acgtactcgg aacattcgat 1860 accgcacaga taattaagct attgccattc gcagccgcac cacctaagca atctagaatg 1920 caattttcta gctttaccgt taacgttagg ggatccggaa tgcgaatact cgttaggggg 1980 aatagtccag tgtttaatta caataaggca actaagagat tgacagtgtt aggcaaggac 2040 gcaggaacat tgaccgaaga cccagacgag ggaaccgctg gagtggaatc cgcagtgctt 2100 agggggtttc tgatactcgg aaaggaggat aagagatacg gacctgcact atcgattaac 2160 gaactatcta atctcgctaa aggcgaaaaa gcgaatgtgt taatcggaca gggagacgta 2220 gtgttagtga tgaaacggaa acgcgatagc tcaatactga cagactcaca aaccgctact 2280 aagagaattc ggatggcaat taattagtgt cgaatagttt aaaaacgacc ttgtttctac 2340 t 2341 <210> 18 <211> 2233 <212> DNA <213> Influenza virus <400> 18 agcgaaagca ggtactgatc caaaatggaa gattttgtgc gacaatgctt caatccgatg 60 attgtcgagc ttgcggaaaa aacaatgaaa gagtatgggg aggacctgaa aatcgaaaca 120 aacaaatttg cagcaatatg cactcacttg gaagtatgct tcatgtattc agattttcac 180 ttcatcaatg agcaaggcga gtcaataatc gtagaacttg gtgatccaaa tgcacttttg 240 aagcacagat ttgaaataat cgagggaaga gatcgcacaa tggcctggac agtagtaaac 300 agtatttgca acactacagg ggctgagaaa ccaaagtttc taccagattt gtatgattac 360 aaggagaata gattcatcga aattggagta acaaggagag aagttcacat atactatctg 420 gaaaaggcca ataaaattaa atctgagaaa acacacatcc acattttctc gttcactggg 480 gaagaaatgg ccacaaaggc agactacact ctcgatgaag aaagcagggc taggatcaaa 540 accagactat tcaccataag acaagaaatg gccagcagag gcctctggga ttcctttcgt 600 cagtccgaga gaggagaaga gacaattgaa gaaaggtttg aaatcacagg aacaatgcgc 660 aagcttgccg accaaagtct cccgccgaac ttctccagcc ttgaaaattt tagagcctat 720 gtggatggat tcgaaccgaa cggctacatt gagggcaagc tgtctcaaat gtccaaagaa 780 gtaaatgcta gaattgaacc ttttttgaaa acaacaccac gaccacttag acttccgaat 840 gggcctccct gttctcagcg gtccaaattc ctgctgatgg atgccttaaa attaagcatt 900 gaggacccaa gtcatgaagg agagggaata ccgctatatg atgcaatcaa atgcatgaga 960 acattctttg gatggaagga acccaatgtt gttaaaccac acgaaaaggg aataaatcca 1020 aattatcttc tgtcatggaa gcaagtactg gcagaactgc aggacattga gaatgaggag 1080 aaaattccaa agactaaaaa tatgaagaaa acaagtcagc taaagtgggc acttggtgag 1140 aacatggcac cagaaaaggt agactttgac gactgtaaag atgtaggtga tttgaagcaa 1200 tatgatagtg atgaaccaga attgaggtcg ctagcaagtt ggattcagaa tgagtttaac 1260 aaggcatgcg aactgacaga ttcaagctgg atagagctcg atgagattgg agaagatgtg 1320 gctccaattg aacacattgc aagcatgaga aggaattatt tcacatcaga ggtgtctcac 1380 tgcagagcca cagaatacat aatgaagggg gtgtacatca atactgcctt gcttaatgca 1440 tcttgtgcag caatggatga tttccaatta attccaatga taagcaagtg tagaactaag 1500 gagggaaggc gaaagaccaa cttgtatggt ttcatcataa aaggaagatc ccacttaagg 1560 aatgacaccg acgtggtaaa ctttgtgagc atggagtttt ctctcactga cccaagactt 1620 gaaccacata aatgggagaa gtactgtgtt cttgagatag gagatatgct tataagaagt 1680 gccataggcc aggtttcaag gcccatgttc ttgtatgtga gaacaaatgg aacctcaaaa 1740 attaaaatga aatggggaat ggagatgagg cgttgcctcc tccagtcact tcaacaaatt 1800 gagagtatga ttgaagctga gtcctctgtc aaagagaaag acatgaccaa agagttcttt 1860 gagaacaaat cagaaacatg gcccattgga gagtccccca aaggagtgga ggaaagttcc 1920 attgggaagg tctgcaggac tttattagca aagtcggtat tcaacagctt gtatgcatct 1980 ccacaactag aaggattttc agctgaatca agaaaactgc ttcttatcgt tcaggctctt 2040 agggacaacc ttgaacctgg gacctttgat cttggggggc tatatgaagc aattgaggag 2100 tgcctgatta atgatccctg ggttttgctt aatgcttctt ggttcaactc cttccttaca 2160 catgcattga gttagttgtg gcagtgctac tatttgctat ccatactgtc caaaaaagta 2220 ccttgtttct act 2233 <210> 19 <211> 2233 <212> DNA <213> unknown <220> <223> synthetic <400> 19 agcgaaagca ggtactgatc caaaatggag gatttcgtta ggcaatgctt taatccaatg 60 atagtcgagt tagccgaaaa gactatgaaa gagtatggcg aagacctaaa gattgagact 120 aataaattcg ccgcaatttg cacacacctt gaggtttgct ttatgtattc cgattttcac 180 tttattaacg aacagggaga gtcaattata gtcgagttag gcgatccgaa cgcattgcta 240 aagcatagat ttgaaattat agagggacgc gataggacaa tggcatggac cgtagttaat 300 tcgatttgca atacaaccgg agccgaaaaa ccgaaattct tacccgatct atacgattat 360 aaagagaata ggtttatcga aatcggagtg actagacgcg aagtgcatat ttattatctc 420 gaaaaagcga ataagattaa gtccgaaaag acacacatac acatttttag ctttaccgga 480 gaggaaatgg caacaaaagc cgattataca cttgacgaag agtctagggc taggattaag 540 actagactgt ttacaattag acaggaaatg gctagtaggg ggttgtggga tagctttaga 600 caatccgaaa gaggcgaaga gacaatcgaa gagagatttg aaattaccgg aacaatgcga 660 aagcttgccg atcaatccct accccccaat ttctctagcc ttgagaattt tagggcatac 720 gttgacggat tcgaacctaa cggatatata gagggaaagc tatcgcaaat gtctaaagag 780 gttaacgcta gaatcgaacc attcctaaag acaacaccta gaccacttag actgccaaac 840 ggaccaccat gctcacagcg atctaagttt ctgcttatgg acgcactaaa gttgtcaatc 900 gaagacccat cacacgaggg agaggggata ccattgtacg acgcaattaa gtgtatgcga 960 acatttttcg gatggaaaga gcctaacgta gtgaaaccac acgaaaaagg gattaatccg 1020 aattatctgc ttagttggaa acaggtgtta gccgaattgc aggatatcga aaacgaagag 1080 aaaattccga aaactaagaa tatgaaaaaa actagccaac tgaaatgggc acttggcgag 1140 aatatggcac ccgaaaaagt cgatttcgac gattgcaaag acgtcggcga tctaaagcaa 1200 tacgatagcg acgaacccga acttagatca ctcgctagtt ggatacagaa cgagttcaat 1260 aaggcatgcg aattgaccga tagctcatgg atagagcttg acgagatagg cgaagacgta 1320 gcaccaatcg aacacatagc ctctatgaga cggaattatt ttacatccga agtgtcacat 1380 tgtagggcaa cagagtatat tatgaaaggg gtgtatatta ataccgcatt gcttaacgct 1440 agttgcgccg caatggacga tttccaactg ataccgatga tctcgaagtg tagaacaaaa 1500 gagggacgta gaaagactaa tctgtatggg ttcattatta agggaaggtc tcatttaagg 1560 aacgatacag acgtagtgaa tttcgttagt atggagttta gccttaccga tccgagactc 1620 gaaccacaca aatgggaaaa gtattgcgta ctagagatag gggatatgtt gattagatcc 1680 gcaatcggac aggtttcgag accaatgttt ttgtacgtta ggactaacgg aacctcgaag 1740 attaaaatga aatggggaat ggagatgcgt agatgcctat tgcaatccct tcagcaaatc 1800 gaatctatga tagaggccga atctagcgtt aaagagaaag atatgacaaa agagtttttt 1860 gaaaataagt ccgaaacatg gccaatcgga gagtcaccaa aaggggttga ggaatcctca 1920 atcggaaaag tttgtagaac attgctcgca aaatccgtat tcaatagtct atacgccagc 1980 ccacaactag agggattctc tgctgagtca cgaaaactgt tactgatagt gcaagccctt 2040 agggataatc tcgaacccgg aacattcgat ctaggggggt tgtacgaagc aatcgaagag 2100 tgtctgatta acgatccatg ggtactgctt aacgctagtt ggtttaattc gttccttaca 2160 cacgcactat cttagttgtg gcagtgctac tatttgctat ccatactgtc caaaaaagta 2220 ccttgtttct act 2233 <210> 20 <211> 1775 <212> DNA <213> Influenza virus <400> 20 agcaaaagca ggggaaaata aaaacaacca aaatgaaggc aaacctactg gtcctgttaa 60 gtgcacttgc agctgcagat gcagacacaa tatgtatagg ctaccatgcg aacaattcaa 120 ccgacactgt tgacacagta ctcgagaaga atgtgacagt gacacactct gttaacctgc 180 tcgaagacag ccacaacgga aaactatgta gattaaaagg aatagcccca ctacaattgg 240 ggaaatgtaa catcgccgga tggctcttgg gaaacccaga atgcgaccca ctgcttccag 300 tgagatcatg gtcctacatt gtagaaacac caaactctga gaatggaata tgttatccag 360 gagatttcat cgactatgag gagctgaggg agcaattgag ctcagtgtca tcattcgaaa 420 gattcgaaat atttcccaaa gaaagctcat ggcccaacca caacacaaac ggagtaacgg 480 cagcatgctc ccatgagggg aaaagcagtt tttacagaaa tttgctatgg ctgacggaga 540 aggagggctc atacccaaag ctgaaaaatt cttatgtgaa caaaaaaggg aaagaagtcc 600 ttgtactgtg gggtattcat cacccgccta acagtaagga acaacagaat atctatcaga 660 atgaaaatgc ttatgtctct gtagtgactt caaattataa caggagattt accccggaaa 720 tagcagaaag acccaaagta agagatcaag ctgggaggat gaactattac tggaccttgc 780 taaaacccgg agacacaata atatttgagg caaatggaaa tctaatagca ccaatgtatg 840 ctttcgcact gagtagaggc tttgggtccg gcatcatcac ctcaaacgca tcaatgcatg 900 agtgtaacac gaagtgtcaa acacccctgg gagctataaa cagcagtctc ccttaccaga 960 atatacaccc agtcacaata ggagagtgcc caaaatacgt caggagtgcc aaattgagga 1020 tggttacagg actaaggaac actccgtcca ttcaatccag aggtctattt ggagccattg 1080 ccggttttat tgaaggggga tggactggaa tgatagatgg atggtatggt tatcatcatc 1140 agaatgaaca gggatcaggc tatgcagcgg atcaaaaaag cacacaaaat gccattaacg 1200 ggattacaaa caaggtgaac actgttatcg agaaaatgaa cattcaattc acagctgtgg 1260 gtaaagaatt caacaaatta gaaaaaagga tggaaaattt aaataaaaaa gttgatgatg 1320 gatttctgga catttggaca tataatgcag aattgttagt tctactggaa aatgaaagga 1380 ctctggattt ccatgactca aatgtgaaga atctgtatga gaaagtaaaa agccaattaa 1440 agaataatgc caaagaaatc ggaaatggat gttttgagtt ctaccacaag tgtgacaatg 1500 aatgcatgga aagtgtaaga aatgggactt atgattatcc caaatattca gaagagtcaa 1560 agttgaacag ggaaaaggta gatggagtga aattggaatc aatggggatc tatcagattc 1620 tggcgatcta ctcaactgtc gccagttcac tggtgctttt ggtctccctg ggggcaatca 1680 gtttctggat gtgttctaat ggatctttgc agtgcagaat atgcatctga gattagaatt 1740 tcagaaatat gaggaaaaac acccttgttt ctact 1775 <210> 21 <211> 1775 <212> DNA <213> unknown <220> <223> synthetic <400> 21 agcaaaagca ggggaaaata aaaacaacca aaatgaaggc aaacctactg gtcctgttaa 60 gtgcacttgc agctgcagat gcagacacaa tatgtatagg ctaccatgcg aacaattcaa 120 ccgacactgt tgacacagta ctcgagaaga atgtgacagt gacacactct gttaacctgt 180 tagaggactc acataacgga aagctatgta ggcttaaggg aatcgcacca ctgcaattgg 240 gcaagtgtaa tatagccgga tggttgttgg ggaatcccga atgcgatcca ctgttacccg 300 ttaggtcatg gtcatatata gtcgagacac ctaatagcga aaacggaatt tgttatcccg 360 gcgattttat cgattacgaa gagcttagag agcaattgtc tagcgttagt tcattcgaaa 420 gattcgaaat ttttccgaaa gagtctagtt ggccaaatca taatactaac ggagtgactg 480 ccgcatgctc acacgaaggc aagtctagct tttataggaa tctgttgtgg ttgactgaga 540 aagagggatc atatccgaaa ctgaaaaact catacgtgaa caaaaaggga aaggaagtgt 600 tagtgttgtg ggggatacac catccaccaa atagtaaaga gcaacagaat atatatcaga 660 acgaaaacgc atacgttagc gtcgtaacta gtaattataa tagaaggttt acacccgaaa 720 tcgcagagag accgaaagtt agagaccaag ccggaagaat gaattattat tggacactac 780 tgaaacccgg cgatacaatt atattcgaag cgaacggaaa tctgatcgca ccgatgtatg 840 cattcgcact atctaggggg ttcggatccg gaattattac tagtaacgct agtatgcacg 900 aatgtaacac gaagtgtcag actccactag gcgcaattaa ctctagtctg ccatatcaga 960 atatacatcc cgtaacaatc ggcgaatgcc caaaatacgt tagatccgct aagcttagaa 1020 tggttaccgg actgagaaat acaccatcaa tccaatctag ggggttgttc ggagcgatag 1080 ccggatttat cgaagggggg tggacaggga tgatagacgg ttggtacgga tatcatcacc 1140 aaaacgaaca gggatccgga tacgcagccg atcagaaatc gacgcaaaac gctattaacg 1200 gaattactaa taaagtgaat accgtaatcg aaaaaatgaa tatccaattt accgcagtcg 1260 gaaaggaatt caataagctt gagaaaagaa tggagaatct gaataaaaaa gtcgacgacg 1320 gatttctaga catatggact tataacgccg aactgttagt gttgctcgaa aacgaaagaa 1380 cactagactt tcacgactca aacgttaaga atctatacga aaaagtgaaa tcccaattga 1440 aaaataacgc taaagagata gggaacggat gtttcgagtt ctatcataaa tgcgataacg 1500 aatgtatgga atccgttagg aacggaacat acgattatcc taagtatagc gaagagtcaa 1560 aactgaatag ggagaaagtc gacggagtga aactcgaatc aatggggata tatcagatac 1620 tggcaatcta tagtacagtc gccagctcac tggttctttt ggtctccctg ggggcaatca 1680 gtttctggat gtgttctaat ggatctttgc agtgcagaat atgcatctga gattagaatt 1740 tcagaaatat gaggaaaaac acccttgttt ctact 1775 <210> 22 <211> 1565 <212> DNA <213> Influenza virus <400> 22 agcaaaagca gggtagataa tcactcactg agtgacatca aaatcatggc gtcccaaggc 60 accaaacggt cttacgaaca gatggagact gatggagaac gccagaatgc cactgaaatc 120 agagcatccg tcggaaaaat gattggtgga attggacgat tctacatcca aatgtgcacc 180 gaactcaaac tcagtgatta tgagggacgg ttgatccaaa acagcttaac aatagagaga 240 atggtgctct ctgcttttga cgaaaggaga aataaatacc tggaagaaca tcccagtgcg 300 gggaaagatc ctaagaaaac tggaggacct atatacagga gagtaaacgg aaagtggatg 360 agagaactca tcctttatga caaagaagaa ataaggcgaa tctggcgcca agctaataat 420 ggtgacgatg caacggctgg tctgactcac atgatgatct ggcattccaa tttgaatgat 480 gcaacttatc agaggacaag agctcttgtt cgcaccggaa tggatcccag gatgtgctct 540 ctgatgcaag gttcaactct ccctaggagg tctggagccg caggtgctgc agtcaaagga 600 gttggaacaa tggtgatgga attggtcagg atgatcaaac gtgggatcaa tgatcggaac 660 ttctggaggg gtgagaatgg acgaaaaaca agaattgctt atgaaagaat gtgcaacatt 720 ctcaaaggga aatttcaaac tgctgcacaa aaagcaatga tggatcaagt gagagagagc 780 cggaacccag ggaatgctga gttcgaagat ctcacttttc tagcacggtc tgcactcata 840 ttgagagggt cggttgctca caagtcctgc ctgcctgcct gtgtgtatgg acctgccgta 900 gccagtgggt acgactttga aagagaggga tactctctag tcggaataga ccctttcaga 960 ctgcttcaaa acagccaagt gtacagccta atcagaccaa atgagaatcc agcacacaag 1020 agtcaactgg tgtggatggc atgccattct gccgcatttg aagatctaag agtattaagc 1080 ttcatcaaag ggacgaaggt gctcccaaga gggaagcttt ccactagagg agttcaaatt 1140 gcttccaatg aaaatatgga gactatggaa tcaagtacac ttgaactgag aagcaggtac 1200 tgggccataa ggaccagaag tggaggaaac accaatcaac agagggcatc tgcgggccaa 1260 atcagcatac aacctacgtt ctcagtacag agaaatctcc cttttgacag aacaaccatt 1320 atggcagcat tcaatgggaa tacagaggga agaacatctg acatgaggac cgaaatcata 1380 aggatgatgg aaagtgcaag accagaagat gtgtctttcc aggggcgggg agtcttcgag 1440 ctctcggacg aaaaggcagc gagcccgatc gtgccttcct ttgacatgag taatgaagga 1500 tcttatttct tcggagacaa tgcagaggag tacgacaatt aaagaaaaat acccttgttt 1560 ctact 1565 <210> 23 <211> 1565 <212> DNA <213> unknown <220> <223> synthetic <400> 23 agcaaaagca gggtagataa tcactcactg agtgacatca aaatcatggc gtcccaaggc 60 accaaacggt cttacgaaca gatggagact gatggagaac gccagaatgc cactgaaatc 120 agagctagcg tcggaaaaat gataggggga atcggaaggt tttacataca aatgtgtacc 180 gaactcaaat tgtccgatta cgaagggaga ttgatccaaa atagtctgac aatcgaaaga 240 atggtgttaa gcgcattcga cgaaagacgg aataagtatc tcgaagagca tcctagcgca 300 ggcaaggatc caaaaaaaac cggagggcca atctatagga gagtgaacgg aaagtggatg 360 cgcgaactga tactgtacga taaagaggag attagacgga tatggcgaca agcgaataac 420 ggagacgacg ctactgccgg actgacacat atgatgatat ggcactctaa tcttaacgac 480 gctacatacc aacggactag ggcactcgtt agaaccggaa tggatcctag aatgtgctca 540 cttatgcagg gatctacact ccctagacga tccggagccg caggagcagc cgttaaggga 600 gtcggaacta tggttatgga actcgttaga atgataaaaa gggggattaa cgataggaat 660 ttttggagag gcgaaaacgg acgtaaaact agaatcgcat acgaaagaat gtgcaatata 720 ctcaaaggga aattccaaac cgcagcgcaa aaagctatga tggatcaagt tagggagtct 780 aggaatccag gaaatgccga attcgaagac cttacatttc tcgctcggtc cgcactaatc 840 cttcgcggat cagtcgcaca caaatcttgc ttacccgcat gcgtatacgg acctgcagtc 900 gctagcggat acgatttcga acgcgaaggg tatagtctag taggaattga tccatttaga 960 ttgctccaaa attcgcaagt gtatagtctg attagaccta acgagaatcc tgcacacaaa 1020 tctcaactcg tatggatggc atgccatagt gccgcattcg aagaccttag agtgctatct 1080 ttcataaagg gaacgaaagt gttgcctagg ggaaagctat ctactagggg agtgcaaatc 1140 gctagtaacg agaatatgga gactatggag tctagtacac tcgaactgag atctagatat 1200 tgggctatta ggactagatc cggagggaat acgaatcagc aacgagctag cgccgggcaa 1260 atctcaatcc aacctacatt ttccgtgcaa cggaatctgc cattcgatcg gacaacgatt 1320 atggccgcat tcaatgggaa taccgaggga cggactagcg atatgagaac cgaaattatc 1380 agaatgatgg aatccgctag accagaggac gtttcgtttc aaggacgggg agtcttcgag 1440 ctctcggacg aaaaggcagc gagcccgatc gtgccttcct ttgacatgag taatgaagga 1500 tcttatttct tcggagacaa tgcagaggag tacgacaatt aaagaaaaat acccttgttt 1560 ctact 1565 <210> 24 <211> 1413 <212> DNA <213> Influenza virus <400> 24 agcgaaagca ggggtttaaa atgaatccaa atcagaaaat aacaaccatt ggatcaatct 60 gtctggtagt cggactaatt agcctaatat tgcaaatagg gaatataatc tcaatatgga 120 ttagccattc aattcaaact ggaagtcaaa accatactgg aatatgcaac caaaacatca 180 ttacctataa aaatagcacc tgggtaaagg acacaacttc agtgatatta accggcaatt 240 catctctttg tcccatccgt gggtgggcta tatacagcaa agacaatagc ataagaattg 300 gttccaaagg agacgttttt gtcataagag agccctttat ttcatgttct cacttggaat 360 gcaggacctt ttttctgacc caaggtgcct tactgaatga caagcattca aatgggactg 420 ttaaggacag aagcccttat agggccttaa tgagctgccc tgtcggtgaa gctccgtccc 480 cgtacaattc aagatttgaa tcggttgctt ggtcagcaag tgcatgtcat gatggcatgg 540 gctggctaac aatcggaatt tcaggtccag ataatggagc agtggctgta ttaaaataca 600 acggcataat aactgaaacc ataaaaagtt ggaggaagaa aatattgagg acacaagagt 660 ctgaatgtgc ctgtgtaaat ggttcatgtt ttactataat gactgatggc ccgagtgatg 720 ggctggcctc gtacaaaatt ttcaagatcg aaaaggggaa ggttactaaa tcaatagagt 780 tgaatgcacc taattctcac tatgaggaat gttcctgtta ccctgatacc ggcaaagtga 840 tgtgtgtgtg cagagacaac tggcatggtt cgaaccggcc atgggtgtct ttcgatcaaa 900 acctggatta tcaaatagga tacatctgca gtggggtttt cggtgacaac ccgcgtcccg 960 aagatggaac aggcagctgt ggtccagtgt atgttgatgg agcaaacgga gtaaagggat 1020 tttcatatag gtatggtaat ggtgtttgga taggaaggac caaaagtcac agttccagac 1080 atgggtttga gatgatttgg gatcctaatg gatggacaga gactgatagt aagttctctg 1140 ttaggcaaga tgttgtggca atgactgatt ggtcagggta tagcggaagt ttcgttcaac 1200 atcctgagct aacagggcta gactgtatga ggccgtgctt ctgggttgaa ttaatcaggg 1260 gacgacctaa agaaaaaaca atctggacta gtgcgagcag catttctttt tgtggcgtga 1320 atagtgatac tgtagattgg tcttggccag acggtgctga gttgccattc agcattgaca 1380 agtagtctgt tcaaaaaact ccttgtttct act 1413 <210> 25 <211> 1413 <212> DNA <213> unknown <220> <223> synthetic <400> 25 agcgaaagca ggggtttaaa atgaatccaa atcagaaaat aacaaccatt ggatcaatct 60 gtctggtagt cggactaatt agcctaatat tgcaaatagg gaatataatc tcaatatgga 120 tttcgcattc aatccaaacc ggatcacaaa atcatacagg catatgcaat cagaatataa 180 ttacttataa aaatagtaca tgggtgaaag atactactag cgtgatacta accggcaatt 240 ctagtctatg tccgattagg gggtgggcta tatactctaa agacaatagt atacggatag 300 ggtctaaggg agacgttttc gtaattaggg aaccgtttat aagttgttca catctagagt 360 gtaggacctt ttttctgaca caaggcgcac tattaaacga taagcattct aacggtacag 420 ttaaggatag gtcaccttat agggcactta tgtcatgtcc cgtaggcgaa gcccctagtc 480 catacaatag tagatttgaa tccgttgcat ggtccgctag cgcatgtcac gacggaatgg 540 ggtggttgac tatagggatt agcggacccg ataacggagc cgttgccgta ctgaaatata 600 acggtataat taccgaaact attaagagtt ggcgtaaaaa aatattgcgt acacaagagt 660 ccgaatgcgc atgcgttaac ggatcatgtt ttacaattat gactgacgga cctagcgacg 720 ggttagcgtc atacaaaatt tttaaaatcg aaaaaggcaa ggttactaag tcaatcgagt 780 taaacgcacc taattcgcat tacgaagagt gttcatgtta tcccgatacc ggaaaggtta 840 tgtgcgtttg tagggataat tggcacggtt cgaacagacc ttgggtgtca ttcgatcaaa 900 atctagacta tcaaatcgga tatatatgta gcggagtgtt cggcgataat cctagaccag 960 aggacggtac aggcagctgt ggaccggttt acgttgacgg cgctaacggc gttaaggggt 1020 ttagttatag atacggcaat ggcgtatgga tcggtaggac taagtcacat agttctagac 1080 acggatttga aatgatatgg gatcctaacg gatggaccga aaccgactcg aagtttagcg 1140 ttaggcaaga cgtagtcgct atgaccgatt ggtccgggta tagcggatca ttcgtgcaac 1200 atccagagtt aaccggattg gattgtatgc gaccatgttt ttgggttgag ttgattaggg 1260 ggagaccgaa agagaaaact atatggacta gcgcgagcag catttctttt tgtggcgtga 1320 atagtgatac tgtagattgg tcttggccag acggtgctga gttgccattc agcattgaca 1380 agtagtctgt tcaaaaaact ccttgtttct act 1413 <210> 26 <211> 1026 <212> DNA <213> Influenza virus <400> 26 agcgaaagca ggtagatatt gaaagatgag tcttctaacc gaggtcgaaa cgtacgtact 60 ctctatcatc ccgtcaggcc ccctcaaagc cgagatcgca cagagacttg aagatgtctt 120 tgcagggaag aacactgatc ttgaggttct catggaatgg ctaaagacaa gaccaatcct 180 gtcacctctg actaagggga ttttaggatt tgtgttcacg ctcaccgtgc ccagtgagcg 240 aggactgcag cgtagacgct ttgtccaaaa tgcccttaat gggaacgggg atccaaataa 300 catggacaaa gcagttaaac tgtataggaa gctcaagagg gagataacat tccatggggc 360 caaagaaatc tcactcagtt attctgctgg tgcacttgcc agttgtatgg gcctcatata 420 caacaggatg ggggctgtga ccactgaagt ggcatttggc ctggtatgtg caacctgtga 480 acagattgct gactcccagc atcggtctca taggcaaatg gtgacaacaa ccaatccact 540 aatcagacat gagaacagaa tggttttagc cagcactaca gctaaggcta tggagcaaat 600 ggctggatcg agtgagcaag cagcagaggc catggaggtt gctagtcagg ctagacaaat 660 ggtgcaagcg atgagaacca ttgggactca tcctagctcc agtgctggtc tgaaaaatga 720 tcttcttgaa aatttgcagg cctatcagaa acgaatgggg gtgcagatgc aacggttcaa 780 gtgatcctct cgctattgcc gcaaatatca ttgggatctt gcacttgaca ttgtggattc 840 ttgatcgtct ttttttcaaa tgcatttacc gtcgctttaa atacggactg aaaggagggc 900 cttctacgga aggagtgcca aagtctatga gggaagaata tcgaaaggaa cagcagagtg 960 ctgtggatgc tgacgatggt cattttgtca gcatagagct ggagtaaaaa actaccttgt 1020 ttctac 1026 <210> 27 <211> 890 <212> DNA <213> Influenza virus <400> 27 agcaaaagca gggtgacaaa gacataatgg atccaaacac tgtgtcaagc tttcaggtag 60 attgctttct ttggcatgtc cgcaaacgag ttgcagacca agaactaggt gatgccccat 120 tccttgatcg gcttcgccga gatcagaaat ccctaagagg aaggggcagc accctcggtc 180 tggacatcga gacagccaca cgtgctggaa agcagatagt ggagcggatt ctgaaagaag 240 aatccgatga ggcacttaaa atgaccatgg cctctgtacc tgcgtcgcgt tacctaactg 300 acatgactct tgaggaaatg tcaagggact ggtccatgct catacccaag cagaaagtgg 360 caggccctct ttgtatcaga atggaccagg cgatcatgga taagaacatc atactgaaag 420 cgaacttcag tgtgattttt gaccggctgg agactctaat attgctaagg gctttcaccg 480 aagagggagc aattgttggc gaaatttcac cattgccttc tcttccagga catactgctg 540 aggatgtcaa aaatgcagtt ggagtcctca tcgggggact tgaatggaat gataacacag 600 ttcgagtctc tgaaactcta cagagattcg cttggagaag cagtaatgag aatgggagac 660 ctccactcac tccaaaacag aaacgagaaa tggcgggaac aattaggtca gaagtttgaa 720 gaaataagat ggttgattga agaagtgaga cacaaactga agataacaga gaatagtttt 780 gagcaaataa catttatgca agccttacat ctattgcttg aagtggagca agagataaga 840 actttctcgt ttcagcttat ttaataataa aaaacaccct tgtttctact 890 <210> 28 <211> 890 <212> DNA <213> unknown <220> <223> synthetic <400> 28 agcaaaagca gggtgacaaa gacataatgg atccaaacac tgtgtcaagc tttcaggtag 60 attgctttct ttggcatgtc cgcaaacgag ttgcagacca agaactaggt gatgccccat 120 tccttgaccg actgagacgg gatcagaaat cccttagggg caggggatcg accctaggcc 180 tagacatcga aaccgcaact agggccggaa agcagatcgt ggagcgtata ctgaaagagg 240 agtccgacga agcgcttaag atgactatgg ccagcgtacc cgctagtcgg taccttaccg 300 atatgacact cgaagagatg tcacgcgatt ggtctatgct aatccctaag cagaaagtgg 360 ccggacctct atgtatacgg atggaccagg cgattatgga caaaaacatt atccttaaag 420 cgaacttttc cgtgatattc gatcgcctag agactctgat actgttgcgt gcattcacag 480 aagagggagc aattgttggc gaaatttcac cattgccttc tcttccagga catactgctg 540 aggatgtcaa aaatgcagtt ggagtcctca tcgggggact tgaatggaat gataacacag 600 ttcgagtctc tgaaactcta cagagattcg cttggagaag cagtaatgag aatgggagac 660 ctccactcac tccaaaacag aaacgagaaa tggcgggaac aattaggtca gaagtttgaa 720 gaaataagat ggttgattga agaagtgaga cacaaactga agataacaga gaatagtttt 780 gagcaaataa catttatgca agccttacat ctattgcttg aagtggagca agagataaga 840 actttctcgt ttcagcttat ttaataataa aaaacaccct tgtttctact 890 <210> 29 <211> 7152 <212> DNA <213> Human rhinovirus 89 <400> 29 ttaaaactgg gagtgggttg ttcccactca ctccacccat gcggtgttgt actctgttat 60 tacggtaact ttgtacgcca gtttttccca cccttcccca taatgtaact tagaagtttg 120 tacaatatga ccaataggtg acaatcatcc agactgtcaa aggtcaagca cttctgtttc 180 cccggtcaat gaggatatgc tttacccaag gcaaaaacct tagagatcgt tatccccaca 240 ctgcctacac agagcccagt accatttttg atataattgg gttggtcgct ccctgcaaac 300 ccagcagtag acctggcaga tgaggctgga cattccccac tggcgacagt ggtccagcct 360 gcgtggctgc ctgctcaccc ttcttgggtg agaagcctaa ttattgacaa ggtgtgaaga 420 gccgcgtgtg ctcagtgtgc ttcctccggc ccctgaatgt ggctaacctt aaccctgcag 480 ccgttgccca taatccaatg ggtttgcggt cgtaatgcgt aagtgcggga tgggaccaac 540 tactttgggt gtccgtgttt cctgtttttc ttttgattgc attttatggt gacaatttat 600 agtgtataga ttgtcatcat gggtgcacaa gtatctagac aaaatgttgg gacacactcc 660 acacaaaatt cagtgagcaa tggatctagc ttaaattatt tcaacatcaa ttattttaaa 720 gacgcagctt caagtggtgc ttctagattg gatttttctc aagaccctag taaatttact 780 gatcctgtta aagatgtgtt agaaaagggt attccaacac ttcaatcacc aacagttgaa 840 gcttgtggtt attcagacag actaatacag ataacccgag gagattccac tataacatcc 900 caagatactg caaatgcagt tgttgcttat ggtgtgtggc catcatactt gactccagat 960 gatgcgactg ctattgacaa acccacacaa cctgatacat catccaacag attctacacc 1020 ttggacagtc gttcttggac atctgcctca tctggatggt ggtggaaatt gcctgatgcc 1080 cttaaaaaca tgggtatatt tggtgaaaat atgttttacc attttctagg gagatctgga 1140 tacacaatac atgtacaatg taattctagc aagtttcatc agggtttatt aatagttgcc 1200 gccatcccag aacatcaatt ggcatctgca acaagtggaa atgtatcagt cgggtacaat 1260 cacacccacc caggtgagca aggtagagaa gtagtaccat cacggacatc tagtgataat 1320 aaaagaccta gtgatgacag ttggttaaat tttgatggaa cattacttgg taacttacct 1380 atttatcccc accaatacat taatctaagg actaacaatt cagctaccct tattttacct 1440 tatgtcaatg ctgtaccaat ggactctatg cttagacata ataattggag cttggttata 1500 atcccaatat gccctcttca ggtccaacct ggggggacac aatccatacc tataacagta 1560 tcaattagcc ctatgttttc agaattttca gggccaagaa gtaaggttgt gtttagtacc 1620 actcagggtt taccagttat gttaacacct ggatctgggc aattcttaac aactgatgat 1680 actcaatccc catcagcgtt tccatacttc cacccgacca aggaaatatt tatacctgga 1740 caagttagga atttaattga aatgtgccaa gttgacacac tcattcctgt taacaataca 1800 caggaaaatg taagatctgt gaatatgtac actgttgatt tacgcacaca agttgattta 1860 gctaaagaag tcttttctat accagtagat attgcctcac aacctttagc cactactctc 1920 ataggagaac ttgcaagcta ttacacacac tggactggta gtctgcgctt tagctttatg 1980 ttttgtggtt ctgctagctc tactttgaaa ctattaattg catacactcc tcctggtgtt 2040 ggaaaaccta aatccaggag agaagccatg cttggtacac atttagtgtg ggatgtgggg 2100 ttgcagtcca ccgcctcact agttgtacca tgggttagtg ctagccattt tagattcact 2160 acacctgaca catattcctc agctggttat attacatgct ggtaccagac caactttgta 2220 gtacctgata gtactccaga taacgccaaa atggtgtgca tggtttctgc atgcaaagat 2280 ttttgcttaa gattagccag agatactaac ctacacacac aagaaggagt actcacacaa 2340 aacccagttg aaaattatat agatagtgta ttaaatgaag ttcttgtggt gccaaatatc 2400 caacctagca catctgtgtc aagtcatgca gcgcctgcat tggatgctgc ggaaaccgga 2460 cacaccagct ctgttcaacc tgaagatatg attgaaacta gatatgttat aactgatcaa 2520 acaagggatg aaacaagtat tgagagtttc ttaggtaggt cagggtgtat cgctatgata 2580 gaatttaata caagtagtga taaaactgaa catgataaaa ttggtaaagg attcaaaaca 2640 tggaaggtta gtcttcaaga aatggcacaa atcagaagaa aatatgaatt attcacatat 2700 acaagatttg attcagagat aacaatagtc actgcagccg cagctcaagg aaatgatagt 2760 ggacatatag tattgcaatt tatgtatgta cccccaggag cacctgtccc cgaaaaacgt 2820 gatgattaca catggcaatc aggaacaaat gcatctgtgt tctggcaaga aggacaacca 2880 taccccagat tcacaatccc ttttatgagc attgcatcag cctattacat gttttatgat 2940 ggttatgatg gtgatagtgc agcatcaaaa tacggttctg tagtcactaa tgatatggga 3000 accatatgtg ttagaatagt gacatccaac caaaaacacg attcaaatat tgtgtgccgc 3060 atttaccaca aggccaaaca tataaaagca tggtgtcctc gcccaccaag ggctgttgcc 3120 tatcaacaca cacactcaac caattacata ccatccaatg gtgaggccac aactcagatt 3180 aaaaccagac ctgatgtttt taccgttaca aacgtcggac catctagtat gtttgtacat 3240 gtgggtaact taatctatag aaatcttcat ctctttaatt ctgatcttga tgattctatt 3300 cttgtatcat actccagtga tctaatcata tatcgaacaa acactgaagg taatgatgtg 3360 atccctaatt gtgattgcac tgaatgtaca tattactgcc accacaaaga taggtatttt 3420 cctatcagag ttactgcaca tgattggtat gagattcaag aatcagaata ttacccaaaa 3480 catatccaat ataatctcct gattggagag ggtccttgtg aaccaggaga ttgtggagga 3540 aaactattgt gtaaacatgg tgttataggt atgattacag ctggaggtga aggtcacgtt 3600 gcttttattg acctgagaaa attccagtgt gctgaggagc aagggttatc tgattatgtg 3660 gaacatcttg gtcaagtctt tggtgtaggc ttcgtagaca gcatcaaaca acaggtaaac 3720 tttatcaacc ccactagtaa aattggttca aaagtgatta aatggttgtt gaggatagtt 3780 tcagctatga taataatggt aaggaatagt tctgatccac aaactgtaat tgccactctc 3840 acccttctag gttgttcagg ctcaccatgg aggtttctta aagagaaact ctgtgcgtgg 3900 ctccagctta gctatgtaca taagcagtct gattcatggc tcaagaaatt tactgaagcg 3960 tgtaacgcag cacgtgggct agagtggatt ggacaaaaga tatctaaatt tatagattgg 4020 ataaagagta tgttaccaca ggctcaattg aaaattgatt acctaaccaa attaaaacaa 4080 cttaatctct tagagaaaca aatagaaaca attagacttg cacctgctag tgttcaggag 4140 aaaattttca ttgaaataaa cacccttcat gatttatcct taaaattctt accactgtat 4200 gcatctgaag cacgtagaat taagaattta tatatcaaat gcagtaatgt tattaaaggg 4260 ggaaagagga atgaaccagt tgcagttcta atacatggtt ctcctggtac tggaaaatct 4320 cttgccactt ctgttcttgc tcgaatgcta actgttgaga ctgatatata ttctttgccc 4380 ccagatccta aatattttga tgggtatgat caacagagtg ttgttatcat ggatgatatc 4440 atgcaaaatc ctagtggtga agacatgact ttgttttgcc aaatggtatc gagtgtccct 4500 ttcatacctc ctatggcaga tcttccagat aaaggaaaac catttacatc caagtttgta 4560 cttgcaagca ctaatcacac tctactaaca ccaccaacag tatcttcatt accagcaatg 4620 gcaagaaggt tttactttga tctagacatt caagttaaga aagagtatct tttagatggc 4680 aaactagata tagcaaaaag ctttcgacca tgtgatgtta atattaaaat aggcaatgct 4740 aagtgctgtc catttatctg tggaaaagct gtagagttta aagatagaaa ttcatgtaca 4800 accttgtctt tatctcaatt gtatagtcat ataaaggaag aagataggag aagaagcagt 4860 gcagcacaag caatggaggc tatatttcaa ggtatagacc tccaatctcc tccacctcca 4920 gccatagctg acctccttag gtctgtgaaa acaccagaga tcattaagta ttgccaagat 4980 aataattgga ttgttccagc agagtgttct attgaaagag atttagggat agcaaatatg 5040 actataggta taatagctaa tgtggtctct atagtaggtg ttatctatat aatttataaa 5100 ttgttctgta cacttcaggg tccatactca ggggaaccta aacccaaaag cagagctcca 5160 gagagaagag tagttactca gggcccagag gaagagtttg gtcgctcact actcaaacat 5220 aattgctgtg ttgtgacaac cgacaaaggc aaattcacag gtcttggcat atatgaccaa 5280 gtcatggtac ttccaacaca ttctgaccca ggctctgaga tcttggtaga tggagtaaaa 5340 gttaaggtct ctgattccta tgatttgcat aaccatgagg gtgttaagct agagatcaca 5400 gttgtgaaat taattagaaa tgagaagttt aaagacatca gaaaatattt accctcacgt 5460 gaagatgact atcctgcttg taaccttgcc ttactagcta atcaagatga gccaacaata 5520 ataagtgttg gtgatgcagt atcttatggt aacatcttat tgagtggtac caatactgca 5580 cgaatgatca agtaccatta cccgacaaaa gctggatatt gtgggggtgt tttgtacaag 5640 gttggctcta ttcttggtat acatgttggt ggcaatggta gagatggatt ttctgcaatg 5700 cttctcaaat cttattttgg tgaaacccag ggtttaatca ctaaagaact tcctgtatct 5760 gtaaagaact taccatccgt acatgtttca tctaaaaccc gactacaacc tagtgttttt 5820 catgatgttt tccctggaac aaaagagcct gcagttctta gtagtaatga tccaagacta 5880 gaaactgact ttgactcagc acttttctcc aaatataaag gtaatcctgc ttgtcaagtg 5940 accccacaca tgaaaattgc tgtagcacat tatgcagcac agttatctac actagacata 6000 aatcctcaac ccctttcatt ggaagagagt gtgtttggta ttgagggatt agaagctttg 6060 gatttaaata ctagtgcagg atttccttat gtttcactgg gaataaagaa gaaagatctt 6120 atagataaaa agaccaaaga catcacaaaa cttaggaaag caattgatga atatggtatt 6180 gatttgccta tggttacttt tctgaaagat gaacttagaa agaaggaaaa aataaaagat 6240 ggaaagacta gagtcataga agctaatagt gtgaatgata ctgtgttatt cagaagtgta 6300 tttggaaatc ttttctctgc tttccacaaa aacccaggta tagtcactgg ttcagcagta 6360 gggtgtgacc ctgaagtatt ctggtcaact atacctctca tgctagatgg agaatgttta 6420 atggcttttg attattcaaa ctatgatggt agcctacatc ccgtttggtt taaatgtctt 6480 agtatgctct tagaagacat aggtttctcc tctcaactta ttaaccagat ctgtaactct 6540 aaacatatat acaaatctaa gtattatgaa gtggaaggag gtatgccatc tggatgtgct 6600 ggtactagta tttttaatac aataatcaac aatattatca ttagaacttt ggtactagat 6660 gcttataaga acatagatct agataaactg aaaatcttag catatgggga tgatgtcatc 6720 ttttcttata attttaaact tgacatggca gttcttgcca aagaaggaga aaaatatgga 6780 ctaacaatca cccctgctga taagtctgat gttttccaag aattgaccta taaaaatgta 6840 acttttctta aaagaggatt cagagctgat gagcgccact ctttccttat acaccctacc 6900 tttcctgtgg ctgagattca tgactccatc agatggacca aaaacccttc atgtatgcag 6960 gaacacgtgc tatctttgtg tcatttaatg tggcataatg gtagacatgc ataccaggaa 7020 ttcattaaag gtatacgcag tgtatctgcc ggtcgggcac tgtatatacc agcttatgaa 7080 gttcttgaac atgaatggta tgaaaaattt tagatataaa actgttaaat atagctagtt 7140 tattagtttt at 7152 <210> 30 <211> 7152 <212> DNA <213> unknown <220> <223> synthetic <400> 30 ttaaaactgg gagtgggttg ttcccactca ctccacccat gcggtgttgt actctgttat 60 tacggtaact ttgtacgcca gtttttccca cccttcccca taatgtaact tagaagtttg 120 tacaatatga ccaataggtg acaatcatcc agactgtcaa aggtcaagca cttctgtttc 180 cccggtcaat gaggatatgc tttacccaag gcaaaaacct tagagatcgt tatccccaca 240 ctgcctacac agagcccagt accatttttg atataattgg gttggtcgct ccctgcaaac 300 ccagcagtag acctggcaga tgaggctgga cattccccac tggcgacagt ggtccagcct 360 gcgtggctgc ctgctcaccc ttcttgggtg agaagcctaa ttattgacaa ggtgtgaaga 420 gccgcgtgtg ctcagtgtgc ttcctccggc ccctgaatgt ggctaacctt aaccctgcag 480 ccgttgccca taatccaatg ggtttgcggt cgtaatgcgt aagtgcggga tgggaccaac 540 tactttgggt gtccgtgttt cctgtttttc ttttgattgc attttatggt gacaatttat 600 agtgtataga ttgtcatcat gggagcacaa gtgtctagac aaaacgtagg tacacatagt 660 acacaaaact cagtgtctaa cggatctagt cttaattatt ttaatattaa ttattttaaa 720 gacgctgcat ctagcggagc tagtagactt gattttagtc aggatccatc taaatttacc 780 gatccagtta aagacgtact cgaaaaaggt atacctacat tgcaatcacc tacagtcgaa 840 gcatgcggat actctgatag attgatacaa attactaggg gggatagtac tattactagt 900 caggataccg ctaacgccgt agtcgcatac ggagtttggc catcttatct tacacctgat 960 gacgcaaccg caatcgataa acctacacaa cctgatacta gttctaatag attctataca 1020 cttgattcta gatcatggac tagtgctagt tcaggttggt ggtggaaatt gcctgacgca 1080 cttaaaaata tgggtatatt cggtgagaat atgttttatc atttcttagg taggtcaggg 1140 tatactatac acgttcaatg taatagttct aaatttcacc aaggtctatt aatcgttgcc 1200 gctatacccg aacaccaatt agctagcgct acatcaggta acgttagcgt agggtataat 1260 catacacatc caggcgaaca gggtagggaa gtcgtaccat ctagaacatc tagcgataat 1320 aaacgaccat ctgacgatag ttggcttaat ttcgatggta cactattagg taatctacct 1380 atatatccac atcaatatat taatcttaga actaataatt ccgctacact tatactgcca 1440 tacgttaacg cagtgcctat ggatagtatg cttagacata ataattggtc attagtgatt 1500 ataccgatat gtccattgca agtgcaacct ggaggtacac aatctatacc tattaccgtt 1560 agtattagtc ctatgtttag cgaatttagc ggacctagat ctaaggtagt gtttagtact 1620 acacaggggt tacccgttat gcttacacct ggatcaggtc aatttttgac tactgacgat 1680 acacaatcac ctagtgcatt cccatatttt caccctacta aagagatttt tatacccggt 1740 caggttagga atctaatcga aatgtgtcaa gtcgatacac ttatacccgt taataataca 1800 caggaaaacg ttagatccgt taatatgtat accgttgatt tgcgtacaca agtcgatcta 1860 gctaaagagg ttttttcgat accagtcgat atcgctagtc aaccattagc tactacactt 1920 ataggcgaac tcgcatcata ttatacacat tggaccggat cacttagatt ttcttttatg 1980 ttttgcggat ccgctagtag tacacttaaa ctgttaatcg catatacacc tccaggagtg 2040 ggtaagccta aatctagacg cgaagctatg ttaggtacac atctagtttg ggacgtaggg 2100 ttacaatcta ccgctagttt agtcgtacca tgggttagcg catcacattt tagatttact 2160 acacctgata cttattctag tgccggatat ataacatgtt ggtatcaaac taatttcgta 2220 gtgccagata gtacacctga taacgctaaa atggtttgta tggttagcgc atgtaaagat 2280 ttttgtctta gattagctag ggatactaat ttgcatacac aagagggagt gcttacacaa 2340 aatccagtcg aaaattatat cgatagcgta cttaacgaag tgttagtcgt acctaatata 2400 caacctagta ctagtgtgtc atctcacgct gcaccagcat tagacgcagc cgaaaccgga 2460 catacatcta gtgtgcaacc tgaggatatg atagagacta gatacgttat taccgatcag 2520 actagagacg aaacatcaat cgaatcattc ttaggtaggt cagggtgtat cgctatgata 2580 gagtttaata ctagttccga taaaaccgaa cacgataaga taggtaaggg gtttaaaact 2640 tggaaagtgt cattgcagga aatggcacaa attagacgta aatacgaatt gtttacatat 2700 actagattcg atagtgagat tactatcgtt accgcagccg cagcacaagg taacgattca 2760 ggtcatatag tgttacaatt tatgtacgta ccaccaggtg caccagtacc cgaaaaacgc 2820 gatgattata catggcaatc cggtactaac gctagcgttt tttggcaaga gggacaacca 2880 tatcctagat ttactatacc ttttatgtca atcgctagtg catattatat gttttacgac 2940 ggatacgatg gcgattctgc cgcatctaaa tacggatctg tagtgactaa cgatatgggt 3000 actatatgcg ttagaatcgt tacatctaat caaaaacacg attctaatat cgtttgtaga 3060 atatatcata aagctaaaca tattaaggca tggtgtccta gaccacctag agccgttgca 3120 tatcaacata cacatagtac taattatata ccatctaacg gtgaggctac tacacaaatt 3180 aaaactagac ctgacgtttt taccgttact aacgtaggtc catctagtat gttcgtacac 3240 gtaggtaatc tgatatatag aaatttgcat ctattcaatt ccgatttaga cgattctata 3300 ctcgttagtt attctagcga tctgattata tatagaacta ataccgaagg taacgatgtg 3360 atacctaatt gcgattgtac cgaatgtact tattattgtc atcataaaga taggtatttt 3420 ccgatacgcg ttaccgcaca cgattggtac gaaatacagg aatctgagta ttatcctaaa 3480 catatacaat ataatctgtt aataggcgaa ggtccatgcg aaccaggcga ttgcggaggt 3540 aagttattgt gtaaacacgg agtgataggt atgattaccg cagggggaga gggacacgtt 3600 gcgtttatcg atttgcgaaa atttcaatgc gcagaggaac aggggttatc cgattacgtt 3660 gagcatttag ggcaagtgtt cggagtcgga ttcgttgatt caattaaaca acaggttaat 3720 tttattaatc ctacatctaa aatcggatct aaagtgataa aatggttact tagaatcgtt 3780 agcgctatga taattatggt taggaattct agcgatccac aaaccgtaat cgctacactt 3840 acactattag ggtgttcagg ttcaccttgg cgatttctta aagagaaatt atgcgcatgg 3900 ttgcaattgt catacgttca taaacaatcc gatagttggc ttaaaaaatt taccgaagca 3960 tgtaacgccg ctaggggact cgaatggata gggcaaaaaa tatctaaatt tatcgattgg 4020 attaaatcta tgttaccaca agcgcaattg aaaatcgatt atcttactaa gcttaaacaa 4080 ttgaacttac tcgaaaaaca aatcgaaact attagactcg caccagctag tgtgcaagag 4140 aaaattttta tagagattaa tacattacac gatctatcac ttaaattctt accattatac 4200 gctagcgaag ctagacggat taaaaatcta tatattaagt gttctaacgt aattaaggga 4260 ggtaagcgta acgaacccgt tgccgtactt atacacggat caccaggtac cggtaagtca 4320 ttagcgacta gcgtactcgc tagaatgctt acagtcgaaa ccgatatata ctctttacca 4380 cctgatccta aatatttcga cggatacgat caacaatccg tagtgattat ggacgatatt 4440 atgcaaaatc ctagtggtga ggatatgaca ttgttttgtc aaatggtatc tagcgtacca 4500 tttataccac ctatggccga tttacccgat aagggtaagc cttttacatc taaattcgta 4560 ctcgcatcaa ctaatcatac attgcttaca ccacctaccg ttagttcact accagctatg 4620 gctagacggt tttatttcga tctagatata caggttaaaa aagagtatct gttagacggt 4680 aagttagata tcgctaaatc ttttagacca tgcgatgtta atattaaaat cggtaacgct 4740 aaatgttgtc catttatatg cggtaaggca gtcgaattta aagataggaa ttcatgtact 4800 acactatcac tatcacaatt gtattcacat attaaggaag aggatagacg tagatctagt 4860 gccgcacaag ctatggaagc tatttttcag ggtatcgatc tgcaatcacc accaccacca 4920 gctatagccg atctacttag atccgttaaa acacctgaga taattaagta ttgtcaggat 4980 aataattgga tcgtaccagc cgaatgttca atcgaacgcg atttagggat agcgaatatg 5040 acaatcggta taatcgctaa cgtagtgtca atcgtaggcg ttatatatat tatatataaa 5100 ttgttttgta cattgcaggg accatactct ggcgaaccta aacctaaatc tagagcacct 5160 gaaagacgcg tagtgacaca gggacctgaa gaggaattcg gtaggtcatt gcttaaacat 5220 aattgttgcg tagtgactac cgataagggt aagtttaccg gattaggtat atacgatcag 5280 gttatggtgt tacctacaca ttccgatcca ggatctgaga tactcgtaga cggagttaag 5340 gttaaggtta gcgattcata cgatctacat aatcacgaag gcgttaagtt agagattacc 5400 gtagttaagc ttatacgtaa cgaaaaattt aaagatatac gaaaatatct accatcacgc 5460 gaagacgatt atcctgcatg taatctcgca ctattagcga atcaagacga acctacaatt 5520 attagcgtag gcgatgccgt atcatacggt aatatactgt tatccggtac taataccgct 5580 agaatgatta agtatcatta tcctactaaa gccggatatt gcggaggagt gttatataaa 5640 gtcggatcta tactcggtat acacgtaggc ggtaacggta gggacggatt ttccgctatg 5700 ttacttaaat cttatttcgg tgagacacag ggattgatta ctaaagagtt acccgtatcc 5760 gttaaaaatc tacctagcgt acacgttagt tctaaaacta gattgcaacc tagtgtgttt 5820 cacgacgttt ttccaggtac taaggaacct gccgtactat cttctaacga tcctagactc 5880 gaaaccgatt tcgatagtgc attattctct aaatataagg gtaatcctgc atgtcaggtt 5940 acaccacata tgaaaatcgc agtcgcacat tacgctgcac aattgtctac acttgatatt 6000 aatccacaac cactatcact tgaggaatcc gtattcggta tcgaagggtt agaggcactt 6060 gatcttaata ctagtgccgg attcccatac gttagtctag gtattaaaaa aaaagatcta 6120 atcgataaaa aaactaagga tattactaaa ttgcgaaaag cgatagacga atacggtatc 6180 gatctaccta tggttacatt ccttaaagac gaacttagaa aaaaagagaa aattaaagac 6240 ggtaagacta gggttatcga agctaactct gttaacgata ccgtactttt tagatccgta 6300 ttcggtaatc tattttccgc attccataaa aatccaggta tcgttaccgg atccgcagtc 6360 ggatgcgatc cagaagtgtt ttggtctact ataccactta tgttagacgg tgagtgtctt 6420 atggcattcg attattctaa ttacgatggg tcattgcatc ccgtatggtt taaatgtcta 6480 tctatgttac tcgaagatat agggtttagt tcacaattga ttaatcagat ttgtaactct 6540 aaacatatat ataaatctaa atattacgaa gtcgaagggg gtatgccatc aggttgcgca 6600 ggtacatcta tttttaatac tataattaat aatattataa ttagaacatt agtgttagac 6660 gcatataaaa atatcgatct agataagctt aagatactcg catacggaga tgacgttata 6720 ttctcatata attttaaact tgatatggcc gtactcgcta aagagggaga aaaatacgga 6780 cttacaatta cacctgccga taagtctgac gtttttcagg aattgactta taaaaacgtt 6840 acattcctta aaagggggtt tcgcgcagac gaacgacatt cttttcttat acatcctaca 6900 tttcccgttg ccgaaataca cgattcaatt agatggacta aaaatcctag ttgtatgcaa 6960 gaacacgtac ttagtctatg tcatcttatg tggcataacg gtagacacgc ttatcaggaa 7020 tttattaagg gtattagatc cgttagtgcc ggtagggcac tatatatacc cgcatacgaa 7080 gtactcgaac acgaatggta cgaaaaattt tagatataaa actgttaaat atagctagtt 7140 tattagtttt at 7152 <210> 31 <211> 7212 <212> DNA <213> Human rhinovirus 14 <400> 31 ttaaaacagc ggatgggtat cccaccattc gacccattgg gtgtagtact ctggtactat 60 gtacctttgt acgcctgttt ctccccaacc acccttcctt aaaattccca cccatgaaac 120 gttagaagct tgacattaaa gtacaatagg tggcgccata tccaatggtg tctatgtaca 180 agcacttctg tttcccagga gcgaggtata ggctgtaccc actgccaaaa gcctttaacc 240 gttatccgcc aaccaactac gtaacagtta gtaccatctt gttcttgact ggacgttcga 300 tcaggtggat tttccctcca ctagtttggt cgatgaggct aggaattccc cacgggtgac 360 cgtgtcctag cctgcgtggc ggccaaccca gcttatgctg ggacgccctt ttaaggacat 420 ggtgtgaaga ctcgcatgtg cttggttgtg agtcctccgg cccctgaatg cggctaacct 480 taaccctaga gccttatgcc acgatccagt ggttgtaagg tcgtaatgag caattccggg 540 acgggaccga ctactttggg tgtccgtgtt tctcattttt cttcatattg tcttatggtc 600 acagcatata tatacatata ctgtgatcat gggcgctcag gtttctacac agaaaagtgg 660 atctcacgaa aatcaaaaca ttttgaccaa tggatcaaat cagactttca cagttataaa 720 ttactataag gatgcagcaa gtacatcatc agctggtcaa tcactgtcaa tggacccatc 780 taagtttaca gaaccagtta aagatctcat gcttaagggt gcaccagcat tgaattcacc 840 caatgttgag gcctgtggtt atagtgatag agtacaacaa atcacactcg ggaattcaac 900 aataacaaca caagaagcag ccaacgctgt tgtgtgttat gctgaatggc cagagtacct 960 tccagatgtg gacgctagtg atgtcaataa aacttcaaaa ccagacactt ctgtctgtag 1020 gttttacaca ttggatagta agacatggac aacaggttct aaaggctggt gctggaaatt 1080 accagatgca ctcaaggata tgggtgtgtt cgggcaaaac atgtttttcc actcactagg 1140 aagatcaggt tacacagtac acgttcagtg caatgccaca aaattccata gcggttgtct 1200 acttgtagtt gtaataccag aacaccaact ggcttcacat gagggtggca atgtttcagt 1260 taaatacaca ttcacgcatc caggtgaacg tggtatagat ttatcatctg caaatgaagt 1320 gggagggcct gtcaaggatg tcatatacaa tatgaatggt actttattag gaaatctgct 1380 cattttccct caccagttca ttaatctaag aaccaataat acagccacaa tagtgatacc 1440 atacataaac tcagtaccca ttgattcaat gacacgtcac aacaatgtct cactgatggt 1500 catccctatt gcccctctta cagtaccaac tggagcaact ccctcactcc ctataacagt 1560 cacaatagca cctatgtgca ctgagttctc tgggataagg tccaagtcaa ttgtgccaca 1620 aggtttgcca actacaactt tgccggggtc aggacaattc ttgaccacag atgacaggca 1680 atcccccagt gcactgccaa attatgagcc aactccaaga atacacatac tagggaaagt 1740 tcataacttg ctagaaatta tacaggtaga tacactcatt cctatgaaca acacgcatac 1800 aaaagatgag gttaacagtt acctcatacc actaaatgca aacaggcaaa atgagcaggt 1860 ttttgggaca aacctgttta ttggtgatgg ggtcttcaaa actactcttc tgggtgaaat 1920 tgttcagtac tatacacatt ggtctggatc acttagattc tcttcgatgt atactggtcc 1980 tgccttgtcc agtgctaaac tcactctagc atacaccccg cctggtgctc gtggtccaca 2040 ggacaggaga gaagcaatgc taggtactca tgttgtctgg gatattggtc tgcaatccac 2100 catagtaatg acaataccat ggacatcagg ggtgcagttt agatatactg atccagatac 2160 atacaccagt gctggctttc tatcatgttg gtatcaaact tctcttatac ttcccccaga 2220 aacgaccggc caggtctact tattatcatt cataagtgca tgtccagatt ttaagcttag 2280 gctgatgaaa gatactcaaa ctatctcaca gactgttgca ctcactgaag gcttaggtga 2340 tgaattagaa gaagtcatcg ttgagaaaac gaaacagacg gtggcctcaa tctcatctgg 2400 tccaaaacac acacaaaaag tccccatact aactgcaaac gaaacagggg ccacaatgcc 2460 tgttcttcca tcagacagca tagaaaccag aactacctac atgcacttta atggttcaga 2520 aactgatgta gaatgctttt tgggtcgtgc agcttgtgtg catgtaactg aaatacaaaa 2580 caaagatgct actggaatag ataatcacag agaagcaaaa ttgttcaatg attggaaaat 2640 caacctgtcc agccttgtcc aacttagaaa gaaactggaa ctcttcactt atgttaggtt 2700 tgattctgag tataccatac tggccactgc atctcaacct gattcagcaa actattcaag 2760 caatttggtg gtccaagcca tgtatgttcc acatggtgcc ccgaaatcca aaagagtggg 2820 cgattacaca tggcaaagtg cttcaaaccc cagtgtattc ttcaaggtgg gggatacatc 2880 aaggtttagt gtgccttatg taggattggc atcagcatat aattgttttt atgatggtta 2940 ctcacatgat gatgcagaaa ctcagtatgg cataactgtt ctaaaccata tgggtagtat 3000 ggcattcaga atagtaaatg aacatgatga acacaaaact cttgtcaaga tcagagttta 3060 tcacagggca aagctcgttg aagcatggat tccaagagca cccagagcac taccctacac 3120 atcaataggg cgcacaaatt atcctaagaa tacagaacca gtaattaaga agaggaaagg 3180 tgacattaaa tcctatggtt taggacctag gtacggtggg atttatacat caaatgttaa 3240 aataatgaat taccacttga tgacaccaga agaccaccat aatctgatag caccctatcc 3300 aaatagagat ttagcaatag tctcaacagg aggacatggt gcagaaacaa taccacactg 3360 taaccgtaca tcaggtgttt actattccac atattacaga aagtattacc ccataatttg 3420 cgaaaagccc accaacatct ggattgaagg aagcccttat tacccaagta gatttcaagc 3480 aggagtgatg aaaggggttg ggccggcaga gctaggagac tgcggtggga ttttgagatg 3540 catacatggt cccattggat tgttaacagc tgaaggtagt ggatatgttt gttttgctga 3600 catacgacag ttggagtgta tcgcagagga acaggggctg agtgattaca tcacaggttt 3660 gggtagagct tttggtgtcg ggttcactga ccaaatctca acaaaagtca cagaactaca 3720 agaagtggcg aaagatttcc tcaccacaaa agttttgtcc aaagtggtca aaatggtttc 3780 agctttagtg atcatttgca gaaatcatga tgacttggtc actgttacgg ccactctagc 3840 actacttgga tgtgatggat ctccttggag atttctgaag atgtacattt ccaaacactt 3900 tcaggtgcct tacattgaaa gacaagcaaa tgatggatgg ttcagaaagt ttaatgatgc 3960 atgtaatgct gcaaagggat tggaatggat tgctaataag atttccaaac tgattgaatg 4020 gataaaaaac aaagtacttc cccaagccaa agaaaaacta gaattttgta gtaaactcaa 4080 acaacttgat atactagaga gacaaataac caccatgcat atctcgaatc caacacagga 4140 aaaacgagag cagttgttca ataacgtatt gtggttggaa caaatgtcgc aaaagtttgc 4200 cccattttat gccgttgaat caaaaagaat cagggaactc aagaacaaaa tggtaaatta 4260 tatgcaattt aaaagtaaac aaagaactga accagtgtgt gtattaatcc atggtacacc 4320 cggttctggt aaatcattaa caacatccat tgtgggacgt gcaattgcag aacacttcaa 4380 ttcagcagta tattcacttc caccagatcc caagcacttt gatggttatc agcaacagga 4440 agttgtgatt atggatgatc tgaaccaaaa tccagatgga caggatataa gcatgttttg 4500 tcaaatggtt tcttcagtgg atttcttgcc tccaatggct agtttagata acaagggcat 4560 gttattcacc agtaattttg ttctagcctc cacaaattct aacacactaa gccccccaac 4620 aatcttgaat cctgaagctt tagtcaggag atttggtttt gacctagata tatgtttgca 4680 tactacctac acaaagaatg gaaaactcaa tgcaggcatg tcaaccaaga catgcaaaga 4740 ttgccatcaa ccatctaatt tcaagaaatg ttgcccccta gtctgtggaa aagctattag 4800 cttggtagac agaactacca acgttaggta tagtgtggat caactggtca cggctattat 4860 aagtgatttc aagagcaaaa tgcaaattac agattcccta gaaacactgt ttcaaggacc 4920 agtgtataaa gatttagaga ttgatgtttg caacacacca ccttcagaat gtatcaacga 4980 tttactgaaa tctgtagatt cagaagagat tagggaatat tgtaagaaga agaaatggat 5040 tatacctgaa attcctacca acatagaaag ggctatgaat caagccagca tgattattaa 5100 tactattctg atgtttgtca gtacattagg tattgtttat gtcatttata aattgtttgc 5160 tcaaactcaa ggaccatatt ctggtaaccc gcctcacaat aaactaaaag ccccaacttt 5220 acgcccagtt gttgtgcaag gaccaaacac agaatttgca ctatccctgt taaggaaaaa 5280 cataatgact ataacaacct caaagggaga gttcacaggg ttaggcatac atgatcgtgt 5340 ctgtgtgata cccacacacg cacagcctgg tgatgatgta ctagtgaatg gtcagaaaat 5400 tagagttaag gataagtaca aattagtaga tccagagaac attaatctag agcttacagt 5460 gttgacttta gatagaaatg aaaaattcag agatatcagg ggatttatat cagaagatct 5520 agaaggtgtg gatgccactt tggtagtaca ttcaaataac tttaccaaca ctatcttaga 5580 agttggccct gtaacaatgg caggacttat taatttgagt agcaccccca ctaacagaat 5640 gattcgttat gattatgcaa caaaaactgg gcagtgtgga ggtgtgctgt gtgctactgg 5700 taagatcttt ggtattcatg ttggcggtaa tggaagacaa ggattttcag ctcaacttaa 5760 aaaacaatat tttgtagaga aacaaggcca agtaatagct agacataagg ttagggagtt 5820 taacataaat ccagtcaaca cggcaactaa gtcaaaatta catcccagtg tattttatga 5880 tgtttttcca ggtgacaagg aacctgctgt attgagtgac aatgatccca gactggaagt 5940 taaattgact gaatcattat tctctaagta caaggggaat gtaaatacgg aacccactga 6000 aaatatgctt gtggctgtag accattatgc agggcaacta ttatcactag atatccccac 6060 ttctgaactt acactaaaag aagcattata tggagtagat ggactagaac ctatagatat 6120 tacaaccagt gcaggatttc cctatgtgag tcttgggatc aaaaagagag acattctgaa 6180 taaagagacc caggacacag aaaagatgaa gttttatcta gacaagtatg gcattgactt 6240 gcctctagtt acatatatta aggatgaatt aagaagtgtt gacaaagtcc gattagggaa 6300 aagtagatta attgaagcct ccagtttgaa tgattctgtt aacatgagaa tgaaactagg 6360 caacctttac aaagcattcc atcaaaatcc cggtgttctg actggatcag cagtgggttg 6420 tgatcctgat gtgttttggt ctgtcatccc ttgcttaatg gatgggcacc tgatggcatt 6480 tgattactct aattttgatg cctctttgtc accagtttgg tttgtctgtc tagagaaggt 6540 tttgaccaag ttaggctttg caggctcttc attaattcaa tcaatttgta atacccatca 6600 tatctttagg gatgaaatat atgtggttga aggtggcatg ccctcagggt gttcaggaac 6660 cagcatattc aattccatga tcaacaacat aatcattagg actttgatat tagatgcata 6720 taaaggaata gatttagaca aacttaaaat cttagcttac ggtgatgatt tgattgtttc 6780 ttatccttat gaactggatc cacaagtgtt ggcaactctt ggtaaaaatt atggactaac 6840 catcacaccc ccagacaaat ctgaaacttt tacaaaaatg acatgggaaa acttgacatt 6900 tttaaagaga tacttcaagc ctgatcaaca atttcccttt ttggttcacc cagttatgcc 6960 catgaaagat atacatgagt caatcagatg gacaaaggat cctaaaaaca cacaggatca 7020 cgtccgatca ttatgcatgt tagcatggca ctcaggagaa aaagagtaca atgaattcat 7080 tcagaagatc agaactactg acattggaaa atgtctaatt ctcccagaat acagcgtact 7140 taggaggcgc tggttggacc tcttttaggt taacaatata gacacttaat ttgagtagaa 7200 gtaggagttt at 7212 <210> 32 <211> 7212 <212> DNA <213> unknown <220> <223> synthetic <400> 32 ttaaaacagc ggatgggtat cccaccattc gacccattgg gtgtagtact ctggtactat 60 gtacctttgt acgcctgttt ctccccaacc acccttcctt aaaattccca cccatgaaac 120 gttagaagct tgacattaaa gtacaatagg tggcgccata tccaatggtg tctatgtaca 180 agcacttctg tttcccagga gcgaggtata ggctgtaccc actgccaaaa gcctttaacc 240 gttatccgcc aaccaactac gtaacagtta gtaccatctt gttcttgact ggacgttcga 300 tcaggtggat tttccctcca ctagtttggt cgatgaggct aggaattccc cacgggtgac 360 cgtgtcctag cctgcgtggc ggccaaccca gcttatgctg ggacgccctt ttaaggacat 420 ggtgtgaaga ctcgcatgtg cttggttgtg agtcctccgg cccctgaatg cggctaacct 480 taaccctaga gccttatgcc acgatccagt ggttgtaagg tcgtaatgag caattccggg 540 acgggaccga ctactttggg tgtccgtgtt tctcattttt cttcatattg tcttatggtc 600 acagcatata tatacatata ctgtgatcat gggcgcacaa gtgtcaacgc aaaaatccgg 660 atcacacgaa aaccaaaaca tactgactaa cggatctaat cagactttta cagtgattaa 720 ttattataaa gacgccgcta gtactagttc agccggtcaa tcactatcta tggatccatc 780 taaatttacc gaacccgtta aggatcttat gcttaaaggc gcaccagcac ttaactcacc 840 taacgttgag gcatgcggat actctgatag agtgcaacaa attacattgg gtaatagtac 900 aattactaca caggaagccg ctaacgcagt cgtttgttac gccgaatggc ccgaatactt 960 acccgatgtc gacgcatcag acgttaataa gacatctaaa cccgatacta gcgtatgtag 1020 attctataca ctcgatagta agacttggac taccggtagt aagggatggt gttggaaatt 1080 gcctgacgca cttaaggata tgggcgtatt cggtcagaat atgttttttc actcattggg 1140 taggtcaggg tatacagtac acgttcaatg taacgctact aaatttcact cagggtgtct 1200 gttagtcgtt gtgatacccg aacaccaatt ggcatcacac gaagggggta acgttagcgt 1260 taagtataca tttacacatc caggcgaaag aggtatcgat ctatcatccg ctaacgaagt 1320 ggggggaccc gttaaagacg ttatatacaa tatgaacggt acactgttag gtaatctgtt 1380 aatttttcca catcaattta ttaatctgag aactaataat accgctacaa tcgttatacc 1440 atatattaac tcagtgccaa tcgatagtat gactagacat aataacgtta gtcttatggt 1500 gataccaatc gcaccattga cagtgccaac cggtgcaaca cctagtctac caattacggt 1560 tacaatcgca cctatgtgta ctgagttttc cggtattagg tctaaatcaa tcgtaccaca 1620 agggttacct actactacat tgcccggatc cggtcaattt ttgactactg acgataggca 1680 atcacctagc gcattgccta attacgaacc tacaccacgt atacatatac tcggtaaggt 1740 gcataatctg ttagagatta tacaggtcga tacactgata cctatgaata atacacatac 1800 aaaagacgaa gtgaattcgt atctgatacc gttaaacgct aataggcaaa acgaacaggt 1860 attcggtacg aatctgttta taggcgatgg cgtattcaaa actacactgt taggcgaaat 1920 cgttcaatac tatacacatt ggtcagggtc acttagattc tcatctatgt atacaggtcc 1980 agcactatct agcgctaaat tgacactcgc atatacacct cccggtgcta ggggaccaca 2040 ggataggaga gaggctatgt taggtacaca cgtagtgtgg gatatcggat tgcaatcgac 2100 aatcgttatg actataccat ggacatcagg cgtacaattt agatataccg atcccgatac 2160 atatacatca gccggattcc tatcatgttg gtatcagact agtctgatac tgccacccga 2220 aactaccggt caagtgtatc tattgtcatt catatccgca tgtcccgatt ttaaacttag 2280 attgatgaaa gatacacaaa caatttcgca aacagtcgca ctaaccgaag ggttaggcga 2340 cgaattagag gaagtgatag tcgaaaaaac taagcaaaca gtcgcatcaa ttagttccgg 2400 acctaaacat acacaaaaag tgccaatatt gaccgctaac gaaacaggcg caactatgcc 2460 cgtactgcca tccgattcaa tcgaaacacg aactacttat atgcatttta acggatccga 2520 aaccgatgtc gaatgctttc taggtagggc cgcatgcgta cacgttacag agatacagaa 2580 taaagacgca accggtatcg ataatcatag agaggctaaa ttgtttaacg attggaaaat 2640 taatctatct agtctagtgc aattgcgtaa aaaactcgaa ttgtttacat acgttagatt 2700 cgatagcgaa tatactatac tcgcaaccgc atcacaaccc gattccgcta attatagttc 2760 taacttagtc gttcaggcta tgtacgtacc acacggtgca cctaaatcta aaagagtcgg 2820 cgattataca tggcaatccg catctaatcc atcagtgttt tttaaggtag gcgatactag 2880 tagattctca gtgccatacg tagggttagc tagcgcatat aattgttttt acgacggata 2940 ctcacacgac gatgccgaaa cacaatacgg tattacggta ctgaatcata tggggtcaat 3000 ggcatttaga atcgttaacg aacacgacga acataaaaca ctagttaaga ttagagtgta 3060 tcatagggct aagttagtcg aagcatggat acctagagca cctagagcac taccatatac 3120 atcaatcggt aggactaatt atcctaaaaa taccgaaccc gttattaaaa aacgtaaagg 3180 cgatattaag tcatacggat tagggcctag atacggaggt atatatacat ctaacgttaa 3240 gattatgaat tatcatctta tgacaccaga ggatcatcat aacttaatcg caccataccc 3300 taatagggat ctagcaatcg ttagtacagg gggacacgga gccgaaacta taccgcattg 3360 taatagaaca tcaggcgtat actatagtac atattataga aagtattatc ctattatatg 3420 cgaaaaacct actaatattt ggatcgaagg gtcaccatat tatcctagta gattccaagc 3480 cggagtgatg aaaggcgtag gtccagccga attaggcgat tgcggaggta tactgagatg 3540 tatacacggt ccaatcggac tgttaactgc cgaagggtca ggatacgttt gtttcgccga 3600 tattaggcaa ttggagtgta tagccgaaga acagggacta tccgattata ttaccggatt 3660 gggtagggca ttcggagtgg ggtttacgga tcagattagt actaaggtta ccgaattgca 3720 ggaagtcgct aaggattttt tgactactaa agtgctatct aaagtcgtta aaatggttag 3780 cgcattagtg ataatttgta ggaatcacga cgatctagtt acggttaccg ctacactcgc 3840 actattaggg tgcgatgggt caccatggag attccttaaa atgtatatta gtaagcattt 3900 tcaagtgcca tatatcgaaa gacaggctaa cgacggatgg tttagaaaat ttaacgatgc 3960 atgtaacgcc gctaagggac tcgaatggat cgctaataag attagtaagt taatcgaatg 4020 gattaaaaat aaagtgttac cacaagctaa agagaaactc gaattttgta gtaagcttaa 4080 gcaattggat atactcgaaa gacagattac gactatgcat atatctaacc ctacacaaga 4140 gaaacgcgaa caattgttta ataacgtatt gtggttagag caaatgtcac aaaaattcgc 4200 accattttac gcagtcgaat ctaaacgtat acgcgaactg aaaaataaaa tggttaacta 4260 tatgcaattt aaatctaaac aacgaaccga acccgtatgc gtactgatac acggtacacc 4320 cggtagcggt aagtcattga ctacatcaat cgtaggtagg gctatagccg aacactttaa 4380 ctcagccgta tatagtctac cacccgatcc aaaacatttc gatgggtatc aacaacagga 4440 agtcgttatt atggacgatc tgaatcagaa tcccgatggt caggatatta gtatgttttg 4500 tcaaatggtg tcatcagtcg attttctacc acctatggca tcactcgata ataagggtat 4560 gttgtttaca tctaatttcg tactcgcatc aactaactct aatacactat caccacctac 4620 tatactgaat cccgaagcat tagtgcgtag attcggattc gatctagata tatgcttgca 4680 tacaacttat actaaaaacg gtaagcttaa cgccggtatg tcaactaaga catgtaagga 4740 ttgtcaccaa cctagtaatt ttaaaaaatg ttgtccacta gtttgcggta aggcaattag 4800 tctagtcgat agaactacta acgttaggta ttcagtcgat caattggtta ccgcaattat 4860 atccgatttt aaatctaaaa tgcaaattac cgattcactc gaaacattgt ttcagggacc 4920 agtgtataag gatcttgaga tagacgtatg caatacacca cctagtgagt gtattaacga 4980 tctgttaaaa tcagtcgata gcgaagagat acgcgaatat tgtaaaaaaa aaaaatggat 5040 tatacccgaa ataccgacta atatcgaaag agctatgaat caggctagta tgattattaa 5100 tactatactt atgttcgtta gtacattggg tatcgtttac gttatataca aattgttcgc 5160 acaaacacag ggaccatact caggtaatcc accacataat aagcttaagg cacctacact 5220 tagacccgta gtcgttcagg gacctaatac cgaattcgca ctatcactat tgcgtaaaaa 5280 tattatgaca attactacat ctaaaggcga atttacaggg ttagggatac acgatagggt 5340 atgcgttata ccgacacacg ctcaacccgg tgatgacgta ctggttaacg gtcaaaaaat 5400 tagggttaag gataagtata agttagtcga tccagagaat attaacttag agttaaccgt 5460 actgacactc gatagaaacg aaaaatttag ggatattagg gggtttatat ccgaagatct 5520 tgagggagtc gacgctacat tagtcgtaca ctctaataat tttacgaata ctatactcga 5580 agtcggaccc gttactatgg ccggattgat taatctatct agtacaccta ctaatagaat 5640 gattaggtac gattacgcta ctaagacagg gcaatgcgga ggggtgttat gcgcaaccgg 5700 taagatattc ggtatacacg tagggggtaa cggtagacag gggtttagcg cacaattgaa 5760 aaaacagtat ttcgtcgaaa aacagggtca ggtaatcgct agacataagg ttagagagtt 5820 taatattaat cccgttaata ccgctactaa gtctaaattg catccatcag tgttttacga 5880 cgtattccca ggcgataagg aaccagccgt actatccgat aacgatccta gacttgaggt 5940 taagttaacc gaatcactat tctctaagta taagggtaac gttaataccg aacctaccga 6000 aaatatgtta gtcgcagtcg atcattacgc cggtcaattg ctatcacttg atataccgac 6060 tagcgaattg acacttaaag aggcactata cggagtcgac ggactcgaac caatcgatat 6120 tactacatca gccggattcc catacgttag tctaggtatt aaaaaaaggg atatacttaa 6180 caaagagaca caggataccg aaaaaatgaa attttatcta gataaatacg gtatcgatct 6240 accattagtg acttatatta aagacgaatt gcgatcagtc gataaggtta ggttaggtaa 6300 gtctagattg atcgaagcta gttcacttaa cgatagcgtt aatatgcgta tgaaattggg 6360 taatctgtat aaggcatttc accaaaatcc cggagtgtta accggatccg cagtcggatg 6420 cgatccagac gttttttggt cagtgatacc atgtcttatg gacggacatc ttatggcatt 6480 cgattactct aatttcgatg catcactatc acccgtttgg ttcgtatgtc ttgagaaagt 6540 gttaactaag ttagggttcg caggatctag tctgatacaa tcaatttgta atacacatca 6600 tatttttaga gacgaaatat acgtagtcga agggggtatg cctagcggat gttccggtac 6660 atcaattttt aactctatga ttaacaatat tattattaga acattgatac ttgacgcata 6720 taagggtatc gatctagata agcttaagat actcgcatac ggagacgatc taatcgttag 6780 ttatccatac gaactcgatc cacaagtgtt agcgacattg ggtaagaatt acggattgac 6840 tattacacct cccgataaat ccgaaacttt tacgaaaatg acatgggaga atctgacatt 6900 tctgaaacga tattttaaac ccgatcagca atttccattc ttagtgcatc ccgttatgcc 6960 tatgaaagat atacacgaat caattagatg gactaaggat ccaaaaaata cacaggatca 7020 cgttaggtca ctatgtatgt tagcatggca ttcaggcgaa aaagagtata acgaattcat 7080 acaaaaaatt agaactaccg atatcggtaa gtgtctgata ttgcccgaat actcagtgct 7140 tagacgtaga tggttagatc tattctaggt taacaatata gacacttaat ttgagtagaa 7200 gtaggagttt at 7212 <210> 33 <211> 10735 <212> DNA <213> Dengue virus type 1 <400> 33 agttgttagt ctacgtggac cgacaagaac agtttcgaat cggaagcttg cttaacgtag 60 ttctaacagt tttttattag agagcagatc tctgatgaat aatcaacgta aaaaaacggg 120 tcgtccgtcg tttaatatgt taaaacgtgc gcgtaatcgt gtatcgacgg tatcgcaatt 180 agcgaaacgt ttttcgaaag gtttattatc gggtcaaggt ccgatgaaat tagtaatggc 240 gtttatagcg tttttacgtt ttttagcgat accgccgacg gcgggtatat tagcgcgttg 300 gggttcgttt aaaaaaaatg gtgcgataaa agtattacgt ggttttaaaa aagaaatatc 360 gaatatgtta aatataatga atcgtcgtaa acgttcggta acgatgttat taatgttatt 420 accgacggcg ttagcgtttc atttaacgac gcgtggtggt gaaccgcata tgatagtatc 480 gaaacaagaa cgtggtaaat cgttattatt taaaacgtcg gcgggtgtaa atatgtgtac 540 gttaatagcg atggatttag gtgaattatg tgaagatacg atgacgtata aatgtccgcg 600 tataacggaa acggaaccgg atgatgtaga ttgttggtgt aatgcgacgg aaacgtgggt 660 aacgtatggt acgtgttcgc aaacgggtga acatcgtcgt gataaacgtt cggtagcgtt 720 agcgccgcat gtaggtttag gtttagaaac gcgtacggaa acgtggatgt cgtcggaagg 780 tgcgtggaaa caaatacaaa aagtagaaac gtgggcgtta cgtcatccgg gttttacggt 840 aatagcgtta tttttagcgc atgcgatagg tacgtcgata acgcaaaaag gtataatatt 900 tatattatta atgttagtaa cgccgtcgat ggcgatgcgt tgtgtaggta taggtaatcg 960 tgattttgta gaaggtttat cgggtgcgac gtgggtagat gtagtattag aacatggttc 1020 gtgtgtaacg acgatggcga aagataaacc gacgttagat atagaattat taaaaacgga 1080 agtaacgaat ccggcggtat tacgtaaatt atgtatagaa gcgaaaatat cgaatacgac 1140 gacggattcg cgttgtccga cgcaaggtga agcgacgtta gtagaagaac aagatacgaa 1200 ttttgtatgt cgtcgtacgt ttgtagatcg tggttggggt aatggttgtg gtttatttgg 1260 taaaggttcg ttaataacgt gtgcgaaatt taaatgtgta acgaaattag aaggtaaaat 1320 agtacaatat gaaaatttaa aatattcggt aatagtaacg gtacatacgg gtgatcaaca 1380 tcaagtaggt aatgaaacga cggaacatgg tacgacggcg acgataacgc cgcaagcgcc 1440 gacgtcggaa atacaattaa cggattatgg tgcgttaacg ttagattgtt cgccgcgtac 1500 gggtttagat tttaatgaaa tggtattatt aacgatgaaa aaaaaatcgt ggttagtaca 1560 taaacaatgg tttttagatt taccgttacc gtggacgtcg ggtgcgtcga cgtcgcaaga 1620 aacgtggaat cgtcaagatt tattagtaac gtttaaaacg gcgcatgcga aaaaacaaga 1680 agtagtagta ttaggttcgc aagaaggtgc gatgcatacg gcgttaacgg gtgcgacgga 1740 aatacaaacg tcgggtacga cgacgatatt tgcgggtcat ttaaaatgtc gtttaaaaat 1800 ggataaatta atattaaaag gtatgtcgta tgtaatgtgt acgggttcgt ttaaattaga 1860 aaaagaagta gcggaaacgc aacatggtac ggtattagta caagtaaaat atgaaggtac 1920 ggatgcgccg tgtaaaatac cgttttcgtc gcaagatgaa aaaggtgtaa cgcaaaatgg 1980 tcgtttaata acggcgaatc cgatagtaac ggataaagaa aaaccggtaa atatagaagc 2040 ggaaccgccg tttggtgaat cgtatatagt agtaggtgcg ggtgaaaaag cgttaaaatt 2100 atcgtggttt aaaaaaggtt cgtcgatagg taaaatgttt gaagcgacgg cgcgtggtgc 2160 gcgtcgtatg gcgatattag gtgatacggc gtgggatttt ggttcgatag gtggtgtatt 2220 tacgtcggta ggtaaattaa tacatcaaat atttggtacg gcgtatggtg tattattttc 2280 gggtgtatcg tggacgatga aaataggtat aggtatatta ttaacgtggt taggtttaaa 2340 ttcgcgttcg acgtcgttat cgatgacgtg tatagcggta ggtatggtaa cgttatattt 2400 aggtgtaatg gtacaagcgg attcgggttg tgtaataaat tggaaaggtc gtgaattaaa 2460 atgtggttcg ggtatatttg taacgaatga agtacatacg tggacggaac aatataaatt 2520 tcaagcggat tcgccgaaac gtttatcggc ggcgataggt aaagcgtggg aagaaggtgt 2580 atgtggtata cgttcggcga cgcgtttaga aaatataatg tggaaacaaa tatcgaatga 2640 attaaatcat atattattag aaaatgatat gaaatttacg gtagtagtag gtgatgtatc 2700 gggtatatta gcgcaaggta aaaaaatgat acgtccgcaa ccgatggaac ataaatattc 2760 gtggaaatcg tggggtaaag cgaaaataat aggtgcggat gtacaaaata cgacgtttat 2820 aatagatggt ccgaatacgc cggaatgtcc ggataatcaa cgtgcgtgga atatatggga 2880 agtagaagat tatggttttg gtatatttac gacgaatata tggttaaaat tacgtgattc 2940 gtatacgcaa gtatgtgatc atcgtttaat gtcggcggcg ataaaagatt cgaaagcggt 3000 acatgcggat atgggttatt ggatagaatc ggaaaaaaat gaaacgtgga aattagcgcg 3060 tgcgtcgttt atagaagtaa aaacgtgtat atggccgaaa tcgcatacgt tatggtcgaa 3120 tggtgtatta gaatcggaaa tgataatacc gaaaatatat ggtggtccga tatcgcaaca 3180 taattatcgt ccgggttatt ttacgcaaac ggcgggtccg tggcatttag gtaaattaga 3240 attagatttt gatttatgtg aaggtacgac ggtagtagta gatgaacatt gtggtaatcg 3300 tggtccgtcg ttacgtacga cgacggtaac gggtaaaacg atacatgaat ggtgttgtcg 3360 ttcgtgtacg ttaccgccgt tacgttttaa aggtgaagat ggttgttggt atggtatgga 3420 aatacgtccg gtaaaagaaa aagaagaaaa tttagtaaaa tcgatggtat cggcgggttc 3480 gggtgaagta gattcgtttt cgttaggttt attatgtata tcgataatga tagaagaagt 3540 aatgcgttcg cgttggtcgc gtaaaatgtt aatgacgggt acgttagcgg tatttttatt 3600 attaacgatg ggtcaattaa cgtggaatga tttaatacgt ttatgtataa tggtaggtgc 3660 gaatgcgtcg gataaaatgg gtatgggtac gacgtattta gcgttaatgg cgacgtttcg 3720 tatgcgtccg atgtttgcgg taggtttatt atttcgtcgt ttaacgtcgc gtgaagtatt 3780 attattaacg gtaggtttat cgttagtagc gtcggtagaa ttaccgaatt cgttagaaga 3840 attaggtgat ggtttagcga tgggtataat gatgttaaaa ttattaacgg attttcaatc 3900 gcatcaatta tgggcgacgt tattatcgtt aacgtttgta aaaacgacgt tttcgttaca 3960 ttatgcgtgg aaaacgatgg cgatgatatt atcgatagta tcgttatttc cgttatgttt 4020 atcgacgacg tcgcaaaaaa cgacgtggtt accggtatta ttaggttcgt taggttgtaa 4080 accgttaacg atgtttttaa taacggaaaa taaaatatgg ggtcgtaaat cgtggccgtt 4140 aaatgaaggt ataatggcgg taggtatagt atcgatatta ttatcgtcgt tattaaaaaa 4200 tgatgtaccg ttagcgggtc cgttaatagc gggtggtatg ttaatagcgt gttatgtaat 4260 atcgggttcg tcggcggatt tatcgttaga aaaagcggcg gaagtatcgt gggaagaaga 4320 agcggaacat tcgggtgcgt cgcataatat attagtagaa gtacaagatg atggtacgat 4380 gaaaataaaa gatgaagaac gtgatgatac gttaacgata ttattaaaag cgacgttatt 4440 agcgatatcg ggtgtatatc cgatgtcgat accggcgacg ttatttgtat ggtatttttg 4500 gcaaaaaaaa aaacaacgtt cgggtgtatt atgggatacg ccgtcgccgc cggaagtaga 4560 acgtgcggta ttagatgatg gtatatatcg tatattacaa cgtggtttat taggtcgttc 4620 gcaagtaggt gtaggtgtat ttcaagaagg tgtatttcat acgatgtggc atgtaacgcg 4680 tggtgcggta ttaatgtatc aaggtaaacg tttagaaccg tcgtgggcgt cggtaaaaaa 4740 agatttaata tcgtatggtg gtggttggcg ttttcaaggt tcgtggaatg cgggtgaaga 4800 agtacaagta atagcggtag aaccgggtaa aaatccgaaa aatgtacaaa cggcgccggg 4860 tacgtttaaa acgccggaag gtgaagtagg tgcgatagcg ttagatttta aaccgggtac 4920 gtcgggttcg ccgatagtaa atcgtgaagg taaaatagta ggtttatatg gtaatggtgt 4980 agtaacgacg tcgggtacgt atgtatcggc gatagcgcaa gcgaaagcgt cgcaagaagg 5040 tccgttaccg gaaatagaag atgaagtatt tcgtaaacgt aatttaacga taatggattt 5100 acatccgggt tcgggtaaaa cgcgtcgtta tttaccggcg atagtacgtg aagcgataaa 5160 acgtaaatta cgtacgttag tattagcgcc gacgcgtgta gtagcgtcgg aaatggcgga 5220 agcgttaaaa ggtatgccga tacgttatca aacgacggcg gtaaaatcgg aacatacggg 5280 taaagaaata gtagatttaa tgtgtcatgc gacgtttacg atgcgtttat tatcgccggt 5340 acgtgtaccg aattataata tgataataat ggatgaagcg cattttacgg atccggcgtc 5400 gatagcggcg cgtggttata tatcgacgcg tgtaggtatg ggtgaagcgg cggcgatatt 5460 tatgacggcg acgccgccgg gttcggtaga agcgtttccg caatcgaatg cggtaataca 5520 agatgaagaa cgtgatatac cggaacgttc gtggaattcg ggttatgatt ggataacgga 5580 ttttccgggt aaaacggtat ggtttgtacc gtcgataaaa tcgggtaatg atatagcgaa 5640 ttgtttacgt aaaaatggta aacgtgtagt acaattatcg cgtaaaacgt ttgatacgga 5700 atatcaaaaa acgaaaaata atgattggga ttatgtagta acgacggata tatcggaaat 5760 gggtgcgaat tttcgtgcgg atcgtgtaat agatccgcgt cgttgtttaa aaccggtaat 5820 attaaaagat ggtccggaac gtgtaatatt agcgggtccg atgccggtaa cggtagcgtc 5880 ggcggcgcaa cgtcgtggtc gtataggtcg taatcaaaat aaagaaggtg atcaatatat 5940 atatatgggt caaccgttaa ataatgatga agatcatgcg cattggacgg aagcgaaaat 6000 gttattagat aatataaata cgccggaagg tataataccg gcgttatttg aaccggaacg 6060 tgaaaaatcg gcggcgatag atggtgaata tcgtttacgt ggtgaagcgc gtaaaacgtt 6120 tgtagaatta atgcgtcgtg gtgatttacc ggtatggtta tcgtataaag tagcgtcgga 6180 aggttttcaa tattcggatc gtcgttggtg ttttgatggt gaacgtaata atcaagtatt 6240 agaagaaaat atggatgtag aaatatggac gaaagaaggt gaacgtaaaa aattacgtcc 6300 gcgttggtta gatgcgcgta cgtattcgga tccgttagcg ttacgtgaat ttaaagaatt 6360 tgcggcgggt cgtcgttcgg tatcgggtga tttaatatta gaaataggta aattaccgca 6420 acatttaacg caacgtgcgc aaaatgcgtt agataattta gtaatgttac ataattcgga 6480 acaaggtggt aaagcgtatc gtcatgcgat ggaagaatta ccggatacga tagaaacgtt 6540 aatgttatta gcgttaatag cggtattaac gggtggtgta acgttatttt ttttatcggg 6600 tcgtggttta ggtaaaacgt cgataggttt attatgtgta atagcgtcgt cggcgttatt 6660 atggatggcg tcggtagaac cgcattggat agcggcgtcg ataatattag aatttttttt 6720 aatggtatta ttaataccgg aaccggatcg tcaacgtacg ccgcaagata atcaattagc 6780 gtatgtagta ataggtttat tatttatgat attaacggta gcggcgaatg aaatgggttt 6840 attagaaacg acgaaaaaag atttaggtat aggtcatgcg gcggcggaaa atcatcatca 6900 tgcggcgatg ttagatgtag atttacatcc ggcgtcggcg tggacgttat atgcggtagc 6960 gacgacgata ataacgccga tgatgcgtca tacgatagaa aatacgacgg cgaatatatc 7020 gttaacggcg atagcgaatc aagcggcgat attaatgggt ttagataaag gttggccgat 7080 atcgaaaatg gatataggtg taccgttatt agcgttaggt tgttattcgc aagtaaatcc 7140 gttaacgtta acggcggcgg tattaatgtt agtagcgcat tatgcgataa taggtccggg 7200 tttacaagcg aaagcgacgc gtgaagcgca aaaacgtacg gcggcgggta taatgaaaaa 7260 tccgacggta gatggtatag tagcgataga tttagatccg gtagtatatg atgcgaaatt 7320 tgaaaaacaa ttaggtcaaa taatgttatt aatattatgt acgtcgcaaa tattattaat 7380 gcgtacgacg tgggcgttat gtgaatcgat aacgttagcg acgggtccgt taacgacgtt 7440 atgggaaggt tcgccgggta aattttggaa tacgacgata gcggtatcga tggcgaatat 7500 atttcgtggt tcgtatttag cgggtgcggg tttagcgttt tcgttaatga aatcgttagg 7560 tggtggtcgt cgtggtacgg gtgcgcaagg tgaaacgtta ggtgaaaaat ggaaacgtca 7620 attaaatcaa ttatcgaaat cggaatttaa tacgtataaa cgttcgggta taatagaagt 7680 agatcgttcg gaagcgaaag aaggtttaaa acgtggtgaa acgacgaaac atgcggtatc 7740 gcgtggtacg gcgaaattac gttggtttgt agaacgtaat ttagtaaaac cggaaggtaa 7800 agtaatagat ttaggttgtg gtcgtggtgg ttggtcgtat tattgtgcgg gtttaaaaaa 7860 agtaacggaa gtaaaaggtt atacgaaagg tggtccgggt catgaagaac cgataccgat 7920 ggcgacgtat ggttggaatt tagtaaaatt atattcgggt aaagatgtat tttttacgcc 7980 gccggaaaaa tgtgatacgt tattatgtga tataggtgaa tcgtcgccga atccgacgat 8040 agaagaaggt cgtacgttac gtgtattaaa aatggtagaa ccgtggttac gtggtaatca 8100 attttgtata aaaatattaa atccgtatat gccgtcggta gtagaaacgt tagaacaaat 8160 gcaacgtaaa catggtggta tgttagtacg taatccgtta tcgcgtaatt cgacgcatga 8220 aatgtattgg gtatcgtgtg gtacgggtaa tatagtatcg gcggtaaata tgacgtcgcg 8280 tatgttatta aatcgtttta cgatggcgca tcgtaaaccg acgtatgaac gtgatgtaga 8340 tttaggtgcg ggtacgcgtc atgtagcggt agaaccggaa gtagcgaatt tagatataat 8400 aggtcaacgt atagaaaata taaaaaatga acataaatcg acgtggcatt atgatgaaga 8460 taatccgtat aaaacgtggg cgtatcatgg ttcgtatgaa gtaaaaccgt cgggttcggc 8520 gtcgtcgatg gtaaatggtg tagtacgttt attaacgaaa ccgtgggatg taataccgat 8580 ggtaacgcaa atagcgatga cggatacgac gccgtttggt caacaacgtg tatttaaaga 8640 aaaagtagat acgcgtacgc cgaaagcgaa acgtggtacg gcgcaaataa tggaagtaac 8700 ggcgcgttgg ttatggggtt ttttatcgcg taataaaaaa ccgcgtatat gtacgcgtga 8760 agaatttacg cgtaaagtac gttcgaatgc ggcgataggt gcggtatttg tagatgaaaa 8820 tcaatggaat tcggcgaaag aagcggtaga agatgaacgt ttttgggatt tagtacatcg 8880 tgaacgtgaa ttacataaac aaggtaaatg tgcgacgtgt gtatataata tgatgggtaa 8940 acgtgaaaaa aaattaggtg aatttggtaa agcgaaaggt tcgcgtgcga tatggtatat 9000 gtggttaggt gcgcgttttt tagaatttga agcgttaggt tttatgaatg aagatcattg 9060 gttttcgcgt gaaaattcgt tatcgggtgt agaaggtgaa ggtttacata aattaggtta 9120 tatattacgt gatatatcga aaataccggg tggtaatatg tatgcggatg atacggcggg 9180 ttgggatacg cgtataacgg aagatgattt acaaaatgaa gcgaaaataa cggatataat 9240 ggaaccggaa catgcgttat tagcgacgtc gatatttaaa ttaacgtatc aaaataaagt 9300 agtacgtgta caacgtccgg cgaaaaatgg tacggtaatg gatgtaatat cgcgtcgtga 9360 tcaacgtggt tcgggtcaag taggtacgta tggtttaaat acgtttacga atatggaagc 9420 gcaattaata cgtcaaatgg aatcggaagg tatattttcg ccgtcggaat tagaaacgcc 9480 gaatttagcg gaacgtgtat tagattggtt aaaaaaacat ggtacggaac gtttaaaacg 9540 tatggcgata tcgggtgatg attgtgtagt aaaaccgata gatgatcgtt ttgcgacggc 9600 gttaacggcg ttaaatgata tgggtaaagt acgtaaagat ataccgcaat gggaaccgtc 9660 gaaaggttgg aatgattggc aacaagtacc gttttgttcg catcattttc atcaattaat 9720 aatgaaagat ggtcgtgaaa tagtagtacc gtgtcgtaat caagatgaat tagtaggtcg 9780 tgcgcgtgta tcgcaaggtg cgggttggtc gttacgtgaa acggcgtgtt taggtaaatc 9840 gtatgcgcaa atgtggcaat taatgtattt tcatcgtcgt gatttacgtt tagcggcgaa 9900 tgcgatatgt tcggcggtac cggtagattg ggtaccgacg tcgcgtacga cgtggtcgat 9960 acatgcgcat catcaatgga tgacgacgga agatatgtta tcggtatgga atcgtgtatg 10020 gatagaagaa aatccgtgga tggaagataa aacgcatgta tcgtcgtggg aagatgtacc 10080 gtatttaggt aaacgtgaag atcaatggtg tggttcgtta ataggtttaa cggcgcgtgc 10140 gacgtgggcg acgaatatac aagtagcgat aaatcaagta cgtcgtttaa taggtaatga 10200 aaattattta gattttatga cgtcgatgaa acgttttaaa aatgaatcgg atccggaagg 10260 tgcgttatgg taagccaact cattcacaaa ataaaggaaa ataaaaaatc aaacaaggca 10320 agaagtcagg ccggattaag ccatagcacg gtaagagcta tgctgcctgt gagccccgtc 10380 caaggacgta aaatgaagtc aggccgaaag ccacggttcg agcaagccgt gctgcctgta 10440 gctccatcgt ggggatgtaa aaacccggga ggctgcaaac catggaagct gtacgcatgg 10500 ggtagcagac tagtggttag aggagacccc tcccaagaca caacgcagca gcggggccca 10560 acaccagggg aagctgtacc ctggtggtaa ggactagagg ttagaggaga ccccccgcac 10620 aacaacaaac agcatattga cgctgggaga gaccagagat cctgctgtct ctacagcatc 10680 attccaggca cagaacgcca aaaaatggaa tggtgctgtt gaatcaacag gttct 10735 <210> 34 <211> 10735 <212> DNA <213> Unknown <220> <223> synthetic <400> 34 agttgttagt ctacgtggac cgacaagaac agtttcgaat cggaagcttg cttaacgtag 60 ttctaacagt tttttattag agagcagatc tctgatgaat aaccaacgaa aaaaaaccgg 120 acgaccatca ttcaatatgc ttaaacgcgc taggaatagg gtgtcaaccg tatcgcaatt 180 ggctaagaga ttctctaagg gactgttaag cggacaggga ccaatgaaac tggttatggc 240 attcatagcg tttctgagat ttctcgcaat accgccaacc gccggaatac tcgctagatg 300 ggggtcattc aaaaaaaacg gcgcaattaa agtgcttagg gggttcaaaa aagagatatc 360 gaatatgctt aacattatga atagacgtaa gagatccgtt acaatgctat tgatgctatt 420 gccaaccgca ctagcctttc acctaacgac tagggggggg gaaccacata tgatagtgag 480 taagcaagag agaggtaagt cactattgtt caaaacatcc gccggagtga atatgtgtac 540 actaatcgct atggacttag gcgaattgtg cgaagacact atgacatata agtgtcctag 600 gattaccgaa accgaaccag acgacgtcga ttgttggtgt aacgcaaccg aaacatgggt 660 gacatacgga acatgttcgc aaaccggaga gcatagacgc gataagagat cagtcgcact 720 cgcaccacac gtcggattgg ggttagagac tagaaccgaa acatggatgt ctagcgaagg 780 cgcatggaaa cagatacaga aagtcgagac atgggccctt agacacccag ggtttaccgt 840 aatcgcacta tttctcgcac acgcaatcgg aacgtcaatt acgcaaaaag ggattatatt 900 catactgctt atgttagtga caccatctat ggctatgaga tgcgtcggaa tcggaaatag 960 ggatttcgtt gagggactat ccggagcgac atgggtcgac gtagtgctcg aacacggatc 1020 atgcgttacg actatggcca aagacaaacc gacacttgac atagagttac tgaaaaccga 1080 agtgactaac ccagccgtac tgagaaagtt gtgtatcgaa gctaagatat cgaatacgac 1140 taccgatagt aggtgtccaa cgcaaggcga agcgacacta gtcgaagagc aggatacgaa 1200 tttcgtatgt agacgtacat tcgtcgatag ggggtgggga aacggatgcg gattgttcgg 1260 taagggatca ctgattacat gcgctaaatt caaatgcgtt acgaaactcg agggtaagat 1320 agtgcaatac gagaatctga aatatagcgt aatcgttaca gtgcataccg gagaccaaca 1380 ccaagtggga aacgagacta ccgaacacgg aactaccgca acgattacgc cacaagcccc 1440 tactagcgaa atccaattga ccgattacgg cgcactaaca ctcgattgtt cacctagaac 1500 cggattggac tttaacgaaa tggtgctatt gactatgaaa aaaaaatcat ggttagtgca 1560 taagcaatgg ttcttagacc taccactacc atggactagc ggagctagta cgtcacagga 1620 gacatggaat agacaggatc tgttagtgac attcaaaacc gcacacgcta aaaaacagga 1680 ggtcgtagtg ttagggtcac aagagggagc tatgcatacc gcactaacag gcgcaaccga 1740 gatacagact agcggaacga ctacgatatt cgccggacac cttaagtgta gactgaaaat 1800 ggacaaactg atactgaaag gtatgtcata cgttatgtgt accggatcat tcaaactcga 1860 aaaagaggtc gccgaaacgc aacacggaac agtgttagtg caagtgaaat acgagggaac 1920 tgacgcacca tgtaagatac cgttttcgtc acaggacgaa aaaggcgtta cgcaaaacgg 1980 tagactgatt accgctaacc caatcgttac cgataaagag aaaccggtta atatcgaagc 2040 cgaaccacca ttcggcgaat catatatcgt agtcggagcc ggagagaaag cccttaagct 2100 atcatggttt aaaaaagggt catcaatcgg taagatgttc gaagcaaccg ctagaggcgc 2160 tagacgtatg gccatactag gcgataccgc atgggatttc ggatcaatcg gaggagtgtt 2220 tacgtcagtc ggaaaactga tacaccaaat tttcggaacc gcatacggag tgttgtttag 2280 cggagtgtca tggactatga aaatcggaat cggaatactg ttgacatggt tagggttgaa 2340 ctctagatcg actagtctat ctatgacatg tatcgcagtc ggaatggtga cactatactt 2400 aggcgtaatg gtgcaagccg atagcggatg cgttattaat tggaaaggga gagagcttaa 2460 atgcggatcc ggaatattcg ttacgaacga agtgcataca tggaccgaac agtataaatt 2520 ccaagccgat agtccgaaaa gactatctgc cgcaatcggt aaggcatggg aggagggagt 2580 gtgcggaatt aggtcagcga ctagactcga aaacattatg tggaaacaga tatctaacga 2640 actgaatcac atactgttag agaacgatat gaaatttaca gtcgtagtcg gagacgttag 2700 cggaatactc gcacagggta agaaaatgat tagaccgcaa cctatggagc ataagtatag 2760 ttggaaatca tggggaaaag cgaaaattat cggagccgac gtgcaaaata cgacattcat 2820 aatcgacgga ccgaatacgc cagagtgtcc agacaatcag agagcatgga acatatggga 2880 ggtcgaagac tacggattcg gaatttttac gactaacata tggcttaagc ttagagactc 2940 atatacacag gtatgcgatc atagattgat gtctgccgca atcaaagact ctaaagccgt 3000 acacgccgat atggggtatt ggatcgaatc cgaaaaaaac gagacatgga aactcgctag 3060 agcgtcattc atagaggtta agacatgtat ttggcctaag tcacatacat tgtggtctaa 3120 cggagtgctt gagtctgaga tgataatccc taagatatac ggcggaccga tatcgcaaca 3180 taactataga ccagggtatt ttacgcaaac agccggacca tggcatctcg gtaagcttga 3240 gttagacttc gatctatgcg aagggactac cgtagtggtc gacgaacatt gcggtaatag 3300 gggacctagt ctgagaacga ctaccgttac cggtaagact atacacgaat ggtgttgtag 3360 gtcatgtaca ctaccaccac ttagattcaa aggcgaagac ggatgttggt acggaatgga 3420 gattagacca gtgaaagaga aagaggaaaa cctagtgaaa tctatggtgt cagccggatc 3480 aggcgaagtc gactcattct cactcggact gttatgcata tcgattatga tcgaagaggt 3540 tatgcgatct agatggtcac gaaaaatgct tatgaccgga acactagccg tttttctgtt 3600 actgactatg gggcaattga catggaacga tctgattagg ttgtgtatta tggtcggagc 3660 taacgctagc gataagatgg gtatgggaac gacatactta gcccttatgg ctacatttag 3720 aatgcgacca atgttcgccg tagggttact gtttagacgg ttgactagta gggaagtgct 3780 attgttgaca gtcggactgt cactagtcgc tagcgttgag ttgcctaact cactcgaaga 3840 gttaggcgac ggactcgcaa tggggattat gatgcttaag ctattgaccg atttccaatc 3900 tcaccaattg tgggctacac tattgtcact gacattcgtt aagactacat tctcattgca 3960 ttacgcatgg aaaactatgg ctatgatact gtcaatcgtt agtctattcc cactatgtct 4020 atctacaact agtcagaaaa ctacatggtt gccagtgcta ttggggtcac tagggtgtaa 4080 accattgact atgtttctga ttaccgaaaa caaaatttgg gggagaaagt catggccact 4140 taacgaggga attatggccg tagggatagt gtcaatactg ctatctagtc tgcttaaaaa 4200 cgacgtgcca ctagccggac cactgatagc cggaggtatg ctaatcgcat gttacgtgat 4260 atccggatct agcgccgatc tgtcactcga aaaagccgcc gaagtgtcat gggaagagga 4320 agccgaacac tctggcgcat cacataacat actagtcgaa gtgcaagacg acggaactat 4380 gaaaattaaa gacgaagaga gagacgatac acttacgata ctgcttaaag cgacactgtt 4440 agcgatatcc ggagtgtatc ctatgtcaat acccgctaca ctattcgttt ggtatttttg 4500 gcaaaaaaaa aaacagagat ccggagtgtt gtgggataca cctagtccac ccgaagtcga 4560 gagagccgta ctcgacgacg gaatatatag gatactgcaa cggggattgc tcggtaggtc 4620 acaggtcgga gtgggagtgt ttcaggaggg agtgtttcac actatgtggc acgttacgag 4680 aggcgccgta ctgatgtatc agggtaagag actcgaacct agttgggcta gcgttaaaaa 4740 agacctaatc tcatacggag gggggtggag atttcagggg tcatggaacg ccggagagga 4800 agtgcaagtg atagccgtcg aacccggtaa gaaccctaaa aacgtgcaaa ccgcacccgg 4860 aacgtttaag acacccgaag gcgaagtggg cgcaatcgca ctcgacttta aacccggaac 4920 tagcggatca ccaatcgtta atagagaggg taagatagtc ggattgtacg gaaacggagt 4980 ggttacgact agcggaacat acgttagcgc aatagcgcaa gcgaaagcgt cacaagaggg 5040 accactacca gagatagagg acgaagtgtt tagaaagcgt aatctgacaa ttatggacct 5100 acatcccgga tccggtaaga ctagacggta tctgccagca atcgttaggg aggcaattaa 5160 gagaaagttg cgtacactag tgttagcccc aactagagtg gtcgctagcg aaatggccga 5220 agcccttaag ggaatgccaa ttaggtatca gactaccgcc gttaagtccg aacataccgg 5280 taaggagata gtcgacctta tgtgtcacgc tacattcaca atgagactgc tatcaccagt 5340 gagagtgcct aactataata tgataattat ggacgaagcc cattttacag acccagcctc 5400 aatcgccgct agggggtata ttagtactag ggtgggaatg ggcgaagccg ccgcaatttt 5460 tatgacagcg acaccacccg gatccgtcga agcgtttccg caatctaacg ccgttataca 5520 ggacgaagag agagacatac ccgaacggtc atggaatagc ggatacgatt ggataaccga 5580 ttttcccggt aagacagtgt ggttcgtacc gtcaattaag tccggaaacg atatcgctaa 5640 ttgtcttaga aaaaacggta agagagtggt gcaattgtct agaaagacat tcgataccga 5700 ataccaaaaa actaagaata acgattggga ttacgtagtg acaaccgaca tatccgaaat 5760 gggcgctaac tttagagccg atagggtgat agaccctaga cggtgtctga aaccagtgat 5820 actgaaagac ggaccagaga gagtgatact agccggacca atgccagtga cagtcgcatc 5880 cgccgcacaa cgtaggggac ggatagggag aaaccaaaac aaagagggag accaatacat 5940 atatatggga cagccactga ataacgacga agaccacgca cattggaccg aagcgaaaat 6000 gctattagac aatattaaca cacccgaagg gattataccc gcactattcg aacccgaacg 6060 cgaaaaatcc gccgcaatcg acggcgaata tagactgaga ggcgaagcta gaaagacatt 6120 cgttgagctt atgcgtagag gcgatctacc cgtatggttg tcatacaaag tcgctagcga 6180 agggtttcag tattccgata ggagatggtg tttcgacggc gaacggaata accaagtgct 6240 cgaagagaat atggacgttg agatatggac taaagagggc gaacgaaaaa aactgagacc 6300 tagatggtta gacgcacgta catattccga tccgttagcc cttagagagt ttaaagagtt 6360 cgcagccggt aggagatccg ttagcggaga tctgatactc gaaatcggta agctaccaca 6420 acacctaacg caacgagccc aaaacgcact agacaatctg gttatgttgc ataactccga 6480 acagggcggt aaggcatata gacacgctat ggaagagtta cccgatacaa tcgaaacact 6540 tatgctactc gcactgatag ccgtactgac aggcggagtg acactattct ttctatccgg 6600 tagggggtta ggtaagacat caatcggact gttatgcgta atcgcatcta gcgcactatt 6660 gtggatggct agcgtcgaac cacattggat agccgcatca attatactcg aattctttct 6720 tatggtgtta ctgatacccg aacccgatag gcaacgaaca ccacaggata accaattggc 6780 atacgtcgta atcggactat tgtttatgat actgacagtc gccgctaacg aaatgggatt 6840 gctcgagaca acgaaaaaag acctagggat cggacacgcc gcagccgaaa atcaccatca 6900 cgccgcaatg ttagacgtcg atctgcatcc cgctagcgca tggacactat acgcagtcgc 6960 aacgacaatt attacgccta tgatgcgaca tacaatcgag aatactaccg ctaacatatc 7020 gctaaccgct atagcgaatc aggccgcaat actgatgggg ttagacaaag ggtggccaat 7080 tagtaagatg gatatcggag tgccactgtt agccttaggg tgttatagtc aggttaaccc 7140 attgacattg accgcagccg tacttatgct agtcgcacat tacgctataa tcggaccagg 7200 actgcaagcg aaagcgacac gcgaagcgca aaaaagaacc gcagccggaa ttatgaaaaa 7260 ccctacagtc gacggaatag tcgcaatcga cttagaccca gtggtgtacg acgctaaatt 7320 cgaaaaacag ttgggacaga ttatgctact gatactgtgt acgtcacaga tactgcttat 7380 gcgaactaca tgggcactat gcgaatcaat tacactcgca accggaccat tgactacatt 7440 gtgggaggga tcacccggta agttttggaa tacgactata gccgttagta tggctaacat 7500 ttttaggggg tcatatctag ccggagccgg actcgcattc tcacttatga aatcactcgg 7560 agggggacgt agggggacag gcgcacaggg agagacacta ggcgaaaaat ggaaacgaca 7620 attgaaccaa ttgtctaaat ccgaatttaa cacttataag agatccggaa taatcgaagt 7680 cgatagatcc gaagcgaaag agggactgaa acgcggagag acaacgaaac acgccgttag 7740 taggggaacc gctaagctta gatggttcgt tgagcgtaac ttagtgaaac cagagggtaa 7800 ggtaatcgat ctcggatgcg gtaggggggg gtggtcatac tattgcgccg gactgaaaaa 7860 agtgaccgaa gtgaaagggt atactaaggg cggacccgga cacgaagagc caataccgat 7920 ggcaacatac ggatggaacc tagtgaaact gtattccggt aaggacgtat tctttacacc 7980 acccgaaaaa tgcgatacac tgttatgcga tataggcgaa tctagtccta accctacaat 8040 cgaagaggga cgtacactta gagtgcttaa aatggtcgaa ccatggttga gggggaatca 8100 gttttgtatt aagatactga atccatatat gcctagcgta gtcgagacac tcgaacagat 8160 gcaacgaaaa cacggcggaa tgctagtgag aaacccacta tctaggaatt cgacacacga 8220 aatgtattgg gtgtcatgcg gaaccggaaa catagtgtca gccgttaata tgactagtag 8280 aatgctactg aatcggttta caatggccca tagaaaaccg acatacgaaa gagacgtcga 8340 cctaggagcc ggaactagac acgttgccgt cgaacccgaa gtcgctaact tagacataat 8400 cggacagaga atcgagaata ttaaaaacga acacaaatcg acatggcatt acgacgaaga 8460 caatccgtat aagacatggg catatcacgg atcatacgaa gtgaaaccta gcggatccgc 8520 tagttctatg gttaacggag tggtgagact gttgactaag ccatgggacg tgataccgat 8580 ggtgacacaa atcgctatga ccgatacgac accattcgga cagcaaagag tgtttaaaga 8640 gaaagtcgac actagaacac ctaaagcgaa acgcggaacc gcacagatta tggaggttac 8700 cgctagatgg ttgtgggggt tcctatctag aaacaaaaaa cctaggattt gtacacgcga 8760 agagtttaca cgaaaagtga gatctaacgc cgcaatcgga gccgtattcg tagacgaaaa 8820 ccaatggaat tccgctaaag aggccgtcga agacgaacgg ttttgggact tagtgcatag 8880 ggaacgcgaa ttgcataaac agggtaagtg cgcaacatgc gtatacaata tgatgggtaa 8940 gcgcgaaaaa aagttaggcg aattcggtaa ggctaaggga tctagagcga tatggtatat 9000 gtggttaggc gctaggtttc tcgaattcga agcactcgga tttatgaacg aagaccattg 9060 gttttctaga gagaatagtc tatccggagt cgagggagag ggattgcata aactcggata 9120 tatactgaga gacatatcta agatacccgg agggaatatg tacgccgacg atacagccgg 9180 atgggataca cgaattaccg aagacgatct gcaaaacgaa gcgaaaatta ccgatattat 9240 ggaacccgaa cacgcactgt tagcgacatc tatttttaag ttgacatatc agaataaggt 9300 cgttagggtg caacgacccg ctaaaaacgg aacggttatg gacgtgatta gtaggagaga 9360 ccaacgcgga tccggacagg tcggaacata cggactgaat acgtttacga atatggaagc 9420 gcaattgatt agacagatgg agtctgaggg gatattctca cctagcgaac tcgagacacc 9480 taacctagcc gaacgggtac tcgattggtt gaaaaaacac ggaaccgaaa gactgaaaag 9540 aatggcaatt agcggagacg attgcgtagt gaaaccaatc gacgatagat tcgcaaccgc 9600 actaaccgca cttaacgata tgggtaaggt gagaaaagac ataccgcaat gggagccatc 9660 taagggatgg aacgattggc aacaggtgcc attttgctca catcactttc accaattgat 9720 tatgaaagac ggtagggaga tagtcgtgcc atgtaggaat caggacgaac tcgtaggtag 9780 ggctagagtg tcacagggag ccggatggtc acttagggaa accgcatgcc taggtaagtc 9840 atacgctcaa atgtggcaat tgatgtattt ccatagacgc gatctgagac tagccgctaa 9900 cgctatatgc tctgccgtac cagtcgattg ggtgccaact agtagaacga catggtctat 9960 acacgcacat caccaatgga tgacaaccga agacatgcta tccgtttgga atagggtgtg 10020 gatcgaagag aatccatgga tggaggataa gacacacgtg tctagttggg aggacgtgcc 10080 atatctcgga aaacgcgaag accaatggtg cggatcacta atcggattga ccgctagagc 10140 gacatgggca actaacatac aggtcgcaat taaccaagtg agacgattga tcggaaacga 10200 gaattatctc gactttatga catctatgaa aagattcaaa aacgaatccg atcccgaagg 10260 cgcactatgg taagccaact cattcacaaa ataaaggaaa ataaaaaatc aaacaaggca 10320 agaagtcagg ccggattaag ccatagcacg gtaagagcta tgctgcctgt gagccccgtc 10380 caaggacgta aaatgaagtc aggccgaaag ccacggttcg agcaagccgt gctgcctgta 10440 gctccatcgt ggggatgtaa aaacccggga ggctgcaaac catggaagct gtacgcatgg 10500 ggtagcagac tagtggttag aggagacccc tcccaagaca caacgcagca gcggggccca 10560 acaccagggg aagctgtacc ctggtggtaa ggactagagg ttagaggaga ccccccgcac 10620 aacaacaaac agcatattga cgctgggaga gaccagagat cctgctgtct ctacagcatc 10680 attccaggca cagaacgcca aaaaatggaa tggtgctgtt gaatcaacag gttct 10735 <210> 35 <211> 9181 <212> DNA <213> Human immunodeficiency virus type 1 <400> 35 ggtctctctg gttagaccag atctgagcct gggagctctc tggctaacta gggaacccac 60 tgcttaagcc tcaataaagc ttgccttgag tgcttcaagt agtgtgtgcc cgtctgttgt 120 gtgactctgg taactagaga tccctcagac ccttttagtc agtgtggaaa atctctagca 180 gtggcgcccg aacagggacc tgaaagcgaa agggaaacca gaggagctct ctcgacgcag 240 gactcggctt gctgaagcgc gcacggcaag aggcgagggg cggcgactgg tgagtacgcc 300 aaaaattttg actagcggag gctagaagga gagagatggg tgcgcgtgcg tcggtattat 360 cgggtggtga attagatcgt tgggaaaaaa tacgtttacg tccgggtggt aaaaaaaaat 420 ataaattaaa acatatagta tgggcgtcgc gtgaattaga acgttttgcg gtaaatccgg 480 gtttattaga aacgtcggaa ggttgtcgtc aaatattagg tcaattacaa ccgtcgttac 540 aaacgggttc ggaagaatta cgttcgttat ataatacggt agcgacgtta tattgtgtac 600 atcaacgtat agaaataaaa gatacgaaag aagcgttaga taaaatagaa gaagaacaaa 660 ataaatcgaa aaaaaaagcg caacaagcgg cggcggatac gggtcattcg aatcaagtat 720 cgcaaaatta tccgatagta caaaatatac aaggtcaaat ggtacatcaa gcgatatcgc 780 cgcgtacgtt aaatgcgtgg gtaaaagtag tagaagaaaa agcgttttcg ccggaagtaa 840 taccgatgtt ttcggcgtta tcggaaggtg cgacgccgca agatttaaat acgatgttaa 900 atacggtagg tggtcatcaa gcggcgatgc aaatgttaaa agaaacgata aatgaagaag 960 cggcggaatg ggatcgtgta catccggtac atgcgggtcc gatagcgccg ggtcaaatgc 1020 gtgaaccgcg tggttcggat atagcgggta cgacgtcgac gttacaagaa caaataggtt 1080 ggatgacgaa taatccgccg ataccggtag gtgaaatata taaacgttgg ataatattag 1140 gtttaaataa aatagtacgt atgtattcgc cgacgtcgat attagatata cgtcaaggtc 1200 cgaaagaacc gtttcgtgat tatgtagatc gtttttataa aacgttacgt gcggaacaag 1260 cgtcgcaaga agtaaaaaat tggatgacgg aaacgttatt agtacaaaat gcgaatccgg 1320 attgtaaaac gatattaaaa gcgttaggtc cggcggcgac gttagaagaa atgatgacgg 1380 cgtgtcaagg tgtaggtggt ccgggtcata aagcgcgtgt attagcggaa gcgatgtcgc 1440 aagtaacgaa ttcggcgacg ataatgatgc aacgtggtaa ttttcgtaat caacgtaaaa 1500 tagtaaaatg ttttaattgt ggtaaagaag gtcatacggc gcgtaattgt cgtgcgccgc 1560 gtaaaaaagg ttgttggaaa tgtggtaaag aaggtcatca aatgaaagat tgtacggaac 1620 gtcaagcgaa ttttttaggg aagatctggc cttcctacaa gggaaggcca gggaattttc 1680 ttcagagcag accagagcca acagccccac cagaagagag cttcaggtct ggggtagaga 1740 caacaactcc ccctcagaag caggagccga tagacaagga actgtatcct ttaacttccc 1800 tcaggtcact ctttggcaac gacccctcgt cacaataaag ataggtggtc aattaaaaga 1860 agcgttatta gatacgggtg cggatgatac ggtattagaa gaaatgtcgt taccgggtcg 1920 ttggaaaccg aaaatgatag gtggtatagg tggttttata aaagtacgtc aatatgatca 1980 aatattaata gaaatatgtg gtcataaagc gataggtacg gtattagtag gtccgacgcc 2040 ggtaaatata ataggtcgta atttattaac gcaaataggt tgtacgttaa attttccgat 2100 atcgccgata gaaacggtac cggtaaaatt aaaaccgggt atggatggtc cgaaagtaaa 2160 acaatggccg ttaacggaag aaaaaataaa agcgttagta gaaatatgta cggaaatgga 2220 aaaagaaggt aaaatatcga aaataggtcc ggaaaatccg tataatacgc cggtatttgc 2280 gataaaaaaa aaagattcga cgaaatggcg taaattagta gattttcgtg aattaaataa 2340 acgtacgcaa gatttttggg aagtacaatt aggtataccg catccggcgg gtttaaaaaa 2400 aaaaaaatcg gtaacggtat tagatgtagg tgatgcgtat ttttcggtac cgttagatga 2460 agattttcgt aaatatacgg cgtttacgat accgtcgata aataatgaaa cgccgggtat 2520 acgttatcaa tataatgtat taccgcaagg ttggaaaggt tcgccggcga tatttcaatc 2580 gtcgatgacg aaaatattag aaccgtttcg taaacaaaat ccggatatag taatatatca 2640 atatatggat gatttatatg taggttcgga tttagaaata ggtcaacatc gtacgaaaat 2700 agaagaatta cgtcaacatt tattacgttg gggtttaacg acgccggata aaaaacatca 2760 aaaagaaccg ccgtttttat ggatgggtta tgaattacat ccggataaat ggacggtaca 2820 accgatagta ttaccggaaa aagattcgtg gacggtaaat gatatacaaa aattagtagg 2880 taaattaaat tgggcgtcgc aaatatatcc gggtataaaa gtacgtcaat tatgtaaatt 2940 attacgtggt acgaaagcgt taacggaagt aataccgtta acggaagaag cggaattaga 3000 attagcggaa aatcgtgaaa tattaaaaga accggtacat ggtgtatatt atgatccgtc 3060 gaaagattta atagcggaaa tacaaaaaca aggtcaaggt caatggacgt atcaaatata 3120 tcaagaaccg tttaaaaatt taaaaacggg taaatatgcg cgtatgcgtg gtgcgcatac 3180 gaatgatgta aaacaattaa cggaagcggt acaaaaaata acgacggaat cgatagtaat 3240 atggggtaaa acgccgaaat ttaaattacc gatacaaaaa gaaacgtggg aaacgtggtg 3300 gacggaatat tggcaagcga cgtggatacc ggaatgggaa tttgtaaata cgccgccgtt 3360 agtaaaatta tggtatcaat tagaaaaaga accgatagta ggtgcggaaa cgttttatgt 3420 agatggtgcg gcgaatcgtg aaacgaaatt aggtaaagcg ggttatgtaa cgaatcgtgg 3480 tcgtcaaaaa gtagtaacgt taacggatac gacgaatcaa aaaacggaat tacaagcgat 3540 atatttagcg ttacaagatt cgggtttaga agtaaatata gtaacggatt cgcaatatgc 3600 gttaggtata atacaagcgc aaccggatca atcggaatcg gaattagtaa atcaaataat 3660 agaacaatta ataaaaaaag aaaaagtata tttagcgtgg gtaccggcgc ataaaggtat 3720 aggtggtaat gaacaagtag ataaattagt atcggcgggt atacgtaaag tattattttt 3780 agatggtata gataaagcgc aagatgaaca tgaaaaatat cattcgaatt ggcgtgcgat 3840 ggcgtcggat tttaatttac cgccggtagt agcgaaagaa atagtagcgt cgtgtgataa 3900 atgtcaatta aaaggtgaag cgatgcatgg tcaagtagat tgttcgccgg gtatatggca 3960 attagattgt acgcatttag aaggtaaagt aatattagta gcggtacatg tagcgtcggg 4020 ttatatagaa gcggaagtaa taccggcgga aacgggtcaa gaaacggcgt attttttatt 4080 aaaattagcg ggtcgttggc cggtaaaaac gatacatacg gataatggtt cgaattttac 4140 gggtgcgacg gtacgtgcgg cgtgttggtg ggcgggtata aaacaagaat ttggtatacc 4200 gtataatccg caatcgcaag gtgtagtaga atcgatgaat aaagaattaa aaaaaataat 4260 aggtcaagta cgtgatcaag cggaacattt aaaaacggcg gtacaaatgg cggtatttat 4320 acataatttt aaacgtaaag gtggtatagg tggttattcg gcgggtgaac gtatagtaga 4380 tataatagcg acggatatac aaacgaaaga attacaaaaa caaataacga aaatacaaaa 4440 ttttcgtgta tattatcgtg attcgcgtaa tccgttatgg aaaggtccgg cgaaattatt 4500 atggaaaggt gaaggtgcgg tagtaataca agataattcg gatataaaag tagtaccgcg 4560 tcgtaaagcg aaaataatac gtgattatgg aaaacagatg gcaggtgatg attgtgtggc 4620 aagtagacag gatgaggatt agaacgtgga aatcgttagt aaaacatcat atgtatgtat 4680 cgggtaaagc gcgtggttgg ttttatcgtc atcattatga atcgccgcat ccgcgtatat 4740 cgtcggaagt acatataccg ttaggtgatg cgcgtttagt aataacgacg tattggggtt 4800 tacatacggg tgaacgtgat tggcatttag gtcaaggtgt atcgatagaa tggcgtaaaa 4860 aacgttattc gacgcaagta gatccggaat tagcggatca attaatacat ttatattatt 4920 ttgattgttt ttcggattcg gcgatacgta aagcgttatt aggtcatata gtatcgccgc 4980 gttgtgaata tcaagcgggt cataataaag taggttcgtt acaatattta gcgttagcgg 5040 cgttaataac gccgaaaaaa ataaaaccgc cgttaccgtc ggtaacgaaa ttaacggaag 5100 atagatggaa caagccccag aagaccaagg gccacagagg gagccacaca atgaatggac 5160 actagagctt ttagaggagc ttaagaatga agctgttaga cattttccta ggatttggct 5220 ccatggctta gggcaacata tctatgaaac ttatggggat acttgggcag gagtggaagc 5280 cataataaga attctgcaac aactgctgtt tatccatttt cagaattggg tgtcgacata 5340 gcagaatagg cgttactcga cagaggagag caagaaatgg agccagtaga tcctagacta 5400 gagccctgga agcatccagg aagtcagcct aaaactgctt gtaccaattg ctattgtaaa 5460 aagtgttgct ttcattgcca agtttgtttc ataacaaaag ccttaggcat ctcctatggc 5520 aggaagaagc ggagacagcg acgaagagct catcagaaca gtcagactca tcaagcttct 5580 ctatcaaagc agtaagtagt acatgtaatg caacctatac caatagtagc aatagtagca 5640 ttagtagtag caataataat agcaatagtt gtgtggtcca tagtaatcat agaatatagg 5700 aaaatattaa gacaaagaaa aatagacagg ttaattgata gactaataga aagagcagaa 5760 gacagtggca atgagagtga aggagaaata tcagcacttg tggagatggg ggtggagatg 5820 gggcaccatg ctccttggga tgttgatgat ctgtagtgcg acggaaaaat tatgggtaac 5880 ggtatattat ggtgtaccgg tatggaaaga agcgacgacg acgttatttt gtgcgtcgga 5940 tgcgaaagcg tatgatacgg aagtacataa tgtatgggcg acgcatgcgt gtgtaccgac 6000 ggatccgaat ccgcaagaag tagtattagt aaatgtaacg gaaaatttta atatgtggaa 6060 aaatgatatg gtagaacaaa tgcatgaaga tataatatcg ttatgggatc aatcgttaaa 6120 accgtgtgta aaattaacgc cgttatgtgt atcgttaaaa tgtacggatt taaaaaatga 6180 tacgaatacg aattcgtcgt cgggtcgtat gataatggaa aaaggtgaaa taaaaaattg 6240 ttcgtttaat atatcgacgt cgatacgtgg taaagtacaa aaagaatatg cgttttttta 6300 taaattagat ataataccga tagataatga tacgacgtcg tataaattaa cgtcgtgtaa 6360 tacgtcggta ataacgcaag cgtgtccgaa agtatcgttt gaaccgatac cgatacatta 6420 ttgtgcgccg gcgggttttg cgatattaaa atgtaataat aaaacgttta atggtacggg 6480 tccgtgtacg aatgtatcga cggtacaatg tacgcatggt atacgtccgg tagtatcgac 6540 gcaattatta ttaaatggtt cgttagcgga agaagaagta gtaatacgtt cggtaaattt 6600 tacggataat gcgaaaacga taatagtaca attaaatacg tcggtagaaa taaattgtac 6660 gcgtccgaat aataatacgc gtaaacgtat acgtatacaa cgtggtccgg gtcgtgcgtt 6720 tgtaacgata ggtaaaatag gtaatatgcg tcaagcgcat tgtaatatat cgcgtgcgaa 6780 atggaataat acgttaaaac aaatagcgtc gaaattacgt gaacaatttg gtaataataa 6840 aacgataata tttaaacaat cgtcgggtgg tgatccggaa atagtaacgc attcgtttaa 6900 ttgtggtggt gaattttttt attgtaattc gacgcaatta tttaattcga cgtggtttaa 6960 ttcgacgtgg tcgacggaag gttcgaataa tacggaaggt tcggatacga taacgttacc 7020 gtgtcgtata aaacaaataa taaatatgtg gcaaaaagta ggtaaagcga tgtatgcgcc 7080 gccgatatcg ggtcaaatac gttgttcgtc gaatataacg ggtttattat taacgcgtga 7140 tggtggtaat tcgaataatg aatcggaaat atttcgtccg ggtggtggtg atatgcgtga 7200 taattggcgt tcggaattat ataaatataa agtagtaaaa atagaaccgt taggtgtagc 7260 gccgacgaaa gcgaaacgtc gtgtagtaca acgtgaaaaa cgtgcggtag gtataggtgc 7320 gttattttta ggttttttag gtgcggcggg ttcgacgatg ggtgcggcgt cgatgacgtt 7380 aacggtacaa gcgcgtcaat tattatcggg tatagtacaa caacaaaata atttattacg 7440 tgcgatagaa gcgcaacaac atttattaca attaacggta tggggtataa aacaattaca 7500 agcgcgtata ttagcggtag aacgttattt aaaagatcaa caattattag gtatatgggg 7560 ttgttcgggt aaattaatat gtacgacggc ggtaccgtgg aatgcgtcgt ggtcgaataa 7620 atcgttagaa caaatatgga atcatacgac gtggatggaa tgggatcgtg aaataaataa 7680 ttatacgtcg ttaatacatt cgttaataga agaatcgcaa aatcaacaag aaaaaaatga 7740 acaagaatta ttagaattag ataaatgggc gtcgttatgg aattggttta atataacgaa 7800 ttggttatgg tatataaaat tatttataat gatagtaggt ggtttagtag gtttacgtat 7860 agtatttgcg gtattatcga tagtaaatcg tgtacgtcaa ggttattcgc cgttatcgtt 7920 tcaaacccac ctcccaaccc cgaggggacc cgacaggccc gaaggaatag aagaagaagg 7980 tggagagaga gacagagaca gatccattcg attagtgaac ggatccttgg cacttatctg 8040 ggacgatctg cggagcctgt gcctcttcag ctaccaccgc ttgagagact tactcttgat 8100 tgtaacgagg attgtggaac ttctgggacg cagggggtgg gaagccctca aatattggtg 8160 gaatctccta cagtattgga gtcaggaact aaagaatagt gctgttagct tgctcaatgc 8220 cacagccata gcagtagctg aggggacaga tagggttata gaagtagtac aaggagcttg 8280 tagagctatt cgccacatac ctagaagaat aagacagggc ttggaaagga ttttgctata 8340 agatgggtgg taaatggtcg aaatcgtcgg taataggttg gccgacggta cgtgaacgta 8400 tgcgtcgtgc ggaaccggcg gcggatcgtg taggtgcggc gtcgcgtgat ttagaaaaac 8460 atggtgcgat aacgtcgtcg aatacggcgg cgacgaatgc ggcgtgtgcg tggttagaag 8520 cgcaagaaga agaagaagta ggttttccgg taacgccgca agtaccgtta cgtccgatga 8580 cgtataaagc ggcggtagat ttatcgcatt ttttaaaaga aaaaggtggt ttagaaggtt 8640 taatacattc gcaacgtcgt caagatatat tagatttatg gatatatcat acgcaaggtt 8700 attttccgga ttaacaaaat tatacgccgg gtccgggtgt acgttatccg ttaacgtttg 8760 gttggtgtta taaattagta ccggtagaac cggataaaat agaagaagcg aataaaggtg 8820 aaaatacgtc gttattacat ccggtatcgt tacatggtat ggatgatccg gaacgtgaag 8880 tattagaatg gcgttttgat tcgcgtttag cgtttcatca tgtagcgcgt gaattacatc 8940 cggaatattt taaaaattgt taacatcgag cttgctacaa gggactttcc gctggggact 9000 ttccagggag gcgtggcctg ggcgggactg gggagtggcg agccctcaga tcctgcatat 9060 aagcagctgc tttttgcctg tactgggtct ctctggttag accagatctg agcctgggag 9120 ctctctggct aactagggaa cccactgctt aagcctcaat aaagcttgcc ttgagtgctt 9180 c 9181 <210> 36 <211> 9181 <212> DNA <213> unknown <220> <223> synthetic <400> 36 ggtctctctg gttagaccag atctgagcct gggagctctc tggctaacta gggaacccac 60 tgcttaagcc tcaataaagc ttgccttgag tgcttcaagt agtgtgtgcc cgtctgttgt 120 gtgactctgg taactagaga tccctcagac ccttttagtc agtgtggaaa atctctagca 180 gtggcgcccg aacagggacc tgaaagcgaa agggaaacca gaggagctct ctcgacgcag 240 gactcggctt gctgaagcgc gcacggcaag aggcgagggg cggcgactgg tgagtacgcc 300 aaaaattttg actagcggag gctagaagga gagagatggg agctagagct agcgtactta 360 gcggaggcga actcgataga tgggaaaaaa ttagactgag accaggggga aaaaaaaaat 420 ataaactgaa acatatagta tgggctagta gagagttaga gagattcgca gtaaacccag 480 ggttactcga aactagcgaa gggtgtagac agatactggg acaattgcaa cctagtctgc 540 aaaccggatc cgaagagctt agatcactat ataatacagt cgcaacacta tattgtgtac 600 accaacgaat cgaaattaag gatacgaaag aggcattaga caaaatcgaa gaggaacaga 660 ataagtctaa aaaaaaagcg caacaggcag cagccgatac cggacatagt aatcaggtat 720 cgcaaaatta tccaatcgta cagaatatac agggacaaat ggtacaccaa gcgatatcac 780 ctagaacact taacgcatgg gttaaggtag tcgaagagaa agcatttagt ccagaggtaa 840 tacctatgtt tagcgcatta agcgaaggcg caacaccaca ggatctgaat actatgctta 900 ataccgtagg ggggcatcaa gccgcaatgc aaatgcttaa agagacaatt aacgaagagg 960 cagccgaatg ggatagagtg catcccgtac acgcaggacc aatcgcacca ggacaaatga 1020 gagaacctag gggatccgat atagccggaa ctactagtac attgcaggaa cagatagggt 1080 ggatgactaa taatccacct atacccgtag gcgaaatata caaaagatgg ataatactgg 1140 gactgaataa gatagttaga atgtatagtc caactagtat actcgatatt agacagggac 1200 ctaaagaacc ttttagggat tacgtagata gattctataa aacacttaga gccgaacagg 1260 ctagtcaaga ggttaagaat tggatgacag agacactatt agtgcaaaac gctaatcccg 1320 attgtaaaac tatacttaag gcactaggac cagcagcaac actcgaagaa atgatgacag 1380 catgtcaggg agtaggggga ccaggacata aagctagagt gttagccgaa gctatgtcac 1440 aggtaacgaa tagcgcaaca attatgatgc aaagaggtaa ttttagaaac caacgaaaaa 1500 tcgttaagtg ttttaattgc ggaaaagagg gacataccgc tagaaattgt agggcaccta 1560 gaaaaaaagg gtgttggaaa tgcggaaaag agggacatca aatgaaagat tgtaccgaaa 1620 gacaggctaa ttttttaggg aagatctggc cttcctacaa gggaaggcca gggaattttc 1680 ttcagagcag accagagcca acagccccac cagaagagag cttcaggtct ggggtagaga 1740 caacaactcc ccctcagaag caggagccga tagacaagga actgtatcct ttaacttccc 1800 tcaggtcact ctttggcaac gacccctcgt cacaataaag atagggggac aattgaaaga 1860 ggcactatta gacacaggag cagacgatac agtactcgaa gaaatgtcac taccaggtag 1920 atggaaacct aaaatgatag gggggatagg ggggtttata aaggtaagac aatacgatca 1980 gatactaatc gaaatttgcg gacataaagc aatcggaaca gtgttagtcg gacctacacc 2040 cgtaaacata atcggtagga atctgttaac acagataggg tgtacattga attttccaat 2100 tagtccaatc gaaaccgtac ccgtaaaact gaaaccaggt atggacggac ctaaggttaa 2160 gcaatggcca ttaaccgaag agaaaattaa ggcattagtc gaaatttgta ccgaaatgga 2220 aaaagagggt aagattagta agataggacc agagaatcca tataatacac ccgtattcgc 2280 aattaaaaaa aaagatagta cgaaatggag aaagttagtc gattttagag agttaaacaa 2340 aagaacacaa gacttttggg aggtacagtt agggatacca catccagcag gactgaaaaa 2400 aaaaaaaagc gtaaccgtat tagacgtagg agacgcatac tttagcgtac cattagacga 2460 agactttaga aagtataccg catttacgat acctagtatt aataacgaaa caccaggaat 2520 taggtatcaa tataacgtac tgccacaggg atggaaaggg tcaccagcta tattccaatc 2580 tagtatgact aagatactcg aaccttttag aaaacagaat ccagacatag tgatatacca 2640 atatatggac gatctatacg taggtagcga tctagagata gggcaacata gaacgaaaat 2700 cgaagagctt agacagcatc tgttaagatg gggattgact acacctgaca aaaaacacca 2760 aaaagaacca ccattcttat ggatgggata cgaattgcat cccgataaat ggacagtgca 2820 acctatagtg ttacccgaaa aagactcatg gacagtaaac gatatacaaa aactggtagg 2880 taagttgaat tgggctagtc agatatatcc cggaattaag gttaggcaat tgtgtaaact 2940 gttaagggga actaaggcac taaccgaagt gataccgtta accgaagagg cagagttaga 3000 gttagccgaa aatagagaga tacttaagga acccgtacac ggagtgtatt acgatcctag 3060 taaggatctg atagccgaaa tacaaaaaca gggacaggga caatggacat atcagatata 3120 tcaggaacct tttaaaaatc tgaaaaccgg taagtacgct agaatgaggg gagcacatac 3180 aaacgacgtt aagcaattga ccgaagccgt acaaaaaatt acaaccgaat caatcgtaat 3240 ttggggtaag acacctaaat ttaaattgcc tatacaaaaa gagacatggg aaacatggtg 3300 gactgagtat tggcaagcta catggatacc cgaatgggaa ttcgtaaata caccaccatt 3360 agtgaaattg tggtatcaac tcgaaaaaga accaatcgta ggagccgaaa cattttacgt 3420 agacggagca gctaataggg aaactaagtt aggtaaggca ggatacgtta cgaatagggg 3480 gagacagaaa gtcgttacac taaccgatac aactaaccaa aaaaccgaac tgcaagcgat 3540 atacttagcg ttacaggata gcggattaga ggtaaacata gtgacagact cacaatacgc 3600 attagggatt atacaggcac aacccgatca atccgaaagc gaactagtta atcagataat 3660 cgaacaattg attaaaaaag agaaagtgta tctagcatgg gtaccagcac ataagggaat 3720 agggggaaac gaacaggtag ataagttagt tagcgcagga attagaaagg tactgttttt 3780 agacggaata gacaaagcgc aagacgaaca cgaaaaatat catagtaatt ggagagctat 3840 ggctagcgat tttaatctac cacccgtagt cgctaaagag atagtcgcat catgtgataa 3900 gtgtcaattg aaaggcgaag ctatgcacgg acaggtcgat tgtagtccag ggatatggca 3960 attggattgt acacacttag agggtaaggt aatactagtc gcagtacacg tagctagcgg 4020 atatatcgaa gccgaagtga taccagccga aaccggacag gaaaccgcat actttctgtt 4080 aaagttagcc ggtagatggc cagttaagac tatacatacc gataacggat ctaattttac 4140 aggagcaacc gttagggcag catgttggtg ggcaggaatt aaacaggaat tcggaatacc 4200 atataatcca caatcacagg gagtagtcga atctatgaat aaagagttaa aaaaaattat 4260 cggacaggtt agagaccaag ccgaacacct taaaaccgca gtgcaaatgg ccgtattcat 4320 acataatttt aaaagaaaag gggggatagg ggggtatagc gcaggcgaaa gaatcgtaga 4380 cataatcgca actgacatac agactaaaga gttacagaaa cagattacta agatacagaa 4440 ttttagagtg tattatagag actctagaaa tccattatgg aaaggaccag ctaaactgtt 4500 atggaaaggc gaaggcgcag tagtgataca ggataatagc gatattaagg tagtgcctag 4560 acgaaaagcg aaaattatta gggattatgg aaaacagatg gcaggtgatg attgtgtggc 4620 aagtagacag gatgaggatt agaacatgga aatcactagt taagcatcat atgtacgtta 4680 gcggtaaggc taggggatgg ttttatagac atcattacga atcaccacat cctagaatat 4740 ctagcgaagt gcatataccg ttaggcgacg ctagattagt gataactaca tattggggat 4800 tgcatacagg cgaaagggat tggcatctag gacagggagt gtcaatcgaa tggcgaaaaa 4860 aaagatatag tacacaggta gacccagagt tagccgatca attgatacac ctatattatt 4920 tcgattgttt tagcgatagc gcaattagaa aggcactatt agggcatata gtgtcaccta 4980 gatgcgaata tcaagccgga cataataagg tagggtcact gcaatatcta gcattagccg 5040 cactaattac acctaaaaaa attaaaccac cactacctag cgtaactaag ttaaccgaag 5100 acagatggaa caagccccag aagaccaagg gccacagagg gagccacaca atgaatggac 5160 actagagctt ttagaggagc ttaagaatga agctgttaga cattttccta ggatttggct 5220 ccatggctta gggcaacata tctatgaaac ttatggggat acttgggcag gagtggaagc 5280 cataataaga attctgcaac aactgctgtt tatccatttt cagaattggg tgtcgacata 5340 gcagaatagg cgttactcga cagaggagag caagaaatgg agccagtaga tcctagacta 5400 gagccctgga agcatccagg aagtcagcct aaaactgctt gtaccaattg ctattgtaaa 5460 aagtgttgct ttcattgcca agtttgtttc ataacaaaag ccttaggcat ctcctatggc 5520 aggaagaagc ggagacagcg acgaagagct catcagaaca gtcagactca tcaagcttct 5580 ctatcaaagc agtaagtagt acatgtaatg caacctatac caatagtagc aatagtagca 5640 ttagtagtag caataataat agcaatagtt gtgtggtcca tagtaatcat agaatatagg 5700 aaaatattaa gacaaagaaa aatagacagg ttaattgata gactaataga aagagcagaa 5760 gacagtggca atgagagtga aggagaaata tcagcacttg tggagatggg ggtggagatg 5820 gggcaccatg ctccttggga tgttgatgat ctgtagtgca accgaaaaat tgtgggttac 5880 ggtatattac ggagtacccg tatggaaaga ggcaactact acactatttt gcgctagcga 5940 cgctaaagca tacgataccg aagtgcataa cgtatgggct acacacgcat gcgtacctac 6000 cgatcctaat ccacaagagg tagtgttagt taacgtaacc gaaaatttta atatgtggaa 6060 aaacgatatg gtcgaacaaa tgcacgaaga cataattagc ttatgggacc aatcacttaa 6120 accatgtgtt aagttgacac cactatgcgt aagtcttaag tgtacagacc ttaaaaacga 6180 tactaatact aactctagta gcggaagaat gattatggaa aagggagaga taaaaaattg 6240 ttcattcaat attagtacat caattagggg taaggtacaa aaagaatacg cattttttta 6300 taagttagac ataataccaa tcgataacga tacaacatca tataagttaa ctagttgtaa 6360 tactagcgta attacacagg catgtcctaa ggtatcattc gaacctatac cgatacacta 6420 ttgtgcacca gccggattcg caatactgaa atgtaataat aagacattta acggaaccgg 6480 accatgtact aacgtaagta cagtgcaatg tacacacgga attagacccg tagtgagtac 6540 gcaattactg ttaaacggat cattagccga agaggaagtg gtaattagat ccgttaattt 6600 taccgataac gctaaaacaa ttatagtgca attgaatact agcgtagaga ttaattgtac 6660 tagacctaat aataatacta gaaaacggat taggatacaa aggggaccag gtagggcatt 6720 cgtaacaatc ggtaagatag ggaatatgag acaggcacat tgtaatatta gtagggctaa 6780 atggaataat acacttaaac agatagctag taagcttaga gagcaattcg gtaataataa 6840 gacaattata ttcaaacaat ctagcggagg ggatccagaa atcgtaacac atagttttaa 6900 ttgcggaggc gaattttttt attgtaatag tacacaattg ttcaatagta catggtttaa 6960 tagtacatgg tcaaccgaag gatctaataa tacagaggga tccgatacaa ttacactacc 7020 atgtaggatt aaacagataa ttaatatgtg gcaaaaggta ggtaaggcaa tgtacgcacc 7080 acctattagc ggacaaatta gatgtagttc gaatataacc ggattactgt taactagaga 7140 cggagggaat tcgaataacg aatccgaaat ttttagacca ggggggggag atatgagaga 7200 caattggaga tccgaattgt ataagtataa agtcgttaaa atcgaaccat taggcgtagc 7260 acctacaaaa gcgaaaagac gggtagtgca acgcgaaaaa agagccgtag ggataggcgc 7320 actattctta gggtttttag gcgcagccgg atcaactatg ggagcagcta gtatgacatt 7380 gacagtgcaa gctagacaac tgttaagcgg aatagtgcaa caacagaata atctgttaag 7440 ggcaatcgaa gcacaacagc atctgttaca attgacagta tgggggatta agcaattgca 7500 ggctagaata ctcgcagtcg aacggtatct gaaagaccaa caactgttag ggatatgggg 7560 atgtagcggt aagttgatat gtacaaccgc agtaccatgg aacgctagtt ggtctaataa 7620 atcactcgaa cagatatgga atcatacaac atggatggaa tgggatagag agattaacaa 7680 ttatactagt ctgatacact cactaatcga agagtcacaa aaccaacagg aaaaaaacga 7740 acaggaactg ttagagttag acaaatgggc tagcttatgg aattggttta atattactaa 7800 ttggttatgg tatataaaac tgtttattat gatagtaggg gggttagtcg gattgagaat 7860 cgtattcgca gtactatcaa tcgttaatag ggttagacag ggatatagtc cactatcatt 7920 ccaaacccac ctcccaaccc cgaggggacc cgacaggccc gaaggaatag aagaagaagg 7980 tggagagaga gacagagaca gatccattcg attagtgaac ggatccttgg cacttatctg 8040 ggacgatctg cggagcctgt gcctcttcag ctaccaccgc ttgagagact tactcttgat 8100 tgtaacgagg attgtggaac ttctgggacg cagggggtgg gaagccctca aatattggtg 8160 gaatctccta cagtattgga gtcaggaact aaagaatagt gctgttagct tgctcaatgc 8220 cacagccata gcagtagctg aggggacaga tagggttata gaagtagtac aaggagcttg 8280 tagagctatt cgccacatac ctagaagaat aagacagggc ttggaaagga ttttgctata 8340 agatgggagg taagtggtct aaatctagcg taatcggatg gcctacagtt agggaaagaa 8400 tgcgtagagc cgaacctgca gccgataggg taggcgcagc tagtagggat ctcgaaaaac 8460 acggagcaat tactagtagt aatacagccg caactaacgc agcatgcgca tggttagagg 8520 cacaggaaga ggaagaggta gggtttcccg taacaccaca ggtaccactt agacctatga 8580 catataaagc cgcagtcgat ctatcacatt ttctgaaaga gaaagggggg ttagagggac 8640 tgatacattc acagagacga caagacatac tagacttatg gatatatcat acacagggat 8700 attttccaga ctagcaaaat tatacaccag gaccaggcgt aagatatcca ttgacattcg 8760 gatggtgtta taaactggta ccagtcgaac cagacaaaat cgaagaggct aacaaaggcg 8820 aaaatactag tctgttacat cccgtaagct tacacggaat ggacgatcca gaaagagagg 8880 tactcgaatg gagattcgat agtagactcg cattccatca cgtagctagg gaattgcatc 8940 cagagtattt taaaaattgt tgacatcgag cttgctacaa gggactttcc gctggggact 9000 ttccagggag gcgtggcctg ggcgggactg gggagtggcg agccctcaga tcctgcatat 9060 aagcagctgc tttttgcctg tactgggtct ctctggttag accagatctg agcctgggag 9120 ctctctggct aactagggaa cccactgctt aagcctcaat aaagcttgcc ttgagtgctt 9180 c 9181 <210> 37 <211> 3309 <212> DNA <213> Rotavirus C <400> 37 ggctaaaaaa aatggcgcaa tcgatagtag tagatggtga ttatgatgcg ttagcgtcgc 60 gttatttaaa atttgtatat gattttgaaa atgtaacgta tcaaaataat tattttgcga 120 cggataaatt taaaaaagat atagaacaat atttaaaatc gatacatgat ggtgaaaaaa 180 taacgcaatc gaaaatagat gaaaaagaaa aaatattatt agatcgtgta ccggcggaag 240 aacgttgttt aatatcgaaa ttagtatttg cgtatggtaa acatggtaat gtagaaaata 300 aattagtaaa atatggtgta aaagatgcgt tatcgcatgc gccgcaaaaa gatgcgaaac 360 cgtatgaaaa taatataata acgtcggaaa tatttaaaga aaaatcggaa tatacggata 420 tatatatgga tccgtcgata aatacgtcgt gtcaatcgaa ttgtcaagcg atgatgttta 480 cgatatcgga aatgaaatta aataatataa aaaatgcggc gcgtttagaa aaattattta 540 cgataatagc ggcgacgata aataaatatg gtatgccgcg tcataatacg cgttatcgtt 600 atgaatggga aacgatgaaa aataaaccgt atcatttagc ggcgtggata aattcgtcga 660 tagaaatgat agcgtgtgta gtagatcatc atacgtatat gatagcgcgt gaattaatag 720 taaaatcgtt tacgaatcgt acgtcgttag cgaaattagt atcgtcgccg atgacggtat 780 taacggcgat gttaccgata cgtggtacgt ttataacgac ggaaaattta gaattagaat 840 attcgaataa atcgataaat tatttaatat cgaaagaaat ggcggaagat tttatgcaag 900 cgataaaaca attacgtgat gaaggtttag aatatatacc ggattattat gaaaaatggt 960 ttaaatcgcc ggatccgtta acgtttccga atatagcgtt aatatattcg ttttcgtttc 1020 atgtaggtta tcgtaaacaa gcgttatcgg atgcggtata tgatcaaata acggtaacgt 1080 attcggataa tgtaaatatg gaaatgtata aagaatattc ggaacgtata gaaaatgaaa 1140 tatttacgat attaaaagat aaaataatac atgaagataa acgtttagaa gaatatgaat 1200 tatcggcgtt attatcgatg tcgtcggcgt cgaatggtat attacgtgaa ataaattttg 1260 gtggtcaaaa agtacgttcg acgaaaaaaa atatgcatgt aatagatgat atatatcata 1320 aaaaatatac gacggatata ccgccggtag atgcgcgtaa tccgataccg ttaggtcgtc 1380 gtgatgtacc gggtcgtcgt acgcgtgcga tatttatatt accgtatcaa tattttatag 1440 cgcaacattc gtttgcggaa ataatgttaa attatgcgaa acgtgaacgt gaatattcgg 1500 aattttattc gcaagcgaat caagtattat cgtatggtga tgtaacgcgt tatttagatt 1560 cgaattcgat attatgtttt acggatgtat cgcaatggga tgcgtcgcaa cataatacga 1620 aagtattacg tcgttcgata atacgtgcga tgaaacgttt aaaacaatta acgcataata 1680 taaatataca taaagcgata aatatatata tacaatcgca agaaaattta gaaaattcgt 1740 atgtattaat agataaaaaa gcgatacaat atggtgcgac ggcgtcgggt gaaaaacaaa 1800 cgaaaataat gaattcgata gcgaataaag cgttaataca aacggtatta ggtaaattaa 1860 tgacggatta tacgtttgat gtaaaaatga tacgtgtaga tggtgatgat aattatgcga 1920 tagtacgttt tccgatagcg ataacggaaa aattattatc ggaatttacg tcgaaattac 1980 gttcgtatta ttcggaaatg aatgtaaaag taaaagcgtt agcgtcgtta acgggttgtg 2040 aaatagcgaa acgttatgta gcgggtggta tgttattttt tcgtgcgggt gtaaatatat 2100 tacatcatga aaaacgtaat caagattcgg cgtatgatat ggcggcgacg ttatatgcga 2160 attatatagt aaatgcgtta cgtggtttaa cgatgtcgcg tacgtttata ttaacgaaaa 2220 tatgtcaaat gacgtcgata aaaataacgg gtacgttacg tttatttccg atgaaatcga 2280 tattagcgtt aaattcggcg tttaaagtat ttgatgaagt agattatgta ataaattatc 2340 cgatatcgaa tttatttata caattacaac gtaaattatc gtcgataaaa gcgaaatcga 2400 aaatagcgga taatatagcg aaatcgccgc aatttaaatc gtatgtagaa ttattaaata 2460 aatcgttaac gacggatgaa aatccgatag tatcggatgg tatacgttta acggaaaaag 2520 cgaaattaaa ttcgtatgcg ccgatagcgt tagaaaaacg tcgtgatcaa ttttcgataa 2580 tggtatcgtt tttacaaaat ccgacgacgt ttaaatcgga aacggtagta acgataaatg 2640 atgtattata ttttatatcg ggttttataa aaatagattc gtcgacggta ttaccgaaag 2700 aagaaaataa tacgatgccg ttattaccgg cgataataaa acgtacgtta tcgtattttg 2760 gtttacgtac gcatgattat gatataaaag gttcgtcgtc gacggtatcg aaaataataa 2820 aacaatattc ggtatatacg ccgggtatag aagaattata tgaaatagta aataaatcgg 2880 tagatacgat acgtggttat tttgcgtcgt ttaatgtacc gaaagcggat gtagatacgt 2940 atatatcgac gcaaatgtat aaacatgatc gttttaaaat attacaagcg tatatatata 3000 atttattatc ggtaaattat ggtatgtatc aattagtaga tttaaattcg gcgcgttttt 3060 ttgatcatgt aatacatacg ccgatggcga aaacgccgac ggcggtattt atgatagatt 3120 tagcgttacg tttaaaaata ataaatcatt gtatagaaaa aggtgaaata ataacggtat 3180 cggtacatgc gaataaaacg gattatttaa aattatggcg tatgttatgg aatgtaaaaa 3240 cgatgaattc gccgtattcg aaaaattcga tgtttgatga ataagagaag tggattgcat 3300 attgtggct 3309 <210> 38 <211> 3309 <212> DNA <213> Unknown <220> <223> synthetic <400> 38 ggctaaaaaa aatggcacaa tcaatcgtag ttgacggaga ttatgatgca ttagctagta 60 gatatctaaa attcgtatac gatttcgaaa acgtaactta tcagaataat tatttcgcaa 120 ctgataaatt taaaaaagat atcgaacaat atcttaaatc aatacacgat ggagaaaaaa 180 ttacgcaatc taagatagac gaaaaagaaa aaatactgtt agatagagta ccagctgaag 240 aaagatgtct aatatctaag ttagtattcg catatggtaa gcatggtaac gttgagaata 300 agttagttaa gtatggagtt aaggatgcac tatcacatgc accacaaaaa gacgctaaac 360 catacgaaaa taatataatt actagcgaaa tttttaaaga aaaatccgaa tatactgata 420 tatatatgga tccatcaatt aatacatcat gtcaatctaa ttgtcaagct atgatgttta 480 cgatatccga aatgaaattg aataatataa aaaacgctgc tagactcgaa aaattgttta 540 caattatagc cgctacaatt aataagtatg gtatgcctag acataatact agatatagat 600 atgaatggga aactatgaaa aataaaccat atcatttagc cgcatggatt aattcgtcaa 660 tcgaaatgat agcatgcgta gtcgatcatc atacatatat gatagctaga gagttaatcg 720 ttaaatcatt tactaataga acatcattag cgaaattagt gtcatcacct atgacagtgt 780 taaccgctat gttaccaatt agaggtacat ttataactac tgaaaatctc gaactcgaat 840 attctaataa atcaattaat tatctgatat cgaaagaaat ggctgaagat tttatgcaag 900 ctataaaaca attgagagac gaaggattag agtatatacc agattattac gaaaaatggt 960 ttaaatcacc agatccatta acttttccta atatagcgtt aatatattca ttttcatttc 1020 acgtagggta tagaaaacag gcactatctg atgcagtata cgatcagatt acggttacat 1080 attcagataa cgttaatatg gaaatgtata aagagtattc agaaagaatc gaaaacgaaa 1140 tttttacgat actgaaagat aaaattatac acgaagataa acggttagag gaatacgaac 1200 tatcagcatt actatctatg tcatcagcat caaacggaat acttagagaa attaatttcg 1260 gaggacaaaa agttagatca actaaaaaaa atatgcatgt aatcgatgat atatatcata 1320 aaaaatatac tactgatata ccaccagtag acgctagaaa tccgatacca ttaggtagaa 1380 gagacgtacc aggtagacga actagagcta tttttatact accatatcaa tattttatag 1440 cgcaacattc attcgcagaa attatgctta attatgctaa aagagaacgc gaatatagcg 1500 aattttattc acaggctaat caggtactat catacggaga tgtaactaga tatctagatt 1560 ctaattcgat actatgtttt acggatgtat cacaatggga tgctagtcag cataatacta 1620 aggtacttag acgatcaatt attagagcta tgaaaagatt gaaacaattg acacataata 1680 ttaatataca taaagcgata aatatatata tacaatcaca ggaaaatctc gaaaattcat 1740 atgtgttaat cgataaaaaa gcgatacaat acggagctac tgcatcaggc gaaaaacaga 1800 ctaaaattat gaattcaatc gctaataagg cattgataca gacagtgtta ggtaagttaa 1860 tgactgatta tacattcgat gttaaaatga ttagagtaga cggagatgat aattatgcta 1920 tagttagatt tccgatagcg ataaccgaaa aactgttaag cgaatttaca tctaaattgc 1980 gatcatatta ttcagaaatg aacgttaagg ttaaggcatt agcgtcatta acgggatgtg 2040 agatagcgaa aagatatgta gccggaggta tgttattttt tagagccgga gtgaatatat 2100 tgcatcatga aaaacgtaat caggatagtg catacgatat ggcagctaca ttatacgcta 2160 attatatagt taacgcactt agagggttaa ctatgtcacg aacttttata ttgactaaga 2220 tatgtcaaat gacatcaatt aaaattacgg gaacacttag attgtttcca atgaaatcaa 2280 tactcgcact taatagtgca tttaaggtat tcgatgaggt agattatgta attaattatc 2340 ctatatctaa tctatttata caattgcaac gaaaactatc atcaattaaa gcgaaatcta 2400 agatagccga taatatagcg aaatcaccac aatttaaatc atacgttgag ttactgaata 2460 aatcattgac tactgacgaa aatccgatag tgtcagacgg aatacggtta acggaaaaag 2520 ctaaattgaa ttcatacgca ccaatcgcat tagaaaaacg tagagatcaa ttttcaatta 2580 tggtatcatt tttacagaat cctactactt ttaaatccga aacagtagtt acaattaacg 2640 atgtattgta ttttatatca ggatttataa aaatcgattc tagtacagtg ttacctaaag 2700 aggaaaataa tactatgcca ctattaccag ctataattaa acgtacacta tcatatttcg 2760 gattgcgtac acatgattat gatattaagg gatcatctag tacagtatcg aaaattataa 2820 aacagtattc agtatataca ccaggaatcg aagagttata cgaaatcgtt aataaatcag 2880 tagatacaat taggggatat tttgctagtt ttaacgtacc taaagctgat gtagatacat 2940 atatatcgac acaaatgtat aaacatgata gatttaaaat actgcaagca tatatatata 3000 atctgttatc agttaattat ggtatgtatc aattagtcga tctgaattca gctagatttt 3060 ttgatcatgt aatacataca cctatggcta aaacacctac agcagttttt atgatagatt 3120 tagcgttaag attgaaaatt ataaatcatt gtatcgaaaa aggcgaaatt ataacagtta 3180 gcgtacacgc taataaaact gattatctta agttatggcg tatgttatgg aacgttaaga 3240 ctatgaatag tccatattct aaaaattcaa tgtttgacga ataagagaag tggattgcat 3300 attgtggct 3309 <210> 39 <211> 2736 <212> DNA <213> Rotavirus C <400> 39 ggcttaaaaa gatcagttga ggacaaatcg ttcaagatga tatcgcgtaa tcgtcgtcgt 60 aataatcaac aaaaaaatat agaaaaagaa aaacaattag aaacgataat aaataaagaa 120 gtaaaagaaa ataaagattc gatgaaagaa gataaattag tagtaacgga agaatcgaat 180 ggtgatgtaa cgacggcgaa agaacaatcg aataatataa atttacaaaa aaatgattta 240 gtaaaagaag taatgaatat acaaaatcaa acgttaaata cggtagtaac ggaaaataaa 300 gtagaaatag aagaaatagt aaaaaaatat ataccgtcgt ataatacgga ttcgttaata 360 gtaaaaaaat taacggaaat acaagaatcg tcggcgaaaa cgtataatac gttatttcgt 420 ttatttacgc cggtaaaatc gtatttatat gatataaatg gtgaaaaaaa attatcgacg 480 cgttggtatt ggaaattatt aaaagatgat ttaccggcgg gtgattattc ggtacgtcaa 540 ttttttttat cgttatattt aaatgtatta gaagaaatgc cggattatat aatgttacgt 600 gatatggcgg tagataatcc gtattcggcg gaagcgggta aaatagtaga tggtaaatcg 660 aaagaaatat taatagaatt atatcaagat caaatgacgg aaggttatat acgtcgttat 720 atgtcggaat tacgtcataa aatatcgggt gaaacgaata cggcgaaata tccggcgata 780 ttacatccgg tagataatga attaaatcaa tattttttag aacatcaatt aatacaaccg 840 ttaacgacgc gtaatatagc ggaattaata ccgacgcaat tatatcatga tccgaattat 900 gtatttaata tagatgcggc gtttttaacg aattcgcgtt ttgtaccgcc gtatttaacg 960 caagatcgta taggtttaca tgatggtttt gaatcgatat gggattcgaa aacgcatgcg 1020 gattatgtat cggcgcgtcg ttttataccg gatttaacgg aattagtaga tgcggaaaaa 1080 caaataaaag aaatggcggc gcatttacaa ttagaagcga taacggtaca agtagaatcg 1140 caatttttag cgggtatatc ggcggcggcg gcgaatgaag cgtttaaatt tataataggt 1200 tcggtattat cgacgcgtac gatagcggta gaatttataa cgtcgaatta tatgtcgtta 1260 gcgtcgtgta tgtatttaat gacgataatg ccgtcggaaa tatttttacg tgaatcgtta 1320 gtagcgatgc aattagcgat aataaatacg ttaatatatc cggcgttagg tttagcgcaa 1380 atgcattatc aagcgggtga agtacgtacg ccgtttgaat tagcggaaat gcaagtagcg 1440 aatcgttcga tacgtcaatg gttacatcat tgtaatacgt tacaatttgg tcgtcaaata 1500 acggaaggta taatacattt acgttttacg aatgatataa tgacgggtcg tatagtaaat 1560 ttattttcga cgatgttagt agcgttatcg tcgcaaccgt ttgcgacgta tccgttagat 1620 tataaacgtt cggtacaacg tgcgttacaa ttattatcga atcgtacggc gcaaatagcg 1680 gatttaacgc gtttaatagt atataattat acgacgttat cggcgtgtat agtaatgaat 1740 atgcatttag taggtacgtt aacggtagaa cgtatacaag cgacgtcgtt aacgtcgtta 1800 atgatgttaa tatcgaataa aacggtaata ccggaaccgt cgtcgttatt ttcgtatttt 1860 tcgtcgaata taaatttttt aacgaattat aatgaacaaa tagataatgt agtagcggaa 1920 ataatggcgg cgtatcgttt aaatttatat caacaaaaaa tgttaatgtt agtaacgcgt 1980 tttgtatcga aattatatat atttgatgcg ccgaaaatac cgccggatca aatgtatcgt 2040 ttacgtaatc gtttacgtaa tataccggta gaacgtcgtc gtgcggatgt atttcgtata 2100 ataatgaata atcgtgattt aatagaaaaa acgtcggaac gtatatgtca aggtgtatta 2160 ttatcgtata cgccgatgcc gttaacgtat gtagaagatg taggtttaac gaatgtaata 2220 aatgatacga attcgtttca aataataaat atagaagaaa tagaaaaaac gggtgattat 2280 tcggcgataa cgaatgcgtt attacgtgat acgccgataa tattaaaagg tgcgataccg 2340 tatgtaacga attcgtcggt aatagatgta ttatcgaaag tagatacgac ggtatttgcg 2400 tcgatagtaa aagatcgtga tatatcgaaa ttaaaaccga taaaatttat aataaattcg 2460 gattcgtcgg aatattattt agtacataat aataaatgga cgccgacgac gacgacggcg 2520 gtatataaag cgcgttcgca acaatttgat atacaacatt cggtatcgat gttagaatcg 2580 aatttatttt ttgtagtata taatgattta tttaaatata taaaaacgac gacggtatta 2640 ccgataaatg cggtatcgta tgatggtgcg cgtataatgc aagaaacgta aatgattgta 2700 tagtatcatc ttgtgacgac ctcaaacttt gtggct 2736 <210> 40 <211> 2736 <212> DNA <213> Unknown <220> <223> synthetic <400> 40 ggcttaaaaa gatcagttga ggacaaatcg ttcaagatga tatctagaaa tagacgtaga 60 aataatcagc aaaaaaatat cgaaaaagaa aaacagttag agacaattat taataaagag 120 gttaaagaga ataaggattc aatgaaagag gataagttag tggtaaccga agaatctaac 180 ggagacgtta caaccgctaa agagcaatct aataatatta atctgcaaaa aaacgattta 240 gttaaagagg ttatgaatat acagaatcag acacttaata cagtagttac cgaaaataag 300 gttgagatag aagagatagt taaaaaatat ataccgtcat ataatactga ttcattaatc 360 gttaaaaaat taaccgaaat acaggaatct agtgctaaaa cttataatac actatttaga 420 ttgtttacac cagttaaatc atacttatac gatattaatg gcgaaaaaaa actatctact 480 agatggtatt ggaaactgtt aaaagacgat ctaccagcag gtgattactc agttagacaa 540 ttttttctat cattatactt aaacgtatta gaggaaatgc cagattatat tatgcttaga 600 gatatggcag ttgataatcc atactcagct gaagcaggta agatagttga cggtaagtct 660 aaagagatat taatcgaatt gtatcaggat caaatgacag agggatatat tagacggtat 720 atgtcagaac ttagacataa aatttcaggc gaaactaata ccgctaaata tccagctata 780 ctgcatccag tagataacga attgaatcaa tattttctcg aacatcaatt gatacaacca 840 ttaactacta gaaatatagc cgaattgata ccgacacaat tgtatcatga tcctaattac 900 gtttttaata tagacgctgc atttttaact aattctagat tcgtaccacc atacttaacg 960 caagatagga tagggttaca tgacggattc gaatcaattt gggattctaa aacacatgct 1020 gattacgtat cagctagacg atttataccc gatttaaccg aattagttga cgctgaaaaa 1080 cagattaagg aaatggctgc acatttacaa ctcgaagcta ttacggtaca ggttgaatca 1140 caatttttag ccggtattag cgcagcagca gctaacgaag catttaaatt tattatagga 1200 tcagtgttat caactagaac tatagcagtc gaatttatta catctaatta tatgtcatta 1260 gctagttgta tgtatcttat gacaattatg cctagcgaaa tttttttacg cgaatcatta 1320 gtcgctatgc aattagctat tattaataca cttatatatc cagcattagg gttagcgcaa 1380 atgcattatc aggcaggtga ggttagaaca ccattcgaat tagccgaaat gcaagttgcg 1440 aatagatcaa ttagacaatg gttacatcat tgtaatacat tacaattcgg taggcaaatt 1500 accgaaggta ttatacatct tagatttact aacgatatta tgacaggtag gatagttaat 1560 ctattttcga ctatgttagt tgcgttatca tcacaaccat tcgctacata tccattagat 1620 tataaaagat cagtgcaacg agcattacaa ttgttatcta atagaaccgc tcaaatagct 1680 gatttaacta gactgatagt gtataattat actacattat ccgcatgcat agttatgaat 1740 atgcatttag tgggtacact tacagtcgaa cgtatacagg ctacatcatt aacatcatta 1800 atgatgttaa tttctaataa aacagttata cccgaaccat catcattatt ttcatatttt 1860 tcatctaata ttaatttttt aactaattat aacgaacaga tagataacgt agttgcggaa 1920 attatggctg catatagatt gaatctatat caacaaaaaa tgttaatgtt agtgactaga 1980 ttcgtaagta agttatatat attcgatgca cctaaaattc caccagatca aatgtataga 2040 cttagaaata gacttagaaa tataccagtc gaaagacgta gagcagacgt atttagaatt 2100 attatgaata atagggattt aatcgaaaaa actagcgaaa gaatttgtca gggagtgtta 2160 ctatcatata cacctatgcc attaacatac gttgaagacg taggattaac taacgtaatt 2220 aacgatacta attcgtttca aattattaat atcgaagaaa tcgaaaaaac aggtgattac 2280 tcagctatta ctaatgcact attaagggat acacctatta tacttaaggg agctatacca 2340 tacgttacga attcgtcagt gatagacgta ctatctaagg tagatactac agtattcgct 2400 agtatagtta aggataggga tatatctaag ttaaaaccaa ttaaatttat aattaattct 2460 gattctagcg aatattattt agtgcataat aataaatgga cacctactac tactactgca 2520 gtgtataaag ctagatcaca acaattcgat atacaacata gcgtatctat gctcgaatct 2580 aatctatttt tcgtagtgta taacgatcta tttaaatata ttaaaactac tacagtgtta 2640 ccaattaacg ctgtatcata cgatggagct agaattatgc aagaaacata aatgattgta 2700 tagtatcatc ttgtgacgac ctcaaacttt gtggct 2736 <210> 41 <211> 29751 <212> DNA <213> coronavirus <400> 41 atattaggtt tttacctacc caggaaaagc caaccaacct cgatctcttg tagatctgtt 60 ctctaaacga actttaaaat ctgtgtagct gtcgctcggc tgcatgccta gtgcacctac 120 gcagtataaa caataataaa ttttactgtc gttgacaaga aacgagtaac tcgtccctct 180 tctgcagact gcttacggtt tcgtccgtgt tgcagtcgat catcagcata cctaggtttc 240 gtccgggtgt gaccgaaagg taagatggaa tcgttagtat taggtgtaaa tgaaaaaacg 300 catgtacaat tatcgttacc ggtattacaa gtacgtgatg tattagtacg tggttttggt 360 gattcggtag aagaagcgtt atcggaagcg cgtgaacatt taaaaaatgg tacgtgtggt 420 ttagtagaat tagaaaaagg tgtattaccg caattagaac aaccgtatgt atttataaaa 480 cgttcggatg cgttatcgac gaatcatggt cataaagtag tagaattagt agcggaaatg 540 gatggtatac aatatggtcg ttcgggtata acgttaggtg tattagtacc gcatgtaggt 600 gaaacgccga tagcgtatcg taatgtatta ttacgtaaaa atggtaataa aggtgcgggt 660 ggtcattcgt atggtataga tttaaaatcg tatgatttag gtgatgaatt aggtacggat 720 ccgatagaag attatgaaca aaattggaat acgaaacatg gttcgggtgc gttacgtgaa 780 ttaacgcgtg aattaaatgg tggtgcggta acgcgttatg tagataataa tttttgtggt 840 ccggatggtt atccgttaga ttgtataaaa gattttttag cgcgtgcggg taaatcgatg 900 tgtacgttat cggaacaatt agattatata gaatcgaaac gtggtgtata ttgttgtcgt 960 gatcatgaac atgaaatagc gtggtttacg gaacgttcgg ataaatcgta tgaacatcaa 1020 acgccgtttg aaataaaatc ggcgaaaaaa tttgatacgt ttaaaggtga atgtccgaaa 1080 tttgtatttc cgttaaattc gaaagtaaaa gtaatacaac cgcgtgtaga aaaaaaaaaa 1140 acggaaggtt ttatgggtcg tatacgttcg gtatatccgg tagcgtcgcc gcaagaatgt 1200 aataatatgc atttatcgac gttaatgaaa tgtaatcatt gtgatgaagt atcgtggcaa 1260 acgtgtgatt ttttaaaagc gacgtgtgaa cattgtggta cggaaaattt agtaatagaa 1320 ggtccgacga cgtgtggtta tttaccgacg aatgcggtag taaaaatgcc gtgtccggcg 1380 tgtcaagatc cggaaatagg tccggaacat tcggtagcgg attatcataa tcattcgaat 1440 atagaaacgc gtttacgtaa aggtggtcgt acgcgttgtt ttggtggttg tgtatttgcg 1500 tatgtaggtt gttataataa acgtgcgtat tgggtaccgc gtgcgtcggc ggatataggt 1560 tcgggtcata cgggtataac gggtgataat gtagaaacgt taaatgaaga tttattagaa 1620 atattatcgc gtgaacgtgt aaatataaat atagtaggtg attttcattt aaatgaagaa 1680 gtagcgataa tattagcgtc gttttcggcg tcgacgtcgg cgtttataga tacgataaaa 1740 tcgttagatt ataaatcgtt taaaacgata gtagaatcgt gtggtaatta taaagtaacg 1800 aaaggtaaac cggtaaaagg tgcgtggaat ataggtcaac aacgttcggt attaacgccg 1860 ttatgtggtt ttccgtcgca agcggcgggt gtaatacgtt cgatatttgc gcgtacgtta 1920 gatgcggcga atcattcgat accggattta caacgtgcgg cggtaacgat attagatggt 1980 atatcggaac aatcgttacg tttagtagat gcgatggtat atacgtcgga tttattaacg 2040 aattcggtaa taataatggc gtatgtaacg ggtggtttag tacaacaaac gtcgcaatgg 2100 ttatcgaatt tattaggtac gacggtagaa aaattacgtc cgatatttga atggatagaa 2160 gcgaaattat cggcgggtgt agaattttta aaagatgcgt gggaaatatt aaaattttta 2220 ataacgggtg tatttgatat agtaaaaggt caaatacaag tagcgtcgga taatataaaa 2280 gattgtgtaa aatgttttat agatgtagta aataaagcgt tagaaatgtg tatagatcaa 2340 gtaacgatag cgggtgcgaa attacgttcg ttaaatttag gtgaagtatt tatagcgcaa 2400 tcgaaaggtt tatatcgtca atgtatacgt ggtaaagaac aattacaatt attaatgccg 2460 ttaaaagcgc cgaaagaagt aacgttttta gaaggtgatt cgcatgatac ggtattaacg 2520 tcggaagaag tagtattaaa aaatggtgaa ttagaagcgt tagaaacgcc ggtagattcg 2580 tttacgaatg gtgcgatagt aggtacgccg gtatgtgtaa atggtttaat gttattagaa 2640 ataaaagata aagaacaata ttgtgcgtta tcgccgggtt tattagcgac gaataatgta 2700 tttcgtttaa aaggtggtgc gccgataaaa ggtgtaacgt ttggtgaaga tacggtatgg 2760 gaagtacaag gttataaaaa tgtacgtata acgtttgaat tagatgaacg tgtagataaa 2820 gtattaaatg aaaaatgttc ggtatatacg gtagaatcgg gtacggaagt aacggaattt 2880 gcgtgtgtag tagcggaagc ggtagtaaaa acgttacaac cggtatcgga tttattaacg 2940 aatatgggta tagatttaga tgaatggtcg gtagcgacgt tttatttatt tgatgatgcg 3000 ggtgaagaaa atttttcgtc gcgtatgtat tgttcgtttt atccgccgga tgaagaagaa 3060 gaagatgatg cggaatgtga agaagaagaa atagatgaaa cgtgtgaaca tgaatatggt 3120 acggaagatg attatcaagg tttaccgtta gaatttggtg cgtcggcgga aacggtacgt 3180 gtagaagaag aagaagaaga agattggtta gatgatacga cggaacaatc ggaaatagaa 3240 ccggaaccgg aaccgacgcc ggaagaaccg gtaaatcaat ttacgggtta tttaaaatta 3300 acggataatg tagcgataaa atgtgtagat atagtaaaag aagcgcaatc ggcgaatccg 3360 atggtaatag taaatgcggc gaatatacat ttaaaacatg gtggtggtgt agcgggtgcg 3420 ttaaataaag cgacgaatgg tgcgatgcaa aaagaatcgg atgattatat aaaattaaat 3480 ggtccgttaa cggtaggtgg ttcgtgttta ttatcgggtc ataatttagc gaaaaaatgt 3540 ttacatgtag taggtccgaa tttaaatgcg ggtgaagata tacaattatt aaaagcggcg 3600 tatgaaaatt ttaattcgca agatatatta ttagcgccgt tattatcggc gggtatattt 3660 ggtgcgaaac cgttacaatc gttacaagta tgtgtacaaa cggtacgtac gcaagtatat 3720 atagcggtaa atgataaagc gttatatgaa caagtagtaa tggattattt agataattta 3780 aaaccgcgtg tagaagcgcc gaaacaagaa gaaccgccga atacggaaga ttcgaaaacg 3840 gaagaaaaat cggtagtaca aaaaccggta gatgtaaaac cgaaaataaa agcgtgtata 3900 gatgaagtaa cgacgacgtt agaagaaacg aaatttttaa cgaataaatt attattattt 3960 gcggatataa atggtaaatt atatcatgat tcgcaaaata tgttacgtgg tgaagatatg 4020 tcgtttttag aaaaagatgc gccgtatatg gtaggtgatg taataacgtc gggtgatata 4080 acgtgtgtag taataccgtc gaaaaaagcg ggtggtacga cggaaatgtt atcgcgtgcg 4140 ttaaaaaaag taccggtaga tgaatatata acgacgtatc cgggtcaagg ttgtgcgggt 4200 tatacgttag aagaagcgaa aacggcgtta aaaaaatgta aatcggcgtt ttatgtatta 4260 ccgtcggaag cgccgaatgc gaaagaagaa atattaggta cggtatcgtg gaatttacgt 4320 gaaatgttag cgcatgcgga agaaacgcgt aaattaatgc cgatatgtat ggatgtacgt 4380 gcgataatgg cgacgataca acgtaaatat aaaggtataa aaatacaaga aggtatagta 4440 gattatggtg tacgtttttt tttttatacg tcgaaagaac cggtagcgtc gataataacg 4500 aaattaaatt cgttaaatga accgttagta acgatgccga taggttatgt aacgcatggt 4560 tttaatttag aagaagcggc gcgttgtatg cgttcgttaa aagcgccggc ggtagtatcg 4620 gtatcgtcgc cggatgcggt aacgacgtat aatggttatt taacgtcgtc gtcgaaaacg 4680 tcggaagaac attttgtaga aacggtatcg ttagcgggtt cgtatcgtga ttggtcgtat 4740 tcgggtcaac gtacggaatt aggtgtagaa tttttaaaac gtggtgataa aatagtatat 4800 catacgttag aatcgccggt agaatttcat ttagatggtg aagtattatc gttagataaa 4860 ttaaaatcgt tattatcgtt acgtgaagta aaaacgataa aagtatttac gacggtagat 4920 aatacgaatt tacatacgca attagtagat atgtcgatga cgtatggtca acaatttggt 4980 ccgacgtatt tagatggtgc ggatgtaacg aaaataaaac cgcatgtaaa tcatgaaggt 5040 aaaacgtttt ttgtattacc gtcggatgat acgttacgtt cggaagcgtt tgaatattat 5100 catacgttag atgaatcgtt tttaggtcgt tatatgtcgg cgttaaatca tacgaaaaaa 5160 tggaaatttc cgcaagtagg tggtttaacg tcgataaaat gggcggataa taattgttat 5220 ttatcgtcgg tattattagc gttacaacaa ttagaagtaa aatttaatgc gccggcgtta 5280 caagaagcgt attatcgtgc gcgtgcgggt gatgcggcga atttttgtgc gttaatatta 5340 gcgtattcga ataaaacggt aggtgaatta ggtgatgtac gtgaaacgat gacgcattta 5400 ttacaacatg cgaatttaga atcggcgaaa cgtgtattaa atgtagtatg taaacattgt 5460 ggtcaaaaaa cgacgacgtt aacgggtgta gaagcggtaa tgtatatggg tacgttatcg 5520 tatgataatt taaaaacggg tgtatcgata ccgtgtgtat gtggtcgtga tgcgacgcaa 5580 tatttagtac aacaagaatc gtcgtttgta atgatgtcgg cgccgccggc ggaatataaa 5640 ttacaacaag gtacgttttt atgtgcgaat gaatatacgg gtaattatca atgtggtcat 5700 tatacgcata taacggcgaa agaaacgtta tatcgtatag atggtgcgca tttaacgaaa 5760 atgtcggaat ataaaggtcc ggtaacggat gtattttata aagaaacgtc gtatacgacg 5820 acgataaaac cggtatcgta taaattagat ggtgtaacgt atacggaaat agaaccgaaa 5880 ttagatggtt attataaaaa agataatgcg tattatacgg aacaaccgat agatttagta 5940 ccgacgcaac cgttaccgaa tgcgtcgttt gataatttta aattaacgtg ttcgaatacg 6000 aaatttgcgg atgatttaaa tcaaatgacg ggttttacga aaccggcgtc gcgtgaatta 6060 tcggtaacgt tttttccgga tttaaatggt gatgtagtag cgatagatta tcgtcattat 6120 tcggcgtcgt ttaaaaaagg tgcgaaatta ttacataaac cgatagtatg gcatataaat 6180 caagcgacga cgaaaacgac gtttaaaccg aatacgtggt gtttacgttg tttatggtcg 6240 acgaaaccgg tagatacgtc gaattcgttt gaagtattag cggtagaaga tacgcaaggt 6300 atggataatt tagcgtgtga atcgcaacaa ccgacgtcgg aagaagtagt agaaaatccg 6360 acgatacaaa aagaagtaat agaatgtgat gtaaaaacga cggaagtagt aggtaatgta 6420 atattaaaac cgtcggatga aggtgtaaaa gtaacgcaag aattaggtca tgaagattta 6480 atggcggcgt atgtagaaaa tacgtcgata acgataaaaa aaccgaatga attatcgtta 6540 gcgttaggtt taaaaacgat agcgacgcat ggtatagcgg cgataaattc ggtaccgtgg 6600 tcgaaaatat tagcgtatgt aaaaccgttt ttaggtcaag cggcgataac gacgtcgaat 6660 tgtgcgaaac gtttagcgca acgtgtattt aataattata tgccgtatgt atttacgtta 6720 ttatttcaat tatgtacgtt tacgaaatcg acgaattcgc gtatacgtgc gtcgttaccg 6780 acgacgatag cgaaaaattc ggtaaaatcg gtagcgaaat tatgtttaga tgcgggtata 6840 aattatgtaa aatcgccgaa attttcgaaa ttatttacga tagcgatgtg gttattatta 6900 ttatcgatat gtttaggttc gttaatatgt gtaacggcgg cgtttggtgt attattatcg 6960 aattttggtg cgccgtcgta ttgtaatggt gtacgtgaat tatatttaaa ttcgtcgaat 7020 gtaacgacga tggatttttg tgaaggttcg tttccgtgtt cgatatgttt atcgggttta 7080 gattcgttag attcgtatcc ggcgttagaa acgatacaag taacgatatc gtcgtataaa 7140 ttagatttaa cgatattagg tttagcggcg gaatgggtat tagcgtatat gttatttacg 7200 aaattttttt atttattagg tttatcggcg ataatgcaag tattttttgg ttattttgcg 7260 tcgcatttta tatcgaattc gtggttaatg tggtttataa tatcgatagt acaaatggcg 7320 ccggtatcgg cgatggtacg tatgtatata ttttttgcgt cgttttatta tatatggaaa 7380 tcgtatgtac atataatgga tggttgtacg tcgtcgacgt gtatgatgtg ttataaacgt 7440 aatcgtgcga cgcgtgtaga atgtacgacg atagtaaatg gtatgaaacg ttcgttttat 7500 gtatatgcga atggtggtcg tggtttttgt aaaacgcata attggaattg tttaaattgt 7560 gatacgtttt gtacgggttc gacgtttata tcggatgaag tagcgcgtga tttatcgtta 7620 caatttaaac gtccgataaa tccgacggat caatcgtcgt atatagtaga ttcggtagcg 7680 gtaaaaaatg gtgcgttaca tttatatttt gataaagcgg gtcaaaaaac gtatgaacgt 7740 catccgttat cgcattttgt aaatttagat aatttacgtg cgaataatac gaaaggttcg 7800 ttaccgataa atgtaatagt atttgatggt aaatcgaaat gtgatgaatc ggcgtcgaaa 7860 tcggcgtcgg tatattattc gcaattaatg tgtcaaccga tattattatt agatcaagcg 7920 ttagtatcgg atgtaggtga ttcgacggaa gtatcggtaa aaatgtttga tgcgtatgta 7980 gatacgtttt cggcgacgtt ttcggtaccg atggaaaaat taaaagcgtt agtagcgacg 8040 gcgcattcgg aattagcgaa aggtgtagcg ttagatggtg tattatcgac gtttgtatcg 8100 gcggcgcgtc aaggtgtagt agatacggat gtagatacga aagatgtaat agaatgttta 8160 aaattatcgc atcattcgga tttagaagta acgggtgatt cgtgtaataa ttttatgtta 8220 acgtataata aagtagaaaa tatgacgccg cgtgatttag gtgcgtgtat agattgtaat 8280 gcgcgtcata taaatgcgca agtagcgaaa tcgcataatg tatcgttaat atggaatgta 8340 aaagattata tgtcgttatc ggaacaatta cgtaaacaaa tacgttcggc ggcgaaaaaa 8400 aataatatac cgtttcgttt aacgtgtgcg acgacgcgtc aagtagtaaa tgtaataacg 8460 acgaaaatat cgttaaaagg tggtaaaata gtatcgacgt gttttaaatt aatgttaaaa 8520 gcgacgttat tatgtgtatt agcggcgtta gtatgttata tagtaatgcc ggtacatacg 8580 ttatcgatac atgatggtta tacgaatgaa ataataggtt ataaagcgat acaagatggt 8640 gtaacgcgtg atataatatc gacggatgat tgttttgcga ataaacatgc gggttttgat 8700 gcgtggtttt cgcaacgtgg tggttcgtat aaaaatgata aatcgtgtcc ggtagtagcg 8760 gcgataataa cgcgtgaaat aggttttata gtaccgggtt taccgggtac ggtattacgt 8820 gcgataaatg gtgatttttt acatttttta ccgcgtgtat tttcggcggt aggtaatata 8880 tgttatacgc cgtcgaaatt aatagaatat tcggattttg cgacgtcggc gtgtgtatta 8940 gcggcggaat gtacgatatt taaagatgcg atgggtaaac cggtaccgta ttgttatgat 9000 acgaatttat tagaaggttc gatatcgtat tcggaattac gtccggatac gcgttatgta 9060 ttaatggatg gttcgataat acaatttccg aatacgtatt tagaaggttc ggtacgtgta 9120 gtaacgacgt ttgatgcgga atattgtcgt catggtacgt gtgaacgttc ggaagtaggt 9180 atatgtttat cgacgtcggg tcgttgggta ttaaataatg aacattatcg tgcgttatcg 9240 ggtgtatttt gtggtgtaga tgcgatgaat ttaatagcga atatatttac gccgttagta 9300 caaccggtag gtgcgttaga tgtatcggcg tcggtagtag cgggtggtat aatagcgata 9360 ttagtaacgt gtgcggcgta ttattttatg aaatttcgtc gtgtatttgg tgaatataat 9420 catgtagtag cggcgaatgc gttattattt ttaatgtcgt ttacgatatt atgtttagta 9480 ccggcgtatt cgtttttacc gggtgtatat tcggtatttt atttatattt aacgttttat 9540 tttacgaatg atgtatcgtt tttagcgcat ttacaatggt ttgcgatgtt ttcgccgata 9600 gtaccgtttt ggataacggc gatatatgta ttttgtatat cgttaaaaca ttgtcattgg 9660 ttttttaata attatttacg taaacgtgta atgtttaatg gtgtaacgtt ttcgacgttt 9720 gaagaagcgg cgttatgtac gtttttatta aataaagaaa tgtatttaaa attacgttcg 9780 gaaacgttat taccgttaac gcaatataat cgttatttag cgttatataa taaatataaa 9840 tatttttcgg gtgcgttaga tacgacgtcg tatcgtgaag cggcgtgttg tcatttagcg 9900 aaagcgttaa atgatttttc gaattcgggt gcggatgtat tatatcaacc gccgcaaacg 9960 tcgataacgt cggcggtatt acaatcgggt tttcgtaaaa tggcgtttcc gtcgggtaaa 10020 gtagaaggtt gtatggtaca agtaacgtgt ggtacgacga cgttaaatgg tttatggtta 10080 gatgatacgg tatattgtcc gcgtcatgta atatgtacgg cggaagatat gttaaatccg 10140 aattatgaag atttattaat acgtaaatcg aatcattcgt ttttagtaca agcgggtaat 10200 gtacaattac gtgtaatagg tcattcgatg caaaattgtt tattacgttt aaaagtagat 10260 acgtcgaatc cgaaaacgcc gaaatataaa tttgtacgta tacaaccggg tcaaacgttt 10320 tcggtattag cgtgttataa tggttcgccg tcgggtgtat atcaatgtgc gatgcgtccg 10380 aatcatacga taaaaggttc gtttttaaat ggttcgtgtg gttcggtagg ttttaatata 10440 gattatgatt gtgtatcgtt ttgttatatg catcatatgg aattaccgac gggtgtacat 10500 gcgggtacgg atttagaagg taaattttat ggtccgtttg tagatcgtca aacggcgcaa 10560 gcggcgggta cggatacgac gataacgtta aatgtattag cgtggttata tgcggcggta 10620 ataaatggtg atcgttggtt tttaaatcgt tttacgacga cgttaaatga ttttaattta 10680 gtagcgatga aatataatta tgaaccgtta acgcaagatc atgtagatat attaggtccg 10740 ttatcggcgc aaacgggtat agcggtatta gatatgtgtg cggcgttaaa agaattatta 10800 caaaatggta tgaatggtcg tacgatatta ggttcgacga tattagaaga tgaatttacg 10860 ccgtttgatg tagtacgtca atgttcgggt gtaacgtttc aaggtaaatt taaaaaaata 10920 gtaaaaggta cgcatcattg gatgttatta acgtttttaa cgtcgttatt aatattagta 10980 caatcgacgc aatggtcgtt attttttttt gtatatgaaa atgcgttttt accgtttacg 11040 ttaggtataa tggcgatagc ggcgtgtgcg atgttattag taaaacataa acatgcgttt 11100 ttatgtttat ttttattacc gtcgttagcg acggtagcgt attttaatat ggtatatatg 11160 ccggcgtcgt gggtaatgcg tataatgacg tggttagaat tagcggatac gtcgttatcg 11220 ggttatcgtt taaaagattg tgtaatgtat gcgtcggcgt tagtattatt aatattaatg 11280 acggcgcgta cggtatatga tgatgcggcg cgtcgtgtat ggacgttaat gaatgtaata 11340 acgttagtat ataaagtata ttatggtaat gcgttagatc aagcgatatc gatgtgggcg 11400 ttagtaatat cggtaacgtc gaattattcg ggtgtagtaa cgacgataat gtttttagcg 11460 cgtgcgatag tatttgtatg tgtagaatat tatccgttat tatttataac gggtaatacg 11520 ttacaatgta taatgttagt atattgtttt ttaggttatt gttgttgttg ttattttggt 11580 ttattttgtt tattaaatcg ttattttcgt ttaacgttag gtgtatatga ttatttagta 11640 tcgacgcaag aatttcgtta tatgaattcg caaggtttat taccgccgaa atcgtcgata 11700 gatgcgttta aattaaatat aaaattatta ggtataggtg gtaaaccgtg tataaaagta 11760 gcgacggtac aatcgaaaat gtcggatgta aaatgtacgt cggtagtatt attatcggta 11820 ttacaacaat tacgtgtaga atcgtcgtcg aaattatggg cgcaatgtgt acaattacat 11880 aatgatatat tattagcgaa agatacgacg gaagcgtttg aaaaaatggt atcgttatta 11940 tcggtattat tatcgatgca aggtgcggta gatataaatc gtttatgtga agaaatgtta 12000 gataatcgtg cgacgttaca agcgatagcg tcggaatttt cgtcgttacc gtcgtatgcg 12060 gcgtatgcga cggcgcaaga agcgtatgaa caagcggtag cgaatggtga ttcggaagta 12120 gtattaaaaa aattaaaaaa atcgttaaat gtagcgaaat cggaatttga tcgtgatgcg 12180 gcgatgcaac gtaaattaga aaaaatggcg gatcaagcga tgacgcaaat gtataaacaa 12240 gcgcgttcgg aagataaacg tgcgaaagta acgtcggcga tgcaaacgat gttatttacg 12300 atgttacgta aattagataa tgatgcgtta aataatataa taaataatgc gcgtgatggt 12360 tgtgtaccgt taaatataat accgttaacg acggcggcga aattaatggt agtagtaccg 12420 gattatggta cgtataaaaa tacgtgtgat ggtaatacgt ttacgtatgc gtcggcgtta 12480 tgggaaatac aacaagtagt agatgcggat tcgaaaatag tacaattatc ggaaataaat 12540 atggataatt cgccgaattt agcgtggccg ttaatagtaa cggcgttacg tgcgaattcg 12600 gcggtaaaat tacaaaataa tgaattatcg ccggtagcgt tacgtcaaat gtcgtgtgcg 12660 gcgggtacga cgcaaacggc gtgtacggat gataatgcgt tagcgtatta taataattcg 12720 aaaggtggtc gttttgtatt agcgttatta tcggatcatc aagatttaaa atgggcgcgt 12780 tttccgaaat cggatggtac gggtacgata tatacggaat tagaaccgcc gtgtcgtttt 12840 gtaacggata cgccgaaagg tccgaaagta aaatatttat attttataaa aggtttaaat 12900 aatttaaatc gtggtatggt attaggttcg ttagcggcga cggtacgttt acaagcgggt 12960 aatgcgacgg aagtaccggc gaattcgacg gtattatcgt tttgtgcgtt tgcggtagat 13020 ccggcgaaag cgtataaaga ttatttagcg tcgggtggtc aaccgataac gaattgtgta 13080 aaaatgttat gtacgcatac gggtacgggt caagcgataa cggtaacgcc ggaagcgaat 13140 atggatcaag aatcgtttgg tggtgcgtcg tgttgtttat attgtcgttg tcatatagat 13200 catccgaatc cgaaaggttt ttgtgattta aaaggtaaat atgtacaaat accgacgacg 13260 tgtgcgaatg atccggtagg ttttacgtta cgtaatacgg tatgtacggt atgtggtatg 13320 tggaaaggtt atggttgttc gtgtgatcaa ttacgtgaac cgttaatgca atcggcggat 13380 gcgtcgacgt ttttaaatgg gtttgcggtg taagtgcggc gcgtttaacg ccgtgtggta 13440 cgggtacgtc gacggatgta gtatatcgtg cgtttgatat atataatgaa aaagtagcgg 13500 gttttgcgaa atttttaaaa acgaattgtt gtcgttttca agaaaaagat gaagaaggta 13560 atttattaga ttcgtatttt gtagtaaaac gtcatacgat gtcgaattat caacatgaag 13620 aaacgatata taatttagta aaagattgtc cggcggtagc ggtacatgat ttttttaaat 13680 ttcgtgtaga tggtgatatg gtaccgcata tatcgcgtca acgtttaacg aaatatacga 13740 tggcggattt agtatatgcg ttacgtcatt ttgatgaagg taattgtgat acgttaaaag 13800 aaatattagt aacgtataat tgttgtgatg atgattattt taataaaaaa gattggtatg 13860 attttgtaga aaatccggat atattacgtg tatatgcgaa tttaggtgaa cgtgtacgtc 13920 aatcgttatt aaaaacggta caattttgtg atgcgatgcg tgatgcgggt atagtaggtg 13980 tattaacgtt agataatcaa gatttaaatg gtaattggta tgattttggt gattttgtac 14040 aagtagcgcc gggttgtggt gtaccgatag tagattcgta ttattcgtta ttaatgccga 14100 tattaacgtt aacgcgtgcg ttagcggcgg aatcgcatat ggatgcggat ttagcgaaac 14160 cgttaataaa atgggattta ttaaaatatg attttacgga agaacgttta tgtttatttg 14220 atcgttattt taaatattgg gatcaaacgt atcatccgaa ttgtataaat tgtttagatg 14280 atcgttgtat attacattgt gcgaatttta atgtattatt ttcgacggta tttccgccga 14340 cgtcgtttgg tccgttagta cgtaaaatat ttgtagatgg tgtaccgttt gtagtatcga 14400 cgggttatca ttttcgtgaa ttaggtgtag tacataatca agatgtaaat ttacattcgt 14460 cgcgtttatc gtttaaagaa ttattagtat atgcggcgga tccggcgatg catgcggcgt 14520 cgggtaattt attattagat aaacgtacga cgtgtttttc ggtagcggcg ttaacgaata 14580 atgtagcgtt tcaaacggta aaaccgggta attttaataa agatttttat gattttgcgg 14640 tatcgaaagg tttttttaaa gaaggttcgt cggtagaatt aaaacatttt ttttttgcgc 14700 aagatggtaa tgcggcgata tcggattatg attattatcg ttataattta ccgacgatgt 14760 gtgatatacg tcaattatta tttgtagtag aagtagtaga taaatatttt gattgttatg 14820 atggtggttg tataaatgcg aatcaagtaa tagtaaataa tttagataaa tcggcgggtt 14880 ttccgtttaa taaatggggt aaagcgcgtt tatattatga ttcgatgtcg tatgaagatc 14940 aagatgcgtt atttgcgtat acgaaacgta atgtaatacc gacgataacg caaatgaatt 15000 taaaatatgc gatatcggcg aaaaatcgtg cgcgtacggt agcgggtgta tcgatatgtt 15060 cgacgatgac gaatcgtcaa tttcatcaaa aattattaaa atcgatagcg gcgacgcgtg 15120 gtgcgacggt agtaataggt acgtcgaaat tttatggtgg ttggcataat atgttaaaaa 15180 cggtatattc ggatgtagaa acgccgcatt taatgggttg ggattatccg aaatgtgatc 15240 gtgcgatgcc gaatatgtta cgtataatgg cgtcgttagt attagcgcgt aaacataata 15300 cgtgttgtaa tttatcgcat cgtttttatc gtttagcgaa tgaatgtgcg caagtattat 15360 cggaaatggt aatgtgtggt ggttcgttat atgtaaaacc gggtggtacg tcgtcgggtg 15420 atgcgacgac ggcgtatgcg aattcggtat ttaatatatg tcaagcggta acggcgaatg 15480 taaatgcgtt attatcgacg gatggtaata aaatagcgga taaatatgta cgtaatttac 15540 aacatcgttt atatgaatgt ttatatcgta atcgtgatgt agatcatgaa tttgtagatg 15600 aattttatgc gtatttacgt aaacattttt cgatgatgat attatcggat gatgcggtag 15660 tatgttataa ttcgaattat gcggcgcaag gtttagtagc gtcgataaaa aattttaaag 15720 cggtattata ttatcaaaat aatgtattta tgtcggaagc gaaatgttgg acggaaacgg 15780 atttaacgaa aggtccgcat gaattttgtt cgcaacatac gatgttagta aaacaaggtg 15840 atgattatgt atatttaccg tatccggatc cgtcgcgtat attaggtgcg ggttgttttg 15900 tagatgatat agtaaaaacg gatggtacgt taatgataga acgttttgta tcgttagcga 15960 tagatgcgta tccgttaacg aaacatccga atcaagaata tgcggatgta tttcatttat 16020 atttacaata tatacgtaaa ttacatgatg aattaacggg tcatatgtta gatatgtatt 16080 cggtaatgtt aacgaatgat aatacgtcgc gttattggga accggaattt tatgaagcga 16140 tgtatacgcc gcatacggta ttacaagcgg taggtgcgtg tgtattatgt aattcgcaaa 16200 cgtcgttacg ttgtggtgcg tgtatacgtc gtccgttttt atgttgtaaa tgttgttatg 16260 atcatgtaat atcgacgtcg cataaattag tattatcggt aaatccgtat gtatgtaatg 16320 cgccgggttg tgatgtaacg gatgtaacgc aattatattt aggtggtatg tcgtattatt 16380 gtaaatcgca taaaccgccg atatcgtttc cgttatgtgc gaatggtcaa gtatttggtt 16440 tatataaaaa tacgtgtgta ggttcggata atgtaacgga ttttaatgcg atagcgacgt 16500 gtgattggac gaatgcgggt gattatatat tagcgaatac gtgtacggaa cgtttaaaat 16560 tatttgcggc ggaaacgtta aaagcgacgg aagaaacgtt taaattatcg tatggtatag 16620 cgacggtacg tgaagtatta tcggatcgtg aattacattt atcgtgggaa gtaggtaaac 16680 cgcgtccgcc gttaaatcgt aattatgtat ttacgggtta tcgtgtaacg aaaaattcga 16740 aagtacaaat aggtgaatat acgtttgaaa aaggtgatta tggtgatgcg gtagtatatc 16800 gtggtacgac gacgtataaa ttaaatgtag gtgattattt tgtattaacg tcgcatacgg 16860 taatgccgtt atcggcgccg acgttagtac cgcaagaaca ttatgtacgt ataacgggtt 16920 tatatccgac gttaaatata tcggatgaat tttcgtcgaa tgtagcgaat tatcaaaaag 16980 taggtatgca aaaatattcg acgttacaag gtccgccggg tacgggtaaa tcgcattttg 17040 cgataggttt agcgttatat tatccgtcgg cgcgtatagt atatacggcg tgttcgcatg 17100 cggcggtaga tgcgttatgt gaaaaagcgt taaaatattt accgatagat aaatgttcgc 17160 gtataatacc ggcgcgtgcg cgtgtagaat gttttgataa atttaaagta aattcgacgt 17220 tagaacaata tgtattttgt acggtaaatg cgttaccgga aacgacggcg gatatagtag 17280 tatttgatga aatatcgatg gcgacgaatt atgatttatc ggtagtaaat gcgcgtttac 17340 gtgcgaaaca ttatgtatat ataggtgatc cggcgcaatt accggcgccg cgtacgttat 17400 taacgaaagg tacgttagaa ccggaatatt ttaattcggt atgtcgttta atgaaaacga 17460 taggtccgga tatgttttta ggtacgtgtc gtcgttgtcc ggcggaaata gtagatacgg 17520 tatcggcgtt agtatatgat aataaattaa aagcgcataa agataaatcg gcgcaatgtt 17580 ttaaaatgtt ttataaaggt gtaataacgc atgatgtatc gtcggcgata aatcgtccgc 17640 aaataggtgt agtacgtgaa tttttaacgc gtaatccggc gtggcgtaaa gcggtattta 17700 tatcgccgta taattcgcaa aatgcggtag cgtcgaaaat attaggttta ccgacgcaaa 17760 cggtagattc gtcgcaaggt tcggaatatg attatgtaat atttacgcaa acgacggaaa 17820 cggcgcattc gtgtaatgta aatcgtttta atgtagcgat aacgcgtgcg aaaataggta 17880 tattatgtat aatgtcggat cgtgatttat atgataaatt acaatttacg tcgttagaaa 17940 taccgcgtcg taatgtagcg acgttacaag cggaaaatgt aacgggttta tttaaagatt 18000 gttcgaaaat aataacgggt ttacatccga cgcaagcgcc gacgcattta tcggtagata 18060 taaaatttaa aacggaaggt ttatgtgtag atataccggg tataccgaaa gatatgacgt 18120 atcgtcgttt aatatcgatg atgggtttta aaatgaatta tcaagtaaat ggttatccga 18180 atatgtttat aacgcgtgaa gaagcgatac gtcatgtacg tgcgtggata ggttttgatg 18240 tagaaggttg tcatgcgacg cgtgatgcgg taggtacgaa tttaccgtta caattaggtt 18300 tttcgacggg tgtaaattta gtagcggtac cgacgggtta tgtagatacg gaaaataata 18360 cggaatttac gcgtgtaaat gcgaaaccgc cgccgggtga tcaatttaaa catttaatac 18420 cgttaatgta taaaggttta ccgtggaatg tagtacgtat aaaaatagta caaatgttat 18480 cggatacgtt aaaaggttta tcggatcgtg tagtatttgt attatgggcg catggttttg 18540 aattaacgtc gatgaaatat tttgtaaaaa taggtccgga acgtacgtgt tgtttatgtg 18600 ataaacgtgc gacgtgtttt tcgacgtcgt cggatacgta tgcgtgttgg aatcattcgg 18660 taggttttga ttatgtatat aatccgttta tgatagatgt acaacaatgg ggttttacgg 18720 gtaatttaca atcgaatcat gatcaacatt gtcaagtaca tggtaatgcg catgtagcgt 18780 cgtgtgatgc gataatgacg cgttgtttag cggtacatga atgttttgta aaacgtgtag 18840 attggtcggt agaatatccg ataataggtg atgaattacg tgtaaattcg gcgtgtcgta 18900 aagtacaaca tatggtagta aaatcggcgt tattagcgga taaatttccg gtattacatg 18960 atataggtaa tccgaaagcg ataaaatgtg taccgcaagc ggaagtagaa tggaaatttt 19020 atgatgcgca accgtgttcg gataaagcgt ataaaataga agaattattt tattcgtatg 19080 cgacgcatca tgataaattt acggatggtg tatgtttatt ttggaattgt aatgtagatc 19140 gttatccggc gaatgcgata gtatgtcgtt ttgatacgcg tgtattatcg aatttaaatt 19200 taccgggttg tgatggtggt tcgttatatg taaataaaca tgcgtttcat acgccggcgt 19260 ttgataaatc ggcgtttacg aatttaaaac aattaccgtt tttttattat tcggattcgc 19320 cgtgtgaatc gcatggtaaa caagtagtat cggatataga ttatgtaccg ttaaaatcgg 19380 cgacgtgtat aacgcgttgt aatttaggtg gtgcggtatg tcgtcatcat gcgaatgaat 19440 atcgtcaata tttagatgcg tataatatga tgatatcggc gggtttttcg ttatggatat 19500 ataaacaatt tgatacgtat aatttatgga atacgtttac gcgtttacaa tcgttagaaa 19560 atgtagcgta taatgtagta aataaaggtc attttgatgg tcatgcgggt gaagcgccgg 19620 tatcgataat aaataatgcg gtatatacga aagtagatgg tatagatgta gaaatatttg 19680 aaaataaaac gacgttaccg gtaaatgtag cgtttgaatt atgggcgaaa cgtaatataa 19740 aaccggtacc ggaaataaaa atattaaata atttaggtgt agatatagcg gcgaatacgg 19800 taatatggga ttataaacgt gaagcgccgg cgcatgtatc gacgataggt gtatgtacga 19860 tgacggatat agcgaaaaaa ccgacggaat cggcgtgttc gtcgttaacg gtattatttg 19920 atggtcgtgt agaaggtcaa gtagatttat ttcgtaatgc gcgtaatggt gtattaataa 19980 cggaaggttc ggtaaaaggt ttaacgccgt cgaaaggtcc ggcgcaagcg tcggtaaatg 20040 gtgtaacgtt aataggtgaa tcggtaaaaa cgcaatttaa ttattttaaa aaagtagatg 20100 gtataataca acaattaccg gaaacgtatt ttacgcaatc gcgtgattta gaagatttta 20160 aaccgcgttc gcaaatggaa acggattttt tagaattagc gatggatgaa tttatacaac 20220 gttataaatt agaaggttat gcgtttgaac atatagtata tggtgatttt tcgcatggtc 20280 aattaggtgg tttacattta atgataggtt tagcgaaacg ttcgcaagat tcgccgttaa 20340 aattagaaga ttttataccg atggattcga cggtaaaaaa ttattttata acggatgcgc 20400 aaacgggttc gtcgaaatgt gtatgttcgg taatagattt attattagat gattttgtag 20460 aaataataaa atcgcaagat ttatcggtaa tatcgaaagt agtaaaagta acgatagatt 20520 atgcggaaat atcgtttatg ttatggtgta aagatggtca tgtagaaacg ttttatccga 20580 aattacaagc gtcgcaagcg tggcaaccgg gtgtagcgat gccgaattta tataaaatgc 20640 aacgtatgtt attagaaaaa tgtgatttac aaaattatgg tgaaaatgcg gtaataccga 20700 aaggtataat gatgaatgta gcgaaatata cgcaattatg tcaatattta aatacgttaa 20760 cgttagcggt accgtataat atgcgtgtaa tacattttgg tgcgggttcg gataaaggtg 20820 tagcgccggg tacggcggta ttacgtcaat ggttaccgac gggtacgtta ttagtagatt 20880 cggatttaaa tgattttgta tcggatgcgg attcgacgtt aataggtgat tgtgcgacgg 20940 tacatacggc gaataaatgg gatttaataa tatcggatat gtatgatccg cgtacgaaac 21000 atgtaacgaa agaaaatgat tcgaaagaag gtttttttac gtatttatgt ggttttataa 21060 aacaaaaatt agcgttaggt ggttcgatag cggtaaaaat aacggaacat tcgtggaatg 21120 cggatttata taaattaatg ggtcattttt cgtggtggac ggcgtttgta acgaatgtaa 21180 atgcgtcgtc gtcggaagcg tttttaatag gtgcgaatta tttaggtaaa ccgaaagaac 21240 aaatagatgg ttatacgatg catgcgaatt atatattttg gcgtaatacg aatccgatac 21300 aattatcgtc gtattcgtta tttgatatgt cgaaatttcc gttaaaatta cgtggtacgg 21360 cggtaatgtc gttaaaagaa aatcaaataa atgatatgat atattcgtta ttagaaaaag 21420 gtcgtttaat aatacgtgaa aataatcgtg tagtagtatc gtcggatata ttagtaaata 21480 attaaacgaa catgtttata tttttattat ttttaacgtt aacgtcgggt tcggatttag 21540 atcgttgtac gacgtttgat gatgtacaag cgccgaatta tacgcaacat acgtcgtcga 21600 tgcgtggtgt atattatccg gatgaaatat ttcgttcgga tacgttatat ttaacgcaag 21660 atttattttt accgttttat tcgaatgtaa cgggttttca tacgataaat catacgtttg 21720 gtaatccggt aataccgttt aaagatggta tatattttgc ggcgacggaa aaatcgaatg 21780 tagtacgtgg ttgggtattt ggttcgacga tgaataataa atcgcaatcg gtaataataa 21840 taaataattc gacgaatgta gtaatacgtg cgtgtaattt tgaattatgt gataatccgt 21900 tttttgcggt atcgaaaccg atgggtacgc aaacgcatac gatgatattt gataatgcgt 21960 ttaattgtac gtttgaatat atatcggatg cgttttcgtt agatgtatcg gaaaaatcgg 22020 gtaattttaa acatttacgt gaatttgtat ttaaaaataa agatggtttt ttatatgtat 22080 ataaaggtta tcaaccgata gatgtagtac gtgatttacc gtcgggtttt aatacgttaa 22140 aaccgatatt taaattaccg ttaggtataa atataacgaa ttttcgtgcg atattaacgg 22200 cgttttcgcc ggcgcaagat atatggggta cgtcggcggc ggcgtatttt gtaggttatt 22260 taaaaccgac gacgtttatg ttaaaatatg atgaaaatgg tacgataacg gatgcggtag 22320 attgttcgca aaatccgtta gcggaattaa aatgttcggt aaaatcgttt gaaatagata 22380 aaggtatata tcaaacgtcg aattttcgtg tagtaccgtc gggtgatgta gtacgttttc 22440 cgaatataac gaatttatgt ccgtttggtg aagtatttaa tgcgacgaaa tttccgtcgg 22500 tatatgcgtg ggaacgtaaa aaaatatcga attgtgtagc ggattattcg gtattatata 22560 attcgacgtt tttttcgacg tttaaatgtt atggtgtatc ggcgacgaaa ttaaatgatt 22620 tatgtttttc gaatgtatat gcggattcgt ttgtagtaaa aggtgatgat gtacgtcaaa 22680 tagcgccggg tcaaacgggt gtaatagcgg attataatta taaattaccg gatgatttta 22740 tgggttgtgt attagcgtgg aatacgcgta atatagatgc gacgtcgacg ggtaattata 22800 attataaata tcgttattta cgtcatggta aattacgtcc gtttgaacgt gatatatcga 22860 atgtaccgtt ttcgccggat ggtaaaccgt gtacgccgcc ggcgttaaat tgttattggc 22920 cgttaaatga ttatggtttt tatacgacga cgggtatagg ttatcaaccg tatcgtgtag 22980 tagtattatc gtttgaatta ttaaatgcgc cggcgacggt atgtggtccg aaattatcga 23040 cggatttaat aaaaaatcaa tgtgtaaatt ttaattttaa tggtttaacg ggtacgggtg 23100 tattaacgcc gtcgtcgaaa cgttttcaac cgtttcaaca atttggtcgt gatgtatcgg 23160 attttacgga ttcggtacgt gatccgaaaa cgtcggaaat attagatata tcgccgtgtg 23220 cgtttggtgg tgtatcggta ataacgccgg gtacgaatgc gtcgtcggaa gtagcggtat 23280 tatatcaaga tgtaaattgt acggatgtat cgacggcgat acatgcggat caattaacgc 23340 cggcgtggcg tatatattcg acgggtaata atgtatttca aacgcaagcg ggttgtttaa 23400 taggtgcgga acatgtagat acgtcgtatg aatgtgatat accgataggt gcgggtatat 23460 gtgcgtcgta tcatacggta tcgttattac gttcgacgtc gcaaaaatcg atagtagcgt 23520 atacgatgtc gttaggtgcg gattcgtcga tagcgtattc gaataatacg atagcgatac 23580 cgacgaattt ttcgatatcg ataacgacgg aagtaatgcc ggtatcgatg gcgaaaacgt 23640 cggtagattg taatatgtat atatgtggtg attcgacgga atgtgcgaat ttattattac 23700 aatatggttc gttttgtacg caattaaatc gtgcgttatc gggtatagcg gcggaacaag 23760 atcgtaatac gcgtgaagta tttgcgcaag taaaacaaat gtataaaacg ccgacgttaa 23820 aatattttgg tggttttaat ttttcgcaaa tattaccgga tccgttaaaa ccgacgaaac 23880 gttcgtttat agaagattta ttatttaata aagtaacgtt agcggatgcg ggttttatga 23940 aacaatatgg tgaatgttta ggtgatataa atgcgcgtga tttaatatgt gcgcaaaaat 24000 ttaatggttt aacggtatta ccgccgttat taacggatga tatgatagcg gcgtatacgg 24060 cggcgttagt atcgggtacg gcgacggcgg gttggacgtt tggtgcgggt gcggcgttac 24120 aaataccgtt tgcgatgcaa atggcgtatc gttttaatgg tataggtgta acgcaaaatg 24180 tattatatga aaatcaaaaa caaatagcga atcaatttaa taaagcgata tcgcaaatac 24240 aagaatcgtt aacgacgacg tcgacggcgt taggtaaatt acaagatgta gtaaatcaaa 24300 atgcgcaagc gttaaatacg ttagtaaaac aattatcgtc gaattttggt gcgatatcgt 24360 cggtattaaa tgatatatta tcgcgtttag ataaagtaga agcggaagta caaatagatc 24420 gtttaataac gggtcgttta caatcgttac aaacgtatgt aacgcaacaa ttaatacgtg 24480 cggcggaaat acgtgcgtcg gcgaatttag cggcgacgaa aatgtcggaa tgtgtattag 24540 gtcaatcgaa acgtgtagat ttttgtggta aaggttatca tttaatgtcg tttccgcaag 24600 cggcgccgca tggtgtagta tttttacatg taacgtatgt accgtcgcaa gaacgtaatt 24660 ttacgacggc gccggcgata tgtcatgaag gtaaagcgta ttttccgcgt gaaggtgtat 24720 ttgtatttaa tggtacgtcg tggtttataa cgcaacgtaa ttttttttcg ccgcaaataa 24780 taacgacgga taatacgttt gtatcgggta attgtgatgt agtaataggt ataataaata 24840 atacggtata tgatccgtta caaccggaat tagattcgtt taaagaagaa ttagataaat 24900 attttaaaaa tcatacgtcg ccggatgtag atttaggtga tatatcgggt ataaatgcgt 24960 cggtagtaaa tatacaaaaa gaaatagatc gtttaaatga agtagcgaaa aatttaaatg 25020 aatcgttaat agatttacaa gaattaggta aatatgaaca atatataaaa tggccgtggt 25080 atgtatggtt aggttttata gcgggtttaa tagcgatagt aatggtaacg atattattat 25140 gttgtatgac gtcgtgttgt tcgtgtttaa aaggtgcgtg ttcgtgtggt tcgtgttgta 25200 aatttgatga agatgattcg gaaccggtat taaaaggtgt aaaattacat tatacgtaaa 25260 cgaacttatg gatttgttta tgagattttt tactcttaga tcaattactg cacagccagt 25320 aaaaattgac aatgcttctc ctgcaagtac tgttcatgct acagcaacga taccgctaca 25380 agcctcactc cctttcggat ggcttgttat tggcgttgca tttcttgctg tttttcagag 25440 cgctaccaaa ataattgcgc tcaataaaag atggcagcta gccctttata agggcttcca 25500 gttcatttgc aatttactgc tgctatttgt taccatctat tcacatcttt tgcttgtcgc 25560 tgcaggtatg gaggcgcaat ttttgtacct ctatgccttg atatattttc tacaatgcat 25620 caacgcatgt agaattatta tgagatgttg gctttgttgg aagtgcaaat ccaagaaccc 25680 attactttat gatgccaact actttgtttg ctggcacaca cataactatg actactgtat 25740 accatataac agtgtcacag atacaattgt cgttactgaa ggtgacggca tttcaacacc 25800 aaaactcaaa gaagactacc aaattggtgg ttattctgag gataggcact caggtgttaa 25860 agactatgtc gttgtacatg gctatttcac cgaagtttac taccagcttg agtctacaca 25920 aattactaca gacactggta ttgaaaatgc tacattcttc atctttaaca agcttgttaa 25980 agacccaccg aatgtgcaaa tacacacaat cgacggctct tcaggagttg ctaatccagc 26040 aatggatcca atttatgatg agccgacgac gactactagc gtgcctttgt aagcacaaga 26100 aagtgagtac gaacttatgt actcattcgt ttcggaagaa acaggtacgt taatagttaa 26160 tagcgtactt ctttttcttg ctttcgtggt attcttgcta gtcacactag ccatccttac 26220 tgcgcttcga ttgtgtgcgt actgctgcaa tattgttaac gtgagtttag taaaaccaac 26280 ggtttacgtc tactcgcgtg ttaaaaatct gaactcttct gaaggagttc ctgatcttct 26340 ggtctaaacg aactaactat tattattatt ctgtttggaa ctttaacatt gcttatcatg 26400 gcggataatg gtacgataac ggtagaagaa ttaaaacaat tattagaaca atggaattta 26460 gtaataggtt ttttattttt agcgtggata atgttattac aatttgcgta ttcgaatcgt 26520 aatcgttttt tatatataat aaaattagta tttttatggt tattatggcc ggtaacgtta 26580 gcgtgttttg tattagcggc ggtatatcgt ataaattggg taacgggtgg tatagcgata 26640 gcgatggcgt gtatagtagg tttaatgtgg ttatcgtatt ttgtagcgtc gtttcgttta 26700 tttgcgcgta cgcgttcgat gtggtcgttt aatccggaaa cgaatatatt attaaatgta 26760 ccgttacgtg gtacgatagt aacgcgtccg ttaatggaat cggaattagt aataggtgcg 26820 gtaataatac gtggtcattt acgtatggcg ggtcattcgt taggtcgttg tgatataaaa 26880 gatttaccga aagaaataac ggtagcgacg tcgcgtacgt tatcgtatta taaattaggt 26940 gcgtcgcaac gtgtaggtac ggattcgggt tttgcggcgt ataatcgtta tcgtataggt 27000 aattataaat taaatacgga tcatgcgggt tcgaatgata atatagcgtt attagtacaa 27060 taagtgacaa cagatgtttc atcttgttga cttccaggtt acaatagcag agatattgat 27120 tatcattatg aggactttca ggattgctat ttggaatctt gacgttataa taagttcaat 27180 agtgagacaa ttatttaagc ctctaactaa gaagaattat tcggagttag atgatgaaga 27240 acctatggag ttagattatc cataaaacga acatgaaaat tattctcttc ctgacattga 27300 ttgtatttac atcttgcgag ctatatcact atcaggagtg tgttagaggt acgactgtac 27360 tactaaaaga accttgccca tcaggaacat acgagggcaa ttcaccattt caccctcttg 27420 ctgacaataa atttgcacta acttgcacta gcacacactt tgcttttgct tgtgctgacg 27480 gtactcgaca tacctatcag ctgcgtgcaa gatcagtttc accaaaactt ttcatcagac 27540 aagaggaggt tcaacaagag ctctactcgc cactttttct cattgttgct gctctagtat 27600 ttttaatact ttgcttcacc attaagagaa agacagaatg aatgagctca ctttaattga 27660 cttctatttg tgctttttag cctttctgct attccttgtt ttaataatgc ttattatatt 27720 ttggttttca ctcgaaatcc aggatctaga agaaccttgt accaaagtct aaacgaacat 27780 gaaacttctc attgttttga cttgtatttc tctatgcagt tgcatatgca ctgtagtaca 27840 gcgctgtgca tctaataaac ctcatgtgct tgaagatcct tgtaaggtac aacactaggg 27900 gtaatactta tagcactgct tggctttgtg ctctaggaaa ggttttacct tttcatagat 27960 ggcacactat ggttcaaaca tgcacaccta atgttactat caactgtcaa gatccagctg 28020 gtggtgcgct tatagctagg tgttggtacc ttcatgaagg tcaccaaact gctgcattta 28080 gagacgtact tgttgtttta aataaacgaa caaattaaaa tgtctgataa tggaccccaa 28140 tcaaaccaac gtagtgcccc ccgcattaca tttggtggac ccacagattc aactgacaat 28200 aaccagaatg gaggacgcaa tggggcaagg ccaaaacagc gccgacccca aggtttaccc 28260 aataatactg cgtcttggtt cacagctctc actcagcatg gcaaggagga acttagattc 28320 cctcgaggcc agggcgttcc aatcaacacc aatagtggtc cagatgacca aattggctac 28380 taccgaagag ctacccgacg agttcgtggt ggtgacggca aaatgaaaga gctcagcccc 28440 agatggtact tctattacct aggaactggc ccagaagctt cacttcccta cggcgctaac 28500 aaagaaggca tcgtatgggt tgcaactgag ggagccttga atacacccaa agaccacatt 28560 ggcacccgca atcctaataa caatgctgcc accgtgctac aacttcctca aggaacaaca 28620 ttgccaaaag gcttctacgc agagggaagc agaggcggca gtcaagcctc ttctcgctcc 28680 tcatcacgta gtcgcggtaa ttcaagaaat tcaactcctg gcagcagtag gggaaattct 28740 cctgctcgaa tggctagcgg aggtggtgaa actgccctcg cgctattgct gctagacaga 28800 ttgaaccagc ttgagagcaa agtttctggt aaaggccaac aacaacaagg ccaaactgtc 28860 actaagaaat ctgctgctga ggcatctaaa aagcctcgcc aaaaacgtac tgccacaaaa 28920 cagtacaacg tcactcaagc atttgggaga cgtggtccag aacaaaccca aggaaatttc 28980 ggggaccaag acctaatcag acaaggaact gattacaaac attggccgca aattgcacaa 29040 tttgctccaa gtgcctctgc attctttgga atgtcacgca ttggcatgga agtcacacct 29100 tcgggaacat ggctgactta tcatggagcc attaaattgg atgacaaaga tccacaattc 29160 aaagacaacg tcatactgct gaacaagcac attgacgcat acaaaacatt cccaccaaca 29220 gagcctaaaa aggacaaaaa gaaaaagact gatgaagctc agcctttgcc gcagagacaa 29280 aagaagcagc ccactgtgac tcttcttcct gcggctgaca tggatgattt ctccagacaa 29340 cttcaaaatt ccatgagtgg agcttctgct gattcaactc aggcataaac actcatgatg 29400 accacacaag gcagatgggc tatgtaaacg ttttcgcaat tccgtttacg atacatagtc 29460 tactcttgtg cagaatgaat tctcgtaact aaacagcaca agtaggttta gttaacttta 29520 atctcacata gcaatcttta atcaatgtgt aacattaggg aggacttgaa agagccacca 29580 cattttcatc gaggccacgc ggagtacgat cgagggtaca gtgaataatg ctagggagag 29640 ctgcctatat ggaagagccc taatgtgtaa aattaatttt agtagtgcta tccccatgtg 29700 attttaatag cttcttagga gaatgacaaa aaaaaaaaaa aaaaaaaaaa a 29751 <210> 42 <211> 29751 <212> DNA <213> Unknown <220> <223> synthetic <400> 42 atattaggtt tttacctacc caggaaaagc caaccaacct cgatctcttg tagatctgtt 60 ctctaaacga actttaaaat ctgtgtagct gtcgctcggc tgcatgccta gtgcacctac 120 gcagtataaa caataataaa ttttactgtc gttgacaaga aacgagtaac tcgtccctct 180 tctgcagact gcttacggtt tcgtccgtgt tgcagtcgat catcagcata cctaggtttc 240 gtccgggtgt gaccgaaagg taagatggag tcattagtgt taggcgttaa cgaaaaaact 300 cacgttcaat tgtcactacc agtgttacag gttagagacg tactcgttag ggggttcggt 360 gattcagtcg aagaggcact atccgaagct agagagcatc ttaaaaacgg tacatgcgga 420 ttagtcgaac tcgaaaaagg cgtactacca caattggagc aaccatacgt ttttattaaa 480 cggtctgacg cacttagtac taatcacggt cataaggtag tcgagttagt cgccgaaatg 540 gacggtattc aatacggtag gtcaggtatt acactcggag tgttagtgcc acacgtaggc 600 gaaacaccta tcgcttatcg taacgttcta ttgcgtaaaa acggtaataa gggcgcaggc 660 ggacattcat acggtatcga tcttaagtca tacgatttag gcgacgaact cggtacggat 720 ccaatcgaag attacgaaca gaattggaat actaaacacg gatctggcgc attacgcgaa 780 cttacacgcg aacttaacgg aggcgcagtg actagatacg tcgataataa tttttgcggt 840 ccagacggat atccactcga ttgtattaag gattttctcg ctagggcagg taagtctatg 900 tgtacactta gcgaacaact cgattatatc gaatctaaaa gaggcgtata ttgttgtcgc 960 gatcacgaac acgaaatcgc ttggtttact gagcgatctg ataagtcata cgaacatcag 1020 actccattcg aaattaagtc tgctaaaaaa ttcgatactt ttaaaggcga atgtcctaaa 1080 ttcgtttttc cacttaactc taaggttaag gttattcaac ctagagtcga aaaaaaaaaa 1140 actgagggtt ttatgggtag gattaggtca gtgtatccag tcgctagtcc acaagagtgt 1200 aataatatgc atctatctac acttatgaaa tgtaatcatt gtgacgaagt gtcatggcaa 1260 acatgcgatt tccttaaggc tacatgcgaa cattgcggta ccgaaaatct cgtaatcgag 1320 ggacctacta catgcggata cttacctact aacgcagtcg ttaaaatgcc atgtccagct 1380 tgtcaggatc cagagatagg tccagagcat agcgttgccg attatcataa tcattctaat 1440 atcgaaacta gattgcgtaa aggcggtagg acacgttgtt tcggcggatg cgtattcgca 1500 tacgtaggtt gttataataa gagagcgtat tgggtgccta gagctagtgc cgatatcggt 1560 agcggacata ccggtattac aggcgataac gttgagacac ttaacgagga tctgttagag 1620 attctatcac gcgaacgcgt taatattaac atagtcggcg attttcatct taacgaagag 1680 gtcgctatta tactcgctag tttttccgct agtacatccg cttttatcga tactattaag 1740 tctcttgact ataagtcttt taaaactatc gttgagtcat gcggtaatta taaggttact 1800 aagggtaagc cagtgaaagg cgcatggaat atcggtcagc aacgttcagt gcttacacca 1860 ctatgcggtt ttcctagtca agccgcaggc gtaattagat ctattttcgc acgtacactt 1920 gacgctgcta atcattctat tcccgatctg caacgtgctg ccgttacgat actcgacggt 1980 attagcgaac agtcacttag actcgttgac gctatggtgt atacatccga tctgttaacg 2040 aatagtgtga ttattatggc ttacgttaca ggcggattag tgcaacagac tagtcaatgg 2100 ttgtctaatc tgttaggtac tacagtcgaa aaattgcgac ctattttcga atggattgag 2160 gctaaattgt ctgccggagt cgaattcctt aaagacgctt gggagatact taaatttctg 2220 attaccggcg tattcgatat cgttaagggt cagattcagg tcgctagcga taatattaag 2280 gattgcgtta agtgttttat cgacgtagtg aataaggcac tcgaaatgtg tatcgatcag 2340 gttacaattg ccggagctaa gcttagatca cttaacttag gcgaagtgtt tatcgctcaa 2400 tctaagggat tgtatcgtca atgtatacgc ggtaaggagc aattgcaatt gcttatgcca 2460 cttaaggctc ctaaagaggt tacattcctt gagggcgatt cacacgatac agtgcttact 2520 agcgaagagg ttgtgcttaa aaacggcgaa ctcgaagcac ttgagacacc agtcgattct 2580 tttactaacg gcgcaatcgt aggtacaccc gtatgcgtta acggtcttat gttgcttgag 2640 attaaggata aagagcaata ttgcgcactt agtccaggtc tgttagcgac taataacgtt 2700 tttagactta agggaggcgc acctattaaa ggcgttacat tcggtgagga tacagtttgg 2760 gaagtgcaag ggtataaaaa cgttaggatt acattcgaac tcgacgaacg tgtcgataag 2820 gtacttaacg aaaagtgtag cgtatataca gtcgaatccg gtactgaggt tactgagttc 2880 gcatgcgtag tcgctgaggc agtcgttaag acattgcaac cggttagcga tctgttaact 2940 aatatgggta tcgatcttga cgaatggtca gtcgctactt tttatctatt cgatgacgct 3000 ggcgaagaga atttttcgtc acgtatgtat tgttcttttt accctcctga cgaagaggaa 3060 gaggacgacg ctgaatgcga agaggaagag atagacgaaa catgcgaaca cgaatacggt 3120 acggaagacg attatcaggg attgccactc gaattcggcg ctagcgctga gactgttaga 3180 gtcgaagagg aagaggaaga ggattggtta gacgatacta ctgagcaatc cgaaatcgaa 3240 cccgaacccg aacctacacc tgaggaaccc gttaatcaat ttacagggta tcttaagctt 3300 accgataacg ttgcgattaa atgcgttgat atcgttaaag aggctcaatc cgctaatcct 3360 atggtaatcg ttaacgctgc taatatacat cttaagcatg gcggaggcgt tgcaggcgca 3420 cttaataagg ctactaacgg cgctatgcaa aaagagtctg acgattatat taagcttaac 3480 ggtccactta ccgtaggcgg atcatgtcta ttgtcaggtc ataatctcgc taaaaaatgt 3540 cttcacgtag tcggacctaa tcttaacgct ggcgaagaca tacaattgct taaagccgca 3600 tacgagaatt ttaattcgca agacatattg ctcgcaccac tgttatccgc aggtattttc 3660 ggagctaaac cattgcaatc attgcaggta tgcgttcaga cagtgcgtac acaggtatat 3720 atcgcagtta acgataaggc actatacgaa caggtcgtta tggattatct cgataatctt 3780 aagcctagag tcgaagctcc taaacaggaa gagccaccta atactgagga ttctaagact 3840 gaggaaaaat ccgttgtgca aaaaccagtc gacgttaagc ctaaaattaa ggcatgtatt 3900 gacgaagtga ctactacact tgaggagact aagtttctta ctaataagtt actgttattc 3960 gctgatatta acggtaagtt gtatcacgat tcacagaata tgcttagagg cgaagatatg 4020 tcttttctcg aaaaagacgc tccatatatg gtaggcgacg ttattacatc tggcgatatt 4080 acatgcgtag tgatacctag taaaaaagcc ggaggtacta ccgaaatgct atcacgtgca 4140 cttaaaaaag tgccagtcga cgaatacatt actacttatc ccggtcaggg atgcgcaggt 4200 tatacactcg aagaggctaa aaccgcactt aaaaaatgta aatccgcttt ttacgttctg 4260 ccatctgagg cacctaacgc taaagaggag atactcggta cagtgtcatg gaatttacgc 4320 gaaatgcttg cgcatgccga agagacacgt aagcttatgc ctatttgtat ggacgttagg 4380 gctattatgg ctactattca acgtaagtat aagggtatta agattcaaga gggtatagtc 4440 gattacggag tgagattttt tttttataca tctaaagagc cagtcgctag tattattact 4500 aagcttaact cacttaacga accattagtg actatgccta tcggatacgt tacacacggt 4560 tttaatctcg aagaggccgc tagatgtatg cgatcactta aggcaccagc cgtagtgtca 4620 gtgtcatcac ctgacgccgt tactacttat aacggatacc ttacatctag ttctaagact 4680 agtgaggaac atttcgttga gacagtgtca cttgccggtt catatcgcga ttggtcttat 4740 tcaggtcaac gtactgagtt aggcgttgag tttcttaaac gcggagataa gatagtgtat 4800 catacacttg agtcaccagt cgagtttcac ttagacggcg aagtgcttag tctcgataag 4860 cttaagtctc tattgtcact tagagaggtt aagactatta aagtgtttac tacagtcgat 4920 aatactaatc tgcatacaca gttagtcgat atgtctatga catacggtca gcaattcgga 4980 cctacttatc ttgacggtgc agacgttact aagattaagc ctcacgttaa tcacgaaggt 5040 aagacttttt tcgtattgcc atctgacgat acacttagat ccgaagcatt cgaatactat 5100 catacacttg acgaatcttt tctcggtagg tatatgtcag cacttaacca tacaaaaaaa 5160 tggaaattcc cacaggtagg cggacttaca tctattaaat gggccgataa taattgttat 5220 ctgtcatcag tgttactcgc attgcagcaa ctcgaagtga aatttaacgc tcctgcattg 5280 caagaggcat actatagggc tagagccggt gacgctgcta atttttgcgc acttatactc 5340 gcatactcta ataaaaccgt aggcgaactc ggtgacgtta gagagactat gacacatcta 5400 ttgcaacacg ctaatctcga atccgctaaa agagtgctta acgtagtgtg taaacattgc 5460 ggtcagaaaa ctactacact taccggagtc gaagccgtta tgtatatggg tacactatca 5520 tacgataatc ttaaaaccgg agtgtcaatt ccatgcgtat gcggtaggga cgctacacaa 5580 tacttagtgc aacaagagtc tagtttcgtt atgatgtcag ctccacctgc cgaatacaaa 5640 ttgcaacagg gtacattctt atgcgctaac gagtataccg gtaattatca atgcggtcat 5700 tatacacata ttaccgctaa agagacattg tatcgtatag acggtgcaca tcttactaaa 5760 atgtctgagt ataagggtcc agttactgac gttttttaca aagagactag ttatactact 5820 actattaaac cggttagtta taagttagac ggagtgactt ataccgaaat cgaacctaag 5880 ttagacggat actataaaaa agataacgct tattataccg aacagccaat cgatttagtg 5940 cctacacaac cattgcctaa cgctagtttc gataatttta agcttacatg ttctaatact 6000 aaattcgcag acgatcttaa tcagatgacc ggttttacta agcctgctag tagagagtta 6060 tccgttactt tttttcccga tcttaacggt gacgtagtcg caatcgatta tcgtcattac 6120 tctgctagtt ttaaaaaagg cgctaagcta ttgcataaac ctatcgtttg gcatattaat 6180 caggctacta ctaagactac ttttaaacct aatacttggt gtcttagatg tctttggtct 6240 actaagccag tcgatacatc taattcattc gaagtgcttg cagtcgagga tacacagggt 6300 atggataatc tcgcatgcga atcgcaacaa cctacatccg aagaggtagt cgagaatcct 6360 acaattcaga aagaggtaat cgaatgcgac gttaagacta ccgaagtggt aggtaacgtt 6420 atacttaaac cgtctgacga aggcgttaag gttacgcaag agttaggcca tgaggatctt 6480 atggccgcat acgttgagaa tacatctatt actattaaaa aacctaacga actatcactc 6540 gcattaggtc ttaagactat cgctacacac ggtatagccg ctattaattc ggttccatgg 6600 tctaagatac tcgcatacgt taagcctttt ctcggtcaag ccgctattac tacatctaat 6660 tgcgctaaac gacttgcgca acgcgttttt aataattata tgccatacgt ttttacattg 6720 ctttttcaat tgtgtacttt tactaagtct actaactcac gtatacgcgc tagtctacct 6780 actactatcg ctaaaaattc cgttaaatcc gttgcgaaat tgtgtcttga cgcaggtatt 6840 aattacgtta agtcacctaa attttctaaa ttgtttacaa tcgctatgtg gttactgtta 6900 ttgtctattt gtctcggttc attgatttgc gttaccgctg cattcggagt gttactatct 6960 aatttcggcg cacctagtta ttgtaacgga gtgagagagt tgtatctgaa tagttctaac 7020 gttactacta tggatttttg cgaaggatct tttccatgtt caatttgtct atctggtctc 7080 gattcactcg attcatatcc cgctctcgaa actattcagg ttacgattag ttcttataaa 7140 ctcgatctta ctatactcgg tctagccgct gaatgggtgt tagcgtatat gctttttact 7200 aagttttttt acttactcgg tctatccgct attatgcaag tgtttttcgg atatttcgct 7260 agtcatttta tttctaatag ttggcttatg tggtttatta tttcgattgt gcaaatggca 7320 ccagttagcg ctatggtacg tatgtatatt tttttcgcta gtttttacta tatttggaaa 7380 tcatacgttc atattatgga cggatgtaca tctagtacat gtatgatgtg ttataaacgt 7440 aatcgcgcta ctagagtcga gtgtactact atcgttaacg gtatgaaacg atctttttac 7500 gtttacgcta acggaggtag ggggttttgt aagactcata attggaattg tcttaattgc 7560 gatacttttt gtaccggtag tacttttatt tctgacgaag tcgcacgcga tctatcattg 7620 caatttaaac gtccaattaa ccctaccgat caatctagtt atatagtcga tagcgttgcg 7680 gttaaaaacg gcgcattgca tctatatttc gataaagccg gtcagaaaac atacgaacgt 7740 catccactat cacatttcgt taacttagac aatcttaggg ctaataatac taagggtagt 7800 ctgccaatta acgtaatcgt attcgacggt aagtctaaat gcgacgaatc cgctagtaag 7860 tctgctagtg tgtattactc tcagcttatg tgtcaaccta tactgttact cgatcaggca 7920 ttagtgtcag acgtaggcga tagtactgag gttagcgtta aaatgttcga cgcttacgtc 7980 gatactttta gcgctacatt ctcagtgcct atggagaaac ttaaggcatt agtcgctacc 8040 gctcattctg agttagcgaa aggcgttgcg ttagacggag tgctatctac attcgtatct 8100 gccgctagac agggcgtagt cgatactgac gtcgatacta aagacgtaat cgaatgtctt 8160 aagctatcac atcattccga tcttgaggtt acaggcgatt catgtaataa ttttatgctt 8220 acatataata aggtcgagaa tatgacacct agagacttag gcgcatgtat cgattgtaac 8280 gctagacata ttaacgctca ggttgcgaaa tcacataacg tatcattgat ttggaacgtt 8340 aaagactata tgtcactatc tgagcaattg cgtaaacaga tacgatccgc tgctaaaaaa 8400 aataatatac cgtttagact tacatgcgct actactagac aggtcgttaa cgttattact 8460 actaagatta gtcttaaggg aggtaagatc gttagtacat gttttaagct tatgcttaag 8520 gctacactgt tatgcgtact cgctgcactc gtatgttata tcgttatgcc agtgcataca 8580 ctatctattc acgacggata tactaacgaa attatcggat ataaggctat tcaagacgga 8640 gtgacacgcg atattattag tactgacgat tgtttcgcta ataaacacgc tggattcgac 8700 gcttggtttt cgcaacgcgg agggtcatat aaaaacgata agtcatgtcc agtcgttgcc 8760 gctattatta cacgcgaaat cggattcata gtgccagggt tacccggtac agtgttgcgt 8820 gctattaacg gcgatttttt gcattttctg ccacgcgttt ttagcgcagt cggtaatatt 8880 tgttatacac ctagtaagtt aatcgaatac tctgatttcg ctactagcgc atgcgtactt 8940 gccgctgagt gtactatttt taaagacgct atgggtaagc cagtgccata ttgttacgat 9000 actaatctgt tagagggatc tatttcatac tctgagttgc gacctgatac taggtacgta 9060 cttatggacg gatctattat tcaattccct aatacttatc ttgagggatc cgttagagtc 9120 gttactacat tcgacgctga gtattgtaga cacggtacat gcgaacgatc tgaggtcggt 9180 atttgtctat ctacatctgg tagatgggta cttaataacg aacattatcg cgcactatct 9240 ggcgtttttt gcggcgtaga cgctatgaat cttatcgcta atatttttac accattagtg 9300 caaccagtcg gcgcacttga cgtatccgct agcgtagtcg caggcggtat tatcgctata 9360 ctcgttacat gcgctgcata ctattttatg aaatttcgta gggtattcgg tgagtataat 9420 cacgtagtcg ctgctaacgc tctattattc cttatgtctt ttacgatact gtgtctcgta 9480 cctgcatact cttttctgcc aggcgtatac tctgtgtttt atctgtatct tacattttac 9540 tttactaacg acgtttcgtt tctcgcacat ctgcaatggt tcgctatgtt ttcacctata 9600 gtgccatttt ggattaccgc tatttacgtt ttttgtattt cgcttaagca ttgtcattgg 9660 ttttttaata attatttgcg taaacgcgtt atgtttaacg gagtgacttt ttcgacattc 9720 gaagaggccg cactttgtac ttttctgctt aataaagaga tgtatcttaa gttacggtct 9780 gagacactgt taccacttac acaatacaat aggtatctcg cactatataa taagtataag 9840 tatttttcag gcgcactcga tactacatct tatcgcgaag ccgcatgttg tcatctcgct 9900 aaagcgctta acgatttttc taactctggc gcagacgtac tgtatcaacc tccacaaaca 9960 tctattacgt ctgccgtact gcaatccggt tttcgtaaaa tggcttttcc atcaggtaag 10020 gtcgagggat gtatggtgca agttacatgc ggtactacta cacttaacgg tctatggtta 10080 gacgatacgg tttattgtcc tagacacgtt atttgtactg ccgaagatat gcttaaccct 10140 aattacgaag acttactgat acgtaaatct aatcactctt ttttagtgca agccggtaac 10200 gttcaattgc gcgttatcgg tcattctatg caaaattgtc tgttacgtct taaagtcgat 10260 acatctaatc ctaaaactcc taagtataaa ttcgttagga ttcaacccgg tcagacattc 10320 tcagtactcg catgttataa cggttcacct agcggagtgt atcaatgcgc tatgcgacct 10380 aatcatacaa ttaagggatc ttttcttaac ggttcatgcg gatcagtcgg ttttaatatc 10440 gattacgatt gcgttagttt ttgttatatg catcatatgg agttacctac aggcgtacac 10500 gctggtactg atcttgaggg taagttttac ggtccattcg ttgatcgtca aaccgctcaa 10560 gccgcaggta ccgatactac tattacactt aacgtactcg catggttata cgctgccgtt 10620 attaacggcg atagatggtt tcttaataga tttactacta cacttaacga ttttaactta 10680 gtcgctatga aatataatta cgaaccactt acacaggatc acgtcgatat actcggtcca 10740 cttagtgcgc aaaccggtat agccgtactc gatatgtgcg ctgcacttaa agagttactg 10800 caaaacggta tgaacggtag gactatactc ggtagtacta tactcgaaga cgaatttaca 10860 ccattcgacg tcgttagaca gtgttcaggc gttacatttc agggtaagtt taaaaaaatc 10920 gttaagggta cacatcattg gatgttgctt acattcctta ctagtctatt gatactcgta 10980 caatctacac aatggtcatt gttttttttc gtatacgaaa acgctttttt gccttttaca 11040 ctcggtatta tggctatagc cgcatgcgct atgttgttag tgaaacataa acacgcattc 11100 ttatgtctat tcctattgcc tagtctcgct acagtcgcat actttaatat ggtgtatatg 11160 cctgctagtt gggttatgcg tattatgact tggcttgagt tagccgatac atctctatct 11220 ggttatagac ttaaggattg cgttatgtac gctagtgcat tagtgttact gatacttatg 11280 actgcacgta cagtttacga cgacgctgct agacgcgttt ggacacttat gaacgttatt 11340 acacttgtgt ataaagtgta ttacggtaac gctctcgatc aggctattag tatgtgggca 11400 ttagtgatat ccgttacgtc taattactct ggagtcgtta cgactattat gtttctcgct 11460 agggctatcg tattcgtatg cgttgagtat tatccactat tgtttattac cggtaataca 11520 ttgcaatgta ttatgttagt gtattgtttt ttagggtatt gttgttgttg ttatttcgga 11580 ttgttttgtc tacttaatag gtattttaga cttacattag gcgtatacga ttatctcgtt 11640 agtacgcaag agtttagata tatgaattca cagggactgt taccacctaa atcttcaatc 11700 gacgctttta agcttaacat taagttactc ggtataggcg gtaagccttg tattaaggtt 11760 gcgacagtgc aatctaaaat gtctgacgtt aagtgtacta gtgtcgtact gttatcagtg 11820 ttacagcaat tgcgagtcga atctagttct aaattgtggg ctcaatgcgt tcaattgcat 11880 aacgatatct tactcgctaa ggatactact gaggcattcg aaaaaatggt tagtctgtta 11940 agcgtactgt tatctatgca aggcgcagtc gatattaatc gattatgcga agagatgtta 12000 gacaataggg ctacattgca ggctattgcg tcagagtttt ctagtctgcc atcatacgct 12060 gcatacgcta ccgctcaaga ggcatacgaa caggcagtcg ctaacggcga ttctgaggta 12120 gtgcttaaaa aacttaaaaa atcacttaac gttgcgaaat ctgagttcga tagagacgct 12180 gctatgcaac gtaaactcga aaaaatggcc gatcaggcta tgacacaaat gtataaacag 12240 gctagatctg aggataagcg tgctaaggtt acatccgcta tgcaaactat gttgtttact 12300 atgttgcgta aactcgataa cgacgcactt aacaatatta ttaataacgc tagagacgga 12360 tgcgtaccac ttaatattat accgcttact actgccgcta agcttatggt agtcgttccc 12420 gattacggta cttataagaa tacatgcgac ggtaatactt ttacatacgc tagtgcattg 12480 tgggagattc aacaggtcgt tgacgctgat tctaaaatcg ttcaattgtc tgagattaat 12540 atggataact cacctaatct cgcatggcca ttaatcgtta cagcgttacg cgctaactct 12600 gccgttaagt tacagaataa cgaattgtca ccagtcgcat tgcgtcaaat gtcatgcgct 12660 gccggtacta cacaaaccgc ttgtactgac gataacgctc tcgcatacta taataactct 12720 aaaggcggta gattcgtact cgcactatta tccgatcatc aggatcttaa atgggctaga 12780 ttccctaagt ctgacggtac aggtacaatt tataccgaac tcgaaccacc atgtagattc 12840 gttaccgata cacctaaggg acctaaggtt aagtatctat actttattaa gggactgaat 12900 aatctgaata ggggtatggt gttagggtca ctcgcagcta ccgttagatt gcaagccggt 12960 aacgctactg aggttcccgc taactcaacc gtacttagtt tttgcgcatt cgcagtcgat 13020 ccagctaagg cttataagga ttacttagct agcggaggtc aacctattac taattgcgtt 13080 aaaatgctat gtacacatac cggtacaggt caggctatta cggttacacc tgaggctaat 13140 atggatcagg agtcattcgg aggcgcatca tgttgtctat attgtagatg tcatatcgat 13200 catcctaatc ctaagggttt ttgcgatctt aagggtaagt acgttcagat tcctactaca 13260 tgcgctaacg atccagtcgg ttttacattg cgtaataccg tttgtacagt atgcggtatg 13320 tggaaaggtt acggatgttc atgcgatcag ttacgcgaac cacttatgca atccgctgac 13380 gctagtacat tccttaatgg gtttgcggtg taagtgccgc tagattgact ccatgcggta 13440 caggtactag tactgacgta gtgtatcgcg cattcgatat ttataacgaa aaggttgccg 13500 gattcgctaa attccttaag actaattgtt gtagatttca ggaaaaagac gaagagggta 13560 atctgttaga ctcatatttc gtagtgaaac gtcatactat gtctaattat caacacgaag 13620 agactattta taatctcgtt aaggattgtc cagccgttgc ggtacacgat ttttttaaat 13680 ttagagtcga cggtgatatg gtgccacata tttctagaca gagattgact aagtatacta 13740 tggccgatct agtttacgct cttagacatt tcgacgaagg taattgcgat acacttaaag 13800 agatactcgt tacatataat tgttgcgacg acgattactt taataaaaaa gattggtacg 13860 atttcgttga gaatcccgat atacttaggg tttacgctaa cttaggcgaa cgcgttagac 13920 agtcattgct taagacagtg caattttgcg acgctatgcg tgacgcaggt atagtcggcg 13980 tacttacact cgataatcag gatcttaacg gtaattggta cgatttcggc gatttcgttc 14040 aggtcgcacc aggttgcgga gtgcctatag tcgattcata ctattcattg cttatgccta 14100 tacttacact tacacgtgca cttgccgctg agtcacatat ggacgctgat ctcgctaaac 14160 cattgattaa atgggatcta cttaaatacg attttactga ggaacgattg tgtctattcg 14220 ataggtattt taagtattgg gatcagactt atcatcctaa ttgtattaat tgtcttgacg 14280 atagatgtat actgcattgc gctaatttta acgtattgtt ctcaaccgta ttcccaccta 14340 catcattcgg tccactcgta cgtaagattt tcgttgacgg cgtaccattc gtagtgtcaa 14400 ccggttatca ttttagagag ttaggcgtag tgcataatca ggacgttaat ctgcattcta 14460 gtagactatc ttttaaagag ttgttagtgt acgctgccga tccagctatg catgccgcta 14520 gcggtaatct gttactcgat aagcgtacta catgttttag cgttgccgca cttactaata 14580 acgttgcgtt tcagactgtt aaacccggta attttaataa ggatttttac gatttcgcag 14640 tgagtaaggg tttttttaaa gagggatcta gcgttgagct taagcatttt tttttcgctc 14700 aagacggtaa cgctgctatt agcgattacg attactatag atataatctg ccaactatgt 14760 gcgatatacg tcaattgttg ttcgtcgttg aggtagtcga taagtatttc gattgttacg 14820 acggaggttg tattaacgct aatcaggtaa tcgttaataa tctcgataag tctgccggat 14880 tcccattcaa taaatggggt aaggctagat tgtattacga ttctatgtca tacgaggatc 14940 aggacgctct attcgcatat actaagcgta acgttatacc gacaattacg caaatgaatc 15000 ttaaatacgc tattagcgct aaaaatcgtg cacgtacagt cgcaggcgta tcaatttgta 15060 gtactatgac taatcgtcaa tttcaccaaa aattgcttaa gtctattgcc gctactagag 15120 gcgctacagt cgttatcggt acatctaaat tttacggagg ttggcataat atgcttaaga 15180 cagtgtattc tgacgttgag actccacatc ttatgggttg ggattaccct aaatgcgata 15240 gggctatgcc taatatgttg cgtattatgg ctagtctcgt actcgcacgt aaacataata 15300 catgttgtaa tctatcacat agattctata gactcgctaa cgaatgcgct caagtgctta 15360 gcgaaatggt tatgtgtggc ggatcacttt acgttaagcc tggcggtaca tctagcggag 15420 acgctactac cgcttacgct aattccgttt ttaatatttg tcaagccgtt accgctaacg 15480 ttaacgctct attgtctact gacggtaata agattgccga taaatacgta cgtaatctgc 15540 aacatagatt gtacgaatgt ctgtatcgta atcgcgatgt cgatcacgaa ttcgttgacg 15600 aattttacgc ttacttacgt aaacattttt ctatgatgat tctatctgac gacgcagtcg 15660 tttgttataa ctctaattac gctgcacagg ggttagtcgc tagtattaag aattttaaag 15720 ccgtactgta ttatcagaat aacgttttta tgtctgaggc taagtgttgg accgaaaccg 15780 atctgactaa gggtccacac gaattttgtt cacagcatac tatgctcgtt aaacagggtg 15840 acgattacgt ttatctacca tatcccgatc cgtcacgtat attaggcgca ggttgtttcg 15900 ttgacgatat cgttaagact gacggtacac ttatgattga gagattcgtt agtctcgcaa 15960 tcgacgctta tccattgact aagcatccta atcaggaata cgctgacgtt tttcacttat 16020 acttacagta tatacgtaaa ttgcacgacg aacttacagg gcatatgctt gatatgtatt 16080 cggttatgct tactaacgat aatactagta ggtattggga acctgagttt tacgaagcta 16140 tgtatacacc acataccgta ctgcaagccg taggcgcatg cgtactatgt aattcacaga 16200 ctagtcttag atgtggcgca tgtatacgta gaccattctt atgttgtaag tgttgttacg 16260 atcacgttat tagtacatca cataagttag tgttatccgt taacccatac gtttgtaacg 16320 ctccaggttg cgacgttact gacgttacgc aattgtactt aggcggtatg tcatactatt 16380 gtaaatcaca taaacctcct attagttttc cgttatgcgc taacggtcag gtattcggtc 16440 tatataagaa tacatgcgta gggtctgata acgttaccga ttttaacgct atcgctacat 16500 gcgattggac taacgctggc gattatatac tcgctaatac atgtactgag cgacttaagt 16560 tattcgcagc cgaaacactt aaggctaccg aagagacttt taaattgtca tacggtatcg 16620 ctaccgtacg cgaagtgctt agcgatagag agttgcatct atcatgggag gtcggtaagc 16680 ctagaccacc acttaatcgt aattacgttt ttacagggta tcgggttact aagaattcga 16740 aagtgcaaat tggcgaatat acattcgaaa aaggcgatta cggtgacgcc gtagtgtata 16800 gaggtactac tacttataag cttaacgtag gcgattattt cgtacttaca tcacataccg 16860 ttatgccatt atccgctcct acattagtgc cacaagagca ttacgttagg attaccggat 16920 tgtatcctac acttaatatt tctgacgaat tttcatctaa cgttgcgaat tatcagaaag 16980 tgggtatgca aaaatactct acattgcagg gacctcccgg taccggtaag tctcatttcg 17040 caatcggact cgcattgtat tatcctagtg ctaggattgt gtataccgct tgttcacacg 17100 ctgcagtcga cgctctatgc gaaaaagctc ttaagtatct accaatcgat aagtgttcac 17160 gtattatacc cgctagggct agagtcgaat gtttcgataa gtttaaagtg aattcgacac 17220 tcgaacaata cgttttttgt acggttaacg ctctaccaga gactactgcc gatatcgtag 17280 tgttcgacga aatttctatg gctactaatt acgatctatc agtcgttaac gctagactta 17340 gggctaagca ttacgtttat ataggcgatc cagcgcaatt gcctgcacca cgtacattgt 17400 tgactaaggg tacactcgaa cctgagtatt ttaattcagt gtgtagactt atgaaaacta 17460 tcggacctga tatgtttctc ggtacatgtc gtagatgtcc tgccgaaata gtcgatacag 17520 ttagcgcact cgtatacgat aataagctta aggcacataa ggataagtct gcgcaatgtt 17580 ttaaaatgtt ttacaaaggc gtaattacac acgacgttag ttccgctatt aatagaccac 17640 agataggcgt agtgagagag tttcttacac gtaatcccgc ttggcgtaaa gccgttttta 17700 ttagtccata taactctcaa aacgcagtcg ctagtaagat actcggattg cctacacaga 17760 cagtcgattc tagtcagggt agcgaatacg attacgttat ttttacgcaa actaccgaaa 17820 ccgctcattc atgtaacgtt aatagattta acgttgcgat tactagggct aaaatcggta 17880 ttctatgtat tatgtctgat cgcgatctat acgataagtt gcaatttaca tcacttgaga 17940 tacctagacg taacgttgcg acattgcaag ccgaaaacgt taccggattg tttaaggatt 18000 gttctaagat tattaccgga ttgcatccta cacaggcacc tacacatcta tcagtcgata 18060 ttaagtttaa gactgagggt ctatgcgttg acatacccgg tatacctaag gatatgactt 18120 atcgtagatt gattagtatg atgggtttta aaatgaatta tcaggttaac ggttatccta 18180 atatgtttat tacacgcgaa gaggctatta gacacgttag ggcttggata gggttcgacg 18240 ttgagggatg tcacgctaca cgtgacgcag tcggtactaa tctgccattg caattagggt 18300 tttcgacagg cgttaatctg gttgccgtac ctaccggata cgtcgatact gagaataata 18360 ctgagtttac tagggttaac gctaaacctc cacctggcga tcaatttaaa catctgattc 18420 cacttatgta taagggattg ccttggaacg tagtgcgtat taagattgtg caaatgctta 18480 gcgatacact taagggattg tctgataggg ttgtgttcgt actttgggct cacggattcg 18540 aattgacatc tatgaaatat ttcgttaaaa tcggacctga gcgtacatgt tgtctatgcg 18600 ataagcgtgc tacatgtttt agtacatcta gcgatacata cgcttgttgg aatcattcag 18660 tcggattcga ttacgtttat aatcctttta tgattgacgt tcagcaatgg gggtttaccg 18720 gtaatctgca atctaatcac gatcagcatt gtcaggtaca cggtaacgct cacgttgcgt 18780 catgcgacgc tattatgact agatgtcttg ccgtacacga atgtttcgtt aagagagtcg 18840 attggtcagt cgaataccct attataggcg acgaacttag ggttaattcc gcttgtcgta 18900 aagtgcaaca tatggtcgtt aagtctgctc tattagccga taagtttccc gtattgcacg 18960 atatcggtaa tcctaaagcg attaaatgcg taccacaagc cgaagtcgaa tggaaatttt 19020 acgacgctca accatgttct gataaggcat acaaaatcga agagttgttt tactcatacg 19080 ctacacatca cgataagttt actgacggcg tatgtctgtt ttggaattgt aacgttgata 19140 ggtatcccgc taacgctatc gtttgtagat tcgatactag ggttctatct aatctgaatc 19200 tgccaggttg cgatggcgga tcactatacg ttaataaaca cgcttttcat acacctgcat 19260 tcgataaatc cgcttttacg aatcttaagc aattgccttt tttttattac tctgatagtc 19320 catgcgaatc tcacggtaag caagtcgtta gcgatatcga ttacgttcca cttaaatccg 19380 ctacatgtat tacacgttgt aatctcggag gcgcagtttg tagacatcac gctaacgaat 19440 atcgtcaata cttagacgct tataatatga tgattagtgc cggtttttca ttgtggattt 19500 ataagcaatt cgatacttat aatctatgga atacttttac tagattgcaa tctctcgaaa 19560 acgttgcgta taacgtcgtt aataagggtc atttcgacgg tcacgctggc gaagctcccg 19620 tatcaattat taataacgca gtgtatacta aggtcgacgg tattgacgtc gagattttcg 19680 aaaataagac tacattaccc gttaacgttg cattcgaatt gtgggctaaa cgtaatatta 19740 aaccagtgcc agagattaag atacttaata acttaggcgt tgatatcgct gctaataccg 19800 ttatttggga ttataaacgc gaagctcctg cacatgtgtc aactataggc gtatgtacta 19860 tgactgatat cgctaaaaaa cctaccgaat ccgcttgttc atcacttaca gtgttattcg 19920 acggtagggt tgagggtcag gtcgatctgt ttcgtaacgc acgtaacggc gtactgatta 19980 ctgagggatc ggttaaggga ttgacaccta gtaagggacc tgctcaagct agcgttaacg 20040 gagtgacact tataggcgaa tcagttaaga ctcaatttaa ttactttaaa aaagtcgacg 20100 gtattattca acagttacca gagacttatt ttacacaatc acgcgatctt gaggatttta 20160 aacctagatc tcaaatggag actgattttc tcgaactcgc tatggacgaa tttattcaac 20220 gatataagct tgagggatac gcattcgaac atatcgttta cggcgatttt tcacacggtc 20280 agttaggcgg attgcatctt atgatcggtc tagctaaacg atcacaggat agtccactta 20340 agcttgagga ttttatacct atggattcaa ccgttaagaa ttactttatt accgatgcgc 20400 aaaccggttc atctaaatgc gtttgtagcg taatcgattt actgttagac gatttcgttg 20460 agattattaa gtctcaggat ctatcagtga ttagtaaggt agtgaaagtg acaatcgatt 20520 acgctgagat ttcttttatg ctttggtgta aagacggtca cgttgagact ttttacccta 20580 aattgcaggc tagtcaggca tggcaacctg gagtcgctat gcctaatttg tataaaatgc 20640 aacgtatgtt actcgaaaaa tgcgatctgc aaaattacgg tgagaacgca gtgataccta 20700 agggtattat gatgaacgtc gctaagtata cacaattgtg tcaatacctt aatacactta 20760 cacttgccgt accatataat atgcgagtga tacatttcgg agccggatct gataagggcg 20820 ttgcgccagg tactgccgta ttgcgtcaat ggttgcctac cggtacactg ttagtcgatt 20880 ccgatcttaa cgatttcgta tctgacgctg atagtacact tataggcgat tgcgctacag 20940 tgcataccgc taataaatgg gatctgatta ttagcgatat gtacgatcca cgtactaaac 21000 acgttacgaa agagaacgat tctaaagagg gtttttttac atatctatgc ggttttatta 21060 aacagaaact cgcattaggc ggatctattg ccgttaagat tactgagcat agttggaacg 21120 ctgatctgta taagcttatg ggtcatttta gttggtggac cgcattcgtt actaacgtta 21180 acgctagttc tagcgaagca ttcttaatcg gcgctaatta tctcggtaag cctaaagagc 21240 aaatcgacgg atatactatg cacgctaatt atattttttg gcgtaatact aatcctattc 21300 aattgtctag ttattcattg ttcgatatgt ctaaatttcc acttaagtta cgcggtactg 21360 ccgttatgtc acttaaagag aatcagatta acgatatgat ttactcttta ctcgaaaagg 21420 gtaggttgat tatacgcgaa aataataggg tagtcgttag ttctgacata ctcgttaata 21480 attaaacgaa catgtttatt tttctgttat tccttacact tacatccggt tcagatctcg 21540 atagatgtac tacattcgac gacgttcagg cacctaatta tacacagcat acatctagta 21600 tgagaggcgt atactatcct gacgaaattt ttagatccga tacattgtat cttacacagg 21660 atctattctt acctttttac tctaacgtta cagggtttca tacaattaat catacattcg 21720 gtaatcccgt tataccgttt aaagacggta tttatttcgc agctaccgaa aaatctaacg 21780 tagtgagagg ttgggtattc ggtagtacta tgaataataa gtctcaatca gtgattatta 21840 ttaataattc gactaacgta gtgatacgcg catgtaattt cgaattgtgc gataatcctt 21900 ttttcgcagt gtctaaacct atgggtacac agactcatac tatgattttc gataacgctt 21960 ttaattgtac attcgaatat atttctgacg ctttttcact tgacgtatcc gaaaaatctg 22020 gtaattttaa acacttacgc gaattcgttt ttaaaaataa agacggtttt ttgtacgttt 22080 ataagggata ccaacctatc gacgtcgtta gggatctgcc atcaggtttt aatacactta 22140 agcctatttt taagttaccg ttaggcatta atattactaa ttttagagct atacttaccg 22200 cttttagtcc agctcaggat atttggggta ctagcgctgc cgcatatttc gtcggatatc 22260 ttaaacctac tacttttatg cttaaatacg acgaaaacgg tacaattact gacgcagtcg 22320 attgttcaca gaatccatta gccgaactta agtgttcagt taagtcattc gaaatcgata 22380 agggtattta tcagactagt aattttagag tcgtacctag cggtgacgta gtgagattcc 22440 ctaatattac gaatctatgt ccattcggcg aagtgtttaa cgctactaaa ttccctagcg 22500 tatacgcttg ggagcgtaaa aaaattagta attgcgttgc cgattactct gtgttgtata 22560 attcgacttt ttttagtact tttaagtgtt acggagtgtc agctactaag cttaacgatc 22620 tatgtttttc taacgtatac gctgattcat tcgtagtgaa aggcgatgac gttaggcaaa 22680 tcgctcccgg tcagactggc gtaatcgctg attataatta taagttacct gacgatttta 22740 tgggttgcgt actcgcatgg aatacacgta atatcgacgc tactagtacc ggtaattata 22800 attataagta tagatatctt agacacggta agcttagacc attcgaacgc gatatttcta 22860 acgtaccatt ctcacctgac ggtaagcctt gtacacctcc tgcacttaat tgttattggc 22920 cacttaacga ttacggtttt tacactacta ccggtatagg gtatcaacct tatagggtag 22980 tcgttctatc attcgaattg cttaacgctc cagctaccgt atgcggacct aaattgtcaa 23040 ccgatctgat taagaatcaa tgcgttaatt ttaattttaa cggtcttacc ggtacaggcg 23100 tacttacacc tagttctaaa cggtttcaac cttttcagca attcggtagg gacgttagcg 23160 attttaccga tagcgttagg gatcctaaaa ctagtgagat actcgatatt agtccatgcg 23220 cattcggagg cgtaagtgtg attactcccg gtactaacgc tagttctgag gttgccgtac 23280 tgtatcagga cgttaattgt actgacgtat caaccgctat acacgctgat caattgacac 23340 ctgcatggcg tatatactct accggtaata acgtttttca gacacaagcc ggttgtctga 23400 taggcgcaga gcatgtcgat acatcatacg aatgcgatat accgataggc gcaggtattt 23460 gcgctagtta tcatacagtg tcattgctta gatctactag tcagaaatca atcgttgcgt 23520 atactatgtc attaggcgct gatagttcaa tcgcatactc taataatact atcgctatac 23580 ctactaattt ttcaatttcg attactactg aggttatgcc agtgtctatg gctaagacta 23640 gtgtcgattg taatatgtat atttgtggcg attcaaccga atgcgctaat ctgttattgc 23700 aatacggatc tttttgtacg caattgaatc gtgcactatc aggtatagcc gctgaacagg 23760 atcgtaatac tagagaggta ttcgcacagg ttaaacagat gtataagact cctacactta 23820 agtatttcgg agggtttaat ttttcacaga ttttacccga tccacttaaa cctactaaac 23880 gatcttttat tgaggatctg ttattcaata aggttacact cgcagacgca ggttttatga 23940 aacaatacgg cgaatgttta ggcgatatta acgctaggga tctgatttgc gctcaaaaat 24000 ttaacggtct tacagtgtta ccaccactat tgactgacga tatgatagcc gcatatactg 24060 ccgcattagt gtcaggtacc gctaccgcag gttggacatt cggtgccggt gccgcattgc 24120 agattccatt cgctatgcaa atggcttata gatttaacgg tataggcgtt acgcaaaacg 24180 tactttacga gaatcagaaa caaatcgcta accaatttaa taaggctatt agtcagattc 24240 aagagtcact tactactact agtaccgcac tcggtaagtt gcaagacgtc gttaatcaga 24300 acgctcaggc acttaataca ctcgttaagc aattgtctag taatttcgga gctattagtt 24360 cagtgcttaa cgatattcta tctagactcg ataaggtcga agccgaagtg caaatcgata 24420 gattgattac cggtaggttg caatctctgc aaacatacgt tacgcaacaa ttgatacgcg 24480 ctgctgagat tagggctagc gctaatctcg cagctactaa aatgtctgag tgcgtactcg 24540 gtcaatctaa aagagtcgat ttttgcggta aggggtatca tcttatgtct tttccacaag 24600 ccgcaccaca cggagtggtt tttttacacg ttacatacgt acctagtcag gaacgtaatt 24660 ttactaccgc tccagctatt tgtcacgaag gtaaggcata ctttccacgc gaaggcgtat 24720 tcgtttttaa cggtacatca tggtttatta cgcaacgtaa tttttttagt ccacaaatta 24780 ttactactga taatacattc gttagcggta attgcgatgt cgttatcggt attattaata 24840 ataccgttta cgatccattg caacctgagt tagactcttt taaagaggaa ctcgataagt 24900 attttaaaaa tcatacatca cctgacgttg acttaggcga tatttcaggt attaacgctt 24960 cagtcgttaa tattcagaaa gagattgata gacttaacga agtcgctaaa aatcttaacg 25020 aatcacttat cgatctgcaa gagttaggta agtacgaaca gtatattaaa tggccttggt 25080 acgtttggtt agggtttata gccggtctaa tcgctatcgt tatggttacg atactgttat 25140 gttgtatgac atcatgttgt tcatgtctta aaggcgcatg ttcatgcgga tcatgttgta 25200 aattcgacga agacgattct gagccagtgc ttaagggagt gaaattgcat tatacataaa 25260 cgaacttatg gatttgttta tgagattttt tactcttaga tcaattactg cacagccagt 25320 aaaaattgac aatgcttctc ctgcaagtac tgttcatgct acagcaacga taccgctaca 25380 agcctcactc cctttcggat ggcttgttat tggcgttgca tttcttgctg tttttcagag 25440 cgctaccaaa ataattgcgc tcaataaaag atggcagcta gccctttata agggcttcca 25500 gttcatttgc aatttactgc tgctatttgt taccatctat tcacatcttt tgcttgtcgc 25560 tgcaggtatg gaggcgcaat ttttgtacct ctatgccttg atatattttc tacaatgcat 25620 caacgcatgt agaattatta tgagatgttg gctttgttgg aagtgcaaat ccaagaaccc 25680 attactttat gatgccaact actttgtttg ctggcacaca cataactatg actactgtat 25740 accatataac agtgtcacag atacaattgt cgttactgaa ggtgacggca tttcaacacc 25800 aaaactcaaa gaagactacc aaattggtgg ttattctgag gataggcact caggtgttaa 25860 agactatgtc gttgtacatg gctatttcac cgaagtttac taccagcttg agtctacaca 25920 aattactaca gacactggta ttgaaaatgc tacattcttc atctttaaca agcttgttaa 25980 agacccaccg aatgtgcaaa tacacacaat cgacggctct tcaggagttg ctaatccagc 26040 aatggatcca atttatgatg agccgacgac gactactagc gtgcctttgt aagcacaaga 26100 aagtgagtac gaacttatgt actcattcgt ttcggaagaa acaggtacgt taatagttaa 26160 tagcgtactt ctttttcttg ctttcgtggt attcttgcta gtcacactag ccatccttac 26220 tgcgcttcga ttgtgtgcgt actgctgcaa tattgttaac gtgagtttag taaaaccaac 26280 ggtttacgtc tactcgcgtg ttaaaaatct gaactcttct gaaggagttc ctgatcttct 26340 ggtctaaacg aactaactat tattattatt ctgtttggaa ctttaacatt gcttatcatg 26400 gccgataacg gtacaattac cgttgaggaa cttaaacagt tactcgaaca atggaatctc 26460 gtaatcggtt ttctgtttct cgcatggatt atgctattgc aattcgcata ctctaatcgt 26520 aatcggtttt tgtatattat taaactcgta ttcttatggt tattgtggcc agttacactc 26580 gcatgtttcg tactcgcagc cgtttatcgt attaattggg ttacaggcgg tatcgctatc 26640 gctatggctt gtatagtcgg acttatgtgg ttgtcttatt tcgttgcgtc atttagattg 26700 ttcgcacgta ctagatctat gtggtctttt aatcccgaaa ctaatatact gcttaacgta 26760 ccacttagag gtacaatcgt tactagacca cttatggagt ctgagttagt gataggcgca 26820 gtgattatta gggggcattt gcgtatggcc ggtcatagtc taggtagatg cgatattaag 26880 gatctaccta aagagattac cgttgcgact agtcgtacac tatcttatta taagttaggc 26940 gctagtcaac gtgtcggtac tgatagcgga ttcgcagctt ataataggta tcgtatcggt 27000 aattataagc ttaataccga tcacgctgga tctaacgata atatcgcatt actcgtacag 27060 taagtgacaa cagatgtttc atcttgttga cttccaggtt acaatagcag agatattgat 27120 tatcattatg aggactttca ggattgctat ttggaatctt gacgttataa taagttcaat 27180 agtgagacaa ttatttaagc ctctaactaa gaagaattat tcggagttag atgatgaaga 27240 acctatggag ttagattatc cataaaacga acatgaaaat tattctcttc ctgacattga 27300 ttgtatttac atcttgcgag ctatatcact atcaggagtg tgttagaggt acgactgtac 27360 tactaaaaga accttgccca tcaggaacat acgagggcaa ttcaccattt caccctcttg 27420 ctgacaataa atttgcacta acttgcacta gcacacactt tgcttttgct tgtgctgacg 27480 gtactcgaca tacctatcag ctgcgtgcaa gatcagtttc accaaaactt ttcatcagac 27540 aagaggaggt tcaacaagag ctctactcgc cactttttct cattgttgct gctctagtat 27600 ttttaatact ttgcttcacc attaagagaa agacagaatg aatgagctca ctttaattga 27660 cttctatttg tgctttttag cctttctgct attccttgtt ttaataatgc ttattatatt 27720 ttggttttca ctcgaaatcc aggatctaga agaaccttgt accaaagtct aaacgaacat 27780 gaaacttctc attgttttga cttgtatttc tctatgcagt tgcatatgca ctgtagtaca 27840 gcgctgtgca tctaataaac ctcatgtgct tgaagatcct tgtaaggtac aacactaggg 27900 gtaatactta tagcactgct tggctttgtg ctctaggaaa ggttttacct tttcatagat 27960 ggcacactat ggttcaaaca tgcacaccta atgttactat caactgtcaa gatccagctg 28020 gtggtgcgct tatagctagg tgttggtacc ttcatgaagg tcaccaaact gctgcattta 28080 gagacgtact tgttgtttta aataaacgaa caaattaaaa tgtctgataa tggaccccaa 28140 tcaaaccaac gtagtgcccc ccgcattaca tttggtggac ccacagattc aactgacaat 28200 aaccagaatg gaggacgcaa tggggcaagg ccaaaacagc gccgacccca aggtttaccc 28260 aataatactg cgtcttggtt cacagctctc actcagcatg gcaaggagga acttagattc 28320 cctcgaggcc agggcgttcc aatcaacacc aatagtggtc cagatgacca aattggctac 28380 taccgaagag ctacccgacg agttcgtggt ggtgacggca aaatgaaaga gctcagcccc 28440 agatggtact tctattacct aggaactggc ccagaagctt cacttcccta cggcgctaac 28500 aaagaaggca tcgtatgggt tgcaactgag ggagccttga atacacccaa agaccacatt 28560 ggcacccgca atcctaataa caatgctgcc accgtgctac aacttcctca aggaacaaca 28620 ttgccaaaag gcttctacgc agagggaagc agaggcggca gtcaagcctc ttctcgctcc 28680 tcatcacgta gtcgcggtaa ttcaagaaat tcaactcctg gcagcagtag gggaaattct 28740 cctgctcgaa tggctagcgg aggtggtgaa actgccctcg cgctattgct gctagacaga 28800 ttgaaccagc ttgagagcaa agtttctggt aaaggccaac aacaacaagg ccaaactgtc 28860 actaagaaat ctgctgctga ggcatctaaa aagcctcgcc aaaaacgtac tgccacaaaa 28920 cagtacaacg tcactcaagc atttgggaga cgtggtccag aacaaaccca aggaaatttc 28980 ggggaccaag acctaatcag acaaggaact gattacaaac attggccgca aattgcacaa 29040 tttgctccaa gtgcctctgc attctttgga atgtcacgca ttggcatgga agtcacacct 29100 tcgggaacat ggctgactta tcatggagcc attaaattgg atgacaaaga tccacaattc 29160 aaagacaacg tcatactgct gaacaagcac attgacgcat acaaaacatt cccaccaaca 29220 gagcctaaaa aggacaaaaa gaaaaagact gatgaagctc agcctttgcc gcagagacaa 29280 aagaagcagc ccactgtgac tcttcttcct gcggctgaca tggatgattt ctccagacaa 29340 cttcaaaatt ccatgagtgg agcttctgct gattcaactc aggcataaac actcatgatg 29400 accacacaag gcagatgggc tatgtaaacg ttttcgcaat tccgtttacg atacatagtc 29460 tactcttgtg cagaatgaat tctcgtaact aaacagcaca agtaggttta gttaacttta 29520 atctcacata gcaatcttta atcaatgtgt aacattaggg aggacttgaa agagccacca 29580 cattttcatc gaggccacgc ggagtacgat cgagggtaca gtgaataatg ctagggagag 29640 ctgcctatat ggaagagccc taatgtgtaa aattaatttt agtagtgcta tccccatgtg 29700 attttaatag cttcttagga gaatgacaaa aaaaaaaaaa aaaaaaaaaa a 29751

Claims (81)

  1. 모(parent) 바이러스의 모 단백질 코딩 서열의 코돈 쌍 편향보다 작은 코돈 쌍 편향을 가지고, 모 단백질 코딩 서열에 존재하는 동의(synonymous) 코돈을 재배열된 순서로 가지는, 변형된 단백질 코딩 서열이 포함된 바이러스 게놈을 포함하는 약독화(attenuated) 바이러스.
  2. 제1항에 있어서, 상기 변형된 단백질 코딩 서열이 상기 모 단백질 코딩 서열의 코돈 쌍 편향보다 0.05 이상 더 작은 코돈 쌍 편향을 가지는 것인 약독화 바이러스.
  3. 제1항에 있어서, 상기 변형된 단백질 코딩 서열이 상기 모 단백질 코딩 서열의 코돈 쌍 편향보다 0.1 이상 더 작은 코돈 쌍 편향을 가지는 것인 약독화 바이러스.
  4. 제1항에 있어서, 상기 변형된 단백질 코딩 서열이 상기 모 단백질 코딩 서열의 코돈 쌍 편향보다 0.2 이상 더 작은 코돈 쌍 편향을 가지는 것인 약독화 바이러스.
  5. 제1항에 있어서, 상기 변형된 단백질 코딩 서열이 -0.05 이하의 코돈 쌍 편향을 가지는 것인 약독화 바이러스.
  6. 제1항에 있어서, 상기 변형된 단백질 코딩 서열이 -0.1 이하의 코돈 쌍 편향을 가지는 것인 약독화 바이러스.
  7. 제1항에 있어서, 상기 변형된 단백질 코딩 서열이 -0.3 이하의 코돈 쌍 편향을 가지는 것인 약독화 바이러스.
  8. 제1항에 있어서, 상기 변형된 단백질 코딩 서열이 -0.4 이하의 코돈 쌍 편향을 가지는 것인 약독화 바이러스.
  9. 제1항에 있어서, 상기 변형된 단백질 코딩 서열이 모 바이러스의 단백질 코딩 서열과 90% 미만 동일한 것인 약독화 바이러스.
  10. 제1항에 있어서, 상기 변형된 단백질 코딩 서열이 모 바이러스의 단백질 코딩 서열과 80% 미만 동일한 것인 약독화 바이러스.
  11. 제1항에 있어서, 상기 변형된 단백질 코딩 서열과 모 단백질 코딩 서열이 동일한 단백질을 코딩하는 것인 약독화 바이러스.
  12. 제1항에 있어서, 상기 변형된 단백질 코딩 서열이 천연 분리주와 10개 이하의 아미노산이 다른 단백질을 코딩하는 것인 약독화 바이러스.
  13. 제1항에 있어서, 상기 변형된 단백질 코딩 서열이 천연 분리주와 20개 이하의 아미노산이 다른 단백질을 코딩하는 것인 약독화 바이러스.
  14. 제1항에 있어서, 상기 변형된 단백질 코딩 서열이 100개 이상의 뉴클레오티드의 길이에 걸쳐 변형된 것인 약독화 바이러스.
  15. 제1항에 있어서, 상기 변형된 단백질 코딩 서열이 500개 이상의 뉴클레오티드의 길이에 걸쳐 변형된 것인 약독화 바이러스.
  16. 제1항에 있어서, 상기 변형된 단백질 코딩 서열이 1000개 이상의 뉴클레오티드의 길이에 걸쳐 변형된 것인 약독화 바이러스.
  17. 제1항에 있어서, 상기 바이러스가 동물 또는 식물을 감염시키는 것인 약독화 바이러스.
  18. 제1항에 있어서, 상기 바이러스가 인간을 감염시키는 것인 약독화 바이러스.
  19. 제1항에 있어서, 상기 바이러스가 동물 숙주에서 보호 면역 반응을 유발하는 것인 약독화 바이러스.
  20. 제1항에 있어서, 숙주에서 증식될 때 상기 변형된 단백질 코딩 서열의 복귀(reversion)가 실질적으로 억제되는 것인 약독화 바이러스.
  21. 제1항에 있어서, 상기 바이러스가 이중 가닥 DNA 바이러스, 단일 가닥 DNA 바이러스, 이중 가닥 RNA 바이러스, 또는 단일 가닥 RNA 바이러스인 약독화 바이러스.
  22. 제1항에 있어서, 상기 단백질 코딩 서열이 다단백질을 코딩하는 것인 약독화 바이러스.
  23. 제1항에 있어서, 상기 단백질 코딩 서열이 캡시드 단백질을 코딩하는 것인 약독화 바이러스.
  24. 제1항에 있어서, 상기 바이러스가 폴리오바이러스, 리노바이러스, 인플루엔자 바이러스, 중증 급성 호흡기 증후군(SARS) 코로나바이러스, 인간 면역결핍 바이러스(HIV), C형 간염 바이러스(HCV), 감염성 기관지염 바이러스, 에볼라바이러스, 말부르크 바이러스, 뎅기열 바이러스, 웨스트 나일병 바이러스, 엡스타인-바 바이러스(EBV), 또는 황열 바이러스인 약독화 바이러스.
  25. 제1항에 있어서, 상기 바이러스가 수두 바이러스, 헤르페스 바이러스, 유두종 바이러스, 또는 아데노바이러스인 약독화 바이러스.
  26. 제24항에 있어서, 상기 약독화 폴리오바이러스가 폴리오바이러스 1형[마호니(Mahoney)], 폴리오바이러스 2형[랜싱(Lansing)], 폴리오바이러스 3형[레온(Leon)], 1가 경구용 폴리오바이러스 백신(OPV) 바이러스, 또는 3가 OPV 바이러스로부터 유래되는 것인 약독화 바이러스.
  27. 제1항에 있어서, 상기 변형된 단백질 코딩 서열 전반에 걸쳐 뉴클레오티드 치환이 분포되는 것인 약독화 바이러스.
  28. 제1항에 있어서, 상기 변형된 단백질 코딩 서열의 일부에 뉴클레오티드 치환이 한정되는 것인 약독화 바이러스.
  29. 제27항에 있어서, 상기 단백질 코딩 서열이 하나 이상의 캡시드 단백질을 코딩하는 것인 약독화 바이러스.
  30. 제1항 내지 제23항 및 제27항 내지 제29항 중 어느 한 항에 있어서, 상기 바이러스가 피코나바이러스인 약독화 바이러스.
  31. 제30항에 있어서, 상기 피코나바이러스가 폴리오바이러스인 약독화 바이러스.
  32. 제31항에 있어서, 상기 바이러스 게놈의 뉴클레오티드 서열이 서열 번호 4 또는 그 일부를 포함하는 것인 약독화 바이러스.
  33. 제31항에 있어서, 상기 바이러스 게놈의 뉴클레오티드 서열이 서열 번호 6을 포함하는 것인 약독화 바이러스.
  34. 제30항에 있어서, 상기 피코나바이러스가 리노바이러스인 약독화 바이러스.
  35. 제34항에 있어서, 상기 바이러스 게놈의 뉴클레오티드 서열이 서열 번호 30 또는 서열 번호 32, 또는 이들의 일부를 포함하는 것인 약독화 바이러스.
  36. 제1항 내지 제23항 및 제27항 내지 제29항 중 어느 한 항에 있어서, 상기 바이러스가 오르토믹소바이러스인 약독화 바이러스.
  37. 제36항에 있어서, 상기 오르토믹소바이러스가 인플루엔자 바이러스인 약독화 바이러스.
  38. 제37항에 있어서, 상기 바이러스 게놈의 뉴클레오티드 서열이 서열 번호 14, 서열 번호 15, 서열 번호 17, 서열 번호 19, 서열 번호 21, 서열 번호 23, 서열 번호 25, 서열 번호 28, 및 이들의 일부 중 하나 이상을 포함하는 것인 약독화 바이러스.
  39. 제37항에 있어서, 상기 바이러스 게놈의 뉴클레오티드 서열이 서열 번호 23을 포함하는 것인 약독화 바이러스.
  40. 제37항에 있어서, 상기 바이러스 게놈의 뉴클레오티드 서열이 서열 번호 15 및 서열 번호 21을 포함하는 것인 약독화 바이러스.
  41. 제1항 내지 제23항 및 제27항 내지 제29항 중 어느 한 항에 있어서, 상기 바이러스가 플라비바이러스인 약독화 바이러스.
  42. 제41항에 있어서, 상기 플라비바이러스가 뎅기 바이러스인 약독화 바이러스.
  43. 제42항에 있어서, 상기 바이러스 게놈의 뉴클레오티드 서열이 서열 번호 34를 포함하는 것인 약독화 바이러스.
  44. 제1항 내지 제23항 및 제27항 내지 제29항 중 어느 한 항에 있어서, 상기 바이러스가 레트로바이러스인 약독화 바이러스.
  45. 제44항에 있어서, 상기 레트로바이러스가 인간 면역결핍 바이러스(HIV)인 약독화 바이러스.
  46. 제45항에 있어서, 상기 바이러스 게놈의 뉴클레오티드 서열이 서열 번호 36을 포함하는 것인 약독화 바이러스.
  47. 제1항 내지 제23항 및 제27항 내지 제29항 중 어느 한 항에 있어서, 상기 바이러스가 레오바이러스인 약독화 바이러스.
  48. 제47항에 있어서, 상기 레오바이러스가 로타바이러스인 약독화 바이러스.
  49. 제48항에 있어서, 상기 바이러스 게놈의 뉴클레오티드 서열이 서열 번호 38 또는 서열 번호 40 중 하나 이상을 포함하는 것인 약독화 바이러스.
  50. 제1항 내지 제23항 및 제27항 내지 제29항 중 어느 한 항에 있어서, 상기 바이러스가 코로나바이러스인 약독화 바이러스.
  51. 제50항에 있어서, 상기 코로나바이러스가 중증 급성 호흡기 증후군(SARS) 바 이러스인 약독화 바이러스.
  52. 제51항에 있어서, 상기 바이러스 게놈의 뉴클레오티드 서열이 서열 번호 42를 포함하는 것인 약독화 바이러스.
  53. (a) 모 바이러스의 단백질 코딩 영역의 뉴클레오티드 서열을 얻는 단계;
    (b) 상기 뉴클레오티드 서열의 코돈을 재배열하여,
    i) 모 바이러스의 단백질 코딩 영역과 동일한 아미노산 서열을 코딩하고,
    ii) 모 바이러스의 단백질 코딩 영역에 비해 감소된 코돈 쌍 편향을 가지는
    돌연변이된 뉴클레오티드 서열을 얻는 단계; 및
    (c) 상기 돌연변이된 뉴클레오티드 서열의 전부 또는 일부를 모 바이러스의 뉴클레오티드 서열 내로 치환하는 단계
    를 포함하는 약독화 바이러스 게놈의 제조 방법.
  54. 제53항에 있어서, 코돈의 재배열이 동일한 아미노산을 코딩하는 코돈 쌍을 무작위로 선택하여 교환하고, 상기 교환에 의해 코돈 쌍 편향이 감소되는지를 확인하는 단계를 포함하는 것인 제조 방법.
  55. 제54항에 있어서, 상기 단계를, 코돈 쌍 편향이 원하는 양만큼 감소될 때까지 반복하는 것인 제조 방법.
  56. 제54항에 있어서, 상기 단계를, 코돈 쌍 편향이 최적 값에 수렴할 때까지 반복하는 것인 제조 방법.
  57. 제53항 내지 제56항 중 어느 한 항에 있어서, 단계 (a) 및 (b)를 컴퓨터에서 실행하는 것인 제조 방법.
  58. 제53항에 있어서, 단계 (c)를 돌연변이된 뉴클레오티드 서열의 신생 합성에 의해 수행하는 것인 제조 방법.
  59. 제58항에 있어서, 전체 게놈을 합성 DNA로 치환하는 것인 제조 방법.
  60. 제58항에 있어서, 상기 바이러스 게놈의 일부를 합성 DNA로 치환하는 것인 제조 방법.
  61. 제53항에 있어서, 상기 모 바이러스가 천연 분리주인 제조 방법.
  62. 제53항에 있어서, 상기 모 바이러스가 천연 분리주의 돌연변이체인 제조 방법.
  63. 제53항의 방법에 의해 제조된 약독화 바이러스 게놈을 인간을 제외한 숙주 생물체 내에 삽입함으로써 약독화 바이러스를 생성하는 단계를 포함하는, 약독화 바이러스의 제조 방법.
  64. 제1항의 약독화 바이러스 및 약학적으로 허용되는 담체를 포함하는, 피험체에서 보호 면역 반응을 유발하기 위한 백신 조성물.
  65. 제64항에 있어서, 상기 약독화 바이러스가 하기 특징 중 하나 이상을 포함하는 것인 백신 조성물:
    (i) 감염된 세포에서의 바이러스 단백질의 합성 및 가공을 실질적으로 변경하지 않음;
    (ii) 감염된 세포당 비리온의 양을 야생형 바이러스와 유사한 양으로 생성함; 또는
    (iii) 야생형 바이러스보다 더 낮은 비리온 특이적 감염력을 나타냄.
  66. 제64항에 있어서, 상기 약독화 바이러스가 숙주 동물에서 상응하는 야생형 바이러스와 실질적으로 유사한 면역 반응을 유발하는 것인 백신 조성물.
  67. 삭제
  68. 제64항에 있어서, 상기 피험체가 병원성 바이러스에 노출된 적이 있는 것인 백신 조성물.
  69. 제1항의 약독화 바이러스 및 약학적으로 허용되는 담체를 포함하는, 피험체가 바이러스 관련 질환을 앓게 되는 것을 예방하기 위한 백신 조성물.
  70. 제69항에 있어서, 상기 피험체가 병원성 바이러스에 노출된 적이 있는 것인 백신 조성물.
  71. 제1항의 약독화 바이러스 및 약학적으로 허용되는 담체를 포함하는, 바이러스 감염 피험체에서 바이러스 관련 질환의 발병을 지연시키거나 진행 속도를 늦추기 위한 백신 조성물.
  72. 제64항 내지 제66항 및 제68항 내지 제71항 중 어느 한 항에 있어서, 상기 피험체는 1종 이상의 면역보조제를 투여한 것인 백신 조성물.
  73. 제64항 내지 제66항 및 제68항 내지 제71항 중 어느 한 항에 있어서, 상기 피험체가 포유동물 또는 조류인 백신 조성물.
  74. 제73항에 있어서, 상기 포유동물이 인간인 백신 조성물.
  75. 제73항에 있어서, 상기 조류가 가축화된 가금 종인 백신 조성물.
  76. 제73항에 있어서, 상기 포유동물이 가축화된 가축 종인 백신 조성물.
  77. 제73항에 있어서, 상기 포유동물이 소인 백신 조성물.
  78. 제73항에 있어서, 상기 포유동물이 돼지인 백신 조성물.
  79. 제73항에 있어서, 상기 포유동물이 양인 백신 조성물.
  80. 제73항에 있어서, 상기 포유동물이 말인 백신 조성물.
  81. 제73항에 있어서, 상기 포유동물이 외래 동물원 동물인 백신 조성물.
KR1020097022782A 2007-03-30 2008-03-31 백신에 유용한 약독화 바이러스 KR101621100B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US90938907P 2007-03-30 2007-03-30
US60/909,389 2007-03-30
US6866608P 2008-03-07 2008-03-07
US61/068,666 2008-03-07

Publications (2)

Publication Number Publication Date
KR20100019423A KR20100019423A (ko) 2010-02-18
KR101621100B1 true KR101621100B1 (ko) 2016-05-13

Family

ID=39808891

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020097022782A KR101621100B1 (ko) 2007-03-30 2008-03-31 백신에 유용한 약독화 바이러스

Country Status (13)

Country Link
US (4) US9476032B2 (ko)
EP (2) EP2139515B2 (ko)
JP (2) JP5733976B2 (ko)
KR (1) KR101621100B1 (ko)
CN (1) CN103476425B (ko)
AU (1) AU2008232491B2 (ko)
BR (1) BRPI0809600B1 (ko)
CA (1) CA2682089C (ko)
DK (1) DK2139515T4 (ko)
HR (1) HRP20181319T4 (ko)
MX (2) MX349825B (ko)
PL (1) PL2139515T5 (ko)
WO (1) WO2008121992A2 (ko)

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2139515B2 (en) * 2007-03-30 2023-12-20 The Research Foundation of the State University of New York Attenuated viruses useful for vaccines
US9052321B2 (en) * 2008-10-03 2015-06-09 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Flavivirus-based system for production of hepatitis C virus (HCV)
CN102459578A (zh) 2009-01-30 2012-05-16 俄克拉荷马州大学评议会 基于在北美狗中循环的犬瘟热病毒的免疫原性组合物、疫苗和诊断方法
JP2012519484A (ja) * 2009-03-06 2012-08-30 マウント・シナイ・スクール・オヴ・メディシン マイクロrna応答要素を含む弱毒化生インフルエンザウイルスワクチン
US20120269849A1 (en) * 2009-10-09 2012-10-25 Eckard Wimmer Attenuated influenza viruses and vaccines
EP2490268A1 (en) * 2011-02-03 2012-08-22 Imec Method for fabricating photovoltaic cells
WO2013030176A2 (en) * 2011-09-02 2013-03-07 Westfälische Wilhelms-Universität Münster Live attenuated influenza virus
US20140356962A1 (en) * 2011-12-16 2014-12-04 The Research Foundation For The State University Of New York Novel attenuated poliovirus: pv-1 mono-cre-x
WO2013109604A1 (en) * 2012-01-19 2013-07-25 Alnylam Pharmaceuticals, Inc. Viral attenuation and vaccine production
HRP20230694T1 (hr) 2013-02-08 2023-10-13 The U.S.A. As Represented By The Secretary, Department Of Health And Human Services Smanjenje ljudskog respiratornog sincicijskog virusa prema ljestvici genoma deoptimizacijom kodon-para
US10232032B2 (en) * 2013-03-14 2019-03-19 Emory University Recombinant RSV with silent mutations, vaccines, and methods related thereto
EP2969005B1 (en) 2013-03-15 2019-10-16 The Research Foundation for The State University of New York Attenuated influenza viruses and vaccines
CN104056276B (zh) * 2013-03-20 2017-05-10 上海生物制品研究所有限责任公司 一种流感病毒减毒活疫苗及其制备方法
CN104419687B (zh) * 2013-09-03 2017-03-15 中国农业大学 重组PRRS病毒HV‑nsp29及其应用
MX2017002949A (es) * 2014-09-05 2017-12-14 Univ New York State Res Found Arbovirus recodificado y vacunas.
US10731227B2 (en) 2014-12-12 2020-08-04 The Trustees Of The University Of Pennsylvania Compositions, kits, and methods to detect HIV virus
WO2017099801A1 (en) * 2015-12-11 2017-06-15 The Trustees Of The University Of Pennsylvania Compositions, kits, and methods to detect hiv virus
EP3050962A1 (en) * 2015-01-28 2016-08-03 Institut Pasteur RNA virus attenuation by alteration of mutational robustness and sequence space
EP3303571A4 (en) * 2015-06-04 2018-10-17 The University of Hong Kong Live-attenuated virus and methods of production and use
EP3355899A4 (en) * 2015-09-30 2019-04-03 Ramot at Tel-Aviv University Ltd. In place of EVOLUTIONARY PRESERVED RNA STRUCTURE MUTATED APPROVED VIRUS
SG11201803581VA (en) 2015-10-29 2018-05-30 Univ Emory Chimeric RSV, Immunogenic Compositions, and Methods of Use
CN105821009B (zh) * 2016-04-05 2019-07-26 中国人民解放军第三〇二医院 靶向肝癌溶瘤流感病毒的构建及其应用
JP7062861B2 (ja) 2016-06-15 2022-05-09 プレジデント アンド フェローズ オブ ハーバード カレッジ 規則に基づいたゲノムデザイン方法
WO2018017949A1 (en) * 2016-07-22 2018-01-25 Verily Life Sciences Llc Quantitative massively parallel proteomics
US11149255B2 (en) * 2016-09-06 2021-10-19 Bioventures, Llc Compositions and methods for generating reversion free attenuated and/or replication incompetent vaccine vectors
CN106650307B (zh) * 2016-09-21 2019-04-05 武汉伯远生物科技有限公司 一种基于密码子对使用频度的基因密码子优化方法
JP7198759B2 (ja) 2016-09-23 2023-01-04 ザ・ユナイテッド・ステイツ・オブ・アメリカ・アズ・リプリゼンテッド・バイ・ザ・セクレタリー・デパートメント・オブ・ヘルス・アンド・ヒューマン・サービシーズ 弱毒化表現型を有するヒト呼吸器多核体ウイルス(rsv)のためのワクチン候補
CN106520832B (zh) * 2016-11-17 2020-02-18 新乡医学院 双顺反子表达载体、表达系统、制备方法及应用
US10548967B2 (en) * 2016-11-30 2020-02-04 Boehringer Ingelheim Animal Health USA Inc. Attenuated swine influenza vaccines and methods of making and use thereof
AR111770A1 (es) 2017-05-05 2019-08-21 Elanco Us Inc Vacuna para enfermedad respiratoria bovina
CN111108203A (zh) * 2017-07-17 2020-05-05 葛兰素史密丝克莱恩生物有限公司 狂犬病病毒抗原构建体
JP2021508696A (ja) * 2017-12-22 2021-03-11 コーダ−ジェニックス・インコーポレイテッドCoda−Genix, Inc. がん処置のためのコドン対脱最適化領域を有する組換え型ウイルス及びその使用法
CN108586608A (zh) * 2018-04-13 2018-09-28 四川农业大学 一种dhav-1 2c蛋白多克隆抗体、重组融合蛋白及其制备方法
CN109504662B (zh) * 2018-11-09 2022-06-10 浙江天元生物药业有限公司 一种柯萨奇病毒减毒株及其应用
EP3893927A1 (en) 2018-12-14 2021-10-20 GlaxoSmithKline Biologicals S.A. Heterologous prime boost vaccine compositions and methods
EP3988650A4 (en) * 2019-06-21 2022-09-21 Osaka University METHOD FOR PREPARING AN ARTIFICIAL RECOMBINANT RNA VIRUS STABLELY INTEGRATING A FOREIGN GENE
CN115427073A (zh) * 2020-01-28 2022-12-02 科达金尼克斯有限公司 去优化SARS-CoV-2及其方法和用途
CN111321125B (zh) * 2020-02-03 2022-07-19 广州医科大学 重组流感病毒及其在疫苗中的应用
CN111269895B (zh) * 2020-02-03 2022-09-27 广州医科大学 甲型流感病毒减毒株及其作为骨架病毒和疫苗的应用
EP4125918A1 (de) * 2020-03-27 2023-02-08 Johannes Reinmüller Virustatisches mittel
CN111481663B (zh) * 2020-04-09 2022-12-09 广州医科大学 一种流感病毒活疫苗及其制备方法
WO2021216743A2 (en) * 2020-04-21 2021-10-28 Emory University Coronavirus vaccines, compositions, and methods related thereto
WO2021242879A1 (en) * 2020-05-27 2021-12-02 The United States Of America, As Represented By The Secretary Of Agriculture Live attenuated strains of foot and mouth disease modified by deoptimization and uses thereof
WO2022011032A1 (en) * 2020-07-07 2022-01-13 Codagenix Inc. Method of producing modified virus genomes and producing modified viruses
EP4181956A1 (en) * 2020-07-16 2023-05-24 Griffith University Live-attenuated virus vaccine
WO2022040355A2 (en) * 2020-08-19 2022-02-24 City Of Hope Lamp detection of sars-cov-2 in saliva for the rapid diagnosis of covid-19
CN112662633A (zh) * 2020-12-28 2021-04-16 中国水产科学研究院珠江水产研究所 II型草鱼呼肠孤病毒冷适应株GCRV-GD108ca及其应用
WO2022269248A1 (en) * 2021-06-23 2022-12-29 University Of Lancaster Virus attenuation
US20230274791A1 (en) * 2021-11-29 2023-08-31 The Chinese University Of Hong Kong Codon de-optimization or optimization using genetic architecture
CN117153270B (zh) * 2023-10-30 2024-02-02 吉林华瑞基因科技有限公司 一种基因二代测序数据处理方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006042156A2 (en) * 2004-10-08 2006-04-20 THE GOVERNMENT OF THE UNITED STATES OF AMERICA AS represneted by THE SECRETARY OF THE DEPARTMENT OF HEALTH AND HUMAN SERVICES, CENTERS FOR DISEASE CONTROL AND PREVENTION Modulation of replicative fitness by using less frequently used synonymous codons

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU6829494A (en) 1993-08-02 1995-02-28 Chiron Corporation Recombinant constructs using replacement sequences in hypervariable regions
US6238884B1 (en) 1995-12-07 2001-05-29 Diversa Corporation End selection in directed evolution
US6764835B2 (en) 1995-12-07 2004-07-20 Diversa Corporation Saturation mutageneis in directed evolution
US6352842B1 (en) 1995-12-07 2002-03-05 Diversa Corporation Exonucease-mediated gene assembly in directed evolution
US6537776B1 (en) 1999-06-14 2003-03-25 Diversa Corporation Synthetic ligation reassembly in directed evolution
US6562594B1 (en) 1999-09-29 2003-05-13 Diversa Corporation Saturation mutagenesis in directed evolution
US20040023327A1 (en) 1995-12-07 2004-02-05 Short Jay M. End selection in directed evolution
US6171820B1 (en) 1995-12-07 2001-01-09 Diversa Corporation Saturation mutagenesis in directed evolution
EP0912724B1 (en) 1996-07-15 2009-12-09 The Government of The United States of America, as represented by The Department of Health and Human Services Production of attenuated respiratory syncytial virus vaccines from cloned nucleotide sequences
GB9705669D0 (en) 1997-03-19 1997-05-07 British Tech Group Attenuated polioviruses
US6410023B1 (en) 1997-05-23 2002-06-25 United States Of America Recombinant parainfluenza virus vaccines attenuated by deletion or ablation of a non-essential gene
JP2000503551A (ja) * 1997-08-07 2000-03-28 アルトウェル バイオテク インコーポレーテッド ポリオウイルスの複製コンピテント組換えセービンタイプ1菌株
AU1449499A (en) 1997-10-31 1999-05-24 Maxygen, Incorporated Modification of virus tropism and host range by viral genome shuffling
GB9817082D0 (en) 1998-08-06 1998-10-07 Btg Int Ltd Attenuated poliovirus vaccine
AU1199000A (en) 1998-09-29 2000-04-17 Maxygen, Inc. Shuffling of codon altered genes
AU3879300A (en) 1999-03-09 2000-09-28 Diversa Corporation End selection in directed evolution
JP2004500019A (ja) 1999-03-26 2004-01-08 ディベルサ コーポレーション 定方向進化におけるエキソヌクレアーゼ仲介核酸再集合
CA2291367A1 (en) * 1999-12-06 2001-06-06 Isabelle Henry Genetic constructions having a reduced or an increased number of epigenetic control regions and methods of use thereof
US20020076415A1 (en) 1999-12-14 2002-06-20 Jing-Hsiung Ou Hepatitis C virus gene products
AUPQ776100A0 (en) 2000-05-26 2000-06-15 Australian National University, The Synthetic molecules and uses therefor
GB0017990D0 (en) 2000-07-21 2000-09-13 Glaxo Group Ltd Papilloma virus sequences
EP1301614B1 (en) 2000-07-21 2006-11-29 Glaxo Group Limited Codon-optimized papilloma virus sequences
IL155154A0 (en) 2000-09-30 2003-10-31 Diversa Corp Whole cell engineering by mutagenizing a substantial portion of a starting genome, combining mutations, and optionally repeating
US20030041354A1 (en) 2000-10-17 2003-02-27 Novozymes A/S Transgenic plants
DK1340085T3 (da) 2000-10-17 2008-12-01 Besst Test Aps Assay til direkte detektion af en biologisk celle i en legemsvæskepröve
WO2002095363A2 (en) 2001-05-25 2002-11-28 Tao Biosciences, Llc Methods for attenuation of virulence in bacteria
AU2003301148A1 (en) * 2002-12-23 2004-07-22 Vical Incorporated Codon-optimized polynucleotide-based vaccines against human cytomegalovirus infection
AU2004262624B2 (en) 2003-02-28 2009-11-19 The Government Of The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services Recombinant human metapneumovirus and its use
WO2005024012A1 (en) 2003-09-11 2005-03-17 Novozymes A/S Increased expression of a modified polypeptide
ATE447031T1 (de) 2004-04-07 2009-11-15 Novozymes As Mutierte prokaryontische zellen mit hohen sekretionsniveaus
EP2995678A1 (en) 2004-05-24 2016-03-16 MedImmune, LLC Multi plasmid system for the production of attenuated influenza b virus
KR20070058440A (ko) 2004-07-02 2007-06-08 헨리 엘 니만 복제 선택 재조합 및 그것의 용도
US20060019301A1 (en) 2004-07-20 2006-01-26 Novozymes A/S Methods of producing mutant polynucleotides
WO2006015370A2 (en) 2004-08-03 2006-02-09 The Regents Of The University Of California Site specific system for generating diversity protein sequences
US8168771B2 (en) 2005-01-31 2012-05-01 The Johns Hopkins University Use of consensus sequence as vaccine antigen to enhance recognition of virulent viral variants
WO2007047459A1 (en) 2005-10-14 2007-04-26 The Government Of The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services, Centers For Disease Control And Prevention Rabies virus vector systems and compositions and methods thereof
CN106148288A (zh) 2006-08-25 2016-11-23 美国国有健康与人类服务部(马里兰州) 重组修饰的安卡拉痘苗病毒及其应用、质粒载体及其应用
US8216844B2 (en) 2006-08-29 2012-07-10 Danisco Us Inc. Compositions and methods for improved protein production
US20090325244A1 (en) 2006-10-24 2009-12-31 Basf Se Method of increasing gene expression using modified codon usage
EP2082045B1 (en) 2006-10-24 2015-03-18 Basf Se Method of reducing gene expression using modified codon usage
WO2008121487A2 (en) 2007-03-29 2008-10-09 The Govt. Of The U.S.A, As Represented By The Secretary, Dept. Of Health And Human Sevices. Live attenuated virus vaccines for la crosse virus and other bunyaviridae
EP2139515B2 (en) 2007-03-30 2023-12-20 The Research Foundation of the State University of New York Attenuated viruses useful for vaccines
EP2215269B1 (en) 2007-10-15 2017-12-13 Admedus Vaccines Pty Limited Construct system and uses therefor
EP3355899A4 (en) 2015-09-30 2019-04-03 Ramot at Tel-Aviv University Ltd. In place of EVOLUTIONARY PRESERVED RNA STRUCTURE MUTATED APPROVED VIRUS
JP7250520B2 (ja) 2016-04-13 2023-04-03 ヤンセン ファーマシューティカルズ,インコーポレーテッド 組換えアルテリウイルスレプリコン系およびその使用
US11821111B2 (en) 2019-11-15 2023-11-21 Fred Hutchinson Cancer Center Barcoded influenza viruses and deep mutational scanning libraries including the same

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006042156A2 (en) * 2004-10-08 2006-04-20 THE GOVERNMENT OF THE UNITED STATES OF AMERICA AS represneted by THE SECRETARY OF THE DEPARTMENT OF HEALTH AND HUMAN SERVICES, CENTERS FOR DISEASE CONTROL AND PREVENTION Modulation of replicative fitness by using less frequently used synonymous codons

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Journal of Virology, Vol.80(19), pages. 9687-9696 (2006)*

Also Published As

Publication number Publication date
MX349825B (es) 2017-08-15
AU2008232491A1 (en) 2008-10-09
US11162080B2 (en) 2021-11-02
CN103476425A (zh) 2013-12-25
JP2015091247A (ja) 2015-05-14
US20170067030A1 (en) 2017-03-09
US20100209454A1 (en) 2010-08-19
EP2139515B2 (en) 2023-12-20
US9476032B2 (en) 2016-10-25
JP2010523086A (ja) 2010-07-15
KR20100019423A (ko) 2010-02-18
EP3431099A1 (en) 2019-01-23
PL2139515T3 (pl) 2018-11-30
US20190010469A1 (en) 2019-01-10
PL2139515T5 (pl) 2024-04-08
DK2139515T4 (da) 2024-03-04
CA2682089C (en) 2019-03-12
CN103476425B (zh) 2015-07-15
EP2139515A2 (en) 2010-01-06
EP2139515B1 (en) 2018-06-13
WO2008121992A3 (en) 2009-02-26
HRP20181319T4 (hr) 2024-02-16
JP5733976B2 (ja) 2015-06-10
HRP20181319T1 (hr) 2018-10-19
DK2139515T3 (en) 2018-08-27
MX2009010549A (es) 2010-03-15
US10023845B2 (en) 2018-07-17
BRPI0809600B1 (pt) 2023-01-24
EP3431099B1 (en) 2024-01-03
EP2139515A4 (en) 2011-07-06
AU2008232491B2 (en) 2014-05-22
US20220298492A1 (en) 2022-09-22
BRPI0809600A2 (pt) 2016-07-12
CA2682089A1 (en) 2008-10-09
WO2008121992A2 (en) 2008-10-09

Similar Documents

Publication Publication Date Title
KR101621100B1 (ko) 백신에 유용한 약독화 바이러스
CN111560354B (zh) 重组新型冠状病毒及其制备方法和应用
ES2523587T3 (es) Virus influenza B que tienen alteraciones en el polipéptido hemaglutinina
CN115427073A (zh) 去优化SARS-CoV-2及其方法和用途
EP1736539A1 (en) Attenuated SARS-CoV vaccines
JP7198759B2 (ja) 弱毒化表現型を有するヒト呼吸器多核体ウイルス(rsv)のためのワクチン候補
WO2018157454A1 (zh) 一种流感病毒弱毒活疫苗毒株的筛选和鉴定方法
KR20230012583A (ko) 합성 변형된 백시니아 앙카라 (sMVA) 기반 코로나바이러스 백신
CN112543806A (zh) 合成嵌合痘苗病毒
JP2004531232A (ja) 高められた転写および複製能力をもつインフルエンザウイルス
WO2022245888A1 (en) Seasonal flu rna vaccines and methods of use
JP2023532735A (ja) 組み換えエンテロウイルスおよびその使用
KR20230005814A (ko) Cpg-어쥬번트된 sars-cov-2 바이러스 백신
US20240100150A1 (en) Reverse genetics-based compositions of recombinant sars-cov-2
KR20230038205A (ko) 키메라 rsv 및 코로나바이러스 단백질, 면역원성 조성물, 및 사용 방법
CN106929486A (zh) 重组猪流感病毒及其应用
Inayoshi et al. Bacterial artificial chromosome-based reverse genetics system for cloning and manipulation of the full-length genome of infectious bronchitis virus
CN108699535B (zh) 包含ns1和ns2基因迁移的重组呼吸道合胞病毒株
JP2023525623A (ja) 核酸構築物、組み換えインフルエンザウイルス、組み換えインフルエンザウイルスを調製するための方法、組成物、および使用
WO2023196914A1 (en) Influenza nucleic acid compositions and uses thereof
Karkashan Generation of influenza A virus vectors for the delivery of antigenic proteins
LT et al. INVESTIGACIONES CIENTIFICAS
PENG MURINE MODELS TO STUDY IMMUNITY AND IMMUNISATION AGAINST RESPIRATORY VIRAL PATHOGENS
WIMMER et al. Patent 2682089 Summary
WO1998008936A1 (fr) Herpes-virus canin recombine

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant