KR20220140528A - Sars-cov-2 mrna 도메인 백신 - Google Patents

Sars-cov-2 mrna 도메인 백신 Download PDF

Info

Publication number
KR20220140528A
KR20220140528A KR1020227028371A KR20227028371A KR20220140528A KR 20220140528 A KR20220140528 A KR 20220140528A KR 1020227028371 A KR1020227028371 A KR 1020227028371A KR 20227028371 A KR20227028371 A KR 20227028371A KR 20220140528 A KR20220140528 A KR 20220140528A
Authority
KR
South Korea
Prior art keywords
mrna
seq
mol
amino acid
acid sequence
Prior art date
Application number
KR1020227028371A
Other languages
English (en)
Inventor
기욤 스튜어트-존스
안드레아 카르피
사이다 마흐구브 엘바시르
미히르 메트카
Original Assignee
모더나티엑스, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 모더나티엑스, 인크. filed Critical 모더나티엑스, 인크.
Publication of KR20220140528A publication Critical patent/KR20220140528A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • A61K39/145Orthomyxoviridae, e.g. influenza virus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • A61K39/215Coronaviridae, e.g. avian infectious bronchitis virus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/06Organic compounds, e.g. natural or synthetic hydrocarbons, polyolefins, mineral oil, petrolatum or ozokerite
    • A61K47/08Organic compounds, e.g. natural or synthetic hydrocarbons, polyolefins, mineral oil, petrolatum or ozokerite containing oxygen, e.g. ethers, acetals, ketones, quinones, aldehydes, peroxides
    • A61K47/10Alcohols; Phenols; Salts thereof, e.g. glycerol; Polyethylene glycols [PEG]; Poloxamers; PEG/POE alkyl ethers
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P11/00Drugs for disorders of the respiratory system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • A61P37/04Immunostimulants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/53DNA (RNA) vaccination
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/545Medicinal preparations containing antigens or antibodies characterised by the dose, timing or administration schedule
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/555Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
    • A61K2039/55511Organic adjuvants
    • A61K2039/55555Liposomes; Vesicles, e.g. nanoparticles; Spheres, e.g. nanospheres; Polymers
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/57Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2
    • A61K2039/575Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2 humoral response
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/03Fusion polypeptide containing a localisation/targetting motif containing a transmembrane segment
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20034Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20071Demonstrated in vivo effect

Abstract

본 개시내용은 코로나바이러스 리보핵산(RNA) 백신 뿐만 아니라 상기 백신을 사용하는 방법 및 상기 백신을 포함하는 조성물에 관한 것이다. 상기 RNA 백신은 코로나바이러스의 도메인 및 서브유닛을 암호화한다.

Description

SARS-COV-2 MRNA 도메인 백신
관련 출원
본 출원은 2020년 2월 7일에 출원된, 미국 가출원 번호 제62/971,825호, 2020년 4월 27일에 출원된, 미국 가출원 번호 제63/016,175호, 2020년 6월 25일에 출원된, 미국 가출원 번호 제63/044,330호, 및 2020년 8월 7일에 출원된, 미국 가출원 번호 제63/063,137호의 35 U.S.C. §119(e) 하에 이점을 주장하고, 이들 각각은 그 전체가 본원에 참조로 포함된다.
인간 코로나바이러스는 코로나바이러스과(Coronaviridae) 패밀리의 전염성이 강한 외피가 있는, 양성 단일-가닥 RNA 바이러스이다. 코로나바이러스과의 두 가지 서브-패밀리가 인간 질환을 일으키는 것으로 알려져 있다. 가장 중요한 것은 β-코로나바이러스(베타코로나바이러스)이다. β-코로나바이러스는 경증 내지 중등도의 상부 호흡기 감염의 흔한 병원체이다. 그러나, 2019년 12월 중국 우한시에서 처음 확인된 코로나바이러스에 의해 발생된 감염과 같은 새로운 코로나바이러스 감염의 발병은 높은 사망률 사망자수와 관련이 있다. 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2)(이전에 "2019 신종 코로나바이러스" 또는 "2019-nCoV"로 지칭됨)로 지칭된, 최근 확인된 코로나바이러스는 수십만 명의 사람들을 빠르게 감염시켰다. SARS-CoV-2 바이러스가 유발하는 팬데믹 질환(pandemic disease)은 세계보건기구(WHO)에 의해 COVID-19(Coronavirus Disease 2019)로 명명되었다. SARS-CoV-2 분리주(Wuhan-Hu-1)의 제1 게놈 서열은 2020년 1월 10일 바이러스 분자 진화 및 역학의 분석 및 해석을 위한 UK-기반 토론 포럼인 Virological에서 베이징 소재의 중국 CDC로부터의 조사관에 의해 발표되었다. 이후, 2020년 1월 12일에 Genbank 등록 번호 MN908947.1을 갖는 서열이 GenBank에 기탁되었다.
현재, COVID-19에 대한 특정 치료법 또는 SARS-CoV-2 감염에 대한 백신은 없다. 코로나바이러스 감염, 특히 SARS-CoV-2 팬데믹과 관련된 지속적인 건강 문제 및 사망률은 국제적으로 엄청난 관심사이다. SARS-CoV-2로 인한 공중 보건 위기는 이러한 바이러스에 대한 효과적이고 안전한 백신 후보를 빠르게 개발하는 것의 중요성을 강조한다.
요약
일부 구현예에서, SARS-CoV-2 항원에 대한 강력한 중화 항체 반응을 유도할 수 있는 고도의 면역원성 항원(들)을 암호화하는 하나 이상의 메신저 리보핵산(mRNA) 분자를 포함하는 조성물(예를 들어, 백신)이 본원에 제공된다. 본원에 기술된 mRNA 분자는 천연 바이러스에 의한 감염으로부터 사람들을 보호하고/하거나 감염된 경우 증상을 감소시키기 위한 면역원성 조성물 또는 백신으로서 개별적으로 또는 조합하여 사용될 때 보호 면역을 유도하는 데 효과적인 SARS-CoV-2 코로나바이러스 스파이크 (S) 단백질의 주요 중화 도메인을 발현하는 데 사용된다.
공지된 베타 코로나바이러스의 외피 S 단백질은 바이러스 숙주 친화성 및 숙주 세포로의 진입을 결정하며 SARS-CoV-2 감염에 있어 중요하다. S 단백질의 구조는 각각 부착 및 막 융합을 매개하는, 2개의 서브유닛, S1 및 S2를 포함하는 베타코로나바이러스, 예컨대 SARS-CoV-2, SARS-CoV, MERS-CoV, HKU1-CoV, MHV-CoV 및 NL63-CoV 간에 유사하다. S1 서브유닛은 N 말단 도메인(NTD) 및 수용체 결합 도메인(RBD)을 포함한다.
서브유닛 항원의 발현은 다른 관련 바이러스와 공유되는 항원의 다른 도메인에 특이적인 기억 B 및 T 세포의 최소 자극으로 특이적 서브유닛에 대한 면역 반응에 초점을 맞춘다. 본원에 제공된 데이터는 막 결합형 또는 가용성 SARS-CoV-2 S1 서브유닛 항원을 암호화하는 mRNA의 투여가 SARS-CoV-2 RBD 항원, NTD 항원, 야생형 전체-길이 S 단백질, 및 융합 전(prefusion) 형태를 안정화하기 위한 이중 프롤린 돌연변이를 갖는 S 단백질 각각에 대한 항체 역가를 생성하였음을 입증한다. 본원에 나타낸 바와 같이, 시험된 모든 용량에서, 2회-용량 요법(즉, 부스터 용량 포함)은 SARS-CoV-2 WT S 단백질을 인식하고 이에 결합할 수 있는 항체를 유도하는 데 효과적이었다. 놀랍게도, 유도된 역가는 S1 서브유닛에서 이중 프롤린 돌연변이가 발견되지 않음에도 불구하고, S 단백질의 이중 프롤린 안정화 버전에 대해 측정했을 때 가장 높았다(이중 프롤린 돌연변이는 S2에서 발생하고, S2는 시험된 면역원에 존재하지 않음).
또한, NTD 및 RBD 모두는 바이러스 활성을 중화시키는 항체의 결합을 위한 부위인 것으로 알려져 있다. SARS-CoV-2의 경우 RBD는 안지오텐신-전환 효소 2(ACE2)에 결합하는 스파이크 단백질의 수용체 결합 부위이다. 기능이 완전히 이해되지 않은 NTD는, 당 모이어티를 결합하고 융합 전에서 융합 후 형태로 스파이크 단백질의 형태 전환을 촉진하는 역할을 하는 것으로 보인다. 그럼에도 불구하고, NTD 및 RBD 도메인 모두는 본원에 나타낸 바와 같이 높은 결합 항체 및 중화 항체 역가를 유도한다.
예를 들어, 매우 놀랍게도, 본원의 일부 구현예에서 제공된 데이터는 막 결합 RBD 항원(RBD-TM) 또는 막 결합 NTD 항원(NTD-TM)을 암호화하는 mRNA의 투여로부터의 혈청이 SARS-CoV-2 S1/S2 스파이크 단백질에 대한 면역원성을 나타내었지만, 상기 2개의 mRNA (및 따라서 2개의 항원)의 50:50의 조합이 SARS-CoV-2 S1/S2 스파이크 단백질에 대해 예상외로 높고, 상승적인 중화 항체 역가를 생성하였음을 보여준다.
따라서, 본 개시의 일부 측면은 면역 반응, 예컨대, SARS-CoV-2에 대한 중화 항체 반응을 유도할 수 있는 SARS-CoV-2 S 단백질의 기능적 도메인을 암호화하는 mRNA를 포함하는 조성물을 제공한다. 일부 구현예에서, mRNA는 지질 나노입자 내 제형화된다.
일부 측면에서, SARS-CoV-2 스파이크 단백질의 적어도 2개의 도메인, 및 전장보다 작은 스파이크 단백질을 암호화하는 오픈 리딩 프레임(ORF)을 포함하는 mRNA가 제공된다. 전장 스파이크 단백질보다 작은 스파이크 단백질은 전장 스파이크 단백질보다 작은 적어도 하나의 아미노산을 갖는 스파이크 단백질의 하나 이상의 도메인 및/또는 서브유닛, 또는 비-천연 순서 또는 서열로 함께 연결된 하나 이상의 도메인을 갖는 융합 단백질이다. 일부 구현예에서, 2개의 도메인 중 하나는 SARS-CoV-2 스파이크 단백질의 N-말단 도메인(NTD)이다. 일부 구현예에서, 2개의 도메인 중 하나는 SARS-CoV-2 스파이크 단백질의 수용체 결합 도메인(RBD)이다. 일부 구현예에서, ORF는 NTD 및/또는 RBD에 연결된 막횡단 도메인(TD)을 암호화한다. 일부 구현예에서, TD는 인플루엔자 혈구응집소 막횡단 도메인이다. 일부 구현예에서, ORF는 NTD - RBD - TM을 포함한다. 일부 구현예에서, 적어도 2개의 도메인은 절단 가능하거나 절단 불가능한 링커를 통해 연결된다. 일부 구현예에서, 절단 불가능한 링커는 글리신-세린(GS) 링커이다. 일부 구현예에서, GS 링커는 4-15개의 아미노산이다. 일부 구현예에서, 링커는 pan HLA DR-결합 에피토프(PADRE)이다. 일부 구현예에서, ORF는 신호 펩티드를 암호화한다. 일부 구현예에서, 신호 펩티드는 NTD에 연결된다. 일부 구현예에서, 신호 펩티드는 RBD에 연결된다. 일부 구현예에서, 신호 펩티드는 SARS-CoV-2와 이종이다. 일부 구현예에서, 적어도 2개의 도메인은 가용성이다. 일부 구현예에서 ORF는 트래피킹 신호 도메인을 암호화한다. 일부 구현예에서, 트래피킹 신호 도메인은 대식세포 마커이다. 일부 구현예에서, 대식세포 마커는 CD86 및/또는 CD11b이다. 일부 구현예에서, 트래피킹 신호 도메인은 VSV-G 세포질 꼬리(VSVGct)이다. 일부 구현예에서, 2개의 도메인 중 하나는 SARS-CoV-2 스파이크 단백질의 제1 반복 헵타펩티드: HPPHCPC(HR1)이다. 일부 구현예에서, 2개의 도메인 중 하나는 SARS-CoV-2 스파이크 단백질의 제2 반복 헵타펩티드: HPPHCPC(HR2)이다. 일부 구현예에서, ORF는 HR1 및/또는 HR2에 연결된 막횡단 도메인(TD)을 암호화한다. 일부 구현예에서, TD는 인플루엔자 혈구응집소 막횡단 도메인이다. 일부 구현예에서, ORF는 융합 펩티드(FP)를 암호화한다. 일부 구현예에서, ORF는 CT 꼬리를 암호화한다.
일부 측면에서 SARS-CoV-2 스파이크 단백질의 수용체 결합 도메인(RBD)을 암호화하는 오픈 리딩 프레임(ORF)을 포함하는 mRNA가 제공된다. 일부 구현예에서 RBD는 가용성이다. 일부 구현예에서 RBD는 막횡단 도메인, 선택적으로 인플루엔자 혈구응집소 막횡단 도메인에 연결된다.
본 발명의 하나 이상의 구현예의 세부사항은 하기의 설명에서 제시된다. 본 발명의 다른 특징 또는 이점은 하기 도면 및 여러 구현예의 상세한 설명, 그리고 또한 첨부된 청구항으로부터 명백할 것이다.
도 1은 본 발명의 mRNA에 의해 암호화된 야생형 및 2P 스파이크 단백질 항원의 도식적인 표현이다; 신호 펩티드(SP), 채우기 없음, N-말단 도메인(NTD), 점선; 수용체-결합 도메인(RBD), 하향 대각선 줄무늬; 서브도메인 1(SD1), 가로 줄무늬; 서브도메인 2(SD2), 물결; 융합 펩티드(FP), 상향 대각선 줄무늬; 헵타드 반복 1(HR1) 직조; 헵타드 반복 2(HR2) 대각선 벽돌; (TM), 세로 줄무늬; 및 세포질 꼬리(CT), 벽돌.
도 2는 실시예 1-3에 기술된 mRNA에 의해 암호화된 항원의 예시적인 선형 디자인을 나타낸다.
도 3은 도 2에 도시된 항원의 서열 정렬을 나타낸다.
도 4는 실시예 4-6에 기술된 mRNA에 의해 암호화된 항원의 예시적인 선형 디자인을 나타낸다.
도 5는 본원에 기술된 다양한 S1 서브유닛 항원의 서열 정렬을 나타낸다.
도 6은 실시예 7 및 8에 기술된 mRNA에 의해 암호화된 항원의 예시적인 선형 디자인을 나타낸다.
도 7은 중화 및 ELISA 역가의 상관관계를 나타낸다.
도 8a-8c는 LNP 내의 NTD-RBD-TM을 암호화하는 mRNA를 이용하여 마우스에서 1일 프라임 및 21일 부스트 용량 후 36일째의 혈청 IgG1 및 IgG2a 역가를 나타낸다.
중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2)는 높은 이환율 및 사망률을 보이는 새로 등장한 호흡기 바이러스이다. SARS-CoV-2는 2002년에 나타난 SARS-CoV, 및 2012년에 등장한 중동 호흡기 증후군 코로나바이러스(MERS-CoV)와 비교하여 전 세계적으로 빠르게 확산되고 있다. 세계보건기구(WHO)는 2020년 7월 6일 현재 COVID-19의 발병으로, 전 세계적으로 거의 11.5백만 건의 확인된 사례와 더불어 530,000명 이상의 사망자가 있음을 보고하였다. COVID-19 감염의 새로운 사례가 증가하고 있으며, 여전히 빠르게 증가하고 있다. 따라서, COVID-19를 예방 및 치료하고, COVID-19가 전 세계에 미치는 심각한 영향을 줄이기 위해, 안전하고 효과적인 다양한 백신 및 약물을 개발하는 것이 중요하다. 다양한 방식을 사용하여 제조된 백신 및 약물과, 개선된 안전성 및 효능을 갖는 백신이 필수적이다. 이들은 코로나바이러스 질환 2019(COVID-19)에 대한 백신 및 치료제의 고급 디자인 및 개발을 가속화할 필요성이 남아 있다.
2020년 1월 7일, 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2)가 2019년 12월 중국 후베이성 우한시에서 발생한 신종 폐렴의 병원체로 확인되었다 (Lu H. 등 (2020) J Med Virol. Apr; 92(4):401-402.). 얼마 지나지 않아, 이 바이러스는 중국에서 발병을 일으키고 전 세계로 퍼졌다. SARS-CoV-2의 게놈 구조 분석에 따르면, 이는 β-코로나바이러스(CoV)에 속한다(Chan 등 2020 Emerg Microbes Infect.; 9(1):221-236).
코로나바이러스 표면 상의 핵심 단백질은 스파이크 단백질이다. 매우 다양한 mRNA 작제물이 디자인되었고, 본원에 개시되어 있다. 스파이크 항원을 암호화하는 적절한 전달 비히클 mRNA로 제형화될 때, 서브유닛 및 이의 도메인은 SARS-CoV-2에 대한 강한 면역 반응을 유도할 수 있고, 따라서 효과적이고 강력한 mRNA 백신을 생산할 수 있다. 다양한 스파이크 단백질 항원, 특히 스파이크 단백질 서브유닛 및 도메인 항원을 암호화하는 mRNA의 투여는 상기 mRNA가 단백질 항원으로 빠르게 번역되는 면역 시스템의 면역 조직 및 세포로의 전달을 초래한다. 다른 면역 세포, 예를 들어, B 세포 및 T 세포는 이후 인식하고 탑재할 수 있으며, 면역 반응은 암호화된 단백질에 대한 면역 반응을 발달시키고, 궁극적으로 코로나바이러스에 대해 오래 지속되는 보호 반응을 생성한다. 면역 시스템에 대한 불량한 제시 또는 항원의 부정확한 폴딩으로 인한 단백질 백신 개발의 결점인, 낮은 면역원성은 본원에 개시된 스파이크 단백질, 서브유닛 및 이의 도메인을 암호화하는 매우 효과적인 mRNA 백신의 사용을 통해 회피된다.
본 개시는 코로나바이러스 항원에 대한 강력한 중화 항체를 유도하는 조성물(예를 들어, mRNA 백신)을 제공한다. 일부 구현예에서, 조성물은 적어도 하나(예를 들어, 1개, 2개 또는 그 이상)의 코로나바이러스 항원, 예컨대 SARS-CoV-2 항원을 암호화하는 mRNA를 포함한다. 일부 구현예에서, mRNA는 스파이크 단백질 도메인, 예컨대 수용체 결합 도메인(RBD), N-말단 도메인(NTD), 또는 RBD와 NTD의 조합을 암호화한다.
본 개시의 일부 측면은 SARS-CoV-2 스파이크 단백질의 수용체 결합 도메인(RBD) 및 단백질 막횡단 도메인, 예를 들어, 천연 발생 또는 이종 막횡단 도메인을 포함하는 융합 단백질을 암호화하는 오픈 리딩 프레임을 포함하는 메신저 리보핵산(mRNA)을 제공한다.
일부 구현예에서, 단백질 막횡단 도메인은 인플루엔자 혈구응집소 막횡단 도메인이다.
일부 구현예에서, 융합 단백질은 서열번호 77의 아미노산 서열에 대해 적어도 80% 동일성을 갖는 아미노산 서열을 포함한다.
일부 구현예에서, 융합 단백질은 서열번호 77의 아미노산 서열에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함한다.
일부 구현예에서, 융합 단백질은 서열번호 77의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열에 대해 적어도 70% 동일성을 갖는 뉴클레오티드 서열을 포함한다.
일부 구현예에서, 상기 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열에 대해 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열을 포함한다.
본 개시의 다른 측면은 SARS-CoV-2 스파이크 단백질의 아미노(N)-말단 도메인 및 막횡단 도메인을 포함하는 융합 단백질을 암호화하는 오픈 리딩 프레임을 포함하는 메신저 리보핵산(mRNA)을 제공한다.
일부 구현예에서, 막횡단 도메인은 인플루엔자 혈구응집소 막횡단 도메인이다.
일부 구현예에서, 융합 단백질은 서열번호 47의 아미노산 서열에 대해 적어도 80% 동일성을 갖는 아미노산 서열을 포함한다.
일부 구현예에서, 융합 단백질은 서열번호 47의 아미노산 서열에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함한다.
일부 구현예에서, 융합 단백질은 서열번호 47의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열에 대해 적어도 70% 동일성을 갖는 뉴클레오티드 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열에 대해 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열을 포함한다.
본 개시의 또 다른 측면은 선택적으로 링커를 통해, SARS-CoV-2 스파이크 단백질의 아미노(N)-말단 도메인에 연결된 SARS-CoV-2 스파이크 단백질의 수용체 결합 도메인을 포함하는 융합 단백질을 암호화하는 오픈 리딩 프레임을 포함하는 메신저 리보핵산(mRNA)을 제공한다.
일부 구현예에서, 융합 단백질은 막횡단 도메인을 추가로 포함한다.
일부 구현예에서, 융합 단백질은 서열번호 92의 아미노산 서열에 대해 적어도 80% 동일성을 갖는 아미노산 서열을 포함한다.
일부 구현예에서, 융합 단백질은 서열번호 92의 아미노산 서열에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함한다.
일부 구현예에서, 융합 단백질은 서열번호 92의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 91의 뉴클레오티드 서열에 대해 적어도 70% 동일성을 갖는 뉴클레오티드 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 91의 뉴클레오티드 서열에 대해 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 91의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, mRNA는 서열번호 131 또는 2의 뉴클레오티드 서열을 선택적으로 포함하는, 5' 비번역 영역(UTR)을 추가로 포함한다.
일부 구현예에서, mRNA는 서열번호 132 또는 4의 뉴클레오티드 서열을 선택적으로 포함하는, 3' 비번역 영역(UTR)을 추가로 포함한다.
일부 구현예에서, mRNA는 5' 캡, 선택적으로 7mG(5')ppp(5')NlmpNp를 추가로 포함한다.
일부 구현예에서, mRNA는 선택적으로 약 100개의 뉴클레오티드 길이를 갖는 폴리A 꼬리를 추가로 포함한다.
일부 구현예에서, mRNA는 화학적 변형, 선택적으로 1-메틸슈도우리딘을 포함한다.
본 개시의 일부 측면은 선행하는 단락 중 임의의 하나의 mRNA를 포함하는 조성물을 제공한다.
본 개시의 다른 측면은 선행하는 단락 중 임의의 하나의 mRNA 중 적어도 2개를 포함하는 조성물을 제공한다.
본 개시의 다른 측면은 (a) SARS-CoV-2 스파이크 단백질의 수용체 결합 도메인(RBD) 및 단백질 막횡단 도메인을 포함하는 융합 단백질을 암호화하는 오픈 리딩 프레임을 포함하는 메신저 리보핵산(mRNA); 및 (b) SARS-CoV-2 스파이크 단백질의 아미노(N)-말단 도메인 및 막횡단 도메인을 포함하는 융합 단백질을 암호화하는 오픈 리딩 프레임을 포함하는 mRNA:를 포함하는 조성물을 제공한다. 일부 구현예에서, (a)의 mRNA 대 (b)의 mRNA의 비율은 약 1:1, 예를 들어, 1:2, 1:3, 21:, 또는 3:1이다. 일부 구현예에서, 조성물 중 mRNA의 적어도 50%는 (a)의 mRNA이다. 예를 들어, 조성물 중 mRNA의 적어도 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%는 (a)의 mRNA이다. 일부 구현예에서, 조성물 중 mRNA의 적어도 50%는 (b)의 mRNA이다. 예를 들어, 조성물 중 mRNA의 적어도 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%는 (b)의 mRNA이다.
일부 구현예에서, 단백질 막횡단 도메인은 인플루엔자 혈구응집소 막횡단 도메인이다.
일부 구현예에서, (a)의 융합 단백질은 서열번호 77의 아미노산 서열에 대해 적어도 80% 동일성을 갖는 아미노산 서열을 포함한다.
일부 구현예에서, (a)의 융합 단백질은 서열번호 77의 아미노산 서열에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함한다.
일부 구현예에서, (a)의 융합 단백질은 서열번호 77의 아미노산 서열을 포함한다.
일부 구현예에서, (a)의 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열에 대해 적어도 70% 동일성을 갖는 뉴클레오티드 서열을 포함한다.
일부 구현예에서, (a)의 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열에 대해 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함한다.
일부 구현예에서, (a)의 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, (b)의 융합 단백질은 서열번호 47의 아미노산 서열에 대해 적어도 80% 동일성을 갖는 아미노산 서열을 포함한다.
일부 구현예에서, (b)의 융합 단백질은 서열번호 47의 아미노산 서열에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함한다.
일부 구현예에서, (b)의 융합 단백질은 서열번호 47의 아미노산 서열을 포함한다.
일부 구현예에서, (b)의 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열에 대해 적어도 70% 동일성을 갖는 뉴클레오티드 서열을 포함한다.
일부 구현예에서, (b)의 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열에 대해 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함한다.
일부 구현예에서, (b)의 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, mRNA는 지질 나노입자 내 제형화된다.
일부 구현예에서, 조성물은 지질 나노입자를 추가로 포함한다.
일부 구현예에서, (a)의 mRNA는 지질 나노입자 내 제형화되고, (b)의 mRNA는 지질 나노입자 내 제형화된다.
일부 구현예에서, 지질 나노입자는 양이온성 지질을 포함한다.
일부 구현예에서, 지질 나노입자는 중성 지질을 추가로 포함한다.
일부 구현예에서, 지질 나노입자는 스테롤을 추가로 포함한다.
일부 구현예에서, 지질 나노입자는 폴리에틸렌 글리콜(PEG)-변형된 지질을 추가로 포함한다.
일부 구현예에서, 지질 나노입자는 이온화 가능한 양이온성 지질, 중성 지질, 스테롤, 및 PEG-변형된 지질을 포함한다.
일부 구현예에서, 이온화 가능한 양이온성 지질은 헵타데칸-9-일 8((2 하이드록시에틸)(6 옥소 6-(운데실옥시)헥실)아미노)옥타노에이트 (화합물 1)이다.
일부 구현예에서, 중성 지질은 1,2 디스테아로일-sn-글리세로-3-포스포콜린(DSPC)이다.
일부 구현예에서, 스테롤은 콜레스테롤이다.
일부 구현예에서, PEG-변형된 지질은 1,2 디미리스토일-sn-글리세롤, 메톡시폴리에틸렌글리콜(PEG2000 DMG)이다.
일부 구현예에서, 지질 나노입자는 20-60 mol%의 이온화 가능한 양이온성 지질, 5-25 mol%의 중성 지질, 25-55 mol%의 스테롤, 및 0.5-15 mol%의 PEG-변형된 지질을 포함한다.
일부 구현예에서, 지질 나노입자는 47 mol%의 이온화 가능한 양이온성 지질; 11.5 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 3.0 mol%의 PEG-변형된 지질; 48 mol%의 이온화 가능한 양이온성 지질; 11 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 2.5 mol%의 PEG-변형된 지질; 49 mol%의 이온화 가능한 양이온성 지질; 10.5 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 2.0 mol%의 PEG-변형된 지질; 50 mol%의 이온화 가능한 양이온성 지질; 10 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 1.5 mol%의 PEG-변형된 지질; 또는 51 mol%의 이온화 가능한 양이온성 지질; 9.5 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 1.0 mol%의 PEG-변형된 지질:을 포함한다.
일부 구현예에서, 지질 나노입자는 47 mol%의 화합물 1; 11.5 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 3.0 mol%의 PEG2000 DMG; 48 mol%의 화합물 1; 11 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 2.5 mol%의 PEG2000 DMG; 49 mol%의 화합물 1; 10.5 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 2.0 mol%의 PEG2000 DMG; 50 mol%의 화합물 1; 10 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 1.5 mol%의 PEG2000 DMG; 또는 51 mol%의 화합물 1; 9.5 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 1.0 mol%의 PEG2000 DMG를 포함한다.
본 개시의 추가 측면은 SARS-CoV-2에 대한 중화 항체 반응을 대상체에서 유도하기에 효과적인 양으로 선행하는 청구항 중 어느 한 항의 mRNA 또는 조성물을 대상체에게 투여하는 단계를 포함하는 방법을 제공한다.
본 개시의 다른 측면은 SARS-CoV-2에 대한 및 T 세포 면역 반응을 대상체에서 유도하기에 효과적인 양으로 선행하는 청구항 중 어느 한 항의 mRNA 또는 조성물을 대상체에게 투여하는 단계를 포함하는 방법을 제공한다.
본 개시의 일부 측면은 SARS-CoV-2에 대한 면역 반응, 예컨대 중화 항체 반응을 유도할 수 있는 코로나바이러스 항원을 암호화하는 오픈 리딩 프레임(ORF)을 포함하는 메신저 리보핵산(mRNA)을 제공하고, 상기 항원은 SARS-CoV-2의 단백질 단편 또는 기능성 단백질 도메인을 포함하며, 선택적으로 상기 RNA는 지질 나노입자 내 제형화된다.
일부 구현예에서, 항원은 기능성 단백질 도메인이다.
일부 구현예에서, 단백질 도메인은 SARS-CoV-2 스파이크 단백질의 N-말단 도메인(NTD)이다.
일부 구현예에서, NTD는 막횡단 도메인, 선택적으로 인플루엔자 혈구응집소 막횡단 도메인에 연결된다.
일부 구현예에서, 항원은 서열번호 47의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 47의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, 단백질 도메인은 SARS-CoV-2 스파이크 단백질의 수용체 결합 도메인(RBD)이다.
일부 구현예에서, RBD는 가용성이다.
일부 구현예에서, 항원은 서열번호 62의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 62의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 61의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 61의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, RBD는 막횡단 도메인, 선택적으로 인플루엔자 혈구응집소 막횡단 도메인에 연결된다.
일부 구현예에서, 항원은 서열번호 77의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 77의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, NTD는 SARS-CoV-2 스파이크 단백질의 RBD에 연결되어 NTD-RBD 융합 단백질을 형성한다.
일부 구현예에서, NTD-RBD 융합은 막횡단 도메인(TM), 선택적으로 인플루엔자 혈구응집소 막횡단 도메인에 연결되어 NTD-RBD-TM 단백질을 형성한다.
일부 구현예에서, 항원은 서열번호 92의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 92의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 91의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 91의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, NTD-RBD 융합은 C-말단 절단을 포함한다.
일부 구현예에서, 항원은 서열번호 107의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 107의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 106의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 106의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, NTD 및/또는 RBD는 확장된 영역을 포함한다.
일부 구현예에서, 항원은 서열번호 59, 86, 89, 116, 119, 또는 122 중 임의의 하나의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 59, 86, 89, 116, 119, 또는 122 중 임의의 하나의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 58, 85, 88, 115, 118, 또는 121 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 58, 85, 88, 115, 118, 또는 121 중 임의의 하나의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, 단백질 도메인은 SARS-CoV-2 스파이크 단백질의 S1 서브유닛 도메인이다.
일부 구현예에서, S1 서브유닛은 가용성이다.
일부 구현예에서, 항원은 서열번호 5의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 5의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 3의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 3의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, S1 서브유닛은 막횡단 도메인, 선택적으로 인플루엔자 혈구응집소 막횡단 도메인에 연결된다.
일부 구현예에서, 항원은 서열번호 17의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 17의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 16의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 16의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, S1 서브유닛은 S 단백질의 RBD 또는 RBD의 일부를 제거하도록 변형되었다.
일부 구현예에서, 항원은 서열번호 20, 23, 26, 29, 32 또는 35 중 임의의 하나의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 20, 23, 26, 29, 32 또는 35 중 임의의 하나의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 19, 22, 25, 28, 41, 또는 34 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 19, 22, 25, 28, 31, 또는 34 중 임의의 하나의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, S1 서브유닛은 S 단백질의 S2 서브유닛에 연결된다.
일부 구현예에서, S2 서브유닛은 SARS-CoV-2 S 단백질로부터 유래된 것이다.
일부 구현예에서, S1 서브유닛은 HKU1 S 단백질로부터 유래된 것이다.
일부 구현예에서, 항원은 서열번호 38의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 38의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 37의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 37의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, S1 서브유닛은 OC43 S 단백질로부터 유래된 것이다.
일부 구현예에서, 항원은 서열번호 41의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 41의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 40의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 40의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, 항원은 페리틴, 루마진 합성효소 및 폴던(foldon)으로부터 선택적으로 선택되는, 스캐폴드 도메인을 추가로 포함한다.
일부 구현예에서, 스캐폴드 도메인은 페리틴이다.
일부 구현예에서, 항원은 서열번호 8 또는 65의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 8 또는 65의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 7 또는 64의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 7 또는 64의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, 스캐폴드 도메인은 루마진 합성효소이다.
일부 구현예에서, 항원은 서열번호 11, 14, 68, 또는 71 중 임의의 하나의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 11, 14, 68, 또는 71 중 임의의 하나의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 10, 13, 67, 또는 70 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 10, 13, 67, 또는 70 중 임의의 하나의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, 스캐폴드 도메인은 폴던이다.
일부 구현예에서, 항원은 서열번호 44, 50, 74, 80, 83, 101, 104 또는 113 중 임의의 하나의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 44, 50, 74, 80, 83, 101, 104 또는 113 중 임의의 하나의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 43, 49, 73, 79, 82, 100, 103, 또는 112 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 43, 49, 73, 79, 82, 100, 103, 또는 112 중 임의의 하나의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, 항원은 대식세포 마커, 선택적으로 CD86, CD11B 및/또는 VSVGct로부터 선택적으로 선택되는, 트래피킹 신호를 추가로 포함한다.
일부 구현예에서, 항원은 서열번호 95, 98, 또는 110 중 임의의 하나의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 95, 98, 또는 110 중 임의의 하나의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 94, 97, 또는 109 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 94, 97, 또는 109 중 임의의 하나의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, mRNA는 지질 나노입자 내 제형화된다.
일부 구현예에서, 지질 나노입자는 양이온성 지질, 선택적으로 이온화 가능한 양이온성 지질, 중성 지질, 스테롤, 및/또는 폴리에틸렌 글리콜(PEG)-변형된 지질을 포함한다. 이온화 가능한 양이온성 지질은 이온화 가능한 지질을 지칭하기 위해 이온화 가능한 지질 및 양이온성 지질과 본원에서 상호교환적으로 사용된다. 일부 구현예에서, 지질 나노입자는 40-50 mol%, 선택적으로 45-50 mol%, 예를 들어, 45-46 mol%, 46-47 mol%, 47-48 mol%, 48-49 mol%, 또는 49-50 mol%, 예를 들어, 약 45 mol%, 45.5 mol%, 46 mol%, 46.5 mol%, 47 mol%, 47.5 mol%, 48 mol%, 48.5 mol%, 49 mol%, 또는 49.5 mol%의 이온화 가능한 지질을 포함한다. 일부 구현예에서, 지질 나노입자는 30-45 mol%, 선택적으로 35-40 mol%, 예를 들어, 30-31 mol%, 31-32 mol%, 32-33 mol%, 33-34 mol%, 35-35 mol%, 35-36 mol%, 36-37 mol%, 38-38 mol%, 38-39 mol%, 또는 39-40 mol%의 스테롤을 포함한다. 일부 구현예에서, 지질 나노입자는 5-15 mol%, 선택적으로 10-12 mol%, 예를 들어, 5-6 mol%, 6-7 mol%, 7-8 mol%, 8-9 mol%, 9-10 mol%, 10-11 mol%, 11-12 mol%, 12-13 mol%, 13-14 mol%, 또는 14-15 mol%의 헬퍼 지질을 포함한다. 일부 구현예에서, 지질 나노입자는 1-5%, 선택적으로 1-3 mol%, 예를 들어 1.5 내지 2.5 mol%, 1-2 mol%, 2-3 mol%, 3-4 mol%, 또는 4-5 mol%의 PEG 지질을 포함한다.
일부 구현예에서, 이온화 가능한 양이온성 지질은 헵타데칸-9-일 8((2 하이드록시에틸)(6 옥소 6-(운데실옥시)헥실)아미노)옥타노에이트 (화합물 1)이고, 중성 지질은 1,2 디스테아로일-sn-글리세로-3-포스포콜린(DSPC)이며, 스테롤은 콜레스테롤이고/이거나, PEG-변형된 지질은 1,2 디미리스토일-sn-글리세롤, 메톡시폴리에틸렌글리콜(PEG2000 DMG)이다.
일부 구현예에서, 지질 나노입자는 20-60 mol%의 이온화 가능한 양이온성 지질, 5-25 mol%의 중성 지질, 25-55 mol%의 스테롤, 및 0.5-15 mol%의 PEG-변형된 지질을 포함한다.
일부 구현예에서, 지질 나노입자는 47 mol%의 이온화 가능한 양이온성 지질; 11.5 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 3.0 mol%의 PEG-변형된 지질; 48 mol%의 이온화 가능한 양이온성 지질; 11 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 2.5 mol%의 PEG-변형된 지질; 49 mol%의 이온화 가능한 양이온성 지질; 10.5 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 2.0 mol%의 PEG-변형된 지질; 50 mol%의 이온화 가능한 양이온성 지질; 10 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 1.5 mol%의 PEG-변형된 지질; 또는 51 mol%의 이온화 가능한 양이온성 지질; 9.5 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 1.0 mol% PEG-변형된 지질:을 포함한다.
일부 구현예에서, 지질 나노입자는 47 mol%의 화합물 1; 11.5 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 3.0 mol%의 PEG2000 DMG; 48 mol%의 화합물 1; 11 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 2.5 mol%의 PEG2000 DMG; 49 mol%의 화합물 1; 10.5 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 2.0 mol%의 PEG2000 DMG; 50 mol%의 화합물 1; 10 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 1.5 mol%의 PEG2000 DMG; 또는 51 mol%의 화합물 1; 9.5 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 1.0 mol%의 PEG2000 DMG:를 포함한다.
국제출원번호 PCT/US2016/058327호(공개번호 WO2017/070626호) 및 국제출원번호 PCT/US2018/022777호(공개번호 WO2018/170347호)의 전체 내용이 참조로 본원에 포함된다.
SARS-Cov-2
SARS-CoV-2의 게놈은 약 9860개의 아미노산을 암호화하는 29.8-30 kb의 크기를 갖는 단일-가닥 양성-센스 RNA(+ssRNA)이다(Chan 등 2000, 상기; Kim 등 2020 Cell, May 14; 181(4):914-921.e10.). SARS-CoV-2는 5'-캡 및 3'-폴리-A 꼬리를 갖는 다시스트론성(polycistronic) mRNA이다. SARS-CoV-2 게놈은 구조 단백질 및 비구조 단백질(Nsps)을 암호화하는 특정 유전자로 구성된다. 게놈에서 구조 단백질의 순서는 5'-복제효소(오픈 리딩 프레임(ORF)1/ab)-구조 단백질[스파이크(S)-외피(E)-막(M)-뉴클레오캡시드(N)]-3'이다. 코로나바이러스의 게놈에는 부속 단백질, 비구조 단백질 및 구조 단백질을 암호화하는 다양한 수의 오픈 리딩 프레임이 포함된다(Song 등 2019 Viruses;11(1):p. 59). 대부분의 항원성 펩티드는 구조 단백질에 위치한다(Cui 등 2019 Nat. Rev. Microbiol.;17(3):181-192). 스파이크 표면 당단백질(S), 작은 외피 단백질(E), 기질 단백질(M) 및 뉴클레오캡시드 단백질(N)은 4가지 주요 구조 단백질이다. S-단백질은 세포 친화성에 기여하기 때문에 이는 중화 항체(NAb) 및 보호 면역을 유도할 수 있으며, 이는 다른 모든 구조 단백질 중 코로나바이러스 백신 개발에 있어서 가장 중요한 표적 중 하나로 간주될 수 있다. 또한, 아미노산 서열 분석은 S-단백질이 코로나바이러스 중에서 보존된 영역을 포함하고 있는 것으로 나타났으며, 이는 보편적 백신 개발의 기초가 될 수 있다.
항원
본 발명의 조성물, 예를 들어, 백신 조성물은 관심 항원, 예를 들어, 베타코로나바이러스 구조 단백질로부터 유래된 항원, 특히 SARS-CoV-2 스파이크 단백질로부터 유래된 항원을 암호화하도록 디자인된 핵산, 특히 mRNA를 특징으로 한다. 본 발명의 조성물, 예를 들어, 백신 조성물은 항원 자체를 포함하지 않고, 오히려 핵산, 특히 세포, 조직 또는 대상체에 일단 전달되면 항원 또는 항원성 서열을 암호화하는 mRNA(들)을 포함한다. 핵산 분자, 특히 mRNA(들)의 전달은 적절한 담체 또는 전달 비히클(예를 들어, 지질 나노입자) 내 상기 핵산 분자를 제형화함으로써 달성되며, 이는 세포, 조직 또는 대상체에 투여시, 핵산은 결국 핵산, 예를 들어 mRNA에 의해 암호화된 단백질을 발현하는 세포에 의해 흡수되도록 한다. 본원에 사용된 바와 같이, 용어 "항원"은 면역 반응을 유도하는, 예를 들어, 대상체에 존재할 때 (예를 들어, 인간 또는 포유동물 대상체에 존재할 때) 면역 반응을 유도하는 단백질(예를 들어, 당단백질), 폴리펩티드, 펩티드 등과 같은 물질을 지칭한다. 본 발명은 적어도 부분적으로 mRNA-암호화된 항원이, 세포 또는 대상체에 투여된 mRNA로부터 발현될 때, 상기 면역 시스템이 발현된 항원에 대한 면역 반응을 생성하도록 할 수 있으며, 예를 들어, 발현된 항원에 대한 항체, 예를 들어, 결합 및/또는 중화 항체의 생산을 유발할 수 있고, 발현된 항원에 특이적인 B 및/또는 T 세포 반응을 유발할 수 있다는 이해에 기초하며, 궁극적으로 항원 또는 항원과 관련된 병원체와의 후속 조우에 대해 보호 또는 예방 반응을 유발할 수 있다. 바람직한 mRNA-암호화된 항원은 "바이러스 항원"이다. 본원에 사용된 바와 같이, 용어 "바이러스 항원"은 바이러스, 예를 들어 병원성 바이러스로부터 유래된 항원을 지칭한다. 본원에 사용된 바와 같은 용어 항원은 전장 단백질, 예를 들어, 전장 바이러스 단백질을 지칭할 수 있거나, 단백질의 단편(예를 들어, 폴리펩티드 또는 펩티드 단편), 서브유닛 또는 도메인, 예를 들어 바이러스 단백질 서브유닛 또는 도메인을 지칭할 수 있다.
많은 단백질은 하나 이상의 폴리펩티드 또는 올리고머 분자로 결합되는 여러 폴리펩티드 사슬로 구성된 4차 또는 3차원 구조를 갖는다. 본원에 사용된 바와 같이, 용어 "서브유닛"은 단일 단백질 분자, 예를 들어 초기 단백질 분자의 처리로부터 생성된 폴리펩티드 또는 폴리펩타이드 사슬을 지칭하며, 이 서브유닛은 다른 단백질 분자(예를 들어, 서브유닛 또는 사슬)와 조립(또는 "공조립")되어 단백질 복합체를 형성한다. 단백질은 비교적 적은 수의 서브유닛을 가질 수 있고 따라서 "올리고머"로 기술되거나, 많은 수의 서브유닛으로 구성될 수 있고 따라서 "다량체"로 기술될 수 있다. 올리고머 또는 다량체 단백질의 서브유닛은 동일하거나, 상동적이거나, 완전히 다를 수 있으며, 이질적인 작업에 전념할 수 있다.
단백질 또는 단백질 서브유닛은 도메인을 추가로 포함할 수 있다. 본원에 사용된 바와 같이, 용어 "도메인"은 단백질 내의 별개의 기능적 및/또는 구조적 단위를 지칭한다. 전형적으로 "도메인"은 특정 기능 또는 상호작용을 담당하며, 단백질의 전반적인 역할에 기여한다. 도메인은 다양한 생물학적 맥락에서 존재할 수 있다. 유사한 도메인(즉, 구조적, 기능적 및/또는 서열 상동성을 공유하는 도메인)은 단일 단백질 내에 존재할 수 있거나 유사하거나 상이한 기능을 갖는 별개의 단백질 내에 존재할 수 있다. 단백질 도메인은 종종 단백질의 나머지 또는 이의 서브유닛과 독립적으로 기능하고 존재할 수 있는 주어진 단백질 3차 구조 또는 서열의 보존된 부분이다.
구조적 및 분자 생물학에서, SARS-CoV-2 바이러스 게놈 서열이 발표된 직후에 수행된 바와 같이, 동일하거나 상동적이거나 유사한 서브유닛 또는 도메인은 새로 확인되거나 새로운 단백질을 분류하는 데 도움이 될 수 있다.
본원에 사용된 바와 같이, 용어 항원은 항원 결합 부위에 의해 인식될 수 있지만, 면역 반응을 유도하기에는 불충분한 항원, 예를 들어, 폴리펩티드 또는 탄수화물 구조의 하부구조인 용어 "에피토프"와 구별된다. 당해 기술은 대상체 또는 면역 세포에 단리된 형태, 예를 들어, 분리된 단백질, 폴리펩티드 또는 펩티드 항원로 전달되는 단백질 항원을 기술하지만, 단백질 항원의 디자인, 시험, 검증 및 생산은 특히 대규모로 단백질을 생산할 때 비용이 많이 들고 시간이 많이 소요될 수 있다. 대조적으로, mRNA 기술은 다양한 항원을 암호화하는 mRNA 작제물의 신속한 디자인 및 시험에 적합하다. 더욱이, 적절한 전달 비히클(예를 들어, 지질 나노입자)에 제제와 결합된 mRNA의 신속한 생산은 신속하게 처리될 수 있고 대규모로 mRNA 백신을 신속하게 생산할 수 있다. 잠재적인 이점은 또한 본 발명의 mRNA에 의해 암호화된 항원이 대상체의 세포에 의해 발현되며, 예를 들어, 인체에 의해 발현되고, 따라서 대상체, 예를 들어, 인체는 항원을 생산하기 위한 "공장" 역할을 한다는 사실로부터 발생하며, 이는 결국, 원하는 면역 반응을 유도한다.
바람직한 측면에서, 항원은 면역 반응을 유도할 수 있는 (예를 들어, 면역 시스템이 항원에 대한 항체를 생산하도록 하는) 단백질이다. 본원에서, 용어 "항원"의 사용은 달리 언급되지 않는 한, 면역원성 단백질, 뿐만 아니라 면역원성 단백질, 예를 들어 면역원성 단편(항원에 대한 면역 반응을 유도하는 (또는 유도할 수 있는) 면역원성 단편)으로부터 유래된 폴리펩티드 또는 펩티드를 포괄한다. 용어 "단백질"은 폴리펩티드 및 펩티드를 포괄하고, 용어 "항원"은 항원성 단편을 포괄하는 것으로 이해되어야 한다. 다른 분자는 항원성, 예컨대 박테리아 다당류 또는 단백질 및 다당류 구조의 조합일 수 있으나, 본원에 포함된 바이러스 백신의 경우, 바이러스 단백질, 바이러스 단백질의 단편과 베타코로나바이러스 SARS-CoV-2로부터 유래된 디자인 및/또는 돌연변이된 단백질이 본원에 특징화된 항원이다.
핵산/mRNA
본원에 기술된 백신 기술은 핵산, 특히 관심 항원, 예를 들어, 베타코로나바이러스 스파이크 단백질 항원, 서브유닛, 도메인 또는 이의 단편(예를 들어, 항원성 단편)을 암호화하도록 디자인된 메신저 RNA(mRNA)를 특징으로 한다. 본 발명의 핵산, 예를 들어 mRNA는 바람직하게는 핵산, 예를 들어, mRNA가 생체내 사용에 적합하도록 적절한 담체 또는 전달 비히클(예를 들어, 지질 나노입자) 내 제형화된다. 적절하게 제형화되는 경우, 핵산, 예를 들어 mRNA는 대상체, 예를 들어, 인간 대상체 내의 세포 및/또는 조직에 전달되어, 이들 핵산에 의해 암호화된 단백질의 번역을 달성할 수 있다.
핵산 분자는 유전 정보를 운반하고 단백질 합성의 과정을 지시함으로써, 모든 세포 기능은 아닐지라도 대부분을 지시하는 연결된 뉴클레오티드로 구성된 거대분자이다. 핵산은 뉴클레오티드의 중합체(뉴클레오티드 단량체)를 포함한다. 따라서, 핵산은 폴리뉴클레오티드(폴리뉴클레오티드 사슬로도 지칭됨)로도 지칭된다. 핵산의 두 가지 주요 부류는 데옥시리보핵산(DNA) 및 리보핵산(RNA)이다. DNA는 모든 독립생활(free-living) 유기체 및 대부분의 바이러스에서 유전 물질을 구성한다. RNA는 특정 바이러스의 유전 물질이지만, 모든 살아있는 세포에서도 발견되며, 이는 세포 공정, 특히 단백질 제조에 중요한 역할을 한다.
뉴클레오시드는 DNA 및 RNA와 같은 핵산의 구조적 서브유닛이다. 뉴클레오시드는 질소 염기(핵염기), 일반적으로 피리미딘(시토신, 티민 또는 우라실) 또는 퓨린(아데닌 또는 구아닌)으로 구성되며, 이는 5탄소 탄수화물 리보스 또는 리보스 또는 데옥시리보스 중 하나인 "당"에 공유결합되어 부착된다. 뉴클레오티드는 질소 염기, 당(리보스 또는 데옥시리보스) 및 1개 내지 3개의 인산기로 구성된다. 본질적으로, 뉴클레오티드는 단순히 추가 포스페이트기 또는 기를 갖는 뉴클레오시드이다.
핵산 분자인 DNA 및 RNA는 하나의 뉴클레오티드의 당 염기와 인접한 뉴클레오티드의 인산기 사이에 에스테르 결합이라고 하는 화학적 결합에 의해 사슬로 서로 연결된 뉴클레오티드로 구성된다. 당은 각 뉴클레오티드의 3' 말단이고, 인산염은 5' 말단이다. 하나의 뉴클레오티드에 있는 당의 5' 탄소에 부착된 인산기는 다음 뉴클레오티드의 3' 탄소에 있는 유리 하이드록실과 에스테르 결합을 형성한다. 이러한 결합을 포스포디에스테르 결합이라고 하며, 당-인산염 백본은 분자가 합성될 때 5'에서 3' 방향으로 확장되거나 성장하는 것으로 기술된다.
핵산의 핵염기 부분은 DNA에서 아데닌(A) 및 구아닌(G)인 퓨린 염기, 및 시토신(C), 티민(T)인 피리미딘 염기, 그리고 RNA에서 우라실(U)을 특징으로 한다. 핵산의 당 부분은 DNA에서 데옥시리보스, RNA에서 리보스를 특징으로 한다. 5개의 뉴클레오시드는 일반적으로 각각 하나의 문자 코드 A, G, C, T 및 U로 축약된다. 그러나, 티미딘은 우리딘에서 발견되는 리보푸라노스 고리보다 2'-데옥시리보푸라노스 모이어티를 포함하므로, "dT"("d"는 "데옥시"를 나타냄)로 더 일반적으로 작성된다. 티미딘은 리보핵산(RNA)이 아닌 데옥시리보핵산(DNA)에서 발견되기 때문이다. 반대로, 우리딘은 DNA가 아닌 RNA에서 발견된다. 나머지 3개의 뉴클레오시드는 RNA 및 DNA 둘 다에서 발견될 수 있다. RNA에서, A, C 및 G로 표시되지만 DNA에서 이들은 dA, dC 및 dG로 표시될 수 있다.
당업자는 달리 언급되지 않는 한, 본 출원에 제시된 핵산 서열은 대표적인 DNA 서열에서 "T"를 언급할 수 있지만, 서열이 mRNA를 나타내는 경우, "T"는 "U"로 치환될 것임을 이해할 것이다. 따라서, 본원에서 특정 서열 식별 번호에 의해 개시되고 확인된 임의의 DNA는 또한 DNA에 상보적인 상응하는 mRNA 서열을 개시하며, 이때 DNA 서열의 각 "T"는 "U"로 치환된다.
핵산은 예를 들어, 데옥시리보핵산(DNA), 리보핵산(RNA), 예를 들어, mRNA, 트레오스 핵산(TNA), 글리콜 핵산(GNA), 펩티드 핵산(PNA), 잠금 핵산(β-D-리보 배열을 갖는 LNA, α-L-리보 배열을 갖는 α-LNA(LNA의 부분입체 이성질체), 2'-아미노 작용기를 갖는 2'-아미노, 및 2'-아미노 작용기를 갖는 2'-아미노-α-LNA를 포함하는, LNA), 에틸렌 핵산(ENA), 사이클로헥세닐 핵산 (CeNA) 및/또는 키메라 및/또는 이들의 조합이거나 이를 포함할 수 있다.
본 발명은 메신저 RNA(mRNA), 특히 관심 항원, 예를 들어, 베타코로나바이러스 스파이크 단백질 항원, 서브유닛, 도메인 또는 이의 단편(예를 들어, 항원성 단편)을 암호화하도록 디자인된 mRNA를 특징으로 한다. RNA의 하위유형인 메신저 RNA(mRNA)는 유전자의 유전적 서열에 상응하는 RNA의 단일-가닥 분자이다. mRNA는 DNA의 단일 가닥이 RNA 중합효소에 의해 해독되고, mRNA가 합성되는, 즉 전사되는 전사의 과정 동안 생성된다. mRNA는 단백질 합성, 즉 번역 과정에서 리보솜에 의해 판독된다. 따라서, 메신저 RNA(mRNA)는 (적어도 하나의) 단백질(천연-발생, 비-천연-발생 또는 아미노산의 변형된 중합체)을 암호화하는 RNA이며, 이는 시험관내, 생체내, 제자리(in situ) 또는 생체외에서 암호화된 단백질을 생성하도록 변역될 수 있다.
본 개시의 조성물은 코로나바이러스 항원을 암호화하는 오픈 리딩 프레임(ORF)을 갖는 (적어도 하나의) mRNA를 포함한다. 일부 구현예에서, mRNA는 5' UTR, 3' UTR, 폴리(A) 꼬리 및/또는 5' 캡 또는 캡 유사체를 추가로 포함한다. 오픈 리딩 프레임(ORF)은 시작 코돈(예를 들어, 메티오닌(ATG 또는 AUG))으로 시작하고 종료 코돈(예를 들어, TAA, TAG 또는 TGA, 또는 UAA, UAG 또는 UGA)으로 끝나는 DNA 또는 RNA의 연속적인 스트레치이다. ORF는 전형적으로 단백질을 암호화한다. 본원에 개시된 서열은 추가 요소, 예를 들어 5' 및 3' UTR을 추가로 포함할 수 있지만, 이러한 요소는 ORF와 달리 본 개시의 mRNA에 반드시 존재할 필요는 없다는 것이 이해될 것이다. 또한, 본 발명의 mRNA, 예를 들어 본 개시의 베타코로나바이러스 백신에 특징이 있는 mRNA는 임의의 5' 비번역 영역(UTR) 및/또는 임의의 3' UTR을 포함할 수 있음을 이해해야 한다. 예시적인 UTR 서열은 서열 목록(예를 들어, 서열번호 2, 4, 131, 및 132)에 제공되고; 그러나, 다른 UTR 서열은 본원에 기술된 임의의 UTR 서열에 대해 사용되거나 교환될 수 있다. UTR은 또한 본원에 제공된 mRNA로부터 생략될 수 있다.
일부 구현예에서, 조성물은 서열번호 45, 75, 또는 90 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 뉴클레오티드 서열을 포함하는 mRNA를 포함한다. 일부 구현예에서, 조성물은 표 1-15의 서열 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 뉴클레오티드 서열을 포함하는 mRNA를 포함한다.
일부 구현예에서, 조성물은 서열번호 46, 76, 또는 91 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 ORF를 포함하는 mRNA를 포함한다. 일부 구현예에서, 조성물은 표 1-15의 서열 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 ORF를 포함하는 mRNA를 포함한다.
본 개시의 조성물의 코로나바이러스 항원 및 코로나바이러스 항원을 암호화하는 mRNA의 예시적인 서열은 표 1-15에 제공된다.
본원에 기술된 mRNA에 의해 암호화된 항원 중 임의의 하나는 신호 서열을 포함하거나 포함하지 않을 수 있음을 이해해야 한다.
암호화된 코로나바이러스 스파이크(S) 단백질 항원
공지된 베타 코로나바이러스의 외피 스파이크(S) 단백질은 바이러스 숙주 친화성과 숙주 세포로의 진입을 결정한다. 코로나바이러스 스파이크(S) 단백질은 중화 항체 및 보호 면역을 유도할 수 있으므로 백신 디자인을 위한 선택 항원이다. S 단백질은 SARS-CoV-2 감염에 중요하다. S 단백질의 구조는 SARS-CoV-2, SARS-CoV, MERS-CoV, HKU1-CoV, MHV-CoV 및 NL63-CoV와 같은 베타 코로나바이러스 간에 유사하다.
본원에 사용된 바와 같이, 용어 "스파이크 단백질"은 베타코로나바이러스를 비롯한 바이러스의 외피(바이러스 표면)로부터 돌출된 동종삼량체를 형성하는 당단백질을 지칭한다. 삼량체화된 스파이크 단백질은 숙주 세포 표면의 수용체에 결합한 후 바이러스 및 숙주 세포막의 융합에 의해 숙주 세포 내로 비리온의 진입을 촉진한다. S 단백질은 바이러스 유형에 따라 1,160 내지 1,400개의 아미노산으로 구성된 고도로 글리코실화된 큰 유형 I 막횡단 융합 단백질이다. 베타코로나바이러스 스파이크 단백질은 약 1100 내지 1500개의 아미노산을 포함하고 도 1에 제시된 바와 같은 구조(즉, 도메인 조성 및 구성)를 포함한다. SARS-CoV-2 스파이크(S) 단백질은 중화 항체 및 보호 면역을 유도할 수 있으므로 백신 디자인을 위한 선택 항원이다. 본 발명의 mRNA는 SARS-CoV-2 스파이크 단백질(즉, mRNA가 세포 또는 조직, 예를 들어 대상체의 세포 또는 조직에 전달될 때 스파이크 단백질이 발현되도록 암호화된 스파이크 단백질), 뿐만 아니라 이의 항원성 변이체를 생성하도록 디자인된다. 당업자는 본질적으로 전장 또는 완전한 스파이크 단백질은 바이러스, 예를 들어, 베타코로나바이러스가 숙주 세포로의 바이러스 진입을 촉진하는 이의 의도된 기능을 수행하는 데 필요할 수 있지만, 스파이크 단백질에 대한 면역 반응을 주로 유도하기 위해 모색할 때 스파이크 단백질 구조 및/또는 서열의 특정 양의 변화가 용인됨을 이해할 것이다. 예를 들어, 암호화된 스파이크 단백질, 예를 들어, 암호화된 스파이크 단백질 항원의 N- 또는 C-말단에서 1개 내지 소수개, 가능하게는 최대 5개 또는 최대 10개의 아미노산의 약간의 절단은, 단백질의 항원성 특성을 변경시키지 않으면서 용인될 수 있다. 마찬가지로, 암호화된 스파이크 단백질, 예를 들어 암호화된 스파이크 단백질 항원의 1개 내지 소수개, 가능하게는 최대 5개 또는 최대 10개 (또는 그 이상)의 아미노산의 변이(예를 들어, 보존적 치환)는, 단백질의 항원성 특성을 변경시키지 않으면서 용인될 수 있다. 예시적인 구현예에서, 스파이크 단백질, 예를 들어 암호화된 스파이크 단백질 항원은 표 1-15의 서열 중 임의의 하나에 제시된 바와 같은 (예를 들어, 서열번호 125로 제시된 아미노산 서열로부터 유래된) 아미노산 서열을 갖는다. 다른 구현예에서, 스파이크 단백질, 예를 들어 암호화된 스파이크 단백질 항원은, 표 1-15의 서열 중 임의의 하나에 제시된 바와 같은 (예를 들어, 서열번호 125로 제시된 아미노산 서열로부터 유래된) 아미노산 서열을 갖는 스파이크 단백질과 (정렬된 경우) 비교하여 100개 이하, 90개 이하, 80개 이하, 70개 이하, 60개 이하, 50개 이하, 40개 이하, 30개 이하, 20개 이하, 10개 이하, 또는 5개 이하의 아미노산 치환 및/또는 결실을 갖는다. 암호화된 스파이크 단백질 서열에 약간의 변이가 있는 경우, 변이체는 바람직하게는 참조 스파이크 단백질 서열과 동일한 활성을 갖고/갖거나, 예를 들어 면역검정법(예를 들어, 효소-결합 면역흡착 검정법(ELISA 검정법))에서 측정된 바와 같이, 참조 스파이크 단백질과 동일한 면역 특이성을 갖는다.
코로나바이러스의 S 단백질은 두 가지 중요한 기능적 서브유닛으로 나눌 수 있으며, 이 중 S 단백질의 구형 머리를 형성하는 N-말단 S1 서브유닛 및 단백질의 스톡(stalk)을 형성하는 C-말단 S2 영역이 포함되며, 이는 바이러스 외피에 직접적으로 매립된다. 잠재적인 숙주 세포와 상호작용 시, S1 서브유닛은 숙주 세포 상의 수용체, 특히 안지오텐신 전환 효소 2(ACE2) 수용체를 인식하고 결합하는 반면, S 단백질의 가장 보존된 구성 요소인 S2 서브유닛은 바이러스의 외피를 숙주 세포막과 융합시키는 역할을 할 것이다. (예를 들어, Shang 등, PLoS Pathog. 2020 Mar; 16(3):e1008392. 참조). 삼량체성 S 단백질 삼량체의 각 단량체는 각각 부착 및 막 융합을 매개하는 두 개의 서브유닛인 S1 및 S2를 함유한다. 예를 들어, 도 1을 참조한다. 생체내 감염 과정의 일부로서, 2개의 서브유닛은 효소적 절단 과정에 의해 서로 분리된다. S 단백질은 감염된 세포의 S1/S2 부위에서 퓨린-매개 절단에 의해 먼저 절단되며, 생체내에서 후속적인 세린 프로테아제-매개 절단 이벤트는 S1 내의 S2' 부위에서 발생한다. SARS-CoV2에서, S1/S2 절단 부위는 아미노산 676-TQTNSPRRAR / SVA-688(서열번호 127 참조)에 있는 것이다. S2' 절단 부위는 아미노산 811-KPSKR/SFI-818(서열번호 126 참조)에 있는 것이다.
본원에 사용된 바와 같이, 예를 들어, 본 발명의 핵산, 예컨대, mRNA에 의해 암호화되는 SARS-CoV-2 S 단백질 항원의 디자인과 관련하여, 용어 "S1 서브유닛"(예를 들어, S1 서브유닛 항원)은 S 단백질 N-말단에서 시작하여 S1/S2 절단 부위에서 끝나는 스파이크 단백질의 N-말단 서브유닛을 지칭하는 반면, 용어 "S2 서브유닛"(예를 들어, S2 서브유닛 항원)은 S1/S2 절단 부위에서 시작하여 스파이크 단백질의 C-말단에서 끝나는 스파이크 단백질의 C-말단 서브유닛을 지칭한다. 상기 기술된 바와 같이, 본질적으로 전장 또는 완전한 스파이크 단백질 S1 또는 S2 서브유닛은 각각 수용체 결합 또는 막 융합에 필요할 수 있지만, 스파이크 단백질 서브유닛에 대한 면역 반응을 주로 유도하기 위해 모색할 때 S1 또는 S2 구조 및/또는 서열의 특정 양의 변화가 용인됨을 이해할 것이다. 예를 들어, 암호화된 서브유닛, 예를 들어, 암호화된 S1 또는 S2 단백질 항원의 N- 또는 C-말단에서 1개 내지 소수개, 가능하게는 최대 4개, 5개, 6개, 7개, 8개, 9개 또는 10개의 아미노산의 약간의 절단은, 단백질의 항원성 특성을 변경시키지 않으면서 용인될 수 있다. 마찬가지로, 암호화된 스파이크 단백질 서브유닛, 예를 들어 암호화된 S1 또는 S2 단백질 항원의 1개 내지 소수개, 가능하게는 최대 4개, 5개, 6개, 7개, 8개, 9개 또는 10개 (또는 그 이상)의 아미노산의 변이(예를 들어, 보존적 치환)는, 단백질(들)의 항원성 특성을 변경시키지 않으면서 용인될 수 있다. 예시적인 구현예에서, 스파이크 단백질, 예를 들어 암호화된 스파이크 단백질 항원은 표 1-15의 서열 중 임의의 하나에 제시된 (예를 들어, 서열번호 125로 제시된 아미노산 서열로부터 유래된) 아미노산 서열을 갖는다. 다른 구현예에서, 스파이크 단백질 서브유닛, 예를 들어 암호화된 S1 또는 S2 단백질 항원은, 서열번호 125로 제시된 바와 같은 아미노산 서열을 갖는 스파이크 단백질의 아미노산 1-685를 포함하거나 이로 구성된 스파이크 단백질 S1 서브유닛 또는 아미노산 686-1273을 포함하거나 이로 구성된 스파이크 단백질 S2 서브유닛과 (정렬된 경우) 비교하여 50개 이하, 40개 이하, 30개 이하, 20개 이하, 10개 이하, 또는 5개 이하의 아미노산 치환 및/또는 결실을 갖는다. 암호화된 스파이크 단백질 서브유닛 서열에 약간의 변이가 있는 경우, 변이체는 바람직하게는 참조 스파이크 단백질 서브유닛 서열과 동일한 활성을 갖고/갖거나, 예를 들어 면역검정법(예를 들어, 효소-결합 면역흡착 검정법(ELISA 검정법))에서 측정된 바와 같이, 참조 스파이크 단백질 서브유닛과 동일한 면역 특이성을 갖는다.
SARS-CoV-2 스파이크 단백질의 S1 및 S2 서브유닛은 구조 및 기능으로 쉽게 식별할 수 있는 도메인을 추가로 포함하며, 이는 차례로 본 발명의 핵산 백신, 특히 mRNA 백신에 의해 암호화되는 항원을 디자인하는 데 특징이 될 수 있다. S1 서브유닛 내에서, 도메인은 N-말단 도메인(NTD) 및 수용체-결합 도메인(RBD)을 포함하고, 상기 RBD 도메인은 수용체-결합 모티프(RBM)를 추가로 포함한다. 야생형 S1 서브유닛은 또한 신호 펩티드(SD), NTD 도메인의 N-말단 및 제1 서브도메인(SD1) 및 제2 서브도메인(SD2)을 포함한다. S2 서브유닛 내에서, 도메인에는 융합 펩티드(FP), 헵타드 반복 1(HR1), 헵타드 반복 2(HR2), 막횡단 도메인(TM) 및 세포질 꼬리(CT)로도 알려진 세포질 도메인이 포함된다(Lu R. 등, 상기; Wan 등, J. Virol. Mar 2020, 94 (7) e00127-20). HR1 및 HR2 도메인은 SARS-CoV-2의 "융합 코어 영역"으로 지칭될 수 있다(Xia 등, 2020 Cell Mol Immunol. Jan; 17(1):1-12.). 도 1은 SARS-CoV-2 스파이크 단백질의 도메인 구조를 도시한다. S1 서브유닛은 N 말단 도메인(NTD), 링커 영역, 수용체 결합 도메인(RBD), 제1 서브도메인(SD1) 및 제2 서브도메인(SD2)을 포함한다. S1 서브유닛은 C-말단 막횡단 도메인(TM)을 추가하도록 변형되거나 이는 가용성일 수 있다. S2 서브유닛은 특히 제1 헵타드 반복(HR1), 제2 헵타드 반복(HR2), 막횡단 도메인(TM) 및 세포질 꼬리를 포함한다. 가용성 S2 서브유닛은 TM 도메인 없이 생성될 수 있다.
S1의 NTD 및 RBD는 이들 도메인이 베타코로나바이러스에 감염된 개체에서 항체를 중화시키는 표적인 것으로 나타났기 때문에 본 발명의 백신 디자인 접근법에 대한 우수한 항원이다. 본원에 사용된 바와 같이, 예를 들어, 항원 디자인 (본 발명의 mRNA에 의해 암호화되고, 예를 들어, 본 발명의 mRNA 백신 및 이의 유래로부터 발현되는 상기 항원)과 관련하여, 용어 "N-말단 도메인" 또는 "NTD"는 서열번호 125로 제시된 아미노산 서열을 갖는 스파이크 단백질의 S1 서브유닛의 아미노산 1-290과 동일성을 갖는, 길이가 대략 290개의 아미노산을 포함하는 SARS-CoV-2 S1 서브유닛 내의 도메인을 지칭한다. 본원에 사용된 바와 같이, 예를 들어, 항원 디자인 (본 발명의 mRNA에 의해 암호화되고, 예를 들어, 본 발명의 mRNA 백신 및 이의 유래로부터 발현되는 상기 항원)과 관련하여, 용어 "수용체 결합 도메인" 또는 "RBD"는 서열번호 125로 제시된 아미노산 서열을 갖는 스파이크 단백질의 S1 서브유닛의 아미노산 316-517과 동일성을 갖는, 길이가 대략 175-225개의 아미노산을 포함하는 SARS-CoV-2 S1 서브유닛 내의 도메인을 지칭한다. 본원에 사용된 바와 같이, 용어 "수용체 결합 모티프"는 ACE2 수용체와 직접적으로 접촉하는 RBD의 부분을 지칭한다. 발현된 RBD는 이의 수용체로서 안지오텐신 전환 효소 2(ACE2)에 특이적으로 결합하고/하거나 RBD-결합 및/또는 중화 항체, 예를 들어, CR3022와 특이적으로 반응할 것으로 예상된다.
본원에 제공된 조성물은 임의의 하나 이상의 전장 또는 부분(서열의 절단 또는 다른 결실) S 단백질 서브유닛(예를 들어, S1 또는 S2 서브유닛), S 단백질 서브유닛의 하나 이상의 도메인 또는 도메인의 조합(예를 들어, SD1 및/또는 SD2가 있거나 없는, NTD, RBD 또는 NTD-RBD 융합), 또는 전장 또는 부분 및 S2 단백질 서브유닛의 키메라를 암호화할 수 있는 mRNA를 포함한다. 다른 S 단백질 서브유닛 및/또는 도메인 구성이 본원에서 고려된다.
도 2도 6은 SARS-CoV-2 스파이크 단백질로부터 유래된 예시적인 도메인 및 서브유닛 항원을 도시한다. 도 2A 및 도 2B는 각각 가용성 및 막횡단 RBD 항원을 도시한다. 막횡단 NTD 항원은 도 2C에 도시된다. 도 2D-2F 및 도 2I에 도시된 도메인 항원은 각각 SP 및 TM 도메인을 갖는 NTD 및 RBD의 예시적인 융합 단백질을 나타낸다. 작제물 중 2개는 말단 트래피킹 도메인(CD86 및/또는 CD11b)을 갖는다. 도메인은 링커, 특히 GS 링커 또는 PADRE 링커를 통해 연결된다(도 2I). NTD 도메인에 대한 RBD 도메인 N-말단을 갖는 도메인 작제물은 도 2G 및 도 2H에 도시된다. 각 작제물은 또한 SP 및/또는 TM 도메인을 포함할 수 있다.
암호화된 서브유닛 항원
본 개시의 일부 측면은 SARS-CoV-2 S 단백질의 (적어도 하나의) 서브유닛을 암호화하는 mRNA를 포함하는 조성물을 제공한다. 일부 구현예에서, mRNA는 S1 서브유닛(예를 들어, 전장 또는 부분)을 암호화한다. 다른 구현예에서, mRNA는 S2 서브유닛(예를 들어, 전장 또는 부분)을 암호화한다. 또 다른 구현예에서, mRNA는 키메라 S1-S2 단백질을 암호화하고, 상기 서브유닛 중 하나는 SARS-CoV-2 S 단백질로부터 유래하며, 다른 서브유닛은 다른 유기체, 예를 들어, 인플루엔자 바이러스와 같은 바이러스로부터 유래한다. 본 개시의 mRNA에 의해 암호화되는 SARS-CoV-2 서브유닛(S1 및/또는 S2)은 가용성이거나 막에 결합(예를 들어, 막횡단 도메인에 연결)될 수 있다. S2를 기반으로 하는 예시적인 항원 디자인은 도 6에 도시된다. 도 6a는 FP, HR1, HR2, TM 및 CT 도메인을 포함하는 전장 S2를 도시한다. 서브유닛 사이의 링커로 구성된 S2의 버전은 도 6b에 도시된다. CT 도메인이 없는 도메인 항원은 도 6c 및 도 6d에 도시된다.
가용성 서브유닛 항원
가용성 단백질은 세포의 세포질에 존재하거나 (예를 들어, 막 결합되지 않은) 세포로부터 분비된다. 세포에 의해 분비되는 가용성 항원은 보체에 의해 옵소닌화될 수 있고 림프절의 여포 수지상 세포에 의해 포획될 수 있으며, 이때 이들은 발현된 단백질 상에 존재하는 에피토프에 특이적인 B 세포에 의해 인식될 수 있다. 서브유닛 항원의 발현은 추가로 특정 서브유닛에 대한 면역 반응의 초점을 맞추고 다른 관련 바이러스와 공유되는 항원의 다른 도메인에 특이적인 기억 B 및 T 세포의 최소의 자극을 허용한다. 이론에 얽매이지 않고, NTD, RBD를 포함하는 SARS-CoV-2 S1 서브유닛과 일부 경우에, SARS-CoV-2 S1 서브유닛의 개재 폴리펩티드가 가용성 형태로 제시되면 S1 서브유닛-특이적 면역 반응을 생성하는 것으로 여겨진다. 따라서, 일부 구현예에서, 본원에 제공된 mRNA는 가용성 SARS-CoV-2 S1 서브유닛 항원 및/또는 가용성 SARS-CoV-2 S2 서브유닛 항원을 암호화한다. 가용성 SARS-CoV-2 S1 서브유닛 항원 및 이를 암호화하는 mRNA의 비-제한적인 예는 하기 표 1A표 1B에 제공된다. 가용성 SARS-CoV-2 서브유닛 항원의 다른 예가 본원에 제공된다.
표 1A. 가용성 서브유닛 항원
Figure pct00001
표 1B. 가용성 서브유닛 항원
Figure pct00002
Figure pct00003
막 결합 서브유닛 항원
막 결합 단백질은 세포막에 고정되어 있다(가용성이 아님). 이론에 얽매이지 않고, 항원 제시 세포는 강한 면역 반응을 생성하기 위해 매립된 항원을 배액 림프절로 운반할 것으로 여겨진다. 배액 림프절에서 발생하는 배 중심 반응은 CD4+ TFH 세포와 B 세포 사이의 장기간 접촉을 수반하여, 제시된 항원에 특이적인 B 세포의 복제 및 IgG1의 생산으로의 클래스 전환을 선호하는 IL-4 및 IL-21과 같은 국소 사이토카인 신호 및 공동-자극을 허용하며, 이들 각각은 수명이 긴 형질 세포 및 기억 B 세포의 생성을 촉진할 수 있다. 따라서, 일부 구현예에서, mRNA는 막 결합 SARS-CoV-2 S1 서브유닛 항원 및/또는 막 결합된 SARS-CoV-2 S2 서브유닛 항원을 암호화한다. 일부 구현예에서, 막 결합 항원(예를 들어, S1 서브유닛, S2 서브유닛, NTD, RBD 또는 이들의 조합)은 세포막에 단백질을 고정시키는 역할을 하는 막횡단 도메인, 예를 들어 천연 발생 막횡단 도메인 또는 (이종 단백질로부터 유래된) 이종 막횡단 도메인에 연결된다. 막 결합 SARS-CoV-2 S1 서브유닛 항원 및 SARS-CoV-2 S2 서브유닛 항원 및 이들을 암호화하는 mRNA의 비-제한적 예는 하기 표 2A표 2B에 제공된다. 다른 막 결합 SARS-CoV-2 S1 서브유닛 항원이 본원에서 고려된다.
표 2A. 막 결합 서브유닛 항원
Figure pct00004
표 2B. 막 결합 서브유닛 항원
Figure pct00005
Figure pct00006
Figure pct00007
서브유닛 항원 절단 및 RBD 결실
일부 구현예에서, 조성물은 RBD 또는 RBD의 일부를 제거하도록 변형된 S1 서브유닛을 암호화하는 mRNA를 포함한다. S1 서브유닛의 절단은 면역 시스템이 인식할 수 있는 에피토프를 더 적게 제공하고, 이에 따라 나머지 에피토프에 대한 면역 반응을 편향시켜 바이러스 중화에 중요한 특정 에피토프에 대한 항체를 선택할 수 있다. RBD의 절단 또는 부분 결실은 발현된 단백질 또는 이를 운반하는 세포가 수용체 ACE2와 상호작용하는 것을 방지하여, 림프절에 도달하고 원하는 면역 반응을 자극할 가능성을 더 높일 수 있다. 또한, RBD의 제거는 관련 바이러스에 대해 이전에 생성된 교차-반응성 항체에 의한 에피토프 마스킹을 방지할 수 있고, 따라서 유도된 면역 반응을 원하는 항원에 특이적으로 집중시킬 수 있다. 추가적으로, RBD의 제거는 발현된 서브유닛의 형태를 변경하여, 이러한 대안적인 형태적 에피토프에 특이적인 B 세포가 T 세포에 선형 펩티드를 흡수하고 제시하도록 허용하고, 이에 따라 여전히 천연 형태에 존재하는 이들 에피토프에 대한 CD4+ T 세포 반응을 간접적으로 향상시킬 수 있다.
일부 구현예에서, 조성물은 RBD 또는 RBD의 일부를 제거하도록 변형된 S1 서브유닛을 암호화하는 mRNA를 포함하며, 이때 S2 서브유닛은 글리칸을 함유한다. 글리칸은 아스파라긴 잔기를 통한 N-연결된 글리코실화 또는 세린 또는 트레오닌 잔기 상에 O-연결된 글리코실화에 의해 단백질에 부착된다. 단백질의 일부 구성 요소에 글리칸 쉴드(shield)의 존재는 펩티드 에피토프를 마스킹할 수 있으며, 이에 따라 다른 노출된 펩티드 에피토프에 대한 항체 반응을 집중시킨다. 또한, 글리코실화된 단백질은 또한 코팅 글리칸을 인식하는 항체를 유도한다. 글리칸 에피토프를 인식하는 B 세포는 선형 펩티드 에피토프를 흡수하여 CD4+ T 세포에 제시하고, 이에 따라 단백질 전체에서 발견되는 선형 에피토프에 대한 CD4+ T 세포 반응을 향상시킬 것이다.
절단된 SARS-CoV-2 S1 서브유닛 항원 및 이를 암호화하는 mRNA의 비-제한적 예는 하기 표 3A표 3B에 제공된다.
RBD 결실을 갖는 SARS-CoV-2 S1 서브유닛 및 이를 암호화하는 mRNA의 비-제한적인 예는 하기 표 4A표 4B에 제공된다.
표 3A. 서브유닛 항원 절단
Figure pct00008
표 3B. 서브유닛 항원 절단
Figure pct00009
Figure pct00010
Figure pct00011
Figure pct00012
Figure pct00013
Figure pct00014
표 4A. 서브유닛 항원 RBD 결실
Figure pct00015
표 4B. 서브유닛 항원 RBD 결실
Figure pct00016
Figure pct00017
Figure pct00018
키메라 S1-S2 서브유닛 항원
일부 구현예에서, 조성물은 키메라 단백질, 예를 들어 하나의 바이러스의 S 단백질로부터 유래된 S1 서브유닛 및 다른 상이한 바이러스의 S 단백질로부터 유래된 S2 서브유닛을 갖는 키메라 S1-S2 단백질을 암호화하는 mRNA를 포함한다. 예를 들어, S2 서브유닛은 SARS-CoV-2로부터 유래될 수 있는 반면, S1 서브유닛은 HKU1으로부터 유래될 수 있다. 다른 예로서, S2 서브유닛은 SARS-CoV-2로부터 유래될 수 있는 반면, S1 서브유닛은 OC43으로부터 유래될 수 있다. 이러한 키메라 단백질은 이전 노출에 의해 생성된 HKU1 또는 OC43의 S1 서브유닛에 특이적인 항체를 순환시키고, 대식세포 및 수지상 세포에 의한 CD4+ T 세포에 대한 SARS-CoV-2 S2 서브유닛 펩티드의 효율적인 흡수 및 교차-제시를 촉진시킴에 의해 옵소닌화될 가능성이 있다. 항체가 순환함에 따른 옵소닌화는 또한 SARS-CoV-2 S2 서브유닛 에피토프에 특이적인 수용체를 갖는 B 세포에 제시하기 위해 여포 수지상 세포에 의한 포획을 촉진한다. 키메라 S1/S2 서브유닛 작제물 및 이를 암호화하는 mRNA의 비-제한적 예는 하기 표 5A표 5B에 제공된다.
표 5A. 키메라 S1 서브유닛-S2 서브유닛 항원
Figure pct00019
표 5B. 키메라 S1 서브유닛-S2 서브유닛 항원
Figure pct00020
Figure pct00021
Figure pct00022
Figure pct00023
Figure pct00024
암호화된 도메인 항원
본 개시의 다른 측면은 S 단백질의 SARS-CoV-2 S1 서브유닛의 (적어도 하나) 서브도메인을 암호화하는 mRNA를 포함하는 조성물을 제공한다. 서브도메인은 (SD1 및/또는 SD2가 있거나 없는) N-말단 도메인(NTD) 또는 수용체 결합 도메인(RBD)일 수 있다. 일부 구현예에서, mRNA는 (SD1 및/또는 SD2가 있거나 없는) NTD 및 RBD의 조합(예를 들어, 비-천연 조합)을 암호화한다. 일부 구현예에서, (SD1 및/또는 SD2가 있거나 없는) NTD 및/또는 RBD는 막횡단 도메인에 연결된다. 일부 구현예에서, mRNA는 시스테인 잔기를 포함하도록 돌연변이된 S 단백질(NTD 및 RBD)의 SARS-CoV-2 S1 서브유닛의 2개의 서브도메인을 암호화한다. 해당 돌연변이는, 일부 구현예에서, 이황화 결합의 형성을 초래한다. 예를 들어, mRNA는 F43C 돌연변이를 포함하는 NTD 및 Q563C 돌연변이를 포함하는 RBD를 암호화할 수 있고, 궁극적으로 이황화 결합을 통해 RBD에 연결된 NTD를 생성한다.
N 말단 도메인(NTD) 작제물
일부 구현예에서, 본원에 제공된 mRNA는 SARS-CoV-2 S 단백질의 S1 서브유닛의 NTD를 암호화한다. 특정 베타코로나바이러스의 NTD는 항체의 보호 수준을 유도한다. MERS와 같은 다른 베타코로나바이러스의 NTD에 특이적인 항체는 막 융합 및 바이러스 진입을 방지함으로써 작용하고(Zhou H 등 Nat Commun. 2019; 3068), 이는 ACE2에 대한 바이러스 부착 방지와 구별되는 제2 중화 메커니즘을 제공한다. 본 개시의 mRNA에 의해 암호화되는 SARS-CoV-2 NTD는 가용성이거나 막 결합될 수 있다. 막 결합 SARS-CoV-2 NTD 항원 및 이를 암호화하는 mRNA의 비-제한적인 예는 하기 표 6A표 6B에 제공된다.
표 6A. 막 결합 NTD 항원
Figure pct00025
표 6B. 막 결합 NTD 항원
Figure pct00026
수용체 결합 도메인(RBD) 작제물
다른 구현예에서, 본원에 제공된 mRNA는 SARS-CoV-2 S 단백질의 S1 서브유닛의 RBD를 암호화한다. RBD는 세포에 대한 바이러스 부착을 매개하는, 숙주 세포 상의 ACE2 수용체에 결합한다. 바이러스가 세포에 진입하여 복제하기 위해서는 부착이 필요하다. 따라서, 세포 내로의 바이러스 부착을 차단하는 RBD 표적화된 항체 반응은 세포외 바이러스 입자를 효과적으로 중화시키고, 증식을 방지하고 상기 중화된 바이러스 입자의 다른 구성요소에 대한 추가 면역 반응을 촉진한다. 본 개시의 mRNA에 의해 암호화되는 SARS-CoV-2 RBD는 가용성이거나 막 결합(예를 들어, 막횡단 도메인에 연결)될 수 있다.
가용성 RBD 항원
일부 구현예에서, mRNA는 가용성 SARS-CoV-2 RBD를 암호화한다. 수지상 세포는 음세포작용(pinocytosis)에 의해 가용성 단백질을 샘플링하고, 배액 림프절로 이동시, 상기 샘플링된 단백질을 포함하는 선형 펩티드를 CD4+ T 세포에 제시한다. 이러한 CD4+ T 세포는 RBD로부터의 에피토프를 인식하고, 흡수하고, 제시된 B 세포에 증식 신호를 제공하므로, SARS-CoV-2 스파이크 단백질의 다른 구성 요소 없이 특이적으로 RBD를 투여하면 RBD에 존재하는 에피토프에 대해 면역 반응이 집중될 것으로 예상된다. 가용성 SARS-CoV-2 RBD 및 이를 암호화하는 mRNA의 비-제한적인 예는 하기 표 7A표 7B에 제공된다.
표 7. 가용성 RBD 항원
Figure pct00027
표 7B. 가용성 RBD 항원
Figure pct00028
막 결합 RBD 항원
일부 구현예에서, mRNA는 막 결합 SARS-CoV-2 RBD를 암호화한다. 막 결합 RBD를 발현하는 세포는 이러한 막-결합 항원을 배액 림프절로 운반하고, RBD-특이적 B 세포에 의한 에피토프의 효율적인 인식을 촉진할 것으로 예상된다. B 세포 표면은 많은 표면 결합 항체를 포함하고, 발현 세포는 막 결합 RBD의 많은 복제물을 함유하기 때문에, B 세포에 의한 항원의 초기 인식이 B 세포 수용체의 교차-결합으로 이어지며, 다가 효과(avidity effect)를 통해 강한 반응을 자극할 것으로 예상된다. 막 결합 SARS-CoV-2 RBD 및 이를 암호화하는 mRNA의 비-제한적 예는 하기 표 8A표 8B에 제공된다.
표 8A. 막 결합 RBD 항원
Figure pct00029
표 8B. 막 결합 RBD 항원
Figure pct00030
도메인 융합 항원
또 다른 구현예에서, 본원에 제공된 mRNA는 SARS-CoV-2 NTD-RBD 융합 단백질을 암호화한다. 예를 들어, S 단백질의 SARS-CoV-2 S1 서브유닛의 NTD 및 RBD는 짧은 아미노산(예를 들어, 글리신-세린) 링커와 같은 링커를 통해 서로 연결되어 상기 도메인 사이의 유연성/힌지 및 공간을 허용할 수 있다. 또 다른 구현예에서, 항원성 에피토프, 예를 들어, PADRE와 같은 클래스 II 보편적 T 세포 에피토프를 포함하는 링커가 사용될 수 있다. 일부 구현예에서, 막횡단 영역은 예를 들어 유연성을 위해 그리고 막과 항원 사이에 합리적인 거리를 허용하기 위해 또 다른 짧은 아미노산(예를 들어, 글리신-세린 또는 PADRE) 링커를 통해 NTD-RBD 융합에 연결된다. 이론에 얽매이지 않고, 이러한 막 결합, 탠덤 구성은 하나의 오픈 리딩 프레임에서 전부는 아니더라도, 대부분의 공지된 중화 및 보호 에피토프를 제시하는 것으로 여겨진다. 이러한 융합 단백질의 투여는 이후 공지된 보호 에피토프에 대한 면역 반응에 초점을 맞추고, 비-보호 에피토프에 특이적인 항체 및 T 세포의 불필요한 생성을 줄여야 한다. 또한, 상이한 도메인에 대한 항체는 숙주 세포에 대한 부착을 차단하거나 결합된 바이러스가 막 융합을 거쳐 숙주 세포로 진입하는 것을 방지하는 것과 같은, 상이한 메커니즘을 통해 바이러스 입자를 중화시킬 수 있다. 상이한 도메인을 포함하는 융합 단백질에 의해 유도되는 광범위한 반응은 따라서 보다 진화적으로 강력할 수 있으며, 백신-유도된 면역을 피하기 위해 다수의 고유한 돌연변이가 필요하다. SARS-CoV-2 NTD-RBD 융합 단백질 및 이를 암호화하는 mRNA의 비-제한적 예는 하기 표 9A표 9B에 제공된다.
링커
다양한 링커가 본 개시에 따라 사용될 수 있다. 본원에 제공된 바와 같은 링커는 단순히 2개의 다른 아미노산 서열을 함께 인공적으로 연결하는 아미노산 서열이다. 본원에 사용된 링커는 절단 가능하거나 절단 불가능할 수 있다. 절단 가능한 링커는 mRNA가 폴리펩티드로 번역되도록 허용하고, 이후 링커의 절단은 각 개별 성분이 독립적으로 방출되도록 허용한다. 절단 불가능한 링커는 연결된 하나 이상의 단백질 서브유닛을 유지하며, 전체 단백질이 구성 요소 서브유닛의 밀접한 근접성을 요구하는 기능을 수행하도록 허용한다. 이러한 링커의 비-제한적 예는 글리신-세린(GS) 링커(절단 불가능); 및 F2A 링커, P2A 링커, T2A 링커, 및 E2A링커(절단 가능)을 포함한다. 다른 링커들이 본원에 사용될 수 있다.
일부 구현예에서, 링커는 GS 링커이다. GS 링커는 글리신 및 세린 아미노산 반복을 포함하는 폴리펩티드 링커이다. 이들은 유연하고 친수성 잔기를 포함하며, 단백질 도메인의 폴딩 및 기능의 간섭 없이, 그리고 2차 구조의 형성 없이 단백질 서브유닛의 융합을 수행하는 데 사용될 수 있다. 일부 구현예에서, mRNA는 3 내지 20개의 아미노산 길이인 GS 링커를 포함하는 융합 단백질을 암호화한다. 예를 들어, GS 링커는 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개 또는 20개의 아미노산 길이를 가질 수 있다 (또는 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 16개, 적어도 17개, 적어도 18개, 적어도 19개 또는 적어도 20개의 아미노산 길이를 가질 수 있다). 일부 구현예에서, GS 링커는 15개의 아미노산 길이(예를 들어, GGSGGSGGSGGSGGG (서열번호 133))이다 (또는 적어도 15개의 아미노산 길이이다). 일부 구현예에서, GS 링커는 8개의 아미노산 길이(예를 들어, GGGSGGGS (서열번호 134))이다 (또는 적어도 8개의 아미노산 길이이다). 일부 구현예에서, GS 링커는 7개의 아미노산 길이(예를 들어, GGGSGGG (서열번호 135))이다 (또는 적어도 7개의 아미노산 길이이다). 일부 구현예에서, GS 링커는 4개의 아미노산 길이(예를 들어, GGGS (서열번호 136))이다 (또는 적어도 4개의 아미노산 길이이다). 일부 구현예에서, GS 링커는 (GGGS)n(서열번호 136)을 포함하고, 여기서 n은 1-5의 임의의 정수이다. 일부 구현예에서, GS 링커는 4개의 아미노산 길이(예를 들어, GSGG (서열번호 152))이다 (또는 적어도 4개의 아미노산 길이이다). 일부 구현예에서, GS 링커는 (GSGG)n (서열번호 152)을 포함하고, 여기서 n은 1-5의 임의의 정수이다.
일부 구현예에서, 링커는 예를 들어, 3개의 아미노산(예를 들어, GGG) 길이 (또는 적어도 3개의 아미노산 길이)를 갖는 글리신 링커이다.
일부 구현예에서, mRNA 백신에 의해 암호화된 단백질은 서로 동일하거나 상이할 수 있는 하나 이상의 링커를 포함한다(예를 들어, 동일한 S 단백질 작제물에서 GGGSGGG (서열번호 135) 및 GGGS (서열번호 136)).
일부 구현예에서, 링커는 pan HLA DR-결합 에피토프(PADRE)(예를 들어, AKFVAAWTLKAAA (서열번호 148))를 암호화하는 mRNA를 포함한다. PADRE는 면역우성(immunodominant) 헬퍼 CD4 T 세포 에피토프 및 강력한 면역원이다(예를 들어, Alexander J. 등 J of Immuno. 164(3): 1625-33 참조, 본원에 참조로 포함됨).
표 9A. 도메인 융합 항원
Figure pct00031
표 9B. 도메인 융합 항원
Figure pct00032
Figure pct00033
Figure pct00034
Figure pct00035
트래피킹 신호
일부 구현예에서, mRNA는 골지(Golgi) 트래피킹 신호에 연결된 SARS-CoV-2 S 단백질 도메인(예를 들어, NTD, RBD 또는 NTD-RBD 융합)을 암호화한다. 이러한 신호의 비-제한적인 예는 CD86 및/또는 CD11b와 같은 대식세포 마커를 포함하며, 이는 고도로 발현되고 세포내 영역은 골지체로부터 세포 표면으로의 효율적인 유출을 제어할 수 있다. 다른 세포 트래피킹 신호(서열), 예를 들어 VSV-G 세포질 꼬리(VSVGct)가 본원에 사용될 수 있다. 암호화된 단백질의 세포 표면으로의 보다 효율적인 트래피킹은 B 세포 인식을 위한 항원 가용성을 증가시키고, 이에 따라 암호화된 SARS-CoV-2 S 단백질 도메인에 대한 항체의 생성을 촉진할 것으로 예상된다. 트래피킹 신호에 연결된 SARS-CoV-2 항원 및 이를 암호화하는 mRNA의 비-제한적인 예는 하기 표 10A표 10B에 제공된다.
표 10A. 트래피킹 신호에 연결된 도메인 융합 항원
Figure pct00036
표 10B. 트래피킹 신호에 연결된 도메인 융합 항원
Figure pct00037
Figure pct00038
Figure pct00039
Figure pct00040
도메인 융합 C-말단 절단
다른 구현예에서, 본원에 제공된 mRNA는 C-말단 도메인의 일부 부분이 절단된/결실된 SARS-CoV-2 NTD-RBD 융합 단백질을 암호화한다. 일 구현예에서, 13개 (또는 적어도 13개)의 아미노산이 NTD-RBD 융합 단백질의 C-말단 도메인으로부터 결실되었다. 이러한 아미노산의 결실은 항체에 대한 에피토프의 노출을 증가시키고, 이에 따라 NTD 및 RBD 도메인에 존재하는 보호 에피토프에 대한 보다 강력한 면역 반응을 자극할 것으로 예상된다.
C-말단 절단을 갖는 SARS-CoV-2 도메인 융합 항원 및 이를 암호화하는 mRNA의 비-제한적인 예는 하기 표 11A표 11B에 제공된다.
표 11A. 도메인 융합 C-말단 절단
Figure pct00041
표 11B. 도메인 융합 C-말단 절단
Figure pct00042
도메인 확장
SARS-CoV-2 S 단백질 도메인 항원은, 일부 구현예에서, NTD 도메인 또는 RBD 도메인인 것으로 당업계에서 이해되는 것에 인접하고/하거나 플랭킹하는 서열을 포함하는 "확장된" 영역을 포함한다. RBD_EXT 시리즈는 SD1(서브도메인 1)을 포괄한다. NTD_EXT 시리즈는 NTD의 C-말단 나선을 포괄한다. 일부 B 세포 및 항체는 SARS-CoV-2 S 단백질 NTD 및 RBD의 적절하게 폴딩되어 있지만, 변성되지 않은 형태에서만 발견되는 형태적 에피토프를 인식한다. NTD 및 RBD 도메인에 인접하고/하거나 측면에 있는 서열의 포함은 항원에 대한 추가 B-세포 에피토프를 제공할 수 있을 뿐만 아니라, 잠재적으로 해당 도메인의 보다 최적의 폴딩을 초래할 수 있고, 두 도메인의 가장자리에서 찾을 수 있는 에피토프에 특이적인 항체로 B 세포를 자극할 수 있다. 또한, 이러한 확장 서열의 포함은 따라서 NTD 또는 RBD와 발현 세포막 사이의 거리를 증가시킬 수 있으며, 발현된 단백질이 세포 표면에 너무 가까울 경우 덜 효율적으로 결합할 수 있는 항체에 대한 두 도메인의 노출을 증가시킬 수 있다. 마지막으로, 확장 서열의 포함은 NTD 또는 RBD 에피토프를 인식한 B 세포에 의해 CD4+ T 세포에 잠재적으로 제시될 수 있는 펩티드의 풀을 증가시키고, 이후 항원 제시를 위해 전체 단백질을 처리하며, 이에 따라 NTD 또는 RBD-특이적 B 세포가 충분한 T 세포 도움을 받을 기회를 증가시킨다. SARS-CoV-2 도메인 확장 및 이를 암호화하는 mRNA의 비-제한적 예는 하기 표 12A표 12B에 제공된다.
표 12. 도메인 확장
Figure pct00043
표 12B. 도메인 확장
Figure pct00044
Figure pct00045
Figure pct00046
Figure pct00047
Figure pct00048
Figure pct00049
Figure pct00050
Figure pct00051
도메인 혼합물
본 개시는, 일부 측면에서, SARS-CoV-2 S 단백질 서브도메인을 암호화하는 mRNA의 혼합물을 포함하는 조성물을 제공한다. 일 예에서, 조성물은 (SD1, SD2, 및/또는 막횡단 도메인이 있거나 없는) NTD를 암호화하는 mRNA 및 (SD1, SD2, 및/또는 막횡단 도메인이 있거나 없는) RBD를 암호화하는 mRNA의 혼합물을 포함한다. 일부 구현예에서, 조성물은 막횡단 도메인(예를 들어, 서열번호 47)에 연결된 NTD를 암호화하는 mRNA(예를 들어, 서열번호 45 또는 46) 및 막횡단 도메인(예를 들어, 서열번호 77)에 연결된 RBD를 암호화하는 mRNA(예를 들어, 서열번호 75 또는 76)를 포함한다.
조성물에서 하나의 mRNA 대 다른 mRNA의 농도 비율은 1:1 (50:50), 1:2, 1:3, 1:4, 또는 1:5일 수 있다. 일부 구현예에서, 비율은 1:1이다. 예를 들어, 조성물은 막횡단 도메인(예를 들어, 서열번호 47)에 연결된 NTD를 암호화하는 mRNA(예를 들어, 서열번호 45 또는 46) 대 막횡단 도메인(예를 들어, 서열번호 77)에 연결된 RBD를 암호화하는 mRNA(예를 들어, 서열번호 75 또는 76)의 1:1 비율을 포함할 수 있다. 일부 구현예에서, 비율은 1:2이다. 예를 들어, 조성물은 막횡단 도메인(예를 들어, 서열번호 47)에 연결된 NTD를 암호화하는 mRNA(예를 들어, 서열번호 45 또는 46) 대 막횡단 도메인(예를 들어, 서열번호 77)에 연결된 RBD를 암호화하는 mRNA(예를 들어, 서열번호 75 또는 76)의 1:2 비율을 포함할 수 있다. 다른 예에서, 조성물은 막횡단 도메인(예를 들어, 서열번호 77)에 연결된 RBD를 암호화하는 mRNA(예를 들어, 서열번호 75 또는 76) 대 막횡단 도메인(예를 들어, 서열번호 47)에 연결된 NTD를 암호화하는 mRNA(예를 들어, 서열번호 45 또는 46)의 1:2 비율을 포함할 수 있다. 상이한 항원을 암호화하는 상이한 mRNA는 다양한 강도의 면역 반응을 자극할 수 있고(Magini D 등 PLoS ONE. 2016; 11:e0161193), 2개의 상이한 항원을 암호화하는 2개의 mRNA의 등몰비의 투여는 하나에 대한 면역 반응을 초래할 수 있지만 다른 하나에 대해서는 그렇지 않을 수 있다(John S 등 Vaccine. 2018; 36:1689-1699). 공동-전달된 mRNA의 비율 조작은 동일한 효능을 가진 원하는 항원을 표적으로 하는 광범위한 면역 반응을 유도하는 데 유용할 수 있다.
암호화된 나노입자 항원
본원에 제공된 mRNA 백신은, 일부 구현예에서, 스캐폴드 도메인에 연결된 코로나바이러스 항원을 포함하는 융합 단백질을 암호화한다. 일부 구현예에서, 스캐폴드 도메인은 본 개시의 mRNA에 의해 암호화되는 항원에 원하는 특성을 부여한다. 예를 들어, 스캐폴드 도메인은 예를 들어, 항원의 구조를 변경하고, 항원의 흡수 및 처리를 변경하고/하거나, 항원이 다른 분자에 결합하도록 함으로써, 항원의 면역원성을 개선할 수 있다. 일부 구현예에서, 항원에 연결된 스캐폴드 도메인은 바이러스 나노입자 또는 더 큰 단백질-폴딩된 면역원으로 항원의 자가-조립을 촉진한다. 본원에서 제공되는 바와 같이, 사용될 수 있는 스캐폴드 도메인의 비-제한적인 예는 페리틴 도메인, 루마진 합성효소 도메인, 폴던 도메인 및 인캡슐린 도메인을 포함한다. 다른 스캐폴드 도메인이 사용될 수 있다.
페리틴
일부 구현예에서, 페리틴 도메인은 스캐폴드 도메인으로서 사용된다. 페리틴은 세포내 철 저장이 이의 주요 기능인, 단백질이다. 페리틴은 24개의 서브유닛으로 구성되며, 각각은 8면체 대칭을 갖는 4차 구조로 자가-조립되는 4개의 알파-나선 묶음(bundle)으로 구성된다(Cho K. J. 등 J Mol Biol. 2009; 390: 83-98; (Granier T. 등 J Biol Inorg Chem. 2003; 8: 105-111; 및 Lawson D.M. 등 Nature. 1991; 349: 541-544). 페리틴은 강력한 열적 및 화학적 안정성을 가진 나노입자로 자가-조립된다. 이러한 방식으로 페리틴 나노입자 내에 항원을 봉입하는 것은 항원의 분해를 지연시킬 뿐만 아니라 개별 항원의 응집 모두를 응집시킬 것으로 예상되며, 각 나노입자는 24개의 항원 서브유닛을 포함한다. 동일한 항원의 많은 복제물의 응집은 수지상 세포에 의한 항원 흡수 및 이동 둘 다 뿐만 아니라 보다 강력한 CD4+ 및 CD8+ T 세포 반응을 향상시킨다(Kastenmuller K 등 J Clin Invest. 2011; 121(5):1782-96). 따라서, 페리틴 나노입자는 항원 제시 및 백신 개발에 적합한 플랫폼이다.
본원에 제공된 mRNA는, 일부 구현예에서, 예를 들어, 글리신(예를 들어, GGG) 링커 도메인을 통해, 페리틴 도메인에 연결된 RBD를 암호화한다. 다른 링커가 사용될 수 있다.
다른 구현예에서, 본원에 제공된 mRNA는 예를 들어, 글리신(예를 들어, GGG) 링커를 통해, 페리틴 도메인에 연결된 S 단백질의 S1 도메인을 암호화한다. 본원의 다른 곳에서 지시된 바와 같이, 다른 링커가 사용될 수 있다.
페리틴 도메인에 연결된 SARS-CoV-2 항원 및 이를 암호화하는 mRNA의 비-제한적 예는 하기 표 13A 및 표 13B에 제공된다.
표 13A. 페리틴 도메인에 연결된 항원
Figure pct00052
표 13B. 페리틴 도메인에 연결된 항원
Figure pct00053
Figure pct00054
Figure pct00055
루마진 합성효소
일부 구현예에서, 루마진 합성효소 도메인은 스캐폴드 도메인으로서 사용된다. 루마진 합성효소는 고세균, 박테리아, 곰팡이, 식물 및 진균을 포함하는, 다양한 유기체에서 리보플라빈의 생합성에서 끝에서 두 번째(penultimate) 촉매 단계를 담당하는 효소이다. 루마진 합성효소는 그 기원 종에 따라 5량체, 10량체 및 20면체 60량체를 포함하여 크기 및 서브유닛 수가 다양한 동종 올리고머(homooligomer)로 구성된다. 루마진 합성효소 단량체는 150개의 아미노산 길이이며, 플랭킹, 탠덤 알파-나선을 가진 베타-시트를 포함한다. 루마진 합성효소에 대해 상이한 4차 구조가 보고되었으며, 이는 호모펜타머에서 150 Å 직경의 캡시드를 형성하는 12개의 5량체의 대칭성 조립에 이르기까지 형태학적 다양성을 보여준다. 루마진 합성효의 표면 상에 항원의 제시는 정렬된 배열로 표시된 항원의 높은 국소 농도를 초래한다. 이러한 반복적인 구조는 B-세포 수용체의 교차-결합을 가능하게 하고, 다가 효과를 통해 강한 면역 반응을 초래한다.
본원에 제공된 mRNA는, 일부 구현예에서, 예를 들어 글리신-세린(예를 들어, GGS)을 통해 루마진 합성효소 도메인에 연결된 RBD를 암호화한다. 다른 링커가 사용될 수 있다.
다른 구현예에서, 본원에 제공된 mRNA는 예를 들어 글리신-세린(예를 들어, GGS) 링커를 통해 루마진 합성효소 도메인에 연결된 S 단백질의 S1 도메인을 암호화한다. 본원의 다른 곳에서 지시된 바와 같이, 다른 링커가 사용될 수 있다.
폴던 도메인에 연결된 SARS-CoV-2 항원 및 이를 암호화하는 mRNA의 비-제한적 예는 하기 표 14A표 14B에 제공된다.
표 14A. 루마진 합성효소 도메인에 연결된 항원
Figure pct00056
표 14B. 루마진 합성효소 도메인에 연결된 항원
Figure pct00057
Figure pct00058
Figure pct00059
Figure pct00060
Figure pct00061
폴던
일부 구현예에서, 폴던 도메인은 스캐폴드 도메인으로서 사용된다. T4 피브리틴(폴던)의 C-말단 도메인은 피브리틴 삼량체 구조의 형성에 필수적이며, 인공 삼량체화 도메인으로서 사용될 수 있다(예를 들어, Meier S. 등 Journal of Molecular Biology 2004 Dec 3; 344(4): 1051-1069; Tao Y 등 Structure 1997 Jun 15; 5(6):789-98 참조). S 단백질 엑토도메인에 융합된 경우, 폴던 도메인은 S 단백질의 정확한 삼량체화를 촉진하며, 따라서 단백질의 잘못된 폴딩(misfolding)을 방지한다. S 단백질의 융합 전 형태의 생성을 초래하는 이러한 과정은 증가된 발현, 형태적 균질성 및 강력한 중화 항체 반응의 유도를 초래한다.
이론에 얽매이지 않고, 이러한 구성은 폴던이 단백질의 세포내 영역에서 면역원적으로 대체로 침묵시키는 결과를 초래할 것으로 여겨진다. 폴던 도메인에 연결된 SARS-CoV-2 항원 및 이를 암호화하는 mRNA의 비-제한적인 예는 하기 표 15A표 15B에 제공된다.
표 15A. 폴던 도메인에 연결된 항원
Figure pct00062
표 15B. 폴던 도메인에 연결된 항원
Figure pct00063
Figure pct00064
Figure pct00065
Figure pct00066
Figure pct00067
Figure pct00068
Figure pct00069
인캡슐린
일부 구현예에서, 인캡슐린 도메인은 스캐폴드 도메인으로서 사용된다. 인캡슐린은 호열성 세균 써모토가 마리티마로부터 단리된 단백질 케이지 나노입자이다. 인캡슐린은 내부 및 외부 직경이 각각 20 및 24 nm인 얇고 20면체 T = 1 대칭성 케이지 구조를 갖는 동일한 31 kDa 단량체의 60개 복제물로부터 조립된다(Sutter M. 등 Nat Struct Mol Biol. 2008; 15: 939-947). T. 마리티마에서 인캡슐린의 정확한 기능은 아직 명확하게 이해되지는 않았으나, 이의 결정 구조는 최근에 해결되었고, 이의 기능은 산화 스트레스 반응 30에 관여하는 DyP(탈염료 퍼옥시다아제) 및 Flp(페리틴 유사 단백질)과 같은 단백질을 캡슐화하는 세포 구획으로서 가정되었다(Rahmanpour R. 등 FEBS J. 2013; 280: 2097-2104). 나노입자 구성을 위한 인캡슐린의 사용은 나노입자의 표면 상에 단백질 항원의 제시와, 나노입자 자체 내에 mRNA와 같은 카고(cargo)의 봉입을 모두 가능하게 한다. 이전의 인캡슐린 나노입자-기반 백신은 표면에 제시된 항원과 카고 단백질 자체 모두에 대해 강한 면역 반응을 유도하였다(Lagoutte P. 등 Vaccine. 2018; 36(25): 3622-3628).
본원에 제공된 mRNA는, 일부 구현예에서, 인캡슐린 도메인에 연결된 S 단백질 도메인(예를 들어, S1, S2, RBD, 및/또는 NTD)을 암호화한다.
융합 단백질
일부 구현예에서, 본 개시의 조성물은 항원성 융합 단백질을 암호화하는 mRNA를 포함한다. 따라서, 암호화된 항원 또는 항원들은 함께 연결된 2개 이상의 단백질(예를 들어, 단백질 및/또는 단백질 단편)을 포함할 수 있다. 대안적으로, 단백질 항원이 융합된 단백질은 그 자체에 강한 면역 반응을 촉진하지 않고, 오히려 코로나바이러스 항원에 대한 강한 면역 반응을 촉진한다. 항원성 융합 단백질은, 일부 구현예에서, 각각의 원래 단백질로부터 기능적 특성을 보유한다.
일부 구현예에서, 융합 단백질은 SARS-CoV-2 스파이크 단백질로부터의 수용체 결합 도메인을 포함한다.
일부 구현예에서, 융합 단백질은 SARS-CoV-2 스파이크 단백질로부터의 N-말단 도메인을 포함한다.
일부 구현예에서, 융합 단백질은 막횡단 도메인을 포함한다. 막횡단 도메인은, 일부 구현예에서, SARS-CoV-2가 아닌 바이러스로부터 유래될 수 있다. 예를 들어, 막횡단 도메인은 인플루엔자 혈구응집소 막횡단 도메인으로부터 유래할 수 있으며, 이는 세포 표면에서 단백질을 효과적으로 고정시키는 것으로 입증되었다.
변이체
일부 구현예에서, 본 개시의 조성물은 코로나바이러스 항원 변이체를 암호화하는 RNA를 포함한다. 항원 변이체 또는 다른 폴리펩타이드 변이체는 이들의 아미노산 서열이 야생형, 천연 또는 참조 서열과 상이한 분자를 지칭한다. 항원/폴리펩티드 변이체는 천연 또는 참조 서열과 비교하여, 아미노산 서열 내의 특정 위치에서 치환, 결실 및/또는 삽입을 보유할 수 있다. 일반적으로, 변이체는 야생형, 천연 또는 참조 서열에 대해 적어도 50%의 동일성을 보유한다. 일부 구현예에서, 변이체는 야생형, 천연 또는 참조 서열과 적어도 80%, 또는 적어도 90% 동일성을 공유한다.
본 개시의 핵산에 의해 암호화되는 변이체 항원/폴리펩티드는 예를 들어, 대상체에서 이들의 면역원성을 향상시키고, 이들의 발현을 향상시키고/시키거나, 이들의 안정성 또는 PK/PD 특성을 개선시키는, 다수의 바람직한 특성 중 임의의 것을 부여하는 아미노산 변화를 함유할 수 있다. 변이체 항원/폴리펩티드는 정례적인 돌연변이 유발 기술을 사용하여 만들 수 있으며, 원하는 특성을 보유하는지의 여부를 결정하기 위해 적절하게 분석될 수 있다. 발현 수준 및 면역원성을 결정하기 위한 분석은 당업계에 잘 알려져 있으며, 예시적인 해당 분석은 실시예 섹션에 제시되어 있다. 유사하게, 단백질 변이체의 PK/PD 특성은 예를 들어, 시간 경과에 따라 백신 접종된 대상체에서 항원의 발현을 결정하고/하거나, 유도된 면역 반응의 지속성을 관찰함으로써 당업계에서 인정된 기법을 사용하여 측정될 수 있다. 변이체 핵산에 의해 암호화된 단백질(들)의 안정성은 열 안정성 또는 요소(urea) 변성 시 안정성을 분석함으로써 측정될 수 있거나 또는 인실리코 예측을 사용하여 측정될 수 있다. 이러한 실험 및 인실리코 측정을 위한 방법은 당업계에 공지되어 있다.
일부 구현예에서, 조성물은 본원에 제공된 서열 중 임의의 하나의 뉴클레오티드 서열을 포함하는 mRNA 또는 mRNA ORF를 포함하거나(예를 들어, 서열 목록 참조), 본원에 제공된 서열 중 임의의 하나의 뉴클레오티드 서열과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 뉴클레오티드 서열을 포함한다.
용어 "동일성"은 서열을 비교함으로써 결정되는 바와 같이, 2개 이상의 폴리펩티드(예를 들어, 항원) 또는 폴리뉴클레오티드(핵산)의 서열 간의 관계를 지칭한다. 동일성은 또한 2개 이상의 아미노산 잔기 또는 핵산 잔기의 스트링 사이의 일치 수에 의해 결정되는 바와 같이 서열 간의 또는 서열 중의 서열 관련성의 정도를 지칭한다. 동일성은 특정 수학적 모델 또는 컴퓨터 프로그램(예를 들어, "알고리즘")에 의해 처리된 (만약에 있다면) 갭 정렬을 가진 2개 이상의 서열 중 더 작은 것 간의 동일한 일치 퍼센트를 측정한다. 관련된 항원 또는 핵산의 동일성은 공지된 방법에 의해 쉽게 계산될 수 있다. 폴리펩티드 또는 폴리뉴클레오티드 서열에 적용함에 따라 "퍼센트(%) 동일성"은, 필요한 경우, 최대 퍼센트 동일성을 달성하기 위해, 서열 정렬 및 갭 도입 후 제2 서열의 핵산 서열 또는 아미노산 서열에서의 잔기와 동일한 후보 아미노산 또는 핵산 서열에서의 잔기(아미노산 잔기 또는 핵산 잔기)의 백분율로서 정의된다. 정렬을 위한 방법 및 컴퓨터 프로그램은 당업계에 잘 알려져 있다. 동일성은 퍼센트 동일성의 계산에 좌우되지만 계산에서 도입된 갭 및 패널티로 인해 값이 상이할 수 있음을 이해한다. 일반적으로, 특정 폴리뉴클레오티드 또는 폴리펩티드(예를 들어, 항원)의 변이체는 본원에 기재된 그리고 당업자에게 공지된 서열 정렬 프로그램 및 매개변수에 의해 결정되는 바와 같이 그 특정 참조 폴리뉴클레오티드 또는 폴리펩티드에 대해 적어도 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 그러나 100% 미만의 서열 동일성을 갖는다. 이러한 정렬을 위한 도구는 BLAST 묶음(Stephen F. Altschul 등 (1997)". Gapped BLAST and PSI-BLAST: a new generation of protein database search programs", Nucleic Acids Res. 25:3389-3402)의 것들을 포함한다. 또 다른 대중적인 로컬 정렬 기술은 Smith-Waterman 알고리즘(Smith, T.F. & Waterman, M.S. (1981) "Identification of common molecular subsequences". J. Mol. Biol. 147:195-197)을 기반으로 한다. 동적 프로그래밍을 기반으로 하는 일반 전반적 정렬 기술은 Needleman-Wunsch 알고리즘(Needleman, S.B. & Wunsch, C.D. (1970) "A general method applicable to the search for similarities in the amino acid sequences of two proteins". J. Mol. Biol. 48:443-453)이다. 보다 최근에, Needleman-Wunsch 알고리즘을 포함하는, 다른 최적의 전반적인 정렬 방법보다 빠르게 뉴클레오티드 및 단백질 서열의 전반적인 정렬을 생성한다고 알려진 신속한 최적의 전반적인 서열 정렬 알고리즘(Fast Optimal Global Sequence Alignment Algorithm; FOGSAA)이 개발되었다.
이와 같이, 참조 서열, 특히 본원에 개시된 폴리펩티드(예를 들어, 항원) 서열에 대하여 치환, 삽입 및/또는 부가, 결실 및 공유 변형을 함유하는 펩티드 또는 폴리펩티드를 암호화하는 폴리뉴클레오티드는 본 개시의 범위 내에 포함된다. 예를 들어, 서열 태그 또는 아미노산, 예컨대 하나 이상의 라이신은 (예를 들어, N-말단 또는 C-말단 끝에서) 펩티드 서열에 부가될 수 있다. 서열 태그는 펩티드 검출, 정제 또는 국부화에 사용될 수 있다. 라이신은 펩티드 용해도를 증가시키거나, 비오틴화를 허용하는데 사용될 수 있다. 대안적으로, 펩티드 또는 단백질의 아미노산 서열의 카르복시 및 아미노 말단 영역에 위치한 아미노산 잔기는 선택적으로 결실되어 절단된 서열을 제공할 수 있다. 특정 아미노산(예를 들어, C-말단 또는 N-말단 잔기)은 예를 들어, 가용성이거나 고체 지지체에 연결된 더 큰 서열의 일부로서 서열의 발현과 같이 서열의 사용에 따라 대안적으로 결실될 수 있다. 일부 구현예에서, 신호 서열, 종결 서열, 막횡단 도메인, 링커, (예를 들어, 폴던 영역과 같은) 다량체화 도메인 등에 대한 (또는 암호화) 서열은 동일 또는 유사한 기능을 달성하는 대안적인 서열로 치환될 수 있다. 일부 구현예에서, 단백질 코어 내의 공동은 예를 들어, 더 큰 아미노산을 도입함으로써 안정성을 개선시키기 위해 채워질 수 있다. 다른 구현예에서, 매립된 수소 결합 네트워크는 안정성을 개선시키기 위해 소수성 잔기로 대체될 수 있다. 또 다른 구현예에서, 글리코실화 부위를 제거하고 적절한 잔기로 대체할 수 있다. 이러한 서열은 당업자에게 용이하게 식별가능하다. 또한, 본원에 제공된 서열 중 일부는 예를 들어, mRNA 백신의 제조에 사용하기 전에, 결실될 수 있는 (예를 들어, N-말단 또는 C-말단 끝에서) 서열 태그 또는 말단 펩티드 서열을 함유한다는 것을 이해해야 한다.
당업자에 의해 인식되는 바와 같이, 단백질 단편, 기능성 단백질 도메인, 및 상동성 단백질은 또한 관심 코로나바이러스 항원의 범위 내에 있는 것으로 간주된다. 예를 들어, 단편이 면역원성이고 코로나바이러스에 대한 보호 면역 반응을 부여한다면, 참조 단백질의 임의의 단백질 단편(참조 항원 서열보다 적어도 하나의 아미노산 잔기가 더 짧지만 다른 것은 동일한 폴리펩ㅌ드 서열을 의미함)이 본원에 제공된다. 참조 단백질과 동일하지만 절단된 변이체 외에도, 일부 구현예에서, 항원은 본원에 제공되거나 언급된 임의의 서열에 나타낸 바와 같은 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 또는 그 이상의 돌연변이를 포함한다. 항원/항원성 폴리펩티드는 길이가 약 4개, 6개, 또는 8개 아미노산에서 전장 단백질까지의 범위일 수 있다.
안정화 요소
천연-발생 진핵생물 mRNA 분자는 5'-캡 구조 또는 3'-폴리(A) 꼬리와 같은, 다른 구조적 특징 외에, 이들의 5'-말단(5' UTR) 및/또는 3'-말단(3' UTR)의 비번역 영역(UTR)을 포함하나, 이에 제한되지 않는 안정화 요소를 함유할 수 있다. 5' UTR과 3' UTR은 모두 전형적으로 게놈 DNA로부터 전사되며, 미성숙한 mRNA의 요소이다. 5'-캡 및 3'-폴리(A) 꼬리와 같은 성숙한 mRNA의 특징적인 구조적 특징은 일반적으로 mRNA 처리 동안 전사된(미성숙한) mRNA에 추가된다.
일부 구현예에서, 조성물은 적어도 하나의 변형, 적어도 하나의 5' 말단 캡을 갖는 적어도 하나의 항원성 폴리펩티드를 암호화하는 오픈 리딩 프레임을 갖는 mRNA를 포함하고, 지질 나노입자 내에 제형화된다. 폴리뉴클레오티드의 5'-캡핑은 제조업체 프로토콜에 따라 5'-구아노신 캡 구조를 생성하기 위해 하기와 같은 화학적 RNA 캡 유사체를 사용하여 시험관내-전사 반응 동안 동시에 완료될 수 있다: 3'-O-Me-m7G(5')ppp(5') G [ARCA 캡]; G(5')ppp(5')A; G(5')ppp(5')G; m7G(5')ppp(5')A; m7G(5')ppp(5')G (New England BioLabs, Ipswich, MA). 변형된 RNA의 5'-캡핑은 "Cap 0" 구조를 생성하기 위해 백시니아 바이러스 캡핑 효소를 사용하여 전사-후 완료될 수 있다: m7G(5')ppp(5')G (New England BioLabs, Ipswich, MA). 캡 1 구조는 m7G(5')ppp(5')G-2'-O-메틸을 생성하기 위해 백시니아 바이러스 캡핑 효소 및 2'-O 메틸-트랜스퍼라제를 모두 사용하여 생성할 수 있다. 캡 2 구조는 캡 1 구조로부터 생성된 후 2'-O 메틸-트랜스퍼라제를 사용하여 5'-맨 끝에서 세번째(antepenultimate) 뉴클레오티드의 2'-O-메틸화에 의해 생성될 수 있다. 캡 3 구조는 캡 2 구조로부터 생성된 후 2'-O 메틸-트랜스퍼라제를 사용하여 5'-맨 끝에서 네번째(preantepenultimate) 뉴클레오티드의 2'-O-메틸화에 의해 생성될 수 있다. 효소는 재조합 공급원으로부터 유래될 수 있다.
3'-폴리(A) 꼬리는 전형적으로 전사된 mRNA의 3'-말단에 부가된 아데닌 뉴클레오티드의 스트레치이다. 일부 경우에, 최대 약 400개의 아데닌 뉴클레오티드를 포함할 수 있다. 일부 구현예에서, 3'-폴리(A) 꼬리의 길이는 개별 mRNA의 안정성과 관련하여 필수적인 요소일 수 있다.
일부 구현예에서, 조성물은 안정화 요소를 포함한다. 안정화 요소는 예를 들어 히스톤 스템-루프(stem-loop)를 포함할 수 있다. 스템-루프 결합 단백질(SLBP), 32 kDa 단백질이 확인되었다. 핵 및 세포질 모두에서 히스톤 메신저의 3'-말단에 있는 히스톤 스템-루프와 관련이 있다. 이의 발현 수준은 세포 주기에 의해 조절되고; 히스톤 mRNA 수준이 또한 상승된 경우, S-기 동안 최고조에 달한다. 단백질은 U7 snRNP에 의해 히스톤 전(pre)-mRNA의 효율적인 3'-말단 처리에 필수적인 것으로 나타났다. SLBP는 처리 후 스템-루프와 계속 연관되며, 이후 성숙한 히스톤 mRNA가 세포질에서 히스톤 단백질로의 번역을 자극시킨다. SLBP의 RNA 결합 도메인은 후생동물 및 원생동물을 통해 보존되고; 히스톤 스템-루프에 대한 결합은 루프의 구조에 좌우된다. 최소 결합 부위는 스템-루프에 대해 적어도 3개의 뉴클레오타이드 5' 및 2개의 뉴클레오타이드 3'을 포함한다.
일부 구현예에서, mRNA는 암호화 영역, 적어도 하나의 히스톤 스템-루프, 및 선택적으로, 폴리(A) 서열 또는 폴리아데닐화 신호를 포함한다. 폴리(A) 서열 또는 폴리아데닐화 신호는 일반적으로 암호화된 단백질의 발현 수준을 향상시켜야 한다. 암호화된 단백질은, 일부 구현예에서, 히스톤 단백질, 리포터 단백질(예를 들어, 루시퍼라아제, GFP, EGFP, β-갈락토시다아제, EGFP), 또는 마커 또는 선택 단백질(예를 들어, 알파-글로빈, 갈락토키나제 및 잔틴:구아닌 포스포리보실 트랜스퍼라제(GPT))가 아니다.
일부 구현예에서, mRNA는 폴리(A) 서열 또는 폴리아데닐화 신호 및 적어도 하나의 히스톤 스템-루프의 조합을 포함하지만, 둘 다 천연에서 대안적인 기전을 나타내더라도, 개별 요소 중 하나에서 관찰된 수준 이상으로 단백질 발현을 증가시키기 위해 상승적으로 작용한다. 폴리(A) 및 적어도 하나의 히스톤 스템-루프 조합의 상승작용 효과는 요소의 순서 또는 폴리(A) 서열의 길이에 좌우되지 않는다.
일부 구현예에서, mRNA는 히스톤 다운스트림 요소(HDE)를 포함하지 않는다. "히스톤 다운스트림 요소"(HDE)는 U7 snRNA에 대한 결합 부위를 나타내는, 천연 발생 스템-루프의 대략 15 내지 20개의 뉴클레오티드 3'의 퓨린-풍부 폴리뉴클레오티드 스트레치를 포함하며, 이는 히스톤 전(pre)-mRNA를 성숙한 히스톤 mRNA로 처리하는 데 관여한다. 일부 구현예에서, 핵산은 인트론을 포함하지 않는다.
mRNA는 변형 또는 비변형될 수 있거나 활성화 또는 불활성화될 수 있는, 인핸서 및/또는 프로모터 서열을 함유할 수 있거나 함유하지 않을 수 있다. 일부 구현예에서, 히스톤 스템-루프는 일반적으로 히스톤 유전자로부터 유래되고, 구조의 루프를 형성하는, 짧은 서열로 구성되는, 스페이서에 의해 분리된 2개의 이웃한 부분적으로 또는 전체적으로 역 상보적인 서열의 분자내 염기 쌍을 포함한다. 쌍을 이루지 않은 루프 영역은 전형적으로 스템 루프 요소 중 하나와 염기 쌍을 이룰 수 없다. 이는 많은 RNA 2차 구조의 핵심 성분인 것처럼, RNA에서 더 종종 발생하지만, 단일가닥 DNA에서도 존재할 수 있다. 스템-루프 구조의 안정성은 일반적으로 길이, 불일치 또는 돌출의 수, 및 쌍을 이루는 영역의 염기 조성에 좌우된다. 일부 구현예에서, 워블 염기 쌍(비-왓슨-크릭 염기 쌍)이 생길 수 있다. 일부 구현예에서, 적어도 하나의 히스톤 스템-루프 서열은 15 내지 45개의 뉴클레오티드의 길이를 포함한다.
일부 구현예에서, mRNA는 제거된 하나 이상의 AU-풍부 서열을 갖는다. 때때로 AURES로 지칭되는 이들 서열은 3' UTR에서 발견되는 불안정화 서열이다. AURES는 RNA 백신으로부터 제거될 수 있다. 대안적으로, AURES는 RNA 백신에 남아있을 수 있다.
신호 펩티드
일부 구현예에서, 조성물은 코로나바이러스 항원에 융합된 신호 펩티드를 암호화하는 ORF를 갖는 mRNA를 포함한다. 단백질의 N-말단 15-60개 아미노산을 포함하는 신호 펩티드는 전형적으로 분비성 경로 상의 막을 가로지르는 전위에 필요하며, 따라서 진핵생물 및 원핵생물 모두에서 대부분의 단백질의 분비성 경로로의 진입을 보편적으로 제어한다. 진핵생물에서, 초기 전구체 단백질(전-단백질)의 신호 펩티드는 리보솜을 조면 소포체(ER) 막으로 안내하고, 처리를 위해 막을 가로지르는 성장하는 펩티드 사슬의 수송을 개시한다. ER 처리는 성숙한 단백질을 생성하고, 상기 신호 펩티드는 전형적으로 숙주 세포의 ER-상주 신호 펩티다아제에 의해 전구체 단백질로부터 절단되거나, 이들은 절단되지 않은 채로 남아있고 막 앵커로서 기능한다. 신호 펩티드는 또한 단백질의 세포막으로의 표적화를 용이하게 할 수 있다.
신호 펩티드는 15-60개의 아미노산의 길이를 가질 수 있다. 예를 들어, 신호 펩티드는 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 30개, 31개, 32개, 33개, 34개, 35개, 36개, 37개, 38개, 39개, 40개, 41개, 42개, 43개, 44개, 45개, 46개, 47개, 48개, 49개, 50개, 51개, 52개, 53개, 54개, 55개, 56개, 57개, 58개, 59개, 또는 60개의 아미노산의 길이를 가질 수 있다. 일부 구현예에서, 신호 펩티드는 20-60개, 25-60개, 30-60개, 35-60개, 40-60개, 45-60개, 50-60개, 55-60개, 15-55개, 20-55개, 25-55개, 30-55개, 35-55개, 40-55개, 45-55개, 50-55개, 15-50개, 20-50개, 25-50개, 30-50개, 35-50개, 40-50개, 45-50개, 15-45개, 20-45개, 25-45개, 30-45개, 35-45개, 40-45개, 15-40개, 20-40개, 25-40개, 30-40개, 35-40개, 15-35개, 20-35개, 25-35개, 30-35개, 15-30개, 20-30개, 25-30개, 15-25개, 20-25개, 또는 15-20개의 아미노산의 길이를 갖는다.
(천연에서 코로나바이러스 항원 이외의 유전자의 발현을 조절하는) 이종 유전자로부터의 신호 펩티드는 당업계에 공지되어 있고, 원하는 특성에 대해 시험한 다음 본 개시의 핵산에 혼입될 수 있다.
서열 최적화
일부 구현예에서, 본 개시의 항원을 암호화하는 ORF는 코돈 최적화된다. 코돈 최적화 방법은 당업계에 공지되어 있다. 예를 들어, 본원에 제공된 서열 중 임의의 하나 이상의 ORF는 코돈 최적화될 수 있다. 코돈 최적화는, 일부 구현예에서, 적절한 폴딩을 보장하기 위해 표적 및 숙주 유기체에서 코돈 빈도를 일치시키는데; mRNA 안정성을 증가시키기 위해 또는 2차 구조를 감소시키기 위해 GC 함량을 편향시키는데; 유전자 작제 또는 발현을 손상시킬 수 있는 연쇄 반복 코돈 또는 염기 실행을 최소화하는데; 전사 및 번역 제어 영역을 맞춤화하는데; 단백질 트래피킹 서열을 삽입 또는 제거하는데; 암호화된 단백질내 번역 후 변형 부위(예를 들어, 글리코실화 부위)를 제거/첨가하는데; 단백질 도메인을 첨가, 제거 또는 셔플링하는데; 제한 부위를 삽입 또는 제거하는데; 리보솜 결합 부위 및 mRNA 분해 부위를 변형시키는데; 단백질의 다양한 도메인을 적절하게 폴딩하도록 하는 번역 속도를 조정하는데; 또는 폴리뉴클레오티드 내의 문제 2차 구조를 감소 또는 제거하는데 사용될 수 있다. 코돈 최적화 도구, 알고리즘 및 서비스는 당업계에 알려져 있으며 - 비-제한적인 예는 GeneArt(Life Technologies), DNA2.0(Menlo Park CA) 및/또는 독점 방법으로부터의 서비스를 포함한다. 일부 구현예에서, 오픈 리딩 프레임(ORF) 서열은 최적화 알고리즘을 사용하여 최적화된다.
일부 구현예에서, 코돈 최적화된 서열은 천연-발생 또는 야생형 서열 ORF(예를 들어, 코로나바이러스 항원을 암호화하는 천연-발생 또는 야생형 mRNA 서열)에 대해 95% 미만의 서열 동일성을 공유한다. 일부 구현예에서, 코돈 최적화된 서열은 천연-발생 또는 야생형 서열(예를 들어, 코로나바이러스 항원을 암호화하는 천연-발생 또는 야생형 mRNA 서열)에 대해 90% 미만의 서열 동일성을 공유한다. 일부 구현예에서, 코돈 최적화된 서열은 천연-발생 또는 야생형 서열(예를 들어, 코로나바이러스 항원을 암호화하는 천연-발생 또는 야생형 mRNA 서열)에 대해 85% 미만의 서열 동일성을 공유한다. 일부 구현예에서, 코돈 최적화된 서열은 천연-발생 또는 야생형 서열(예를 들어, 코로나바이러스 항원을 암호화하는 천연-발생 또는 야생형 mRNA 서열)에 대해 80% 미만의 서열 동일성을 공유한다. 일부 구현예에서, 코돈 최적화된 서열은 천연-발생 또는 야생형 서열(예를 들어, 코로나바이러스 항원을 암호화하는 천연-발생 또는 야생형 mRNA 서열)에 대해 75% 미만의 서열 동일성을 공유한다.
일부 구현예에서, 코돈 최적화된 서열은 천연-발생 또는 야생형 서열(예를 들어, 코로나바이러스 항원을 암호화하는 천연-발생 또는 야생형 mRNA 서열)에 대해 65% 내지 85%(예를 들어, 약 67% 내지 약 85% 또는 약 67% 내지 약 80%) 서열 동일성을 공유한다. 일부 구현예에서, 코돈 최적화된 서열은 천연-발생 또는 야생형 서열(예를 들어, 코로나바이러스 항원을 암호화하는 천연-발생 또는 야생형 mRNA 서열)에 대해 65% 내지 75% 또는 약 80% 서열 동일성을 공유한다.
일부 구현예에서, 코돈-최적화된 서열은 비-코돈-최적화된 서열에 의해 암호화되는 코로나바이러스 항원만큼 면역원성인 항원을 암호화하거나, 보다 면역원성(예를 들어, 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 100%, 또는 적어도 200% 이상)인 항원을 암호화한다.
포유동물 숙주 세포 내로 형질감염될 때, 변형된 mRNA는 12 내지 18시간 또는 18시간 초과, 예를 들어, 24, 36, 48, 60, 72, 또는 72시간 초과의 안정성을 갖고, 이는 포유동물 숙주 세포에 의해 발현될 수 있다.
일부 구현예에서, 코돈 최적화된 RNA는 G/C의 수준이 향상된 것일 수 있다. 핵산 분자(예를 들어, mRNA)의 G/C-함량은 RNA의 안정성에 영향을 미칠 수 있다. 증가된 양의 구아닌(G) 및/또는 시토신(C) 잔기를 갖는 RNA는 다량의 아데닌(A) 및 티민(T) 또는 우라실(U) 뉴클레오티드를 함유하는 mRNA 보다 기능적으로 더 안정할 수 있다. 예로서, WO02/098443호는 번역된 영역에서 서열 변형에 의해 안정화된 mRNA를 함유하는 약학적 조성물을 개시한다. 유전자 코드의 축퇴성으로 인해, 변형은 기존 코돈을 생성된 아미노산을 변경하지 않으면서 더 큰 RNA 안정성을 촉진하는 코돈으로 치환함으로써 작동한다. 접근법은 RNA의 암호화 영역으로 제한된다.
화학적으로 비변형된 뉴클레오티드
일부 구현예에서, mRNA는 화학적으로 변형되지 않으며 아데노신, 구아노신, 시토신 및 우리딘으로 구성된 표준 리보뉴클레오티드를 포함한다. 일부 구현예에서, 본 개시의 뉴클레오티드 및 뉴클레오시드는 전사된 RNA(예를 들어, A, G, C, 또는 U)에 존재하는 것과 같은 표준 뉴클레오시드 잔기를 포함한다. 일부 구현예에서, 본 개시의 뉴클레오티드 및 뉴클레오시드는 DNA(예를 들어, dA, dG, dC, 또는 dT)에 존재하는 것과 같은 표준 데옥시리보뉴클레오시드를 포함한다.
화학적 변형
본 개시의 조성물은 일부 구현예에서, 코로나바이러스 항원을 암호화하는 오픈 리딩 프레임을 갖는 mRNA를 포함하며, 상기 핵산은 당업계에 공지된 바와 같이 표준(비변형됨) 또는 변형될 수 있는 뉴클레오티드 및/또는 뉴클레오시드를 포함한다. 일부 구현예에서, 본 개시의 뉴클레오티드 및 뉴클레오시드는 변형된 뉴클레오티드 또는 뉴클레오시드를 포함한다. 이러한 변형된 뉴클레오티드 및 뉴클레오시드는 천연-발생 변형된 뉴클레오티드 및 뉴클레오시드 또는 비-천연 발생 변형된 뉴클레오티드 및 뉴클레오시드일 수 있다. 이러한 변형은 당업계에서 인식되는 바와 같이 뉴클레오티드 및/또는 뉴클레오시드의 당, 백본, 또는 핵염기 부분에서의 변형을 포함할 수 있다.
일부 구현예에서, 본 개시의 천연-발생 변형된 뉴클레오티드 또는 뉴클레오티드는 당업계에 일반적으로 공지되거나, 인식된 바와 같은 것이다. 이러한 천연 발생 변형된 뉴클레오티드 및 뉴클레오티드의 비제한적인 예는 특히 광범위하게 인식된 MODOMICS 데이터베이스에서 찾을 수 있다.
일부 구현예에서, 본 개시의 비-천연 발생 변형된 뉴클레오티드 또는 뉴클레오시드는 당업계에 일반적으로 공지되거나, 인식된 바와 같은 것이다. 이러한 비-천연 발생 변형된 뉴클레오티드 및 뉴클레오시드의 비제한적인 예는 특히, 공개된 미국 출원 번호 PCT/US2012/058519호; PCT/US2013/075177호; PCT/US2014/058897호; PCT/US2014/058891호; PCT/US2014/070413호; PCT/US2015/36773호; PCT/US2015/36759호; PCT/US2015/36771호; 또는 PCT/IB2017/051367호에서 찾을 수 있으며, 이들 모두는 본원에 참조로 포함된다.
따라서, 본 개시의 핵산(예를 들어, DNA 핵산 및 RNA 핵산, 예컨대 mRNA 핵산)은 표준 뉴클레오티드 및 뉴클레오시드, 천연-발생 뉴클레오티드 및 뉴클레오시드, 비-천연-발생 뉴클레오티드 및 뉴클레오시드, 또는 이의 임의의 조합을 포함할 수 있다.
본 개시의 핵산(예를 들어, DNA 핵산 및 RNA 핵산, 예컨대 mRNA 핵산)은, 일부 구현예에서, 다양한 (하나 초과의) 상이한 유형의 표준 및/또는 변형된 뉴클레오티드 및 뉴클레오시드를 포함한다. 일부 구현예에서, 핵산의 특정 영역은 1개, 2개 이상의 (선택적으로 상이한) 유형의 표준 및/또는 변형된 뉴클레오티드 및 뉴클레오시드를 함유한다.
일부 구현예에서, 세포 또는 유기체에 도입된 변형된 RNA 핵산(예를 들어, 변형된 mRNA 핵산)은 표준 뉴클레오티드 및 뉴클레오시드를 포함하는 비변형된 핵산에 비해 각각 세포 또는 유기체에서 감소된 분해를 나타낸다.
일부 구현예에서, 세포 또는 유기체에 도입된 변형된 RNA 핵산(예를 들어, 변형된 mRNA 핵산)은 표준 뉴클레오티드 및 뉴클레오시드를 포함하는 비변형된 핵산에 비해 각각 세포 또는 유기체에서 감소된 면역원성(예를 들어, 감소된 선천적 반응)을 나타낼 수 있다.
핵산(예를 들어, RNA 핵산, 예컨대 mRNA 핵산)은, 일부 구현예에서, 원하는 기능 또는 특성을 달성하기 위해 핵산의 합성 동안 또는 합성 후 도입되는 비-천연 변형된 뉴클레오티드를 포함한다. 변형은 뉴클레오티드간 연결, 퓨린 또는 피리미딘 염기, 또는 당에 존재할 수 있다. 변형은 화학적 합성 또는 사슬의 말단 또는 사슬의 다른 곳에서 폴리머라제 효소를 사용하여 도입될 수 있다. 핵산의 임의의 영역은 화학적으로 변형될 수 있다.
본 개시는 핵산(예를 들어, RNA 핵산, 예컨대 mRNA 핵산)의 변형된 뉴클레오시드 및 뉴클레오티드를 제공한다. "뉴클레오시드"는 유기 염기(예를 들어, 퓨린 또는 피리미딘) 또는 이의 유도체(본원에서 "핵염기"로도 지칭됨)와 조합하여 당 분자(예를 들어, 펜토스 또는 리보스) 또는 이의 유도체를 함유하는 화합물을 지칭한다. "뉴클레오티드"는 포스페이트 기를 포함하는 뉴클레오시드를 지칭한다. 변형된 뉴클레오티드는 하나 이상의 변형된 또는 비-천연 뉴클레오시드를 포함하기 위해, 예를 들어, 화학적으로, 효소적으로, 또는 재조합적으로와 같은 임의의 유용한 방법에 의해 합성될 수 있다. 핵산은 연결된 뉴클레오시드의 영역 또는 영역들을 포함할 수 있다. 이러한 영역은 가변적인 백본 연결을 가질 수 있다. 연결은 표준 포스포디에스테르 연결일 수 있으며, 이 경우 핵산은 뉴클레오티드의 영역을 포함할 것이다.
변형된 뉴클레오티드 염기 쌍은 표준 아데노신-티민, 아데노신-우라실, 또는 구아노신-시토신 염기 쌍, 뿐만 아니라 비-표준 또는 변형된 염기를 포함하는 뉴클레오티드 및/또는 변형된 뉴클레오티드 사이에 형성된 염기 쌍을 포함하며, 여기서 수소 결합 공여체 및 수소 결합 수용체의 배열은 예를 들어 적어도 하나의 화학적 변형을 갖는 핵산에서와 같이 비-표준 염기 및 표준 염기 사이 또는 2개의 상보적 비-표준 염기 구조 사이의 수소 결합을 허용한다. 이러한 비-표준 염기 쌍의 하나의 예는 변형된 뉴클레오티드 이노신 및 아데닌, 시토신 또는 우라실 사이의 염기 쌍이다. 염기/당 또는 링커의 임의의 조합은 본 개시의 핵산으로 혼입될 수 있다.
일부 구현예에서, 핵산(예를 들어, RNA 핵산, 예컨대 mRNA 핵산)에서 변형된 핵염기는 1-메틸-슈도우리딘(m1Ψ), 1-에틸-슈도우리딘(e1Ψ), 5-메톡시-우리딘(mo5U), 5-메틸-시티딘(m5C), 및/또는 슈도우리딘(Ψ)을 포함한다. 일부 구현예에서, 핵산(예를 들어, RNA 핵산, 예컨대 mRNA 핵산)에서 변형된 핵염기는 5-메톡시메틸 우리딘, 5-메틸티오 우리딘, 1-메톡시메틸 슈도우리딘, 5-메틸 시티딘, 및/또는 5-메톡시 시티딘을 포함한다. 일부 구현예에서, 폴리리보뉴클레오티드는 화학적 변형을 포함하나 이에 제한되지 않는, 임의의 전술한 변형된 핵염기 중 적어도 2개(예를 들어, 2개, 3개, 4개 이상)의 조합을 포함한다.
일부 구현예에서, 본 개시의 mRNA는 핵산의 하나 이상 또는 모든 우리딘 위치에서 1-메틸-슈도우리딘(m1Ψ) 치환을 포함한다.
일부 구현예에서, 본 개시의 mRNA는 핵산의 하나 이상 또는 모든 우리딘 위치에서 1-메틸-슈도우리딘(m1Ψ) 치환 및 핵산의 하나 이상 또는 모든 시티딘 위치에서 5-메틸 시티딘 치환을 포함한다.
일부 구현예에서, 본 개시의 mRNA는 핵산의 하나 이상 또는 모든 우리딘 위치에서 슈도우리딘(Ψ) 치환을 포함한다.
일부 구현예에서, 본 개시의 mRNA는 핵산의 하나 이상 또는 모든 우리딘 위치에서 슈도우리딘(Ψ) 치환 및 핵산의 하나 이상 또는 모든 시티딘 위치에서 5-메틸 시티딘 치환을 포함한다.
일부 구현예에서, 본 개시의 mRNA는 핵산의 하나 이상 또는 모든 우리딘 위치에서 우리딘을 포함한다.
일부 구현예에서, mRNA는 특정 변형에 대해 균일하게 변형(예를 들어, 완전히 변형, 전체 서열에 걸쳐 변형)된다. 예를 들어, 핵산은 1-메틸-슈도우리딘으로 균일하게 변형될 수 있으며, 이는 mRNA 서열에서 모든 우리딘 잔기가 1-메틸-슈도우리딘으로 대체됨을 의미한다. 유사하게는, 핵산은 상기 제시된 것들과 같은 변형된 잔기로 대체함으로써 서열에 존재하는 임의의 유형의 뉴클레오시드 잔기에 대해 균일하게 변형될 수 있다.
본 개시의 핵산은 분자의 전체 길이에 따라 부분적으로 또는 완전히 변형될 수 있다. 예를 들어, 하나 이상 또는 모든 또는 주어진 유형의 뉴클레오티드(예를 들어, 퓨린 또는 피리미딘, 또는 A, G, U, C 중 임의의 하나 이상 또는 모두)는 개시의 핵산, 또는 이의 미리 결정된 서열 영역(예를 들어, 폴리(A) 꼬리를 포함하거나 또는 제외한 mRNA)에서 균일하게 변형될 수 있다. 일부 구현예에서, 본 개시의 핵산 (또는 이의 서열 영역)에서 모든 뉴클레오티드 X는 변형된 뉴클레오티드이며, 상기 X는 뉴클레오티드 A, G, U, C 중 임의의 하나, 또는 조합 A+G, A+U, A+C, G+U, G+C, U+C, A+G+U, A+G+C, G+U+C 또는 A+G+C 중 임의의 하나일 수 있다.
핵산은 약 1% 내지 약 100%의 변형된 뉴클레오티드(전체 뉴클레오티드 함량과 관련하여, 또는 하나 이상의 유형의 뉴클레오티드, 즉, A, G, U, 또는 C 중 임의의 하나 이상과 관련하여) 또는 임의의 중간 백분율(예를 들어, 1% 내지 20%, 1% 내지 25%, 1% 내지 50%, 1% 내지 60%, 1% 내지 70%, 1% 내지 80%, 1% 내지 90%, 1% 내지 95%, 10% 내지 20%, 10% 내지 25%, 10% 내지 50%, 10% 내지 60%, 10% 내지 70%, 10% 내지 80%, 10% 내지 90%, 10% 내지 95%, 10% 내지 100%, 20% 내지 25%, 20% 내지 50%, 20% 내지 60%, 20% 내지 70%, 20% 내지 80%, 20% 내지 90%, 20% 내지 95%, 20% 내지 100%, 50% 내지 60%, 50% 내지 70%, 50% 내지 80%, 50% 내지 90%, 50% 내지 95%, 50% 내지 100%, 70% 내지 80%, 70% 내지 90%, 70% 내지 95%, 70% 내지 100%, 80% 내지 90%, 80% 내지 95%, 80% 내지 100%, 90% 내지 95%, 90% 내지 100%, 및 95% 내지 100%)을 함유할 수 있다. 임의의 나머지 백분율은 비변형된 A, G, U, 또는 C의 존재에 의해 고려되는 것으로 이해될 것이다.
mRNA는 최소 1% 및 최대 100%의 변형된 뉴클레오티드, 또는 적어도 5% 변형된 뉴클레오티드, 적어도 10% 변형된 뉴클레오티드, 적어도 25% 변형된 뉴클레오티드, 적어도 50% 변형된 뉴클레오티드, 적어도 80% 변형된 뉴클레오티드, 또는 적어도 90% 변형된 뉴클레오티드와 같은 임의의 중간 백분율을 함유할 수 있다. 예를 들어, 핵산은 변형된 우라실 또는 시토신과 같은 변형된 피리미딘을 함유할 수 있다. 일부 구현예에서, 핵산 내 우라실의 적어도 5%, 적어도 10%, 적어도 25%, 적어도 50%, 적어도 80%, 적어도 90% 또는 100%가 변형된 우라실(예를 들어, 5-치환된 우라실)로 대체된다. 변형된 우라실은 단일 고유 구조를 갖는 화합물로 대체될 수 있거나, 상이한 구조(예를 들어, 2개, 3개, 4개 이상의 고유 구조)를 갖는 복수의 화합물로 대체될 수 있다. 일부 구현예에서, 핵산 내 시토신의 적어도 5%, 적어도 10%, 적어도 25%, 적어도 50%, 적어도 80%, 적어도 90%, 또는 100%가 변형된 시토신(예를 들어, 5-치환된 시토신)으로 대체된다. 변형된 시토신은 단일 고유 구조를 갖는 화합물로 대체될 수 있거나, 상이한 구조(예를 들어, 2개, 3개, 4개 이상의 고유 구조)를 갖는 복수의 화합물로 대체될 수 있다.
비번역 영역(UTR)
본 개시의 mRNA는 비번역 영역으로서 작용하거나 기능하는 하나 이상의 영역 또는 부분을 포함할 수 있다. mRNA가 적어도 하나의 관심 항원을 암호화하도록 디자인된 경우, 핵산은 이러한 비번역 영역(UTR) 중 하나 이상을 포함할 수 있다. 핵산의 야생형 비번역 영역은 전사되나 번역되지는 않는다. mRNA에서, 5' UTR은 전사 시작 부위에서 시작하여 시작 코돈까지 계속되지만, 시작 코돈은 포함하지 않는다; 반면, 3' UTR은 정지 코돈 직후에 시작하여 전사 종결 신호까지 계속된다. 핵산 분자 및 번역의 안정성 측면에서 UTR에 의해 수행되는 조절 역할에 대한 증거 체제가 증가하고 있다. UTR의 조절 기능은 무엇보다도 분자의 안정성을 향상시키기 위해, 본 개시의 폴리뉴클레오티드에 혼입될 수 있다. 특정 기능은 바람직하지 않은 기관 부위로 잘못 지시되는 경우 전사체의 제어된 하향-조절을 보장하기 위해 혼입될 수도 있다. 다양한 5' UTR 및 3' UTR 서열은 공지되어 있고 당업계에서 이용가능하다.
5' UTR은 시작 코돈 (리보솜에 의해 번역된 mRNA 전사체의 제1 코돈)으로부터 바로 업스트림 (5')인 mRNA의 영역이다. 5' UTR은 단백질을 암호화하지 않는다(이는 비-암호화임). 천연 5' UTR은 번역 개시에 역할을 하는 기능을 갖는다. 이들은 리보솜이 많은 유전자의 번역을 개시하는 과정에 수반되는 것으로 통상적으로 알려진 Kozak 서열과 같은 특징을 가지고 있다. 코작 서열은 공통 CCR(A/G)CCAUGG (서열번호 128)를 가지며, 여기서 R은 시작 코돈(AUG)의 상류에 있는 퓨린(아데닌 또는 구아닌) 3개 염기이며, 그 뒤에 또 다른 'G'가 있다. 5' UTR은 또한 신장 인자 결합에 관여하는 2차 구조를 형성하는 것으로 알려져 있다.
본 개시의 일부 구현예에서, 5' UTR은 이종 UTR, 즉, 상이한 ORF와 연관된 천연에서 발견되는 UTR이다. 또 다른 구현예에서, 5' UTR은 합성 UTR, 즉 천연에서 발생하지 않는다. 합성 UTR은 이들의 특성을 개선하기 위해, 예를 들어, 유전자 발현을 증가시키기 위해 돌연변이된 UTR 뿐만 아니라 완전히 합성된 UTR을 포함한다. 예시적인 5' UTR은 제노프스(Xenopus) 또는 인간 유래 a-글로빈 또는 b-글로빈(8278063; 9012219), 인간 시토크롬 b-245 a 폴리펩티드, 및 하이드록시스테로이드(17b) 탈수소효소, 및 담배 식각 바이러스(US8278063호, 9012219)를 포함한다. CMV 극초기 1(IE1) 유전자(US20140206753호, WO2013/185069호), 서열 GGGAUCCUACC(서열번호 129)(WO2014144196호)도 사용될 수 있다. 다른 구현예에서, TOP 유전자의 5' UTR은 5' TOP 모티프(올리고피리미딘 트랙)가 결여된 TOP 유전자의 5' UTR(예를 들어, WO/2015101414호, WO2015101415호, WO/2015/062738호, WO2015024667호, WO2015024667호이고; 리보솜 단백질 Large 32(L32) 유전자로부터 유래된 5' UTR 요소(WO/2015101414호, WO2015101415호, WO/2015/062738호), 하이드록시스테로이드(17-β) 탈수소효소 4 유전자(HSD17B4)의 5' UTR로부터 유래된 5' UTR 요소(WO2015024667호), 또는 ATP5A1의 5' UTR로부터 유래된 5' UTR 요소(WO2015024667호)가 사용될 수 있다. 일부 구현예에서, 내부 리보솜 진입 부위(IRES)가 5' UTR 대신 사용된다.
일부 구현예에서, 본 개시의 5' UTR은 서열 131 및 서열번호 2로부터 선택되는 서열을 포함한다.
3' UTR은 정지 코돈 (번역의 종결을 신호하는 mRNA 전사체의 코돈)으로부터 바로 다운스트림(3')인 mRNA의 영역이다. 3' UTR은 단백질을 암호화하지 않는다(이는 비-암호화임). 천연 또는 야생형 3' UTR은 그들에 함입된 아데노신 및 우리딘의 스트레치(stretch)를 갖는 것으로 알려져 있다. 이러한 AU 풍부한 특징은 높은 전환율을 갖는 유전자에서 특히 보편적이다. 이들의 서열 특징 및 기능적 특성에 기반하여, AU 풍부 요소(ARE)는 3가지 부류로 분리될 수 있으며(Chen 등, 1995): 클래스 I ARE는 U-풍부 영역 내에서 AUUUA 모티프의 몇몇 분산된 복제물을 함유한다. C-Myc 및 MyoD는 클래스 I ARE를 함유한다. 클래스 II ARE는 2개 이상의 중복 UUAUUUA(U/A)(U/A)(서열번호 130) 노나머를 갖는다. 이 유형의 ARE를 함유하는 분자는 GM-CSF 및 TNF-a를 포함한다. 클래스 III ARES는 덜 제대로 정의된다. 이들 U 풍부 영역은 AUUUA 모티프를 함유하지 않는다. c-Jun 및 마이오게닌은 이 부류의 2가지 잘 연구된 예이다. ARE에 대한 대부분의 단백질 결합은 메신저를 불안정하게 하는 것으로 알려져 있는 반면, ELAV 패밀리의 구성원, 가장 현저하게는 HuR은 mRNA의 안정성을 증가시키는 것으로 보고되었다. HuR은 모두 3가지 부류의 ARE에 결합한다. 핵산 분자의 3' UTR에 HuR 특이적 결합 부위를 조작하는 것은 HuR 결합을 유도할 것이고, 따라서 생체내 메신저의 안정화를 유도할 것이다.
3' UTR AU 풍부 요소(ARE)의 도입, 제거 또는 변형은 본 개시의 핵산(예를 들어, RNA)의 안정성을 조절하기 위해 사용될 수 있다. 특정 핵산을 조작할 때, 본 개시의 핵산을 덜 안정하게 만들기 위해 ARE의 하나 이상의 복제물이 도입될 수 있고, 이에 의해 번역을 축소시키며 생성된 단백질의 생산을 감소시킨다. 마찬가지로, ARE는 세포내 안정성을 증가시키기 위해 동정되고 제거되거나 또는 돌연변이될 수 있고, 따라서, 생성된 단백질의 번역 및 생산을 증가시킨다. 형질감염 실험은 본 개시의 핵산을 이용하여, 적절한 세포주에서 수행될 수 있고, 단백질 생산은 형질감염 후 다양한 시점에 분석될 수 있다. 예를 들어, 세포는 상이한 ARE-조작 분자로 형질감염될 수 있고, 적절한 단백질에 대해 ELISA 키트를 이용하여 형질감염 후 6시간, 12시간, 24시간, 48시간 및 7일에 생성된 단백질을 분석한다.
3' UTR은 이종 또는 합성일 수 있다. 3' UTR과 관련하여, 제노푸스 β-글로빈 UTR 및 인간 β-글로빈 UTR을 포함하는, 글로빈 UTR이 당업계에 공지되어 있다(8278063, 9012219, US20110086907호). 2개의 순차적인 인간 β-글로빈 3' UTR을 머리에서 꼬리로 클로닝함으로써 일부 세포 유형에서 안정성이 향상된 변형된 β-글로빈 작제물이 개발되었으며, 당업계에 잘 알려져 있다(US2012/0195936호, WO2014/071963호). 또한, a2-글로빈, a1-글로빈, UTR 및 이들의 돌연변이체도 당업계에 공지되어 있다(WO2015101415호, WO2015024667호). 비특허 문헌의 mRNA 작제물에 기술된 다른 3' UTR에는 CYBA(Ferizi 등, 2015) 및 알부민(Thess 등, 2015)이 포함된다. 다른 예시적인 3' UTR에는 (야생형 또는 변형된) 소 또는 인간 성장 호르몬(WO2013/185069호, US20140206753호, WO2014152774호), 토끼 β 글로빈 및 B형 간염 바이러스(HBV)의 것이 포함되고, α-글로빈 3' UTR 및 바이러스 VEEV 3' UTR 서열도 당업계에 공지되어 있다. 일부 구현예에서, 서열 UUUGAAUU(WO2014144196호)가 사용된다. 일부 구현예에서, 인간 및 마우스 리보솜 단백질의 3' UTR이 사용된다. 다른 예에는 rps9 3' UTR (WO2015101414호), FIG4 (WO2015101415호), 및 인간 알부민 7(WO2015101415호)이 포함된다.
일부 구현예에서, 본 개시의 3' UTR은 서열 132 및 서열번호 4로부터 선택되는 서열을 포함한다.
당업자는 이종 또는 합성인 5' UTR이 임의의 원하는 3' UTR 서열과 함께 사용될 수 있음을 이해할 것이다. 예를 들어, 이종 5' UTR은 이종 3" UTR이 있는 합성 3' UTR과 함께 사용될 수 있다.
비-UTR 서열은 또한 핵산 내의 영역 또는 서브영역으로 사용될 수 있다. 예를 들어, 인트론 또는 인트론 서열의 일부는 본 개시의 핵산의 영역에 혼입될 수 있다. 인트론 서열의 혼입은 핵산 수준 뿐만 아니라 단백질 생산을 증가시킬 수 있다.
특징의 조합은 측부 영역(flanking region)에 포함될 수 있고, 다른 특징 내에 포함될 수 있다. 예를 들어, ORF는 강한 코작(Kozak) 번역 개시 신호를 포함할 수 있는 5' UTR 및/또는 폴리-A 꼬리의 주형 첨가를 위한 올리고(dT) 서열을 포함할 수 있는 3' UTR에 의해 플랭크될 수 있다. 5' UTR은 본원에 그 전체가 참조로 포함된 미국 출원 공개 번호 제20100293625호 및 PCT/US2014/069155호에 기재된 5' UTR과 같은 동일하고/하거나 상이한 유전자로부터의 제1 폴리뉴클레오티드 단편 및 제2 폴리뉴클레오티드 단편을 포함할 수 있다.
임의의 유전자로부터의 임의의 UTR이 핵산 영역에 포함될 수 있음을 이해해야 한다. 더욱이, 임의의 알려진 유전자의 다중 야생형 UTR이 활용될 수 있다. 야생형 영역의 변이체가 아닌 인공 UTR을 제공하는 것도 본 개시의 범위 내에 있다. 이러한 UTR 또는 이의 일부는 이들이 선택된 전사체와 동일한 방향으로 배치될 수 있거나 방향 또는 위치가 변경될 수 있다. 따라서 5' 또는 3' UTR은 하나 이상의 다른 5' UTR 또는 3' UTR로 반전되고, 단축되고, 연장되고, 이루어질 수 있다. 본원에 사용된 바와 같이, UTR 서열과 관련하여 용어 "변경된"은 UTR이 참조 서열과 관련하여 어떤 방식으로든 변화되었음을 의미한다. 예를 들어, 3' UTR 또는 5' UTR은 상기 교시된 방향 또는 위치의 변화에 의해 야생형 또는 천연 UTR에 비해 변경될 수 있거나, 추가 뉴클레오티드의 포함, 뉴클레오티드의 결실, 뉴클레오티드의 교체 또는 전위에 의해 변경될 수 있다. "변경된" UTR (3'이든 5'이든)을 생성하는 이러한 변화들 중 임의의 것은 변이체 UTR을 포함한다.
일부 구현예에서, 5' UTR 또는 3' UTR과 같은 이중, 삼중 또는 사중 UTR이 사용될 수 있다. 본원에 사용된 바와 같이, "이중" UTR은 동일한 UTR의 2개의 복제물이 연속하여 또는 실질적으로 연속하여 암호화된 것이다. 예를 들어, 이중 베타-글로빈 3' UTR은 미국 특허 공개 제20100129877호에 기재된 바와 같이 사용될 수 있으며, 이 내용은 그 전체가 본원에 참조로 포함된다.
또한 패턴화된 UTR에 대한 본 개시의 범주 내에 있다. 본원에 사용된 바와 같이, "패턴화된 UTR"은 ABABAB 또는 AABBAABBAABB 또는 ABCABCABC 또는 1회, 2회, 또는 3회 이상 반복되는 이의 변이체와 같은 반복 또는 교대 패턴을 반영하는 UTR이다. 이러한 패턴에서, 각각의 문자, A, B 또는 C는 뉴클레오티드 수준에서 상이한 UTR을 나타낸다.
일부 구현예에서, 측부 영역은 단백질이 공통 기능, 구조, 특징 또는 특성을 공유하는 전사체 패밀리로부터 선택된다. 예를 들어, 관심 폴리펩티드는 발달 동안 특정 세포, 조직에서 또는 일부 시간에 발현되는 단백질 패밀리에 속할 수 있다. 임의의 이들 유전자로부터의 UTR은 동일하거나 상이한 단백질 패밀리의 임의의 다른 UTR로 교체되어 새로운 폴리뉴클레오티드를 생성할 수 있다. 본원에 사용된 바와 같이, "단백질 패밀리"는 적어도 하나의 기능, 구조, 특징, 국소화, 기원 또는 발현 패턴을 공유하는 2개 이상의 관심 폴리펩티드의 그룹을 지칭하기 위해 가장 넓은 의미로 사용된다.
비번역 영역은 또한 번역 인핸서 요소(TEE)를 포함할 수 있다. 비-제한적인 예로서, TEE는 본원에 그 전체가 참조로 포함된 미국 출원 번호 제20090226470호에 기재된 것들, 및 당업계에 공지된 것들을 포함할 수 있다.
RNA의 시험관내 전사
본원에 기재된 폴리뉴클레오티드를 암호화하는 cDNA는 시험관내 전사(IVT) 시스템을 사용하여 전사될 수 있다. RNA의 시험관내 전사는 당업계에 공지되어 있고, 국제 공개 WO 2014/152027호에 기재되어 있으며, 이는 그 전체가 본원에 참조로 포함된다. 일부 구현예에서, 본 개시의 RNA는 WO 2018/053209호 및 WO 2019/036682호에 기재된 방법 중 임의의 하나 이상에 따라 제조되며, 이들 각각은 본원에 참조로 포함된다.
일부 구현예에서, RNA 전사체는 RNA 전사체를 생성하기 위해 시험관내 전사 반응에서 비-증폭된, 선형화된 DNA 주형을 사용하여 생성된다. 일부 구현예에서, 주형 DNA는 단리된 DNA이다. 일부 구현예에서, 주형 DNA는 cDNA이다. 일부 구현예에서, cDNA는 mRNA, 이에 제한되지는 않으나, 예를 들어, 코로나바이러스 mRNA의 역전사에 의해 형성된다. 일부 구현예에서, 세포, 예를 들어, 박테리아 세포, 예를 들어, E. coli, 예를 들어, DH-1 세포는 플라스미드 DNA 주형으로 형질감염된다. 일부 구현예에서, 형질감염된 세포는 플라스미드 DNA를 복제하기 위해 배양되며, 이는 이후 단리되고 정제된다. 일부 구현예에서, DNA 주형은 관심 유전자의 5'에 위치하고 작동가능하게 연결된 RNA 폴리머라제 프로모터, 예를 들어, T7 프로모터를 포함한다.
일부 구현예에서, 시험관내 전사 주형은 5' 비번역(UTR) 영역을 암호화하고, 오픈 리딩 프레임을 함유하고, 3' UTR 및 폴리A 꼬리를 암호화한다. 시험관내 전사 주형의 특정 핵산 서열 조성 및 길이는 주형에 의해 암호화된 mRNA에 의존할 것이다.
"5' 비번역 영역"(UTR)은 폴리펩티드를 암호화하지 않는 시작 코돈 (즉, 리보솜에 의해 번역된 mRNA 전사체의 제1 코돈)으로부터 바로 업스트림 (즉, 5')인 mRNA의 영역을 지칭한다. RNA 전사체가 생성되는 경우, 5' UTR은 프로모터 서열을 포함할 수 있다. 이러한 프로모터 서열은 당업계에 공지되어 있다. 이러한 프로모터 서열은 본 개시의 백신에 존재하지 않을 것임을 이해해야 한다.
"3' 비번역 영역"(UTR)은 폴리펩티드를 암호화하지 않는 정지 코돈 (즉, 번역의 종결을 신호하는 mRNA 전사체의 코돈)으로부터 바로 다운스트림 (즉, 3')인 mRNA의 영역을 지칭한다.
"오픈 리딩 프레임"은 시작 코돈 (예를 들어, 메티오닌(ATG))으로 시작하여, 정지 코돈 (예를 들어, TAA, TAG 또는 TGA)으로 종료하는 DNA의 연속적인 스트레치이며 폴리펩티드를 암호화한다.
"폴리(A) 꼬리"는 다중, 연속적인 아데노신 모노포스페이트를 함유하는 3' UTR로부터, 다운스트림, 예를 들어, 바로 다운스트림 (즉, 3')인, mRNA의 영역이다. 폴리(A) 꼬리는 10 내지 300 아데노신 모노포스페이트를 함유할 수 있다. 예를 들어, 폴리(A) 꼬리는 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, 250, 260, 270, 280, 290, 또는 300 아데노신 모노포스페이트를 함유할 수 있다. 일부 구현예에서, 폴리(A) 꼬리는 50 내지 250 아데노신 모노포스페이트를 함유한다. 관련된 생물학적 설정에서 (예를 들어, 세포에서, 생체내에서), 폴리(A) 꼬리는, 예를 들어, 세포질에서 효소적 분해로부터 mRNA를 보호하는 기능을 하고, 전사 종결, 및/또는 핵으로부터 mRNA의 유출, 및 번역을 돕는다.
일부 구현예에서, 핵산은 200 내지 3,000개의 뉴클레오티드를 포함한다. 예를 들어, 핵산은 200 내지 500, 200 내지 1000, 200 내지 1500, 200 내지 3000, 500 내지 1000, 500 내지 1500, 500 내지 2000, 500 내지 3000, 1000 내지 1500, 1000 내지 2000, 1000 내지 3000, 1500 내지 3000, 또는 2000 내지 3000개의 뉴클레오티드)를 포함할 수 있다.
시험관내 전사 시스템은 전형적으로 전사 완충액, 뉴클레오티드 트리포스페이트(NTP), RNase 억제제 및 폴리머라제를 포함한다.
NTP는 사내에서 제조될 수 있거나, 공급자로부터 선택될 수 있거나, 본원에 기술된 바와 같이 합성될 수 있다. NTP는 천연 및 비천연 (변형된) NTP를 포함하는 본원에 기재된 것들로부터 선택될 수 있으나, 이에 제한되지는 않는다.
임의의 수의 RNA 폴리머라제 또는 변이체가 본 개시의 방법에서 사용될 수 있다. 상기 폴리머라제는 이에 제한되지는 않으나, 파지 RNA 폴리머라제, 예를 들어, T7 RNA 폴리머라제, T3 RNA 폴리머라제, SP6 RNA 폴리머라제, 및/또는 변이 폴리머라제, 예컨대, 이에 제한되지는 않으나, 화학적으로 변형된 핵산 및/또는 뉴클레오티드를 포함하는, 변형된 핵산 및/또는 변형된 뉴클레오티드를 혼입할 수 있는 폴리머라제로부터 선택될 수 있다. 일부 구현예는 DNase의 사용을 배제한다.
일부 구현예에서, RNA 전사체는 효소적 캡핑을 통해 캡핑된다. 일부 구현예에서, RNA는 5' 말단 캡, 예를 들어 7mG(5')ppp(5')NlmpNp를 포함한다.
화학적 합성
고체상 화학적 합성. 본 개시의 핵산은 고체상 기술을 사용하여 전체적으로 또는 부분적으로 제조될 수 있다. 핵산의 고체상 화학적 합성은 분자가 고체 지지체 상에 고정화되고, 반응 용액에서 단계별로 합성되는 자동화된 방법이다. 고체상 합성은 핵산 서열의 화학적 변형의 부위-특이적 도입에 유용하다.
액체상 화학적 합성. 단량체 빌딩 블록의 순차적 첨가에 의한 본 개시의 핵산 합성은 액체상에서 수행될 수 있다.
합성 방법의 조합. 상기 논의된 합성 방법은 이들 각각의 장점 및 한계를 갖는다. 이러한 방법을 조합하여 한계를 극복하려는 시도가 이루어지고 있다. 이러한 방법의 조합은 본 개시의 범위 내에 있다. 효소적 결찰과 조합하여 고체상 또는 액체상 화학적 합성의 사용은 화학적 합성 단독으로 수득할 수 없는 긴 사슬 핵산을 생성하는 효율적인 방법을 제공한다.
핵산 영역 또는 서브 영역의 결찰
리가아제에 의해 핵산을 조립하는 것도 사용될 수 있다. DNA 또는 RNA 리가아제는 포스포디에스테르 결합의 형성을 통해 폴리뉴클레오티드 사슬의 5' 및 3' 말단의 분자간 결찰을 촉진한다. 키메라 폴리뉴클레오티드 및/또는 원형 핵산과 같은 핵산은 하나 이상의 영역 또는 서브 영역의 결찰에 의해 제조될 수 있다. DNA 단편은 리가아제 촉매화 반응에 의해 결합되어 상이한 기능을 갖는 재조합 DNA를 생성할 수 있다. 하나는 5' 인산기가 있고, 다른 하나는 유리 3' 하이드록실기가 있는, 2개의 올리고데옥시뉴클레오티드는 DNA 리가아제의 기질 역할을 한다.
정제
본원에 기술된 핵산의 정제는 핵산 정화, 품질 보증 및 품질 관리를 포함할 수 있으나, 이에 제한되지 않는다. 정화는 이에 제한되지 않는, AGENCOURT® 비드(Beckman Coulter Genomics, Danvers, MA), 폴리-T 비드, LNATM 올리고-T 포획 프로브(EXIQON® Inc, Vedbaek, Denmark)와 같은 당업계에 공지된 방법 또는 이에 제한되지 않는, 강한 음이온 교환 HPLC, 약한 음이온 교환 HPLC, 역상 HPLC(RP-HPLC), 및 소수성 상호작용 HPLC(HIC-HPLC)와 같은 HPLC 기반 정제 방법에 의해 수행될 수 있다. "정제된 핵산"과 같은 핵산과 관련하여 사용될 때 용어 "정제된"은 적어도 하나의 오염물로부터 분리된 것을 지칭한다. "오염 물질"은 다른 부적합하거나, 불순물이 섞여있거나, 열등하게 만드는 임의의 물질이다. 따라서, 정제된 핵산(예를 들어, DNA 및 RNA)은 천연에서 발견되는 것과 다른 형태 또는 설정으로 존재하거나, 처리 또는 정제 방법을 적용하기 전에 존재했던 것과 다른 형태 또는 설정으로 존재한다.
품질 보증 및/또는 품질 관리 검사는 겔 전기영동, UV 흡광도 또는 분석용 HPLC와 같은 방법을 사용하여 수행할 수 있으나, 이에 제한되지 않는다.
일부 구현예에서, 핵산은 역전사 효소-PCR을 포함하나 이에 제한되지 않는 방법에 의해 시퀀싱될 수 있다.
정량화
일부 구현예에서, 본 개시의 핵산은 엑소좀에서 또는 하나 이상의 체액으로부터 유래된 경우에 정량화될 수 있다. 체액에는 말초 혈액, 혈청,혈장, 복수, 소변, 뇌척수액(CSF), 객담, 타액, 골수, 활액, 수액, 양수액, 귀지, 모유, 기관지 폐포 세척액, 정액, 전립선액, 쿠퍼액 또는 사정전 액(pre-ejaculatory fluid), 땀, 대변, 모발, 눈물, 낭종액, 흉막 및 복막액, 심낭액, 림프, 미즙, 유미(chyle), 담즙, 간질액, 월경, 고름, 피지, 구토, 질 분비물, 점막 분비물, 대변 물, 췌장액, 누강의 세척액, 기관지 폐 흡인물, 배반포 강 유체(blastocyl cavity fluid), 및 제대혈이 포함된다. 대안적으로, 엑소좀은 폐, 심장, 췌장, 위, 장, 방광, 신장, 난소, 정소, 피부, 결장, 유방, 전립선, 뇌, 식도, 간 및 태반으로 이루어진 군으로부터 선택되는 기관으로부터 회수될 수 있다.
분석은 구성 특이적 프로브, 세포측정법, qRT-PCR, 실시간 PCR, PCR, 유세포 분석법, 전기영동, 질량 분석법 또는 이들의 조합을 사용하여 수행될 수 있는 반면, 엑소좀은 효소 결합 면역흡착 분석(ELISA) 방법과 같은 면역조직화학적 방법을 사용하여 단리될 수 있다. 엑소좀은 또한 크기 배제 크로마토그래피, 밀도 구배 원심분리, 차등 원심분리, 나노막 한외여과, 면역흡착 포획, 친화성 정제, 미세유체 분리, 또는 이들의 조합에 의해 단리될 수 있다.
이러한 방법은 조사자가 남아 있거나 전달되는 핵산 수준을 실시간으로 모니터링할 수 있는 능력을 제공한다. 이는 본 개시의 핵산이 일부 구현예에서, 구조적 또는 화학적 변형으로 인해 내인성 형태와 상이하기 때문에 가능하다.
일부 구현예에서, 핵산은 이에 제한되지 않는, 자외선 가시 분광법(UV/Vis)과 같은 방법을 사용하여 정량화될 수 있다. UV/Vis 분광계의 비-제한적인 예는 NANODROP® 분광계(ThermoFisher, Waltham, MA)이다. 상기 정량화된 핵산은 핵산이 적절한 크기일 수 있는지 여부를 결정하기 위해 분석될 수 있으며, 핵산의 분해가 일어나지 않았음을 확인한다. 핵산의 분해는 이에 제한되지 않는, 아가로스 겔 전기영동과 같은 방법, 이에 제한되지 않는, 강한 음이온 교환 HPLC, 약한 음이온 교환 HPLC, 역상 HPLC(RP-HPLC), 및 소수성 상호작용 HPLC(HIC-HPLC), 액체 크로마토그래피-질량 분석법(LCMS), 모세관 전기영동(CE) 및 모세관 겔 전기영동(CGE)과 같은 HPLC 기반 정제 방법으로 확인할 수 있다.
지질 나노입자(LNP)
일부 구현예에서, 본 개시의 mRNA는 지질 나노입자(LNP)로 제형화된다. 지질 나노입자는 전형적으로 관심 핵산 카고(cargo)와 함께 이온화 가능한 양이온성 지질, 비-양이온성 지질, 스테롤 및 PEG 지질 성분을 포함한다. 본 개시의 지질 나노입자는 당업계에 일반적으로 공지된 성분, 조성물, 및 방법을 사용하여 생성될 수 있으며, 예를 들어 PCT/US2016/052352호; PCT/US2016/068300호; PCT/US2017/037551호; PCT/US2015/027400호; PCT/US2016/047406호; PCT/US2016000129호; PCT/US2016/014280호; PCT/US2016/014280호; PCT/US2017/038426호; PCT/US2014/027077호; PCT/US2014/055394호; PCT/US2016/52117호; PCT/US2012/069610호; PCT/US2017/027492호; PCT/US2016/059575호 및 PCT/US2016/069491호를 참조하고, 이들 모두는 그 전체가 본원에 참조로 포함된다.
본 개시의 백신은 전형적으로 지질 나노입자 내 제형화된다. 일부 구현예에서, 지질 나노입자는 적어도 하나의 이온화 가능한 양이온성 지질, 적어도 하나의 비-양이온성 지질, 적어도 하나의 스테롤, 및/또는 적어도 하나의 폴리에틸렌 글리콜(PEG)-변형된 지질을 포함한다.
일부 구현예에서, 지질 나노입자는 40-50 mol%, 선택적으로 45-50 mol%, 예를 들어, 45-46 mol%, 46-47 mol%, 47-48 mol%, 48-49 mol%, 또는 49-50 mol%, 예를 들어, 약 45 mol%, 45.5 mol%, 46 mol%, 46.5 mol%, 47 mol%, 47.5 mol%, 48 mol%, 48.5 mol%, 49 mol%, 또는 49.5 mol%의 이온화 가능한 지질을 포함한다.
일부 구현예에서, 지질 나노입자는 30-45 mol%, 선택적으로 35-40 mol%, 예를 들어, 30-31 mol%, 31-32 mol%, 32-33 mol%, 33-34 mol%, 35-35 mol%, 35-36 mol%, 36-37 mol%, 38-38 mol%, 38-39 mol%, 또는 39-40 mol%의 스테롤을 포함한다.
일부 구현예에서, 지질 나노입자는 5-15 mol%, 선택적으로 10-12 mol%, 예를 들어, 5-6 mol%, 6-7 mol%, 7-8 mol%, 8-9 mol%, 9-10 mol%, 10-11 mol%, 11-12 mol%, 12-13 mol%, 13-14 mol%, 또는 14-15 mol%의 헬퍼 지질을 포함한다.
일부 구현예에서, 지질 나노입자는 1-5%, 선택적으로 1-3 mol%, 예를 들어 1.5 내지 2.5 mol%, 1-2 mol%, 2-3 mol%, 3-4 mol%, 또는 4-5 mol%의 PEG 지질을 포함한다.
일부 구현예에서, 지질 나노입자는 20-60 mol%의 이온화 가능한 양이온성 지질을 포함한다. 예를 들어, 지질 나노입자는 20-50 mol%, 20-40 mol%, 20-30 mol%, 30-60 mol%, 30-50 mol%, 30-40 mol%, 40-60 mol%, 40-50 mol%, 또는 50-60 mol%의 이온화 가능한 양이온성 지질을 포함할 수 있다. 일부 구현예에서, 지질 나노입자는 20 mol%, 30 mol%, 40 mol%, 50 mol%, 또는 60 mol%의 이온화 가능한 양이온성 지질을 포함한다. 일부 구현예에서, 지질 나노입자는 35 mol%, 36 mol%, 37 mol%, 38 mol%, 39 mol%, 40 mol%, 41 mol%, 42 mol%, 43 mol%, 44 mol%, 45 mol%, 46 mol%, 47 mol%, 48 mol%, 49 mol%, 50 mol%, 51 mol%, 52 mol%, 53 mol%, 54 mol%, 또는 55 mol%의 이온화 가능한 양이온성 지질을 포함한다.
일부 구현예에서, 지질 나노입자는 5-25 mol%의 비-양이온성 지질을 포함한다. 예를 들어, 지질 나노입자는 5-20 mol%, 5-15 mol%, 5-10 mol%, 10-25 mol%, 10-20 mol%, 10-25 mol%, 15-25 mol%, 15-20 mol%, 또는 20-25 mol%의 비-양이온성 지질을 포함할 수 있다. 일부 구현예에서, 지질 나노입자는 5 mol%, 10 mol%, 15 mol%, 20 mol%, 또는 25 mol%의 비-양이온성 지질을 포함한다.
일부 구현예에서, 지질 나노입자는 25-55 mol%의 스테롤을 포함한다. 예를 들어, 지질 나노입자는 25-50 mol%, 25-45 mol%, 25-40 mol%, 25-35 mol%, 25-30 mol%, 30-55 mol%, 30-50 mol%, 30-45 mol%, 30-40 mol%, 30-35 mol%, 35-55 mol%, 35-50 mol%, 35-45 mol%, 35-40 mol%, 40-55 mol%, 40-50 mol%, 40-45 mol%, 45-55 mol%, 45-50 mol%, 또는 50-55 mol%의 스테롤을 포함할 수 있다. 일부 구현예에서, 지질 나노입자는 25 mol%, 30 mol%, 35 mol%, 40 mol%, 45 mol%, 50 mol%, 또는 55 mol%의 스테롤을 포함한다.
일부 구현예에서, 지질 나노입자는 0.5-15 mol%의 PEG-변형된 지질을 포함한다. 예를 들어, 지질 나노입자는 0.5-10 mol%, 0.5-5 mol%, 1-15 mol%, 1-10 mol%, 1-5 mol%, 2-15 mol%, 2-10 mol%, 2-5 mol%, 5-15 mol%, 5-10 mol%, 또는 10-15 mol%를 포함할 수 있다. 일부 구현예에서, 지질 나노입자는 0.5 mol%, 1 mol%, 2 mol%, 3 mol%, 4 mol%, 5 mol%, 6 mol%, 7 mol%, 8 mol%, 9 mol%, 10 mol%, 11 mol%, 12 mol%, 13 mol%, 14 mol%, 또는 15 mol%의 PEG-변형된 지질을 포함한다.
일부 구현예에서, 지질 나노입자는 20-60 mol%의 이온화 가능한 양이온성 지질, 5-25 mol%의 비-양이온성 지질, 25-55 mol%의 스테롤, 및 0.5-15 mol%의 PEG-변형된 지질을 포함한다.
일부 구현예에서, 본 개시의 이온화 가능한 양이온성 지질은 하기 화학식 (I)의 화합물 또는 이의 염 또는 이성질체를 포함한다:
Figure pct00070
(I),
식 중:
R1은 C5-30 알킬, C5-20 알케닐, -R*YR", -YR", 및 -R"M'R'로 이루어진 군으로부터 선택되고;
R2 및 R3은 H, C1-14 알킬, C2-14 알케닐, R*YR", -YR", 및 -R*OR"로 이루어진 군으로부터 독립적으로 선택되거나, 또는 R2 및 R3은 이들이 부착되는 원자와 함께 헤테로사이클 또는 카르보사이클을 형성하며;
R4는 C3-6 카르보사이클, -(CH2)nQ, -(CH2)nCHQR, -CHQR, -CQ(R)2, 및 비치환된 C1-6 알킬로 이루어진 군으로부터 선택되고, 이때 Q는 카르보사이클, 헤테로사이클, -OR, -O(CH2)nN(R)2, -C(O)OR, -OC(O)R, -CX3, -CX2H, -CXH2, -CN, -N(R)2, -C(O)N(R)2, -N(R)C(O)R, -N(R)S(O)2R, -N(R)C(O)N(R)2, -N(R)C(S)N(R)2, -N(R)R8,
-O(CH2)nOR, -N(R)C(=NR9)N(R)2, -N(R)C(=CHR9)N(R)2, -OC(O)N(R)2, -N(R)C(O)OR,
-N(OR)C(O)R, -N(OR)S(O)2R, -N(OR)C(O)OR, -N(OR)C(O)N(R)2, -N(OR)C(S)N(R)2,
-N(OR)C(=NR9)N(R)2, -N(OR)C(=CHR9)N(R)2, -C(=NR9)N(R)2, -C(=NR9)R, -C(O)N(R)OR, 및 -C(R)N(R)2C(O)OR로부터 선택되며, 각각의 n은 1, 2, 3, 4, 및 5로부터 독립적으로 선택되고;
각각의 R5는 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R6은 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
M 및 M'는 -C(O)O-, -OC(O)-, -C(O)N(R')-, -N(R')C(O)-, -C(O)-, -C(S)-, -C(S)S-, -SC(S)-, -CH(OH)-, -P(O)(OR')O-, -S(O)2-, -S-S-, 아릴기, 및 헤테로아릴기로부터 독립적으로 선택되고;
R7은 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 선택되고;
R8은 C3-6 카르보사이클 및 헤테로사이클로 이루어진 군으로부터 선택되고;
R9는 H, CN, NO2, C1-6 알킬, -OR, -S(O)2R, -S(O)2N(R)2, C2-6 알케닐, C3-6 카르보사이클 및 헤테로사이클로 이루어진 군으로부터 선택되고;
각각의 R은 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R'은 C1-18 알킬, C2-18 알케닐, -R*YR", -YR", 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R"은 C3-14 알킬 및 C3-14 알케닐로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R*은 C1-12 알킬 및 C2-12 알케닐로 이루어진 군으로부터 독립적으로 선택되고;
각각의 Y는 독립적으로 C3-6 카르보사이클이고;
각각의 X는 F, Cl, Br, 및 I로 이루어진 군으로부터 독립적으로 선택되고;
m은 5, 6, 7, 8, 9, 10, 11, 12, 및 13으로부터 선택된다.
일부 구현예에서, 화학식 (I)의 화합물의 서브세트(subset)는 R4가 -(CH2)nQ, -(CH2)nCHQR, -CHQR, 또는 -CQ(R)2인 경우, (i) n이 1, 2, 3, 4 또는 5일 때, Q는 -N(R)2가 아니거나, 또는 (ii) n이 1 또는 2일 때, Q는 5, 6, 또는 7-원 헤테로사이클로알킬이 아닌 화합물들을 포함한다.
일부 구현예에서, 화학식 (I)의 화합물의 또 다른 서브세트는 하기의 화합물, 또는 이의 염 또는 이성질체를 포함한다:
R1은 C5-30 알킬, C5-20 알케닐, -R*YR", -YR", 및 -R"M'R'로 이루어진 군으로부터 선택되고;
R2 및 R3은 H, C1-14 알킬, C2-14 알케닐, -R*YR", -YR", 및 -R*OR"로 이루어진 군으로부터 독립적으로 선택되거나, 또는 R2 및 R3은 이들이 부착되는 원자와 함께 헤테로사이클 또는 카르보사이클을 형성하며;
R4는 C3-6 카르보사이클, -(CH2)nQ, -(CH2)nCHQR, -CHQR, -CQ(R)2, 및 비치환된 C1-6 알킬로 이루어진 군으로부터 선택되고, 이때 Q는 C3-6 카르보사이클, N, O, 및 S로부터 선택되는 하나 이상의 헤테로원자를 갖는 5-원 내지 14-원 헤테로아릴, -OR, -O(CH2)nN(R)2, -C(O)OR, -OC(O)R, -CX3, -CX2H, -CXH2, -CN, -C(O)N(R)2, -N(R)C(O)R, -N(R)S(O)2R, -N(R)C(O)N(R)2, -N(R)C(S)N(R)2, -CRN(R)2C(O)OR, -N(R)R8, -O(CH2)nOR, -N(R)C(=NR9)N(R)2, -N(R)C(=CHR9)N(R)2, -OC(O)N(R)2, -N(R)C(O)OR, -N(OR)C(O)R, -N(OR)S(O)2R, -N(OR)C(O)OR, -N(OR)C(O)N(R)2, -N(OR)C(S)N(R)2, -N(OR)C(=NR9)N(R)2, -N(OR)C(=CHR9)N(R)2, -C(=NR9)N(R)2, -C(=NR9)R, -C(O)N(R)OR, 및 N, O 및 S로부터 선택되는 하나 이상의 헤테로원자를 가지며 옥소(=O), OH, 아미노, 모노- 또는 디-알킬아미노, 및 C1-3 알킬로부터 선택되는 하나 이상의 치환기로 치환된 5-원 내지 14-원 헤테로사이클로알킬로부터 선택되고, 각각의 n은 1, 2, 3, 4, 및 5로부터 독립적으로 선택되고;
각각의 R5는 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R6는 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
M 및 M'은 -C(O)O-, -OC(O)-, -C(O)N(R')-, -N(R')C(O)-, -C(O)-, -C(S)-, -C(S)S-, -SC(S)-, -CH(OH)-, -P(O)(OR')O-, -S(O)2-, -S-S-, 아릴기, 및 헤테로아릴기로부터 독립적으로 선택되고;
R7은 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 선택되고;
R8은 C3-6 카르보사이클 및 헤테로사이클로 이루어진 군으로부터 선택되고;
R9는 H, CN, NO2, C1-6 알킬, -OR, -S(O)2R, -S(O)2N(R)2, C2-6 알케닐, C3-6 카르보사이클 및 헤테로사이클로 이루어진 군으로부터 선택되고;
각각의 R은 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R'은 C1-18 알킬, C2-18 알케닐, -R*YR", -YR", 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R"은 C3-14 알킬 및 C3-14 알케닐로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R*은 C1-12 알킬 및 C2-12 알케닐로 이루어진 군으로부터 독립적으로 선택되고;
각각의 Y는 독립적으로 C3-6 카르보사이클이고;
각각의 X는 F, Cl, Br, 및 I로 이루어진 군으로부터 독립적으로 선택되고;
m은 5, 6, 7, 8, 9, 10, 11, 12 및 13으로부터 선택된다.
일부 구현예에서, 화학식 (I)의 화합물의 또 다른 서브세트는 하기의 화합물, 또는 이의 염 또는 이성질체를 포함한다:
R1은 C5-30 알킬, C5-20 알케닐, -R*YR", -YR", 및 -R"M'R'로 이루어진 군으로부터 선택되고;
R2 및 R3은 H, C1-14 알킬, C2-14 알케닐, -R*YR", -YR", 및 -R*OR"로 이루어진 군으로부터 독립적으로 선택되거나, 또는 R2 및 R3은 이들이 부착되는 원자와 함께 헤테로사이클 또는 카르보사이클을 형성하며;
R4는 C3-6 카르보사이클, -(CH2)nQ, -(CH2)nCHQR, -CHQR, -CQ(R)2, 및 비치환된 C1-6 알킬로 이루어진 군으로부터 선택되고, 이때 Q는 C3-6 카르보사이클, N, O, 및 S로부터 선택되는 하나 이상의 헤테로원자를 갖는 5-원 내지 14-원 헤테로사이클, -OR, -O(CH2)nN(R)2, -C(O)OR, -OC(O)R, -CX3, -CX2H, -CXH2, -CN, -C(O)N(R)2, -N(R)C(O)R, -N(R)S(O)2R, -N(R)C(O)N(R)2, -N(R)C(S)N(R)2, -CRN(R)2C(O)OR, -N(R)R8, -O(CH2)nOR, -N(R)C(=NR9)N(R)2, -N(R)C(=CHR9)N(R)2, -OC(O)N(R)2, -N(R)C(O)OR, -N(OR)C(O)R, -N(OR)S(O)2R, -N(OR)C(O)OR, -N(OR)C(O)N(R)2, -N(OR)C(S)N(R)2, -N(OR)C(=NR9)N(R)2, -N(OR)C(=CHR9)N(R)2, -C(=NR9)R, -C(O)N(R)OR, 및 -C(=NR9)N(R)2로부터 선택되고, 각각의 n은 1, 2, 3, 4, 및 5로부터 독립적으로 선택되고; Q가 5-원 내지 14-원 헤테로사이클일 때 (i) R4는 -(CH2)nQ이고 이때 n은 1 또는 2이거나, 또는 (ii) R4는 -(CH2)nCHQR이고 이때 n은 1이거나, 또는 (iii) R4는 -CHQR, 및 -CQ(R)2이고, 이때 Q는 5-원 내지 14-원 헤테로아릴 또는 8-원 내지 14-원 헤테로사이클로알킬이고;
각각의 R5는 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R6은 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
M 및 M'은 -C(O)O-, -OC(O)-, -C(O)N(R')-, -N(R')C(O)-, -C(O)-, -C(S)-, -C(S)S-, -SC(S)-, -CH(OH)-, -P(O)(OR')O-, -S(O)2-, -S-S-, 아릴기 및 헤테로아릴기로부터 독립적으로 선택되고;
R7은 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 선택되고;
R8은 C3-6 카르보사이클 및 헤테로사이클로 이루어진 군으로부터 선택되고;
R9는 H, CN, NO2, C1-6 알킬, -OR, -S(O)2R, -S(O)2N(R)2, C2-6 알케닐, C3-6 카르보사이클 및 헤테로사이클로 이루어진 군으로부터 선택되고;
각각의 R은 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R'은 C1-18 알킬, C2-18 알케닐, -R*YR", -YR", 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R"은 C3-14 알킬 및 C3-14 알케닐로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R*은 C1-12 알킬 및 C2-12 알케닐로 이루어진 군으로부터 독립적으로 선택되고;
각각의 Y는 독립적으로 C3-6 카르보사이클이고;
각각의 X는 F, Cl, Br 및 I로 이루어진 군으로부터 독립적으로 선택되고;
m은 5, 6, 7, 8, 9, 10, 11, 12 및 13으로부터 선택된다.
일부 구현예에서, 화학식 (I)의 화합물의 또 다른 서브세트는 하기 화합물 또는 이의 염 또는 이성질체를 포함한다:
R1은 C5-30 알킬, C5-20 알케닐, -R*YR", -YR", 및 -R"M'R'로 이루어진 군으로부터 선택되고;
R2 및 R3은 H, C1-14 알킬, C2-14 알케닐, -R*YR", -YR", 및 -R*OR"로 이루어진 군으로부터 독립적으로 선택되거나, 또는 R2 및 R3은 이들이 부착되는 원자와 함께 헤테로사이클 또는 카르보사이클을 형성하며;
R4는 C3-6 카르보사이클, -(CH2)nQ, -(CH2)nCHQR, -CHQR, -CQ(R)2, 및 비치환된 C1-6 알킬로 이루어진 군으로부터 선택되고, 이때 Q는 C3-6 카르보사이클, N, O, 및 S로부터 선택되는 하나 이상의 헤테로원자를 갖는 5-원 내지 14-원 헤테로아릴, -OR, -O(CH2)nN(R)2, -C(O)OR, -OC(O)R, -CX3, -CX2H, -CXH2, -CN, -C(O)N(R)2, -N(R)C(O)R, -N(R)S(O)2R, -N(R)C(O)N(R)2, -N(R)C(S)N(R)2, -CRN(R)2C(O)OR, -N(R)R8, -O(CH2)nOR, -N(R)C(=NR9)N(R)2, -N(R)C(=CHR9)N(R)2, -OC(O)N(R)2, -N(R)C(O)OR, -N(OR)C(O)R, -N(OR)S(O)2R, -N(OR)C(O)OR, -N(OR)C(O)N(R)2, -N(OR)C(S)N(R)2, -N(OR)C(=NR9)N(R)2, -N(OR)C(=CHR9)N(R)2, -C(=NR9)R, -C(O)N(R)OR, 및 -C(=NR9)N(R)2로부터 선택되고, 각각의 n은 1, 2, 3, 4, 및 5로부터 독립적으로 선택되고;
각각의 R5는 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R6은 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
M 및 M'은 -C(O)O-, -OC(O)-, -C(O)N(R')-, -N(R')C(O)-, -C(O)-, -C(S)-, -C(S)S-, -SC(S)-, -CH(OH)-, -P(O)(OR')O-, -S(O)2-, -S-S-, 아릴기 및 헤테로아릴기로부터 독립적으로 선택되고;
R7은 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 선택되고;
R8은 C3-6 카르보사이클 및 헤테로사이클로 이루어진 군으로부터 선택되고;
R9는 H, CN, NO2, C1-6 알킬, -OR, -S(O)2R, -S(O)2N(R)2, C2-6 알케닐, C3-6 카르보사이클 및 헤테로사이클로 이루어진 군으로부터 선택되고;
각각의 R은 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R'은 C1-18 알킬, C2-18 알케닐, -R*YR", -YR", 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R"은 C3-14 알킬 및 C3-14 알케닐로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R*은 C1-12 알킬 및 C2-12 알케닐로 이루어진 군으로부터 독립적으로 선택되고;
각각의 Y는 독립적으로 C3-6 카르보사이클이고;
각각의 X는 F, Cl, Br 및 I로 이루어진 군으로부터 독립적으로 선택되고;
m은 5, 6, 7, 8, 9, 10, 11, 12 및 13으로부터 선택된다.
일부 구현예에서, 화학식 (I)의 화합물의 또 다른 서브세트는 하기의 화합물, 또는 이의 염 또는 이성질체를 포함한다:
R1은 C5-30 알킬, C5-20 알케닐, -R*YR", -YR", 및 -R"M'R'로 이루어진 군으로부터 선택되고;
R2 및 R3은 H, C2-14 알킬, C2-14 알케닐, -R*YR", -YR", 및 -R*OR"로 이루어진 군으로부터 독립적으로 선택되거나, 또는 R2 및 R3은 이들이 부착되는 원자와 함께 헤테로사이클 또는 카르보사이클을 형성하며;
R4는 -(CH2)nQ 또는 -(CH2)nCHQR이고, 이때 Q는 -N(R)2이며, n은 3, 4 및 5로부터 선택되고;
각각의 R5는 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R6은 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
M 및 M'은 -C(O)O-, -OC(O)-, -C(O)N(R')-, -N(R')C(O)-, -C(O)-, -C(S)-, -C(S)S-, -SC(S)-, -CH(OH)-, -P(O)(OR')O-, -S(O)2-, -S-S-, 아릴기 및 헤테로아릴기로부터 독립적으로 선택되고;
R7은 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 선택되고;
각각의 R은 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R'은 C1-18 알킬, C2-18 알케닐, -R*YR", -YR", 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R"은 C3-14 알킬 및 C3-14 알케닐로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R*은 C1-12 알킬 및 C1-12 알케닐로 이루어진 군으로부터 독립적으로 선택되고;
각각의 Y는 독립적으로 C3-6 카르보사이클이고;
각각의 X는 F, Cl, Br 및 I로 이루어진 군으로부터 독립적으로 선택되고;
m은 5, 6, 7, 8, 9, 10, 11, 12 및 13으로부터 선택된다.
일부 구현예에서, 화학식 (I)의 화합물의 또 다른 서브세트는 하기 화합물 또는 이의 염 또는 이성질체를 포함한다:
R1은 C5-30 알킬, C5-20 알케닐, -R*YR", -YR", 및 -R"M'R'로 이루어진 군으로부터 선택되고;
R2 및 R3은 C1-14 알킬, C2-14 알케닐, -R*YR", -YR", 및 -R*OR"로 이루어진 군으로부터 독립적으로 선택되거나, 또는 R2 및 R3은 이들이 부착되는 원자와 함께 헤테로사이클 또는 카르보사이클을 형성하며;
R4는 -(CH2)nQ, -(CH2)nCHQR, -CHQR, 및 -CQ(R)2로 이루어진 군으로부터 선택되고, 이때 Q는 -N(R)2이며, n은 1, 2, 3, 4 및 5로부터 선택되고;
각각의 R5는 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R6은 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
M 및 M'은 -C(O)O-, -OC(O)-, -C(O)N(R')-, -N(R')C(O)-, -C(O)-, -C(S)-, -C(S)S-, -SC(S)-, -CH(OH)-, -P(O)(OR')O-, -S(O)2-, -S-S-, 아릴기 및 헤테로아릴기로부터 독립적으로 선택되고;
R7은 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 선택되고;
각각의 R은 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R'은 C1-18 알킬, C2-18 알케닐, -R*YR", -YR", 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R"은 C3-14 알킬 및 C3-14 알케닐로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R*은 C1-12 알킬 및 C1-12 알케닐로 이루어진 군으로부터 독립적으로 선택되고;
각각의 Y는 독립적으로 C3-6 카르보사이클이고;
각각의 X는 F, Cl, Br 및 I로 이루어진 군으로부터 독립적으로 선택되고;
m은 5, 6, 7, 8, 9, 10, 11, 12 및 13으로부터 선택된다.
일부 구현예에서, 화학식 (I)의 화합물의 서브세트는 하기 화학식 (IA)의 화합물, 또는 이의 염 또는 이성질체를 포함한다:
Figure pct00071
(IA),
식 중, l은 1, 2, 3, 4 및 5로부터 선택되고; m은 5, 6, 7, 8 및 9로부터 선택되고; M1은 결합 또는 M'이고; R4는 비치환된 C1-3 알킬, 또는 -(CH2)nQ이고, 이때 Q는 OH, -NHC(S)N(R)2, -NHC(O)N(R)2, -N(R)C(O)R, -N(R)S(O)2R, -N(R)R8, -NHC(=NR9)N(R)2, -NHC(=CHR9)N(R)2, -OC(O)N(R)2, -N(R)C(O)OR, 헤테로아릴 또는 헤테로사이클로알킬이며; M 및 M'은 -C(O)O-, -OC(O)-, -C(O)N(R')-, -P(O)(OR')O-, -S-S-, 아릴기 및 헤테로아릴기로부터 독립적으로 선택되고; R2 및 R3은 H, C1-14 알킬, 및 C2-14 알케닐로 이루어진 군으로부터 독립적으로 선택된다.
일부 구현예에서, 화학식 (I)의 화합물의 서브세트는 하기 화학식 (II)의 화합물 또는 이의 염 또는 이성질체를 포함한다:
Figure pct00072
(II),
식 중, l은 1, 2, 3, 4 및 5로부터 선택되며; M1은 결합 또는 M'이고; R4는 비치환된 C1-3 알킬, 또는 -(CH2)nQ이며, 이때 n은 2, 3 또는 4이고, Q는 OH, -NHC(S)N(R)2, -NHC(O)N(R)2, -N(R)C(O)R, -N(R)S(O)2R, -N(R)R8, -NHC(=NR9)N(R)2, -NHC(=CHR9)N(R)2, -OC(O)N(R)2, -N(R)C(O)OR, 헤테로아릴 또는 헤테로사이클로알킬이고; M 및 M'은 -C(O)O-, -OC(O)-, -C(O)N(R')-, -P(O)(OR')O-, -S-S-, 아릴기 및 헤테로아릴기로부터 독립적으로 선택되고; R2 및 R3은 H, C1-14 알킬 및 C2-14 알케닐로 이루어진 군으로부터 독립적으로 선택된다.
일부 구현예에서, 화학식 (I)의 화합물의 서브세트는 하기 화학식 (IIa), (IIb), (IIc), 또는 (IIe)의 화합물 또는 이의 염 또는 이성질체를 포함한다:
Figure pct00073
(IIa),
Figure pct00074
(IIb),
Figure pct00075
(IIc), 또는
Figure pct00076
(IIe),
식 중, R4는 본원에 기재된 바와 같다.
일부 구현예에서, 화학식 (I)의 화합물의 서브세트는 하기 화학식 (IId)의 화합물 또는 이의 염 또는 이성질체를 포함한다:
Figure pct00077
(IId),
식 중, n은 2, 3 또는 4이고; m, R', R" 및 R2 내지 R6은 본원에 기재된 바와 같다. 예를 들어, R2 및 R3의 각각은 C5-14 알킬 및 C5-14 알케닐로 이루어진 군으로부터 독립적으로 선택될 수 있다.
일부 구현예에서, 본 개시의 이온화 가능한 양이온성 지질은 하기 구조를 갖는 화합물을 포함한다:
Figure pct00078
(화합물 I).
일부 구현예에서, 본 개시의 이온화 가능한 양이온성 지질은 하기 구조를 갖는 화합물을 포함한다:
Figure pct00079
(화합물 II).
일부 구현예에서, 본 개시의 비-양이온성 지질은 1,2-디스테아로일-sn-글리세로-3-포스포콜린(DSPC), 1,2-디올레오일-sn-글리세로-3-포스포에탄올아민(DOPE), 1,2-디리놀레오일-sn-글리세로-3-포스포콜린(DLPC), 1,2-디미리스토일-sn-글리세로-포스포콜린(DMPC), 1,2-디올레오일-sn-글리세로-3-포스포콜린(DOPC), 1,2-디팔미토일-sn-글리세로-3-포스포콜린(DPPC), 1,2-디운데카노일-sn-글리세로-포스포콜린(DUPC), 1-팔미토일-2-올레오일-sn-글리세로-3-포스포콜린(POPC), 1,2-디-O-옥타데세닐-sn-글리세로-3-포스포콜린(18:0 디에테르 PC), 1-올레오일-2 콜레스테릴헤미숙시노일-sn-글리세로-3-포스포콜린(OChemsPC), 1-헥사데실-sn-글리세로-3-포스포콜린(C16 Lyso PC), 1,2-디리놀레노일-sn-글리세로-3-포스포콜린, 1,2-디아라키도노일-sn-글리세로-3-포스포콜린, 1,2-디도코사헥사에노일-sn-글리세로-3-포스포콜린, 1,2-디피타노일-sn-글리세로-3-포스포에탄올아민(ME 16.0 PE), 1,2-디스테아로일-sn-글리세로-3-포스포에탄올아민, 1,2-디리놀레오일-sn-글리세로-3-포스포에탄올아민, 1,2-디리놀레노일-sn-글리세로-3-포스포에탄올아민, 1,2-디아라키도노일-sn-글리세로-3-포스포에탄올아민, 1,2-디도코사헥사에노일-sn-글리세로-3-포스포에탄올아민, 1,2-디올레오일-sn-글리세로-3-포스포-rac-(1-글리세롤) 나트륨 염(DOPG), 스핑고미엘린, 및 이들의 혼합물을 포함한다.
일부 구현예에서, 본 개시의 PEG 변형된 지질은 PEG-변형된 포스파티딜에탄올아민, PEG-변형된 포스파티드산, PEG-변형된 세라마이드, PEG-변형된 디알킬아민, PEG-변형된 디아실글리세롤, PEG-변형된 디알킬글리세롤, 및 이들의 혼합물을 포함한다. 일부 구현예에서, PEG-변형된 지질은 DMG-PEG, PEG-c-DOMG(PEG-DOMG로도 지칭됨), PEG-DSG 및/또는 PEG-DPG이다.
일부 구현예에서, 본 개시의 스테롤은 콜레스테롤, 페코스테롤, 시토스테롤, 에르고스테롤, 캄페스테롤, 스티그마스테롤, 브라시카스테롤, 토마티딘, 우르솔산, 알파-토코페롤, 및 이의 혼합물을 포함한다.
일부 구현예에서, 본 개시의 LNP는 화합물 1의 이온화 가능한 양이온성 지질을 포함하며, 상기 비-양이온성 지질은 DSPC이고, 구조적 지질은 콜레스테롤이고, PEG 지질은 DMG-PEG이다.
일부 구현예에서, 지질 나노입자는 45 - 55 몰%(mol%) 이온화 가능한 양이온성 지질을 포함한다. 예를 들어, 지질 나노입자는 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 또는 55 mol%의 이온화 가능한 양이온성 지질을 포함할 수 있다.
일부 구현예에서, 지질 나노입자는 5 - 15 mol%, 5 - 10 mol%, 또는 10 - 15 mol%의 DSPC를 포함한다. 예를 들어, 지질 나노입자는 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 또는 15 mol%의 DSPC를 포함할 수 있다.
일부 구현예에서, 지질 나노입자는 35 - 40 mol%의 콜레스테롤을 포함한다. 예를 들어, 지질 나노입자는 35, 35.5, 36, 36.5, 37, 37.5, 38, 38.5, 39, 39.5, 또는 40 mol%의 콜레스테롤을 포함할 수 있다.
일부 구현예에서, 지질 나노입자는 1 - 2 mol%, 1 - 3 mol%, 1 - 4 mol%, 또는 1 - 5 mol%의 DMG-PEG를 포함한다. 예를 들어, 지질 나노입자는 1, 1.5, 2, 2.5, 3, 또는 3.5 mol%의 DMG-PEG를 포함할 수 있다.
일부 구현예에서, 지질 나노입자는 50 mol%의 이온화 가능한 양이온성 지질, 10 mol%의 DSPC, 38.5 mol%의 콜레스테롤, 및 1.5 mol%의 DMG-PEG를 포함한다.
일부 구현예에서, 지질 나노입자는 49 mol%의 이온화 가능한 양이온성 지질, 10 mol%의 DSPC, 38.5 mol%의 콜레스테롤, 및 2.5 mol%의 DMG-PEG를 포함한다.
일부 구현예에서, 지질 나노입자는 49 mol%의 이온화 가능한 양이온성 지질, 11 mol%의 DSPC, 38.5 mol%의 콜레스테롤, 및 1.5 mol%의 DMG-PEG를 포함한다.
일부 구현예에서, 지질 나노입자는 48 mol%의 이온화 가능한 양이온성 지질, 11 mol%의 DSPC, 38.5 mol%의 콜레스테롤, 및 2.5 mol%의 DMG-PEG를 포함한다.
일부 구현예에서, 본 개시의 LNP는 약 2:1 내지 약 30:1의 N:P 비율을 포함한다.
일부 구현예에서, 본 개시의 LNP는 약 6:1의 N:P 비율을 포함한다.
일부 구현예에서, 본 개시의 LNP는 약 3:1의 N:P 비율을 포함한다.
일부 구현예에서, 본 개시의 LNP는 약 10:1 내지 약 100:1의 이온화 가능한 양이온성 지질 성분 대 RNA의 중량/중량(wt/wt) 비율을 포함한다.
일부 구현예에서, 본 개시의 LNP는 약 20:1의 이온화 가능한 양이온성 지질 성분 대 RNA의 중량/중량(wt/wt) 비율을 포함한다.
일부 구현예에서, 본 개시의 LNP는 약 10:1의 이온화 가능한 양이온성 지질 성분 대 RNA의 중량/중량(wt/wt) 비율을 포함한다.
일부 구현예에서, 본 개시의 LNP는 약 50 nm 내지 약 150 nm의 평균 직경을 갖는다.
일부 구현예에서, 본 개시의 LNP는 약 70 nm 내지 약 120 nm의 평균 직경을 갖는다.
다가 백신
본원에 제공된 바와 같은, 조성물은 동일하거나 상이한 종의 2개 이상의 항원을 암호화하는 RNA 또는 다중 RNA를 포함할 수 있다. 일부 구현예에서, 조성물은 2개 이상의 코로나바이러스 항원을 암호화하는 mRNA 또는 다중 mRNA를 포함한다. 일부 구현예에서, RNA는 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개 또는 그 이상의 코로나바이러스 항원을 암호화할 수 있다.
일부 구현예에서, 항원을 암호화하는 2개 이상의 상이한 mRNA가 동일한 지질 나노입자 내 제형화될 수 있다. 다른 구현예에서, 항원을 암호화하는 2개 이상의 상이한 RNA는 별개의 지질 나노입자 내 제형화될 수 있다(각각의 RNA는 단일 지질 나노입자 내 제형화됨). 지질 나노입자는 이후 (예를 들어, 다중 항원을 암호화하는 다중 RNA 포함하는) 단일 백신 조성물로서 조합되어 투여될 수 있거나, 개별적으로 투여될 수 있다.
조합 백신
본원에 제공된 바와 같은, 조성물은 동일하거나 상이한 바이러스 균주의 2개 이상의 항원을 암호화하는 mRNA 또는 다중 RNA를 포함할 수 있다. 하나 이상의 코로나바이러스 및 상이한 유기체의 하나 이상의 항원(들)을 암호화하는 RNA를 포함하는 조합 백신이 또한 본원에서 제공된다. 따라서, 본 개시의 백신은 동일한 균주/종의 하나 이상의 항원, 또는 상이한 균주/종의 하나 이상의 항원, 예를 들어, 코로나바이러스 감염의 위험이 높은 동일한 지리적 영역에서 발견되는 유기체 또는 코로나바이러스에 노출될 때 개체가 이에 노출될 가능성이 있는 유기체에 대한 면역을 유도하는 항원을 표적으로 하는 조합 백신일 수 있다.
약학적 제제
예를 들어, 인간 및 다른 포유동물에서 코로나바이러스의 예방 또는 치료용 조성물(예를 들어, 약학적 조성물), 방법, 키트 및 시약이 본원에 제공된다. 본원에 제공된 조성물은 치료제 또는 예방제로서 사용될 수 있다. 이들은 코로나바이러스 감염을 예방 및/또는 치료하기 위한 의약에서 사용될 수 있다.
일부 구현예에서, 본원에 기재된 바와 같은 RNA를 함유하는 코로나바이러스 백신은 대상체(예를 들어, 포유류 대상체, 예컨대 인간 대상체)에게 투여될 수 있고, mRNA는 항원성 폴리펩타이드(항원)를 생산하기 위해 생체내에서 번역된다.
조성물(예를 들어, RNA를 포함)의 "유효량"은, 적어도 부분적으로, 상기 표적 조직, 표적 세포 유형, 투여 수단, RNA의 물리적 특징(예를 들어, 길이, 뉴클레오티드 조성물, 및/또는 변형된 뉴클레오시드의 정도) 및 백신의 다른 성분, 및 다른 결정인자, 예컨대, 대상체의 연령, 체중, 키, 성별 및 일반적인 건강을 기반으로 한다. 전형적으로, 유효량의 조성물은 대상체의 세포에서 항원 생산의 기능으로서 유도된 또는 부스팅된 면역 반응을 제공한다. 일부 구현예에서, 적어도 하나의 화학적 변형을 갖는 mRNA를 함유하는 유효량의 조성물은 동일한 항원 또는 펩티드 항원을 암호화하는 상응하는 비변형된 폴리뉴클레오티드를 함유하는 조성물보다 더 효율적이다. 증가된 항원 생산은 증가된 세포 형질감염(RNA 백신으로 형질감염된 세포의 백분율), 폴리뉴클레오티드로부터의 증가된 단백질 번역 및/또는 발현, (예를 들어, 변형된 폴리뉴클레오티드로부터의 단백질 번역 기간 증가에 의해 입증된 바와 같이) 감소된 핵산 분해, 또는 숙주 세포의 변경된 항원 특이적 면역 반응에 의해 입증될 수 있다.
용어 "약학적 조성물"은, 생체내 또는 생체외 진단 또는 치료 용도에 특히 적합하게 조성물을 만드는, 불활성 또는 활성인, 담체와 활성제의 조합을 지칭한다. "약학적으로 허용가능한 담체"는 대상체에게 또는 대상체 상에 투여된 후, 바람직하지 않은 생리학적 효과를 야기시키지 않는다. 약학적 조성물 내 담체는 활성 성분과 양립가능하고, 이를 안정화시킬 수 있다는 의미에서 또한 "허용가능"해야 한다. 하나 이상의 가용화제는 활성제의 전달을 위한 약학적 담체로서 이용될 수 있다. 약학적으로 허용가능한 담체의 예는, 투약 형태로서 사용가능한 조성물을 달성하기 위한, 생체적합성 비히클, 보조제, 첨가제, 및 희석제를 포함하나, 이에 제한되지는 않는다. 다른 담체의 예는 콜로이드성 산화규소, 마그네슘 스테아르산, 셀룰로오스, 및 나트륨 라우릴 설페이트를 포함한다. 추가의 적합한 약학적 담체 및 희석제, 뿐만 아니라 이들의 용도를 위한 약학적 필수품은 Remington's Pharmaceutical Sciences에 기재되어 있다.
일부 구현예에서, 본 개시에 따른 조성물(폴리뉴클레오티드 및 이들의 암호화된 폴리펩티드를 포함)은 코로나바이러스 감염의 치료 또는 예방에 사용될 수 있다. 조성물은 건강한 개체에 대한 능동 면역화 계획의 일부로서 예방적으로 또는 치료적으로, 또는 잠복기 동안 또는 증상의 발병 후 활성 감염 동안 감염 초기에 투여될 수 있다. 일부 구현예에서, 세포, 조직 또는 대상체에 제공되는 RNA의 양은 면역 예방에 효과적인 양일 수 있다.
조성물은 다른 예방적 또는 치료적 화합물과 함께 투여될 수 있다. 비-제한적인 예로서, 예방적 또는 치료적 화합물은 보조제 또는 부스터일 수 있다. 본원에 사용된 바와 같이, 예방적 조성물, 예컨대 백신을 언급할 때, 용어 "부스터"는 예방적 (백신) 조성물의 추가 투여를 지칭한다. 부스터 (또는 부스터 백신)는 예방적 조성물의 초기 투여 후에 주어질 수 있다. 예방적 조성물의 초기 투여와 부스터 사이의 투여 시간은, 이에 제한되지는 않으나, 1분, 2분, 3분, 4분, 5분, 6분, 7분, 8분, 9분, 10분, 15분, 20분, 35분, 40분, 45분, 50분, 55분, 1시간, 2시간, 3시간, 4시간, 5시간, 6시간, 7시간, 8시간, 9시간, 10시간, 11시간, 12시간, 13시간, 14시간, 15시간, 16시간, 17시간, 18시간, 19시간, 20시간, 21시간, 22시간, 23시간, 1일, 36시간, 2일, 3일, 4일, 5일, 6일, 1주, 10일, 2주, 3주, 1개월, 2개월, 3개월, 4개월, 5개월, 6개월, 7개월, 8개월, 9개월, 10개월, 11개월, 1년, 18개월, 2년, 3년, 4년, 5년, 6년, 7년, 8년, 9년, 10년, 11년, 12년, 13년, 14년, 15년, 16년, 17년, 18년, 19년, 20년, 25년, 30년, 35년, 40년, 45년, 50년, 55년, 60년, 65년, 70년, 75년, 80년, 85년, 90년, 95년 또는 99년 이상일 수 있다. 예시적인 구현예에서, 예방적 조성물의 초기 투여와 부스터 사이의 투여 시간은, 이에 제한되지 않으나, 1주, 2주, 3주, 1개월, 2개월, 3개월, 6개월 또는 1년일 수 있다.
일부 구현예에서, 조성물은 당업계에 공지된 불활성화된 백신의 투여와 유사하게 근육내로, 비강내로 또는 진피내로 투여될 수 있다.
조성물은 감염의 유병률 또는 충족되지 않은 의학적 요구의 정도 또는 수준에 따라 다양한 환경에서 활용될 수 있다. 비제한적인 예로서, RNA 백신은 다양한 감염성 질환을 치료 및/또는 예방하는데 활용될 수 있다. RNA 백신은 상업적으로 이용가능한 백신보다 훨씬 더 큰 항체 역가를 생성하고, 면역을 더 잘 중화시키며, 더 오래 지속되는 면역 반응을 생성하고/하거나, 더 빨리 반응을 생성한다는 점에서 우수한 특성을 갖는다.
선택적으로 하나 이상의 약학적으로 허용가능한 부형제와 조합하여 RNA 및/또는 복합체를 포함하는 약학적 조성물이 본원에 제공된다.
RNA는 단독으로 또는 하나 이상의 다른 성분과 함께 제형화거나 투여될 수 있다. 예를 들어, 조성물은 이에 제한되지는 않으나, 보조제(adjuvant)를 포함하는 다른 성분을 포함할 수 있다.
일부 구현예에서, 조성물은 보조제를 포함하지 않는다(이들은 보조제가 없음).
RNA는 하나 이상의 약학적으로-허용가능한 부형제와 조합하여 제형화되거나 투여될 수 있다. 일부 구현예에서, 백신 조성물은 예를 들어, 치료적-활성 물질, 예방적-활성 물질, 또는 둘 다의 조합과 같은 적어도 하나의 추가 활성 물질을 포함한다. 백신 조성물은 무균, 발열원-무함유 또는 무균 및 발열원-무함유 둘 다일 수 있다. 약제, 예컨대 백신 조성물의 제형 및/또는 제조의 일반적인 고려사항은, 예를 들어 Remington: The Science and Practice of Pharmacy 21st ed., Lippincott Williams & Wilkins, 2005(이는 그 전체가 본원에 참조로 포함됨)에서 확인할 수 있다.
일부 구현예에서, 조성물은 인간, 인간 환자 또는 대상체에게 투여된다. 본 개시의 목적을 위해, 어구 "활성 성분"은 일반적으로, 상기 성분 내에 함유된 RNA 백신 또는 폴리뉴클레오티드, 예를 들어, 항원을 암호화하는 mRNA를 지칭한다.
본원에 기재된 백신 조성물의 제형은 약리학 분야에서 공지되거나 이후 개발되는 임의의 방법에 의해 제조될 수 있다. 일반적으로, 이러한 준비 방법은 활성 성분(예를 들어, mRNA)을 부형제 및/또는 하나 이상의 다른 보조 성분과 결합시키고, 그 다음, 필요하고/하거나 바람직한 경우, 생성물을 원하는 단일- 또는 다중-용량 단위로 분할, 성형 및/또는 포장하는 단계를 포함한다.
본 개시에 따른 약학적 조성물 내의 활성 성분, 약학적으로 허용가능한 부형제, 및/또는 임의의 추가 성분의 상대적인 양은 치료된 대상체의 동일성, 크기, 및/또는 상태 및 추가로 조성물이 투여될 경로에 따라 달라질 것이다. 예로서, 본 조성물은 0.1% 내지 100%, 예를 들어, 0.5 내지 50%, 1 내지 30%, 5 내지 80%, 적어도 80%(w/w)의 활성 성분을 포함할 수 있다.
일부 구현예에서, mRNA는 (1) 안정성 증가; (2) 세포 형질감염의 증가; (3) (예를 들어, 데포 제형으로부터) 지속 또는 지연 방출의 허용; (4) 생체 분포의 변경(예를 들어, 특정 조직 또는 세포 유형에 대한 표적); (5) 생체내 암호화된 단백질 번역의 증가; 및/또는 (6) 생체내 암호화된 단백질(항원)의 방출 프로파일 변경을 위해 하나 이상의 부형제를 사용하여 제형화된다. 임의의 그리고 모든 용매, 분산 매질, 희석제 또는 다른 액체 비히클, 분산물 또는 현탁 보조제, 표면 활성제, 등장제, 증점제 또는 유화제, 보존제와 같은 전통적인 부형제 이외에, 부형제는 제한 없이, 리피도이드, 리포좀, 지질 나노입자, 중합체, 리포플렉스, 코어-쉘 나노입자, 펩티드, 단백질, (예를 들어, 대상체 내로 이식을 위해) RNA로 형질감염된 세포, 하이알루로니다제, 나노입자 모방체 및 이들의 조합을 포함할 수 있다.
투약/투여
인간 및 다른 포유동물에서 코로나바이러스 감염의 예방 및/또는 치료를 위한 조성물(예를 들어, RNA 백신), 방법, 키트 및 시약이 본원에 제공된다. 면역화 조성물은 치료제 또는 예방제로서 사용될 수 있다. 일부 구현예에서, 조성물은 코로나바이러스 감염으로부터 예방적 보호를 제공하기 위해 사용된다. 일부 구현예에서, 조성물은 코로나바이러스 감염을 치료하기 위해 사용된다. 일부 구현예, 구현예에서, 조성물은 예를 들어, 생체외에서 말초혈액 단핵세포(PBMC)를 활성화하기 위해 면역 이펙터 세포의 프라이밍에 사용되며, 이는 이후 대상체 내로 주입(재주입)된다.
대상체는 비인간 영장류 및 인간 대상체를 포함하는, 임의의 포유동물일 수 있다. 전형적으로, 대상체는 인간 대상체이다.
일부 구현예에서, 조성물(예를 들어, RNA 백신)은 항원-특이적 면역 반응을 유도하기 위한 유효량으로 대상체(예를 들어, 포유류 대상체, 예컨대 인간 대상체)에게 투여된다. 코로나바이러스 항원을 암호화하는 RNA는 생체내에서 발현되고 번역되어 항원을 생성하고, 이는 이후 대상체에서 면역 반응을 자극한다.
코로나바이러스로부터의 예방적 보호는 본 개시의 조성물의 투여 후에 달성될 수 있다. 면역화 조성물은 1회, 2회, 3회, 4회 또는 그 이상 투여될 수 있으나, 백신을 1회 투여하는 것으로 충분할 가능성이 있다(선택적으로 단일 부스터가 뒤따름). 덜 바람직하지만, 치료 반응을 달성하기 위해 감염된 개체에게 조성물을 투여하는 것이 가능하다. 투약은 이에 따라 조정될 필요가 있을 수 있다.
코로나바이러스 항원(또는 다중 항원)에 대한 대상체에서 면역 반응을 유도하는 방법이 본 개시의 측면에서 제공된다. 일부 구현예에서, 상기 방법은 코로나바이러스 항원을 암호화하는 오픈 리딩 프레임을 갖는 mRNA를 포함하는 조성물을 대상체에게 투여하는 단계를 포함하며, 이에 따라 대상체에서 코로나바이러스 항원에 특이적인 면역 반응을 유도하고, 여기서 상기 대상체에서 항-항원 항체 역가는 항원에 대한 전통적 백신의 예방적 유효량으로 백신 접종된 대상체에서 항-항원 항체 역가에 비해 백신 접종 후 증가된다. "항-항원 항체"는 항원에 특이적으로 결합하는 혈청 항체이다.
예방적 유효량은 임상적으로 허용가능한 수준에서 바이러스에 의한 감염을 예방하는 유효량이다. 일부 구현예에서, 치료적으로 유효량은 백신용 포장 삽입물에서 나열된 용량이다. 본원에 사용된 바와 같이, 전통적 백신은 본 개시의 mRNA 백신 이외의 백신을 지칭한다. 예를 들어, 전통적 백신은 이에 제한되지는 않으나, 살아있는 미생물 백신, 사멸된 미생물 백신, 서브유닛 백신, 단백질 항원 백신, DNA 백신, 바이러스 유사 입자(VLP) 백신 등을 포함한다. 예시적인 구현예에서, 전통적 백신은 규제 승인을 획득하고/하거나 국가 약물 규제 기관, 예를 들어 미국 식품의약국(FDA) 또는 유럽 의약품청(EMA)에 의해 등록된 백신이다.
일부 구현예에서, 대상체에서의 항-항원 항체 역가는 코로나바이러스 또는 백신 미접종된 대상체에 대한 예방적 유효량의 전통적 백신으로 백신 접종된 대상체에서의 항-항원 항체 역가에 비해 백신 접종 후 1 log 내지 10 log 증가된다. 일부 구현예에서, 대상체에서의 항-항원 항체 역가는 코로나바이러스 또는 백신 미접종된 대상체에 대한 예방적 유효량의 전통적 백신이 백신 접종된 대상체에서의 항-항원 항체 역가에 비해 백신 접종 후 1 log, 2 log, 3 log, 4 log, 5 log 또는 10 log 증가된다.
코로나바이러스에 대한 대상체에서 면역 반응을 유도하는 방법이 본 개시의 다른 측면에서 제공된다. 상기 방법은 코로나바이러스 항원을 암호화하는 오픈 리딩 프레임을 포함하는 mRNA를 포함하는 조성물을 대상체에게 투여하는 단계를 포함하며, 이에 따라 대상체에서 코로나바이러스에 특이적인 면역 반응을 유도하고, 여기서 상기 대상체에서의 면역 반응은 조성물에 비해 투여량 수준의 2배 내지 100배에서 코로나바이러스에 대한 전통적 백신으로 백신 접종된 대상체에서의 면역 반응과 동등하다.
일부 구현예에서, 대상체에서의 면역 반응은 본 개시의 조성물에 비해 2배의 투여량 수준에서 전통적 백신으로 백신 접종된 대상체에서의 면역 반응과 동등하다. 일부 구현예에서, 대상체에서의 면역 반응은 본 개시의 조성물에 비해 3배의 투여량 수준에서 전통적 백신으로 백신 접종된 대상체에서의 면역 반응과 동등하다. 일부 구현예에서, 대상체에서의 면역 반응은 본 개시의 조성물에 비해 4배, 5배, 10배, 50배, 또는 100배의 투여량 수준에서 전통적 백신으로 백신 접종된 대상체에서의 면역 반응과 동등하다. 일부 구현예에서, 대상체에서의 면역 반응은 본 개시의 조성물에 비해 10배 내지 1000배의 투여량 수준에서 전통적 백신으로 백신 접종된 대상체에서의 면역 반응과 동등하다. 일부 구현예에서, 대상체에서의 면역 반응은 본 개시의 조성물에 비해 100배 내지 1000배의 투여량 수준에서 전통적 백신으로 백신 접종된 대상체에서의 면역 반응과 동등하다.
다른 구현예에서, 면역 반응은 대상체에서의 [단백질] 항체 역가를 결정함으로써 평가된다. 다른 구현예에서, 면역화된 대상체로부터의 혈청 또는 항체의 능력은 바이러스 흡수를 중화하거나 인간 B 림프구의 코로나바이러스 형질전환을 감소시키는 이의 능력에 대해 시험된다. 다른 구현예에서, 강력한 T 세포 반응(들)을 촉진하는 능력은 당업계에 인정된 기법을 사용하여 측정된다.
다른 측면에서, 본 개시는 코로나바이러스 항원을 암호화하는 오픈 리딩 프레임을 갖는 mRNA를 포함하는 조성물을 대상체에게 투여함으로써 코로나바이러스에 대한 대상체에서의 면역 반응을 유도하는 방법을 제공하며, 이에 따라 대상체에서 코로나바이러스 항원에 특이적인 면역 반응을 유도하고, 여기서 상기 대상체에서의 면역 반응은 코로나바이러스에 대한 전통적 백신의 예방적 유효량으로 백신 접종된 대상체에서 유도된 면역 반응에 비해 2일 내지 10주 더 일찍 유도된다. 일부 구현예에서, 대상체에서의 면역 반응은 본 개시의 조성물에 비해 2배 내지 100배의 투여량 수준에서 전통적 백신의 예방적 유효량으로 백신 접종된 대상체에서 유도된다.
일부 구현예에서, 대상체에서의 면역 반응은 예방적 유효량의 전통적 백신으로 백신 접종을 받은 대상체에서 유도된 면역 반응에 비해 2일, 3일, 1주, 2주, 3주, 5주 또는 10주 더 일찍 유도된다.
또한 제1 항원을 암호화하는 오픈 리딩 프레임을 갖는 mRNA를 대상체에게 투여함으로써 코로나바이러스에 대한 대상체에서의 면역 반응을 유도하는 방법이 본원에 제공되며, 여기서 상기 RNA는 안정화 요소를 포함하지 않고, 여기서 보조제는 백신과 공동-제형화되거나 공동-투여되지 않는다.
조성물은 치료적으로 효과적인 결과를 초래하는 임의의 경로에 의해 투여될 수 있다. 이들은, 이에 제한되지는 않으나, 진피내, 근육내, 비강내 및/또는 피하 투여를 포함한다. 본 개시는 RNA 백신을 이를 필요로 하는 대상체에게 투여하는 단계를 포함하는 방법을 제공한다. 요구된 정확한 양은, 대상체의 종, 연령, 및 일반적인 병태, 질환의 중증도, 특정 조성물, 이의 투여 방식, 이의 활성 방식 등에 따라 대상체마다 다를 수 있다. RNA는 전형적으로 투여의 용이성 및 투여량의 균일성을 위해 투여량 단위 형태로 제형화된다. 그러나, RNA의 총 1일 사용량은 건전한 의학적 판단의 범위 내에서 주치의에 의해 결정될 수 있음이 이해될 것이다. 임의의 특정 환자에 대하여 특정 치료적으로 효과적인, 예방적으로 효과적인, 또는 적절한 이미징 용량 수준은 하기를 포함하는 다양한 인자에 따라 달라질 것이다: 치료받는 장애 및 장애의 중증도; 이용된 특정 화합물의 활성; 이용된 특정 조성물; 환자의 연령, 체중, 일반적인 건강, 성별 및 식이; 이용된 특정 화합물의 투여 시간, 투여 경로, 및 배출 속도; 치료 기간; 이용된 특정 화합물과 조합으로 또는 동시에 사용된 약물; 및 의학 분야에서 잘 알려진 유사 인자.
본원에 제공된 바와 같은, RNA의 유효량은 예를 들어 단일 용량으로 또는 2회의 10 μg 용량으로 투여되는 20 μg 만큼 낮을 수 있다. 일부 구현예에서, 유효량은 20 μg-300 μg 또는 25 μg-300 μg의 총 용량이다. 예를 들어, 유효량은 20 μg, 25 μg, 30 μg, 35 μg, 40 μg, 45 μg, 50 μg, 55 μg, 60 μg, 65 μg, 70 μg, 75 μg, 80 μg, 85 μg, 90 μg, 95 μg, 100 μg, 110 μg, 120 μg, 130 μg, 140 μg, 150 μg, 160 μg, 170 μg, 180 μg, 190 μg, 200 μg, 250 μg, 또는 300 μg의 총 용량일 수 있다. 일부 구현예에서, 유효량은 20 μg의 총 용량이다. 일부 구현예에서, 유효량은 25 μg의 총 용량이다. 일부 구현예에서, 유효량은 50 μg의 총 용량이다. 일부 구현예에서, 유효량은 75 μg의 총 용량이다. 일부 구현예에서, 유효량은 100 μg의 총 용량이다. 일부 구현예에서, 유효량은 150 μg의 총 용량이다. 일부 구현예에서, 유효량은 200 μg의 총 용량이다. 일부 구현예에서, 유효량은 250 μg의 총 용량이다. 일부 구현예에서, 유효량은 300 μg의 총 용량이다.
본원에 기술된 RNA는 비강내, 기관내 또는 (예를 들어, 정맥내로, 안내로, 유리체내로, 근육내로, 피내로, 심장내로, 복강내로 및 피하로) 주사가능한 것과 같은 본원에 기술된 제형으로 제제화될 수 있다.
백신 효능
본 개시의 일부 측면은 조성물(예를 들어, RNA 백신)의 제제를 제공하고, 상기 RNA는 대상체에서 항원 특이적 면역 반응(예를 들어, 코로나바이러스 항원에 특이적인 항체의 생산)을 생성하기 위한 유효량으로 제제화된다. "유효량"은 항원-특이적 면역 반응을 생성하는데 효과적인 RNA의 용량이다. 또한 대상체에서 항원-특이적 면역 반응을 유도하는 방법이 본원에 제공된다.
본원에 사용된 바와 같이, 본 개시의 백신 또는 LNP에 대한 면역 반응은 백신에 존재하는 (하나 이상의) 코로나바이러스 단백질(들)에 대한 체액성 및/또는 세포성 면역 반응의 대상체에서의 발달이다. 본 개시의 목적을 위해, "체액성" 면역 반응은 예를 들어, 분비(IgA) 또는 IgG 분자를 포함하는, 항체 분자에 의해 매개되는 면역 반응을 지칭하는 반면, "세포성" 면역 반응은 T-림프구(예를 들어, CD4+ 헬퍼 및/또는 CD8+ T 세포(예를 들어, CTL) 및/또는 기타 백혈구에 의해 매개되는 면역 반응이다. 세포성 면역의 하나의 중요한 측면은 세포용해성 T-세포(CTL)에 의한 항원-특이적 반응을 수반한다. CTL은 주요 조직적합성 복합체(MHC)에 의해 암호화되고 세포의 표면 상에서 발현되는 단백질과 관련하여 제시되는 펩티드 항원에 대한 특이성을 갖는다. CTL은 세포내 미생물의 파괴 또는 이러한 미생물에 감염된 세포의 용해를 유도하고 촉진하는 데 도움이 된다. 세포성 면역의 또 다른 측면은 헬퍼 T-세포에 의한 항원-특이적 반응을 수반한다. 헬퍼 T-세포는 기능을 자극하는 데 도움이 되도록 작용하고, 이들의 표면 상에 MHC 분자와 관련하여 펩티드 항원을 나타내는 세포에 대해 비특이적 이펙터 세포의 활성을 집중시킨다. 세포성 면역 반응은 또한 CD4+ 및 CD8+ T-세포로부터 유래된 것들을 포함하는 활성화된 T-세포 및/또는 기타 백혈구에 의해 생성되는 사이토카인, 케모카인, 및 기타 해당 분자의 생산을 유도한다.
일부 구현예에서, 항원-특이적 면역 반응은 본원에 제공된 바와 같은 조성물이 투여된 대상체에서 생산된 항-코로나바이러스 항원 항체 역가를 측정하는 것을 특징으로 한다. 항체 역가는 대상체 내에서 항체, 예를 들어, 특정 항원 또는 항원의 에피토프에 특이적인 항체의 양의 측정이다. 항체 역가는 긍정적인 결과를 제공하는 가장 큰 희석의 역수로서 전형적으로 표현된다. 효소-결합 면역흡착 분석법(ELISA)은 예를 들어 항체 역가를 결정하기 위한 일반적인 분석법이다.
다양한 혈청학적 시험을 사용하여 암호화된 관심 항원, 예를 들어, SAR-CoV-2 바이러스 또는 SAR-CoV-2 바이러스 항원, 예를 들어, SAR-CoV-2 스파이크 또는 이의 도메인의 S 단백질에 대한 항체를 측정할 수 있다. 이러한 검사에는 혈구응집-억제 시험, 보체 고정 시험, 형광 항체 시험, 효소-결합 면역흡착 분석법(ELISA) 및 플라크 감소 중화 시험(PRNT)이 포함된다. 이러한 각 시험은 상이한 항체 활성을 측정한다. 예시적인 구현예에서, 플라크 감소 중화 시험, 또는 PRNT(예를 들어, PRNT50 또는 PRNT90)는 보호의 혈청학적 상관관계로서 사용된다. PRNT는 시험관 내 바이러스 중화의 생물학적 매개변수를 측정하고 특정 부류의 바이러스 중에서 가장 혈청학적으로 바이러스-특이적인 시험이며, 이는 바이러스 감염으로부터 혈청 보호 수준과 밀접한 연관성이 있다.
PRNT의 기본 디자인은 시험관 또는 미세역가 플레이트에서 바이러스-항체 상호작용이 일어나도록 한 다음, 혼합물을 바이러스-민감성 세포, 바람직하게는 포유류 기원의 세포에 플레이팅하여 바이러스 감염성에 대한 항체 효과를 측정할 수 있다. 세포는 자손 바이러스의 확산을 제한하는 반-고체 배지로 오버레이된다. 생산적인 감염을 개시하는 각 바이러스는 다양한 방법으로 검출될 수 있는 국소화된 감염 영역(플라크)을 생성한다. 플라크를 계수하고 바이러스의 시작 농도와 다시 비교하여 총 바이러스 감염성의 감소 백분율을 결정한다. PRNT에서, 테스트되는 혈청 샘플은 일반적으로 표준화된 양의 바이러스와 혼합하기 전에 연속 희석을 거친다. 바이러스의 농도는 감수성 세포에 첨가되고 반-고체 배지로 오버레이되는 경우에 개별 플라크가 식별되고 계수될 수 있도록, 일정하게 유지된다. 이러한 방식으로, PRNT 종점 역가는 임의의 선택된 바이러스 활성의 감소 백분율에서 각 혈청 샘플에 대해 계산될 수 있다.
백신 면역원성을 평가하기 위한 기능 분석에서, 항체 적정을 위한 혈청 샘플 희석 시리즈는 "혈청보호" 역치 역가 미만에서 이상적으로 시작해야 한다. SARS-CoV-2 중화 항체와 관련하여 "혈청보호" 역치 역가는 알려지지 않은 채로 남아 있으나; 1:10의 혈청 반응 양성 역치는 특정 구현예에서 혈청보호 역치로 간주될 수 있다.
PRNT 종점 역가는 플라크 수의 원하는 감소 백분율을 나타내는 마지막 혈청 희석의 역수로 표현된다. PRNT 역가는 플라크 수의 50% 이상 감소(PRNT50)를 기반으로 계산될 수 있다. PRNT50 역가는 백신 혈청에 대해 더 높은 컷-오프(예를 들어, PRNT90)를 사용하는 역가보다 바람직하며, 적정 곡선의 선형 부분에서 보다 정확한 결과를 제공한다.
PRNT 역가를 계산하는 여러 방법이 있다. 역가를 계산하는 가장 간단하고 가장 널리 사용되는 방법은 플라크를 계수하고, 입력 플라크의 역-적정을 기반으로 입력 플라크 수의 >50% 감소를 나타내기 위해 마지막 혈청 희석의 역수로서 역가를 기록한다. 여러 혈청 희석으로부터의 곡선 맞춤 방법의 사용은 보다 정확한 결과의 계산을 가능하게 할 수 있다. 이를 위해 사용 가능한 다양한 컴퓨터 분석 프로그램(예를 들어, SPSS 또는 GraphPad Prism)이 있다.
일부 구현예에서, 항체 역가는 대상체가 감염되었는지 여부를 평가하는데 또는 면역화가 필요한지 여부를 결정하는데 사용된다. 일부 구현예에서, 항체 역가는 자가면역 반응의 강도를 결정하는데, 부스터 면역화가 필요한지 여부를 결정하는데, 이전의 백신이 효과적인지 여부를 결정하는데, 그리고 임의의 최근 또는 이전의 감염을 확인하는데 사용된다. 본 개시에 따르면, 항체 역가는 조성물(예를 들어, RNA 백신)에 의해 대상체에서 유도된 면역 반응의 강도를 결정하는데 사용될 수 있다.
일부 구현예에서, 대상체에서 생산된 항-코로나바이러스 항원 항체 역가는 대조군에 비해 적어도 1 log까지 증가된다. 예를 들어, 대상체에서 생산된 항-코로나바이러스 항원 항체 역가는 대조군에 비해 적어도 1.5, 적어도 2, 적어도 2.5, 또는 적어도 3 log까지 증가될 수 있다. 일부 구현예에서, 대상체에서 생산된 항-코로나바이러스 항원 항체 역가는 대조군에 비해 1, 1.5, 2, 2.5 또는 3 log까지 증가된다. 일부 구현예에서, 대상체에서 생산된 항-코로나바이러스 항원 항체 역가는 대조군에 비해 1-3 log까지 증가된다. 예를 들어, 대상체에서 생산된 항-코로나바이러스 항원 항체 역가는 대조군에 비해 1-1.5, 1-2, 1-2.5, 1-3, 1.5-2, 1.5-2.5, 1.5-3, 2-2.5, 2-3, 또는 2.5-3 log까지 증가될 수 있다.
일부 구현예에서, 대상체에서 생산된 항-코로나바이러스 항원 항체 역가는 대조군에 비해 적어도 2배 증가된다. 예를 들어, 대상체에서 생산된 항-코로나바이러스 항원 항체 역가는 대조군에 비해 적어도 3 배, 적어도 4 배, 적어도 5 배, 적어도 6 배, 적어도 7 배, 적어도 8 배, 적어도 9 배, 또는 적어도 10 배 증가될 수 있다. 일부 구현예에서, 대상체에서 생산된 항-코로나바이러스 항원 항체 역가는 대조군에 비해 2, 3, 4, 5, 6, 7, 8, 9, 또는 10배 증가된다. 일부 구현예에서, 대상체에서 생산된 항-코로나바이러스 항원 항체 역가는 대조군에 비해 2-10배 증가된다. 예를 들어, 대상체에서 생산된 항-코로나바이러스 항원 항체 역가는 대조군에 비해 2-10, 2-9, 2-8, 2-7, 2-6, 2-5, 2-4, 2-3, 3-10, 3-9, 3-8, 3-7, 3-6, 3-5, 3-4, 4-10, 4-9, 4-8, 4-7, 4-6, 4-5, 5-10, 5-9, 5-8, 5-7, 5-6, 6-10, 6-9, 6-8, 6-7, 7-10, 7-9, 7-8, 8-10, 8-9, 또는 9-10배 증가될 수 있다.
일부 구현예에서, 항원-특이적 면역 반응은 코로나바이러스에 대한 혈청 중화 항체 역가의 기하 평균 비율(GMR)로 지칭되는, 기하 평균 역가(GMT)의 비율로 측정된다. 기하 평균 역가(GMT)는 모든 값을 곱하고 상기 수의 n제곱근을 취하여 계산된 대상체 그룹에 대한 평균 항체 역가이며, 상기 n은 사용 가능한 데이터를 가진 대상체의 수이다.
대조군은, 일부 구현예에서, 조성물(예를 들어, RNA 백신)이 투여되지 않은 대상체에서 생산된 항-코로나바이러스 항원 항체 역가이다. 일부 구현예에서, 대조군은 재조합 또는 정제된 단백질 백신이 투여된 대상체에서 생산된 항-코로나바이러스 항원 항체 역가이다. 재조합 단백질 백신은 전형적으로 이종 발현 시스템(예를 들어, 박테리아 또는 효모)에서 생산되거나 다량의 병원성 유기체로부터 정제된 단백질 항원을 포함한다.
일부 구현예에서, 효과적인 조성물(예를 들어, RNA 백신)의 능력은 뮤린 모델에서 측정된다. 예를 들어, 조성물은 뮤린 모델 및 중화 항체 역가의 유도에 대해 분석된 뮤린 모델에 투여될 수 있다. 바이러스 챌린지 연구는 또한 본 개시의 백신의 효능을 평가하기 위해 사용될 수 있다. 예를 들어, 조성물은 뮤린 모델에 투여될 수 있고, 뮤린 모델은 바이러스로 챌린지되고, 뮤린 모델은 생존 및/또는 면역 반응(예를 들어, 중화 항체 반응, T 세포 반응(예를 들어, 사이토카인 반응))에 대해 분석될 수 있다.
일부 구현예에서, 조성물(예를 들어, RNA 백신)의 유효량은 재조합 단백질 백신의 표준 치료 용량과 비교하여 감소된 용량이다. 본원에 제공된 바와 같은 "표준 치료"는, 의학적 또는 심리적 치료 지침을 지칭하고 일반적이거나 특이적일 수 있다. "표준 치료"는 주어진 병태의 치료에 관련된 의료 전문가 간의 과학적 증거 및 공동 작업을 기반으로 한 적절한 치료를 구체화한다. 의사/임상의가 특정 유형의 환자, 병 또는 임상 상황에 대해 따라야 하는 진단 및 치료 과정이다. 본원에 제공된 바와 같은 "표준 치료 용량"은 의사/임상의 또는 다른 의료 전문가가 코로나바이러스 감염 또는 관련된 병태를 치료 또는 예방하기 위한 표준 치료 지침을 따르는 동안, 코로나바이러스 감염 또는 관련된 병태를 치료 또는 예방하기 위해 대상체에게 투여하는 재조합 또는 정제된 단백질 백신, 또는 생약독화된 또는 불활성화된 백신, 또는 VLP 백신의 용량을 지칭한다.
일부 구현예에서, 조성물의 유효량이 투여된 대상체에서 생산된 항-코로나바이러스 항원 항체 역가는 재조합 또는 정제된 단백질 백신, 또는 생약독화된 또는 불활성화된 백신, 또는 VLP 백신의 표준 치료 용량이 투여된 대조군 대상체에서 생산된 항-코로나바이러스 항원 항체 역가와 동등하다.
백신 효능은 표준 분석을 사용하여 평가될 수 있다(예를 들어, Weinberg 등, J Infect Dis. 2010 Jun 1;201(11):1607-10 참조). 예를 들어, 백신 효능은 이중-맹검, 무작위화된, 임상 제어된 시험에 의해 측정될 수 있다. 백신 효능은 백신 미접종된(ARU)과 백신 접종된(ARV) 코호트 연구 간의 질환 발병률(AR)의 비례 감소로서 표현될 수 있고, 하기 공식을 사용하여 백신 접종된 군 간의 질환의 상대 위험도(RR)로부터 계산될 수 있다:
효능 = (ARU - ARV)/ARU x 100; 및
효능 = (1-RR) x 100.
마찬가지로, 백신 유효성은 표준 분석을 사용하여 평가될 수 있다(예를 들어, Weinberg 등, J Infect Dis. 2010 Jun 1;201(11):1607-10 참조). 백신 유효성은 (높은 백신 효능을 갖는 것으로 이미 입증될 수 있는) 백신이 모집단에서 질환을 얼마나 감소시키는지의 평가이다. 이러한 측정은 통제된 임상 시험에서보다 자연 현장 조건 하에서 백신 자체 뿐만 아니라 백신 접종 프로그램의 이점 및 역효과의 순 균형을 평가할 수 있다. 백신 유효성은 백신 효능(역가)에 비례하지만, 또한 모집단의 표적 그룹이 얼마나 면역화되었는지에 의해, 뿐만 아니라 입원, 외래 방문, 또는 비용의 "실사회" 결과에 영향을 주는 다른 비-백신-관련된 인자에 의해 영향을 받는다. 예를 들어, 일련의 감염된 사례 및 적절한 대조군 간의 백신 접종률을 비교하는 후향적 사례 대조군 분석이 사용될 수 있다. 백신 유효성은 백신 접종에도 불구하고 감염이 발병하는 경우 오즈비(OR)를 사용하여 비율 차이로서 표현될 수 있다:
유효성 = (1 - OR) x 100.
일부 구현예에서, 조성물(예를 들어, RNA 백신)의 효능은 백신 미접종 대조군 대상체에 비해 적어도 60%이다. 예를 들어, 조성물의 효능은 백신 미접종 대조군 대상체에 비해 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 95%, 적어도 98%, 또는 100%일 수 있다.
살균 면역. 살균 면역은 숙주로의 효과적인 병원체 감염을 방지하는 독특한 면역 상태를 지칭한다. 일부 구현예에서, 본 개시의 조성물의 유효량은 적어도 1년 동안 대상체에서 살균 면역을 제공하기에 충분하다. 예를 들어, 본 개시의 조성물의 유효량은 적어도 2년, 적어도 3년, 적어도 4년, 또는 적어도 5년 동안 대상체에서 살균 면역을 제공하기에 충분하다. 일부 구현예에서, 본 개시의 조성물의 유효량은 대조군에 비해 적어도 5배 더 낮은 용량으로 대상체에서 살균 면역을 제공하기에 충분하다. 예를 들어, 유효량은 대조군에 비해 적어도 10배 낮은, 15배, 또는 20배 낮은 용량으로 대상체에서 살균 면역을 제공하기에 충분할 수 있다.
검출 가능한 항원. 일부 구현예에서, 본 개시의 조성물의 유효량은 투여 후 1-72시간에 대상체의 혈청에서 측정된 바와 같이 검출 가능한 수준의 코로나바이러스 항원을 생성하기에 충분하다.
역가. 항체 역가는 대상체 내의 항체, 예를 들어, 특정 항원(예를 들어, 항-코로나바이러스 항원)에 특이적인 항체 수의 측정이다. 항체 역가는 전형적으로 양성 결과를 제공하는 최대 희석액의 역수로 표시된다. 효소-결합 면역흡착 분석법(ELISA)은 예를 들어 항체 역가를 측정하기 위한 일반적인 분석법이다.
일부 구현예에서, 본 개시의 조성물의 유효량은 투여 후 1-72시간에 대상체의 혈청에서 측정된 바와 같이 코로나바이러스 항원에 대한 중화 항체에 의해 생산된 1,000-10,000의 중화 항체 역가를 생성하기에 충분하다. 일부 구현예에서, 유효량은 투여 후 1-72시간에 대상체의 혈청에서 측정된 바와 같이 코로나바이러스 항원에 대한 중화 항체에 의해 생산된 1,000-5,000의 중화 항체 역가를 생성하기에 충분하다. 일부 구현예에서, 유효량은 투여 후 1-72시간에 대상체의 혈청에서 측정된 바와 같이 코로나바이러스 항원에 대한 중화 항체에 의해 생산된 5,000-10,000의 중화 항체 역가를 생성하기에 충분하다.
일부 구현예에서, 중화 항체 역가는 적어도 100 NT50이다. 예를 들어, 중화 항체 역가는 적어도 200, 300, 400, 500, 600, 700, 800, 900 또는 1000 NT50일 수 있다. 일부 구현예에서, 중화 항체 역가는 적어도 10,000 NT50이다.
일부 구현예에서, 중화 항체 역가는 밀리리터 당 적어도 100 중화 단위(NU/mL)이다. 예를 들어, 중화 항체 역가는 적어도 200, 300, 400, 500, 600, 700, 800, 900 또는 1000 NU/mL일 수 있다. 일부 구현예에서, 중화 항체 역가는 적어도 10,000 NU/mL이다.
일부 구현예에서, 대상체 내 생산된 항-코로나바이러스 항원 항체 역가는 대조군에 비해 적어도 1 log 만큼 증가된다. 예를 들어, 대상체 내 생산된 항-코로나바이러스 항원 항체 역가는 대조군에 비해 적어도 2, 3, 4, 5, 6, 7, 8, 9 또는 10 log 만큼 증가될 수 있다.
일부 구현예에서, 대상체 내 생산된 항-코로나바이러스 항원 항체 역가는 대조군에 비해 적어도 2배 증가된다. 예를 들어, 대상체 내 생산된 항-코로나바이러스 항원 항체 역가는 대조군에 비해 적어도 3, 4, 5, 6, 7, 8, 9 또는 10배 증가된다.
일부 구현예에서, n 수의 곱의 n제곱근 기하 평균은 비례 성장을 기술하는 데 일반적으로 사용된다. 일부 구현예에서, 기하 평균은 대상체 내 생산된 항체 역가를 특성화하는 데 사용된다.
대조군은 예를 들어, 백신 미접종 대상체, 또는 바이러스 약독화 생백신, 불활성화된 바이러스 백신, 또는 단백질 서브유닛 백신을 투여받은 대상체일 수 있다.
추가 구현예
본 개시의 추가 구현예는 하기 번호가 매겨진 단락에 의해 포함된다:
1. SARS-CoV-2 스파이크 단백질의 수용체 결합 도메인(RBD) 및 단백질 막횡단 도메인을 포함하는 융합 단백질을 암호화하는 오픈 리딩 프레임을 포함하는 메신저 리보핵산(mRNA).
2. 단락 1에 있어서, 상기 단백질 막횡단 도메인은 인플루엔자 혈구응집소 막횡단 도메인인, mRNA.
3. 단락 2에 있어서, 상기 융합 단백질은 서열번호 77의 아미노산 서열에 대해 적어도 80% 동일성을 갖는 아미노산 서열을 포함하는 것인, mRNA.
4. 단락 3에 있어서, 상기 융합 단백질은 서열번호 77의 아미노산 서열에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하는 것인, mRNA.
5. 단락 4에 있어서, 상기 융합 단백질은 서열번호 77의 아미노산 서열을 포함하는 것인, mRNA.
6. 선행하는 단락 중 어느 한 단락에 있어서, 상기 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열에 대해 적어도 70% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, mRNA.
7. 단락 6에 있어서, 상기 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열에 대해 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, mRNA.
8. 단락 7에 있어서, 상기 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열을 포함하는 것인, mRNA.
9. SARS-CoV-2 스파이크 단백질의 아미노(N)-말단 도메인(NTD) 및 막횡단 도메인을 포함하는 융합 단백질을 암호화하는 오픈 리딩 프레임을 포함하는 메신저 리보핵산(mRNA).
10. 단락 9에 있어서, 상기 막횡단 도메인은 인플루엔자 혈구응집소 막횡단 도메인인, mRNA.
11. 단락 10에 있어서, 상기 융합 단백질은 서열번호 47의 아미노산 서열에 대해 적어도 80% 동일성을 갖는 아미노산 서열을 포함하는 것인, mRNA.
12. 단락 11에 있어서, 상기 융합 단백질은 서열번호 47의 아미노산 서열에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하는 것인, mRNA.
13. 단락 12에 있어서, 상기 융합 단백질은 서열번호 47의 아미노산 서열을 포함하는 것인, mRNA.
14. 선행하는 단락 중 어느 한 단락에 있어서, 상기 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열에 대해 적어도 70% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, mRNA.
15. 단락 14에 있어서, 상기 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열에 대해 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, mRNA.
16. 단락 15에 있어서, 상기 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열을 포함하는 것인, mRNA.
17. SARS-CoV-2 스파이크의 수용체 결합 도메인에 연결된 SARS-CoV-2 스파이크 단백질의 아미노(N)-말단 도메인을 포함하는 융합 단백질을 암호화하는 오픈 리딩 프레임을 포함하는 메신저 리보핵산(mRNA).
18. 단락 17에 있어서, 상기 융합 단백질은 막횡단 도메인을 추가로 포함하는 것인, mRNA.
19. 단락 18에 있어서, 상기 융합 단백질은 서열번호 92의 아미노산 서열에 대해 적어도 80% 동일성을 갖는 아미노산 서열을 포함하는 것인, mRNA.
20. 단락 18에 있어서, 상기 융합 단백질은 서열번호 92의 아미노산 서열에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하는 것인, mRNA.
21. 단락 20에 있어서, 상기 융합 단백질은 서열번호 92의 아미노산 서열을 포함하는 것인, mRNA.
22. 선행하는 단락 중 어느 한 단락에 있어서, 상기 오픈 리딩 프레임은 서열번호 91의 뉴클레오티드 서열에 대해 적어도 70% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, mRNA.
23. 단락 22에 있어서, 상기 오픈 리딩 프레임은 서열번호 91의 뉴클레오티드 서열에 대해 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, mRNA.
24. 단락 23에 있어서, 상기 오픈 리딩 프레임은 서열번호 91의 뉴클레오티드 서열을 포함하는 것인, mRNA.
25. 선행하는 단락 중 어느 한 단락에 있어서, 서열번호 131 또는 2의 뉴클레오티드 서열을 선택적으로 포함하는, 5' 비번역 영역(UTR)을 추가로 포함하는 것인, mRNA.
26. 선행하는 단락 중 어느 한 단락에 있어서, 서열번호 132 또는 4의 뉴클레오티드 서열을 선택적으로 포함하는, 3' 비번역 영역(UTR)을 추가로 포함하는 것인, mRNA.
27. 선행하는 단락 중 어느 한 단락에 있어서, 5' 캡, 선택적으로 7mG(5')ppp(5')NlmpNp를 추가로 포함하는 것인, mRNA.
28. 선행하는 단락 중 어느 한 단락에 있어서, 선택적으로 약 100개의 뉴클레오티드 길이를 갖는 폴리A 꼬리를 추가로 포함하는 것인, mRNA.
29. 선행하는 단락 중 어느 한 단락에 있어서, 상기 mRNA는 화학적 변형, 선택적으로 1-메틸슈도우리딘을 포함하는 것인, mRNA.
30. 단락 1 내지 단락 29 중 어느 한 단락의 mRNA를 포함하는 조성물.
31. 단락 1 내지 단락 8 중 어느 한 단락의 mRNA 및 단락 9 내지 단락 16 중 어느 한 단락의 mRNA를 포함하는 조성물.
32. 단락 17 내지 단락 29 중 어느 한 단락의 mRNA를 포함하는 조성물.
33. (a) SARS-CoV-2 스파이크 단백질의 수용체 결합 도메인(RBD) 및 단백질 막횡단 도메인을 포함하는 융합 단백질을 암호화하는 오픈 리딩 프레임을 포함하는 메신저 리보핵산(mRNA); 및
(b) SARS-CoV-2 스파이크 단백질의 아미노(N)-말단 도메인 및 막횡단 도메인을 포함하는 융합 단백질을 암호화하는 오픈 리딩 프레임을 포함하는 mRNA:
를 포함하는 조성물.
34. 단락 33에 있어서, 상기 단백질 막횡단 도메인은 인플루엔자 혈구응집소 막횡단 도메인인, 조성물.
35. 단락 34에 있어서, 상기 (a)의 융합 단백질은 서열번호 77의 아미노산 서열에 대해 적어도 80% 동일성을 갖는 아미노산 서열을 포함하는 것인, 조성물.
36. 단락 35에 있어서, 상기 (a)의 융합 단백질은 서열번호 77의 아미노산 서열에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하는 것인, 조성물.
37. 단락 36에 있어서, 상기 (a)의 융합 단백질은 서열번호 77의 아미노산 서열을 포함하는 것인, 조성물.
38. 단락 34 내지 단락 37 중 어느 한 단락에 있어서, 상기 (a)의 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열에 대해 적어도 70% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, 조성물.
39. 단락 38에 있어서, 상기 (a)의 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열에 대해 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, 조성물.
40. 단락 39에 있어서, 상기 (a)의 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열을 포함하는 것인, 조성물.
41. 단락 34 내지 단락 40 중 어느 한 단락에 있어서, 상기 (b)의 융합 단백질은 서열번호 47의 아미노산 서열에 대해 적어도 80% 동일성을 갖는 아미노산 서열을 포함하는 것인, 조성물.
42. 단락 41에 있어서, 상기 (b)의 융합 단백질은 서열번호 47의 아미노산 서열에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하는 것인, 조성물.
43. 단락 42에 있어서, 상기 (b)의 융합 단백질은 서열번호 47의 아미노산 서열을 포함하는 것인, 조성물.
44. 단락 34 내지 단락 43 중 어느 한 단락에 있어서, 상기 (b)의 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열에 대해 적어도 70% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, 조성물.
45. 단락 44에 있어서, 상기 (b)의 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열에 대해 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, 조성물.
46. 단락 45에 있어서, 상기 (b)의 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열을 포함하는 것인, 조성물.
47. 단락 33 내지 단락 46 중 어느 한 단락에 있어서, 상기 (a)의 mRNA 대 (b)의 mRNA의 비율은 약 1:1인, 조성물.
48. 지질 나노입자 내 제형화된 단락 1 내지 단락 29 중 어느 한 단락의 mRNA.
49. 지질 나노입자를 추가로 포함하는 단락 30 내지 단락 47 중 어느 한 단락의 조성물.
50. 단락 49에 있어서, 상기 mRNA는 지질 나노입자 내 제형화되는 것인, 조성물.
51. 단락 33 내지 단락 47 중 어느 한 단락에 있어서, 상기 (a)의 mRNA는 지질 나노입자 내 제형화되고, 상기 (b)의 mRNA는 지질 나노입자 내 제형화되는 것인, 조성물.
52. 단락 51에 있어서, 상기 (a) 및 (b)의 mRNA는 동일한 지질 나노입자 내 존재하거나, 상기 (a) 및 (b)의 각각의 mRNA는 서로 상대적으로 별개의 나노입자 내 제형화되는 것인, 조성물.
53. 단락 48의 mRNA 또는 단락 49 내지 단락 52 중 어느 한 단락의 조성물에 있어서, 상기 지질 나노입자는 양이온성 지질을 포함하는 것인 mRNA 또는 조성물.
54. 단락 53에 있어서, 상기 지질 나노입자는 중성 지질을 추가로 포함하는 것인, mRNA 또는 조성물.
55. 단락 53 또는 단락 54에 있어서, 상기 지질 나노입자는 스테롤을 추가로 포함하는 것인, mRNA 또는 조성물.
56. 단락 53 내지 단락 55 중 어느 한 단락에 있어서, 상기 지질 나노입자는 폴리에틸렌 글리콜(PEG)-변형된 지질을 추가로 포함하는 것인, mRNA 또는 조성물.
57. 단락 53 내지 단락 56 중 어느 한 단락에 있어서, 상기 지질 나노입자는 이온화 가능한 양이온성 지질, 중성 지질, 스테롤, 및 PEG-변형된 지질을 포함하는 것인, mRNA 또는 조성물.
58. 단락 57에 있어서, 상기 이온화 가능한 양이온성 지질은 헵타데칸-9-일 8((2 하이드록시에틸)(6 옥소 6-(운데실옥시)헥실)아미노)옥타노에이트 (화합물 1)인, mRNA 또는 조성물.
59. 단락 57 또는 단락 58에 있어서, 상기 중성 지질은 1,2 디스테아로일-sn-글리세로-3-포스포콜린(DSPC)인, mRNA 또는 조성물.
60. 단락 57 내지 단락 59 중 어느 한 단락에 있어서, 상기 스테롤은 콜레스테롤인, mRNA 또는 조성물.
61. 단락 57 내지 단락 60 중 어느 한 단락에 있어서, 상기 PEG-변형된 지질은 1,2 디미리스토일-sn-글리세롤, 메톡시폴리에틸렌글리콜(PEG2000 DMG)인, mRNA 또는 조성물.
62. 단락 57 내지 단락 61 중 어느 한 단락에 있어서, 상기 지질 나노입자는 20-60 mol%의 이온화 가능한 양이온성 지질, 5-25 mol%의 중성 지질, 25-55 mol%의 스테롤, 및 0.5-15 mol%의 PEG-변형된 지질을 포함하는 것인, mRNA 또는 조성물.
63. 단락 62에 있어서, 상기 지질 나노입자는
47 mol%의 이온화 가능한 양이온성 지질; 11.5 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 3.0 mol% PEG-변형된 지질;
48 mol%의 이온화 가능한 양이온성 지질; 11 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 2.5 mol%의 PEG-변형된 지질;
49 mol%의 이온화 가능한 양이온성 지질; 10.5 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 2.0 mol%의 PEG-변형된 지질;
50 mol%의 이온화 가능한 양이온성 지질; 10 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 1.5 mol%의 PEG-변형된 지질; 또는
51 mol%의 이온화 가능한 양이온성 지질; 9.5 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 1.0 mol%의 PEG-변형된 지질:
을 포함하는 mRNA 또는 조성물.
64. 단락 63에 있어서, 상기 지질 나노입자는
47 mol%의 화합물 1; 11.5 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 3.0 mol%의 PEG2000 DMG;
48 mol%의 화합물 1; 11 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 2.5 mol%의 PEG2000 DMG;
49 mol%의 화합물 1; 10.5 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 2.0 mol%의 PEG2000 DMG;
50 mol%의 화합물 1; 10 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 1.5 mol%의 PEG2000 DMG; 또는
51 mol%의 화합물 1; 9.5 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 1.0 mol%의 PEG2000 DMG:
를 포함하는 mRNA 또는 조성물.
65. SARS-CoV-2에 대한 중화 항체 반응을 대상체에서 유도하기에 효과적인 양으로 선행하는 단락 중 어느 한 단락의 mRNA 또는 조성물을 대상체에게 투여하는 단계를 포함하는 방법.
66. SARS-CoV-2에 대한 T 세포 면역 반응을 대상체에서 유도하기에 효과적인 양으로 선행하는 단락 중 어느 한 단락의 mRNA 또는 조성물을 대상체에게 투여하는 단계를 포함하는 방법.
67. SARS-CoV-2에 대한 면역 반응, 예컨대 중화 항체 반응을 유도할 수 있는 코로나바이러스 항원을 암호화하는 오픈 리딩 프레임(ORF)을 포함하는 메신저 리보핵산(mRNA)으로서, 상기 항원은 SARS-CoV-2의 단백질 단편 또는 기능성 단백질 도메인을 포함하며, 선택적으로 상기 RNA는 지질 나노입자 내 제형화되는 것인 메신저 리보핵산(mRNA).
68. 단락 67에 있어서, 상기 항원은 기능성 단백질 도메인인, mRNA.
69. 단락 68에 있어서, 상기 단백질 도메인은 SARS-CoV-2 스파이크 단백질의 N-말단 도메인(NTD)인, mRNA.
70. 단락 69에 있어서, 상기 NTD는 막횡단 도메인, 선택적으로 인플루엔자 혈구응집소 막횡단 도메인에 연결된 것인, mRNA.
71. 단락 70에 있어서, 상기 항원은 서열번호 47의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 47의 아미노산 서열을 포함하는 것인, mRNA.
72. 단락 70 또는 단락 71에 있어서, 상기 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열을 포함하는 것인, mRNA.
73. 단락 68에 있어서, 상기 단백질 도메인은 SARS-CoV-2 스파이크 단백질의 수용체 결합 도메인(RBD)인, mRNA.
74. 단락 73에 있어서, 상기 RBD는 가용성인, mRNA.
75. 단락 74에 있어서, 상기 항원은 서열번호 62의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 62의 아미노산 서열을 포함하는 것인, mRNA.
76. 단락 74 또는 단락 75에 있어서, 상기 오픈 리딩 프레임은 서열번호 61의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 61의 뉴클레오티드 서열을 포함하는 것인, mRNA.
77. 단락 73에 있어서, 상기 RBD는 막횡단 도메인, 선택적으로 인플루엔자 혈구응집소 막횡단 도메인에 연결된 것인, mRNA.
78. 단락 77에 있어서, 상기 항원은 서열번호 77의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 77의 아미노산 서열을 포함하는 것인, mRNA.
79. 단략 77 또는 단락 78에 있어서, 상기 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열을 포함하는 것인, mRNA.
80. 단락 69에 있어서, 상기 NTD는 SARS-CoV-2 스파이크 단백질의 RBD에 연결되어 NTD-RBD 융합 단백질을 형성하는 것인, mRNA.
81. 단락 80에 있어서, 상기 NTD-RBD 융합은 막횡단 도메인(TM), 선택적으로 인플루엔자 혈구응집소 막횡단 도메인에 연결되어 NTD-RBD-TM 단백질을 형성하는 것인, mRNA.
82. 단락 81에 있어서, 상기 항원은 서열번호 92의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 92의 아미노산 서열을 포함하는 것인, mRNA.
83. 단락 81 또는 단락 82에 있어서, 상기 오픈 리딩 프레임은 서열번호 91의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 91의 뉴클레오티드 서열을 포함하는 것인, mRNA.
84. 단락 80에 있어서, 상기 NTD-RBD 융합은 C-말단 절단을 포함하는 것인, mRNA.
85. 단락 84에 있어서, 상기 항원은 서열번호 107의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 107의 아미노산 서열을 포함하는 것인, mRNA.
86. 단락 84 또는 단락 85에 있어서, 상기 오픈 리딩 프레임은 서열번호 106의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 106의 뉴클레오티드 서열을 포함하는 것인, mRNA.
87. 선행하는 단락 중 어느 한 단락에 있어서, 상기 NTD 및/또는 RBD는 확장된 영역을 포함하는 것인, mRNA.
88. 단락 87에 있어서, 상기 항원은 서열번호 59, 86, 89, 116, 119, 또는 122 중 임의의 하나의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 59, 86, 89, 116, 119, 또는 122 중 임의의 하나의 아미노산 서열을 포함하는 것인, mRNA.
89. 단락 87 또는 88에 있어서, 상기 오픈 리딩 프레임은 서열번호 58, 85, 88, 115, 118, 또는 121 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 58, 85, 88, 115, 118, 또는 121 중 임의의 하나의 뉴클레오티드 서열을 포함하는 것인, mRNA.
90. 단락 68에 있어서, 상기 단백질 도메인은 SARS-CoV-2 스파이크 단백질의 S1 서브유닛 도메인인, mRNA.
91. 단락 90에 있어서, 상기 S1 서브유닛은 가용성인, mRNA.
92. 단락 91에 있어서, 상기 항원은 서열번호 5의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 5의 아미노산 서열을 포함하는 것인, mRNA.
93. 단락 91 또는 단락 92에 있어서, 상기 오픈 리딩 프레임은 서열번호 3의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 3의 뉴클레오티드 서열을 포함하는 것인, mRNA.
94. 단락 90에 있어서, 상기 S1 서브유닛은 막횡단 도메인, 선택적으로 인플루엔자 혈구응집소 막횡단 도메인에 연결된 것인, mRNA.
95. 단락 94에 있어서, 상기 항원은 서열번호 17의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 17의 아미노산 서열을 포함하는 것인, mRNA.
96. 단락 94 또는 단락 95에 있어서, 상기 오픈 리딩 프레임은 서열번호 16의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 16의 뉴클레오티드 서열을 포함하는 것인, mRNA.
97. 단락 90에 있어서, 상기 S1 서브유닛은 S 단백질의 RBD 또는 RBD의 일부를 제거하도록 변형된 것인, mRNA.
98. 단락 97에 있어서, 상기 항원은 서열번호 20, 23, 26, 29, 32 또는 35 중 임의의 하나의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 20, 23, 26, 29, 32 또는 35 중 임의의 하나의 아미노산 서열을 포함하는 것인, mRNA.
99. 단락 97 또는 단락 98에 있어서, 상기 오픈 리딩 프레임은 서열번호 19, 22, 25, 28, 41, 또는 34 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 19, 22, 25, 28, 31, 또는 34 중 임의의 하나의 뉴클레오티드 서열을 포함하는 것인, mRNA.
100. 단락 90에 있어서, 상기 S1 서브유닛은 S 단백질의 S2 서브유닛에 연결된 것인, mRNA.
101. 단락 100에 있어서, 상기 S2 서브유닛은 SARS-CoV-2 S 단백질로부터 유래된 것이고, 일부 구현예에서 상기 S2 서브유닛은 서열번호 145의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하는 오픈 리딩 프레임을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 145의 뉴클레오티드 서열을 포함하는 것인, mRNA.
102. 단락 101에 있어서, 상기 S1 서브유닛은 HKU1 S 단백질로부터 유래된 것인, mRNA.
103. 단락 102에 있어서, 상기 항원은 서열번호 38의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 38의 아미노산 서열을 포함하는 것인, mRNA.
104. 단락 102 또는 단락 103에 있어서, 상기 오픈 리딩 프레임은 서열번호 37의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 37의 뉴클레오티드 서열을 포함하는 것인, mRNA.
105. 단락 101에 있어서, 상기 S1 서브유닛은 OC43 S 단백질로부터 유래된 것인, mRNA.
106. 단락 105에 있어서, 상기 항원은 서열번호 41의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 41의 아미노산 서열을 포함하는 것인, mRNA.
107. 단락 105 또는 단락 106에 있어서, 상기 오픈 리딩 프레임은 서열번호 40의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 40의 뉴클레오티드 서열을 포함하는 것인, mRNA.
108. 선행하는 단락 중 어느 한 단락에 있어서, 상기 항원은 페리틴, 루마진 합성효소 및 폴던으로부터 선택적으로 선택되는, 스캐폴드 도메인을 추가로 포함하는 것인, mRNA.
109. 단락 108에 있어서, 상기 스캐폴드 도메인은 페리틴인, mRNA.
110. 단락 109에 있어서, 상기 항원은 서열번호 8 또는 65의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 8 또는 65의 아미노산 서열을 포함하는 것인, mRNA.
111. 단락 109 또는 단락 110에 있어서, 상기 오픈 리딩 프레임은 서열번호 7 또는 64의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 7 또는 64의 뉴클레오티드 서열을 포함하는 것인, mRNA.
112. 단락 108에 있어서, 상기 스캐폴드 도메인은 루마진 합성효소인, mRNA.
113. 단락 112에 있어서, 상기 항원은 서열번호 11, 14, 68, 또는 71 중 임의의 하나의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 11, 14, 68, 또는 71 중 임의의 하나의 아미노산 서열을 포함하는 것인, mRNA.
114. 단락 112 또는 단락 113에 있어서, 상기 오픈 리딩 프레임은 서열번호 10, 13, 67, 또는 70 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 10, 13, 67, 또는 70 중 임의의 하나의 뉴클레오티드 서열을 포함하는 것인, mRNA.
115. 단락 108에 있어서, 상기 스캐폴드 도메인은 폴던인, mRNA.
116. 단락 115에 있어서, 상기 항원은 서열번호 44, 50, 74, 80, 83, 101, 104 또는 113 중 임의의 하나의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 44, 50, 74, 80, 83, 101, 104 또는 113 중 임의의 하나의 아미노산 서열을 포함하는 것인, mRNA.
117. 단락 115 또는 단락 116에 있어서, 상기 오픈 리딩 프레임은 서열번호 43, 49, 73, 79, 82, 100, 103, 또는 112 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 43, 49, 73, 79, 82, 100, 103, 또는 112 중 임의의 하나의 뉴클레오티드 서열을 포함하는 것인, mRNA.
118. 선행하는 단락 중 어느 한 단락에 있어서, 대식세포 마커, 선택적으로 CD86, CD11B 및/또는 VSVGct로부터 선택적으로 선택되는 트래피킹 신호를 추가로 포함하는 것인, mRNA.
119. 단락 118에 있어서, 상기 항원은 서열번호 95, 98, 또는 110 중 임의의 하나의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 95, 98, 또는 110 중 임의의 하나의 아미노산 서열을 포함하는 것인, mRNA.
120. 단락 118 또는 단락 119에 있어서, 상기 오픈 리딩 프레임은 서열번호 94, 97, 또는 109 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 94, 97, 또는 109 중 임의의 하나의 뉴클레오티드 서열을 포함하는 것인, mRNA.
121.지질 나노입자 내 제형화된 단락 67 내지 단락 120 중 어느 한 단락의 mRNA.
122. 단락 121에 있어서, 상기 지질 나노입자는 양이온성 지질, 선택적으로 이온화 가능한 양이온성 지질, 중성 지질, 스테롤, 및/또는 폴리에틸렌 글리콜(PEG)-변형된 지질을 포함하는 것인, mRNA.
123. 단락 108에 있어서, 상기 이온화 가능한 양이온성 지질은 헵타데칸-9-일 8((2 하이드록시에틸)(6 옥소 6-(운데실옥시)헥실)아미노)옥타노에이트 (화합물 1)이고, 중성 지질은 1,2 디스테아로일-sn-글리세로-3-포스포콜린(DSPC)이고, 스테롤은 콜레스테롤이고/이거나, PEG-변형된 지질은 1,2 디미리스토일-sn-글리세롤, 메톡시폴리에틸렌글리콜 (PEG2000 DMG)인, mRNA 또는 조성물.
124. 단락 121 내지 단락 123 중 어느 한 단락에 있어서, 상기 지질 나노입자는 20-60 mol%의 이온화 가능한 양이온성 지질, 5-25 mol%의 중성 지질, 25-55 mol%의 스테롤, 및 0.5-15 mol%의 PEG-변형된 지질을 포함하는 것인, mRNA 또는 조성물.
125. 단락 124에 있어서, 상기 지질 나노입자는
47 mol%의 이온화 가능한 양이온성 지질; 11.5 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 3.0 mol%의 PEG-변형된 지질;
48 mol%의 이온화 가능한 양이온성 지질; 11 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 2.5 mol%의 PEG-변형된 지질;
49 mol%의 이온화 가능한 양이온성 지질; 10.5 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 2.0 mol%의 PEG-변형된 지질;
50 mol%의 이온화 가능한 양이온성 지질; 10 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 1.5 mol%의 PEG-변형된 지질; 또는
51 mol%의 이온화 가능한 양이온성 지질; 9.5 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 1.0 mol%의 PEG-변형된 지질:
을 포함하는 mRNA 또는 조성물.
126. 단락 125에 있어서, 상기 지질 나노입자는
47 mol%의 화합물 1; 11.5 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 3.0 mol%의 PEG2000 DMG;
48 mol%의 화합물 1; 11 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 2.5 mol%의 PEG2000 DMG;
49 mol%의 화합물 1; 10.5 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 2.0 mol%의 PEG2000 DMG;
50 mol%의 화합물 1; 10 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 1.5 mol%의 PEG2000 DMG; 또는
51 mol%의 화합물 1; 9.5 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 1.0 mol%의 PEG2000 DMG:
를 포함하는 mRNA 또는 조성물.
127. SARS-CoV-2에 대한 중화 항체 반응을 대상체에서 유도하기에 효과적인 양으로 단락 67 내지 단락 126 중 어느 한 단락의 mRNA를 대상체에게 투여하는 단계를 포함하는 방법.
128. SARS-CoV-2에 대한 T 세포 면역 반응을 대상체에서 유도하기에 효과적인 양으로 단락 67 내지 단락 126 중 어느 한 단락의 mRNA를 대상체에게 투여하는 단계를 포함하는 방법.
실시예
실시예 1. 발현 데이터
본 연구에 사용된 mRNA를 사용하여 SARS-CoV-2 코로나바이러스 스파이크(S) 단백질의 주요 중화 도메인을 발현시켰으며, 이러한 중화 단백질 도메인은 살아서 확산되는 천연 바이러스에 의한 감염으로부터 사람들을 보호하기 위한 면역원성 조성물 또는 백신으로서 개별적으로 또는 조합하여 사용될 때 보호 면역을 유도하는데 더 효과적인지의 여부를 평가한다. mRNA에 의해 암호화된 단백질의 선형 디자인은 도 2에 도시되어 있다. 모든 단백질은 또한 인플루엔자의 혈구응집소(HA)로부터 유래된 카르복시(C) 말단 막횡단 도메인(TM)을 포함한다.
NTD 및 RBD 둘 다는 중화 바이러스 활성을 나타내는 항체의 결합을 위한 부위로 알려져 있다. SARS-CoV-2의 경우에 RBD는 스파이크 단백질의 수용체 결합 부위이며, 안지오텐신-전환 효소 2(ACE2)에 결합한다. 기능이 완전히 이해되지 않은, 아미노(N) 말단 도메인인 NTD는 당 모이어티에 결합하고, 스파이크 단백질의 융합 전 형태로부터 융합 후 형태로의 구조적 전이를 촉진하는 역할을 갖는 것으로 보인다. Zhou H, Chen Y, Zhang S 등 Nat Commun. 2019; 10(1): 3068을 참조한다. 그럼에도 불구하고, NTD 및 RBD 도메인 둘 다는 하기 논의되는 바와 같이 높은 결합 항체 및 중화 항체 역가를 유도한다.
mRNA RBD-TM 백신("SARS-CoV-2 RBD-TM"; 서열번호 75-77), mRNA NTD-TM 백신("SARS-CoV-2 NTD-TM"; 서열번호 45-47) 및 mRNA NTD-RBD-TM("SARS-CoV-1 NTD-RBD-TM"; 서열번호 90-92) 백신에 대한 발현 데이터는 SARS-CoV-2 스파이크 단백질의 수용체 결합 도메인(RBD)에 대해(mAb1) 및 SARS-CoV-2 스파이크 단백질의 N-말단 도메인(NTD)에 대해(Ab2) 특이적인 항체를 사용하여 표 16 및 표 17에 나타내었다. 표 16은 24시간(hr), 48 hr 및 72 hr째에 WT SARS-CoV-2 스파이크 단백질 mRNA(표 16)와 비교한 (희석 범위 전반에 걸친) MFI*Freq의 평균 배수 차이를 나타낸다.
표 16. S2P 단백질과 비교한 총 항원 발현(MFI * Freq) 배수 변화
Figure pct00080
RBD=수용체 결합 도메인
NTD=N-말단 도메인
TM=막횡단 도메인
실시예 2. 단일 용량 이후 21일차 면역원성 데이터 및 중화 데이터
mRNA NTD-TM 및 mRNA RBD-TM(실시예 1에 기재됨)을 하기 용량으로 마우스에 투여하였다: 0.001 μg, 0.01 μg, 0.1 μg 또는 1 μg(N=8). mRNA NTD-RBD-TM(실시예 1에 기재됨)을 하기 용량으로 마우스에 투여하였다: 0.1 μg 또는 1 μg(N=8). mRNA NTD-TM 및 mRNA RBD-TM의 50:50 혼합물을 마우스에 투여하였으며, 이때 0.2 μg의 총 mRNA에 대해 0.1 μg의 각각의 mRNA, 또는 2 μg의 총 mRNA에 대해 1 μg의 각각의 mRNA가 함유되었다(N=8). 이후, SARS-CoV-2 스파이크 단백질-특이적 IgG 역가(표 17), SARS-CoV-2 RBD-특이적 IgG 역가(표 18), 및 SARS-CoV-2 NTD-특이적 IgG 역가(표 19)는 백신 접종 후 21일째에 ELISA로 측정하였다. 데이터는 표 17-19에 제공된다. 0.1 μg 용량의 mRNA NTD-RBD-TM 및 0.2 μg 용량의 mRNA NTD-TM 및 mRNA RBD-TM 조성물의 50:50 혼합물은, 관찰 가능한 NTD-특이적 및 RBD-특이적 IgG 역가를 유도하였으며, 0.1 μg 용량의 RBD-TM 및 NTD-TM은 각각 RBD 및 NTD 항원에 대해 측정 가능한 IgG 역가를 유도하였다.
표 17. SARS-CoV-2 S1/S2 스파이크 단백질-특이적 IgG 역가 - 평균값
Figure pct00081
N=8의 평균; PBS 단독 = 1.1
18. RBD 도메인-특이적 IgG 역가 - 평균값
Figure pct00082
N=8의 평균; PBS 단독 = 1.1
19. NTD 도메인-특이적 IgG 역가 - 평균값
Figure pct00083
N=8의 평균; PBS 단독 = 1.1
1 μg 용량의 RBD-TM 및 NTD-RBD-TM 조성물 및 2 μg 용량의 NTD-TM 및 RBD-TM 조성물의 50:50 혼합물로 백신 접종한 마우스의 혈청으로부터 중화 역가를 측정하고, ELISA 역가 및 중화 역가 간의 상관관계를 분석하였다(도 7).
1 μg 용량의 NTD-RBD-TM 조성물 또는 2 μg 용량의 NTD-TM 및 RBD-TM 조성물의 50:50 혼합물에 의해 유도된 역가는 1 μg 용량의 RBD-TM 조성물에 의해 유도된 역가보다 더 컸다(표 20). 스파이크-특이적 IgG, RBD-특이적 IgG, 및 NTD-특이적 IgG의 중화 역가 및 ELISA 역가 간에는 유의미한 상관관계가 존재한다(도 7).
20. 중화 역가 - 평균값
Figure pct00084
N=8의 평균; PBS 단독 = 1.1
재조합 VSVΔG -기반 SARS-CoV-2 슈도바이러스 중화 분석
코돈-최적화된 야생형 또는 D614G 스파이크 유전자(Wuhan-Hu-1 균주; NC_045512.2)를 pCAGGS 벡터에 클로닝하였다. VSVΔG-기반 SARS-CoV-2 슈도바이러스를 생성하기 위해, BHK-21/WI-2 세포를 스파이크 발현 플라스미드로 형질감염시키고, 이전에 기술한 바와 같이 VSVΔG-반딧불이-루시페라아제를 감염시켰다(Whitt, 2010). A549-hACE2-TMPRSS2 세포는 VSVΔG-기반 SARS-CoV-2 슈도바이러스 중화 분석을 위한 표적 세포로 사용하였다. hACE2-P2A-TMPRSS2를 암호화하는 렌티바이러스는 A549-hACE2-TMPRSS2 세포를 생성하도록 만들어졌으며, 이는 10% 소 태아 혈청 및 1 μg/mL 퓨로마이신이 보충된 DMEM에서 유지하였다. A549-hACE2-TMPRSS2 세포를 섭씨 37도에서 1시간 동안 슈도바이러스로 감염시켰다. 감염 후 접종 바이러스 또는 바이러스-항체 혼합을 제거하였다. 18 hr 후, 동일한 부피의 One-Glo 시약(Promega; E6120)을 BMG PHERastar-FS 플레이트 리더를 사용하여 판독하기 위해 배양 배지에 첨가하였다. 중화 절차 및 데이터 분석은 전술한 렌티바이러스-기반 슈도바이러스 중화 분석과 동일하다. Whitt, M.A.(2010)를 참조한다. Journal of Virological Methods 169, 365-374.
실시예 3. 2회 용량 이후 36일차 면역원성 데이터
실시예 2에 기재된 동일한 용량의 mRNA 백신을 제1 용량으로 백신 접종 후 22일째에 부스터 용량으로서 마우스에 다시 투여하였다. RBD 항원, NTD 항원, 야생형(WT) 스파이크(S) 단백질 및 S2P 단백질 (융합 전 형태를 안정화시키는 이중 프롤린 돌연변이를 갖는 S 단백질) 각각에 대한 부스터 용량 후 생산된 항체의 역가를 36일째 혈청으로부터 ELISA로 측정하고 하기에 나타내었다. LNP 내 mRNA에 의해 암호화된 RBD-TM 및 NTD-TM의 2가지 면역원성 조성물의 50:50 혼합물을 22일째에 부스터 용량으로서 마우스에 2 μg 또는 0.2 μg의 총 mRNA를 투여하고, 36일째에 역가를 측정하였다. 표 21을 참조한다.
LNP 내 mRNA에 의해 암호화된 RBD-TM, NTD-TM, 또는 NTD-RBD-TM로 면역화된 마우스에 따른 표 21에 나타낸 WT S 단백질 역가는 SARS-CoV-2 WT S 단백질을 인식하고 이에 결합할 수 있는 유도 항체로 시험된 모든 용량에서 2회 용량이 우수함을 나타내었다.
21. SARS-CoV-2 WT S-특이적 IgG 역가 - 기하 평균값
Figure pct00085
N=8의 평균; PBS 단독 = 1.1
LNP 내 mRNA에 의해 암호화된 RBD-TM, NTD-TM, 또는 NTD-RBD-TM의 2회 용량으로 면역화된 마우스의 혈청은 SARS-CoV-2 S2P 단백질을 인식하고 결합하는 항체의 능력에 대해 추가로 분석되었다. SARS-CoV-2 S2P 단백질에 대한 역가는 플레이트 상의 항원으로서 S2P를 사용하여 ELISA로 측정하였고, 하기 표 22에 나타내었다. 이들 면역원 각각은 S2P가 항원인 경우 대 WT S 단백질이 ELISA 항원인 경우 훨씬 더 높은 항체 역가를 유도하였다. 표 21표 22를 비교한다.
22. SARS-CoV-2 S2P-특이적 IgG 역가 - 기하 평균값
Figure pct00086
N=8의 평균; PBS 단독 = 1.1
표 23에서, 면역원은 LNP 내 mRNA에 의해 암호화된 RBD-TM 및 NTD-TM의 50:50 혼합이었으며, WT S, RBD, NTD 및 S2P에 대한 역가는 1회 용량(21일) 및 2회 용량(36일) 후에 측정하였다. 이러한 결과는 면역원이 동일한 용량의 개별 항원에 의해 유도된 항체 역가와 비교하여 50:50 혼합의 RBD-TM 및 NTD-TM 조합인 경우 역가가 극적으로 증가하였음을 나타낸다. 50:50 혼합은 면역화 항원에 대해 우수한 역가를 유도하였으나, 놀랍게도 WT S 단백질에 대해 훨씬 더 우수한 역가 및 S2P 단백질에 대해 극도로 더 높은 역가를 유도하였다. 표 23을 참조한다.
23. SARS-CoV-2 항원-특이적 IgG 역가 - 기하 평균값
Figure pct00087
N=8의 평균; PBS 단독 = 1.1
표 24는 각각의 RBD-TM 및 NTD-TM을 해당 항원을 암호화하는 mRNA로서 사용한 면역화의 결과를 나타낸다. ELISA 플레이트 상의 항원으로서 mRNA 면역원에 의해 암호화된 단백질을 사용하여 8마리 마우스의 그룹에 대해 기하 평균 역가를 측정하였다. 또한, 면역원성 조성물 둘 다는 항원이 LNP 내 제형화된 mRNA로서 투여된 경우 면역화 항원에 대해 높은 역가를 유도하였다. 이 경우에, 2회 용량은 모든 농도에서 우수한 항체 반응을 생성하였다. 그러나, 마이크로그램 당 (μg) 기준으로 이러한 항원의 50:50 혼합은 항원을 단독으로 투여한 경우보다 약 10배 더 높은 항체 반응을 유도하였다. 표 23표 24를 비교한다.
24. SARS-CoV-2 RBD 및 NTD 도메인 특이적 IgG 역가 - 기하 평균값
Figure pct00088
N=8의 평균; PBS 단독 = 1.1
RBD에 연결되고 LNP 내 mRNA에 의해 암호화된 NTD를 포함하는 융합 단백질은 1일째 및 21일째에 0.1 및 1 μg 용량으로 8마리의 마우스 그룹에 면역원성 조성물로서 투여하였다. 하기 표 25를 참조한다. NTD-RBD-TM의 융합 단백질 버전을 암호화하는 mRNA도 단일 도메인이 면역화 항원인 경우보다 더 높은 개별 도메인에 대한 매우 우수한 역가를 유도하였다. S2P 단백질에 대한 역가는 WT S 단백질에 대한 역가보다 약 8배 더 높았다. 표 25를 참조한다.
25. SARS-CoV-2 NTD-RBD-TM 도메인 특이적 IgG 역가 - 기하 평균값
Figure pct00089
N=8의 평균; PBS 단독 = 1.1
중화 데이터는 표 26에 나타내었다. mRNA에 의해 암호화된 S1-666-TM은 S1 서브도메인, 구체적으로 막횡단 도메인에 부착된 SARS-CoV-2 스파이크 단백질의 잔기 1-666을 사용하는 항원이다.
표 26. 1일째 및 22일째에 2회의 면역화 후 36일째의 평균 중화 역가.
Figure pct00090
N=8의 평균; PBS 단독 = 1.1
실시예 4. S1-666-TM의 면역원성
LNP 내 mRNA에 의해 암호화된 S1-666-TM (또는 스파이크 단백질 S의 S1 잔기 1-666)은 1일째에 프라임 면역화로서 마우스에 투여하였고, 0.01 μg 및 0.1 μg(N=8) 그룹의 경우 22일째에 부스터 용량으로서 투여하였다. 각각의 mRNA RBD, mRNA NTD 및 mRNA 야생형(WT) 스파이크(S) 단백질(도 1)에 대한 부스터 용량 후 생산된 항체의 역가는 21일째(부스트 전) 및 36일째(부스트 후)의 혈청을 ELISA로 측정하였으며, 하기 표 27에 나타내었다.
LNP 내 mRNA에 의해 암호화된 S1-666-TM으로 면역화된 마우스에 따른 표 27에 나타낸 WT S 단백질 역가는 SARS-CoV-2 WT S 단백질을 인식하고 이에 결합할 수 있는 유도 항체로 시험된 모든 용량에서 2회 용량이 우수함을 나타내었다. 놀랍게도, 유도된 역가는 S1에서 2P 돌연변이가 발견되지 않았음에도 불구하고 스파이크 단백질의 S2P 버전에 대해 측정한 경우 가장 높았으며, 이는 2P 돌연변이가 S2에서 발생하고 S2가 면역원에 존재하지 않기 때문이다. 다른 작제물과 유사하게, NTD 역가가 높아지도록 제2 용량이 필요하다.
27. SARS-CoV-2 항원-특이적 IgG 역가 - 기하 평균값
Figure pct00091
N=8의 평균; PBS 단독 = 1.1
실시예 5. 2회 용량 이후 36일차 RBD-TM, NTD-TM, NTD-RBD-TM, 및 NTD-TM/RBD-TM 조성물의 50:50 혼합물의 면역원성
해당 반복 실험에서, 상기 실시예에 기재된 동일한 용량의 mRNA 백신을 제1 용량으로 백신 접종 후 22일째에 부스터 용량으로서 마우스에 다시 투여하였다. 이후, SARS-CoV-2 스파이크 단백질-특이적 IgG 역가, SARS-CoV-2 S2P 단백질-특이적 IgG 역가, SARS-CoV-2 RBD-특이적 IgG 역가, 및 SARS-CoV-2 NTD-특이적 IgG 역가(는 제1 용량으로 백신 접종 후 36일째에 ELISA로 측정하였다.
결과는 1 μg 및 0.1 μg 용량의 mRNA RBD-TM, mRNA NTD-TM, mRNA NTD-RBD-TM 조성물, 및 1 μg 및 0.1 μg 각각의 mRNA RBD-TM 및 mRNA NTD-TM 조성물을 함유하는 50:50 혼합물이, SARS-CoV-2 스파이크 또는 SARS-CoV-2 S2P 단백질에 대해 높은 ELISA 역가를 유도하였음을 나타내었다.
실시예 6. 면역원성 연구
mRNA NTD-TM 및 mRNA RBD-TM의 50:50 혼합물의 면역원성을 하기 용량으로 마우스에 투여하였다: 0.2 μg 또는 2 μg 총 mRNA (0.1 μg 또는 1 μg의 각각의 mRNA) (N=8). 프라임 용량은 1일째에 투여하였고, 부스트 용량은 22일째에 투여하였다. 36일째에, ELISA를 사용하여 SARS-CoV-2 안정화된 융합 전 스파이크 단백질(SARS-CoV-2 pre-S)에 대한 항체 결합을 평가하였다. mRNA NTD-RBD-TM, mRNA RBD-TM 및 mRNA NTD-TM을 포함하는 하기 백신 조성물을 하기 용량으로 마우스에 투여하였다: 0.1 μg 또는 0.01 μg(N=8). GMT 데이터를 측정하고, 하기 표 28에 나타내었다.
28. S 단백질 도메인 융합 및 조합에 의해 유도된 SARS-CoV-2 스파이크 역가
Figure pct00092
실시예 7. NTD-RBD-TM에 대한 IgG2a 및 IgG1의 비율 측정
NTD-RBD-TM, mRNA NTD-RBD-TM의 조성물을 하기 용량으로 마우스에 투여하였다: 0.1 μg 또는 1 μg. 프라임 용량은 1일째에 투여하였고, 부스트 용량은 22일째에 투여하였다. 36일째에, S2P 특이적 IgG1 및 IgG2a 역가를 평가하였다. 도 7a-도 7c를 참조한다. 36일째까지, IgG2a의 역가는 용량 수준 둘 모두에서 IgG1의 양보다 더 높았다. 도 7a를 참조한다. T 세포 반응이 Th1 또는 Th2 유형의 반응으로 편향되는지의 여부를 규명하기 위해, 본 발명자들은 36일차 시점에서 IgG2a/IgG1의 비율을 플롯팅하였다. 도 7b에 나타낸 바와 같이, NTD-RBD-TM 조성물은 항체 면역 반응을 유도하며, 이는 완전히 Th1 유형의 반응 내에 있다. Th2 유형 반응은 질병 증강을 유도하는 것과의 연관성으로 인해 백신 개발에 있어서 불리하다.
실시예 8. 면역원성 연구
표 29에 열거된 mRNA를 하기 용량으로 마우스에 투여하였다: 0.1 μg 또는 1 μg(N=8). 프라임 용량은 1일째에 투여하였고, 부스트 용량은 22일째에 투여하였다. 혈청 IgG 역가는 21일째 및 36일째에 S2P 코팅된 플레이트 상에서 분석하였다. 결과는 표 29에 나타내었다.
표 29.
Figure pct00093
추가 서열
본원에 기술된 mRNA 서열 중 임의의 것이 5' UTR 및/또는 3' UTR을 포함할 수 있음을 이해해야 한다. UTR 서열은 하기 서열로부터 선택되거나, 다른 공지된 UTR 서열이 사용될 수 있다. 또한, 본원에 기술된 mRNA 작제물 중 임의의 것이 폴리(A) 꼬리 및/또는 캡(예를 들어, 7mG(5')ppp(5')NlmpNp)을 추가로 포함할 수 있음을 이해해야 한다. 추가로, 본원에 기술된 다수의 mRNA 및 암호화된 항원 서열은 신호 펩티드 및/또는 펩티드 태그(예를 들어, C-말단 His 태그)를 포함하지만, 표시된 신호 펩티드 및/또는 펩티드 태그가 다른 신호 펩티드 및/또는 펩티드 태그로 대체될 수 있거나, 신호 펩티드 및/또는 펩티드 태그가 생략될 수 있음을 이해해야 한다.
Figure pct00094
Figure pct00095
Figure pct00096
Figure pct00097
본원에 기술된 오픈 리딩 프레임 및/또는 상응하는 아미노산 서열 중 임의의 하나는 신호 서열을 포함하거나 제외할 수 있음을 또한 이해해야 한다.
본원에 개시된 모든 참조, 특허 및 특허 출원은 각각이 인용된 주제와 관련하여 참조로 포함되며, 일부 경우에는 문서의 전체를 포함할 수 있다.
상기 명세서 및 청구항에서 본원에 사용된 바와 같이, 부정관사 "한(a)" 및 "하나의(an)"는 명백하게 반대로 표시되지 않는 한, "적어도 하나"를 의미하는 것으로 이해되어야 한다. 또한, 명백하게 반대로 표시되지 않는 한, 하나 이상의 단계 또는 행위를 포함하는 본원에 청구된 임의의 방법에 있어서, 상기 방법의 단계 또는 행위의 순서는 반드시 상기 방법의 단계 또는 행위가 인용되는 순서로 제한되지 않는 것으로 이해되어야 한다.
청구항에서 뿐만 아니라 상기 명세서에서, 모든 전환 어구(transitional phrase), 예컨대 "포함하는", "비롯한", "동반하는", "갖는", "함유하는", "포괄하는", "보유하는", "구성된" 등은 개방형으로, 즉, 포함하나 이에 제한되지 않는 의미로 이해되어야 한다. 단지 상기 전환 어구 "구성되는" 및 "본질적으로 구성되는"은 미국 특허청의 특허 심사 절차 매뉴얼, 섹션 2111.03에 제시된 바와 같이, 각각 폐쇄형 또는 반-폐쇄형 전환 어구일 수 있다.
선행하는 수치의 용어 "약" 및 "실질적으로"는 인용된 수치의 평균 ± 10%를 의미한다.
값의 범위가 제공되는 경우, 범위의 상단과 하단 사이의 각 값이 본원에 구체적으로 고려되고 기술된다.
국제출원번호 PCT/US2015/02740호, PCT/US2016/043348호, PCT/US2016/043332호, PCT/US2016/058327호, PCT/US2016/058324호, PCT/US2016/058314호, PCT/US2016/058310호, PCT/US2016/058321호, PCT/US2016/058297호, PCT/US2016/058319호, 및 PCT/US2016/058314호의 전체 내용이 참조로 본원에 포함된다.
SEQUENCE LISTING <110> ModernaTX, Inc. <120> SARS-COV-2 mRNA DOMAIN VACCINES <130> M1378.70157WO00 <140> Not Yet Assigned <141> Concurrently Herewith <150> US 63/063,137 <151> 2020-08-07 <150> US 63/044,330 <151> 2020-06-25 <150> US 63/016,175 <151> 2020-04-27 <150> US 62/971,825 <151> 2020-02-07 <160> 152 <170> PatentIn version 3.5 <210> 1 <211> 2216 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 1 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120 acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180 guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240 gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300 cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360 cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420 aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480 ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540 agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600 aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660 aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720 gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780 cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840 gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900 aacggcacca ucaccgacgc cguggacugc gcccuggacc cucugagcga gaccaagugc 960 acccugaaga gcuucaccgu ggagaagggc aucuaccaga ccagcaacuu ccgggugcag 1020 cccaccgaga gcaucgugcg guuccccaac aucaccaacc ugugccccuu cggcgaggug 1080 uucaacgcca cccgguucgc cagcguguac gccuggaacc ggaagcggau cagcaacugc 1140 guggccgacu acagcgugcu guacaacagc gccagcuuca gcaccuucaa gugcuacggc 1200 gugagcccca ccaagcugaa cgaccugugc uucaccaacg uguacgccga cagcuucgug 1260 auccguggcg acgaggugcg gcagaucgca cccggccaga caggcaagau cgccgacuac 1320 aacuacaagc ugcccgacga cuucaccggc ugcgugaucg ccuggaacag caacaaccuc 1380 gacagcaagg ugggcggcaa cuacaacuac cuguaccggc uguuccggaa gagcaaccug 1440 aagcccuucg agcgggacau cagcaccgag aucuaccaag ccggcuccac cccuugcaac 1500 ggcguggagg gcuucaacug cuacuucccu cugcagagcu acggcuucca gcccaccaac 1560 ggcgugggcu accagcccua ccggguggug gugcugagcu ucgagcugcu gcacgcccca 1620 gccaccgugu guggccccaa gaagagcacc aaccugguga agaacaagug cgugaacuuc 1680 aacuucaacg gccuuaccgg caccggcgug cugaccgaga gcaacaagaa auuccugccc 1740 uuucagcagu ucggccggga caucgccgac accaccgacg cugugcggga uccccagacc 1800 cuggagaucc uggacaucac cccuugcagc uucggcggcg ugagcgugau caccccaggc 1860 accaacacca gcaaccaggu ggccgugcug uaccaggacg ugaacugcac cgaggugccc 1920 guggccaucc acgccgacca gcugacaccc accuggcggg ucuacagcac cggcagcaac 1980 guguuccaga cccgggccgg uugccugauc ggcgccgagc acgugaacaa cagcuacgag 2040 ugcgacaucc ccaucggcgc cggcaucugu gccagcuacc agacccagac caauucauga 2100 uaauaggcug gagccucggu ggccuagcuu cuugccccuu gggccucccc ccagccccuc 2160 cuccccuucc ugcacccgua cccccguggu cuuugaauaa agucugagug ggcggc 2216 <210> 2 <211> 57 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 2 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccacc 57 <210> 3 <211> 2040 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 3 auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60 cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120 aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180 aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240 aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300 auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360 aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420 cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480 agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540 ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600 uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660 ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720 cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780 ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840 gagaacggca ccaucaccga cgccguggac ugcgcccugg acccucugag cgagaccaag 900 ugcacccuga agagcuucac cguggagaag ggcaucuacc agaccagcaa cuuccgggug 960 cagcccaccg agagcaucgu gcgguucccc aacaucacca accugugccc cuucggcgag 1020 guguucaacg ccacccgguu cgccagcgug uacgccugga accggaagcg gaucagcaac 1080 ugcguggccg acuacagcgu gcuguacaac agcgccagcu ucagcaccuu caagugcuac 1140 ggcgugagcc ccaccaagcu gaacgaccug ugcuucacca acguguacgc cgacagcuuc 1200 gugauccgug gcgacgaggu gcggcagauc gcacccggcc agacaggcaa gaucgccgac 1260 uacaacuaca agcugcccga cgacuucacc ggcugcguga ucgccuggaa cagcaacaac 1320 cucgacagca aggugggcgg caacuacaac uaccuguacc ggcuguuccg gaagagcaac 1380 cugaagcccu ucgagcggga caucagcacc gagaucuacc aagccggcuc caccccuugc 1440 aacggcgugg agggcuucaa cugcuacuuc ccucugcaga gcuacggcuu ccagcccacc 1500 aacggcgugg gcuaccagcc cuaccgggug guggugcuga gcuucgagcu gcugcacgcc 1560 ccagccaccg uguguggccc caagaagagc accaaccugg ugaagaacaa gugcgugaac 1620 uucaacuuca acggccuuac cggcaccggc gugcugaccg agagcaacaa gaaauuccug 1680 cccuuucagc aguucggccg ggacaucgcc gacaccaccg acgcugugcg ggauccccag 1740 acccuggaga uccuggacau caccccuugc agcuucggcg gcgugagcgu gaucacccca 1800 ggcaccaaca ccagcaacca gguggccgug cuguaccagg acgugaacug caccgaggug 1860 cccguggcca uccacgccga ccagcugaca cccaccuggc gggucuacag caccggcagc 1920 aacguguucc agacccgggc cgguugccug aucggcgccg agcacgugaa caacagcuac 1980 gagugcgaca uccccaucgg cgccggcauc ugugccagcu accagaccca gaccaauuca 2040 <210> 4 <211> 119 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 4 ugauaauagg cuggagccuc gguggccuag cuucuugccc cuugggccuc cccccagccc 60 cuccuccccu uccugcaccc guacccccgu ggucuuugaa uaaagucuga gugggcggc 119 <210> 5 <211> 680 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 5 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser 675 680 <210> 6 <211> 2729 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 6 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120 acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180 guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240 gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300 cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360 cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420 aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480 ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540 agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600 aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660 aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720 gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780 cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840 gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900 aacggcacca ucaccgacgc cguggacugc gcccuggacc cucugagcga gaccaagugc 960 acccugaaga gcuucaccgu ggagaagggc aucuaccaga ccagcaacuu ccgggugcag 1020 cccaccgaga gcaucgugcg guuccccaac aucaccaacc ugugccccuu cggcgaggug 1080 uucaacgcca cccgguucgc cagcguguac gccuggaacc ggaagcggau cagcaacugc 1140 guggccgacu acagcgugcu guacaacagc gccagcuuca gcaccuucaa gugcuacggc 1200 gugagcccca ccaagcugaa cgaccugugc uucaccaacg uguacgccga cagcuucgug 1260 auccguggcg acgaggugcg gcagaucgca cccggccaga caggcaagau cgccgacuac 1320 aacuacaagc ugcccgacga cuucaccggc ugcgugaucg ccuggaacag caacaaccuc 1380 gacagcaagg ugggcggcaa cuacaacuac cuguaccggc uguuccggaa gagcaaccug 1440 aagcccuucg agcgggacau cagcaccgag aucuaccaag ccggcuccac cccuugcaac 1500 ggcguggagg gcuucaacug cuacuucccu cugcagagcu acggcuucca gcccaccaac 1560 ggcgugggcu accagcccua ccggguggug gugcugagcu ucgagcugcu gcacgcccca 1620 gccaccgugu guggccccaa gaagagcacc aaccugguga agaacaagug cgugaacuuc 1680 aacuucaacg gccuuaccgg caccggcgug cugaccgaga gcaacaagaa auuccugccc 1740 uuucagcagu ucggccggga caucgccgac accaccgacg cugugcggga uccccagacc 1800 cuggagaucc uggacaucac cccuugcagc uucggcggcg ugagcgugau caccccaggc 1860 accaacacca gcaaccaggu ggccgugcug uaccaggacg ugaacugcac cgaggugccc 1920 guggccaucc acgccgacca gcugacaccc accuggcggg ucuacagcac cggcagcaac 1980 guguuccaga cccgggccgg uugccugauc ggcgccgagc acgugaacaa cagcuacgag 2040 ugcgacaucc ccaucggcgc cggcaucugu gccagcuacc agacccagac caauucagga 2100 ggaggcagcg gcggcgauau caucaagcuu cugaacgagc aaguuaacaa ggaaaugcag 2160 agcaguaauc ucuacaugag caugagcagc uggugcuaca cccacucccu ggacggagca 2220 ggccucuucc uguucgacca cgcagccgag gaguacgagc acgcuaagaa guugaucauu 2280 uucuugaacg agaacaacgu gcccgugcag cuaacgucaa ucagcgcacc ugagcacaag 2340 uucgagggcc ugacccagau cuuccagaag gccuacgaac acgaacagca caucuccgag 2400 agcaucaaca auauugugga ucacgcuauc aaguccaagg accacgcuac cuucaacuuc 2460 cugcaguggu acguggccga gcaacaugag gaggaggugc uguucaagga cauccuggac 2520 aagaucgagc ugaucgguaa ugagaaucac ggccuguacc uggccgacca guacgugaag 2580 ggcaucgcca agagccggaa gucaggcuca ugauaauagg cuggagccuc gguggccuag 2640 cuucuugccc cuugggccuc cccccagccc cuccuccccu uccugcaccc guacccccgu 2700 ggucuuugaa uaaagucuga gugggcggc 2729 <210> 7 <211> 2553 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 7 auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60 cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120 aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180 aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240 aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300 auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360 aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420 cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480 agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540 ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600 uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660 ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720 cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780 ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840 gagaacggca ccaucaccga cgccguggac ugcgcccugg acccucugag cgagaccaag 900 ugcacccuga agagcuucac cguggagaag ggcaucuacc agaccagcaa cuuccgggug 960 cagcccaccg agagcaucgu gcgguucccc aacaucacca accugugccc cuucggcgag 1020 guguucaacg ccacccgguu cgccagcgug uacgccugga accggaagcg gaucagcaac 1080 ugcguggccg acuacagcgu gcuguacaac agcgccagcu ucagcaccuu caagugcuac 1140 ggcgugagcc ccaccaagcu gaacgaccug ugcuucacca acguguacgc cgacagcuuc 1200 gugauccgug gcgacgaggu gcggcagauc gcacccggcc agacaggcaa gaucgccgac 1260 uacaacuaca agcugcccga cgacuucacc ggcugcguga ucgccuggaa cagcaacaac 1320 cucgacagca aggugggcgg caacuacaac uaccuguacc ggcuguuccg gaagagcaac 1380 cugaagcccu ucgagcggga caucagcacc gagaucuacc aagccggcuc caccccuugc 1440 aacggcgugg agggcuucaa cugcuacuuc ccucugcaga gcuacggcuu ccagcccacc 1500 aacggcgugg gcuaccagcc cuaccgggug guggugcuga gcuucgagcu gcugcacgcc 1560 ccagccaccg uguguggccc caagaagagc accaaccugg ugaagaacaa gugcgugaac 1620 uucaacuuca acggccuuac cggcaccggc gugcugaccg agagcaacaa gaaauuccug 1680 cccuuucagc aguucggccg ggacaucgcc gacaccaccg acgcugugcg ggauccccag 1740 acccuggaga uccuggacau caccccuugc agcuucggcg gcgugagcgu gaucacccca 1800 ggcaccaaca ccagcaacca gguggccgug cuguaccagg acgugaacug caccgaggug 1860 cccguggcca uccacgccga ccagcugaca cccaccuggc gggucuacag caccggcagc 1920 aacguguucc agacccgggc cgguugccug aucggcgccg agcacgugaa caacagcuac 1980 gagugcgaca uccccaucgg cgccggcauc ugugccagcu accagaccca gaccaauuca 2040 ggaggaggca gcggcggcga uaucaucaag cuucugaacg agcaaguuaa caaggaaaug 2100 cagagcagua aucucuacau gagcaugagc agcuggugcu acacccacuc ccuggacgga 2160 gcaggccucu uccuguucga ccacgcagcc gaggaguacg agcacgcuaa gaaguugauc 2220 auuuucuuga acgagaacaa cgugcccgug cagcuaacgu caaucagcgc accugagcac 2280 aaguucgagg gccugaccca gaucuuccag aaggccuacg aacacgaaca gcacaucucc 2340 gagagcauca acaauauugu ggaucacgcu aucaagucca aggaccacgc uaccuucaac 2400 uuccugcagu gguacguggc cgagcaacau gaggaggagg ugcuguucaa ggacauccug 2460 gacaagaucg agcugaucgg uaaugagaau cacggccugu accuggccga ccaguacgug 2520 aagggcaucg ccaagagccg gaagucaggc uca 2553 <210> 8 <211> 851 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 8 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Gly Gly Gly Ser Gly Gly Asp Ile 675 680 685 Ile Lys Leu Leu Asn Glu Gln Val Asn Lys Glu Met Gln Ser Ser Asn 690 695 700 Leu Tyr Met Ser Met Ser Ser Trp Cys Tyr Thr His Ser Leu Asp Gly 705 710 715 720 Ala Gly Leu Phe Leu Phe Asp His Ala Ala Glu Glu Tyr Glu His Ala 725 730 735 Lys Lys Leu Ile Ile Phe Leu Asn Glu Asn Asn Val Pro Val Gln Leu 740 745 750 Thr Ser Ile Ser Ala Pro Glu His Lys Phe Glu Gly Leu Thr Gln Ile 755 760 765 Phe Gln Lys Ala Tyr Glu His Glu Gln His Ile Ser Glu Ser Ile Asn 770 775 780 Asn Ile Val Asp His Ala Ile Lys Ser Lys Asp His Ala Thr Phe Asn 785 790 795 800 Phe Leu Gln Trp Tyr Val Ala Glu Gln His Glu Glu Glu Val Leu Phe 805 810 815 Lys Asp Ile Leu Asp Lys Ile Glu Leu Ile Gly Asn Glu Asn His Gly 820 825 830 Leu Tyr Leu Ala Asp Gln Tyr Val Lys Gly Ile Ala Lys Ser Arg Lys 835 840 845 Ser Gly Ser 850 <210> 9 <211> 2762 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 9 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 ggcauccugc ccagcccugg caugcccgcu cugcugagcc uggugagccu gcugagcgug 120 cugcugaugg gcugcguggc ugagaccggc augcagaucu acgagggcaa gcugaccgca 180 gagggccugc gguucggcau cguggccagc cgcgccaacc acgcucuggu ggaccggcuu 240 guggagggcg cuaucgacgc caucgugaga cacggcggcc gggaagagga caucacccug 300 gugcgggugu gcggcagcug ggagauuccc gucgccgccg gagaacuggc ccggaaggag 360 gacaucgacg ccgugaucgc caucggcgug cugugcagag gcgccacgcc cagcuucgac 420 uacaucgcca gcgaggugag caagggccug gccgaccuga gccuggagcu gcggaagccc 480 aucaccuucg gcgugaucac cgccgacacc cuggagcagg ccaucgaggc cgcaggcacc 540 ugccacggca acaagggcug ggaagccgcc cugugcgcca ucgagauggc caaccuguuc 600 aagagccugc ggggcggaag uggaggcucu gguggcagcg gaggaucugg cggcggcacc 660 acccggaccc agcugccacc agccuacacc aacagcuuca cccggggcgu cuacuacccc 720 gacaaggugu uccggagcag cguccugcac agcacccagg accuguuccu gcccuucuuc 780 agcaacguga ccugguucca cgccauccac gugagcggca ccaacggcac caagcgguuc 840 gacaaccccg ugcugcccuu caacgacggc guguacuucg ccagcaccga gaagagcaac 900 aucauccggg gcuggaucuu cggcaccacc cuggacagca agacccagag ccugcugauc 960 gugaauaacg ccaccaacgu ggugaucaag gugugcgagu uccaguucug caacgacccc 1020 uuccugggcg uguacuacca caagaacaac aagagcugga uggagagcga guuccgggug 1080 uacagcagcg ccaacaacug caccuucgag uacgugagcc agcccuuccu gauggaccug 1140 gagggcaagc agggcaacuu caagaaccug cgggaguucg uguucaagaa caucgacggc 1200 uacuucaaga ucuacagcaa gcacacccca aucaaccugg ugcgggaucu gccccagggc 1260 uucucagccc uggagccccu gguggaccug cccaucggca ucaacaucac ccgguuccag 1320 acccugcugg cccugcaccg gagcuaccug accccaggcg acagcagcag cggguggaca 1380 gcaggcgcgg cugcuuacua cgugggcuac cugcagcccc ggaccuuccu gcugaaguac 1440 aacgagaacg gcaccaucac cgacgccgug gacugcgccc uggacccucu gagcgagacc 1500 aagugcaccc ugaagagcuu caccguggag aagggcaucu accagaccag caacuuccgg 1560 gugcagccca ccgagagcau cgugcgguuc cccaacauca ccaaccugug ccccuucggc 1620 gagguguuca acgccacccg guucgccagc guguacgccu ggaaccggaa gcggaucagc 1680 aacugcgugg ccgacuacag cgugcuguac aacagcgcca gcuucagcac cuucaagugc 1740 uacggcguga gccccaccaa gcugaacgac cugugcuuca ccaacgugua cgccgacagc 1800 uucgugaucc guggcgacga ggugcggcag aucgcacccg gccagacagg caagaucgcc 1860 gacuacaacu acaagcugcc cgacgacuuc accggcugcg ugaucgccug gaacagcaac 1920 aaccucgaca gcaagguggg cggcaacuac aacuaccugu accggcuguu ccggaagagc 1980 aaccugaagc ccuucgagcg ggacaucagc accgagaucu accaagccgg cuccaccccu 2040 ugcaacggcg uggagggcuu caacugcuac uucccucugc agagcuacgg cuuccagccc 2100 accaacggcg ugggcuacca gcccuaccgg gugguggugc ugagcuucga gcugcugcac 2160 gccccagcca ccgugugugg ccccaagaag agcaccaacc uggugaagaa caagugcgug 2220 aacuucaacu ucaacggccu uaccggcacc ggcgugcuga ccgagagcaa caagaaauuc 2280 cugcccuuuc agcaguucgg ccgggacauc gccgacacca ccgacgcugu gcgggauccc 2340 cagacccugg agauccugga caucaccccu ugcagcuucg gcggcgugag cgugaucacc 2400 ccaggcacca acaccagcaa ccagguggcc gugcuguacc aggacgugaa cugcaccgag 2460 gugcccgugg ccauccacgc cgaccagcug acacccaccu ggcgggucua cagcaccggc 2520 agcaacgugu uccagacccg ggccgguugc cugaucggcg ccgagcacgu gaacaacagc 2580 uacgagugcg acauccccau cggcgccggc aucugugcca gcuaccagac ccagaccaau 2640 ucaugauaau aggcuggagc cucgguggcc uagcuucuug ccccuugggc cuccccccag 2700 ccccuccucc ccuuccugca cccguacccc cguggucuuu gaauaaaguc ugagugggcg 2760 gc 2762 <210> 10 <211> 2586 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 10 augggcaucc ugcccagccc uggcaugccc gcucugcuga gccuggugag ccugcugagc 60 gugcugcuga ugggcugcgu ggcugagacc ggcaugcaga ucuacgaggg caagcugacc 120 gcagagggcc ugcgguucgg caucguggcc agccgcgcca accacgcucu gguggaccgg 180 cuuguggagg gcgcuaucga cgccaucgug agacacggcg gccgggaaga ggacaucacc 240 cuggugcggg ugugcggcag cugggagauu cccgucgccg ccggagaacu ggcccggaag 300 gaggacaucg acgccgugau cgccaucggc gugcugugca gaggcgccac gcccagcuuc 360 gacuacaucg ccagcgaggu gagcaagggc cuggccgacc ugagccugga gcugcggaag 420 cccaucaccu ucggcgugau caccgccgac acccuggagc aggccaucga ggccgcaggc 480 accugccacg gcaacaaggg cugggaagcc gcccugugcg ccaucgagau ggccaaccug 540 uucaagagcc ugcggggcgg aaguggaggc ucugguggca gcggaggauc uggcggcggc 600 accacccgga cccagcugcc accagccuac accaacagcu ucacccgggg cgucuacuac 660 cccgacaagg uguuccggag cagcguccug cacagcaccc aggaccuguu ccugcccuuc 720 uucagcaacg ugaccugguu ccacgccauc cacgugagcg gcaccaacgg caccaagcgg 780 uucgacaacc ccgugcugcc cuucaacgac ggcguguacu ucgccagcac cgagaagagc 840 aacaucaucc ggggcuggau cuucggcacc acccuggaca gcaagaccca gagccugcug 900 aucgugaaua acgccaccaa cguggugauc aaggugugcg aguuccaguu cugcaacgac 960 cccuuccugg gcguguacua ccacaagaac aacaagagcu ggauggagag cgaguuccgg 1020 guguacagca gcgccaacaa cugcaccuuc gaguacguga gccagcccuu ccugauggac 1080 cuggagggca agcagggcaa cuucaagaac cugcgggagu ucguguucaa gaacaucgac 1140 ggcuacuuca agaucuacag caagcacacc ccaaucaacc uggugcggga ucugccccag 1200 ggcuucucag cccuggagcc ccugguggac cugcccaucg gcaucaacau cacccgguuc 1260 cagacccugc uggcccugca ccggagcuac cugaccccag gcgacagcag cagcgggugg 1320 acagcaggcg cggcugcuua cuacgugggc uaccugcagc cccggaccuu ccugcugaag 1380 uacaacgaga acggcaccau caccgacgcc guggacugcg cccuggaccc ucugagcgag 1440 accaagugca cccugaagag cuucaccgug gagaagggca ucuaccagac cagcaacuuc 1500 cgggugcagc ccaccgagag caucgugcgg uuccccaaca ucaccaaccu gugccccuuc 1560 ggcgaggugu ucaacgccac ccgguucgcc agcguguacg ccuggaaccg gaagcggauc 1620 agcaacugcg uggccgacua cagcgugcug uacaacagcg ccagcuucag caccuucaag 1680 ugcuacggcg ugagccccac caagcugaac gaccugugcu ucaccaacgu guacgccgac 1740 agcuucguga uccguggcga cgaggugcgg cagaucgcac ccggccagac aggcaagauc 1800 gccgacuaca acuacaagcu gcccgacgac uucaccggcu gcgugaucgc cuggaacagc 1860 aacaaccucg acagcaaggu gggcggcaac uacaacuacc uguaccggcu guuccggaag 1920 agcaaccuga agcccuucga gcgggacauc agcaccgaga ucuaccaagc cggcuccacc 1980 ccuugcaacg gcguggaggg cuucaacugc uacuucccuc ugcagagcua cggcuuccag 2040 cccaccaacg gcgugggcua ccagcccuac cggguggugg ugcugagcuu cgagcugcug 2100 cacgccccag ccaccgugug uggccccaag aagagcacca accuggugaa gaacaagugc 2160 gugaacuuca acuucaacgg ccuuaccggc accggcgugc ugaccgagag caacaagaaa 2220 uuccugcccu uucagcaguu cggccgggac aucgccgaca ccaccgacgc ugugcgggau 2280 ccccagaccc uggagauccu ggacaucacc ccuugcagcu ucggcggcgu gagcgugauc 2340 accccaggca ccaacaccag caaccaggug gccgugcugu accaggacgu gaacugcacc 2400 gaggugcccg uggccaucca cgccgaccag cugacaccca ccuggcgggu cuacagcacc 2460 ggcagcaacg uguuccagac ccgggccggu ugccugaucg gcgccgagca cgugaacaac 2520 agcuacgagu gcgacauccc caucggcgcc ggcaucugug ccagcuacca gacccagacc 2580 aauuca 2586 <210> 11 <211> 862 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 11 Met Gly Ile Leu Pro Ser Pro Gly Met Pro Ala Leu Leu Ser Leu Val 1 5 10 15 Ser Leu Leu Ser Val Leu Leu Met Gly Cys Val Ala Glu Thr Gly Met 20 25 30 Gln Ile Tyr Glu Gly Lys Leu Thr Ala Glu Gly Leu Arg Phe Gly Ile 35 40 45 Val Ala Ser Arg Ala Asn His Ala Leu Val Asp Arg Leu Val Glu Gly 50 55 60 Ala Ile Asp Ala Ile Val Arg His Gly Gly Arg Glu Glu Asp Ile Thr 65 70 75 80 Leu Val Arg Val Cys Gly Ser Trp Glu Ile Pro Val Ala Ala Gly Glu 85 90 95 Leu Ala Arg Lys Glu Asp Ile Asp Ala Val Ile Ala Ile Gly Val Leu 100 105 110 Cys Arg Gly Ala Thr Pro Ser Phe Asp Tyr Ile Ala Ser Glu Val Ser 115 120 125 Lys Gly Leu Ala Asp Leu Ser Leu Glu Leu Arg Lys Pro Ile Thr Phe 130 135 140 Gly Val Ile Thr Ala Asp Thr Leu Glu Gln Ala Ile Glu Ala Ala Gly 145 150 155 160 Thr Cys His Gly Asn Lys Gly Trp Glu Ala Ala Leu Cys Ala Ile Glu 165 170 175 Met Ala Asn Leu Phe Lys Ser Leu Arg Gly Gly Ser Gly Gly Ser Gly 180 185 190 Gly Ser Gly Gly Ser Gly Gly Gly Thr Thr Arg Thr Gln Leu Pro Pro 195 200 205 Ala Tyr Thr Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val 210 215 220 Phe Arg Ser Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe 225 230 235 240 Phe Ser Asn Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn 245 250 255 Gly Thr Lys Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val 260 265 270 Tyr Phe Ala Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe 275 280 285 Gly Thr Thr Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn 290 295 300 Ala Thr Asn Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp 305 310 315 320 Pro Phe Leu Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu 325 330 335 Ser Glu Phe Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr 340 345 350 Val Ser Gln Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe 355 360 365 Lys Asn Leu Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys 370 375 380 Ile Tyr Ser Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln 385 390 395 400 Gly Phe Ser Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn 405 410 415 Ile Thr Arg Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr 420 425 430 Pro Gly Asp Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr 435 440 445 Val Gly Tyr Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn 450 455 460 Gly Thr Ile Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu 465 470 475 480 Thr Lys Cys Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln 485 490 495 Thr Ser Asn Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro 500 505 510 Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg 515 520 525 Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val 530 535 540 Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys 545 550 555 560 Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn 565 570 575 Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile 580 585 590 Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro 595 600 605 Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp 610 615 620 Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys 625 630 635 640 Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln 645 650 655 Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe 660 665 670 Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln 675 680 685 Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala 690 695 700 Thr Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys 705 710 715 720 Val Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu 725 730 735 Ser Asn Lys Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala 740 745 750 Asp Thr Thr Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp 755 760 765 Ile Thr Pro Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr 770 775 780 Asn Thr Ser Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr 785 790 795 800 Glu Val Pro Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg 805 810 815 Val Tyr Ser Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu 820 825 830 Ile Gly Ala Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile 835 840 845 Gly Ala Gly Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser 850 855 860 <210> 12 <211> 2714 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 12 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120 acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180 guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240 gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300 cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360 cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420 aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480 ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540 agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600 aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660 aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720 gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780 cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840 gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900 aacggcacca ucaccgacgc cguggacugc gcccuggacc cucugagcga gaccaagugc 960 acccugaaga gcuucaccgu ggagaagggc aucuaccaga ccagcaacuu ccgggugcag 1020 cccaccgaga gcaucgugcg guuccccaac aucaccaacc ugugccccuu cggcgaggug 1080 uucaacgcca cccgguucgc cagcguguac gccuggaacc ggaagcggau cagcaacugc 1140 guggccgacu acagcgugcu guacaacagc gccagcuuca gcaccuucaa gugcuacggc 1200 gugagcccca ccaagcugaa cgaccugugc uucaccaacg uguacgccga cagcuucgug 1260 auccguggcg acgaggugcg gcagaucgca cccggccaga caggcaagau cgccgacuac 1320 aacuacaagc ugcccgacga cuucaccggc ugcgugaucg ccuggaacag caacaaccuc 1380 gacagcaagg ugggcggcaa cuacaacuac cuguaccggc uguuccggaa gagcaaccug 1440 aagcccuucg agcgggacau cagcaccgag aucuaccaag ccggcuccac cccuugcaac 1500 ggcguggagg gcuucaacug cuacuucccu cugcagagcu acggcuucca gcccaccaac 1560 ggcgugggcu accagcccua ccggguggug gugcugagcu ucgagcugcu gcacgcccca 1620 gccaccgugu guggccccaa gaagagcacc aaccugguga agaacaagug cgugaacuuc 1680 aacuucaacg gccuuaccgg caccggcgug cugaccgaga gcaacaagaa auuccugccc 1740 uuucagcagu ucggccggga caucgccgac accaccgacg cugugcggga uccccagacc 1800 cuggagaucc uggacaucac cccuugcagc uucggcggcg ugagcgugau caccccaggc 1860 accaacacca gcaaccaggu ggccgugcug uaccaggacg ugaacugcac cgaggugccc 1920 guggccaucc acgccgacca gcugacaccc accuggcggg ucuacagcac cggcagcaac 1980 guguuccaga cccgggccgg uugccugauc ggcgccgagc acgugaacaa cagcuacgag 2040 ugcgacaucc ccaucggcgc cggcaucugu gccagcuacc agacccagac caauucagga 2100 ggaggcuccg gaggcgguag cgcugagacc ggcaugcaga ucuacgaggg caagcugacc 2160 gcagagggcc ugcgguucgg caucguggcc agccgcgcca accacgcucu gguggaccgg 2220 cuuguggagg gcgcuaucga cgccaucgug agacacggcg gccgggaaga ggacaucacc 2280 cuggugcggg ugugcggcag cugggagauu cccgucgccg ccggagaacu ggcccggaag 2340 gaggacaucg acgccgugau cgccaucggc gugcugugca gaggcgccac gcccagcuuc 2400 gacuacaucg ccagcgaggu gagcaagggc cuggccgacc ugagccugga gcugcggaag 2460 cccaucaccu ucggcgugau caccgccgac acccuggagc aggccaucga ggccgcaggc 2520 accugccacg gcaacaaggg cugggaagcc gcccugugcg ccaucgagau ggccaaccug 2580 uucaagagcc ugcggugaua auaggcugga gccucggugg ccuagcuucu ugccccuugg 2640 gccucccccc agccccuccu ccccuuccug cacccguacc cccguggucu uugaauaaag 2700 ucugaguggg cggc 2714 <210> 13 <211> 2538 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 13 auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60 cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120 aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180 aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240 aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300 auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360 aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420 cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480 agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540 ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600 uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660 ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720 cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780 ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840 gagaacggca ccaucaccga cgccguggac ugcgcccugg acccucugag cgagaccaag 900 ugcacccuga agagcuucac cguggagaag ggcaucuacc agaccagcaa cuuccgggug 960 cagcccaccg agagcaucgu gcgguucccc aacaucacca accugugccc cuucggcgag 1020 guguucaacg ccacccgguu cgccagcgug uacgccugga accggaagcg gaucagcaac 1080 ugcguggccg acuacagcgu gcuguacaac agcgccagcu ucagcaccuu caagugcuac 1140 ggcgugagcc ccaccaagcu gaacgaccug ugcuucacca acguguacgc cgacagcuuc 1200 gugauccgug gcgacgaggu gcggcagauc gcacccggcc agacaggcaa gaucgccgac 1260 uacaacuaca agcugcccga cgacuucacc ggcugcguga ucgccuggaa cagcaacaac 1320 cucgacagca aggugggcgg caacuacaac uaccuguacc ggcuguuccg gaagagcaac 1380 cugaagcccu ucgagcggga caucagcacc gagaucuacc aagccggcuc caccccuugc 1440 aacggcgugg agggcuucaa cugcuacuuc ccucugcaga gcuacggcuu ccagcccacc 1500 aacggcgugg gcuaccagcc cuaccgggug guggugcuga gcuucgagcu gcugcacgcc 1560 ccagccaccg uguguggccc caagaagagc accaaccugg ugaagaacaa gugcgugaac 1620 uucaacuuca acggccuuac cggcaccggc gugcugaccg agagcaacaa gaaauuccug 1680 cccuuucagc aguucggccg ggacaucgcc gacaccaccg acgcugugcg ggauccccag 1740 acccuggaga uccuggacau caccccuugc agcuucggcg gcgugagcgu gaucacccca 1800 ggcaccaaca ccagcaacca gguggccgug cuguaccagg acgugaacug caccgaggug 1860 cccguggcca uccacgccga ccagcugaca cccaccuggc gggucuacag caccggcagc 1920 aacguguucc agacccgggc cgguugccug aucggcgccg agcacgugaa caacagcuac 1980 gagugcgaca uccccaucgg cgccggcauc ugugccagcu accagaccca gaccaauuca 2040 ggaggaggcu ccggaggcgg uagcgcugag accggcaugc agaucuacga gggcaagcug 2100 accgcagagg gccugcgguu cggcaucgug gccagccgcg ccaaccacgc ucugguggac 2160 cggcuugugg agggcgcuau cgacgccauc gugagacacg gcggccggga agaggacauc 2220 acccuggugc gggugugcgg cagcugggag auucccgucg ccgccggaga acuggcccgg 2280 aaggaggaca ucgacgccgu gaucgccauc ggcgugcugu gcagaggcgc cacgcccagc 2340 uucgacuaca ucgccagcga ggugagcaag ggccuggccg accugagccu ggagcugcgg 2400 aagcccauca ccuucggcgu gaucaccgcc gacacccugg agcaggccau cgaggccgca 2460 ggcaccugcc acggcaacaa gggcugggaa gccgcccugu gcgccaucga gauggccaac 2520 cuguucaaga gccugcgg 2538 <210> 14 <211> 846 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 14 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Gly Gly Gly Ser Gly Gly Gly Ser 675 680 685 Ala Glu Thr Gly Met Gln Ile Tyr Glu Gly Lys Leu Thr Ala Glu Gly 690 695 700 Leu Arg Phe Gly Ile Val Ala Ser Arg Ala Asn His Ala Leu Val Asp 705 710 715 720 Arg Leu Val Glu Gly Ala Ile Asp Ala Ile Val Arg His Gly Gly Arg 725 730 735 Glu Glu Asp Ile Thr Leu Val Arg Val Cys Gly Ser Trp Glu Ile Pro 740 745 750 Val Ala Ala Gly Glu Leu Ala Arg Lys Glu Asp Ile Asp Ala Val Ile 755 760 765 Ala Ile Gly Val Leu Cys Arg Gly Ala Thr Pro Ser Phe Asp Tyr Ile 770 775 780 Ala Ser Glu Val Ser Lys Gly Leu Ala Asp Leu Ser Leu Glu Leu Arg 785 790 795 800 Lys Pro Ile Thr Phe Gly Val Ile Thr Ala Asp Thr Leu Glu Gln Ala 805 810 815 Ile Glu Ala Ala Gly Thr Cys His Gly Asn Lys Gly Trp Glu Ala Ala 820 825 830 Leu Cys Ala Ile Glu Met Ala Asn Leu Phe Lys Ser Leu Arg 835 840 845 <210> 15 <211> 2300 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 15 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120 acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180 guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240 gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300 cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360 cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420 aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480 ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540 agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600 aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660 aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720 gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780 cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840 gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900 aacggcacca ucaccgacgc cguggacugc gcccuggacc cucugagcga gaccaagugc 960 acccugaaga gcuucaccgu ggagaagggc aucuaccaga ccagcaacuu ccgggugcag 1020 cccaccgaga gcaucgugcg guuccccaac aucaccaacc ugugccccuu cggcgaggug 1080 uucaacgcca cccgguucgc cagcguguac gccuggaacc ggaagcggau cagcaacugc 1140 guggccgacu acagcgugcu guacaacagc gccagcuuca gcaccuucaa gugcuacggc 1200 gugagcccca ccaagcugaa cgaccugugc uucaccaacg uguacgccga cagcuucgug 1260 auccguggcg acgaggugcg gcagaucgca cccggccaga caggcaagau cgccgacuac 1320 aacuacaagc ugcccgacga cuucaccggc ugcgugaucg ccuggaacag caacaaccuc 1380 gacagcaagg ugggcggcaa cuacaacuac cuguaccggc uguuccggaa gagcaaccug 1440 aagcccuucg agcgggacau cagcaccgag aucuaccaag ccggcuccac cccuugcaac 1500 ggcguggagg gcuucaacug cuacuucccu cugcagagcu acggcuucca gcccaccaac 1560 ggcgugggcu accagcccua ccggguggug gugcugagcu ucgagcugcu gcacgcccca 1620 gccaccgugu guggccccaa gaagagcacc aaccugguga agaacaagug cgugaacuuc 1680 aacuucaacg gccuuaccgg caccggcgug cugaccgaga gcaacaagaa auuccugccc 1740 uuucagcagu ucggccggga caucgccgac accaccgacg cugugcggga uccccagacc 1800 cuggagaucc uggacaucac cccuugcagc uucggcggcg ugagcgugau caccccaggc 1860 accaacacca gcaaccaggu ggccgugcug uaccaggacg ugaacugcac cgaggugccc 1920 guggccaucc acgccgacca gcugacaccc accuggcggg ucuacagcac cggcagcaac 1980 guguuccaga cccgggccgg uugccugauc ggcgccgagc acgugaacaa cagcuacgag 2040 ugcgacaucc ccaucggcgc cggcaucugu gccagcuacc agacccagac caauucaucu 2100 ggcggaggca gcauccuggc caucuacagc accguggcca gcagccuggu gcugcuggug 2160 agccugggcg ccaucagcuu cugauaauag gcuggagccu cgguggccua gcuucuugcc 2220 ccuugggccu ccccccagcc ccuccucccc uuccugcacc cguacccccg uggucuuuga 2280 auaaagucug agugggcggc 2300 <210> 16 <211> 2124 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 16 auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60 cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120 aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180 aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240 aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300 auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360 aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420 cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480 agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540 ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600 uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660 ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720 cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780 ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840 gagaacggca ccaucaccga cgccguggac ugcgcccugg acccucugag cgagaccaag 900 ugcacccuga agagcuucac cguggagaag ggcaucuacc agaccagcaa cuuccgggug 960 cagcccaccg agagcaucgu gcgguucccc aacaucacca accugugccc cuucggcgag 1020 guguucaacg ccacccgguu cgccagcgug uacgccugga accggaagcg gaucagcaac 1080 ugcguggccg acuacagcgu gcuguacaac agcgccagcu ucagcaccuu caagugcuac 1140 ggcgugagcc ccaccaagcu gaacgaccug ugcuucacca acguguacgc cgacagcuuc 1200 gugauccgug gcgacgaggu gcggcagauc gcacccggcc agacaggcaa gaucgccgac 1260 uacaacuaca agcugcccga cgacuucacc ggcugcguga ucgccuggaa cagcaacaac 1320 cucgacagca aggugggcgg caacuacaac uaccuguacc ggcuguuccg gaagagcaac 1380 cugaagcccu ucgagcggga caucagcacc gagaucuacc aagccggcuc caccccuugc 1440 aacggcgugg agggcuucaa cugcuacuuc ccucugcaga gcuacggcuu ccagcccacc 1500 aacggcgugg gcuaccagcc cuaccgggug guggugcuga gcuucgagcu gcugcacgcc 1560 ccagccaccg uguguggccc caagaagagc accaaccugg ugaagaacaa gugcgugaac 1620 uucaacuuca acggccuuac cggcaccggc gugcugaccg agagcaacaa gaaauuccug 1680 cccuuucagc aguucggccg ggacaucgcc gacaccaccg acgcugugcg ggauccccag 1740 acccuggaga uccuggacau caccccuugc agcuucggcg gcgugagcgu gaucacccca 1800 ggcaccaaca ccagcaacca gguggccgug cuguaccagg acgugaacug caccgaggug 1860 cccguggcca uccacgccga ccagcugaca cccaccuggc gggucuacag caccggcagc 1920 aacguguucc agacccgggc cgguugccug aucggcgccg agcacgugaa caacagcuac 1980 gagugcgaca uccccaucgg cgccggcauc ugugccagcu accagaccca gaccaauuca 2040 ucuggcggag gcagcauccu ggccaucuac agcaccgugg ccagcagccu ggugcugcug 2100 gugagccugg gcgccaucag cuuc 2124 <210> 17 <211> 707 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 17 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Gly Gly Gly Ser Ile Leu Ala Ile 675 680 685 Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val Ser Leu Gly Ala 690 695 700 Ile Ser Phe 705 <210> 18 <211> 1853 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 18 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120 acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180 guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240 gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300 cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360 cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420 aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480 ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540 agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600 aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660 aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720 gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780 cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840 gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900 aacggcacca ucaccgacgc cguggacugc gcccuggacc cucugagcga gaccaagugc 960 acccugaaga gcuucaccgu ggagaagggc aucuaccaga ccagcaacuu ccgggugcag 1020 cccaccgaga gcaucgugcg guuccccaac aucaccaacc ugugccccuu cggcgaggug 1080 uucaacgcca cccgguucgc cagcguguac gccuggaacc ggaagcggau cagcaacugc 1140 guggccgacu acagcgugcu guacaacagc gccagcuuca gcaccuucaa gugcuacggc 1200 gugagcccca ccaagcugaa cgaccugugc uucaccaacg uguacgccga cagcuucgug 1260 auccguggcg acgaggugcg gcagaucgca cccggccaga caggcaagau cgccgacuac 1320 aacuacaagc ugcccgacga cuucaccggc ugcgugaucg ccuggaacag caacaaccuc 1380 gacagcaagg ugggcggcaa cuacaacuac cuguaccggc uguuccggaa gagcaaccug 1440 aagcccuucg agcgggacau cagcaccgag aucuaccaag ccggcuccac cccuugcaac 1500 ggcguggagg gcuucaacug cuacuucccu cugcagagcu acggcuucca gcccaccaac 1560 ggcgugggcu accagcccua ccggguggug gugcugagcu ucgagcugcu gcacgcccca 1620 gccaccgugu guggccccaa gaagagcacc ucuggcggag gcagcauccu ggccaucuac 1680 agcaccgugg ccagcagccu ggugcugcug gugagccugg gcgccaucag cuucugauaa 1740 uaggcuggag ccucgguggc cuagcuucuu gccccuuggg ccucccccca gccccuccuc 1800 cccuuccugc acccguaccc ccguggucuu ugaauaaagu cugagugggc ggc 1853 <210> 19 <211> 1677 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 19 auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60 cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120 aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180 aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240 aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300 auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360 aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420 cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480 agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540 ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600 uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660 ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720 cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780 ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840 gagaacggca ccaucaccga cgccguggac ugcgcccugg acccucugag cgagaccaag 900 ugcacccuga agagcuucac cguggagaag ggcaucuacc agaccagcaa cuuccgggug 960 cagcccaccg agagcaucgu gcgguucccc aacaucacca accugugccc cuucggcgag 1020 guguucaacg ccacccgguu cgccagcgug uacgccugga accggaagcg gaucagcaac 1080 ugcguggccg acuacagcgu gcuguacaac agcgccagcu ucagcaccuu caagugcuac 1140 ggcgugagcc ccaccaagcu gaacgaccug ugcuucacca acguguacgc cgacagcuuc 1200 gugauccgug gcgacgaggu gcggcagauc gcacccggcc agacaggcaa gaucgccgac 1260 uacaacuaca agcugcccga cgacuucacc ggcugcguga ucgccuggaa cagcaacaac 1320 cucgacagca aggugggcgg caacuacaac uaccuguacc ggcuguuccg gaagagcaac 1380 cugaagcccu ucgagcggga caucagcacc gagaucuacc aagccggcuc caccccuugc 1440 aacggcgugg agggcuucaa cugcuacuuc ccucugcaga gcuacggcuu ccagcccacc 1500 aacggcgugg gcuaccagcc cuaccgggug guggugcuga gcuucgagcu gcugcacgcc 1560 ccagccaccg uguguggccc caagaagagc accucuggcg gaggcagcau ccuggccauc 1620 uacagcaccg uggccagcag ccuggugcug cuggugagcc ugggcgccau cagcuuc 1677 <210> 20 <211> 559 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 20 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Ser Gly Gly Gly Ser Ile Leu Ala Ile Tyr Ser Thr Val 530 535 540 Ala Ser Ser Leu Val Leu Leu Val Ser Leu Gly Ala Ile Ser Phe 545 550 555 <210> 21 <211> 2042 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 21 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120 acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180 guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240 gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300 cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360 cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420 aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480 ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540 agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600 aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660 aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720 gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780 cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840 gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900 aacggcacca ucaccgacgc cguggacugc gcccuggacc cucugagcga gaccaagugc 960 acccugaaga gcuucaccgu ggagaagggc aucuaccaga ccagcaacuu ccgggugcag 1020 cccaccgaga gcaucgugcg guuccccaac aucaccaacc ugugccccuu cggcgaggug 1080 uucaacgcca cccgguucgc cagcguguac gccuggaacc ggaagcggau cagcaacugc 1140 guggccgacu acagcgugcu guacaacagc gccagcuuca gcaccuucaa gugcuacggc 1200 gugagcccca ccaagcugaa cgaccugugc uucaccaacg uguacgccga cagcuucgug 1260 auccguggcg acgaggugcg gcagaucgca cccggccaga caggcaagau cgccgacuac 1320 aacuacaagc ugcccgacga cuucaccggc ugcgugaucg ccuggaacag caacaaccuc 1380 gacagcaagg ugggcggcaa cuacaacuac cuguaccggc uguuccggaa gagcaaccug 1440 aagcccuucg agcgggacau cagcaccgag aucuaccaag ccggcuccac cccuugcaac 1500 ggcguggagg gcuucaacug cuacuucccu cugcagagcu acggcuucca gcccaccaac 1560 ggcgugggcu accagcccua ccggguggug gugcugagcu ucgagcugcu gcacgcccca 1620 gccaccgugu guggccccaa gaagagcacc aaccugguga agaacaagug cgugaacuuc 1680 aacuucaacg gccuuaccgg caccggcgug cugaccgaga gcaacaagaa auuccugccc 1740 uuucagcagu ucggccggga caucgccgac accaccgacg cugugcggga uccccagacc 1800 cuggagaucc uggacaucac cccuugcagc uucggcggcu cuggcggagg cagcauccug 1860 gccaucuaca gcaccguggc cagcagccug gugcugcugg ugagccuggg cgccaucagc 1920 uucugauaau aggcuggagc cucgguggcc uagcuucuug ccccuugggc cuccccccag 1980 ccccuccucc ccuuccugca cccguacccc cguggucuuu gaauaaaguc ugagugggcg 2040 gc 2042 <210> 22 <211> 1866 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 22 auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60 cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120 aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180 aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240 aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300 auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360 aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420 cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480 agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540 ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600 uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660 ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720 cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780 ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840 gagaacggca ccaucaccga cgccguggac ugcgcccugg acccucugag cgagaccaag 900 ugcacccuga agagcuucac cguggagaag ggcaucuacc agaccagcaa cuuccgggug 960 cagcccaccg agagcaucgu gcgguucccc aacaucacca accugugccc cuucggcgag 1020 guguucaacg ccacccgguu cgccagcgug uacgccugga accggaagcg gaucagcaac 1080 ugcguggccg acuacagcgu gcuguacaac agcgccagcu ucagcaccuu caagugcuac 1140 ggcgugagcc ccaccaagcu gaacgaccug ugcuucacca acguguacgc cgacagcuuc 1200 gugauccgug gcgacgaggu gcggcagauc gcacccggcc agacaggcaa gaucgccgac 1260 uacaacuaca agcugcccga cgacuucacc ggcugcguga ucgccuggaa cagcaacaac 1320 cucgacagca aggugggcgg caacuacaac uaccuguacc ggcuguuccg gaagagcaac 1380 cugaagcccu ucgagcggga caucagcacc gagaucuacc aagccggcuc caccccuugc 1440 aacggcgugg agggcuucaa cugcuacuuc ccucugcaga gcuacggcuu ccagcccacc 1500 aacggcgugg gcuaccagcc cuaccgggug guggugcuga gcuucgagcu gcugcacgcc 1560 ccagccaccg uguguggccc caagaagagc accaaccugg ugaagaacaa gugcgugaac 1620 uucaacuuca acggccuuac cggcaccggc gugcugaccg agagcaacaa gaaauuccug 1680 cccuuucagc aguucggccg ggacaucgcc gacaccaccg acgcugugcg ggauccccag 1740 acccuggaga uccuggacau caccccuugc agcuucggcg gcucuggcgg aggcagcauc 1800 cuggccaucu acagcaccgu ggccagcagc cuggugcugc uggugagccu gggcgccauc 1860 agcuuc 1866 <210> 23 <211> 622 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 23 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Ser Gly Gly Gly Ser Ile Leu Ala Ile Tyr Ser Thr Val Ala 595 600 605 Ser Ser Leu Val Leu Leu Val Ser Leu Gly Ala Ile Ser Phe 610 615 620 <210> 24 <211> 2066 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 24 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120 acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180 guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240 gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300 cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360 cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420 aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480 ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540 agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600 aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660 aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720 gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780 cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840 gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900 aacggcacca ucaccgacgc cguggacugc gcccuggacc cucugagcga gaccaagugc 960 acccugaaga gcuucaccgu gggcagcggc ggcggcagcg gcggaggcag cggaggaggc 1020 agcggcggag gcaguggagg ccagcccacc gagagcaucg ugcgguuccc caacaucacc 1080 aaccugugcc ccuucggcga gguguucaac gccacccggu ucgccagcgu guacgccugg 1140 aaccggaagc ggaucagcaa cugcguggcc gacuacagcg ugcuguacaa cagcgccagc 1200 uucagcaccu ucaagugcua cggcgugagc cccaccaagc ugaacgaccu gugcuucacc 1260 aacguguacg ccgacagcuu cgugauccgu ggcgacgagg ugcggcagau cgcacccggc 1320 cagacaggca agaucgccga cuacaacuac aagcugcccg acgacuucac cggcugcgug 1380 aucgccugga acagcaacaa ccucgacagc aaggugggcg gcaacuacaa cuaccuguac 1440 cggcuguucc ggaagagcaa ccugaagccc uucgagcggg acaucagcac cgagaucuac 1500 caagccggcu ccaccccuug caacggcgug gagggcuuca acugcuacuu cccucugcag 1560 agcuacggcu uccagcccac caacggcgug ggcuaccagc ccuaccgggu gguggugcug 1620 agcuucgagc ugcugcacgc cccagccacc guguguggcc ccaagaagag caccaaccug 1680 gugaagaaca agugcgugaa cuucaacuuc aacggccuua ccggcaccgg cgugcugacc 1740 gagagcaaca agaaauuccu gcccuuucag caguucggcc gggacaucgc cgacaccacc 1800 gacgcugugc gggaucccca gacccuggag auccuggaca ucaccccuug cagcuucggc 1860 ggcucuggcg gaggcagcau ccuggccauc uacagcaccg uggccagcag ccuggugcug 1920 cuggugagcc ugggcgccau cagcuucuga uaauaggcug gagccucggu ggccuagcuu 1980 cuugccccuu gggccucccc ccagccccuc cuccccuucc ugcacccgua cccccguggu 2040 cuuugaauaa agucugagug ggcggc 2066 <210> 25 <211> 1890 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 25 auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60 cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120 aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180 aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240 aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300 auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360 aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420 cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480 agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540 ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600 uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660 ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720 cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780 ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840 gagaacggca ccaucaccga cgccguggac ugcgcccugg acccucugag cgagaccaag 900 ugcacccuga agagcuucac cgugggcagc ggcggcggca gcggcggagg cagcggagga 960 ggcagcggcg gaggcagugg aggccagccc accgagagca ucgugcgguu ccccaacauc 1020 accaaccugu gccccuucgg cgagguguuc aacgccaccc gguucgccag cguguacgcc 1080 uggaaccgga agcggaucag caacugcgug gccgacuaca gcgugcugua caacagcgcc 1140 agcuucagca ccuucaagug cuacggcgug agccccacca agcugaacga ccugugcuuc 1200 accaacgugu acgccgacag cuucgugauc cguggcgacg aggugcggca gaucgcaccc 1260 ggccagacag gcaagaucgc cgacuacaac uacaagcugc ccgacgacuu caccggcugc 1320 gugaucgccu ggaacagcaa caaccucgac agcaaggugg gcggcaacua caacuaccug 1380 uaccggcugu uccggaagag caaccugaag cccuucgagc gggacaucag caccgagauc 1440 uaccaagccg gcuccacccc uugcaacggc guggagggcu ucaacugcua cuucccucug 1500 cagagcuacg gcuuccagcc caccaacggc gugggcuacc agcccuaccg ggugguggug 1560 cugagcuucg agcugcugca cgccccagcc accgugugug gccccaagaa gagcaccaac 1620 cuggugaaga acaagugcgu gaacuucaac uucaacggcc uuaccggcac cggcgugcug 1680 accgagagca acaagaaauu ccugcccuuu cagcaguucg gccgggacau cgccgacacc 1740 accgacgcug ugcgggaucc ccagacccug gagauccugg acaucacccc uugcagcuuc 1800 ggcggcucug gcggaggcag cauccuggcc aucuacagca ccguggccag cagccuggug 1860 cugcugguga gccugggcgc caucagcuuc 1890 <210> 26 <211> 630 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 26 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly 305 310 315 320 Gly Ser Gly Gly Gly Ser Gly Gly Gln Pro Thr Glu Ser Ile Val Arg 325 330 335 Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala 340 345 350 Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn 355 360 365 Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr 370 375 380 Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe 385 390 395 400 Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg 405 410 415 Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys 420 425 430 Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn 435 440 445 Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe 450 455 460 Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile 465 470 475 480 Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys 485 490 495 Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly 500 505 510 Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala 515 520 525 Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn 530 535 540 Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu 545 550 555 560 Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp 565 570 575 Ile Ala Asp Thr Thr Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile 580 585 590 Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Ser Gly Gly Gly Ser Ile 595 600 605 Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val Ser 610 615 620 Leu Gly Ala Ile Ser Phe 625 630 <210> 27 <211> 2066 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 27 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120 acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180 gugugccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240 gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300 cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360 cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420 aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480 ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540 agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600 aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660 aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720 gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780 cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840 gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900 aacggcacca ucaccgacgc cguggacugc gcccuggacc cucugagcga gaccaagugc 960 acccugaaga gcuucaccgu gggcagcggc ggcggcagcg gcggaggcag cggaggaggc 1020 agcggcggag gcaguggagg ccagcccacc gagagcaucg ugcgguuccc caacaucacc 1080 aaccugugcc ccuucggcga gguguucaac gccacccggu ucgccagcgu guacgccugg 1140 aaccggaagc ggaucagcaa cugcguggcc gacuacagcg ugcuguacaa cagcgccagc 1200 uucagcaccu ucaagugcua cggcgugagc cccaccaagc ugaacgaccu gugcuucacc 1260 aacguguacg ccgacagcuu cgugauccgu ggcgacgagg ugcggcagau cgcacccggc 1320 cagacaggca agaucgccga cuacaacuac aagcugcccg acgacuucac cggcugcgug 1380 aucgccugga acagcaacaa ccucgacagc aaggugggcg gcaacuacaa cuaccuguac 1440 cggcuguucc ggaagagcaa ccugaagccc uucgagcggg acaucagcac cgagaucuac 1500 caagccggcu ccaccccuug caacggcgug gagggcuuca acugcuacuu cccucugcag 1560 agcuacggcu uccagcccac caacggcgug ggcuaccagc ccuaccgggu gguggugcug 1620 agcuucgagc ugcugcacgc cccagccacc guguguggcc ccaagaagag caccaaccug 1680 gugaagaaca agugcgugaa cuucaacuuc aacggccuua ccggcaccgg cgugcugacc 1740 gagagcaaca agaaauuccu gcccuuuugc caguucggcc gggacaucgc cgacaccacc 1800 gacgcugugc gggaucccca gacccuggag auccuggaca ucaccccuug cagcuucggc 1860 ggcucuggcg gaggcagcau ccuggccauc uacagcaccg uggccagcag ccuggugcug 1920 cuggugagcc ugggcgccau cagcuucuga uaauaggcug gagccucggu ggccuagcuu 1980 cuugccccuu gggccucccc ccagccccuc cuccccuucc ugcacccgua cccccguggu 2040 cuuugaauaa agucugagug ggcggc 2066 <210> 28 <211> 1890 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 28 auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60 cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120 aaggugugcc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180 aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240 aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300 auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360 aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420 cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480 agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540 ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600 uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660 ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720 cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780 ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840 gagaacggca ccaucaccga cgccguggac ugcgcccugg acccucugag cgagaccaag 900 ugcacccuga agagcuucac cgugggcagc ggcggcggca gcggcggagg cagcggagga 960 ggcagcggcg gaggcagugg aggccagccc accgagagca ucgugcgguu ccccaacauc 1020 accaaccugu gccccuucgg cgagguguuc aacgccaccc gguucgccag cguguacgcc 1080 uggaaccgga agcggaucag caacugcgug gccgacuaca gcgugcugua caacagcgcc 1140 agcuucagca ccuucaagug cuacggcgug agccccacca agcugaacga ccugugcuuc 1200 accaacgugu acgccgacag cuucgugauc cguggcgacg aggugcggca gaucgcaccc 1260 ggccagacag gcaagaucgc cgacuacaac uacaagcugc ccgacgacuu caccggcugc 1320 gugaucgccu ggaacagcaa caaccucgac agcaaggugg gcggcaacua caacuaccug 1380 uaccggcugu uccggaagag caaccugaag cccuucgagc gggacaucag caccgagauc 1440 uaccaagccg gcuccacccc uugcaacggc guggagggcu ucaacugcua cuucccucug 1500 cagagcuacg gcuuccagcc caccaacggc gugggcuacc agcccuaccg ggugguggug 1560 cugagcuucg agcugcugca cgccccagcc accgugugug gccccaagaa gagcaccaac 1620 cuggugaaga acaagugcgu gaacuucaac uucaacggcc uuaccggcac cggcgugcug 1680 accgagagca acaagaaauu ccugcccuuu ugccaguucg gccgggacau cgccgacacc 1740 accgacgcug ugcgggaucc ccagacccug gagauccugg acaucacccc uugcagcuuc 1800 ggcggcucug gcggaggcag cauccuggcc aucuacagca ccguggccag cagccuggug 1860 cugcugguga gccugggcgc caucagcuuc 1890 <210> 29 <211> 630 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 29 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Cys Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly 305 310 315 320 Gly Ser Gly Gly Gly Ser Gly Gly Gln Pro Thr Glu Ser Ile Val Arg 325 330 335 Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala 340 345 350 Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn 355 360 365 Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr 370 375 380 Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe 385 390 395 400 Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg 405 410 415 Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys 420 425 430 Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn 435 440 445 Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe 450 455 460 Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile 465 470 475 480 Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys 485 490 495 Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly 500 505 510 Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala 515 520 525 Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn 530 535 540 Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu 545 550 555 560 Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Cys Gln Phe Gly Arg Asp 565 570 575 Ile Ala Asp Thr Thr Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile 580 585 590 Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Ser Gly Gly Gly Ser Ile 595 600 605 Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val Ser 610 615 620 Leu Gly Ala Ile Ser Phe 625 630 <210> 30 <211> 3182 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 30 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120 acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180 guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240 gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300 cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360 cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420 aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480 ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540 agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600 aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660 aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720 gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780 cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840 gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900 aacggcacca ucaccgacgc cguggacugc gcccuggacc cucugagcga gaccaagugc 960 acccugaaga gcuucaccgu ggagaagggc aucuaccaga ccagcaacuu cggcggcagc 1020 ggcggcguga gcgugaucac cccaggcacc aacaccagca accagguggc cgugcuguac 1080 caggacguga acugcaccga ggugcccgug gccauccacg ccgaccagcu gacacccacc 1140 uggcgggucu acagcaccgg cagcaacgug uuccagaccc gggccgguug ccugaucggc 1200 gccgagcacg ugaacaacag cuacgagugc gacaucccca ucggcgccgg caucugugcc 1260 agcuaccaga cccagaccaa uucaccccgg agggcaagga gcguggccag ccagagcauc 1320 aucgccuaca ccaugagccu gggcgccgag aacagcgugg ccuacagcaa caacagcauc 1380 gccaucccca ccaacuucac caucagcgug accaccgaga uucugcccgu gagcaugacc 1440 aagaccagcg uggacugcac cauguacauc ugcggcgaca gcaccgagug cagcaaccug 1500 cugcugcagu acggcagcuu cugcacccag cugaaccggg cccugaccgg caucgccgug 1560 gagcaggaca agaacaccca ggagguguuc gcccagguga agcagaucua caagaccccu 1620 cccaucaagg acuucggcgg cuucaacuuc agccagaucc ugcccgaccc cagcaagccc 1680 agcaagcgga gcuucaucga ggaccugcug uucaacaagg ugacccuagc cgacgccggc 1740 uucaucaagc aguacggcga cugccucggc gacauagccg cccgggaccu gaucugcgcc 1800 cagaaguuca acggccugac cgugcugccu ccccugcuga ccgacgagau gaucgcccag 1860 uacaccagcg cccuguuagc cggaaccauc accagcggcu ggacuuucgg cgcuggagcc 1920 gcucugcaga uccccuucgc caugcagaug gccuaccggu ucaacggcau cggcgugacc 1980 cagaacgugc uguacgagaa ccagaagcug aucgccaacc aguucaacag cgccaucggc 2040 aagauccagg acagccugag cagcaccgcu agcgcccugg gcaagcugca ggacguggug 2100 aaccagaacg cccaggcccu gaacacccug gugaagcagc ugagcagcaa cuucggcgcc 2160 aucagcagcg ugcugaacga cauccugagc cggcuggacc cucccaacgc caccgugcag 2220 aucgaccggc ugaucacugg ccggcugcag agccugcaga ccuacgugac ccagcagcug 2280 auccgggccg ccgagauucg ggccagcgcc aaccuggccg ccaccaagau gagcgagugc 2340 gugcugggcc agagcaagcg gguggacuuc ugcggcaagg gcuaccaccu gaugagcuuu 2400 ccccagagcg caccccacgg agugguguuc cugcacguga ccuacgugcc cgcccaggag 2460 aagaacuuca ccaccgcccc agccaucugc cacgacggca aggcccacuu uccccgggag 2520 ggcguguucg ugagcaacgg cacccacugg uucgugaccc agcggaacuu cuacgagccc 2580 cagaucauca ccaccgacaa caccuucgug agcggcaacu gcgacguggu gaucggcauc 2640 gugaacaaca ccguguacga uccccugcag cccgagcugg acagcuucaa ggaggagcug 2700 gacaaguacu ucaagaauca caccagcccc gacguggacc ugggcgacau cagcggcauc 2760 aacgccagcg uggugaacau ccagaaggag aucgaucggc ugaacgaggu ggccaagaac 2820 cugaacgaga gccugaucga ccugcaggag cugggcaagu acgagcagua caucaagugg 2880 cccugguaca ucuggcuggg cuucaucgcc ggccugaucg ccaucgugau ggugaccauc 2940 augcugugcu gcaugaccag cugcugcagc ugccugaagg gcuguugcag cugcggcagc 3000 ugcugcaagu ucgacgagga cgacagcgag cccgugcuga agggcgugaa gcugcacuac 3060 accugauaau aggcuggagc cucgguggcc uagcuucuug ccccuugggc cuccccccag 3120 ccccuccucc ccuuccugca cccguacccc cguggucuuu gaauaaaguc ugagugggcg 3180 gc 3182 <210> 31 <211> 3006 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 31 auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60 cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120 aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180 aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240 aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300 auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360 aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420 cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480 agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540 ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600 uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660 ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720 cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780 ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840 gagaacggca ccaucaccga cgccguggac ugcgcccugg acccucugag cgagaccaag 900 ugcacccuga agagcuucac cguggagaag ggcaucuacc agaccagcaa cuucggcggc 960 agcggcggcg ugagcgugau caccccaggc accaacacca gcaaccaggu ggccgugcug 1020 uaccaggacg ugaacugcac cgaggugccc guggccaucc acgccgacca gcugacaccc 1080 accuggcggg ucuacagcac cggcagcaac guguuccaga cccgggccgg uugccugauc 1140 ggcgccgagc acgugaacaa cagcuacgag ugcgacaucc ccaucggcgc cggcaucugu 1200 gccagcuacc agacccagac caauucaccc cggagggcaa ggagcguggc cagccagagc 1260 aucaucgccu acaccaugag ccugggcgcc gagaacagcg uggccuacag caacaacagc 1320 aucgccaucc ccaccaacuu caccaucagc gugaccaccg agauucugcc cgugagcaug 1380 accaagacca gcguggacug caccauguac aucugcggcg acagcaccga gugcagcaac 1440 cugcugcugc aguacggcag cuucugcacc cagcugaacc gggcccugac cggcaucgcc 1500 guggagcagg acaagaacac ccaggaggug uucgcccagg ugaagcagau cuacaagacc 1560 ccucccauca aggacuucgg cggcuucaac uucagccaga uccugcccga ccccagcaag 1620 cccagcaagc ggagcuucau cgaggaccug cuguucaaca aggugacccu agccgacgcc 1680 ggcuucauca agcaguacgg cgacugccuc ggcgacauag ccgcccggga ccugaucugc 1740 gcccagaagu ucaacggccu gaccgugcug ccuccccugc ugaccgacga gaugaucgcc 1800 caguacacca gcgcccuguu agccggaacc aucaccagcg gcuggacuuu cggcgcugga 1860 gccgcucugc agauccccuu cgccaugcag auggccuacc gguucaacgg caucggcgug 1920 acccagaacg ugcuguacga gaaccagaag cugaucgcca accaguucaa cagcgccauc 1980 ggcaagaucc aggacagccu gagcagcacc gcuagcgccc ugggcaagcu gcaggacgug 2040 gugaaccaga acgcccaggc ccugaacacc cuggugaagc agcugagcag caacuucggc 2100 gccaucagca gcgugcugaa cgacauccug agccggcugg acccucccaa cgccaccgug 2160 cagaucgacc ggcugaucac uggccggcug cagagccugc agaccuacgu gacccagcag 2220 cugauccggg ccgccgagau ucgggccagc gccaaccugg ccgccaccaa gaugagcgag 2280 ugcgugcugg gccagagcaa gcggguggac uucugcggca agggcuacca ccugaugagc 2340 uuuccccaga gcgcacccca cggaguggug uuccugcacg ugaccuacgu gcccgcccag 2400 gagaagaacu ucaccaccgc cccagccauc ugccacgacg gcaaggccca cuuuccccgg 2460 gagggcgugu ucgugagcaa cggcacccac ugguucguga cccagcggaa cuucuacgag 2520 ccccagauca ucaccaccga caacaccuuc gugagcggca acugcgacgu ggugaucggc 2580 aucgugaaca acaccgugua cgauccccug cagcccgagc uggacagcuu caaggaggag 2640 cuggacaagu acuucaagaa ucacaccagc cccgacgugg accugggcga caucagcggc 2700 aucaacgcca gcguggugaa cauccagaag gagaucgauc ggcugaacga gguggccaag 2760 aaccugaacg agagccugau cgaccugcag gagcugggca aguacgagca guacaucaag 2820 uggcccuggu acaucuggcu gggcuucauc gccggccuga ucgccaucgu gauggugacc 2880 aucaugcugu gcugcaugac cagcugcugc agcugccuga agggcuguug cagcugcggc 2940 agcugcugca aguucgacga ggacgacagc gagcccgugc ugaagggcgu gaagcugcac 3000 uacacc 3006 <210> 32 <211> 1002 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 32 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Gly Gly 305 310 315 320 Ser Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln 325 330 335 Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala 340 345 350 Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly 355 360 365 Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His 370 375 380 Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys 385 390 395 400 Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val 405 410 415 Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn 420 425 430 Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr 435 440 445 Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser 450 455 460 Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn 465 470 475 480 Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu 485 490 495 Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala 500 505 510 Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly 515 520 525 Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg 530 535 540 Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala 545 550 555 560 Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg 565 570 575 Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro 580 585 590 Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala 595 600 605 Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln 610 615 620 Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val 625 630 635 640 Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe 645 650 655 Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser 660 665 670 Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu 675 680 685 Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser 690 695 700 Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Asn Ala Thr Val 705 710 715 720 Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr 725 730 735 Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 740 745 750 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg 755 760 765 Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser 770 775 780 Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln 785 790 795 800 Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala 805 810 815 His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe 820 825 830 Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn 835 840 845 Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn 850 855 860 Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu 865 870 875 880 Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly 885 890 895 Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile 900 905 910 Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp 915 920 925 Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr 930 935 940 Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr 945 950 955 960 Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys 965 970 975 Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro 980 985 990 Val Leu Lys Gly Val Lys Leu His Tyr Thr 995 1000 <210> 33 <211> 2378 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 33 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uucguguucc uggugcugcu gccccuggug agcagccagg gcaccaucac cgacgccgug 120 gacugcgccc uggacccucu gagcgagacc aagugcaccc ugaagagcuu caccguggag 180 aagggcaucu accagaccag caacuucggc ggcagcggcg gcgugagcgu gaucacccca 240 ggcaccaaca ccagcaacca gguggccgug cuguaccagg acgugaacug caccgaggug 300 cccguggcca uccacgccga ccagcugaca cccaccuggc gggucuacag caccggcagc 360 aacguguucc agacccgggc cgguugccug aucggcgccg agcacgugaa caacagcuac 420 gagugcgaca uccccaucgg cgccggcauc ugugccagcu accagaccca gaccaauuca 480 ccccggaggg caaggagcgu ggccagccag agcaucaucg ccuacaccau gagccugggc 540 gccgagaaca gcguggccua cagcaacaac agcaucgcca uccccaccaa cuucaccauc 600 agcgugacca ccgagauucu gcccgugagc augaccaaga ccagcgugga cugcaccaug 660 uacaucugcg gcgacagcac cgagugcagc aaccugcugc ugaacuacac cagcuucugc 720 acccagcuga accgggcccu gaccggcauc gccguggagc aggacaagaa cacccaggag 780 guguucgccc aggugaagca gaucuacaag accccuccca ucaaggacuu cggcggcuuc 840 aacuucagcc agauccugcc cgaccccagc aagcccagca agcggagcuu caucgaggac 900 cugcuguuca acaaggugac ccuagccgac gccggcuuca ucaagcagua cggcgacugc 960 cucggcgaca uagccgcccg ggaccugauc ugcgcccaga aguucaacgg ccugaccgug 1020 cugccucccc ugcugaccga cgagaugauc gcccaguaca ccagcgcccu guuagccgga 1080 accaucacca gcggcuggac uuucggcgcu ggagccgcuc ugcagauccc cuucgccaug 1140 cagauggccu accgguucaa cggcaucggc gugacccaga acgugcugua cgagaaccag 1200 aagcugaucg ccaaccaguu caacagcgcc aucggcaaga uccaggacag ccugagcagc 1260 accgcuagcg cccugggcaa gcugcaggac guggugaacc agaacgccca ggcccugaac 1320 acccugguga agcagcugag cagcaacuuc ggcgccauca gcagcgugcu gaacgacauc 1380 cugagccggc uggacccucc caacgccacc gugcagaucg accggcugau cacuggccgg 1440 cugcagagcc ugcagaccua cgugacccag cagcugaucc gggccgccga gauucgggcc 1500 agcgccaacc uggccgccac caagaugagc gagugcgugc ugggccagag caagcgggug 1560 gacuucugcg gcaagggcua ccaccugaug agcuuucccc agagcgcacc ccacggagug 1620 guguuccugc acgugaccua cgugcccgcc caggagaaga acuucaccac cgccccagcc 1680 aucugccacg acggcaaggc ccacuuuccc cgggagggcg uguucgugag caacggcacc 1740 cacugguucg ugacccagcg gaacuucuac gagccccaga ucaucaccac cgacaacacc 1800 uucgugagcg gcaacugcga cguggugauc ggcaucguga acaacaccgu guacgauccc 1860 cugcagcccg agcuggacag cuucaaggag gagcuggaca aguacuucaa gaaucacacc 1920 agccccgacg uggaccuggg cgacaucagc ggcaucaacg ccagcguggu gaacauccag 1980 aaggagaucg aucggcugaa cgagguggcc aagaaccuga acgagagccu gaucgaccug 2040 caggagcugg gcaaguacga gcaguacauc aaguggcccu gguacaucug gcugggcuuc 2100 aucgccggcc ugaucgccau cgugauggug accaucaugc ugugcugcau gaccagcugc 2160 ugcagcugcc ugaagggcug uugcagcugc ggcagcugcu gcaaguucga cgaggacgac 2220 agcgagcccg ugcugaaggg cgugaagcug cacuacaccu gauaauaggc uggagccucg 2280 guggccuagc uucuugcccc uugggccucc ccccagcccc uccuccccuu ccugcacccg 2340 uacccccgug gucuuugaau aaagucugag ugggcggc 2378 <210> 34 <211> 2202 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 34 auguucgugu uccuggugcu gcugccccug gugagcagcc agggcaccau caccgacgcc 60 guggacugcg cccuggaccc ucugagcgag accaagugca cccugaagag cuucaccgug 120 gagaagggca ucuaccagac cagcaacuuc ggcggcagcg gcggcgugag cgugaucacc 180 ccaggcacca acaccagcaa ccagguggcc gugcuguacc aggacgugaa cugcaccgag 240 gugcccgugg ccauccacgc cgaccagcug acacccaccu ggcgggucua cagcaccggc 300 agcaacgugu uccagacccg ggccgguugc cugaucggcg ccgagcacgu gaacaacagc 360 uacgagugcg acauccccau cggcgccggc aucugugcca gcuaccagac ccagaccaau 420 ucaccccgga gggcaaggag cguggccagc cagagcauca ucgccuacac caugagccug 480 ggcgccgaga acagcguggc cuacagcaac aacagcaucg ccauccccac caacuucacc 540 aucagcguga ccaccgagau ucugcccgug agcaugacca agaccagcgu ggacugcacc 600 auguacaucu gcggcgacag caccgagugc agcaaccugc ugcugaacua caccagcuuc 660 ugcacccagc ugaaccgggc ccugaccggc aucgccgugg agcaggacaa gaacacccag 720 gagguguucg cccaggugaa gcagaucuac aagaccccuc ccaucaagga cuucggcggc 780 uucaacuuca gccagauccu gcccgacccc agcaagccca gcaagcggag cuucaucgag 840 gaccugcugu ucaacaaggu gacccuagcc gacgccggcu ucaucaagca guacggcgac 900 ugccucggcg acauagccgc ccgggaccug aucugcgccc agaaguucaa cggccugacc 960 gugcugccuc cccugcugac cgacgagaug aucgcccagu acaccagcgc ccuguuagcc 1020 ggaaccauca ccagcggcug gacuuucggc gcuggagccg cucugcagau ccccuucgcc 1080 augcagaugg ccuaccgguu caacggcauc ggcgugaccc agaacgugcu guacgagaac 1140 cagaagcuga ucgccaacca guucaacagc gccaucggca agauccagga cagccugagc 1200 agcaccgcua gcgcccuggg caagcugcag gacgugguga accagaacgc ccaggcccug 1260 aacacccugg ugaagcagcu gagcagcaac uucggcgcca ucagcagcgu gcugaacgac 1320 auccugagcc ggcuggaccc ucccaacgcc accgugcaga ucgaccggcu gaucacuggc 1380 cggcugcaga gccugcagac cuacgugacc cagcagcuga uccgggccgc cgagauucgg 1440 gccagcgcca accuggccgc caccaagaug agcgagugcg ugcugggcca gagcaagcgg 1500 guggacuucu gcggcaaggg cuaccaccug augagcuuuc cccagagcgc accccacgga 1560 gugguguucc ugcacgugac cuacgugccc gcccaggaga agaacuucac caccgcccca 1620 gccaucugcc acgacggcaa ggcccacuuu ccccgggagg gcguguucgu gagcaacggc 1680 acccacuggu ucgugaccca gcggaacuuc uacgagcccc agaucaucac caccgacaac 1740 accuucguga gcggcaacug cgacguggug aucggcaucg ugaacaacac cguguacgau 1800 ccccugcagc ccgagcugga cagcuucaag gaggagcugg acaaguacuu caagaaucac 1860 accagccccg acguggaccu gggcgacauc agcggcauca acgccagcgu ggugaacauc 1920 cagaaggaga ucgaucggcu gaacgaggug gccaagaacc ugaacgagag ccugaucgac 1980 cugcaggagc ugggcaagua cgagcaguac aucaaguggc ccugguacau cuggcugggc 2040 uucaucgccg gccugaucgc caucgugaug gugaccauca ugcugugcug caugaccagc 2100 ugcugcagcu gccugaaggg cuguugcagc ugcggcagcu gcugcaaguu cgacgaggac 2160 gacagcgagc ccgugcugaa gggcgugaag cugcacuaca cc 2202 <210> 35 <211> 734 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 35 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Gly Thr 1 5 10 15 Ile Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys 20 25 30 Cys Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser 35 40 45 Asn Phe Gly Gly Ser Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn 50 55 60 Thr Ser Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu 65 70 75 80 Val Pro Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val 85 90 95 Tyr Ser Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile 100 105 110 Gly Ala Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly 115 120 125 Ala Gly Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg 130 135 140 Ala Arg Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu 145 150 155 160 Gly Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro 165 170 175 Thr Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met 180 185 190 Thr Lys Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr 195 200 205 Glu Cys Ser Asn Leu Leu Leu Asn Tyr Thr Ser Phe Cys Thr Gln Leu 210 215 220 Asn Arg Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln 225 230 235 240 Glu Val Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys 245 250 255 Asp Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys 260 265 270 Pro Ser Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr 275 280 285 Leu Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp 290 295 300 Ile Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr 305 310 315 320 Val Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser 325 330 335 Ala Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly 340 345 350 Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn 355 360 365 Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile 370 375 380 Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser 385 390 395 400 Ser Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn 405 410 415 Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly 420 425 430 Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro 435 440 445 Asn Ala Thr Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser 450 455 460 Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg 465 470 475 480 Ala Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly 485 490 495 Gln Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser 500 505 510 Phe Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr 515 520 525 Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 530 535 540 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly 545 550 555 560 Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile 565 570 575 Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly 580 585 590 Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser 595 600 605 Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp 610 615 620 Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile 625 630 635 640 Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu 645 650 655 Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys 660 665 670 Trp Pro Trp Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile 675 680 685 Val Met Val Thr Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys 690 695 700 Leu Lys Gly Cys Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp 705 710 715 720 Asp Ser Glu Pro Val Leu Lys Gly Val Lys Leu His Tyr Thr 725 730 <210> 36 <211> 4241 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 36 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uuccugauca ucuucauccu gcccaccacc cuggccguga ucggcgacuu caacugcacc 120 aacagcuuca ucaacgacua caacaagacc aucccucgga ucagcgaaga cgugguggac 180 gugucccugg gccugggcac cuacuacgug cugaaccggg uguaccugaa caccacacug 240 cuguucaccg gcuacuuccc caagagcggc gccaacuucc gggaccuggc ccugaagggc 300 agcaucuacc ugagcaccuu gugguacaag ccucccuucc ugagcgacuu caauaacggc 360 aucuucucua aggugaagaa caccaagcug uacguaaaca acacccugua cagcgaguuc 420 agcaccaucg ugaucggcag cguguucguc aacaccagcu acaccaucgu ggugcagccc 480 cacaacggca uccuggagau caccgccugc caguacacca ugugcgagua cccucacacc 540 gugugcaaga gcaagggcuc cauccggaac gagagcuggc acaucgacag cagcgagccg 600 cugugccugu ucaagaagaa cuucaccuac aacgugagcg ccgacuggcu guacuuccac 660 uucuaccagg agcggggcgu guucuacgcc uacuacgccg acgugggcau gccaaccacc 720 uuccuguuca gccuguaccu gggcaccauc cugagccacu acuacgugau gccccugacc 780 ugcaacgcca ucagcucaaa caccgacaac gagacccugg aguacugggu gacuccacug 840 agccggcggc aguaccugcu gaacuucgac gagcacggcg ugaucaccaa cgccguggac 900 ugcgcccugg acccucugag cgagaccaag ugcacccuga agagcuucac cguggagaag 960 ggcaucuacc agaccagcgg cuucaccgug aagcccguag ccaccgugua ccggcggauc 1020 cccaaccugc ccgacugcga caucgacaac uggcugaaca acgucagcgu gcccagccca 1080 cugaacuggg agcggcggau cuucagcaac ugcaacuuca aucugagcac ccugcugcgg 1140 cuggugcacg uggacagcuu cagcugcaac aaccuggaca agagcaagau cuucgguagc 1200 ugcuucaaca gcaucaccgu ggacaaguuc gccaucccua accggcggcg ggacgaucug 1260 cagcugggca gcagcggcuu ccugcagagc agcaacuaca agaucgacau cagcagcuca 1320 agcugccagc uguacuacag ccugccccug gugaacguga ccaucaacaa cuucaacccc 1380 agcagcugga accggcggua cggcuucggc agcuucaacc ugagcagcua cgacguggug 1440 uacagcgacc acugcuucag cgugaacagc gacuucugcc ccugugccga cccuagcgug 1500 gugaacagcu gcgccaagag caagccuccc agcgccauuu gccccgccgg caccaaguac 1560 cggcacugcg accuggacac cacccuguac gugaagaacu ggugccggug cagcugccug 1620 cccgacccca ucagcaccua cagccccaac accugucccc agaagaaggu gguggugggu 1680 aucggcgagc acugucccgg ccugggcauc aacgaggaga agugcggcac ccagcugaac 1740 cacagcagcu gcuucuguag ccccgacgcc uuccugggcu ggagcuucga cagcugcauc 1800 agcaacaacc ggugcaacau cuuuagcaac uucaucuuca acggaaucaa cagcggcacc 1860 accugcagca acgaccugcu guauagcaac accgagauca gcaccggcgu gugcgugaac 1920 uacgaccugu acggcaucac cggccagggc aucuucaagg aggugagcgc cgccuacuac 1980 aacaacuggc agaaccugcu guacgacagc aacggcaaca ucaucggcuu caaggacuuu 2040 cugaccaaca agaccuacac cauccugccc ugcuacagcg gcggcgugag cgugaucacc 2100 ccaggcacca acaccagcaa ccagguggcc gugcuguacc aggacgugaa cugcaccgag 2160 gugcccgugg ccauccacgc cgaccagcug acacccaccu ggcgggucua cagcaccggc 2220 agcaacgugu uccagacccg ggccgguugc cugaucggcg ccgagcacgu gaacaacagc 2280 uacgagugcg acauccccau cggcgccggc aucugugcca gcuaccagac ccagaccaau 2340 ucaccccgga gggcaaggag cguggccagc cagagcauca ucgccuacac caugagccug 2400 ggcgccgaga acagcguggc cuacagcaac aacagcaucg ccauccccac caacuucacc 2460 aucagcguga ccaccgagau ucugcccgug agcaugacca agaccagcgu ggacugcacc 2520 auguacaucu gcggcgacag caccgagugc agcaaccugc ugcugcagua cggcagcuuc 2580 ugcacccagc ugaaccgggc ccugaccggc aucgccgugg agcaggacaa gaacacccag 2640 gagguguucg cccaggugaa gcagaucuac aagaccccuc ccaucaagga cuucggcggc 2700 uucaacuuca gccagauccu gcccgacccc agcaagccca gcaagcggag cuucaucgag 2760 gaccugcugu ucaacaaggu gacccuagcc gacgccggcu ucaucaagca guacggcgac 2820 ugccucggcg acauagccgc ccgggaccug aucugcgccc agaaguucaa cggccugacc 2880 gugcugccuc cccugcugac cgacgagaug aucgcccagu acaccagcgc ccuguuagcc 2940 ggaaccauca ccagcggcug gacuuucggc gcuggagccg cucugcagau ccccuucgcc 3000 augcagaugg ccuaccgguu caacggcauc ggcgugaccc agaacgugcu guacgagaac 3060 cagaagcuga ucgccaacca guucaacagc gccaucggca agauccagga cagccugagc 3120 agcaccgcua gcgcccuggg caagcugcag gacgugguga accagaacgc ccaggcccug 3180 aacacccugg ugaagcagcu gagcagcaac uucggcgcca ucagcagcgu gcugaacgac 3240 auccugagcc ggcuggaccc ucccgaggcc gaggugcaga ucgaccggcu gaucacuggc 3300 cggcugcaga gccugcagac cuacgugacc cagcagcuga uccgggccgc cgagauucgg 3360 gccagcgcca accuggccgc caccaagaug agcgagugcg ugcugggcca gagcaagcgg 3420 guggacuucu gcggcaaggg cuaccaccug augagcuuuc cccagagcgc accccacgga 3480 gugguguucc ugcacgugac cuacgugccc gcccaggaga agaacuucac caccgcccca 3540 gccaucugcc acgacggcaa ggcccacuuu ccccgggagg gcguguucgu gagcaacggc 3600 acccacuggu ucgugaccca gcggaacuuc uacgagcccc agaucaucac caccgacaac 3660 accuucguga gcggcaacug cgacguggug aucggcaucg ugaacaacac cguguacgau 3720 ccccugcagc ccgagcugga cagcuucaag gaggagcugg acaaguacuu caagaaucac 3780 accagccccg acguggaccu gggcgacauc agcggcauca acgccagcgu ggugaacauc 3840 cagaaggaga ucgaucggcu gaacgaggug gccaagaacc ugaacgagag ccugaucgac 3900 cugcaggagc ugggcaagua cgagcaguac aucaaguggc ccugguacau cuggcugggc 3960 uucaucgccg gccugaucgc caucgugaug gugaccauca ugcugugcug caugaccagc 4020 ugcugcagcu gccugaaggg cuguugcagc ugcggcagcu gcugcaaguu cgacgaggac 4080 gacagcgagc ccgugcugaa gggcgugaag cugcacuaca ccugauaaua ggcuggagcc 4140 ucgguggccu agcuucuugc cccuugggcc uccccccagc cccuccuccc cuuccugcac 4200 ccguaccccc guggucuuug aauaaagucu gagugggcgg c 4241 <210> 37 <211> 4065 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 37 auguuccuga ucaucuucau ccugcccacc acccuggccg ugaucggcga cuucaacugc 60 accaacagcu ucaucaacga cuacaacaag accaucccuc ggaucagcga agacguggug 120 gacguguccc ugggccuggg caccuacuac gugcugaacc ggguguaccu gaacaccaca 180 cugcuguuca ccggcuacuu ccccaagagc ggcgccaacu uccgggaccu ggcccugaag 240 ggcagcaucu accugagcac cuugugguac aagccucccu uccugagcga cuucaauaac 300 ggcaucuucu cuaaggugaa gaacaccaag cuguacguaa acaacacccu guacagcgag 360 uucagcacca ucgugaucgg cagcguguuc gucaacacca gcuacaccau cguggugcag 420 ccccacaacg gcauccugga gaucaccgcc ugccaguaca ccaugugcga guacccucac 480 accgugugca agagcaaggg cuccauccgg aacgagagcu ggcacaucga cagcagcgag 540 ccgcugugcc uguucaagaa gaacuucacc uacaacguga gcgccgacug gcuguacuuc 600 cacuucuacc aggagcgggg cguguucuac gccuacuacg ccgacguggg caugccaacc 660 accuuccugu ucagccugua ccugggcacc auccugagcc acuacuacgu gaugccccug 720 accugcaacg ccaucagcuc aaacaccgac aacgagaccc uggaguacug ggugacucca 780 cugagccggc ggcaguaccu gcugaacuuc gacgagcacg gcgugaucac caacgccgug 840 gacugcgccc uggacccucu gagcgagacc aagugcaccc ugaagagcuu caccguggag 900 aagggcaucu accagaccag cggcuucacc gugaagcccg uagccaccgu guaccggcgg 960 auccccaacc ugcccgacug cgacaucgac aacuggcuga acaacgucag cgugcccagc 1020 ccacugaacu gggagcggcg gaucuucagc aacugcaacu ucaaucugag cacccugcug 1080 cggcuggugc acguggacag cuucagcugc aacaaccugg acaagagcaa gaucuucggu 1140 agcugcuuca acagcaucac cguggacaag uucgccaucc cuaaccggcg gcgggacgau 1200 cugcagcugg gcagcagcgg cuuccugcag agcagcaacu acaagaucga caucagcagc 1260 ucaagcugcc agcuguacua cagccugccc cuggugaacg ugaccaucaa caacuucaac 1320 cccagcagcu ggaaccggcg guacggcuuc ggcagcuuca accugagcag cuacgacgug 1380 guguacagcg accacugcuu cagcgugaac agcgacuucu gccccugugc cgacccuagc 1440 guggugaaca gcugcgccaa gagcaagccu cccagcgcca uuugccccgc cggcaccaag 1500 uaccggcacu gcgaccugga caccacccug uacgugaaga acuggugccg gugcagcugc 1560 cugcccgacc ccaucagcac cuacagcccc aacaccuguc cccagaagaa ggugguggug 1620 gguaucggcg agcacugucc cggccugggc aucaacgagg agaagugcgg cacccagcug 1680 aaccacagca gcugcuucug uagccccgac gccuuccugg gcuggagcuu cgacagcugc 1740 aucagcaaca accggugcaa caucuuuagc aacuucaucu ucaacggaau caacagcggc 1800 accaccugca gcaacgaccu gcuguauagc aacaccgaga ucagcaccgg cgugugcgug 1860 aacuacgacc uguacggcau caccggccag ggcaucuuca aggaggugag cgccgccuac 1920 uacaacaacu ggcagaaccu gcuguacgac agcaacggca acaucaucgg cuucaaggac 1980 uuucugacca acaagaccua caccauccug cccugcuaca gcggcggcgu gagcgugauc 2040 accccaggca ccaacaccag caaccaggug gccgugcugu accaggacgu gaacugcacc 2100 gaggugcccg uggccaucca cgccgaccag cugacaccca ccuggcgggu cuacagcacc 2160 ggcagcaacg uguuccagac ccgggccggu ugccugaucg gcgccgagca cgugaacaac 2220 agcuacgagu gcgacauccc caucggcgcc ggcaucugug ccagcuacca gacccagacc 2280 aauucacccc ggagggcaag gagcguggcc agccagagca ucaucgccua caccaugagc 2340 cugggcgccg agaacagcgu ggccuacagc aacaacagca ucgccauccc caccaacuuc 2400 accaucagcg ugaccaccga gauucugccc gugagcauga ccaagaccag cguggacugc 2460 accauguaca ucugcggcga cagcaccgag ugcagcaacc ugcugcugca guacggcagc 2520 uucugcaccc agcugaaccg ggcccugacc ggcaucgccg uggagcagga caagaacacc 2580 caggaggugu ucgcccaggu gaagcagauc uacaagaccc cucccaucaa ggacuucggc 2640 ggcuucaacu ucagccagau ccugcccgac cccagcaagc ccagcaagcg gagcuucauc 2700 gaggaccugc uguucaacaa ggugacccua gccgacgccg gcuucaucaa gcaguacggc 2760 gacugccucg gcgacauagc cgcccgggac cugaucugcg cccagaaguu caacggccug 2820 accgugcugc cuccccugcu gaccgacgag augaucgccc aguacaccag cgcccuguua 2880 gccggaacca ucaccagcgg cuggacuuuc ggcgcuggag ccgcucugca gauccccuuc 2940 gccaugcaga uggccuaccg guucaacggc aucggcguga cccagaacgu gcuguacgag 3000 aaccagaagc ugaucgccaa ccaguucaac agcgccaucg gcaagaucca ggacagccug 3060 agcagcaccg cuagcgcccu gggcaagcug caggacgugg ugaaccagaa cgcccaggcc 3120 cugaacaccc uggugaagca gcugagcagc aacuucggcg ccaucagcag cgugcugaac 3180 gacauccuga gccggcugga cccucccgag gccgaggugc agaucgaccg gcugaucacu 3240 ggccggcugc agagccugca gaccuacgug acccagcagc ugauccgggc cgccgagauu 3300 cgggccagcg ccaaccuggc cgccaccaag augagcgagu gcgugcuggg ccagagcaag 3360 cggguggacu ucugcggcaa gggcuaccac cugaugagcu uuccccagag cgcaccccac 3420 ggaguggugu uccugcacgu gaccuacgug cccgcccagg agaagaacuu caccaccgcc 3480 ccagccaucu gccacgacgg caaggcccac uuuccccggg agggcguguu cgugagcaac 3540 ggcacccacu gguucgugac ccagcggaac uucuacgagc cccagaucau caccaccgac 3600 aacaccuucg ugagcggcaa cugcgacgug gugaucggca ucgugaacaa caccguguac 3660 gauccccugc agcccgagcu ggacagcuuc aaggaggagc uggacaagua cuucaagaau 3720 cacaccagcc ccgacgugga ccugggcgac aucagcggca ucaacgccag cguggugaac 3780 auccagaagg agaucgaucg gcugaacgag guggccaaga accugaacga gagccugauc 3840 gaccugcagg agcugggcaa guacgagcag uacaucaagu ggcccuggua caucuggcug 3900 ggcuucaucg ccggccugau cgccaucgug auggugacca ucaugcugug cugcaugacc 3960 agcugcugca gcugccugaa gggcuguugc agcugcggca gcugcugcaa guucgacgag 4020 gacgacagcg agcccgugcu gaagggcgug aagcugcacu acacc 4065 <210> 38 <211> 1355 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 38 Met Phe Leu Ile Ile Phe Ile Leu Pro Thr Thr Leu Ala Val Ile Gly 1 5 10 15 Asp Phe Asn Cys Thr Asn Ser Phe Ile Asn Asp Tyr Asn Lys Thr Ile 20 25 30 Pro Arg Ile Ser Glu Asp Val Val Asp Val Ser Leu Gly Leu Gly Thr 35 40 45 Tyr Tyr Val Leu Asn Arg Val Tyr Leu Asn Thr Thr Leu Leu Phe Thr 50 55 60 Gly Tyr Phe Pro Lys Ser Gly Ala Asn Phe Arg Asp Leu Ala Leu Lys 65 70 75 80 Gly Ser Ile Tyr Leu Ser Thr Leu Trp Tyr Lys Pro Pro Phe Leu Ser 85 90 95 Asp Phe Asn Asn Gly Ile Phe Ser Lys Val Lys Asn Thr Lys Leu Tyr 100 105 110 Val Asn Asn Thr Leu Tyr Ser Glu Phe Ser Thr Ile Val Ile Gly Ser 115 120 125 Val Phe Val Asn Thr Ser Tyr Thr Ile Val Val Gln Pro His Asn Gly 130 135 140 Ile Leu Glu Ile Thr Ala Cys Gln Tyr Thr Met Cys Glu Tyr Pro His 145 150 155 160 Thr Val Cys Lys Ser Lys Gly Ser Ile Arg Asn Glu Ser Trp His Ile 165 170 175 Asp Ser Ser Glu Pro Leu Cys Leu Phe Lys Lys Asn Phe Thr Tyr Asn 180 185 190 Val Ser Ala Asp Trp Leu Tyr Phe His Phe Tyr Gln Glu Arg Gly Val 195 200 205 Phe Tyr Ala Tyr Tyr Ala Asp Val Gly Met Pro Thr Thr Phe Leu Phe 210 215 220 Ser Leu Tyr Leu Gly Thr Ile Leu Ser His Tyr Tyr Val Met Pro Leu 225 230 235 240 Thr Cys Asn Ala Ile Ser Ser Asn Thr Asp Asn Glu Thr Leu Glu Tyr 245 250 255 Trp Val Thr Pro Leu Ser Arg Arg Gln Tyr Leu Leu Asn Phe Asp Glu 260 265 270 His Gly Val Ile Thr Asn Ala Val Asp Cys Ala Leu Asp Pro Leu Ser 275 280 285 Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr 290 295 300 Gln Thr Ser Gly Phe Thr Val Lys Pro Val Ala Thr Val Tyr Arg Arg 305 310 315 320 Ile Pro Asn Leu Pro Asp Cys Asp Ile Asp Asn Trp Leu Asn Asn Val 325 330 335 Ser Val Pro Ser Pro Leu Asn Trp Glu Arg Arg Ile Phe Ser Asn Cys 340 345 350 Asn Phe Asn Leu Ser Thr Leu Leu Arg Leu Val His Val Asp Ser Phe 355 360 365 Ser Cys Asn Asn Leu Asp Lys Ser Lys Ile Phe Gly Ser Cys Phe Asn 370 375 380 Ser Ile Thr Val Asp Lys Phe Ala Ile Pro Asn Arg Arg Arg Asp Asp 385 390 395 400 Leu Gln Leu Gly Ser Ser Gly Phe Leu Gln Ser Ser Asn Tyr Lys Ile 405 410 415 Asp Ile Ser Ser Ser Ser Cys Gln Leu Tyr Tyr Ser Leu Pro Leu Val 420 425 430 Asn Val Thr Ile Asn Asn Phe Asn Pro Ser Ser Trp Asn Arg Arg Tyr 435 440 445 Gly Phe Gly Ser Phe Asn Leu Ser Ser Tyr Asp Val Val Tyr Ser Asp 450 455 460 His Cys Phe Ser Val Asn Ser Asp Phe Cys Pro Cys Ala Asp Pro Ser 465 470 475 480 Val Val Asn Ser Cys Ala Lys Ser Lys Pro Pro Ser Ala Ile Cys Pro 485 490 495 Ala Gly Thr Lys Tyr Arg His Cys Asp Leu Asp Thr Thr Leu Tyr Val 500 505 510 Lys Asn Trp Cys Arg Cys Ser Cys Leu Pro Asp Pro Ile Ser Thr Tyr 515 520 525 Ser Pro Asn Thr Cys Pro Gln Lys Lys Val Val Val Gly Ile Gly Glu 530 535 540 His Cys Pro Gly Leu Gly Ile Asn Glu Glu Lys Cys Gly Thr Gln Leu 545 550 555 560 Asn His Ser Ser Cys Phe Cys Ser Pro Asp Ala Phe Leu Gly Trp Ser 565 570 575 Phe Asp Ser Cys Ile Ser Asn Asn Arg Cys Asn Ile Phe Ser Asn Phe 580 585 590 Ile Phe Asn Gly Ile Asn Ser Gly Thr Thr Cys Ser Asn Asp Leu Leu 595 600 605 Tyr Ser Asn Thr Glu Ile Ser Thr Gly Val Cys Val Asn Tyr Asp Leu 610 615 620 Tyr Gly Ile Thr Gly Gln Gly Ile Phe Lys Glu Val Ser Ala Ala Tyr 625 630 635 640 Tyr Asn Asn Trp Gln Asn Leu Leu Tyr Asp Ser Asn Gly Asn Ile Ile 645 650 655 Gly Phe Lys Asp Phe Leu Thr Asn Lys Thr Tyr Thr Ile Leu Pro Cys 660 665 670 Tyr Ser Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn 675 680 685 Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val 690 695 700 Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr 705 710 715 720 Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu 725 730 735 His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile 740 745 750 Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser 755 760 765 Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu 770 775 780 Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe 785 790 795 800 Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr 805 810 815 Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser 820 825 830 Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala 835 840 845 Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe 850 855 860 Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly 865 870 875 880 Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys 885 890 895 Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp 900 905 910 Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala 915 920 925 Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro 930 935 940 Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu 945 950 955 960 Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu 965 970 975 Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly 980 985 990 Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln 995 1000 1005 Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr 1010 1015 1020 Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala 1025 1030 1035 Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly 1040 1045 1050 Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro 1055 1060 1065 Pro Glu Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu 1070 1075 1080 Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala 1085 1090 1095 Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu 1100 1105 1110 Cys Val Leu Gly Gln Ser Lys Arg Val Asp Phe Cys Gly Lys Gly 1115 1120 1125 Tyr His Leu Met Ser Phe Pro Gln Ser Ala Pro His Gly Val Val 1130 1135 1140 Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe Thr 1145 1150 1155 Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His Phe Pro Arg 1160 1165 1170 Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val Thr Gln 1175 1180 1185 Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe 1190 1195 1200 Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr 1205 1210 1215 Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu 1220 1225 1230 Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu 1235 1240 1245 Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys 1250 1255 1260 Glu Ile Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser 1265 1270 1275 Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys 1280 1285 1290 Trp Pro Trp Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala 1295 1300 1305 Ile Val Met Val Thr Ile Met Leu Cys Cys Met Thr Ser Cys Cys 1310 1315 1320 Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly Ser Cys Cys Lys Phe 1325 1330 1335 Asp Glu Asp Asp Ser Glu Pro Val Leu Lys Gly Val Lys Leu His 1340 1345 1350 Tyr Thr 1355 <210> 39 <211> 4247 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 39 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uuccugaucc ugcugaucag ccugcccacc gccuucgccg ugaucggcga ccugaagugc 120 accagcgaca acaucaacga caaggacacc ggcccaccac ccaucagcac cgacaccgug 180 gacgugacca acggccuggg caccuacuac gugcuggacc ggguguaccu gaacaccacc 240 cuguuccuga acggcuacua ccccaccagc ggcagcaccu accggaauau ggcccugaag 300 ggcagcgugc ugcugagccg gcugugguuc aagccaccau uccugagcga cuucaucaac 360 ggaaucuucg ccaaggugaa gaacaccaag gugaucaagg accgggugau guacagcgag 420 uuccccgcca ucaccauugg caguaccuuc gugaacacca gcuacagcgu gguggugcag 480 ccccggacca ucaacagcac ccaggacggc gacaacaagc ugcagggccu gcuggaggug 540 agcgugugcc aguacaacau gugcgaguac ccucagacca ucugccaccc caaccugggc 600 aaccaccgga aggagcugug gcaccuggac accggcgugg ugagcugccu guacaagcgg 660 aacuucaccu acgacguaaa cgccgacuac cuguacuucc acuucuacca ggagggcggc 720 accuucuacg ccuacuucac cgacacgggc guggugacca aguuccuguu caacguguac 780 cugggcaugg cccugagcca cuacuacgug augccccuga ccuguaacag caagcugacc 840 cuggaguacu gggugacccc ucugaccagc cggcaguacc ugcuggccuu caaccaggac 900 ggcaucaucu ucaacgccgu ggacugcgcc cuggacccuc ugagcgagac caagugcacc 960 cugaagagcu ucaccgugga gaagggcauc uaccagacca acggcuacac cgugcagccc 1020 aucgccgacg uguaccggcg gaagcccaac cugcccaacu gcaacaucga ggccuggcug 1080 aacgacaaga gcgugcccuc gccccugaac ugggagcgga agaccuucag caacugcaac 1140 uucaacauga gcagucugau gagcuucauc caggccgaca gcuucaccug caacaacauc 1200 gacgccgcca agaucuacgg caugugcuuc agcagcauca ccaucgacaa guuugccauc 1260 cccaacggcc ggaaggugga ccugcagcug ggcaaccugg gcuaccugca gagcuucaac 1320 uaccggaucg acaccaccgc caccucuugc cagcuguacu acaaccugcc cgccgccaac 1380 gugagcguga gccgguucaa ccccagcacc uggaacaagc gguucggcuu cauugaggac 1440 agcguguuca aaccccggcc cgcaggagua cugaccaacc acgacguggu guacgcccag 1500 cacugcuuca aggcacccaa gaacuucugc cccugcaagc ugaacggcag cugugugggc 1560 ucuggccccg guaagaacaa cggcauaggg acuugcccgg cagggaccaa cuaccugacc 1620 ugcgacaacc ugugcacacc cgaccccauc accuucaccg gcaccuacaa guguccccag 1680 accaagagcc uggugggcau cggcgagcac ugcagcggcc uggccgugaa gagcgacuac 1740 ugcggcggca acagcugcac cugucggccc caggccuucc ugggcuggag cgccgacagc 1800 ugccugcagg gcgacaagug caacaucuuu gccaacuuca uccugcacga cgugaacagc 1860 ggccugaccu gcagcaccga ccugcagaag gccaacaccg acaucauccu gggcgugugc 1920 gugaacuacg acuuguacgg cauccugggc cagggcaucu ucguggaggu gaacgccacc 1980 uacuacaaca gcuggcagaa ccugcuguac gacagcaacg gcaaccugua cggcuuccgg 2040 gacuacauca ucaaccggac cuucaugauc cggagcugcu acagcggcgg cgugagcgug 2100 aucaccccag gcaccaacac cagcaaccag guggccgugc uguaccagga cgugaacugc 2160 accgaggugc ccguggccau ccacgccgac cagcugacac ccaccuggcg ggucuacagc 2220 accggcagca acguguucca gacccgggcc gguugccuga ucggcgccga gcacgugaac 2280 aacagcuacg agugcgacau ccccaucggc gccggcaucu gugccagcua ccagacccag 2340 accaauucac cccggagggc aaggagcgug gccagccaga gcaucaucgc cuacaccaug 2400 agccugggcg ccgagaacag cguggccuac agcaacaaca gcaucgccau ccccaccaac 2460 uucaccauca gcgugaccac cgagauucug cccgugagca ugaccaagac cagcguggac 2520 ugcaccaugu acaucugcgg cgacagcacc gagugcagca accugcugcu gcaguacggc 2580 agcuucugca cccagcugaa ccgggcccug accggcaucg ccguggagca ggacaagaac 2640 acccaggagg uguucgccca ggugaagcag aucuacaaga ccccucccau caaggacuuc 2700 ggcggcuuca acuucagcca gauccugccc gaccccagca agcccagcaa gcggagcuuc 2760 aucgaggacc ugcuguucaa caaggugacc cuagccgacg ccggcuucau caagcaguac 2820 ggcgacugcc ucggcgacau agccgcccgg gaccugaucu gcgcccagaa guucaacggc 2880 cugaccgugc ugccuccccu gcugaccgac gagaugaucg cccaguacac cagcgcccug 2940 uuagccggaa ccaucaccag cggcuggacu uucggcgcug gagccgcucu gcagaucccc 3000 uucgccaugc agauggccua ccgguucaac ggcaucggcg ugacccagaa cgugcuguac 3060 gagaaccaga agcugaucgc caaccaguuc aacagcgcca ucggcaagau ccaggacagc 3120 cugagcagca ccgcuagcgc ccugggcaag cugcaggacg uggugaacca gaacgcccag 3180 gcccugaaca cccuggugaa gcagcugagc agcaacuucg gcgccaucag cagcgugcug 3240 aacgacaucc ugagccggcu ggacccuccc gaggccgagg ugcagaucga ccggcugauc 3300 acuggccggc ugcagagccu gcagaccuac gugacccagc agcugauccg ggccgccgag 3360 auucgggcca gcgccaaccu ggccgccacc aagaugagcg agugcgugcu gggccagagc 3420 aagcgggugg acuucugcgg caagggcuac caccugauga gcuuucccca gagcgcaccc 3480 cacggagugg uguuccugca cgugaccuac gugcccgccc aggagaagaa cuucaccacc 3540 gccccagcca ucugccacga cggcaaggcc cacuuucccc gggagggcgu guucgugagc 3600 aacggcaccc acugguucgu gacccagcgg aacuucuacg agccccagau caucaccacc 3660 gacaacaccu ucgugagcgg caacugcgac guggugaucg gcaucgugaa caacaccgug 3720 uacgaucccc ugcagcccga gcuggacagc uucaaggagg agcuggacaa guacuucaag 3780 aaucacacca gccccgacgu ggaccugggc gacaucagcg gcaucaacgc cagcguggug 3840 aacauccaga aggagaucga ucggcugaac gagguggcca agaaccugaa cgagagccug 3900 aucgaccugc aggagcuggg caaguacgag caguacauca aguggcccug guacaucugg 3960 cugggcuuca ucgccggccu gaucgccauc gugaugguga ccaucaugcu gugcugcaug 4020 accagcugcu gcagcugccu gaagggcugu ugcagcugcg gcagcugcug caaguucgac 4080 gaggacgaca gcgagcccgu gcugaagggc gugaagcugc acuacaccug auaauaggcu 4140 ggagccucgg uggccuagcu ucuugccccu ugggccuccc cccagccccu ccuccccuuc 4200 cugcacccgu acccccgugg ucuuugaaua aagucugagu gggcggc 4247 <210> 40 <211> 4071 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 40 auguuccuga uccugcugau cagccugccc accgccuucg ccgugaucgg cgaccugaag 60 ugcaccagcg acaacaucaa cgacaaggac accggcccac cacccaucag caccgacacc 120 guggacguga ccaacggccu gggcaccuac uacgugcugg accgggugua ccugaacacc 180 acccuguucc ugaacggcua cuaccccacc agcggcagca ccuaccggaa uauggcccug 240 aagggcagcg ugcugcugag ccggcugugg uucaagccac cauuccugag cgacuucauc 300 aacggaaucu ucgccaaggu gaagaacacc aaggugauca aggaccgggu gauguacagc 360 gaguuccccg ccaucaccau uggcaguacc uucgugaaca ccagcuacag cgugguggug 420 cagccccgga ccaucaacag cacccaggac ggcgacaaca agcugcaggg ccugcuggag 480 gugagcgugu gccaguacaa caugugcgag uacccucaga ccaucugcca ccccaaccug 540 ggcaaccacc ggaaggagcu guggcaccug gacaccggcg uggugagcug ccuguacaag 600 cggaacuuca ccuacgacgu aaacgccgac uaccuguacu uccacuucua ccaggagggc 660 ggcaccuucu acgccuacuu caccgacacg ggcgugguga ccaaguuccu guucaacgug 720 uaccugggca uggcccugag ccacuacuac gugaugcccc ugaccuguaa cagcaagcug 780 acccuggagu acugggugac cccucugacc agccggcagu accugcuggc cuucaaccag 840 gacggcauca ucuucaacgc cguggacugc gcccuggacc cucugagcga gaccaagugc 900 acccugaaga gcuucaccgu ggagaagggc aucuaccaga ccaacggcua caccgugcag 960 cccaucgccg acguguaccg gcggaagccc aaccugccca acugcaacau cgaggccugg 1020 cugaacgaca agagcgugcc cucgccccug aacugggagc ggaagaccuu cagcaacugc 1080 aacuucaaca ugagcagucu gaugagcuuc auccaggccg acagcuucac cugcaacaac 1140 aucgacgccg ccaagaucua cggcaugugc uucagcagca ucaccaucga caaguuugcc 1200 auccccaacg gccggaaggu ggaccugcag cugggcaacc ugggcuaccu gcagagcuuc 1260 aacuaccgga ucgacaccac cgccaccucu ugccagcugu acuacaaccu gcccgccgcc 1320 aacgugagcg ugagccgguu caaccccagc accuggaaca agcgguucgg cuucauugag 1380 gacagcgugu ucaaaccccg gcccgcagga guacugacca accacgacgu gguguacgcc 1440 cagcacugcu ucaaggcacc caagaacuuc ugccccugca agcugaacgg cagcugugug 1500 ggcucuggcc ccgguaagaa caacggcaua gggacuugcc cggcagggac caacuaccug 1560 accugcgaca accugugcac acccgacccc aucaccuuca ccggcaccua caaguguccc 1620 cagaccaaga gccugguggg caucggcgag cacugcagcg gccuggccgu gaagagcgac 1680 uacugcggcg gcaacagcug caccugucgg ccccaggccu uccugggcug gagcgccgac 1740 agcugccugc agggcgacaa gugcaacauc uuugccaacu ucauccugca cgacgugaac 1800 agcggccuga ccugcagcac cgaccugcag aaggccaaca ccgacaucau ccugggcgug 1860 ugcgugaacu acgacuugua cggcauccug ggccagggca ucuucgugga ggugaacgcc 1920 accuacuaca acagcuggca gaaccugcug uacgacagca acggcaaccu guacggcuuc 1980 cgggacuaca ucaucaaccg gaccuucaug auccggagcu gcuacagcgg cggcgugagc 2040 gugaucaccc caggcaccaa caccagcaac cagguggccg ugcuguacca ggacgugaac 2100 ugcaccgagg ugcccguggc cauccacgcc gaccagcuga cacccaccug gcgggucuac 2160 agcaccggca gcaacguguu ccagacccgg gccgguugcc ugaucggcgc cgagcacgug 2220 aacaacagcu acgagugcga cauccccauc ggcgccggca ucugugccag cuaccagacc 2280 cagaccaauu caccccggag ggcaaggagc guggccagcc agagcaucau cgccuacacc 2340 augagccugg gcgccgagaa cagcguggcc uacagcaaca acagcaucgc cauccccacc 2400 aacuucacca ucagcgugac caccgagauu cugcccguga gcaugaccaa gaccagcgug 2460 gacugcacca uguacaucug cggcgacagc accgagugca gcaaccugcu gcugcaguac 2520 ggcagcuucu gcacccagcu gaaccgggcc cugaccggca ucgccgugga gcaggacaag 2580 aacacccagg agguguucgc ccaggugaag cagaucuaca agaccccucc caucaaggac 2640 uucggcggcu ucaacuucag ccagauccug cccgacccca gcaagcccag caagcggagc 2700 uucaucgagg accugcuguu caacaaggug acccuagccg acgccggcuu caucaagcag 2760 uacggcgacu gccucggcga cauagccgcc cgggaccuga ucugcgccca gaaguucaac 2820 ggccugaccg ugcugccucc ccugcugacc gacgagauga ucgcccagua caccagcgcc 2880 cuguuagccg gaaccaucac cagcggcugg acuuucggcg cuggagccgc ucugcagauc 2940 cccuucgcca ugcagauggc cuaccgguuc aacggcaucg gcgugaccca gaacgugcug 3000 uacgagaacc agaagcugau cgccaaccag uucaacagcg ccaucggcaa gauccaggac 3060 agccugagca gcaccgcuag cgcccugggc aagcugcagg acguggugaa ccagaacgcc 3120 caggcccuga acacccuggu gaagcagcug agcagcaacu ucggcgccau cagcagcgug 3180 cugaacgaca uccugagccg gcuggacccu cccgaggccg aggugcagau cgaccggcug 3240 aucacuggcc ggcugcagag ccugcagacc uacgugaccc agcagcugau ccgggccgcc 3300 gagauucggg ccagcgccaa ccuggccgcc accaagauga gcgagugcgu gcugggccag 3360 agcaagcggg uggacuucug cggcaagggc uaccaccuga ugagcuuucc ccagagcgca 3420 ccccacggag ugguguuccu gcacgugacc uacgugcccg cccaggagaa gaacuucacc 3480 accgccccag ccaucugcca cgacggcaag gcccacuuuc cccgggaggg cguguucgug 3540 agcaacggca cccacugguu cgugacccag cggaacuucu acgagcccca gaucaucacc 3600 accgacaaca ccuucgugag cggcaacugc gacgugguga ucggcaucgu gaacaacacc 3660 guguacgauc cccugcagcc cgagcuggac agcuucaagg aggagcugga caaguacuuc 3720 aagaaucaca ccagccccga cguggaccug ggcgacauca gcggcaucaa cgccagcgug 3780 gugaacaucc agaaggagau cgaucggcug aacgaggugg ccaagaaccu gaacgagagc 3840 cugaucgacc ugcaggagcu gggcaaguac gagcaguaca ucaaguggcc cugguacauc 3900 uggcugggcu ucaucgccgg ccugaucgcc aucgugaugg ugaccaucau gcugugcugc 3960 augaccagcu gcugcagcug ccugaagggc uguugcagcu gcggcagcug cugcaaguuc 4020 gacgaggacg acagcgagcc cgugcugaag ggcgugaagc ugcacuacac c 4071 <210> 41 <211> 1357 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 41 Met Phe Leu Ile Leu Leu Ile Ser Leu Pro Thr Ala Phe Ala Val Ile 1 5 10 15 Gly Asp Leu Lys Cys Thr Ser Asp Asn Ile Asn Asp Lys Asp Thr Gly 20 25 30 Pro Pro Pro Ile Ser Thr Asp Thr Val Asp Val Thr Asn Gly Leu Gly 35 40 45 Thr Tyr Tyr Val Leu Asp Arg Val Tyr Leu Asn Thr Thr Leu Phe Leu 50 55 60 Asn Gly Tyr Tyr Pro Thr Ser Gly Ser Thr Tyr Arg Asn Met Ala Leu 65 70 75 80 Lys Gly Ser Val Leu Leu Ser Arg Leu Trp Phe Lys Pro Pro Phe Leu 85 90 95 Ser Asp Phe Ile Asn Gly Ile Phe Ala Lys Val Lys Asn Thr Lys Val 100 105 110 Ile Lys Asp Arg Val Met Tyr Ser Glu Phe Pro Ala Ile Thr Ile Gly 115 120 125 Ser Thr Phe Val Asn Thr Ser Tyr Ser Val Val Val Gln Pro Arg Thr 130 135 140 Ile Asn Ser Thr Gln Asp Gly Asp Asn Lys Leu Gln Gly Leu Leu Glu 145 150 155 160 Val Ser Val Cys Gln Tyr Asn Met Cys Glu Tyr Pro Gln Thr Ile Cys 165 170 175 His Pro Asn Leu Gly Asn His Arg Lys Glu Leu Trp His Leu Asp Thr 180 185 190 Gly Val Val Ser Cys Leu Tyr Lys Arg Asn Phe Thr Tyr Asp Val Asn 195 200 205 Ala Asp Tyr Leu Tyr Phe His Phe Tyr Gln Glu Gly Gly Thr Phe Tyr 210 215 220 Ala Tyr Phe Thr Asp Thr Gly Val Val Thr Lys Phe Leu Phe Asn Val 225 230 235 240 Tyr Leu Gly Met Ala Leu Ser His Tyr Tyr Val Met Pro Leu Thr Cys 245 250 255 Asn Ser Lys Leu Thr Leu Glu Tyr Trp Val Thr Pro Leu Thr Ser Arg 260 265 270 Gln Tyr Leu Leu Ala Phe Asn Gln Asp Gly Ile Ile Phe Asn Ala Val 275 280 285 Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser 290 295 300 Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Asn Gly Tyr Thr Val Gln 305 310 315 320 Pro Ile Ala Asp Val Tyr Arg Arg Lys Pro Asn Leu Pro Asn Cys Asn 325 330 335 Ile Glu Ala Trp Leu Asn Asp Lys Ser Val Pro Ser Pro Leu Asn Trp 340 345 350 Glu Arg Lys Thr Phe Ser Asn Cys Asn Phe Asn Met Ser Ser Leu Met 355 360 365 Ser Phe Ile Gln Ala Asp Ser Phe Thr Cys Asn Asn Ile Asp Ala Ala 370 375 380 Lys Ile Tyr Gly Met Cys Phe Ser Ser Ile Thr Ile Asp Lys Phe Ala 385 390 395 400 Ile Pro Asn Gly Arg Lys Val Asp Leu Gln Leu Gly Asn Leu Gly Tyr 405 410 415 Leu Gln Ser Phe Asn Tyr Arg Ile Asp Thr Thr Ala Thr Ser Cys Gln 420 425 430 Leu Tyr Tyr Asn Leu Pro Ala Ala Asn Val Ser Val Ser Arg Phe Asn 435 440 445 Pro Ser Thr Trp Asn Lys Arg Phe Gly Phe Ile Glu Asp Ser Val Phe 450 455 460 Lys Pro Arg Pro Ala Gly Val Leu Thr Asn His Asp Val Val Tyr Ala 465 470 475 480 Gln His Cys Phe Lys Ala Pro Lys Asn Phe Cys Pro Cys Lys Leu Asn 485 490 495 Gly Ser Cys Val Gly Ser Gly Pro Gly Lys Asn Asn Gly Ile Gly Thr 500 505 510 Cys Pro Ala Gly Thr Asn Tyr Leu Thr Cys Asp Asn Leu Cys Thr Pro 515 520 525 Asp Pro Ile Thr Phe Thr Gly Thr Tyr Lys Cys Pro Gln Thr Lys Ser 530 535 540 Leu Val Gly Ile Gly Glu His Cys Ser Gly Leu Ala Val Lys Ser Asp 545 550 555 560 Tyr Cys Gly Gly Asn Ser Cys Thr Cys Arg Pro Gln Ala Phe Leu Gly 565 570 575 Trp Ser Ala Asp Ser Cys Leu Gln Gly Asp Lys Cys Asn Ile Phe Ala 580 585 590 Asn Phe Ile Leu His Asp Val Asn Ser Gly Leu Thr Cys Ser Thr Asp 595 600 605 Leu Gln Lys Ala Asn Thr Asp Ile Ile Leu Gly Val Cys Val Asn Tyr 610 615 620 Asp Leu Tyr Gly Ile Leu Gly Gln Gly Ile Phe Val Glu Val Asn Ala 625 630 635 640 Thr Tyr Tyr Asn Ser Trp Gln Asn Leu Leu Tyr Asp Ser Asn Gly Asn 645 650 655 Leu Tyr Gly Phe Arg Asp Tyr Ile Ile Asn Arg Thr Phe Met Ile Arg 660 665 670 Ser Cys Tyr Ser Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr 675 680 685 Ser Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val 690 695 700 Pro Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr 705 710 715 720 Ser Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly 725 730 735 Ala Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala 740 745 750 Gly Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala 755 760 765 Arg Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly 770 775 780 Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr 785 790 795 800 Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr 805 810 815 Lys Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu 820 825 830 Cys Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn 835 840 845 Arg Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu 850 855 860 Val Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp 865 870 875 880 Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro 885 890 895 Ser Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu 900 905 910 Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile 915 920 925 Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val 930 935 940 Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala 945 950 955 960 Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala 965 970 975 Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly 980 985 990 Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala 995 1000 1005 Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser 1010 1015 1020 Ser Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln 1025 1030 1035 Asn Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn 1040 1045 1050 Phe Gly Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu 1055 1060 1065 Asp Pro Pro Glu Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly 1070 1075 1080 Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg 1085 1090 1095 Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr Lys Met 1100 1105 1110 Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp Phe Cys Gly 1115 1120 1125 Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala Pro His Gly 1130 1135 1140 Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu Lys Asn 1145 1150 1155 Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His Phe 1160 1165 1170 Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val 1175 1180 1185 Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn 1190 1195 1200 Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn 1205 1210 1215 Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys 1220 1225 1230 Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val 1235 1240 1245 Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile 1250 1255 1260 Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn 1265 1270 1275 Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr 1280 1285 1290 Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu 1295 1300 1305 Ile Ala Ile Val Met Val Thr Ile Met Leu Cys Cys Met Thr Ser 1310 1315 1320 Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly Ser Cys Cys 1325 1330 1335 Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys Gly Val Lys 1340 1345 1350 Leu His Tyr Thr 1355 <210> 42 <211> 1157 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 42 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120 acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180 guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240 gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300 cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360 cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420 aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480 ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540 agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600 aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660 aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720 gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780 cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840 gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900 aacggcacca ucaccgacgc cguggacucu ggcggaggcg gcagcgccau cggcggcuac 960 auccccgagg ccccuagaga cggccaggcc uacgugcgga aggacggcga gugggugcug 1020 cugagcaccu uccugggcug auaauaggcu ggagccucgg uggccuagcu ucuugccccu 1080 ugggccuccc cccagccccu ccuccccuuc cugcacccgu acccccgugg ucuuugaaua 1140 aagucugagu gggcggc 1157 <210> 43 <211> 981 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 43 auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60 cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120 aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180 aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240 aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300 auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360 aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420 cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480 agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540 ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600 uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660 ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720 cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780 ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840 gagaacggca ccaucaccga cgccguggac ucuggcggag gcggcagcgc caucggcggc 900 uacauccccg aggccccuag agacggccag gccuacgugc ggaaggacgg cgagugggug 960 cugcugagca ccuuccuggg c 981 <210> 44 <211> 327 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 44 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Ser Gly Gly Gly Gly Ser Ala Ile Gly Gly Tyr Ile Pro Glu 290 295 300 Ala Pro Arg Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val 305 310 315 320 Leu Leu Ser Thr Phe Leu Gly 325 <210> 45 <211> 1130 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 45 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120 acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180 guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240 gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300 cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360 cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420 aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480 ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540 agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600 aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660 aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720 gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780 cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840 gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900 aacggcacca ucaccgacgc cguggacucu ggcggaggca gcauccuggc caucuacagc 960 accguggcca gcagccuggu gcugcuggug agccugggcg ccaucagcuu cugauaauag 1020 gcuggagccu cgguggccua gcuucuugcc ccuugggccu ccccccagcc ccuccucccc 1080 uuccugcacc cguacccccg uggucuuuga auaaagucug agugggcggc 1130 <210> 46 <211> 954 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 46 auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60 cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120 aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180 aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240 aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300 auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360 aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420 cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480 agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540 ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600 uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660 ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720 cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780 ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840 gagaacggca ccaucaccga cgccguggac ucuggcggag gcagcauccu ggccaucuac 900 agcaccgugg ccagcagccu ggugcugcug gugagccugg gcgccaucag cuuc 954 <210> 47 <211> 318 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 47 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Ser Gly Gly Gly Ser Ile Leu Ala Ile Tyr Ser Thr Val Ala 290 295 300 Ser Ser Leu Val Leu Leu Val Ser Leu Gly Ala Ile Ser Phe 305 310 315 <210> 48 <211> 1238 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 48 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120 acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180 guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240 gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300 cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360 cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420 aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480 ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540 agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600 aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660 aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720 gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780 cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840 gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900 aacggcacca ucaccgacgc cguggacucu ggcggaggca gcauccuggc caucuacagc 960 accguggcca gcagccuggu gcugcuggug agccugggcg ccaucagcuu cggcggaggc 1020 agcgccaucg gcggcuacau ccccgaggcc ccuagagacg gccaggccua cgugcggaag 1080 gacggcgagu gggugcugcu gagcaccuuc cugggcaagu gauaauaggc uggagccucg 1140 guggccuagc uucuugcccc uugggccucc ccccagcccc uccuccccuu ccugcacccg 1200 uacccccgug gucuuugaau aaagucugag ugggcggc 1238 <210> 49 <211> 1062 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 49 auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60 cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120 aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180 aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240 aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300 auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360 aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420 cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480 agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540 ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600 uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660 ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720 cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780 ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840 gagaacggca ccaucaccga cgccguggac ucuggcggag gcagcauccu ggccaucuac 900 agcaccgugg ccagcagccu ggugcugcug gugagccugg gcgccaucag cuucggcgga 960 ggcagcgcca ucggcggcua cauccccgag gccccuagag acggccaggc cuacgugcgg 1020 aaggacggcg agugggugcu gcugagcacc uuccugggca ag 1062 <210> 50 <211> 354 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 50 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Ser Gly Gly Gly Ser Ile Leu Ala Ile Tyr Ser Thr Val Ala 290 295 300 Ser Ser Leu Val Leu Leu Val Ser Leu Gly Ala Ile Ser Phe Gly Gly 305 310 315 320 Gly Ser Ala Ile Gly Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln 325 330 335 Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu 340 345 350 Gly Lys <210> 51 <211> 1130 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 51 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120 acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180 gugugccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240 gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300 cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360 cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420 aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480 ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540 agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600 aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660 aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720 gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780 cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840 gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900 aacggcacca ucaccgacgc cguggacucu ggcggaggca gcauccuggc caucuacagc 960 accguggcca gcagccuggu gcugcuggug agccugggcg ccaucagcuu cugauaauag 1020 gcuggagccu cgguggccua gcuucuugcc ccuugggccu ccccccagcc ccuccucccc 1080 uuccugcacc cguacccccg uggucuuuga auaaagucug agugggcggc 1130 <210> 52 <211> 954 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 52 auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60 cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120 aaggugugcc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180 aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240 aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300 auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360 aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420 cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480 agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540 ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600 uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660 ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720 cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780 ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840 gagaacggca ccaucaccga cgccguggac ucuggcggag gcagcauccu ggccaucuac 900 agcaccgugg ccagcagccu ggugcugcug gugagccugg gcgccaucag cuuc 954 <210> 53 <211> 318 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 53 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Cys Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Ser Gly Gly Gly Ser Ile Leu Ala Ile Tyr Ser Thr Val Ala 290 295 300 Ser Ser Leu Val Leu Leu Val Ser Leu Gly Ala Ile Ser Phe 305 310 315 <210> 54 <211> 1181 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 54 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120 acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180 gugugccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240 gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300 cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360 cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420 aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480 ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540 agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600 aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660 aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720 gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780 cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840 gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900 aacggcacca ucaccgacgc cguggacugc gcccuggacc cucugagcga gaccaagugc 960 acccugaaga gcuucaccuc uggcggaggc agcauccugg ccaucuacag caccguggcc 1020 agcagccugg ugcugcuggu gagccugggc gccaucagcu ucugauaaua ggcuggagcc 1080 ucgguggccu agcuucuugc cccuugggcc uccccccagc cccuccuccc cuuccugcac 1140 ccguaccccc guggucuuug aauaaagucu gagugggcgg c 1181 <210> 55 <211> 1005 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 55 auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60 cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120 aaggugugcc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180 aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240 aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300 auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360 aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420 cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480 agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540 ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600 uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660 ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720 cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780 ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840 gagaacggca ccaucaccga cgccguggac ugcgcccugg acccucugag cgagaccaag 900 ugcacccuga agagcuucac cucuggcgga ggcagcaucc uggccaucua cagcaccgug 960 gccagcagcc uggugcugcu ggugagccug ggcgccauca gcuuc 1005 <210> 56 <211> 335 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 56 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Cys Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Ser Gly Gly Gly Ser Ile Leu Ala Ile Tyr Ser Thr Val 305 310 315 320 Ala Ser Ser Leu Val Leu Leu Val Ser Leu Gly Ala Ile Ser Phe 325 330 335 <210> 57 <211> 1181 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 57 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120 acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180 guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240 gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300 cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360 cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420 aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480 ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540 agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600 aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660 aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720 gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780 cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840 gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900 aacggcacca ucaccgacgc cguggacugc gcccuggacc cucugagcga gaccaagugc 960 acccugaaga gcuucaccuc uggcggaggc agcauccugg ccaucuacag caccguggcc 1020 agcagccugg ugcugcuggu gagccugggc gccaucagcu ucugauaaua ggcuggagcc 1080 ucgguggccu agcuucuugc cccuugggcc uccccccagc cccuccuccc cuuccugcac 1140 ccguaccccc guggucuuug aauaaagucu gagugggcgg c 1181 <210> 58 <211> 1005 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 58 auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60 cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120 aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180 aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240 aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300 auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360 aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420 cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480 agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540 ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600 uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660 ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720 cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780 ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840 gagaacggca ccaucaccga cgccguggac ugcgcccugg acccucugag cgagaccaag 900 ugcacccuga agagcuucac cucuggcgga ggcagcaucc uggccaucua cagcaccgug 960 gccagcagcc uggugcugcu ggugagccug ggcgccauca gcuuc 1005 <210> 59 <211> 335 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 59 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Ser Gly Gly Gly Ser Ile Leu Ala Ile Tyr Ser Thr Val 305 310 315 320 Ala Ser Ser Leu Val Leu Leu Val Ser Leu Gly Ala Ile Ser Phe 325 330 335 <210> 60 <211> 836 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 60 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uacagcaugc agcuggcuag cugcgugacc cugacccugg ugcugcuggu gaacagccag 120 cccaacauca ccaaccugug ccccuucggc gagguguuca acgccacccg guucgccagc 180 guguacgccu ggaaccggaa gcggaucagc aacugcgugg ccgacuacag cgugcuguac 240 aacagcgcca gcuucagcac cuucaagugc uacggcguga gccccaccaa gcugaacgac 300 cugugcuuca ccaacgugua cgccgacagc uucgugaucc guggcgacga ggugcggcag 360 aucgcacccg gccagacagg caagaucgcc gacuacaacu acaagcugcc cgacgacuuc 420 accggcugcg ugaucgccug gaacagcaac aaccucgaca gcaagguggg cggcaacuac 480 aacuaccugu accggcuguu ccggaagagc aaccugaagc ccuucgagcg ggacaucagc 540 accgagaucu accaagccgg cuccaccccu ugcaacggcg uggagggcuu caacugcuac 600 uucccucugc agagcuacgg cuuccagccc accaacggcg ugggcuacca gcccuaccgg 660 gugguggugc ugagcuucga gcugcugcac gccccagcca ccgugugugg ccccaaguga 720 uaauaggcug gagccucggu ggccuagcuu cuugccccuu gggccucccc ccagccccuc 780 cuccccuucc ugcacccgua cccccguggu cuuugaauaa agucugagug ggcggc 836 <210> 61 <211> 660 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 61 auguacagca ugcagcuggc uagcugcgug acccugaccc uggugcugcu ggugaacagc 60 cagcccaaca ucaccaaccu gugccccuuc ggcgaggugu ucaacgccac ccgguucgcc 120 agcguguacg ccuggaaccg gaagcggauc agcaacugcg uggccgacua cagcgugcug 180 uacaacagcg ccagcuucag caccuucaag ugcuacggcg ugagccccac caagcugaac 240 gaccugugcu ucaccaacgu guacgccgac agcuucguga uccguggcga cgaggugcgg 300 cagaucgcac ccggccagac aggcaagauc gccgacuaca acuacaagcu gcccgacgac 360 uucaccggcu gcgugaucgc cuggaacagc aacaaccucg acagcaaggu gggcggcaac 420 uacaacuacc uguaccggcu guuccggaag agcaaccuga agcccuucga gcgggacauc 480 agcaccgaga ucuaccaagc cggcuccacc ccuugcaacg gcguggaggg cuucaacugc 540 uacuucccuc ugcagagcua cggcuuccag cccaccaacg gcgugggcua ccagcccuac 600 cggguggugg ugcugagcuu cgagcugcug cacgccccag ccaccgugug uggccccaag 660 <210> 62 <211> 220 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 62 Met Tyr Ser Met Gln Leu Ala Ser Cys Val Thr Leu Thr Leu Val Leu 1 5 10 15 Leu Val Asn Ser Gln Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu 20 25 30 Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys 35 40 45 Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala 50 55 60 Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn 65 70 75 80 Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly 85 90 95 Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp 100 105 110 Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp 115 120 125 Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu 130 135 140 Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile 145 150 155 160 Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu 165 170 175 Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr 180 185 190 Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu 195 200 205 Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 210 215 220 <210> 63 <211> 1349 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 63 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uacagcaugc agcuggcuag cugcgugacc cugacccugg ugcugcuggu gaacagccag 120 cccaacauca ccaaccugug ccccuucggc gagguguuca acgccacccg guucgccagc 180 guguacgccu ggaaccggaa gcggaucagc aacugcgugg ccgacuacag cgugcuguac 240 aacagcgcca gcuucagcac cuucaagugc uacggcguga gccccaccaa gcugaacgac 300 cugugcuuca ccaacgugua cgccgacagc uucgugaucc guggcgacga ggugcggcag 360 aucgcacccg gccagacagg caagaucgcc gacuacaacu acaagcugcc cgacgacuuc 420 accggcugcg ugaucgccug gaacagcaac aaccucgaca gcaagguggg cggcaacuac 480 aacuaccugu accggcuguu ccggaagagc aaccugaagc ccuucgagcg ggacaucagc 540 accgagaucu accaagccgg cuccaccccu ugcaacggcg uggagggcuu caacugcuac 600 uucccucugc agagcuacgg cuuccagccc accaacggcg ugggcuacca gcccuaccgg 660 gugguggugc ugagcuucga gcugcugcac gccccagcca ccgugugugg ccccaaggga 720 ggaggcagcg gcggcgauau caucaagcuu cugaacgagc aaguuaacaa ggaaaugcag 780 agcaguaauc ucuacaugag caugagcagc uggugcuaca cccacucccu ggacggagca 840 ggccucuucc uguucgacca cgcagccgag gaguacgagc acgcuaagaa guugaucauu 900 uucuugaacg agaacaacgu gcccgugcag cuaacgucaa ucagcgcacc ugagcacaag 960 uucgagggcc ugacccagau cuuccagaag gccuacgaac acgaacagca caucuccgag 1020 agcaucaaca auauugugga ucacgcuauc aaguccaagg accacgcuac cuucaacuuc 1080 cugcaguggu acguggccga gcaacaugag gaggaggugc uguucaagga cauccuggac 1140 aagaucgagc ugaucgguaa ugagaaucac ggccuguacc uggccgacca guacgugaag 1200 ggcaucgcca agagccggaa gucaggcuca ugauaauagg cuggagccuc gguggccuag 1260 cuucuugccc cuugggccuc cccccagccc cuccuccccu uccugcaccc guacccccgu 1320 ggucuuugaa uaaagucuga gugggcggc 1349 <210> 64 <211> 1173 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 64 auguacagca ugcagcuggc uagcugcgug acccugaccc uggugcugcu ggugaacagc 60 cagcccaaca ucaccaaccu gugccccuuc ggcgaggugu ucaacgccac ccgguucgcc 120 agcguguacg ccuggaaccg gaagcggauc agcaacugcg uggccgacua cagcgugcug 180 uacaacagcg ccagcuucag caccuucaag ugcuacggcg ugagccccac caagcugaac 240 gaccugugcu ucaccaacgu guacgccgac agcuucguga uccguggcga cgaggugcgg 300 cagaucgcac ccggccagac aggcaagauc gccgacuaca acuacaagcu gcccgacgac 360 uucaccggcu gcgugaucgc cuggaacagc aacaaccucg acagcaaggu gggcggcaac 420 uacaacuacc uguaccggcu guuccggaag agcaaccuga agcccuucga gcgggacauc 480 agcaccgaga ucuaccaagc cggcuccacc ccuugcaacg gcguggaggg cuucaacugc 540 uacuucccuc ugcagagcua cggcuuccag cccaccaacg gcgugggcua ccagcccuac 600 cggguggugg ugcugagcuu cgagcugcug cacgccccag ccaccgugug uggccccaag 660 ggaggaggca gcggcggcga uaucaucaag cuucugaacg agcaaguuaa caaggaaaug 720 cagagcagua aucucuacau gagcaugagc agcuggugcu acacccacuc ccuggacgga 780 gcaggccucu uccuguucga ccacgcagcc gaggaguacg agcacgcuaa gaaguugauc 840 auuuucuuga acgagaacaa cgugcccgug cagcuaacgu caaucagcgc accugagcac 900 aaguucgagg gccugaccca gaucuuccag aaggccuacg aacacgaaca gcacaucucc 960 gagagcauca acaauauugu ggaucacgcu aucaagucca aggaccacgc uaccuucaac 1020 uuccugcagu gguacguggc cgagcaacau gaggaggagg ugcuguucaa ggacauccug 1080 gacaagaucg agcugaucgg uaaugagaau cacggccugu accuggccga ccaguacgug 1140 aagggcaucg ccaagagccg gaagucaggc uca 1173 <210> 65 <211> 391 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 65 Met Tyr Ser Met Gln Leu Ala Ser Cys Val Thr Leu Thr Leu Val Leu 1 5 10 15 Leu Val Asn Ser Gln Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu 20 25 30 Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys 35 40 45 Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala 50 55 60 Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn 65 70 75 80 Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly 85 90 95 Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp 100 105 110 Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp 115 120 125 Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu 130 135 140 Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile 145 150 155 160 Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu 165 170 175 Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr 180 185 190 Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu 195 200 205 Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Gly Gly Gly Ser 210 215 220 Gly Gly Asp Ile Ile Lys Leu Leu Asn Glu Gln Val Asn Lys Glu Met 225 230 235 240 Gln Ser Ser Asn Leu Tyr Met Ser Met Ser Ser Trp Cys Tyr Thr His 245 250 255 Ser Leu Asp Gly Ala Gly Leu Phe Leu Phe Asp His Ala Ala Glu Glu 260 265 270 Tyr Glu His Ala Lys Lys Leu Ile Ile Phe Leu Asn Glu Asn Asn Val 275 280 285 Pro Val Gln Leu Thr Ser Ile Ser Ala Pro Glu His Lys Phe Glu Gly 290 295 300 Leu Thr Gln Ile Phe Gln Lys Ala Tyr Glu His Glu Gln His Ile Ser 305 310 315 320 Glu Ser Ile Asn Asn Ile Val Asp His Ala Ile Lys Ser Lys Asp His 325 330 335 Ala Thr Phe Asn Phe Leu Gln Trp Tyr Val Ala Glu Gln His Glu Glu 340 345 350 Glu Val Leu Phe Lys Asp Ile Leu Asp Lys Ile Glu Leu Ile Gly Asn 355 360 365 Glu Asn His Gly Leu Tyr Leu Ala Asp Gln Tyr Val Lys Gly Ile Ala 370 375 380 Lys Ser Arg Lys Ser Gly Ser 385 390 <210> 66 <211> 1376 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 66 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 ggcauccugc ccagcccugg caugcccgcu cugcugagcc uggugagccu gcugagcgug 120 cugcugaugg gcugcguggc ugagaccggc augcagaucu acgagggcaa gcugaccgca 180 gagggccugc gguucggcau cguggccagc cgcgccaacc acgcucuggu ggaccggcuu 240 guggagggcg cuaucgacgc caucgugaga cacggcggcc gggaagagga caucacccug 300 gugcgggugu gcggcagcug ggagauuccc gucgccgccg gagaacuggc ccggaaggag 360 gacaucgacg ccgugaucgc caucggcgug cugugcagag gcgccacgcc cagcuucgac 420 uacaucgcca gcgaggugag caagggccug gccgaccuga gccuggagcu gcggaagccc 480 aucaccuucg gcgugaucac cgccgacacc cuggagcagg ccaucgaggc cgcaggcacc 540 ugccacggca acaagggcug ggaagccgcc cugugcgcca ucgagauggc caaccuguuc 600 aagagccugc ggggcggaag uggaggcucu gguggcagcg gaggaucugg cggcggccag 660 cccaacauca ccaaccugug ccccuucggc gagguguuca acgccacccg guucgccagc 720 guguacgccu ggaaccggaa gcggaucagc aacugcgugg ccgacuacag cgugcuguac 780 aacagcgcca gcuucagcac cuucaagugc uacggcguga gccccaccaa gcugaacgac 840 cugugcuuca ccaacgugua cgccgacagc uucgugaucc guggcgacga ggugcggcag 900 aucgcacccg gccagacagg caagaucgcc gacuacaacu acaagcugcc cgacgacuuc 960 accggcugcg ugaucgccug gaacagcaac aaccucgaca gcaagguggg cggcaacuac 1020 aacuaccugu accggcuguu ccggaagagc aaccugaagc ccuucgagcg ggacaucagc 1080 accgagaucu accaagccgg cuccaccccu ugcaacggcg uggagggcuu caacugcuac 1140 uucccucugc agagcuacgg cuuccagccc accaacggcg ugggcuacca gcccuaccgg 1200 gugguggugc ugagcuucga gcugcugcac gccccagcca ccgugugugg ccccaaguga 1260 uaauaggcug gagccucggu ggccuagcuu cuugccccuu gggccucccc ccagccccuc 1320 cuccccuucc ugcacccgua cccccguggu cuuugaauaa agucugagug ggcggc 1376 <210> 67 <211> 1200 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 67 augggcaucc ugcccagccc uggcaugccc gcucugcuga gccuggugag ccugcugagc 60 gugcugcuga ugggcugcgu ggcugagacc ggcaugcaga ucuacgaggg caagcugacc 120 gcagagggcc ugcgguucgg caucguggcc agccgcgcca accacgcucu gguggaccgg 180 cuuguggagg gcgcuaucga cgccaucgug agacacggcg gccgggaaga ggacaucacc 240 cuggugcggg ugugcggcag cugggagauu cccgucgccg ccggagaacu ggcccggaag 300 gaggacaucg acgccgugau cgccaucggc gugcugugca gaggcgccac gcccagcuuc 360 gacuacaucg ccagcgaggu gagcaagggc cuggccgacc ugagccugga gcugcggaag 420 cccaucaccu ucggcgugau caccgccgac acccuggagc aggccaucga ggccgcaggc 480 accugccacg gcaacaaggg cugggaagcc gcccugugcg ccaucgagau ggccaaccug 540 uucaagagcc ugcggggcgg aaguggaggc ucugguggca gcggaggauc uggcggcggc 600 cagcccaaca ucaccaaccu gugccccuuc ggcgaggugu ucaacgccac ccgguucgcc 660 agcguguacg ccuggaaccg gaagcggauc agcaacugcg uggccgacua cagcgugcug 720 uacaacagcg ccagcuucag caccuucaag ugcuacggcg ugagccccac caagcugaac 780 gaccugugcu ucaccaacgu guacgccgac agcuucguga uccguggcga cgaggugcgg 840 cagaucgcac ccggccagac aggcaagauc gccgacuaca acuacaagcu gcccgacgac 900 uucaccggcu gcgugaucgc cuggaacagc aacaaccucg acagcaaggu gggcggcaac 960 uacaacuacc uguaccggcu guuccggaag agcaaccuga agcccuucga gcgggacauc 1020 agcaccgaga ucuaccaagc cggcuccacc ccuugcaacg gcguggaggg cuucaacugc 1080 uacuucccuc ugcagagcua cggcuuccag cccaccaacg gcgugggcua ccagcccuac 1140 cggguggugg ugcugagcuu cgagcugcug cacgccccag ccaccgugug uggccccaag 1200 <210> 68 <211> 400 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 68 Met Gly Ile Leu Pro Ser Pro Gly Met Pro Ala Leu Leu Ser Leu Val 1 5 10 15 Ser Leu Leu Ser Val Leu Leu Met Gly Cys Val Ala Glu Thr Gly Met 20 25 30 Gln Ile Tyr Glu Gly Lys Leu Thr Ala Glu Gly Leu Arg Phe Gly Ile 35 40 45 Val Ala Ser Arg Ala Asn His Ala Leu Val Asp Arg Leu Val Glu Gly 50 55 60 Ala Ile Asp Ala Ile Val Arg His Gly Gly Arg Glu Glu Asp Ile Thr 65 70 75 80 Leu Val Arg Val Cys Gly Ser Trp Glu Ile Pro Val Ala Ala Gly Glu 85 90 95 Leu Ala Arg Lys Glu Asp Ile Asp Ala Val Ile Ala Ile Gly Val Leu 100 105 110 Cys Arg Gly Ala Thr Pro Ser Phe Asp Tyr Ile Ala Ser Glu Val Ser 115 120 125 Lys Gly Leu Ala Asp Leu Ser Leu Glu Leu Arg Lys Pro Ile Thr Phe 130 135 140 Gly Val Ile Thr Ala Asp Thr Leu Glu Gln Ala Ile Glu Ala Ala Gly 145 150 155 160 Thr Cys His Gly Asn Lys Gly Trp Glu Ala Ala Leu Cys Ala Ile Glu 165 170 175 Met Ala Asn Leu Phe Lys Ser Leu Arg Gly Gly Ser Gly Gly Ser Gly 180 185 190 Gly Ser Gly Gly Ser Gly Gly Gly Gln Pro Asn Ile Thr Asn Leu Cys 195 200 205 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 210 215 220 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 225 230 235 240 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 245 250 255 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 260 265 270 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 275 280 285 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 290 295 300 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 305 310 315 320 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 325 330 335 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 340 345 350 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 355 360 365 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 370 375 380 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 385 390 395 400 <210> 69 <211> 1334 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 69 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uacagcaugc agcuggcuag cugcgugacc cugacccugg ugcugcuggu gaacagccag 120 cccaacauca ccaaccugug ccccuucggc gagguguuca acgccacccg guucgccagc 180 guguacgccu ggaaccggaa gcggaucagc aacugcgugg ccgacuacag cgugcuguac 240 aacagcgcca gcuucagcac cuucaagugc uacggcguga gccccaccaa gcugaacgac 300 cugugcuuca ccaacgugua cgccgacagc uucgugaucc guggcgacga ggugcggcag 360 aucgcacccg gccagacagg caagaucgcc gacuacaacu acaagcugcc cgacgacuuc 420 accggcugcg ugaucgccug gaacagcaac aaccucgaca gcaagguggg cggcaacuac 480 aacuaccugu accggcuguu ccggaagagc aaccugaagc ccuucgagcg ggacaucagc 540 accgagaucu accaagccgg cuccaccccu ugcaacggcg uggagggcuu caacugcuac 600 uucccucugc agagcuacgg cuuccagccc accaacggcg ugggcuacca gcccuaccgg 660 gugguggugc ugagcuucga gcugcugcac gccccagcca ccgugugugg ccccaaggga 720 ggaggcuccg gaggcgguag cgcugagacc ggcaugcaga ucuacgaggg caagcugacc 780 gcagagggcc ugcgguucgg caucguggcc agccgcgcca accacgcucu gguggaccgg 840 cuuguggagg gcgcuaucga cgccaucgug agacacggcg gccgggaaga ggacaucacc 900 cuggugcggg ugugcggcag cugggagauu cccgucgccg ccggagaacu ggcccggaag 960 gaggacaucg acgccgugau cgccaucggc gugcugugca gaggcgccac gcccagcuuc 1020 gacuacaucg ccagcgaggu gagcaagggc cuggccgacc ugagccugga gcugcggaag 1080 cccaucaccu ucggcgugau caccgccgac acccuggagc aggccaucga ggccgcaggc 1140 accugccacg gcaacaaggg cugggaagcc gcccugugcg ccaucgagau ggccaaccug 1200 uucaagagcc ugcggugaua auaggcugga gccucggugg ccuagcuucu ugccccuugg 1260 gccucccccc agccccuccu ccccuuccug cacccguacc cccguggucu uugaauaaag 1320 ucugaguggg cggc 1334 <210> 70 <211> 1158 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 70 auguacagca ugcagcuggc uagcugcgug acccugaccc uggugcugcu ggugaacagc 60 cagcccaaca ucaccaaccu gugccccuuc ggcgaggugu ucaacgccac ccgguucgcc 120 agcguguacg ccuggaaccg gaagcggauc agcaacugcg uggccgacua cagcgugcug 180 uacaacagcg ccagcuucag caccuucaag ugcuacggcg ugagccccac caagcugaac 240 gaccugugcu ucaccaacgu guacgccgac agcuucguga uccguggcga cgaggugcgg 300 cagaucgcac ccggccagac aggcaagauc gccgacuaca acuacaagcu gcccgacgac 360 uucaccggcu gcgugaucgc cuggaacagc aacaaccucg acagcaaggu gggcggcaac 420 uacaacuacc uguaccggcu guuccggaag agcaaccuga agcccuucga gcgggacauc 480 agcaccgaga ucuaccaagc cggcuccacc ccuugcaacg gcguggaggg cuucaacugc 540 uacuucccuc ugcagagcua cggcuuccag cccaccaacg gcgugggcua ccagcccuac 600 cggguggugg ugcugagcuu cgagcugcug cacgccccag ccaccgugug uggccccaag 660 ggaggaggcu ccggaggcgg uagcgcugag accggcaugc agaucuacga gggcaagcug 720 accgcagagg gccugcgguu cggcaucgug gccagccgcg ccaaccacgc ucugguggac 780 cggcuugugg agggcgcuau cgacgccauc gugagacacg gcggccggga agaggacauc 840 acccuggugc gggugugcgg cagcugggag auucccgucg ccgccggaga acuggcccgg 900 aaggaggaca ucgacgccgu gaucgccauc ggcgugcugu gcagaggcgc cacgcccagc 960 uucgacuaca ucgccagcga ggugagcaag ggccuggccg accugagccu ggagcugcgg 1020 aagcccauca ccuucggcgu gaucaccgcc gacacccugg agcaggccau cgaggccgca 1080 ggcaccugcc acggcaacaa gggcugggaa gccgcccugu gcgccaucga gauggccaac 1140 cuguucaaga gccugcgg 1158 <210> 71 <211> 386 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 71 Met Tyr Ser Met Gln Leu Ala Ser Cys Val Thr Leu Thr Leu Val Leu 1 5 10 15 Leu Val Asn Ser Gln Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu 20 25 30 Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys 35 40 45 Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala 50 55 60 Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn 65 70 75 80 Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly 85 90 95 Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp 100 105 110 Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp 115 120 125 Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu 130 135 140 Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile 145 150 155 160 Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu 165 170 175 Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr 180 185 190 Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu 195 200 205 Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Gly Gly Gly Ser 210 215 220 Gly Gly Gly Ser Ala Glu Thr Gly Met Gln Ile Tyr Glu Gly Lys Leu 225 230 235 240 Thr Ala Glu Gly Leu Arg Phe Gly Ile Val Ala Ser Arg Ala Asn His 245 250 255 Ala Leu Val Asp Arg Leu Val Glu Gly Ala Ile Asp Ala Ile Val Arg 260 265 270 His Gly Gly Arg Glu Glu Asp Ile Thr Leu Val Arg Val Cys Gly Ser 275 280 285 Trp Glu Ile Pro Val Ala Ala Gly Glu Leu Ala Arg Lys Glu Asp Ile 290 295 300 Asp Ala Val Ile Ala Ile Gly Val Leu Cys Arg Gly Ala Thr Pro Ser 305 310 315 320 Phe Asp Tyr Ile Ala Ser Glu Val Ser Lys Gly Leu Ala Asp Leu Ser 325 330 335 Leu Glu Leu Arg Lys Pro Ile Thr Phe Gly Val Ile Thr Ala Asp Thr 340 345 350 Leu Glu Gln Ala Ile Glu Ala Ala Gly Thr Cys His Gly Asn Lys Gly 355 360 365 Trp Glu Ala Ala Leu Cys Ala Ile Glu Met Ala Asn Leu Phe Lys Ser 370 375 380 Leu Arg 385 <210> 72 <211> 947 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 72 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uacagcaugc agcuggcuag cugcgugacc cugacccugg ugcugcuggu gaacagccag 120 cccaacauca ccaaccugug ccccuucggc gagguguuca acgccacccg guucgccagc 180 guguacgccu ggaaccggaa gcggaucagc aacugcgugg ccgacuacag cgugcuguac 240 aacagcgcca gcuucagcac cuucaagugc uacggcguga gccccaccaa gcugaacgac 300 cugugcuuca ccaacgugua cgccgacagc uucgugaucc guggcgacga ggugcggcag 360 aucgcacccg gccagacagg caagaucgcc gacuacaacu acaagcugcc cgacgacuuc 420 accggcugcg ugaucgccug gaacagcaac aaccucgaca gcaagguggg cggcaacuac 480 aacuaccugu accggcuguu ccggaagagc aaccugaagc ccuucgagcg ggacaucagc 540 accgagaucu accaagccgg cuccaccccu ugcaacggcg uggagggcuu caacugcuac 600 uucccucugc agagcuacgg cuuccagccc accaacggcg ugggcuacca gcccuaccgg 660 gugguggugc ugagcuucga gcugcugcac gccccagcca ccgugugugg ccccaagucu 720 ggcggaggcg gcagcgccau cggcggcuac auccccgagg ccccuagaga cggccaggcc 780 uacgugcgga aggacggcga gugggugcug cugagcaccu uccugggcug auaauaggcu 840 ggagccucgg uggccuagcu ucuugccccu ugggccuccc cccagccccu ccuccccuuc 900 cugcacccgu acccccgugg ucuuugaaua aagucugagu gggcggc 947 <210> 73 <211> 771 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 73 auguacagca ugcagcuggc uagcugcgug acccugaccc uggugcugcu ggugaacagc 60 cagcccaaca ucaccaaccu gugccccuuc ggcgaggugu ucaacgccac ccgguucgcc 120 agcguguacg ccuggaaccg gaagcggauc agcaacugcg uggccgacua cagcgugcug 180 uacaacagcg ccagcuucag caccuucaag ugcuacggcg ugagccccac caagcugaac 240 gaccugugcu ucaccaacgu guacgccgac agcuucguga uccguggcga cgaggugcgg 300 cagaucgcac ccggccagac aggcaagauc gccgacuaca acuacaagcu gcccgacgac 360 uucaccggcu gcgugaucgc cuggaacagc aacaaccucg acagcaaggu gggcggcaac 420 uacaacuacc uguaccggcu guuccggaag agcaaccuga agcccuucga gcgggacauc 480 agcaccgaga ucuaccaagc cggcuccacc ccuugcaacg gcguggaggg cuucaacugc 540 uacuucccuc ugcagagcua cggcuuccag cccaccaacg gcgugggcua ccagcccuac 600 cggguggugg ugcugagcuu cgagcugcug cacgccccag ccaccgugug uggccccaag 660 ucuggcggag gcggcagcgc caucggcggc uacauccccg aggccccuag agacggccag 720 gccuacgugc ggaaggacgg cgagugggug cugcugagca ccuuccuggg c 771 <210> 74 <211> 257 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 74 Met Tyr Ser Met Gln Leu Ala Ser Cys Val Thr Leu Thr Leu Val Leu 1 5 10 15 Leu Val Asn Ser Gln Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu 20 25 30 Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys 35 40 45 Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala 50 55 60 Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn 65 70 75 80 Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly 85 90 95 Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp 100 105 110 Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp 115 120 125 Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu 130 135 140 Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile 145 150 155 160 Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu 165 170 175 Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr 180 185 190 Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu 195 200 205 Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Ser Gly Gly Gly 210 215 220 Gly Ser Ala Ile Gly Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln 225 230 235 240 Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu 245 250 255 Gly <210> 75 <211> 920 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 75 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uacagcaugc agcuggcuag cugcgugacc cugacccugg ugcugcuggu gaacagccag 120 cccaacauca ccaaccugug ccccuucggc gagguguuca acgccacccg guucgccagc 180 guguacgccu ggaaccggaa gcggaucagc aacugcgugg ccgacuacag cgugcuguac 240 aacagcgcca gcuucagcac cuucaagugc uacggcguga gccccaccaa gcugaacgac 300 cugugcuuca ccaacgugua cgccgacagc uucgugaucc guggcgacga ggugcggcag 360 aucgcacccg gccagacagg caagaucgcc gacuacaacu acaagcugcc cgacgacuuc 420 accggcugcg ugaucgccug gaacagcaac aaccucgaca gcaagguggg cggcaacuac 480 aacuaccugu accggcuguu ccggaagagc aaccugaagc ccuucgagcg ggacaucagc 540 accgagaucu accaagccgg cuccaccccu ugcaacggcg uggagggcuu caacugcuac 600 uucccucugc agagcuacgg cuuccagccc accaacggcg ugggcuacca gcccuaccgg 660 gugguggugc ugagcuucga gcugcugcac gccccagcca ccgugugugg ccccaagucu 720 ggcggaggca gcauccuggc caucuacagc accguggcca gcagccuggu gcugcuggug 780 agccugggcg ccaucagcuu cugauaauag gcuggagccu cgguggccua gcuucuugcc 840 ccuugggccu ccccccagcc ccuccucccc uuccugcacc cguacccccg uggucuuuga 900 auaaagucug agugggcggc 920 <210> 76 <211> 744 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 76 auguacagca ugcagcuggc uagcugcgug acccugaccc uggugcugcu ggugaacagc 60 cagcccaaca ucaccaaccu gugccccuuc ggcgaggugu ucaacgccac ccgguucgcc 120 agcguguacg ccuggaaccg gaagcggauc agcaacugcg uggccgacua cagcgugcug 180 uacaacagcg ccagcuucag caccuucaag ugcuacggcg ugagccccac caagcugaac 240 gaccugugcu ucaccaacgu guacgccgac agcuucguga uccguggcga cgaggugcgg 300 cagaucgcac ccggccagac aggcaagauc gccgacuaca acuacaagcu gcccgacgac 360 uucaccggcu gcgugaucgc cuggaacagc aacaaccucg acagcaaggu gggcggcaac 420 uacaacuacc uguaccggcu guuccggaag agcaaccuga agcccuucga gcgggacauc 480 agcaccgaga ucuaccaagc cggcuccacc ccuugcaacg gcguggaggg cuucaacugc 540 uacuucccuc ugcagagcua cggcuuccag cccaccaacg gcgugggcua ccagcccuac 600 cggguggugg ugcugagcuu cgagcugcug cacgccccag ccaccgugug uggccccaag 660 ucuggcggag gcagcauccu ggccaucuac agcaccgugg ccagcagccu ggugcugcug 720 gugagccugg gcgccaucag cuuc 744 <210> 77 <211> 248 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 77 Met Tyr Ser Met Gln Leu Ala Ser Cys Val Thr Leu Thr Leu Val Leu 1 5 10 15 Leu Val Asn Ser Gln Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu 20 25 30 Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys 35 40 45 Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala 50 55 60 Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn 65 70 75 80 Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly 85 90 95 Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp 100 105 110 Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp 115 120 125 Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu 130 135 140 Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile 145 150 155 160 Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu 165 170 175 Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr 180 185 190 Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu 195 200 205 Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Ser Gly Gly Gly 210 215 220 Ser Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu 225 230 235 240 Val Ser Leu Gly Ala Ile Ser Phe 245 <210> 78 <211> 1025 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 78 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uacagcaugc agcuggcuag cugcgugacc cugacccugg ugcugcuggu gaacagccag 120 cccaacauca ccaaccugug ccccuucggc gagguguuca acgccacccg guucgccagc 180 guguacgccu ggaaccggaa gcggaucagc aacugcgugg ccgacuacag cgugcuguac 240 aacagcgcca gcuucagcac cuucaagugc uacggcguga gccccaccaa gcugaacgac 300 cugugcuuca ccaacgugua cgccgacagc uucgugaucc guggcgacga ggugcggcag 360 aucgcacccg gccagacagg caagaucgcc gacuacaacu acaagcugcc cgacgacuuc 420 accggcugcg ugaucgccug gaacagcaac aaccucgaca gcaagguggg cggcaacuac 480 aacuaccugu accggcuguu ccggaagagc aaccugaagc ccuucgagcg ggacaucagc 540 accgagaucu accaagccgg cuccaccccu ugcaacggcg uggagggcuu caacugcuac 600 uucccucugc agagcuacgg cuuccagccc accaacggcg ugggcuacca gcccuaccgg 660 gugguggugc ugagcuucga gcugcugcac gccccagcca ccgugugugg ccccaagucu 720 ggcggaggcg gcagcgccau cggcggcuac auccccgagg ccccuagaga cggccaggcc 780 uacgugcgga aggacggcga gugggugcug cugagcaccu uccugggcgg aggcagcauc 840 cuggccaucu acagcaccgu ggccagcagc cuggugcugc uggugagccu gggcgccauc 900 agcuucugau aauaggcugg agccucggug gccuagcuuc uugccccuug ggccuccccc 960 cagccccucc uccccuuccu gcacccguac ccccgugguc uuugaauaaa gucugagugg 1020 gcggc 1025 <210> 79 <211> 849 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 79 auguacagca ugcagcuggc uagcugcgug acccugaccc uggugcugcu ggugaacagc 60 cagcccaaca ucaccaaccu gugccccuuc ggcgaggugu ucaacgccac ccgguucgcc 120 agcguguacg ccuggaaccg gaagcggauc agcaacugcg uggccgacua cagcgugcug 180 uacaacagcg ccagcuucag caccuucaag ugcuacggcg ugagccccac caagcugaac 240 gaccugugcu ucaccaacgu guacgccgac agcuucguga uccguggcga cgaggugcgg 300 cagaucgcac ccggccagac aggcaagauc gccgacuaca acuacaagcu gcccgacgac 360 uucaccggcu gcgugaucgc cuggaacagc aacaaccucg acagcaaggu gggcggcaac 420 uacaacuacc uguaccggcu guuccggaag agcaaccuga agcccuucga gcgggacauc 480 agcaccgaga ucuaccaagc cggcuccacc ccuugcaacg gcguggaggg cuucaacugc 540 uacuucccuc ugcagagcua cggcuuccag cccaccaacg gcgugggcua ccagcccuac 600 cggguggugg ugcugagcuu cgagcugcug cacgccccag ccaccgugug uggccccaag 660 ucuggcggag gcggcagcgc caucggcggc uacauccccg aggccccuag agacggccag 720 gccuacgugc ggaaggacgg cgagugggug cugcugagca ccuuccuggg cggaggcagc 780 auccuggcca ucuacagcac cguggccagc agccuggugc ugcuggugag ccugggcgcc 840 aucagcuuc 849 <210> 80 <211> 283 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 80 Met Tyr Ser Met Gln Leu Ala Ser Cys Val Thr Leu Thr Leu Val Leu 1 5 10 15 Leu Val Asn Ser Gln Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu 20 25 30 Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys 35 40 45 Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala 50 55 60 Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn 65 70 75 80 Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly 85 90 95 Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp 100 105 110 Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp 115 120 125 Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu 130 135 140 Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile 145 150 155 160 Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu 165 170 175 Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr 180 185 190 Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu 195 200 205 Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Ser Gly Gly Gly 210 215 220 Gly Ser Ala Ile Gly Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln 225 230 235 240 Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu 245 250 255 Gly Gly Gly Ser Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu 260 265 270 Val Leu Leu Val Ser Leu Gly Ala Ile Ser Phe 275 280 <210> 81 <211> 1028 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 81 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uacagcaugc agcuggcuag cugcgugacc cugacccugg ugcugcuggu gaacagccag 120 cccaacauca ccaaccugug ccccuucggc gagguguuca acgccacccg guucgccagc 180 guguacgccu ggaaccggaa gcggaucagc aacugcgugg ccgacuacag cgugcuguac 240 aacagcgcca gcuucagcac cuucaagugc uacggcguga gccccaccaa gcugaacgac 300 cugugcuuca ccaacgugua cgccgacagc uucgugaucc guggcgacga ggugcggcag 360 aucgcacccg gccagacagg caagaucgcc gacuacaacu acaagcugcc cgacgacuuc 420 accggcugcg ugaucgccug gaacagcaac aaccucgaca gcaagguggg cggcaacuac 480 aacuaccugu accggcuguu ccggaagagc aaccugaagc ccuucgagcg ggacaucagc 540 accgagaucu accaagccgg cuccaccccu ugcaacggcg uggagggcuu caacugcuac 600 uucccucugc agagcuacgg cuuccagccc accaacggcg ugggcuacca gcccuaccgg 660 gugguggugc ugagcuucga gcugcugcac gccccagcca ccgugugugg ccccaagucu 720 ggcggaggca gcauccuggc caucuacagc accguggcca gcagccuggu gcugcuggug 780 agccugggcg ccaucagcuu cggcggaggc agcgccaucg gcggcuacau ccccgaggcc 840 ccuagagacg gccaggccua cgugcggaag gacggcgagu gggugcugcu gagcaccuuc 900 cugggcaagu gauaauaggc uggagccucg guggccuagc uucuugcccc uugggccucc 960 ccccagcccc uccuccccuu ccugcacccg uacccccgug gucuuugaau aaagucugag 1020 ugggcggc 1028 <210> 82 <211> 852 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 82 auguacagca ugcagcuggc uagcugcgug acccugaccc uggugcugcu ggugaacagc 60 cagcccaaca ucaccaaccu gugccccuuc ggcgaggugu ucaacgccac ccgguucgcc 120 agcguguacg ccuggaaccg gaagcggauc agcaacugcg uggccgacua cagcgugcug 180 uacaacagcg ccagcuucag caccuucaag ugcuacggcg ugagccccac caagcugaac 240 gaccugugcu ucaccaacgu guacgccgac agcuucguga uccguggcga cgaggugcgg 300 cagaucgcac ccggccagac aggcaagauc gccgacuaca acuacaagcu gcccgacgac 360 uucaccggcu gcgugaucgc cuggaacagc aacaaccucg acagcaaggu gggcggcaac 420 uacaacuacc uguaccggcu guuccggaag agcaaccuga agcccuucga gcgggacauc 480 agcaccgaga ucuaccaagc cggcuccacc ccuugcaacg gcguggaggg cuucaacugc 540 uacuucccuc ugcagagcua cggcuuccag cccaccaacg gcgugggcua ccagcccuac 600 cggguggugg ugcugagcuu cgagcugcug cacgccccag ccaccgugug uggccccaag 660 ucuggcggag gcagcauccu ggccaucuac agcaccgugg ccagcagccu ggugcugcug 720 gugagccugg gcgccaucag cuucggcgga ggcagcgcca ucggcggcua cauccccgag 780 gccccuagag acggccaggc cuacgugcgg aaggacggcg agugggugcu gcugagcacc 840 uuccugggca ag 852 <210> 83 <211> 284 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 83 Met Tyr Ser Met Gln Leu Ala Ser Cys Val Thr Leu Thr Leu Val Leu 1 5 10 15 Leu Val Asn Ser Gln Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu 20 25 30 Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys 35 40 45 Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala 50 55 60 Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn 65 70 75 80 Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly 85 90 95 Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp 100 105 110 Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp 115 120 125 Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu 130 135 140 Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile 145 150 155 160 Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu 165 170 175 Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr 180 185 190 Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu 195 200 205 Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Ser Gly Gly Gly 210 215 220 Ser Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu 225 230 235 240 Val Ser Leu Gly Ala Ile Ser Phe Gly Gly Gly Ser Ala Ile Gly Gly 245 250 255 Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr Val Arg Lys Asp 260 265 270 Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly Lys 275 280 <210> 84 <211> 1142 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 84 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uacagcaugc agcuggcuag cugcgugacc cugacccugg ugcugcuggu gaacagccag 120 cgggugcagc ccaccgagag caucgugcgg uuccccaaca ucaccaaccu gugccccuuc 180 ggcgaggugu ucaacgccac ccgguucgcc agcguguacg ccuggaaccg gaagcggauc 240 agcaacugcg uggccgacua cagcgugcug uacaacagcg ccagcuucag caccuucaag 300 ugcuacggcg ugagccccac caagcugaac gaccugugcu ucaccaacgu guacgccgac 360 agcuucguga uccguggcga cgaggugcgg cagaucgcac ccggccagac aggcaagauc 420 gccgacuaca acuacaagcu gcccgacgac uucaccggcu gcgugaucgc cuggaacagc 480 aacaaccucg acagcaaggu gggcggcaac uacaacuacc uguaccggcu guuccggaag 540 agcaaccuga agcccuucga gcgggacauc agcaccgaga ucuaccaagc cggcuccacc 600 ccuugcaacg gcguggaggg cuucaacugc uacuucccuc ugcagagcua cggcuuccag 660 cccaccaacg gcgugggcua ccagcccuac cggguggugg ugcugagcuu cgagcugcug 720 cacgccccag ccaccgugug uggccccaag aagagcacca accuggugaa gaacaagugc 780 gugaacuuca acuucaacgg ccuuaccggc accggcgugc ugaccgagag caacaagaaa 840 uuccugcccu uucagcaguu cggccgggac aucgccgaca ccaccgacgc ugugcgggau 900 ccccagaccc uggagauccu ggacaucacc ccuugcagcu cuggcggagg cagcauccug 960 gccaucuaca gcaccguggc cagcagccug gugcugcugg ugagccuggg cgccaucagc 1020 uucugauaau aggcuggagc cucgguggcc uagcuucuug ccccuugggc cuccccccag 1080 ccccuccucc ccuuccugca cccguacccc cguggucuuu gaauaaaguc ugagugggcg 1140 gc 1142 <210> 85 <211> 966 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 85 auguacagca ugcagcuggc uagcugcgug acccugaccc uggugcugcu ggugaacagc 60 cagcgggugc agcccaccga gagcaucgug cgguucccca acaucaccaa ccugugcccc 120 uucggcgagg uguucaacgc cacccgguuc gccagcgugu acgccuggaa ccggaagcgg 180 aucagcaacu gcguggccga cuacagcgug cuguacaaca gcgccagcuu cagcaccuuc 240 aagugcuacg gcgugagccc caccaagcug aacgaccugu gcuucaccaa cguguacgcc 300 gacagcuucg ugauccgugg cgacgaggug cggcagaucg cacccggcca gacaggcaag 360 aucgccgacu acaacuacaa gcugcccgac gacuucaccg gcugcgugau cgccuggaac 420 agcaacaacc ucgacagcaa ggugggcggc aacuacaacu accuguaccg gcuguuccgg 480 aagagcaacc ugaagcccuu cgagcgggac aucagcaccg agaucuacca agccggcucc 540 accccuugca acggcgugga gggcuucaac ugcuacuucc cucugcagag cuacggcuuc 600 cagcccacca acggcguggg cuaccagccc uaccgggugg uggugcugag cuucgagcug 660 cugcacgccc cagccaccgu guguggcccc aagaagagca ccaaccuggu gaagaacaag 720 ugcgugaacu ucaacuucaa cggccuuacc ggcaccggcg ugcugaccga gagcaacaag 780 aaauuccugc ccuuucagca guucggccgg gacaucgccg acaccaccga cgcugugcgg 840 gauccccaga cccuggagau ccuggacauc accccuugca gcucuggcgg aggcagcauc 900 cuggccaucu acagcaccgu ggccagcagc cuggugcugc uggugagccu gggcgccauc 960 agcuuc 966 <210> 86 <211> 322 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 86 Met Tyr Ser Met Gln Leu Ala Ser Cys Val Thr Leu Thr Leu Val Leu 1 5 10 15 Leu Val Asn Ser Gln Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe 20 25 30 Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr 35 40 45 Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys 50 55 60 Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe 65 70 75 80 Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr 85 90 95 Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln 100 105 110 Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu 115 120 125 Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu 130 135 140 Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg 145 150 155 160 Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr 165 170 175 Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr 180 185 190 Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr 195 200 205 Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro 210 215 220 Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys 225 230 235 240 Cys Val Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr 245 250 255 Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile 260 265 270 Ala Asp Thr Thr Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu 275 280 285 Asp Ile Thr Pro Cys Ser Ser Gly Gly Gly Ser Ile Leu Ala Ile Tyr 290 295 300 Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val Ser Leu Gly Ala Ile 305 310 315 320 Ser Phe <210> 87 <211> 1142 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 87 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uacagcaugc agcuggcuag cugcgugacc cugacccugg ugcugcuggu gaacagccag 120 cgggugcagc ccaccgagag caucgugcgg uuccccaaca ucaccaaccu gugccccuuc 180 ggcgaggugu ucaacgccac ccgguucgcc agcguguacg ccuggaaccg gaagcggauc 240 agcaacugcg uggccgacua cagcgugcug uacaacagcg ccagcuucag caccuucaag 300 ugcuacggcg ugagccccac caagcugaac gaccugugcu ucaccaacgu guacgccgac 360 agcuucguga uccguggcga cgaggugcgg cagaucgcac ccggccagac aggcaagauc 420 gccgacuaca acuacaagcu gcccgacgac uucaccggcu gcgugaucgc cuggaacagc 480 aacaaccucg acagcaaggu gggcggcaac uacaacuacc uguaccggcu guuccggaag 540 agcaaccuga agcccuucga gcgggacauc agcaccgaga ucuaccaagc cggcuccacc 600 ccuugcaacg gcguggaggg cuucaacugc uacuucccuc ugcagagcua cggcuuccag 660 cccaccaacg gcgugggcua ccagcccuac cggguggugg ugcugagcuu cgagcugcug 720 cacgccccag ccaccgugug uggccccaag aagagcacca accuggugaa gaacaagugc 780 gugaacuuca acuucaacgg ccuuaccggc accggcgugc ugaccgagag caacaagaaa 840 uuccugcccu uuugccaguu cggccgggac aucgccgaca ccaccgacgc ugugcgggau 900 ccccagaccc uggagauccu ggacaucacc ccuugcagcu cuggcggagg cagcauccug 960 gccaucuaca gcaccguggc cagcagccug gugcugcugg ugagccuggg cgccaucagc 1020 uucugauaau aggcuggagc cucgguggcc uagcuucuug ccccuugggc cuccccccag 1080 ccccuccucc ccuuccugca cccguacccc cguggucuuu gaauaaaguc ugagugggcg 1140 gc 1142 <210> 88 <211> 966 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 88 auguacagca ugcagcuggc uagcugcgug acccugaccc uggugcugcu ggugaacagc 60 cagcgggugc agcccaccga gagcaucgug cgguucccca acaucaccaa ccugugcccc 120 uucggcgagg uguucaacgc cacccgguuc gccagcgugu acgccuggaa ccggaagcgg 180 aucagcaacu gcguggccga cuacagcgug cuguacaaca gcgccagcuu cagcaccuuc 240 aagugcuacg gcgugagccc caccaagcug aacgaccugu gcuucaccaa cguguacgcc 300 gacagcuucg ugauccgugg cgacgaggug cggcagaucg cacccggcca gacaggcaag 360 aucgccgacu acaacuacaa gcugcccgac gacuucaccg gcugcgugau cgccuggaac 420 agcaacaacc ucgacagcaa ggugggcggc aacuacaacu accuguaccg gcuguuccgg 480 aagagcaacc ugaagcccuu cgagcgggac aucagcaccg agaucuacca agccggcucc 540 accccuugca acggcgugga gggcuucaac ugcuacuucc cucugcagag cuacggcuuc 600 cagcccacca acggcguggg cuaccagccc uaccgggugg uggugcugag cuucgagcug 660 cugcacgccc cagccaccgu guguggcccc aagaagagca ccaaccuggu gaagaacaag 720 ugcgugaacu ucaacuucaa cggccuuacc ggcaccggcg ugcugaccga gagcaacaag 780 aaauuccugc ccuuuugcca guucggccgg gacaucgccg acaccaccga cgcugugcgg 840 gauccccaga cccuggagau ccuggacauc accccuugca gcucuggcgg aggcagcauc 900 cuggccaucu acagcaccgu ggccagcagc cuggugcugc uggugagccu gggcgccauc 960 agcuuc 966 <210> 89 <211> 322 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 89 Met Tyr Ser Met Gln Leu Ala Ser Cys Val Thr Leu Thr Leu Val Leu 1 5 10 15 Leu Val Asn Ser Gln Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe 20 25 30 Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr 35 40 45 Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys 50 55 60 Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe 65 70 75 80 Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr 85 90 95 Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln 100 105 110 Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu 115 120 125 Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu 130 135 140 Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg 145 150 155 160 Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr 165 170 175 Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr 180 185 190 Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr 195 200 205 Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro 210 215 220 Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys 225 230 235 240 Cys Val Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr 245 250 255 Glu Ser Asn Lys Lys Phe Leu Pro Phe Cys Gln Phe Gly Arg Asp Ile 260 265 270 Ala Asp Thr Thr Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu 275 280 285 Asp Ile Thr Pro Cys Ser Ser Gly Gly Gly Ser Ile Leu Ala Ile Tyr 290 295 300 Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val Ser Leu Gly Ala Ile 305 310 315 320 Ser Phe <210> 90 <211> 1748 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 90 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120 acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180 guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240 gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300 cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360 cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420 aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480 ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540 agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600 aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660 aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720 gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780 cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840 gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900 aacggcacca ucaccgacgc cguggacgga ggcggaucgg gaggcggacc caacaucacc 960 aaccugugcc ccuucggcga gguguucaac gccacccggu ucgccagcgu guacgccugg 1020 aaccggaagc ggaucagcaa cugcguggcc gacuacagcg ugcuguacaa cagcgccagc 1080 uucagcaccu ucaagugcua cggcgugagc cccaccaagc ugaacgaccu gugcuucacc 1140 aacguguacg ccgacagcuu cgugauccgu ggcgacgagg ugcggcagau cgcacccggc 1200 cagacaggca agaucgccga cuacaacuac aagcugcccg acgacuucac cggcugcgug 1260 aucgccugga acagcaacaa ccucgacagc aaggugggcg gcaacuacaa cuaccuguac 1320 cggcuguucc ggaagagcaa ccugaagccc uucgagcggg acaucagcac cgagaucuac 1380 caagccggcu ccaccccuug caacggcgug gagggcuuca acugcuacuu cccucugcag 1440 agcuacggcu uccagcccac caacggcgug ggcuaccagc ccuaccgggu gguggugcug 1500 agcuucgagc ugcugcacgc cccagccacc guguguggcc ccaagucugg cggaggcagc 1560 auccuggcca ucuacagcac cguggccagc agccuggugc ugcuggugag ccugggcgcc 1620 aucagcuucu gauaauaggc uggagccucg guggccuagc uucuugcccc uugggccucc 1680 ccccagcccc uccuccccuu ccugcacccg uacccccgug gucuuugaau aaagucugag 1740 ugggcggc 1748 <210> 91 <211> 1572 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 91 auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60 cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120 aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180 aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240 aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300 auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360 aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420 cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480 agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540 ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600 uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660 ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720 cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780 ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840 gagaacggca ccaucaccga cgccguggac ggaggcggau cgggaggcgg acccaacauc 900 accaaccugu gccccuucgg cgagguguuc aacgccaccc gguucgccag cguguacgcc 960 uggaaccgga agcggaucag caacugcgug gccgacuaca gcgugcugua caacagcgcc 1020 agcuucagca ccuucaagug cuacggcgug agccccacca agcugaacga ccugugcuuc 1080 accaacgugu acgccgacag cuucgugauc cguggcgacg aggugcggca gaucgcaccc 1140 ggccagacag gcaagaucgc cgacuacaac uacaagcugc ccgacgacuu caccggcugc 1200 gugaucgccu ggaacagcaa caaccucgac agcaaggugg gcggcaacua caacuaccug 1260 uaccggcugu uccggaagag caaccugaag cccuucgagc gggacaucag caccgagauc 1320 uaccaagccg gcuccacccc uugcaacggc guggagggcu ucaacugcua cuucccucug 1380 cagagcuacg gcuuccagcc caccaacggc gugggcuacc agcccuaccg ggugguggug 1440 cugagcuucg agcugcugca cgccccagcc accgugugug gccccaaguc uggcggaggc 1500 agcauccugg ccaucuacag caccguggcc agcagccugg ugcugcuggu gagccugggc 1560 gccaucagcu uc 1572 <210> 92 <211> 524 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 92 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Gly Gly Gly Ser Gly Gly Gly Pro Asn Ile Thr Asn Leu Cys 290 295 300 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 305 310 315 320 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 325 330 335 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 340 345 350 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 355 360 365 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 370 375 380 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 385 390 395 400 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 405 410 415 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 420 425 430 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 435 440 445 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 450 455 460 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 465 470 475 480 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 485 490 495 Ser Gly Gly Gly Ser Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser 500 505 510 Leu Val Leu Leu Val Ser Leu Gly Ala Ile Ser Phe 515 520 <210> 93 <211> 1925 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 93 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120 acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180 guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240 gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300 cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360 cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420 aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480 ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540 agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600 aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660 aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720 gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780 cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840 gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900 aacggcacca ucaccgacgc cguggacgga ggcggaucgg gaggcggacc caacaucacc 960 aaccugugcc ccuucggcga gguguucaac gccacccggu ucgccagcgu guacgccugg 1020 aaccggaagc ggaucagcaa cugcguggcc gacuacagcg ugcuguacaa cagcgccagc 1080 uucagcaccu ucaagugcua cggcgugagc cccaccaagc ugaacgaccu gugcuucacc 1140 aacguguacg ccgacagcuu cgugauccgu ggcgacgagg ugcggcagau cgcacccggc 1200 cagacaggca agaucgccga cuacaacuac aagcugcccg acgacuucac cggcugcgug 1260 aucgccugga acagcaacaa ccucgacagc aaggugggcg gcaacuacaa cuaccuguac 1320 cggcuguucc ggaagagcaa ccugaagccc uucgagcggg acaucagcac cgagaucuac 1380 caagccggcu ccaccccuug caacggcgug gagggcuuca acugcuacuu cccucugcag 1440 agcuacggcu uccagcccac caacggcgug ggcuaccagc ccuaccgggu gguggugcug 1500 agcuucgagc ugcugcacgc cccagccacc guguguggcc ccaagucugg cggaggcagc 1560 auccuggcca ucuacagcac cguggccagc agccuggugc ugcuggugag ccugggcgcc 1620 aucagcuuca agaagaagaa gcggccacgg aacuccuaca agugcggcac caacaccaug 1680 gagcgggagg agagcgagca gaccaagaag cgggagaaga uccacauucc ugaacggucc 1740 gacgaagccc agcggguguu caagagcagc aagaccagca gcugcgacaa gagcgacacc 1800 ugcuucugau aauaggcugg agccucggug gccuagcuuc uugccccuug ggccuccccc 1860 cagccccucc uccccuuccu gcacccguac ccccgugguc uuugaauaaa gucugagugg 1920 gcggc 1925 <210> 94 <211> 1749 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 94 auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60 cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120 aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180 aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240 aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300 auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360 aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420 cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480 agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540 ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600 uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660 ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720 cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780 ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840 gagaacggca ccaucaccga cgccguggac ggaggcggau cgggaggcgg acccaacauc 900 accaaccugu gccccuucgg cgagguguuc aacgccaccc gguucgccag cguguacgcc 960 uggaaccgga agcggaucag caacugcgug gccgacuaca gcgugcugua caacagcgcc 1020 agcuucagca ccuucaagug cuacggcgug agccccacca agcugaacga ccugugcuuc 1080 accaacgugu acgccgacag cuucgugauc cguggcgacg aggugcggca gaucgcaccc 1140 ggccagacag gcaagaucgc cgacuacaac uacaagcugc ccgacgacuu caccggcugc 1200 gugaucgccu ggaacagcaa caaccucgac agcaaggugg gcggcaacua caacuaccug 1260 uaccggcugu uccggaagag caaccugaag cccuucgagc gggacaucag caccgagauc 1320 uaccaagccg gcuccacccc uugcaacggc guggagggcu ucaacugcua cuucccucug 1380 cagagcuacg gcuuccagcc caccaacggc gugggcuacc agcccuaccg ggugguggug 1440 cugagcuucg agcugcugca cgccccagcc accgugugug gccccaaguc uggcggaggc 1500 agcauccugg ccaucuacag caccguggcc agcagccugg ugcugcuggu gagccugggc 1560 gccaucagcu ucaagaagaa gaagcggcca cggaacuccu acaagugcgg caccaacacc 1620 auggagcggg aggagagcga gcagaccaag aagcgggaga agauccacau uccugaacgg 1680 uccgacgaag cccagcgggu guucaagagc agcaagacca gcagcugcga caagagcgac 1740 accugcuuc 1749 <210> 95 <211> 583 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 95 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Gly Gly Gly Ser Gly Gly Gly Pro Asn Ile Thr Asn Leu Cys 290 295 300 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 305 310 315 320 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 325 330 335 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 340 345 350 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 355 360 365 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 370 375 380 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 385 390 395 400 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 405 410 415 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 420 425 430 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 435 440 445 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 450 455 460 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 465 470 475 480 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 485 490 495 Ser Gly Gly Gly Ser Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser 500 505 510 Leu Val Leu Leu Val Ser Leu Gly Ala Ile Ser Phe Lys Lys Lys Lys 515 520 525 Arg Pro Arg Asn Ser Tyr Lys Cys Gly Thr Asn Thr Met Glu Arg Glu 530 535 540 Glu Ser Glu Gln Thr Lys Lys Arg Glu Lys Ile His Ile Pro Glu Arg 545 550 555 560 Ser Asp Glu Ala Gln Arg Val Phe Lys Ser Ser Lys Thr Ser Ser Cys 565 570 575 Asp Lys Ser Asp Thr Cys Phe 580 <210> 96 <211> 1805 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 96 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120 acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180 guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240 gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300 cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360 cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420 aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480 ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540 agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600 aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660 aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720 gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780 cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840 gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900 aacggcacca ucaccgacgc cguggacgga ggcggaucgg gaggcggacc caacaucacc 960 aaccugugcc ccuucggcga gguguucaac gccacccggu ucgccagcgu guacgccugg 1020 aaccggaagc ggaucagcaa cugcguggcc gacuacagcg ugcuguacaa cagcgccagc 1080 uucagcaccu ucaagugcua cggcgugagc cccaccaagc ugaacgaccu gugcuucacc 1140 aacguguacg ccgacagcuu cgugauccgu ggcgacgagg ugcggcagau cgcacccggc 1200 cagacaggca agaucgccga cuacaacuac aagcugcccg acgacuucac cggcugcgug 1260 aucgccugga acagcaacaa ccucgacagc aaggugggcg gcaacuacaa cuaccuguac 1320 cggcuguucc ggaagagcaa ccugaagccc uucgagcggg acaucagcac cgagaucuac 1380 caagccggcu ccaccccuug caacggcgug gagggcuuca acugcuacuu cccucugcag 1440 agcuacggcu uccagcccac caacggcgug ggcuaccagc ccuaccgggu gguggugcug 1500 agcuucgagc ugcugcacgc cccagccacc guguguggcc ccaagucugg cggaggcagc 1560 auccuggcca ucuacagcac cguggccagc agccuggugc ugcuggugag ccugggcgcc 1620 aucagcuuca agcggcagua caaggacaug augagcgagg gaggaccacc uggcgcugag 1680 ccacagugau aauaggcugg agccucggug gccuagcuuc uugccccuug ggccuccccc 1740 cagccccucc uccccuuccu gcacccguac ccccgugguc uuugaauaaa gucugagugg 1800 gcggc 1805 <210> 97 <211> 1629 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 97 auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60 cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120 aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180 aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240 aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300 auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360 aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420 cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480 agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540 ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600 uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660 ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720 cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780 ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840 gagaacggca ccaucaccga cgccguggac ggaggcggau cgggaggcgg acccaacauc 900 accaaccugu gccccuucgg cgagguguuc aacgccaccc gguucgccag cguguacgcc 960 uggaaccgga agcggaucag caacugcgug gccgacuaca gcgugcugua caacagcgcc 1020 agcuucagca ccuucaagug cuacggcgug agccccacca agcugaacga ccugugcuuc 1080 accaacgugu acgccgacag cuucgugauc cguggcgacg aggugcggca gaucgcaccc 1140 ggccagacag gcaagaucgc cgacuacaac uacaagcugc ccgacgacuu caccggcugc 1200 gugaucgccu ggaacagcaa caaccucgac agcaaggugg gcggcaacua caacuaccug 1260 uaccggcugu uccggaagag caaccugaag cccuucgagc gggacaucag caccgagauc 1320 uaccaagccg gcuccacccc uugcaacggc guggagggcu ucaacugcua cuucccucug 1380 cagagcuacg gcuuccagcc caccaacggc gugggcuacc agcccuaccg ggugguggug 1440 cugagcuucg agcugcugca cgccccagcc accgugugug gccccaaguc uggcggaggc 1500 agcauccugg ccaucuacag caccguggcc agcagccugg ugcugcuggu gagccugggc 1560 gccaucagcu ucaagcggca guacaaggac augaugagcg agggaggacc accuggcgcu 1620 gagccacag 1629 <210> 98 <211> 543 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 98 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Gly Gly Gly Ser Gly Gly Gly Pro Asn Ile Thr Asn Leu Cys 290 295 300 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 305 310 315 320 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 325 330 335 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 340 345 350 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 355 360 365 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 370 375 380 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 385 390 395 400 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 405 410 415 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 420 425 430 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 435 440 445 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 450 455 460 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 465 470 475 480 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 485 490 495 Ser Gly Gly Gly Ser Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser 500 505 510 Leu Val Leu Leu Val Ser Leu Gly Ala Ile Ser Phe Lys Arg Gln Tyr 515 520 525 Lys Asp Met Met Ser Glu Gly Gly Pro Pro Gly Ala Glu Pro Gln 530 535 540 <210> 99 <211> 1853 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 99 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120 acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180 guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240 gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300 cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360 cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420 aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480 ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540 agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600 aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660 aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720 gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780 cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840 gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900 aacggcacca ucaccgacgc cguggacgga ggcggaucgg gaggcggacc caacaucacc 960 aaccugugcc ccuucggcga gguguucaac gccacccggu ucgccagcgu guacgccugg 1020 aaccggaagc ggaucagcaa cugcguggcc gacuacagcg ugcuguacaa cagcgccagc 1080 uucagcaccu ucaagugcua cggcgugagc cccaccaagc ugaacgaccu gugcuucacc 1140 aacguguacg ccgacagcuu cgugauccgu ggcgacgagg ugcggcagau cgcacccggc 1200 cagacaggca agaucgccga cuacaacuac aagcugcccg acgacuucac cggcugcgug 1260 aucgccugga acagcaacaa ccucgacagc aaggugggcg gcaacuacaa cuaccuguac 1320 cggcuguucc ggaagagcaa ccugaagccc uucgagcggg acaucagcac cgagaucuac 1380 caagccggcu ccaccccuug caacggcgug gagggcuuca acugcuacuu cccucugcag 1440 agcuacggcu uccagcccac caacggcgug ggcuaccagc ccuaccgggu gguggugcug 1500 agcuucgagc ugcugcacgc cccagccacc guguguggcc ccaagucugg cggaggcggc 1560 agcgccaucg gcggcuacau ccccgaggcc ccuagagacg gccaggccua cgugcggaag 1620 gacggcgagu gggugcugcu gagcaccuuc cugggcggag gcagcauccu ggccaucuac 1680 agcaccgugg ccagcagccu ggugcugcug gugagccugg gcgccaucag cuucugauaa 1740 uaggcuggag ccucgguggc cuagcuucuu gccccuuggg ccucccccca gccccuccuc 1800 cccuuccugc acccguaccc ccguggucuu ugaauaaagu cugagugggc ggc 1853 <210> 100 <211> 1677 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 100 auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60 cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120 aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180 aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240 aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300 auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360 aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420 cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480 agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540 ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600 uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660 ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720 cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780 ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840 gagaacggca ccaucaccga cgccguggac ggaggcggau cgggaggcgg acccaacauc 900 accaaccugu gccccuucgg cgagguguuc aacgccaccc gguucgccag cguguacgcc 960 uggaaccgga agcggaucag caacugcgug gccgacuaca gcgugcugua caacagcgcc 1020 agcuucagca ccuucaagug cuacggcgug agccccacca agcugaacga ccugugcuuc 1080 accaacgugu acgccgacag cuucgugauc cguggcgacg aggugcggca gaucgcaccc 1140 ggccagacag gcaagaucgc cgacuacaac uacaagcugc ccgacgacuu caccggcugc 1200 gugaucgccu ggaacagcaa caaccucgac agcaaggugg gcggcaacua caacuaccug 1260 uaccggcugu uccggaagag caaccugaag cccuucgagc gggacaucag caccgagauc 1320 uaccaagccg gcuccacccc uugcaacggc guggagggcu ucaacugcua cuucccucug 1380 cagagcuacg gcuuccagcc caccaacggc gugggcuacc agcccuaccg ggugguggug 1440 cugagcuucg agcugcugca cgccccagcc accgugugug gccccaaguc uggcggaggc 1500 ggcagcgcca ucggcggcua cauccccgag gccccuagag acggccaggc cuacgugcgg 1560 aaggacggcg agugggugcu gcugagcacc uuccugggcg gaggcagcau ccuggccauc 1620 uacagcaccg uggccagcag ccuggugcug cuggugagcc ugggcgccau cagcuuc 1677 <210> 101 <211> 559 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 101 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Gly Gly Gly Ser Gly Gly Gly Pro Asn Ile Thr Asn Leu Cys 290 295 300 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 305 310 315 320 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 325 330 335 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 340 345 350 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 355 360 365 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 370 375 380 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 385 390 395 400 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 405 410 415 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 420 425 430 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 435 440 445 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 450 455 460 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 465 470 475 480 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 485 490 495 Ser Gly Gly Gly Gly Ser Ala Ile Gly Gly Tyr Ile Pro Glu Ala Pro 500 505 510 Arg Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu 515 520 525 Ser Thr Phe Leu Gly Gly Gly Ser Ile Leu Ala Ile Tyr Ser Thr Val 530 535 540 Ala Ser Ser Leu Val Leu Leu Val Ser Leu Gly Ala Ile Ser Phe 545 550 555 <210> 102 <211> 1856 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 102 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120 acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180 guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240 gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300 cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360 cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420 aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480 ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540 agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600 aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660 aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720 gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780 cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840 gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900 aacggcacca ucaccgacgc cguggacgga ggcggaucgg gaggcggacc caacaucacc 960 aaccugugcc ccuucggcga gguguucaac gccacccggu ucgccagcgu guacgccugg 1020 aaccggaagc ggaucagcaa cugcguggcc gacuacagcg ugcuguacaa cagcgccagc 1080 uucagcaccu ucaagugcua cggcgugagc cccaccaagc ugaacgaccu gugcuucacc 1140 aacguguacg ccgacagcuu cgugauccgu ggcgacgagg ugcggcagau cgcacccggc 1200 cagacaggca agaucgccga cuacaacuac aagcugcccg acgacuucac cggcugcgug 1260 aucgccugga acagcaacaa ccucgacagc aaggugggcg gcaacuacaa cuaccuguac 1320 cggcuguucc ggaagagcaa ccugaagccc uucgagcggg acaucagcac cgagaucuac 1380 caagccggcu ccaccccuug caacggcgug gagggcuuca acugcuacuu cccucugcag 1440 agcuacggcu uccagcccac caacggcgug ggcuaccagc ccuaccgggu gguggugcug 1500 agcuucgagc ugcugcacgc cccagccacc guguguggcc ccaagucugg cggaggcagc 1560 auccuggcca ucuacagcac cguggccagc agccuggugc ugcuggugag ccugggcgcc 1620 aucagcuucg gcggaggcag cgccaucggc ggcuacaucc ccgaggcccc uagagacggc 1680 caggccuacg ugcggaagga cggcgagugg gugcugcuga gcaccuuccu gggcaaguga 1740 uaauaggcug gagccucggu ggccuagcuu cuugccccuu gggccucccc ccagccccuc 1800 cuccccuucc ugcacccgua cccccguggu cuuugaauaa agucugagug ggcggc 1856 <210> 103 <211> 1680 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 103 auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60 cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120 aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180 aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240 aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300 auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360 aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420 cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480 agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540 ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600 uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660 ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720 cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780 ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840 gagaacggca ccaucaccga cgccguggac ggaggcggau cgggaggcgg acccaacauc 900 accaaccugu gccccuucgg cgagguguuc aacgccaccc gguucgccag cguguacgcc 960 uggaaccgga agcggaucag caacugcgug gccgacuaca gcgugcugua caacagcgcc 1020 agcuucagca ccuucaagug cuacggcgug agccccacca agcugaacga ccugugcuuc 1080 accaacgugu acgccgacag cuucgugauc cguggcgacg aggugcggca gaucgcaccc 1140 ggccagacag gcaagaucgc cgacuacaac uacaagcugc ccgacgacuu caccggcugc 1200 gugaucgccu ggaacagcaa caaccucgac agcaaggugg gcggcaacua caacuaccug 1260 uaccggcugu uccggaagag caaccugaag cccuucgagc gggacaucag caccgagauc 1320 uaccaagccg gcuccacccc uugcaacggc guggagggcu ucaacugcua cuucccucug 1380 cagagcuacg gcuuccagcc caccaacggc gugggcuacc agcccuaccg ggugguggug 1440 cugagcuucg agcugcugca cgccccagcc accgugugug gccccaaguc uggcggaggc 1500 agcauccugg ccaucuacag caccguggcc agcagccugg ugcugcuggu gagccugggc 1560 gccaucagcu ucggcggagg cagcgccauc ggcggcuaca uccccgaggc cccuagagac 1620 ggccaggccu acgugcggaa ggacggcgag ugggugcugc ugagcaccuu ccugggcaag 1680 <210> 104 <211> 560 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 104 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Gly Gly Gly Ser Gly Gly Gly Pro Asn Ile Thr Asn Leu Cys 290 295 300 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 305 310 315 320 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 325 330 335 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 340 345 350 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 355 360 365 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 370 375 380 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 385 390 395 400 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 405 410 415 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 420 425 430 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 435 440 445 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 450 455 460 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 465 470 475 480 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 485 490 495 Ser Gly Gly Gly Ser Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser 500 505 510 Leu Val Leu Leu Val Ser Leu Gly Ala Ile Ser Phe Gly Gly Gly Ser 515 520 525 Ala Ile Gly Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr 530 535 540 Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly Lys 545 550 555 560 <210> 105 <211> 1826 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 105 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120 acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180 guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240 gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300 cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360 cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420 aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480 ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540 agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600 aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660 aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720 gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780 cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840 gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900 aacggcacca ucaccgacgc cguggacgga ggcggaucgg gaggcggacc caacaucacc 960 aaccugugcc ccuucggcga gguguucaac gccacccggu ucgccagcgu guacgccugg 1020 aaccggaagc ggaucagcaa cugcguggcc gacuacagcg ugcuguacaa cagcgccagc 1080 uucagcaccu ucaagugcua cggcgugagc cccaccaagc ugaacgaccu gugcuucacc 1140 aacguguacg ccgacagcuu cgugauccgu ggcgacgagg ugcggcagau cgcacccggc 1200 cagacaggca agaucgccga cuacaacuac aagcugcccg acgacuucac cggcugcgug 1260 aucgccugga acagcaacaa ccucgacagc aaggugggcg gcaacuacaa cuaccuguac 1320 cggcuguucc ggaagagcaa ccugaagccc uucgagcggg acaucagcac cgagaucuac 1380 caagccggcu ccaccccuug caacggcgug gagggcuuca acugcuacuu cccucugcag 1440 agcuacggcu uccagcccac caacggcgug ggcuaccagc ccuaccgggu gguggugcug 1500 agcuucgagc ugcugcacgc cccagccacc guguguggcc ccaagucugg cggaggcagc 1560 auccuggcca ucuacagccu gggcuucauc gccggccuga ucgccaucgu gauggugacc 1620 aucaugcugu gcugcaugac cagcugcugc agcugccuga agggcuguug cagcugcggc 1680 agcugcugca aguucgacga ggacgacuga uaauaggcug gagccucggu ggccuagcuu 1740 cuugccccuu gggccucccc ccagccccuc cuccccuucc ugcacccgua cccccguggu 1800 cuuugaauaa agucugagug ggcggc 1826 <210> 106 <211> 1650 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 106 auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60 cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120 aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180 aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240 aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300 auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360 aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420 cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480 agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540 ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600 uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660 ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720 cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780 ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840 gagaacggca ccaucaccga cgccguggac ggaggcggau cgggaggcgg acccaacauc 900 accaaccugu gccccuucgg cgagguguuc aacgccaccc gguucgccag cguguacgcc 960 uggaaccgga agcggaucag caacugcgug gccgacuaca gcgugcugua caacagcgcc 1020 agcuucagca ccuucaagug cuacggcgug agccccacca agcugaacga ccugugcuuc 1080 accaacgugu acgccgacag cuucgugauc cguggcgacg aggugcggca gaucgcaccc 1140 ggccagacag gcaagaucgc cgacuacaac uacaagcugc ccgacgacuu caccggcugc 1200 gugaucgccu ggaacagcaa caaccucgac agcaaggugg gcggcaacua caacuaccug 1260 uaccggcugu uccggaagag caaccugaag cccuucgagc gggacaucag caccgagauc 1320 uaccaagccg gcuccacccc uugcaacggc guggagggcu ucaacugcua cuucccucug 1380 cagagcuacg gcuuccagcc caccaacggc gugggcuacc agcccuaccg ggugguggug 1440 cugagcuucg agcugcugca cgccccagcc accgugugug gccccaaguc uggcggaggc 1500 agcauccugg ccaucuacag ccugggcuuc aucgccggcc ugaucgccau cgugauggug 1560 accaucaugc ugugcugcau gaccagcugc ugcagcugcc ugaagggcug uugcagcugc 1620 ggcagcugcu gcaaguucga cgaggacgac 1650 <210> 107 <211> 550 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 107 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Gly Gly Gly Ser Gly Gly Gly Pro Asn Ile Thr Asn Leu Cys 290 295 300 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 305 310 315 320 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 325 330 335 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 340 345 350 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 355 360 365 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 370 375 380 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 385 390 395 400 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 405 410 415 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 420 425 430 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 435 440 445 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 450 455 460 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 465 470 475 480 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 485 490 495 Ser Gly Gly Gly Ser Ile Leu Ala Ile Tyr Ser Leu Gly Phe Ile Ala 500 505 510 Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys Cys Met Thr 515 520 525 Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly Ser Cys Cys 530 535 540 Lys Phe Asp Glu Asp Asp 545 550 <210> 108 <211> 1826 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 108 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120 acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180 guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240 gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300 cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360 cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420 aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480 ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540 agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600 aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660 aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720 gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780 cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840 gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900 aacggcacca ucaccgacgc cguggacgga ggcggaucgg gaggcggacc caacaucacc 960 aaccugugcc ccuucggcga gguguucaac gccacccggu ucgccagcgu guacgccugg 1020 aaccggaagc ggaucagcaa cugcguggcc gacuacagcg ugcuguacaa cagcgccagc 1080 uucagcaccu ucaagugcua cggcgugagc cccaccaagc ugaacgaccu gugcuucacc 1140 aacguguacg ccgacagcuu cgugauccgu ggcgacgagg ugcggcagau cgcacccggc 1200 cagacaggca agaucgccga cuacaacuac aagcugcccg acgacuucac cggcugcgug 1260 aucgccugga acagcaacaa ccucgacagc aaggugggcg gcaacuacaa cuaccuguac 1320 cggcuguucc ggaagagcaa ccugaagccc uucgagcggg acaucagcac cgagaucuac 1380 caagccggcu ccaccccuug caacggcgug gagggcuuca acugcuacuu cccucugcag 1440 agcuacggcu uccagcccac caacggcgug ggcuaccagc ccuaccgggu gguggugcug 1500 agcuucgagc ugcugcacgc cccagccacc guguguggcc ccaagucugg cggaggcagc 1560 agcagcaucg ccagcuucuu cuucaucauc gggcugauca ucggccucuu ccuggugcug 1620 cgggugggca uccaccugug caucaagcug aagcacacca agaagagaca gaucuacacc 1680 gacaucgaga ugaaccggcu gggcaaguga uaauaggcug gagccucggu ggccuagcuu 1740 cuugccccuu gggccucccc ccagccccuc cuccccuucc ugcacccgua cccccguggu 1800 cuuugaauaa agucugagug ggcggc 1826 <210> 109 <211> 1650 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 109 auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60 cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120 aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180 aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240 aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300 auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360 aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420 cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480 agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540 ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600 uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660 ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720 cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780 ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840 gagaacggca ccaucaccga cgccguggac ggaggcggau cgggaggcgg acccaacauc 900 accaaccugu gccccuucgg cgagguguuc aacgccaccc gguucgccag cguguacgcc 960 uggaaccgga agcggaucag caacugcgug gccgacuaca gcgugcugua caacagcgcc 1020 agcuucagca ccuucaagug cuacggcgug agccccacca agcugaacga ccugugcuuc 1080 accaacgugu acgccgacag cuucgugauc cguggcgacg aggugcggca gaucgcaccc 1140 ggccagacag gcaagaucgc cgacuacaac uacaagcugc ccgacgacuu caccggcugc 1200 gugaucgccu ggaacagcaa caaccucgac agcaaggugg gcggcaacua caacuaccug 1260 uaccggcugu uccggaagag caaccugaag cccuucgagc gggacaucag caccgagauc 1320 uaccaagccg gcuccacccc uugcaacggc guggagggcu ucaacugcua cuucccucug 1380 cagagcuacg gcuuccagcc caccaacggc gugggcuacc agcccuaccg ggugguggug 1440 cugagcuucg agcugcugca cgccccagcc accgugugug gccccaaguc uggcggaggc 1500 agcagcagca ucgccagcuu cuucuucauc aucgggcuga ucaucggccu cuuccuggug 1560 cugcgggugg gcauccaccu gugcaucaag cugaagcaca ccaagaagag acagaucuac 1620 accgacaucg agaugaaccg gcugggcaag 1650 <210> 110 <211> 550 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 110 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Gly Gly Gly Ser Gly Gly Gly Pro Asn Ile Thr Asn Leu Cys 290 295 300 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 305 310 315 320 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 325 330 335 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 340 345 350 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 355 360 365 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 370 375 380 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 385 390 395 400 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 405 410 415 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 420 425 430 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 435 440 445 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 450 455 460 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 465 470 475 480 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 485 490 495 Ser Gly Gly Gly Ser Ser Ser Ile Ala Ser Phe Phe Phe Ile Ile Gly 500 505 510 Leu Ile Ile Gly Leu Phe Leu Val Leu Arg Val Gly Ile His Leu Cys 515 520 525 Ile Lys Leu Lys His Thr Lys Lys Arg Gln Ile Tyr Thr Asp Ile Glu 530 535 540 Met Asn Arg Leu Gly Lys 545 550 <210> 111 <211> 1775 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 111 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120 acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180 guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240 gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300 cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360 cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420 aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480 ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540 agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600 aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660 aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720 gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780 cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840 gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900 aacggcacca ucaccgacgc cguggacgga ggcggaucgg gaggcggacc caacaucacc 960 aaccugugcc ccuucggcga gguguucaac gccacccggu ucgccagcgu guacgccugg 1020 aaccggaagc ggaucagcaa cugcguggcc gacuacagcg ugcuguacaa cagcgccagc 1080 uucagcaccu ucaagugcua cggcgugagc cccaccaagc ugaacgaccu gugcuucacc 1140 aacguguacg ccgacagcuu cgugauccgu ggcgacgagg ugcggcagau cgcacccggc 1200 cagacaggca agaucgccga cuacaacuac aagcugcccg acgacuucac cggcugcgug 1260 aucgccugga acagcaacaa ccucgacagc aaggugggcg gcaacuacaa cuaccuguac 1320 cggcuguucc ggaagagcaa ccugaagccc uucgagcggg acaucagcac cgagaucuac 1380 caagccggcu ccaccccuug caacggcgug gagggcuuca acugcuacuu cccucugcag 1440 agcuacggcu uccagcccac caacggcgug ggcuaccagc ccuaccgggu gguggugcug 1500 agcuucgagc ugcugcacgc cccagccacc guguguggcc ccaagucugg cggaggcggc 1560 agcgccaucg gcggcuacau ccccgaggcc ccuagagacg gccaggccua cgugcggaag 1620 gacggcgagu gggugcugcu gagcaccuuc cugggcugau aauaggcugg agccucggug 1680 gccuagcuuc uugccccuug ggccuccccc cagccccucc uccccuuccu gcacccguac 1740 ccccgugguc uuugaauaaa gucugagugg gcggc 1775 <210> 112 <211> 1599 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 112 auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60 cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120 aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180 aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240 aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300 auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360 aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420 cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480 agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540 ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600 uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660 ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720 cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780 ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840 gagaacggca ccaucaccga cgccguggac ggaggcggau cgggaggcgg acccaacauc 900 accaaccugu gccccuucgg cgagguguuc aacgccaccc gguucgccag cguguacgcc 960 uggaaccgga agcggaucag caacugcgug gccgacuaca gcgugcugua caacagcgcc 1020 agcuucagca ccuucaagug cuacggcgug agccccacca agcugaacga ccugugcuuc 1080 accaacgugu acgccgacag cuucgugauc cguggcgacg aggugcggca gaucgcaccc 1140 ggccagacag gcaagaucgc cgacuacaac uacaagcugc ccgacgacuu caccggcugc 1200 gugaucgccu ggaacagcaa caaccucgac agcaaggugg gcggcaacua caacuaccug 1260 uaccggcugu uccggaagag caaccugaag cccuucgagc gggacaucag caccgagauc 1320 uaccaagccg gcuccacccc uugcaacggc guggagggcu ucaacugcua cuucccucug 1380 cagagcuacg gcuuccagcc caccaacggc gugggcuacc agcccuaccg ggugguggug 1440 cugagcuucg agcugcugca cgccccagcc accgugugug gccccaaguc uggcggaggc 1500 ggcagcgcca ucggcggcua cauccccgag gccccuagag acggccaggc cuacgugcgg 1560 aaggacggcg agugggugcu gcugagcacc uuccugggc 1599 <210> 113 <211> 533 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 113 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Gly Gly Gly Ser Gly Gly Gly Pro Asn Ile Thr Asn Leu Cys 290 295 300 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 305 310 315 320 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 325 330 335 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 340 345 350 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 355 360 365 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 370 375 380 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 385 390 395 400 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 405 410 415 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 420 425 430 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 435 440 445 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 450 455 460 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 465 470 475 480 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 485 490 495 Ser Gly Gly Gly Gly Ser Ala Ile Gly Gly Tyr Ile Pro Glu Ala Pro 500 505 510 Arg Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu 515 520 525 Ser Thr Phe Leu Gly 530 <210> 114 <211> 1973 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 114 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120 acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180 guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240 gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300 cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360 cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420 aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480 ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540 agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600 aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660 aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720 gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780 cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840 gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900 aacggcacca ucaccgacgc cguggacgga ggcggaucgg gaggcggaca gcgggugcag 960 cccaccgaga gcaucgugcg guuccccaac aucaccaacc ugugccccuu cggcgaggug 1020 uucaacgcca cccgguucgc cagcguguac gccuggaacc ggaagcggau cagcaacugc 1080 guggccgacu acagcgugcu guacaacagc gccagcuuca gcaccuucaa gugcuacggc 1140 gugagcccca ccaagcugaa cgaccugugc uucaccaacg uguacgccga cagcuucgug 1200 auccguggcg acgaggugcg gcagaucgca cccggccaga caggcaagau cgccgacuac 1260 aacuacaagc ugcccgacga cuucaccggc ugcgugaucg ccuggaacag caacaaccuc 1320 gacagcaagg ugggcggcaa cuacaacuac cuguaccggc uguuccggaa gagcaaccug 1380 aagcccuucg agcgggacau cagcaccgag aucuaccaag ccggcuccac cccuugcaac 1440 ggcguggagg gcuucaacug cuacuucccu cugcagagcu acggcuucca gcccaccaac 1500 ggcgugggcu accagcccua ccggguggug gugcugagcu ucgagcugcu gcacgcccca 1560 gccaccgugu guggccccaa gaagagcacc aaccugguga agaacaagug cgugaacuuc 1620 aacuucaacg gccuuaccgg caccggcgug cugaccgaga gcaacaagaa auuccugccc 1680 uuucagcagu ucggccggga caucgccgac accaccgacg cugugcggga uccccagacc 1740 cuggagaucc uggacaucac cccuugcagc ucuggcggag gcagcauccu ggccaucuac 1800 agcaccgugg ccagcagccu ggugcugcug gugagccugg gcgccaucag cuucugauaa 1860 uaggcuggag ccucgguggc cuagcuucuu gccccuuggg ccucccccca gccccuccuc 1920 cccuuccugc acccguaccc ccguggucuu ugaauaaagu cugagugggc ggc 1973 <210> 115 <211> 1797 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 115 auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60 cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120 aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180 aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240 aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300 auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360 aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420 cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480 agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540 ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600 uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660 ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720 cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780 ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840 gagaacggca ccaucaccga cgccguggac ggaggcggau cgggaggcgg acagcgggug 900 cagcccaccg agagcaucgu gcgguucccc aacaucacca accugugccc cuucggcgag 960 guguucaacg ccacccgguu cgccagcgug uacgccugga accggaagcg gaucagcaac 1020 ugcguggccg acuacagcgu gcuguacaac agcgccagcu ucagcaccuu caagugcuac 1080 ggcgugagcc ccaccaagcu gaacgaccug ugcuucacca acguguacgc cgacagcuuc 1140 gugauccgug gcgacgaggu gcggcagauc gcacccggcc agacaggcaa gaucgccgac 1200 uacaacuaca agcugcccga cgacuucacc ggcugcguga ucgccuggaa cagcaacaac 1260 cucgacagca aggugggcgg caacuacaac uaccuguacc ggcuguuccg gaagagcaac 1320 cugaagcccu ucgagcggga caucagcacc gagaucuacc aagccggcuc caccccuugc 1380 aacggcgugg agggcuucaa cugcuacuuc ccucugcaga gcuacggcuu ccagcccacc 1440 aacggcgugg gcuaccagcc cuaccgggug guggugcuga gcuucgagcu gcugcacgcc 1500 ccagccaccg uguguggccc caagaagagc accaaccugg ugaagaacaa gugcgugaac 1560 uucaacuuca acggccuuac cggcaccggc gugcugaccg agagcaacaa gaaauuccug 1620 cccuuucagc aguucggccg ggacaucgcc gacaccaccg acgcugugcg ggauccccag 1680 acccuggaga uccuggacau caccccuugc agcucuggcg gaggcagcau ccuggccauc 1740 uacagcaccg uggccagcag ccuggugcug cuggugagcc ugggcgccau cagcuuc 1797 <210> 116 <211> 599 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 116 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Gly Gly Gly Ser Gly Gly Gly Gln Arg Val Gln Pro Thr Glu 290 295 300 Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu 305 310 315 320 Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys 325 330 335 Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala 340 345 350 Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn 355 360 365 Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly 370 375 380 Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp 385 390 395 400 Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp 405 410 415 Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu 420 425 430 Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile 435 440 445 Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu 450 455 460 Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr 465 470 475 480 Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu 485 490 495 Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Asn 500 505 510 Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr Gly 515 520 525 Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln Gln 530 535 540 Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp Pro Gln 545 550 555 560 Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Ser Gly Gly Gly Ser 565 570 575 Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val 580 585 590 Ser Leu Gly Ala Ile Ser Phe 595 <210> 117 <211> 1799 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 117 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120 acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180 guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240 gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300 cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360 cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420 aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480 ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540 agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600 aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660 aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720 gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780 cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840 gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900 aacggcacca ucaccgacgc cguggacugc gcccuggacc cucugagcga gaccaagugc 960 acccugaaga gcuucaccgg aggcggaucg ggaggcggac ccaacaucac caaccugugc 1020 cccuucggcg agguguucaa cgccacccgg uucgccagcg uguacgccug gaaccggaag 1080 cggaucagca acugcguggc cgacuacagc gugcuguaca acagcgccag cuucagcacc 1140 uucaagugcu acggcgugag ccccaccaag cugaacgacc ugugcuucac caacguguac 1200 gccgacagcu ucgugauccg uggcgacgag gugcggcaga ucgcacccgg ccagacaggc 1260 aagaucgccg acuacaacua caagcugccc gacgacuuca ccggcugcgu gaucgccugg 1320 aacagcaaca accucgacag caaggugggc ggcaacuaca acuaccugua ccggcuguuc 1380 cggaagagca accugaagcc cuucgagcgg gacaucagca ccgagaucua ccaagccggc 1440 uccaccccuu gcaacggcgu ggagggcuuc aacugcuacu ucccucugca gagcuacggc 1500 uuccagccca ccaacggcgu gggcuaccag cccuaccggg ugguggugcu gagcuucgag 1560 cugcugcacg ccccagccac cguguguggc cccaagucug gcggaggcag cauccuggcc 1620 aucuacagca ccguggccag cagccuggug cugcugguga gccugggcgc caucagcuuc 1680 ugauaauagg cuggagccuc gguggccuag cuucuugccc cuugggccuc cccccagccc 1740 cuccuccccu uccugcaccc guacccccgu ggucuuugaa uaaagucuga gugggcggc 1799 <210> 118 <211> 1623 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 118 auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60 cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120 aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180 aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240 aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300 auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360 aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420 cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480 agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540 ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600 uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660 ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720 cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780 ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840 gagaacggca ccaucaccga cgccguggac ugcgcccugg acccucugag cgagaccaag 900 ugcacccuga agagcuucac cggaggcgga ucgggaggcg gacccaacau caccaaccug 960 ugccccuucg gcgagguguu caacgccacc cgguucgcca gcguguacgc cuggaaccgg 1020 aagcggauca gcaacugcgu ggccgacuac agcgugcugu acaacagcgc cagcuucagc 1080 accuucaagu gcuacggcgu gagccccacc aagcugaacg accugugcuu caccaacgug 1140 uacgccgaca gcuucgugau ccguggcgac gaggugcggc agaucgcacc cggccagaca 1200 ggcaagaucg ccgacuacaa cuacaagcug cccgacgacu ucaccggcug cgugaucgcc 1260 uggaacagca acaaccucga cagcaaggug ggcggcaacu acaacuaccu guaccggcug 1320 uuccggaaga gcaaccugaa gcccuucgag cgggacauca gcaccgagau cuaccaagcc 1380 ggcuccaccc cuugcaacgg cguggagggc uucaacugcu acuucccucu gcagagcuac 1440 ggcuuccagc ccaccaacgg cgugggcuac cagcccuacc gggugguggu gcugagcuuc 1500 gagcugcugc acgccccagc caccgugugu ggccccaagu cuggcggagg cagcauccug 1560 gccaucuaca gcaccguggc cagcagccug gugcugcugg ugagccuggg cgccaucagc 1620 uuc 1623 <210> 119 <211> 541 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 119 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Gly Gly Gly Ser Gly Gly Gly Pro Asn Ile Thr Asn Leu 305 310 315 320 Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr 325 330 335 Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val 340 345 350 Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser 355 360 365 Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser 370 375 380 Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr 385 390 395 400 Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly 405 410 415 Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly 420 425 430 Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro 435 440 445 Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro 450 455 460 Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr 465 470 475 480 Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val 485 490 495 Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro 500 505 510 Lys Ser Gly Gly Gly Ser Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser 515 520 525 Ser Leu Val Leu Leu Val Ser Leu Gly Ala Ile Ser Phe 530 535 540 <210> 120 <211> 2024 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 120 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120 acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180 guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240 gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300 cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360 cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420 aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480 ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540 agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600 aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660 aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720 gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780 cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840 gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900 aacggcacca ucaccgacgc cguggacugc gcccuggacc cucugagcga gaccaagugc 960 acccugaaga gcuucaccgg aggcggaucg ggaggcggac agcgggugca gcccaccgag 1020 agcaucgugc gguuccccaa caucaccaac cugugccccu ucggcgaggu guucaacgcc 1080 acccgguucg ccagcgugua cgccuggaac cggaagcgga ucagcaacug cguggccgac 1140 uacagcgugc uguacaacag cgccagcuuc agcaccuuca agugcuacgg cgugagcccc 1200 accaagcuga acgaccugug cuucaccaac guguacgccg acagcuucgu gauccguggc 1260 gacgaggugc ggcagaucgc acccggccag acaggcaaga ucgccgacua caacuacaag 1320 cugcccgacg acuucaccgg cugcgugauc gccuggaaca gcaacaaccu cgacagcaag 1380 gugggcggca acuacaacua ccuguaccgg cuguuccgga agagcaaccu gaagcccuuc 1440 gagcgggaca ucagcaccga gaucuaccaa gccggcucca ccccuugcaa cggcguggag 1500 ggcuucaacu gcuacuuccc ucugcagagc uacggcuucc agcccaccaa cggcgugggc 1560 uaccagcccu accggguggu ggugcugagc uucgagcugc ugcacgcccc agccaccgug 1620 uguggcccca agaagagcac caaccuggug aagaacaagu gcgugaacuu caacuucaac 1680 ggccuuaccg gcaccggcgu gcugaccgag agcaacaaga aauuccugcc cuuucagcag 1740 uucggccggg acaucgccga caccaccgac gcugugcggg auccccagac ccuggagauc 1800 cuggacauca ccccuugcag cucuggcgga ggcagcaucc uggccaucua cagcaccgug 1860 gccagcagcc uggugcugcu ggugagccug ggcgccauca gcuucugaua auaggcugga 1920 gccucggugg ccuagcuucu ugccccuugg gccucccccc agccccuccu ccccuuccug 1980 cacccguacc cccguggucu uugaauaaag ucugaguggg cggc 2024 <210> 121 <211> 1848 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 121 auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60 cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120 aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180 aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240 aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300 auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360 aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420 cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480 agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540 ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600 uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660 ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720 cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780 ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840 gagaacggca ccaucaccga cgccguggac ugcgcccugg acccucugag cgagaccaag 900 ugcacccuga agagcuucac cggaggcgga ucgggaggcg gacagcgggu gcagcccacc 960 gagagcaucg ugcgguuccc caacaucacc aaccugugcc ccuucggcga gguguucaac 1020 gccacccggu ucgccagcgu guacgccugg aaccggaagc ggaucagcaa cugcguggcc 1080 gacuacagcg ugcuguacaa cagcgccagc uucagcaccu ucaagugcua cggcgugagc 1140 cccaccaagc ugaacgaccu gugcuucacc aacguguacg ccgacagcuu cgugauccgu 1200 ggcgacgagg ugcggcagau cgcacccggc cagacaggca agaucgccga cuacaacuac 1260 aagcugcccg acgacuucac cggcugcgug aucgccugga acagcaacaa ccucgacagc 1320 aaggugggcg gcaacuacaa cuaccuguac cggcuguucc ggaagagcaa ccugaagccc 1380 uucgagcggg acaucagcac cgagaucuac caagccggcu ccaccccuug caacggcgug 1440 gagggcuuca acugcuacuu cccucugcag agcuacggcu uccagcccac caacggcgug 1500 ggcuaccagc ccuaccgggu gguggugcug agcuucgagc ugcugcacgc cccagccacc 1560 guguguggcc ccaagaagag caccaaccug gugaagaaca agugcgugaa cuucaacuuc 1620 aacggccuua ccggcaccgg cgugcugacc gagagcaaca agaaauuccu gcccuuucag 1680 caguucggcc gggacaucgc cgacaccacc gacgcugugc gggaucccca gacccuggag 1740 auccuggaca ucaccccuug cagcucuggc ggaggcagca uccuggccau cuacagcacc 1800 guggccagca gccuggugcu gcuggugagc cugggcgcca ucagcuuc 1848 <210> 122 <211> 616 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 122 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Gly Gly Gly Ser Gly Gly Gly Gln Arg Val Gln Pro Thr 305 310 315 320 Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly 325 330 335 Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg 340 345 350 Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser 355 360 365 Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu 370 375 380 Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg 385 390 395 400 Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala 405 410 415 Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala 420 425 430 Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr 435 440 445 Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp 450 455 460 Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val 465 470 475 480 Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro 485 490 495 Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe 500 505 510 Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr 515 520 525 Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr 530 535 540 Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln 545 550 555 560 Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp Pro 565 570 575 Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Ser Gly Gly Gly 580 585 590 Ser Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu 595 600 605 Val Ser Leu Gly Ala Ile Ser Phe 610 615 <210> 123 <211> 3995 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 123 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120 acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180 guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240 gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300 cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360 cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420 aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480 ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540 agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600 aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660 aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720 gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780 cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840 gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900 aacggcacca ucaccgacgc cguggacugc gcccuggacc cucugagcga gaccaagugc 960 acccugaaga gcuucaccgu ggagaagggc aucuaccaga ccagcaacuu ccgggugcag 1020 cccaccgaga gcaucgugcg guuccccaac aucaccaacc ugugccccuu cggcgaggug 1080 uucaacgcca cccgguucgc cagcguguac gccuggaacc ggaagcggau cagcaacugc 1140 guggccgacu acagcgugcu guacaacagc gccagcuuca gcaccuucaa gugcuacggc 1200 gugagcccca ccaagcugaa cgaccugugc uucaccaacg uguacgccga cagcuucgug 1260 auccguggcg acgaggugcg gcagaucgca cccggccaga caggcaagau cgccgacuac 1320 aacuacaagc ugcccgacga cuucaccggc ugcgugaucg ccuggaacag caacaaccuc 1380 gacagcaagg ugggcggcaa cuacaacuac cuguaccggc uguuccggaa gagcaaccug 1440 aagcccuucg agcgggacau cagcaccgag aucuaccaag ccggcuccac cccuugcaac 1500 ggcguggagg gcuucaacug cuacuucccu cugcagagcu acggcuucca gcccaccaac 1560 ggcgugggcu accagcccua ccggguggug gugcugagcu ucgagcugcu gcacgcccca 1620 gccaccgugu guggccccaa gaagagcacc aaccugguga agaacaagug cgugaacuuc 1680 aacuucaacg gccuuaccgg caccggcgug cugaccgaga gcaacaagaa auuccugccc 1740 uuucagcagu ucggccggga caucgccgac accaccgacg cugugcggga uccccagacc 1800 cuggagaucc uggacaucac cccuugcagc uucggcggcg ugagcgugau caccccaggc 1860 accaacacca gcaaccaggu ggccgugcug uaccaggacg ugaacugcac cgaggugccc 1920 guggccaucc acgccgacca gcugacaccc accuggcggg ucuacagcac cggcagcaac 1980 guguuccaga cccgggccgg uugccugauc ggcgccgagc acgugaacaa cagcuacgag 2040 ugcgacaucc ccaucggcgc cggcaucugu gccagcuacc agacccagac caauucaccc 2100 cggagggcaa ggagcguggc cagccagagc aucaucgccu acaccaugag ccugggcgcc 2160 gagaacagcg uggccuacag caacaacagc aucgccaucc ccaccaacuu caccaucagc 2220 gugaccaccg agauucugcc cgugagcaug accaagacca gcguggacug caccauguac 2280 aucugcggcg acagcaccga gugcagcaac cugcugcugc aguacggcag cuucugcacc 2340 cagcugaacc gggcccugac cggcaucgcc guggagcagg acaagaacac ccaggaggug 2400 uucgcccagg ugaagcagau cuacaagacc ccucccauca aggacuucgg cggcuucaac 2460 uucagccaga uccugcccga ccccagcaag cccagcaagc ggagcuucau cgaggaccug 2520 cuguucaaca aggugacccu agccgacgcc ggcuucauca agcaguacgg cgacugccuc 2580 ggcgacauag ccgcccggga ccugaucugc gcccagaagu ucaacggccu gaccgugcug 2640 ccuccccugc ugaccgacga gaugaucgcc caguacacca gcgcccuguu agccggaacc 2700 aucaccagcg gcuggacuuu cggcgcugga gccgcucugc agauccccuu cgccaugcag 2760 auggccuacc gguucaacgg caucggcgug acccagaacg ugcuguacga gaaccagaag 2820 cugaucgcca accaguucaa cagcgccauc ggcaagaucc aggacagccu gagcagcacc 2880 gcuagcgccc ugggcaagcu gcaggacgug gugaaccaga acgcccaggc ccugaacacc 2940 cuggugaagc agcugagcag caacuucggc gccaucagca gcgugcugaa cgacauccug 3000 agccggcugg acaaggugga ggccgaggug cagaucgacc ggcugaucac uggccggcug 3060 cagagccugc agaccuacgu gacccagcag cugauccggg ccgccgagau ucgggccagc 3120 gccaaccugg ccgccaccaa gaugagcgag ugcgugcugg gccagagcaa gcggguggac 3180 uucugcggca agggcuacca ccugaugagc uuuccccaga gcgcacccca cggaguggug 3240 uuccugcacg ugaccuacgu gcccgcccag gagaagaacu ucaccaccgc cccagccauc 3300 ugccacgacg gcaaggccca cuuuccccgg gagggcgugu ucgugagcaa cggcacccac 3360 ugguucguga cccagcggaa cuucuacgag ccccagauca ucaccaccga caacaccuuc 3420 gugagcggca acugcgacgu ggugaucggc aucgugaaca acaccgugua cgauccccug 3480 cagcccgagc uggacagcuu caaggaggag cuggacaagu acuucaagaa ucacaccagc 3540 cccgacgugg accugggcga caucagcggc aucaacgcca gcguggugaa cauccagaag 3600 gagaucgauc ggcugaacga gguggccaag aaccugaacg agagccugau cgaccugcag 3660 gagcugggca aguacgagca guacaucaag uggcccuggu acaucuggcu gggcuucauc 3720 gccggccuga ucgccaucgu gauggugacc aucaugcugu gcugcaugac cagcugcugc 3780 agcugccuga agggcuguug cagcugcggc agcugcugca aguucgacga ggacgacagc 3840 gagcccgugc ugaagggcgu gaagcugcac uacaccugau aauaggcugg agccucggug 3900 gccuagcuuc uugccccuug ggccuccccc cagccccucc uccccuuccu gcacccguac 3960 ccccgugguc uuugaauaaa gucugagugg gcggc 3995 <210> 124 <211> 3819 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 124 auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60 cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120 aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180 aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240 aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300 auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360 aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420 cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480 agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540 ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600 uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660 ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720 cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780 ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840 gagaacggca ccaucaccga cgccguggac ugcgcccugg acccucugag cgagaccaag 900 ugcacccuga agagcuucac cguggagaag ggcaucuacc agaccagcaa cuuccgggug 960 cagcccaccg agagcaucgu gcgguucccc aacaucacca accugugccc cuucggcgag 1020 guguucaacg ccacccgguu cgccagcgug uacgccugga accggaagcg gaucagcaac 1080 ugcguggccg acuacagcgu gcuguacaac agcgccagcu ucagcaccuu caagugcuac 1140 ggcgugagcc ccaccaagcu gaacgaccug ugcuucacca acguguacgc cgacagcuuc 1200 gugauccgug gcgacgaggu gcggcagauc gcacccggcc agacaggcaa gaucgccgac 1260 uacaacuaca agcugcccga cgacuucacc ggcugcguga ucgccuggaa cagcaacaac 1320 cucgacagca aggugggcgg caacuacaac uaccuguacc ggcuguuccg gaagagcaac 1380 cugaagcccu ucgagcggga caucagcacc gagaucuacc aagccggcuc caccccuugc 1440 aacggcgugg agggcuucaa cugcuacuuc ccucugcaga gcuacggcuu ccagcccacc 1500 aacggcgugg gcuaccagcc cuaccgggug guggugcuga gcuucgagcu gcugcacgcc 1560 ccagccaccg uguguggccc caagaagagc accaaccugg ugaagaacaa gugcgugaac 1620 uucaacuuca acggccuuac cggcaccggc gugcugaccg agagcaacaa gaaauuccug 1680 cccuuucagc aguucggccg ggacaucgcc gacaccaccg acgcugugcg ggauccccag 1740 acccuggaga uccuggacau caccccuugc agcuucggcg gcgugagcgu gaucacccca 1800 ggcaccaaca ccagcaacca gguggccgug cuguaccagg acgugaacug caccgaggug 1860 cccguggcca uccacgccga ccagcugaca cccaccuggc gggucuacag caccggcagc 1920 aacguguucc agacccgggc cgguugccug aucggcgccg agcacgugaa caacagcuac 1980 gagugcgaca uccccaucgg cgccggcauc ugugccagcu accagaccca gaccaauuca 2040 ccccggaggg caaggagcgu ggccagccag agcaucaucg ccuacaccau gagccugggc 2100 gccgagaaca gcguggccua cagcaacaac agcaucgcca uccccaccaa cuucaccauc 2160 agcgugacca ccgagauucu gcccgugagc augaccaaga ccagcgugga cugcaccaug 2220 uacaucugcg gcgacagcac cgagugcagc aaccugcugc ugcaguacgg cagcuucugc 2280 acccagcuga accgggcccu gaccggcauc gccguggagc aggacaagaa cacccaggag 2340 guguucgccc aggugaagca gaucuacaag accccuccca ucaaggacuu cggcggcuuc 2400 aacuucagcc agauccugcc cgaccccagc aagcccagca agcggagcuu caucgaggac 2460 cugcuguuca acaaggugac ccuagccgac gccggcuuca ucaagcagua cggcgacugc 2520 cucggcgaca uagccgcccg ggaccugauc ugcgcccaga aguucaacgg ccugaccgug 2580 cugccucccc ugcugaccga cgagaugauc gcccaguaca ccagcgcccu guuagccgga 2640 accaucacca gcggcuggac uuucggcgcu ggagccgcuc ugcagauccc cuucgccaug 2700 cagauggccu accgguucaa cggcaucggc gugacccaga acgugcugua cgagaaccag 2760 aagcugaucg ccaaccaguu caacagcgcc aucggcaaga uccaggacag ccugagcagc 2820 accgcuagcg cccugggcaa gcugcaggac guggugaacc agaacgccca ggcccugaac 2880 acccugguga agcagcugag cagcaacuuc ggcgccauca gcagcgugcu gaacgacauc 2940 cugagccggc uggacaaggu ggaggccgag gugcagaucg accggcugau cacuggccgg 3000 cugcagagcc ugcagaccua cgugacccag cagcugaucc gggccgccga gauucgggcc 3060 agcgccaacc uggccgccac caagaugagc gagugcgugc ugggccagag caagcgggug 3120 gacuucugcg gcaagggcua ccaccugaug agcuuucccc agagcgcacc ccacggagug 3180 guguuccugc acgugaccua cgugcccgcc caggagaaga acuucaccac cgccccagcc 3240 aucugccacg acggcaaggc ccacuuuccc cgggagggcg uguucgugag caacggcacc 3300 cacugguucg ugacccagcg gaacuucuac gagccccaga ucaucaccac cgacaacacc 3360 uucgugagcg gcaacugcga cguggugauc ggcaucguga acaacaccgu guacgauccc 3420 cugcagcccg agcuggacag cuucaaggag gagcuggaca aguacuucaa gaaucacacc 3480 agccccgacg uggaccuggg cgacaucagc ggcaucaacg ccagcguggu gaacauccag 3540 aaggagaucg aucggcugaa cgagguggcc aagaaccuga acgagagccu gaucgaccug 3600 caggagcugg gcaaguacga gcaguacauc aaguggcccu gguacaucug gcugggcuuc 3660 aucgccggcc ugaucgccau cgugauggug accaucaugc ugugcugcau gaccagcugc 3720 ugcagcugcc ugaagggcug uugcagcugc ggcagcugcu gcaaguucga cgaggacgac 3780 agcgagcccg ugcugaaggg cgugaagcug cacuacacc 3819 <210> 125 <211> 1273 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 125 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile 885 890 895 Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn 1145 1150 1155 His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn 1160 1165 1170 Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu 1175 1180 1185 Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu 1190 1195 1200 Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu 1205 1210 1215 Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met 1220 1225 1230 Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys 1235 1240 1245 Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro 1250 1255 1260 Val Leu Lys Gly Val Lys Leu His Tyr Thr 1265 1270 <210> 126 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 126 Lys Pro Ser Lys Arg Ser Phe Ile 1 5 <210> 127 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 127 Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala 1 5 10 <210> 128 <211> 9 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 128 ccrccaugg 9 <210> 129 <211> 11 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 129 gggauccuac c 11 <210> 130 <211> 9 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 130 uuauuuaww 9 <210> 131 <211> 47 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 131 gggaaauaag agagaaaaga agaguaagaa gaaauauaag agccacc 47 <210> 132 <211> 119 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 132 ugauaauagg cuggagccuc gguggccaug cuucuugccc cuugggccuc cccccagccc 60 cuccuccccu uccugcaccc guacccccgu ggucuuugaa uaaagucuga gugggcggc 119 <210> 133 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 133 Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Gly 1 5 10 15 <210> 134 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 134 Gly Gly Gly Ser Gly Gly Gly Ser 1 5 <210> 135 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 135 Gly Gly Gly Ser Gly Gly Gly 1 5 <210> 136 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 136 Gly Gly Gly Ser 1 <210> 137 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 137 Ser Gly Gly Ser 1 <210> 138 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 138 Ser Gly Gly Gly Ser 1 5 <210> 139 <211> 1602 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 139 auguacagca ugcagcuggc uagcugcgug acccugaccc uggugcugcu ggugaacagc 60 cagcccaaca ucaccaaccu gugccccuuc ggcgaggugu ucaacgccac ccgguucgcc 120 agcguguacg ccuggaaccg gaagcggauc agcaacugcg uggccgacua cagcgugcug 180 uacaacagcg ccagcuucag caccuucaag ugcuacggcg ugagccccac caagcugaac 240 gaccugugcu ucaccaacgu guacgccgac agcuucguga uccguggcga cgaggugcgg 300 cagaucgcac ccggccagac aggcaagauc gccgacuaca acuacaagcu gcccgacgac 360 uucaccggcu gcgugaucgc cuggaacagc aacaaccucg acagcaaggu gggcggcaac 420 uacaacuacc uguaccggcu guuccggaag agcaaccuga agcccuucga gcgggacauc 480 agcaccgaga ucuaccaagc cggcuccacc ccuugcaacg gcguggaggg cuucaacugc 540 uacuucccuc ugcagagcua cggcuuccag cccaccaacg gcgugggcua ccagcccuac 600 cggguggugg ugcugagcuu cgagcugcug cacgccccag ccaccgugug uggccccaag 660 ucuggcggag gcagcggagg cggaagccag ugcgugaacc ugaccacccg gacccagcug 720 ccaccagccu acaccaacag cuucacccgg ggcgucuacu accccgacaa gguguuccgg 780 agcagcgucc ugcacagcac ccaggaccug uuccugcccu ucuucagcaa cgugaccugg 840 uuccacgcca uccacgugag cggcaccaac ggcaccaagc gguucgacaa ccccgugcug 900 cccuucaacg acggcgugua cuucgccagc accgagaaga gcaacaucau ccggggcugg 960 aucuucggca ccacccugga cagcaagacc cagagccugc ugaucgugaa uaacgccacc 1020 aacgugguga ucaaggugug cgaguuccag uucugcaacg accccuuccu gggcguguac 1080 uaccacaaga acaacaagag cuggauggag agcgaguucc ggguguacag cagcgccaac 1140 aacugcaccu ucgaguacgu gagccagccc uuccugaugg accuggaggg caagcagggc 1200 aacuucaaga accugcggga guucguguuc aagaacaucg acggcuacuu caagaucuac 1260 agcaagcaca ccccaaucaa ccuggugcgg gaucugcccc agggcuucuc agcccuggag 1320 ccccuggugg accugcccau cggcaucaac aucacccggu uccagacccu gcuggcccug 1380 caccggagcu accugacccc aggcgacagc agcagcgggu ggacagcagg cgcggcugcu 1440 uacuacgugg gcuaccugca gccccggacc uuccugcuga aguacaacga gaacggcacc 1500 aucaccgacg ccguggacuc uggcggaggc agcauccugg ccaucuacag caccguggcc 1560 agcagccugg ugcugcuggu gagccugggc gccaucagcu uc 1602 <210> 140 <211> 534 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 140 Met Tyr Ser Met Gln Leu Ala Ser Cys Val Thr Leu Thr Leu Val Leu 1 5 10 15 Leu Val Asn Ser Gln Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu 20 25 30 Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys 35 40 45 Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala 50 55 60 Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn 65 70 75 80 Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly 85 90 95 Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp 100 105 110 Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp 115 120 125 Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu 130 135 140 Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile 145 150 155 160 Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu 165 170 175 Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr 180 185 190 Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu 195 200 205 Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Ser Gly Gly Gly 210 215 220 Ser Gly Gly Gly Ser Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu 225 230 235 240 Pro Pro Ala Tyr Thr Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp 245 250 255 Lys Val Phe Arg Ser Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu 260 265 270 Pro Phe Phe Ser Asn Val Thr Trp Phe His Ala Ile His Val Ser Gly 275 280 285 Thr Asn Gly Thr Lys Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp 290 295 300 Gly Val Tyr Phe Ala Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp 305 310 315 320 Ile Phe Gly Thr Thr Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val 325 330 335 Asn Asn Ala Thr Asn Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys 340 345 350 Asn Asp Pro Phe Leu Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp 355 360 365 Met Glu Ser Glu Phe Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe 370 375 380 Glu Tyr Val Ser Gln Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly 385 390 395 400 Asn Phe Lys Asn Leu Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr 405 410 415 Phe Lys Ile Tyr Ser Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu 420 425 430 Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly 435 440 445 Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr 450 455 460 Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala 465 470 475 480 Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn 485 490 495 Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Ser Gly Gly Gly Ser Ile 500 505 510 Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val Ser 515 520 525 Leu Gly Ala Ile Ser Phe 530 <210> 141 <211> 1778 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 141 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uacagcaugc agcuggcuag cugcgugacc cugacccugg ugcugcuggu gaacagccag 120 cccaacauca ccaaccugug ccccuucggc gagguguuca acgccacccg guucgccagc 180 guguacgccu ggaaccggaa gcggaucagc aacugcgugg ccgacuacag cgugcuguac 240 aacagcgcca gcuucagcac cuucaagugc uacggcguga gccccaccaa gcugaacgac 300 cugugcuuca ccaacgugua cgccgacagc uucgugaucc guggcgacga ggugcggcag 360 aucgcacccg gccagacagg caagaucgcc gacuacaacu acaagcugcc cgacgacuuc 420 accggcugcg ugaucgccug gaacagcaac aaccucgaca gcaagguggg cggcaacuac 480 aacuaccugu accggcuguu ccggaagagc aaccugaagc ccuucgagcg ggacaucagc 540 accgagaucu accaagccgg cuccaccccu ugcaacggcg uggagggcuu caacugcuac 600 uucccucugc agagcuacgg cuuccagccc accaacggcg ugggcuacca gcccuaccgg 660 gugguggugc ugagcuucga gcugcugcac gccccagcca ccgugugugg ccccaagucu 720 ggcggaggca gcggaggcgg aagccagugc gugaaccuga ccacccggac ccagcugcca 780 ccagccuaca ccaacagcuu cacccggggc gucuacuacc ccgacaaggu guuccggagc 840 agcguccugc acagcaccca ggaccuguuc cugcccuucu ucagcaacgu gaccugguuc 900 cacgccaucc acgugagcgg caccaacggc accaagcggu ucgacaaccc cgugcugccc 960 uucaacgacg gcguguacuu cgccagcacc gagaagagca acaucauccg gggcuggauc 1020 uucggcacca cccuggacag caagacccag agccugcuga ucgugaauaa cgccaccaac 1080 guggugauca aggugugcga guuccaguuc ugcaacgacc ccuuccuggg cguguacuac 1140 cacaagaaca acaagagcug gauggagagc gaguuccggg uguacagcag cgccaacaac 1200 ugcaccuucg aguacgugag ccagcccuuc cugauggacc uggagggcaa gcagggcaac 1260 uucaagaacc ugcgggaguu cguguucaag aacaucgacg gcuacuucaa gaucuacagc 1320 aagcacaccc caaucaaccu ggugcgggau cugccccagg gcuucucagc ccuggagccc 1380 cugguggacc ugcccaucgg caucaacauc acccgguucc agacccugcu ggcccugcac 1440 cggagcuacc ugaccccagg cgacagcagc agcgggugga cagcaggcgc ggcugcuuac 1500 uacgugggcu accugcagcc ccggaccuuc cugcugaagu acaacgagaa cggcaccauc 1560 accgacgccg uggacucugg cggaggcagc auccuggcca ucuacagcac cguggccagc 1620 agccuggugc ugcuggugag ccugggcgcc aucagcuucu gauaauaggc uggagccucg 1680 guggccuagc uucuugcccc uugggccucc ccccagcccc uccuccccuu ccugcacccg 1740 uacccccgug gucuuugaau aaagucugag ugggcggc 1778 <210> 142 <211> 1602 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 142 auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60 cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120 aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180 aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240 aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300 auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360 aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420 cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480 agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540 ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600 uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660 ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720 cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780 ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840 gagaacggca ccaucaccga cgccguggac ggaggcgcca aguucguggc cgccuggacu 900 cugaaggccg cagccggcgg acccaacauc accaaccugu gccccuucgg cgagguguuc 960 aacgccaccc gguucgccag cguguacgcc uggaaccgga agcggaucag caacugcgug 1020 gccgacuaca gcgugcugua caacagcgcc agcuucagca ccuucaagug cuacggcgug 1080 agccccacca agcugaacga ccugugcuuc accaacgugu acgccgacag cuucgugauc 1140 cguggcgacg aggugcggca gaucgcaccc ggccagacag gcaagaucgc cgacuacaac 1200 uacaagcugc ccgacgacuu caccggcugc gugaucgccu ggaacagcaa caaccucgac 1260 agcaaggugg gcggcaacua caacuaccug uaccggcugu uccggaagag caaccugaag 1320 cccuucgagc gggacaucag caccgagauc uaccaagccg gcuccacccc uugcaacggc 1380 guggagggcu ucaacugcua cuucccucug cagagcuacg gcuuccagcc caccaacggc 1440 gugggcuacc agcccuaccg ggugguggug cugagcuucg agcugcugca cgccccagcc 1500 accgugugug gccccaaguc uggcggaggc agcauccugg ccaucuacag caccguggcc 1560 agcagccugg ugcugcuggu gagccugggc gccaucagcu uc 1602 <210> 143 <211> 534 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 143 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Gly Gly Ala Lys Phe Val Ala Ala Trp Thr Leu Lys Ala Ala 290 295 300 Ala Gly Gly Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe 305 310 315 320 Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile 325 330 335 Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe 340 345 350 Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu 355 360 365 Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu 370 375 380 Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn 385 390 395 400 Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser 405 410 415 Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg 420 425 430 Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr 435 440 445 Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe 450 455 460 Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly 465 470 475 480 Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu 485 490 495 His Ala Pro Ala Thr Val Cys Gly Pro Lys Ser Gly Gly Gly Ser Ile 500 505 510 Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val Ser 515 520 525 Leu Gly Ala Ile Ser Phe 530 <210> 144 <211> 1778 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 144 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120 acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180 guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240 gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300 cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360 cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420 aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480 ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540 agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600 aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660 aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720 gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780 cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840 gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900 aacggcacca ucaccgacgc cguggacgga ggcgccaagu ucguggccgc cuggacucug 960 aaggccgcag ccggcggacc caacaucacc aaccugugcc ccuucggcga gguguucaac 1020 gccacccggu ucgccagcgu guacgccugg aaccggaagc ggaucagcaa cugcguggcc 1080 gacuacagcg ugcuguacaa cagcgccagc uucagcaccu ucaagugcua cggcgugagc 1140 cccaccaagc ugaacgaccu gugcuucacc aacguguacg ccgacagcuu cgugauccgu 1200 ggcgacgagg ugcggcagau cgcacccggc cagacaggca agaucgccga cuacaacuac 1260 aagcugcccg acgacuucac cggcugcgug aucgccugga acagcaacaa ccucgacagc 1320 aaggugggcg gcaacuacaa cuaccuguac cggcuguucc ggaagagcaa ccugaagccc 1380 uucgagcggg acaucagcac cgagaucuac caagccggcu ccaccccuug caacggcgug 1440 gagggcuuca acugcuacuu cccucugcag agcuacggcu uccagcccac caacggcgug 1500 ggcuaccagc ccuaccgggu gguggugcug agcuucgagc ugcugcacgc cccagccacc 1560 guguguggcc ccaagucugg cggaggcagc auccuggcca ucuacagcac cguggccagc 1620 agccuggugc ugcuggugag ccugggcgcc aucagcuucu gauaauaggc uggagccucg 1680 guggccuagc uucuugcccc uugggccucc ccccagcccc uccuccccuu ccugcacccg 1740 uacccccgug gucuuugaau aaagucugag ugggcggc 1778 <210> 145 <211> 1785 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 145 auguacagca ugcagcuggc uagcugcgug acccugaccc uggugcugcu ggugaacagc 60 cagggcgccg agaacagcgu ggccuacagc aacaacagca ucgccauccc caccaacuuc 120 accaucagcg ugaccaccga gauucugccc gugagcauga ccaagaccag cguggacugc 180 accauguaca ucugcggcga cagcaccgag ugcagcaacc ugcugcugca guacggcagc 240 uucugcaccc agcugaaccg ggcccugacc ggcaucgccg uggagcagga caagaacacc 300 caggaggugu ucgcccaggu gaagcagauc uacaagaccc cucccaucaa ggacuucggc 360 ggcuucaacu ucagccagau ccugcccgac cccagcaagc ccagcaagcg gagcuucauc 420 gaggaccugc uguucaacaa ggugacccua gccgacgccg gcuucaucaa gcaguacggc 480 gacugccucg gcgacauagc cgcccgggac cugaucugcg cccagaaguu caacggccug 540 accgugcugc cuccccugcu gaccgacgag augaucgccc aguacaccag cgcccuguua 600 gccggaacca ucaccagcgg cuggacuuuc ggcgcuggag ccgcucugca gauccccuuc 660 gccaugcaga uggccuaccg guucaacggc aucggcguga cccagaacgu gcuguacgag 720 aaccagaagc ugaucgccaa ccaguucaac agcgccaucg gcaagaucca ggacagccug 780 agcagcaccg cuagcgcccu gggcaagcug caggacgugg ugaaccagaa cgcccaggcc 840 cugaacaccc uggugaagca gcugagcagc aacuucggcg ccaucagcag cgugcugaac 900 gacauccuga gccggcugga cccucccgag gccgaggugc agaucgaccg gcugaucacu 960 ggccggcugc agagccugca gaccuacgug acccagcagc ugauccgggc cgccgagauu 1020 cgggccagcg ccaaccuggc cgccaccaag augagcgagu gcgugcuggg ccagagcaag 1080 cggguggacu ucugcggcaa gggcuaccac cugaugagcu uuccccagag cgcaccccac 1140 ggaguggugu uccugcacgu gaccuacgug cccgcccagg agaagaacuu caccaccgcc 1200 ccagccaucu gccacgacgg caaggcccac uuuccccggg agggcguguu cgugagcaac 1260 ggcacccacu gguucgugac ccagcggaac uucuacgagc cccagaucau caccaccgac 1320 aacaccuucg ugagcggcaa cugcgacgug gugaucggca ucgugaacaa caccguguac 1380 gauccccugc agcccgagcu ggacagcuuc aaggaggagc uggacaagua cuucaagaau 1440 cacaccagcc ccgacgugga ccugggcgac aucagcggca ucaacgccag cguggugaac 1500 auccagaagg agaucgaucg gcugaacgag guggccaaga accugaacga gagccugauc 1560 gaccugcagg agcugggcaa guacgagcag uacaucaagu ggcccuggua caucuggcug 1620 ggcuucaucg ccggccugau cgccaucgug auggugacca ucaugcugug cugcaugacc 1680 agcugcugca gcugccugaa gggcuguugc agcugcggca gcugcugcaa guucgacgag 1740 gacgacagcg agcccgugcu gaagggcgug aagcugcacu acacc 1785 <210> 146 <211> 595 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 146 Met Tyr Ser Met Gln Leu Ala Ser Cys Val Thr Leu Thr Leu Val Leu 1 5 10 15 Leu Val Asn Ser Gln Gly Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn 20 25 30 Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr Thr Glu Ile 35 40 45 Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr Met Tyr Ile 50 55 60 Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln Tyr Gly Ser 65 70 75 80 Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala Val Glu Gln 85 90 95 Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln Ile Tyr Lys 100 105 110 Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu 115 120 125 Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu Asp Leu Leu 130 135 140 Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly 145 150 155 160 Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys 165 170 175 Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp Glu Met Ile 180 185 190 Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp 195 200 205 Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met 210 215 220 Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu 225 230 235 240 Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile 245 250 255 Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp 260 265 270 Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu 275 280 285 Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser 290 295 300 Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile Asp Arg Leu Ile Thr 305 310 315 320 Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg 325 330 335 Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr Lys Met Ser 340 345 350 Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp Phe Cys Gly Lys Gly 355 360 365 Tyr His Leu Met Ser Phe Pro Gln Ser Ala Pro His Gly Val Val Phe 370 375 380 Leu His Val Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala 385 390 395 400 Pro Ala Ile Cys His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val 405 410 415 Phe Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr 420 425 430 Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys 435 440 445 Asp Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln 450 455 460 Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn 465 470 475 480 His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala 485 490 495 Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala 500 505 510 Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr 515 520 525 Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly Phe Ile Ala 530 535 540 Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys Cys Met Thr 545 550 555 560 Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly Ser Cys Cys 565 570 575 Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys Gly Val Lys Leu 580 585 590 His Tyr Thr 595 <210> 147 <211> 1961 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 147 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uacagcaugc agcuggcuag cugcgugacc cugacccugg ugcugcuggu gaacagccag 120 ggcgccgaga acagcguggc cuacagcaac aacagcaucg ccauccccac caacuucacc 180 aucagcguga ccaccgagau ucugcccgug agcaugacca agaccagcgu ggacugcacc 240 auguacaucu gcggcgacag caccgagugc agcaaccugc ugcugcagua cggcagcuuc 300 ugcacccagc ugaaccgggc ccugaccggc aucgccgugg agcaggacaa gaacacccag 360 gagguguucg cccaggugaa gcagaucuac aagaccccuc ccaucaagga cuucggcggc 420 uucaacuuca gccagauccu gcccgacccc agcaagccca gcaagcggag cuucaucgag 480 gaccugcugu ucaacaaggu gacccuagcc gacgccggcu ucaucaagca guacggcgac 540 ugccucggcg acauagccgc ccgggaccug aucugcgccc agaaguucaa cggccugacc 600 gugcugccuc cccugcugac cgacgagaug aucgcccagu acaccagcgc ccuguuagcc 660 ggaaccauca ccagcggcug gacuuucggc gcuggagccg cucugcagau ccccuucgcc 720 augcagaugg ccuaccgguu caacggcauc ggcgugaccc agaacgugcu guacgagaac 780 cagaagcuga ucgccaacca guucaacagc gccaucggca agauccagga cagccugagc 840 agcaccgcua gcgcccuggg caagcugcag gacgugguga accagaacgc ccaggcccug 900 aacacccugg ugaagcagcu gagcagcaac uucggcgcca ucagcagcgu gcugaacgac 960 auccugagcc ggcuggaccc ucccgaggcc gaggugcaga ucgaccggcu gaucacuggc 1020 cggcugcaga gccugcagac cuacgugacc cagcagcuga uccgggccgc cgagauucgg 1080 gccagcgcca accuggccgc caccaagaug agcgagugcg ugcugggcca gagcaagcgg 1140 guggacuucu gcggcaaggg cuaccaccug augagcuuuc cccagagcgc accccacgga 1200 gugguguucc ugcacgugac cuacgugccc gcccaggaga agaacuucac caccgcccca 1260 gccaucugcc acgacggcaa ggcccacuuu ccccgggagg gcguguucgu gagcaacggc 1320 acccacuggu ucgugaccca gcggaacuuc uacgagcccc agaucaucac caccgacaac 1380 accuucguga gcggcaacug cgacguggug aucggcaucg ugaacaacac cguguacgau 1440 ccccugcagc ccgagcugga cagcuucaag gaggagcugg acaaguacuu caagaaucac 1500 accagccccg acguggaccu gggcgacauc agcggcauca acgccagcgu ggugaacauc 1560 cagaaggaga ucgaucggcu gaacgaggug gccaagaacc ugaacgagag ccugaucgac 1620 cugcaggagc ugggcaagua cgagcaguac aucaaguggc ccugguacau cuggcugggc 1680 uucaucgccg gccugaucgc caucgugaug gugaccauca ugcugugcug caugaccagc 1740 ugcugcagcu gccugaaggg cuguugcagc ugcggcagcu gcugcaaguu cgacgaggac 1800 gacagcgagc ccgugcugaa gggcgugaag cugcacuaca ccugauaaua ggcuggagcc 1860 ucgguggccu agcuucuugc cccuugggcc uccccccagc cccuccuccc cuuccugcac 1920 ccguaccccc guggucuuug aauaaagucu gagugggcgg c 1961 <210> 148 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 148 Ala Lys Phe Val Ala Ala Trp Thr Leu Lys Ala Ala Ala 1 5 10 <210> 149 <211> 2216 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 149 gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60 uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120 acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180 guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240 gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300 cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360 cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420 aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480 ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540 agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600 aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660 aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720 gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780 cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840 gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900 aacggcacca ucaccgacgc cguggacugc gcccuggacc cucugagcga gaccaagugc 960 acccugaaga gcuucaccgu ggagaagggc aucuaccaga ccagcaacuu ccgggugcag 1020 cccaccgaga gcaucgugcg guuccccaac aucaccaacc ugugccccuu cggcgaggug 1080 uucaacgcca cccgguucgc cagcguguac gccuggaacc ggaagcggau cagcaacugc 1140 guggccgacu acagcgugcu guacaacagc gccagcuuca gcaccuucaa gugcuacggc 1200 gugagcccca ccaagcugaa cgaccugugc uucaccaacg uguacgccga cagcuucgug 1260 auccguggcg acgaggugcg gcagaucgca cccggccaga caggcaagau cgccgacuac 1320 aacuacaagc ugcccgacga cuucaccggc ugcgugaucg ccuggaacag caacaaccuc 1380 gacagcaagg ugggcggcaa cuacaacuac cuguaccggc uguuccggaa gagcaaccug 1440 aagcccuucg agcgggacau cagcaccgag aucuaccaag ccggcuccac cccuugcaac 1500 ggcguggagg gcuucaacug cuacuucccu cugcagagcu acggcuucca gcccaccaac 1560 ggcgugggcu accagcccua ccggguggug gugcugagcu ucgagcugcu gcacgcccca 1620 gccaccgugu guggccccaa gaagagcacc aaccugguga agaacaagug cgugaacuuc 1680 aacuucaacg gccuuaccgg caccggcgug cugaccgaga gcaacaagaa auuccugccc 1740 uuucagcagu ucggccggga caucgccgac accaccgacg cugugcggga uccccagacc 1800 cuggagaucc uggacaucac cccuugcagc uucggcggcg ugagcgugau caccccaggc 1860 accaacacca gcaaccaggu ggccgugcug uaccaggacg ugaacugcac cgaggugccc 1920 guggccaucc acgccgacca gcugacaccc accuggcggg ucuacagcac cggcagcaac 1980 guguuccaga cccgggccgg uugccugauc ggcgccgagc acgugaacaa cagcuacgag 2040 ugcgacaucc ccaucggcgc cggcaucugu gccagcuacc agacccagac caauucauga 2100 uaauaggcug gagccucggu ggccuagcuu cuugccccuu gggccucccc ccagccccuc 2160 cuccccuucc ugcacccgua cccccguggu cuuugaauaa agucugagug ggcggc 2216 <210> 150 <211> 2040 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 150 auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60 cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120 aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180 aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240 aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300 auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360 aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420 cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480 agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540 ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600 uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660 ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720 cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780 ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840 gagaacggca ccaucaccga cgccguggac ugcgcccugg acccucugag cgagaccaag 900 ugcacccuga agagcuucac cguggagaag ggcaucuacc agaccagcaa cuuccgggug 960 cagcccaccg agagcaucgu gcgguucccc aacaucacca accugugccc cuucggcgag 1020 guguucaacg ccacccgguu cgccagcgug uacgccugga accggaagcg gaucagcaac 1080 ugcguggccg acuacagcgu gcuguacaac agcgccagcu ucagcaccuu caagugcuac 1140 ggcgugagcc ccaccaagcu gaacgaccug ugcuucacca acguguacgc cgacagcuuc 1200 gugauccgug gcgacgaggu gcggcagauc gcacccggcc agacaggcaa gaucgccgac 1260 uacaacuaca agcugcccga cgacuucacc ggcugcguga ucgccuggaa cagcaacaac 1320 cucgacagca aggugggcgg caacuacaac uaccuguacc ggcuguuccg gaagagcaac 1380 cugaagcccu ucgagcggga caucagcacc gagaucuacc aagccggcuc caccccuugc 1440 aacggcgugg agggcuucaa cugcuacuuc ccucugcaga gcuacggcuu ccagcccacc 1500 aacggcgugg gcuaccagcc cuaccgggug guggugcuga gcuucgagcu gcugcacgcc 1560 ccagccaccg uguguggccc caagaagagc accaaccugg ugaagaacaa gugcgugaac 1620 uucaacuuca acggccuuac cggcaccggc gugcugaccg agagcaacaa gaaauuccug 1680 cccuuucagc aguucggccg ggacaucgcc gacaccaccg acgcugugcg ggauccccag 1740 acccuggaga uccuggacau caccccuugc agcuucggcg gcgugagcgu gaucacccca 1800 ggcaccaaca ccagcaacca gguggccgug cuguaccagg acgugaacug caccgaggug 1860 cccguggcca uccacgccga ccagcugaca cccaccuggc gggucuacag caccggcagc 1920 aacguguucc agacccgggc cgguugccug aucggcgccg agcacgugaa caacagcuac 1980 gagugcgaca uccccaucgg cgccggcauc ugugccagcu accagaccca gaccaauuca 2040 <210> 151 <211> 680 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 151 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser 675 680 <210> 152 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 152 Gly Ser Gly Gly 1

Claims (154)

  1. SARS-CoV-2 스파이크 단백질의 적어도 2개의 도메인, 및 전장보다 작은 스파이크 단백질을 암호화하는 오픈 리딩 프레임(ORF)을 포함하는 메신저 리보핵산(mRNA).
  2. 제1항에 있어서, 상기 2개의 도메인 중 하나는 SARS-CoV-2 스파이크 단백질의 N-말단 도메인(NTD)인, mRNA.
  3. 제1항 또는 제2항에 있어서, 상기 2개의 도메인 중 하나는 SARS-CoV-2 스파이크 단백질의 수용체 결합 도메인(RBD)인, mRNA.
  4. 제2항 또는 제3항에 있어서, 상기 ORF는 NTD 및/또는 RBD에 연결된 막횡단 도메인(TD)을 암호화하는 것인, mRNA.
  5. 제4항에 있어서, 상기 TD는 인플루엔자 혈구응집소 막횡단 도메인인, mRNA.
  6. 제3항 또는 제4항에 있어서, 상기 ORF는 NTD - RBD - TM을 포함하는 것인, mRNA.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 적어도 2개의 도메인은 절단 가능하거나 절단 불가능한 링커를 통해 연결된 것인, mRNA.
  8. 제7항에 있어서, 상기 절단 불가능한 링커는 글리신-세린(GS) 링커인, mRNA.
  9. 제8항에 있어서, 상기 GS 링커는 4-15개의 아미노산인, mRNA.
  10. 제6항에 있어서, 상기 링커는 pan HLA DR-결합 에피토프(PADRE)인, mRNA.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 ORF는 신호 펩티드를 암호화하는 것인, mRNA.
  12. 제11항에 있어서, 상기 신호 펩티드는 NTD에 연결된 것인, mRNA.
  13. 제11항에 있어서, 상기 신호 펩티드는 RBD에 연결된 것인, mRNA.
  14. 제11항 내지 제13항 중 어느 한 항에 있어서, 상기 신호 펩티드는 SARS-CoV-2와 이종인, mRNA.
  15. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 적어도 2개의 도메인은 가용성인, mRNA.
  16. 제1항 내지 제14항 중 어느 한 항에 있어서, 상기 ORF는 트래피킹 신호 도메인을 암호화하는 것인, mRNA.
  17. 제16항에 있어서, 상기 트래피킹 신호 도메인은 대식세포 마커인, mRNA.
  18. 제16항에 있어서, 상기 대식세포 마커는 CD86 및/또는 CD11b인, mRNA.
  19. 제16항에 있어서, 상기 트래피킹 신호 도메인은 VSV-G 세포질 꼬리(VSVGct)인, mRNA.
  20. 제1항에 있어서, 상기 2개의 도메인 중 하나는 SARS-CoV-2 스파이크 단백질의 제1 반복 헵타펩티드: HPPHCPC(HR1)인, mRNA.
  21. 제1항에 있어서, 상기 2개의 도메인 중 하나는 SARS-CoV-2 스파이크 단백질의 제2 반복 헵타펩티드: HPPHCPC(HR2)인, mRNA.
  22. 제20항 또는 제21항에 있어서, 상기 ORF는 HR1 및/또는 HR2에 연결된 막횡단 도메인(TD)을 암호화하는 것인, mRNA.
  23. 제22항에 있어서, 상기 TD는 인플루엔자 혈구응집소 막횡단 도메인인, mRNA.
  24. 제20항 내지 제23항 중 어느 한 항에 있어서, 상기 ORF는 융합 펩티드(FP)를 암호화하는 것인, mRNA.
  25. 제20항 내지 제23항 중 어느 한 항에 있어서, 상기 ORF는 CT 꼬리를 암호화하는 것인, mRNA.
  26. SARS-CoV-2 스파이크 단백질의 수용체 결합 도메인(RBD)을 암호화하는 오픈 리딩 프레임(ORF)을 포함하는 메신저 리보핵산(mRNA).
  27. 제26항에 있어서, 상기 RBD는 가용성인, mRNA.
  28. 제26항에 있어서, 상기 RBD는 막횡단 도메인, 선택적으로 인플루엔자 혈구응집소 막횡단 도메인에 연결된 것인, mRNA.
  29. SARS-CoV-2 스파이크 단백질의 N-말단 도메인(NTD)을 암호화하는 오픈 리딩 프레임(ORF)을 포함하는 메신저 리보핵산(mRNA).
  30. 제29항에 있어서, 상기 NTD는 SARS-CoV-2 스파이크 단백질의 RBD에 연결되어 NTD-RBD 융합 단백질을 형성하는 것인, mRNA.
  31. 제30항에 있어서, 상기 NTD-RBD 융합은 막횡단 도메인(TM), 선택적으로 인플루엔자 혈구응집소 막횡단 도메인에 연결되어 NTD-RBD-TM 단백질을 형성하는 것인, mRNA.
  32. 제30항에 있어서, 상기 NTD-RBD 융합은 C-말단 절단을 포함하는 것인, mRNA.
  33. 제26항 내지 제32항 중 어느 한 항에 있어서, 상기 NTD 및/또는 RBD는 확장된 영역을 포함하는 것인, mRNA.
  34. S1 서브유닛을 암호화하는 오픈 리딩 프레임(ORF)을 포함하는 메신저 리보핵산(mRNA)으로서, 상기 S1 서브유닛은 막횡단 도메인, 선택적으로 인플루엔자 혈구응집소 막횡단 도메인에 연결된 것인 메신저 리보핵산(mRNA).
  35. S1 서브유닛을 암호화하는 오픈 리딩 프레임(ORF)을 포함하는 메신저 리보핵산(mRNA)으로서, 상기 S1 서브유닛은 S 단백질의 RBD 또는 RBD의 일부를 제거하도록 변형된 것인 메신저 리보핵산(mRNA).
  36. S2 서브유닛에 연결된 S1 서브유닛을 암호화하는 오픈 리딩 프레임(ORF)을 포함하는 메신저 리보핵산(mRNA)으로서, 상기 S1 서브유닛은 HKU1 S 단백질로부터 유래된 것인 메신저 리보핵산(mRNA).
  37. S2 서브유닛에 연결된 S1 서브유닛을 암호화하는 오픈 리딩 프레임(ORF)을 포함하는 메신저 리보핵산(mRNA)으로서, 상기 S1 서브유닛은 OC43 S 단백질로부터 유래된 것인 메신저 리보핵산(mRNA).
  38. 제34항 내지 제37항 중 어느 한 항에 있어서, 대식세포 마커, 선택적으로 CD86, CD11B 및/또는 VSVGct로부터 선택적으로 선택되는 트래피킹 신호를 추가로 포함하는 것인, mRNA.
  39. SARS-CoV-2 스파이크 단백질의 S2 서브유닛을 암호화하는 오픈 리딩 프레임(ORF)을 포함하는 메신저 리보핵산(mRNA).
  40. SARS-CoV-2 스파이크 단백질의 수용체 결합 도메인(RBD) 및 단백질 막횡단 도메인을 포함하는 융합 단백질을 암호화하는 오픈 리딩 프레임을 포함하는 메신저 리보핵산(mRNA).
  41. 제40항에 있어서, 상기 단백질 막횡단 도메인은 인플루엔자 혈구응집소 막횡단 도메인인, mRNA.
  42. SARS-CoV-2 스파이크 단백질의 아미노(N)-말단 도메인(NTD) 및 막횡단 도메인을 포함하는 융합 단백질을 암호화하는 오픈 리딩 프레임을 포함하는 메신저 리보핵산(mRNA).
  43. 제42항에 있어서, 상기 막횡단 도메인은 인플루엔자 혈구응집소 막횡단 도메인인, mRNA.
  44. SARS-CoV-2 스파이크 단백질의 수용체 결합 도메인에 연결된 SARS-CoV-2 스파이크 단백질의 아미노(N)-말단 도메인을 포함하는 융합 단백질을 암호화하는 오픈 리딩 프레임을 포함하는 메신저 리보핵산(mRNA).
  45. 제44항에 있어서, 상기 융합 단백질은 막횡단 도메인을 추가로 포함하는 것인, mRNA.
  46. 제1항 내지 제45항 중 어느 한 항에 있어서, 5' 캡, 선택적으로 7mG(5')ppp(5')NlmpNp를 추가로 포함하는 것인, mRNA.
  47. 제1항 내지 제45항 중 어느 한 항에 있어서, 선택적으로 약 100개의 뉴클레오티드 길이를 갖는 폴리A 꼬리를 추가로 포함하는 것인, mRNA.
  48. 제1항 내지 제46항 중 어느 한 항에 있어서, 상기 mRNA는 화학적 변형, 선택적으로 1-메틸슈도우리딘을 포함하는 것인, mRNA.
  49. 제1항 내지 제47항 중 어느 한 항에 있어서, 상기 mRNA 내의 각각의 우리딘은 1-메틸슈도우리딘인, mRNA.
  50. (a) SARS-CoV-2 스파이크 단백질의 수용체 결합 도메인(RBD) 및 단백질 막횡단 도메인을 포함하는 융합 단백질을 암호화하는 오픈 리딩 프레임을 포함하는 메신저 리보핵산(mRNA); 및
    (b) SARS-CoV-2 스파이크 단백질의 아미노(N)-말단 도메인(NTD) 및 막횡단 도메인을 포함하는 융합 단백질을 암호화하는 오픈 리딩 프레임을 포함하는 mRNA
    를 포함하는 조성물.
  51. 제49항에 있어서, 상기 단백질 막횡단 도메인은 인플루엔자 혈구응집소 막횡단 도메인인, 조성물.
  52. 제50항에 있어서, 상기 (a)의 융합 단백질은 서열번호 77의 아미노산 서열에 대해 적어도 80% 동일성을 갖는 아미노산 서열을 포함하는 것인, 조성물.
  53. 제51항에 있어서, 상기 (a)의 융합 단백질은 서열번호 77의 아미노산 서열에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하는 것인, 조성물.
  54. 제52항에 있어서, 상기 (a)의 융합 단백질은 서열번호 77의 아미노산 서열을 포함하는 것인, 조성물.
  55. 제50항 내지 제53항 중 어느 한 항에 있어서, 상기 (a)의 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열에 대해 적어도 70% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, 조성물.
  56. 제54항에 있어서, 상기 (a)의 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열에 대해 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, 조성물.
  57. 제55항에 있어서, 상기 (a)의 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열을 포함하는 것인, 조성물.
  58. 제50항 내지 제56항 중 어느 한 항에 있어서, 상기 (b)의 융합 단백질은 서열번호 47의 아미노산 서열에 대해 적어도 80% 동일성을 갖는 아미노산 서열을 포함하는 것인, 조성물.
  59. 제57항에 있어서, 상기 (b)의 융합 단백질은 서열번호 47의 아미노산 서열에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하는 것인, 조성물.
  60. 제58항에 있어서, 상기 (b)의 융합 단백질은 서열번호 47의 아미노산 서열을 포함하는 것인, 조성물.
  61. 제50항 내지 제59항 중 어느 한 항에 있어서, 상기 (b)의 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열에 대해 적어도 70% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, 조성물.
  62. 제60항에 있어서, 상기 (b)의 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열에 대해 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, 조성물.
  63. 제61항에 있어서, 상기 (b)의 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열을 포함하는 것인, 조성물.
  64. 제49항 내지 제62항 중 어느 한 항에 있어서, 상기 (a)의 mRNA 대 (b)의 mRNA의 비율은 약 1:1인, 조성물.
  65. 제1항 내지 제48항 중 어느 한 항에 있어서, 조성물 내 지질 나노입자를 추가로 포함하는 것인, mRNA.
  66. 제49항 내지 제62항 중 어느 한 항에 있어서, 지질 나노입자를 추가로 포함하는 것인, 조성물.
  67. 제64항 또는 제65항에 있어서, 상기 mRNA는 지질 나노입자 내 존재하는 것인, 조성물.
  68. 제49항 내지 제62항 중 어느 한 항에 있어서, 상기 (a)의 mRNA는 지질 나노입자 내 존재하고, 상기 (b)의 mRNA는 지질 나노입자 내 존재하는 것인, 조성물.
  69. 제67항에 있어서, 상기 (a) 및 (b)의 mRNA는 동일한 지질 나노입자 내 존재하거나, 상기 (a) 및 (b)의 각각의 mRNA는 서로 상대적으로 별개의 나노입자 내 제형화되는 것인, 조성물.
  70. 제64항 내지 제68항 중 어느 한 항에 있어서, 상기 지질 나노입자는 양이온성 지질을 포함하는 것인, 조성물.
  71. 제69항에 있어서, 상기 지질 나노입자는 중성 지질을 추가로 포함하는 것인, 조성물.
  72. 제69항 또는 제70항에 있어서, 상기 지질 나노입자는 스테롤을 추가로 포함하는 것인, 조성물.
  73. 제69항 내지 제71항 중 어느 한 항에 있어서, 상기 지질 나노입자는 폴리에틸렌 글리콜(PEG)-변형된 지질을 추가로 포함하는 것인, 조성물.
  74. 제69항 내지 제72항 중 어느 한 항에 있어서, 상기 지질 나노입자는 이온화 가능한 양이온성 지질, 중성 지질, 스테롤, 및 PEG-변형된 지질을 포함하는 것인, 조성물.
  75. 제73항에 있어서, 상기 이온화 가능한 양이온성 지질은 헵타데칸-9-일 8((2 하이드록시에틸)(6 옥소 6-(운데실옥시)헥실)아미노)옥타노에이트 (화합물 1)인, 조성물.
  76. 제73항 또는 제74항에 있어서, 상기 중성 지질은 1,2 디스테아로일-sn-글리세로-3-포스포콜린(DSPC)인, 조성물.
  77. 제69항 내지 제75항 중 어느 한 항에 있어서, 상기 스테롤은 콜레스테롤인, 조성물.
  78. 제69항 내지 제76항 중 어느 한 항에 있어서, 상기 PEG-변형된 지질은 1,2 디미리스토일-sn-글리세롤, 메톡시폴리에틸렌글리콜(PEG2000 DMG)인, 조성물.
  79. 제69항 내지 제77항 중 어느 한 항에 있어서, 상기 지질 나노입자는 20-60 mol%의 이온화 가능한 양이온성 지질, 5-25 mol%의 중성 지질, 25-55 mol%의 스테롤, 및 0.5-15 mol%의 PEG-변형된 지질을 포함하는 것인, 조성물.
  80. 제78항에 있어서, 상기 지질 나노입자는
    40-50 mol%, 선택적으로 45-50 mol%의 이온화 가능한 지질, 30-45 mol%, 선택적으로 35-40 mol%의 스테롤, 5-15 mol%, 선택적으로 10-12 mol%의 헬퍼 지질, 1-5%, 선택적으로 1-3 mol%, 또는 1.5 내지 2.5 mol%의 PEG 지질:
    을 포함하는 조성물.
  81. 제79항에 있어서, 상기 지질 나노입자는
    40-50 mol%, 선택적으로 45-50 mol%의 화합물 1, 30-45 mol%, 선택적으로 35-40 mol%의 콜레스테롤, 5-15 mol%, 선택적으로 10-12 mol%의 DSPC, 1-5%, 선택적으로 1-3 mol%, 또는 1.5 내지 2.5 mol%의 PEG2000DMG:
    를 포함하는 조성물.
  82. SARS-CoV-2에 대한 중화 항체 반응을 대상체에서 유도하기에 효과적인 양으로 제1항 내지 제80항 중 어느 한 항의 mRNA 또는 조성물을 대상체에게 투여하는 단계를 포함하는 방법.
  83. SARS-CoV-2에 대한 T 세포 면역 반응을 대상체에서 유도하기에 효과적인 양으로 제1항 내지 제81항 중 어느 한 항의 mRNA 또는 조성물을 대상체에게 투여하는 단계를 포함하는 방법.
  84. SARS-CoV-2에 대한 중화 항체 반응 및 T 세포 면역 반응을 대상체에서 유도하기에 효과적인 양으로 제1항 내지 제48항 중 어느 한 항의 mRNA를 대상체에게 투여하는 단계를 포함하는 방법.
  85. SARS-CoV-2 스파이크 단백질의 적어도 1개의 도메인을 암호화하는 오픈 리딩 프레임(ORF)을 포함하는 메신저 리보핵산(mRNA).
  86. 제84항에 있어서, 상기 mRNA는 제1항 내지 제48항 중 어느 한 항의 것인, mRNA.
  87. 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 77의 아미노산 서열에 대해 적어도 80% 동일성을 갖는 아미노산 서열을 암호화하는 것인, mRNA.
  88. 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 77의 아미노산 서열에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 암호화하는 것인, mRNA.
  89. 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 77의 아미노산 서열을 암호화하는 것인, mRNA.
  90. 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 76의 뉴클레오티드 서열에 대해 적어도 70% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, mRNA.
  91. 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 76의 뉴클레오티드 서열에 대해 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, mRNA.
  92. 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 76의 뉴클레오티드 서열을 포함하는 것인, mRNA.
  93. 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 47의 아미노산 서열에 대해 적어도 80% 동일성을 갖는 아미노산 서열을 암호화하는 것인, mRNA.
  94. 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 47의 아미노산 서열에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 암호화하는 것인, mRNA.
  95. 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 47의 아미노산 서열을 암호화하는 것인, mRNA.
  96. 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 46의 뉴클레오티드 서열에 대해 적어도 70% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, mRNA.
  97. 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 46의 뉴클레오티드 서열에 대해 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, mRNA.
  98. 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 46의 뉴클레오티드 서열을 포함하는 것인, mRNA.
  99. 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 62의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 암호화하고, 선택적으로 상기 항원은 서열번호 62의 아미노산 서열을 포함하는 것인, mRNA.
  100. 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 61의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 61의 뉴클레오티드 서열을 포함하는 것인, mRNA.
  101. 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 92, 140, 또는 143의 아미노산 서열에 대해 적어도 80% 동일성을 갖는 아미노산 서열을 암호화하는 것인, mRNA.
  102. 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 92, 140, 또는 143의 아미노산 서열에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 암호화하는 것인, mRNA.
  103. 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 92, 140, 또는 143의 아미노산 서열을 암호화하는 것인, mRNA.
  104. 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 91, 139, 또는 142의 뉴클레오티드 서열에 대해 적어도 70% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, mRNA.
  105. 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 91, 139, 또는 142의 뉴클레오티드 서열에 대해 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, mRNA.
  106. 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 91, 139, 또는 142의 뉴클레오티드 서열을 포함하는 것인, mRNA.
  107. 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 107의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 암호화하고, 선택적으로 상기 항원은 서열번호 107의 아미노산 서열을 포함하는 것인, mRNA.
  108. 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 106의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 106의 뉴클레오티드 서열을 포함하는 것인, mRNA.
  109. 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 59, 86, 89, 116, 119, 또는 122 중 임의의 하나의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 암호화하고, 선택적으로 상기 항원은 서열번호 59, 86, 89, 116, 119, 또는 122 중 임의의 하나의 아미노산 서열을 포함하는 것인, mRNA.
  110. 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 58, 85, 88, 115, 118, 또는 121 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 58, 85, 88, 115, 118, 또는 121 중 임의의 하나의 뉴클레오티드 서열을 포함하는 것인, mRNA.
  111. 서열번호 5의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하는 S1 서브유닛 항원을 암호화하는 오픈 리딩 프레임(ORF)을 포함하고, 선택적으로 상기 항원은 서열번호 5의 아미노산 서열을 포함하는 메신저 리보핵산(mRNA).
  112. 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 3의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 3의 뉴클레오티드 서열을 포함하는 것인, mRNA.
  113. 제84항 또는 제85항에 있어서, 상기 항원은 서열번호 17 또는 146의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 17 또는 146의 아미노산 서열을 포함하는 것인, mRNA.
  114. 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 16 또는 145의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 16 또는 145의 뉴클레오티드 서열을 포함하는 것인, mRNA.
  115. 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 20, 23, 26, 29, 32 또는 35 중 임의의 하나의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 암호화하고, 선택적으로 상기 항원은 서열번호 20, 23, 26, 29, 32 또는 35 중 임의의 하나의 아미노산 서열을 포함하는 것인, mRNA.
  116. 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 19, 22, 25, 28, 41, 또는 34 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 19, 22, 25, 28, 31, 또는 34 중 임의의 하나의 뉴클레오티드 서열을 포함하는 것인, mRNA.
  117. 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 38의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 암호화하고, 선택적으로 상기 항원은 서열번호 38의 아미노산 서열을 포함하는 것인, mRNA.
  118. 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 37의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 37의 뉴클레오티드 서열을 포함하는 것인, mRNA.
  119. 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 41의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 암호화하고, 선택적으로 상기 항원은 서열번호 41의 아미노산 서열을 포함하는 것인, mRNA.
  120. 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 40의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 40의 뉴클레오티드 서열을 포함하는 것인, mRNA.
  121. 제1항 내지 제119항 중 어느 한 항에 있어서, 서열번호 131 또는 2의 뉴클레오티드 서열을 선택적으로 포함하는, 5' 비번역 영역(UTR)을 추가로 포함하는 것인, mRNA.
  122. 제1항 내지 제120항 중 어느 한 항에 있어서, 서열번호 132 또는 4의 뉴클레오티드 서열을 선택적으로 포함하는, 3' 비번역 영역(UTR)을 추가로 포함하는 것인, mRNA.
  123. 서열번호 8 또는 65의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하는 항원을 암호화하는 오픈 리딩 프레임(ORF)을 포함하고, 선택적으로 상기 항원은 서열번호 8 또는 65의 아미노산 서열을 포함하는 메신저 리보핵산(mRNA).
  124. 제122항에 있어서, 상기 ORF는 서열번호 7 또는 64의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 7 또는 64의 뉴클레오티드 서열을 포함하는 것인, mRNA.
  125. 서열번호 11, 14, 68, 또는 71 중 임의의 하나의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하는 항원을 암호화하는 오픈 리딩 프레임(ORF)을 포함하고, 선택적으로 상기 항원은 서열번호 11, 14, 68, 또는 71 중 임의의 하나의 아미노산 서열을 포함하는 메신저 리보핵산(mRNA).
  126. 제124항에 있어서, 상기 오픈 리딩 프레임은 서열번호 10, 13, 67, 또는 70 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 10, 13, 67, 또는 70 중 임의의 하나의 뉴클레오티드 서열을 포함하는 것인, mRNA.
  127. 서열번호 44, 50, 74, 80, 83, 101, 104 또는 113 중 임의의 하나의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하는 항원을 암호화하는 오픈 리딩 프레임(ORF)을 포함하고, 선택적으로 상기 항원은 서열번호 44, 50, 74, 80, 83, 101, 104 또는 113 중 임의의 하나의 아미노산 서열을 포함하는 메신저 리보핵산(mRNA).
  128. 제126항에 있어서, 상기 오픈 리딩 프레임은 서열번호 43, 49, 73, 79, 82, 100, 103, 또는 112 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 43, 49, 73, 79, 82, 100, 103, 또는 112 중 임의의 하나의 뉴클레오티드 서열을 포함하는 것인, mRNA.
  129. 제108항에 있어서, 상기 항원은 서열번호 95, 98, 또는 110 중 임의의 하나의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 95, 98, 또는 110 중 임의의 하나의 아미노산 서열을 포함하는 것인, mRNA.
  130. 제127항 또는 제128항에 있어서, 상기 오픈 리딩 프레임은 서열번호 94, 97, 또는 109 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 94, 97, 또는 109 중 임의의 하나의 뉴클레오티드 서열을 포함하는 것인, mRNA.
  131. 제84항 내지 제129항 중 어느 한 항에 있어서, 조성물 내 지질 나노입자를 추가로 포함하는 것인, mRNA.
  132. 제130항에 있어서, 상기 mRNA는 지질 나노입자 내 존재하는 것인, 조성물.
  133. 제130항 내지 제131항 중 어느 한 항에 있어서, 상기 지질 나노입자는 양이온성 지질을 포함하는 것인, 조성물.
  134. 제132항에 있어서, 상기 지질 나노입자는 중성 지질을 추가로 포함하는 것인, 조성물.
  135. 제130항 내지 제133항 중 어느 한 항에 있어서, 상기 지질 나노입자는 스테롤을 추가로 포함하는 것인, 조성물.
  136. 제130항 내지 제134항 중 어느 한 항에 있어서, 상기 지질 나노입자는 폴리에틸렌 글리콜(PEG)-변형된 지질을 추가로 포함하는 것인, 조성물.
  137. 제130항 내지 제135항 중 어느 한 항에 있어서, 상기 지질 나노입자는 이온화 가능한 양이온성 지질, 중성 지질, 스테롤, 및 PEG-변형된 지질을 포함하는 것인, 조성물.
  138. 제136항에 있어서, 상기 이온화 가능한 양이온성 지질은 헵타데칸-9-일 8((2 하이드록시에틸)(6 옥소 6-(운데실옥시)헥실)아미노)옥타노에이트 (화합물 1)인, 조성물.
  139. 제136항 또는 제137항에 있어서, 상기 중성 지질은 1,2 디스테아로일-sn-글리세로-3-포스포콜린(DSPC)인, 조성물.
  140. 제130항 내지 제138항 중 어느 한 항에 있어서, 상기 스테롤은 콜레스테롤인, 조성물.
  141. 제130항 내지 제139항 중 어느 한 항에 있어서, 상기 PEG-변형된 지질은 1,2 디미리스토일-sn-글리세롤, 메톡시폴리에틸렌글리콜(PEG2000 DMG)인, 조성물.
  142. 제130항 내지 제140항 중 어느 한 항에 있어서, 상기 지질 나노입자는 20-60 mol%의 이온화 가능한 양이온성 지질, 5-25 mol%의 중성 지질, 25-55 mol%의 스테롤, 및 0.5-15 mol%의 PEG-변형된 지질을 포함하는 것인, 조성물.
  143. 제141항에 있어서, 상기 지질 나노입자는
    40-50 mol%, 선택적으로 45-50 mol%의 이온화 가능한 지질, 30-45 mol%, 선택적으로 35-40 mol%의 스테롤, 5-15 mol%, 선택적으로 10-12 mol%의 헬퍼 지질, 1-5%, 선택적으로 1-3 mol%, 또는 1.5 내지 2.5 mol%의 PEG 지질:
    을 포함하는 조성물.
  144. 제142항에 있어서, 상기 지질 나노입자는
    40-50 mol%, 선택적으로 45-50 mol%의 화합물 1, 30-45 mol%, 선택적으로 35-40 mol%의 콜레스테롤, 5-15 mol%, 선택적으로 10-12 mol%의 DSPC, 1-5%, 선택적으로 1-3 mol%, 또는 1.5 내지 2.5 mol%의 PEG2000DMG:
    를 포함하는 조성물.
  145. 제84항 내지 제129항 중 어느 한 항에 있어서, 상기 mRNA는 화학적 변형, 선택적으로 1-메틸슈도우리딘을 포함하는 것인, mRNA.
  146. 제84항 내지 제129항 중 어느 한 항에 있어서, 상기 mRNA 내의 각각의 우리딘은 1-메틸슈도우리딘인, mRNA.
  147. 제130항 내지 제143항 중 어느 한 항에 있어서, 상기 mRNA는 화학적 변형, 선택적으로 1-메틸슈도우리딘을 포함하는 것인, 조성물.
  148. 제130항 내지 제143항 중 어느 한 항에 있어서, 상기 mRNA 내의 각각의 우리딘은 1-메틸슈도우리딘인, 조성물.
  149. SARS-CoV-2에 대한 중화 항체 반응을 대상체에서 유도하기에 효과적인 양으로 제84항 내지 제129항 중 어느 한 항의 mRNA를 대상체에게 투여하는 단계를 포함하는 방법.
  150. SARS-CoV-2에 대한 T 세포 면역 반응을 대상체에서 유도하기에 효과적인 양으로 제84항 내지 제129항 중 어느 한 항의 mRNA를 대상체에게 투여하는 단계를 포함하는 방법.
  151. SARS-CoV-2에 대한 중화 항체 반응 및 T 세포 면역 반응을 대상체에서 유도하기에 효과적인 양으로 제84항 내지 제129항 중 어느 한 항의 mRNA를 대상체에게 투여하는 단계를 포함하는 방법.
  152. SARS-CoV-2에 대한 중화 항체 반응을 대상체에서 유도하기에 효과적인 양으로 제130항 내지 제143항 중 어느 한 항의 조성물을 대상체에게 투여하는 단계를 포함하는 방법.
  153. SARS-CoV-2에 대한 T 세포 면역 반응을 대상체에서 유도하기에 효과적인 양으로 제130항 내지 제143항 중 어느 한 항의 조성물을 대상체에게 투여하는 단계를 포함하는 방법.
  154. SARS-CoV-2에 대한 중화 항체 반응 및 T 세포 면역 반응을 대상체에서 유도하기에 효과적인 양으로 제130항 내지 제143항 중 어느 한 항의 조성물을 대상체에게 투여하는 단계를 포함하는 방법.
KR1020227028371A 2020-02-07 2021-02-06 Sars-cov-2 mrna 도메인 백신 KR20220140528A (ko)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US202062971825P 2020-02-07 2020-02-07
US62/971,825 2020-02-07
US202063016175P 2020-04-27 2020-04-27
US63/016,175 2020-04-27
US202063044330P 2020-06-25 2020-06-25
US63/044,330 2020-06-25
US202063063137P 2020-08-07 2020-08-07
US63/063,137 2020-08-07
PCT/US2021/016979 WO2021159040A2 (en) 2020-02-07 2021-02-06 Sars-cov-2 mrna domain vaccines

Publications (1)

Publication Number Publication Date
KR20220140528A true KR20220140528A (ko) 2022-10-18

Family

ID=74845093

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227028371A KR20220140528A (ko) 2020-02-07 2021-02-06 Sars-cov-2 mrna 도메인 백신

Country Status (11)

Country Link
US (1) US20230346914A1 (ko)
EP (1) EP4100052A2 (ko)
JP (3) JP7438604B2 (ko)
KR (1) KR20220140528A (ko)
CN (1) CN115551545A (ko)
AU (1) AU2021215938A1 (ko)
BR (1) BR112022015565A2 (ko)
CA (1) CA3170150A1 (ko)
IL (1) IL295377A (ko)
MX (1) MX2022009707A (ko)
WO (1) WO2021159040A2 (ko)

Families Citing this family (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11564893B2 (en) 2015-08-17 2023-01-31 Modernatx, Inc. Methods for preparing particles and related compositions
PL3718565T3 (pl) 2015-10-22 2022-09-19 Modernatx, Inc. Szczepionki przeciwko wirusom układu oddechowego
WO2017070613A1 (en) 2015-10-22 2017-04-27 Modernatx, Inc. Human cytomegalovirus vaccine
AU2017326423B2 (en) 2016-09-14 2023-11-09 Modernatx, Inc. High purity RNA compositions and methods for preparation thereof
MA46584A (fr) 2016-10-21 2019-08-28 Modernatx Inc Vaccin contre le cytomégalovirus humain
MA46766A (fr) 2016-11-11 2019-09-18 Modernatx Inc Vaccin antigrippal
MA47787A (fr) 2017-03-15 2020-01-22 Modernatx Inc Vaccin contre le virus respiratoire syncytial
WO2018170256A1 (en) 2017-03-15 2018-09-20 Modernatx, Inc. Herpes simplex virus vaccine
EP3609534A4 (en) 2017-03-15 2021-01-13 ModernaTX, Inc. BROAD SPECTRUM VACCINE AGAINST THE INFLUENZA VIRUS
US11045540B2 (en) 2017-03-15 2021-06-29 Modernatx, Inc. Varicella zoster virus (VZV) vaccine
MA47790A (fr) 2017-03-17 2021-05-05 Modernatx Inc Vaccins à base d'arn contre des maladies zoonotiques
MA48047A (fr) 2017-04-05 2020-02-12 Modernatx Inc Réduction ou élimination de réponses immunitaires à des protéines thérapeutiques administrées par voie non intraveineuse, par exemple par voie sous-cutanée
WO2018232357A1 (en) 2017-06-15 2018-12-20 Modernatx, Inc. Rna formulations
MA49914A (fr) 2017-08-18 2021-04-21 Modernatx Inc Procédés analytiques par hplc
US11912982B2 (en) 2017-08-18 2024-02-27 Modernatx, Inc. Methods for HPLC analysis
EP3668971B1 (en) 2017-08-18 2024-04-10 ModernaTX, Inc. Rna polymerase variants
JP7275111B2 (ja) 2017-08-31 2023-05-17 モデルナティエックス インコーポレイテッド 脂質ナノ粒子の生成方法
MA54676A (fr) 2018-01-29 2021-11-17 Modernatx Inc Vaccins à base d'arn contre le vrs
US11851694B1 (en) 2019-02-20 2023-12-26 Modernatx, Inc. High fidelity in vitro transcription
US11576966B2 (en) 2020-02-04 2023-02-14 CureVac SE Coronavirus vaccine
US11241493B2 (en) 2020-02-04 2022-02-08 Curevac Ag Coronavirus vaccine
WO2021213924A1 (en) 2020-04-22 2021-10-28 BioNTech SE Coronavirus vaccine
EP4155406A4 (en) * 2020-05-18 2024-03-27 Cansino Shanghai Biotechnologies Co Ltd MRNA OR MRNA COMPOSITION, PREPARATION METHOD THEREFOR AND ASSOCIATED APPLICATION
WO2022046583A1 (en) * 2020-08-24 2022-03-03 Phylex Biosciences, Inc. Reagents and methods for preventing, treating or limiting severe acute respiratory syndrome (sars) coronavirus infection
US11406703B2 (en) 2020-08-25 2022-08-09 Modernatx, Inc. Human cytomegalovirus vaccine
US20220193225A1 (en) * 2020-08-31 2022-06-23 Bruce Lyday Compositions and methods for sars-2 vaccine with virus replicative particles and recombinant glycoproteins
EP4267178A1 (en) 2020-12-22 2023-11-01 CureVac SE Rna vaccine against sars-cov-2 variants
WO2022155524A1 (en) * 2021-01-15 2022-07-21 Modernatx, Inc. Variant strain-based coronavirus vaccines
US11524023B2 (en) * 2021-02-19 2022-12-13 Modernatx, Inc. Lipid nanoparticle compositions and methods of formulating the same
EP4308156A1 (en) * 2021-03-15 2024-01-24 ModernaTX, Inc. Therapeutic use of sars-cov-2 mrna domain vaccines
WO2022235853A1 (en) 2021-05-04 2022-11-10 BioNTech SE Immunogen selection
WO2023022954A1 (en) * 2021-08-15 2023-02-23 Burton Dennis R Undirected mutated mrna vaccine
AU2022330710A1 (en) * 2021-08-17 2024-01-18 Monash University Vaccine compositions
WO2023026170A1 (en) * 2021-08-24 2023-03-02 Victoria Link Limited Fusion polypeptide
WO2023034991A1 (en) * 2021-09-02 2023-03-09 Kansas State University Research Foundation Mrna vaccine formulations and methods of using the same
CN113527522B (zh) * 2021-09-13 2021-12-21 深圳市瑞吉生物科技有限公司 一种新冠病毒三聚体重组蛋白、DNA、mRNA及应用和mRNA疫苗
CN116064598B (zh) * 2021-10-08 2024-03-12 苏州艾博生物科技有限公司 冠状病毒的核酸疫苗
WO2023060483A1 (zh) * 2021-10-13 2023-04-20 清华大学 多肽-rbd免疫偶联物及其用途
CA3235180A1 (en) 2021-10-21 2023-04-27 BioNTech SE Coronavirus vaccine
WO2023064993A1 (en) * 2021-10-21 2023-04-27 The University Of Melbourne Chimeric betacoronavirus spike polypeptides
WO2023092069A1 (en) * 2021-11-18 2023-05-25 Modernatx, Inc. Sars-cov-2 mrna domain vaccines and methods of use
WO2023096990A1 (en) * 2021-11-24 2023-06-01 Flagship Pioneering Innovation Vi, Llc Coronavirus immunogen compositions and their uses
JP2023081859A (ja) 2021-11-29 2023-06-13 ビオンテック・ソシエタス・エウロパエア コロナウイルスワクチン
IL288634A (en) * 2021-12-02 2023-07-01 Yeda Res & Dev Improving the translation and protein secretion efficiency of mRNA vaccines
WO2023113094A1 (ko) * 2021-12-16 2023-06-22 주식회사 씨티씨백 면역원성이 증가된 코로나바이러스감염증-19 백신 조성물
CN116376942A (zh) * 2021-12-31 2023-07-04 广州国家实验室 mRNA疫苗
EP4242308A1 (en) * 2022-01-27 2023-09-13 Shenzhen Rhegen Biotechnology Co., Ltd. Sars-cov-2 mrna vaccine, and preparation method therefor and use thereof
WO2023142283A1 (zh) 2022-01-27 2023-08-03 深圳市瑞吉生物科技有限公司 一种新型冠状病毒mRNA疫苗及其制备方法与应用
WO2023143600A1 (zh) * 2022-01-30 2023-08-03 康希诺生物股份公司 一种用于核酸递送的新型可电离脂质及其lnp组合物和疫苗
CN114213509B (zh) * 2022-02-22 2022-06-10 广州市锐博生物科技有限公司 基于SARS-CoV-2的S蛋白的疫苗及其用途
CN116726162A (zh) * 2022-03-11 2023-09-12 病毒与疫苗研究中心有限公司 用于呼吸道病毒性疾病的疫苗加强组合物
KR20230144421A (ko) * 2022-04-07 2023-10-16 엠큐렉스 주식회사 사스-코로나바이러스 2 감염증에 대한 rna 백신
WO2024002985A1 (en) 2022-06-26 2024-01-04 BioNTech SE Coronavirus vaccine

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10121252A1 (de) 2001-04-30 2002-11-07 Christos C Zouboulis Behandlung der Akne
EP1800697B1 (de) 2001-06-05 2010-04-14 CureVac GmbH Stabilisierte mRNA mit erhöhtem G/C-Gehalt für die Gentherapie
US9012219B2 (en) 2005-08-23 2015-04-21 The Trustees Of The University Of Pennsylvania RNA preparations comprising purified modified RNA for reprogramming cells
DE102005046490A1 (de) 2005-09-28 2007-03-29 Johannes-Gutenberg-Universität Mainz Modifikationen von RNA, die zu einer erhöhten Transkriptstabilität und Translationseffizienz führen
AU2008271907A1 (en) 2007-06-29 2009-01-08 Commonwealth Scientific And Industrial Research Organisation Methods for degrading toxic compounds
EP2535419A3 (en) 2007-09-26 2013-05-29 Intrexon Corporation Synthetic 5'UTRs, expression vectors, and methods for increasing transgene expression
SG10201408165WA (en) 2007-12-11 2015-01-29 Scripps Research Inst Compositions and methods related to mrna translational enhancer elements
AU2010278309B2 (en) 2009-07-31 2013-10-31 Ethris Gmbh RNA with a combination of unmodified and modified nucleotides for protein expression
JP6184945B2 (ja) 2011-06-08 2017-08-23 シャイアー ヒューマン ジェネティック セラピーズ インコーポレイテッド mRNA送達のための脂質ナノ粒子組成物および方法
US10245229B2 (en) 2012-06-08 2019-04-02 Translate Bio, Inc. Pulmonary delivery of mRNA to non-lung target cells
WO2014071963A1 (en) 2012-11-09 2014-05-15 Biontech Ag Method for cellular rna expression
CN105209490A (zh) 2013-03-14 2015-12-30 夏尔人类遗传性治疗公司 用于递送mrna编码的抗体的方法和组合物
SI2972360T1 (en) 2013-03-15 2018-08-31 Translate Bio, Inc. Synergistic improvement in the delivery of nucleic acids via mixed formulations
US10138507B2 (en) 2013-03-15 2018-11-27 Modernatx, Inc. Manufacturing methods for production of RNA transcripts
SG10201801428RA (en) 2013-08-21 2018-03-28 Curevac Ag Method for increasing expression of rna-encoded proteins
WO2015062738A1 (en) 2013-11-01 2015-05-07 Curevac Gmbh Modified rna with decreased immunostimulatory properties
WO2015101415A1 (en) 2013-12-30 2015-07-09 Curevac Gmbh Artificial nucleic acid molecules
DK3090053T3 (en) 2013-12-30 2019-02-25 Curevac Ag Artificial nucleic acid molecules
RU2021109685A (ru) 2014-04-23 2021-04-13 МОДЕРНАТиЭкс, ИНК. Вакцины на основе нуклеиновых кислот
PL3718565T3 (pl) 2015-10-22 2022-09-19 Modernatx, Inc. Szczepionki przeciwko wirusom układu oddechowego
AU2017326423B2 (en) 2016-09-14 2023-11-09 Modernatx, Inc. High purity RNA compositions and methods for preparation thereof
WO2018115527A2 (en) * 2016-12-23 2018-06-28 Curevac Ag Mers coronavirus vaccine
EP3582790A4 (en) 2017-02-16 2020-11-25 ModernaTX, Inc. VERY POWERFUL IMMUNOGENIC COMPOSITIONS
MA47790A (fr) 2017-03-17 2021-05-05 Modernatx Inc Vaccins à base d'arn contre des maladies zoonotiques
EP3668971B1 (en) 2017-08-18 2024-04-10 ModernaTX, Inc. Rna polymerase variants

Also Published As

Publication number Publication date
CN115551545A (zh) 2022-12-30
JP7438604B2 (ja) 2024-02-27
WO2021159040A2 (en) 2021-08-12
CA3170150A1 (en) 2021-08-12
WO2021159040A9 (en) 2021-11-25
EP4100052A2 (en) 2022-12-14
US20230346914A1 (en) 2023-11-02
MX2022009707A (es) 2022-09-07
AU2021215938A1 (en) 2022-09-01
JP2024050973A (ja) 2024-04-10
JP7443608B2 (ja) 2024-03-05
JP2023513544A (ja) 2023-03-31
JP2023153256A (ja) 2023-10-17
IL295377A (en) 2022-10-01
BR112022015565A2 (pt) 2022-09-27
WO2021159040A3 (en) 2021-11-04

Similar Documents

Publication Publication Date Title
JP7443608B2 (ja) SARS-COV-2 mRNAドメインワクチン
US20230108894A1 (en) Coronavirus rna vaccines
US20210228707A1 (en) Coronavirus rna vaccines
US20230355743A1 (en) Multi-proline-substituted coronavirus spike protein vaccines
WO2021159130A2 (en) Coronavirus rna vaccines and methods of use
JP2024503699A (ja) バリアント株ベースのコロナウイルスワクチン
KR20220133911A (ko) 호흡기 바이러스 면역화 조성물
JP2024503698A (ja) 変異型株ベースのコロナウイルスワクチン
WO2022266010A1 (en) Mrna vaccines encoding flexible coronavirus spike proteins
WO2023283642A2 (en) Pan-human coronavirus concatemeric vaccines
WO2022266012A1 (en) Coronavirus glycosylation variant vaccines
JP2024514183A (ja) エプスタイン-バーウイルスmRNAワクチン
WO2023283645A1 (en) Pan-human coronavirus domain vaccines
WO2023092069A1 (en) Sars-cov-2 mrna domain vaccines and methods of use
EP4308156A1 (en) Therapeutic use of sars-cov-2 mrna domain vaccines
TW202217000A (zh) Sars—cov—2 mrna結構域疫苗