KR20220140528A - Sars-cov-2 mrna 도메인 백신 - Google Patents
Sars-cov-2 mrna 도메인 백신 Download PDFInfo
- Publication number
- KR20220140528A KR20220140528A KR1020227028371A KR20227028371A KR20220140528A KR 20220140528 A KR20220140528 A KR 20220140528A KR 1020227028371 A KR1020227028371 A KR 1020227028371A KR 20227028371 A KR20227028371 A KR 20227028371A KR 20220140528 A KR20220140528 A KR 20220140528A
- Authority
- KR
- South Korea
- Prior art keywords
- mrna
- seq
- mol
- amino acid
- acid sequence
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
- A61K39/145—Orthomyxoviridae, e.g. influenza virus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
- A61K39/215—Coronaviridae, e.g. avian infectious bronchitis virus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K47/00—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
- A61K47/06—Organic compounds, e.g. natural or synthetic hydrocarbons, polyolefins, mineral oil, petrolatum or ozokerite
- A61K47/08—Organic compounds, e.g. natural or synthetic hydrocarbons, polyolefins, mineral oil, petrolatum or ozokerite containing oxygen, e.g. ethers, acetals, ketones, quinones, aldehydes, peroxides
- A61K47/10—Alcohols; Phenols; Salts thereof, e.g. glycerol; Polyethylene glycols [PEG]; Poloxamers; PEG/POE alkyl ethers
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P11/00—Drugs for disorders of the respiratory system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
- A61P37/02—Immunomodulators
- A61P37/04—Immunostimulants
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/51—Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
- A61K2039/53—DNA (RNA) vaccination
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/545—Medicinal preparations containing antigens or antibodies characterised by the dose, timing or administration schedule
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/555—Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
- A61K2039/55511—Organic adjuvants
- A61K2039/55555—Liposomes; Vesicles, e.g. nanoparticles; Spheres, e.g. nanospheres; Polymers
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/57—Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2
- A61K2039/575—Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2 humoral response
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/02—Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/03—Fusion polypeptide containing a localisation/targetting motif containing a transmembrane segment
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/20011—Coronaviridae
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/20011—Coronaviridae
- C12N2770/20022—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/20011—Coronaviridae
- C12N2770/20034—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/20011—Coronaviridae
- C12N2770/20071—Demonstrated in vivo effect
Abstract
본 개시내용은 코로나바이러스 리보핵산(RNA) 백신 뿐만 아니라 상기 백신을 사용하는 방법 및 상기 백신을 포함하는 조성물에 관한 것이다. 상기 RNA 백신은 코로나바이러스의 도메인 및 서브유닛을 암호화한다.
Description
관련 출원
본 출원은 2020년 2월 7일에 출원된, 미국 가출원 번호 제62/971,825호, 2020년 4월 27일에 출원된, 미국 가출원 번호 제63/016,175호, 2020년 6월 25일에 출원된, 미국 가출원 번호 제63/044,330호, 및 2020년 8월 7일에 출원된, 미국 가출원 번호 제63/063,137호의 35 U.S.C. §119(e) 하에 이점을 주장하고, 이들 각각은 그 전체가 본원에 참조로 포함된다.
인간 코로나바이러스는 코로나바이러스과(Coronaviridae) 패밀리의 전염성이 강한 외피가 있는, 양성 단일-가닥 RNA 바이러스이다. 코로나바이러스과의 두 가지 서브-패밀리가 인간 질환을 일으키는 것으로 알려져 있다. 가장 중요한 것은 β-코로나바이러스(베타코로나바이러스)이다. β-코로나바이러스는 경증 내지 중등도의 상부 호흡기 감염의 흔한 병원체이다. 그러나, 2019년 12월 중국 우한시에서 처음 확인된 코로나바이러스에 의해 발생된 감염과 같은 새로운 코로나바이러스 감염의 발병은 높은 사망률 사망자수와 관련이 있다. 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2)(이전에 "2019 신종 코로나바이러스" 또는 "2019-nCoV"로 지칭됨)로 지칭된, 최근 확인된 코로나바이러스는 수십만 명의 사람들을 빠르게 감염시켰다. SARS-CoV-2 바이러스가 유발하는 팬데믹 질환(pandemic disease)은 세계보건기구(WHO)에 의해 COVID-19(Coronavirus Disease 2019)로 명명되었다. SARS-CoV-2 분리주(Wuhan-Hu-1)의 제1 게놈 서열은 2020년 1월 10일 바이러스 분자 진화 및 역학의 분석 및 해석을 위한 UK-기반 토론 포럼인 Virological에서 베이징 소재의 중국 CDC로부터의 조사관에 의해 발표되었다. 이후, 2020년 1월 12일에 Genbank 등록 번호 MN908947.1을 갖는 서열이 GenBank에 기탁되었다.
현재, COVID-19에 대한 특정 치료법 또는 SARS-CoV-2 감염에 대한 백신은 없다. 코로나바이러스 감염, 특히 SARS-CoV-2 팬데믹과 관련된 지속적인 건강 문제 및 사망률은 국제적으로 엄청난 관심사이다. SARS-CoV-2로 인한 공중 보건 위기는 이러한 바이러스에 대한 효과적이고 안전한 백신 후보를 빠르게 개발하는 것의 중요성을 강조한다.
요약
일부 구현예에서, SARS-CoV-2 항원에 대한 강력한 중화 항체 반응을 유도할 수 있는 고도의 면역원성 항원(들)을 암호화하는 하나 이상의 메신저 리보핵산(mRNA) 분자를 포함하는 조성물(예를 들어, 백신)이 본원에 제공된다. 본원에 기술된 mRNA 분자는 천연 바이러스에 의한 감염으로부터 사람들을 보호하고/하거나 감염된 경우 증상을 감소시키기 위한 면역원성 조성물 또는 백신으로서 개별적으로 또는 조합하여 사용될 때 보호 면역을 유도하는 데 효과적인 SARS-CoV-2 코로나바이러스 스파이크 (S) 단백질의 주요 중화 도메인을 발현하는 데 사용된다.
공지된 베타 코로나바이러스의 외피 S 단백질은 바이러스 숙주 친화성 및 숙주 세포로의 진입을 결정하며 SARS-CoV-2 감염에 있어 중요하다. S 단백질의 구조는 각각 부착 및 막 융합을 매개하는, 2개의 서브유닛, S1 및 S2를 포함하는 베타코로나바이러스, 예컨대 SARS-CoV-2, SARS-CoV, MERS-CoV, HKU1-CoV, MHV-CoV 및 NL63-CoV 간에 유사하다. S1 서브유닛은 N 말단 도메인(NTD) 및 수용체 결합 도메인(RBD)을 포함한다.
서브유닛 항원의 발현은 다른 관련 바이러스와 공유되는 항원의 다른 도메인에 특이적인 기억 B 및 T 세포의 최소 자극으로 특이적 서브유닛에 대한 면역 반응에 초점을 맞춘다. 본원에 제공된 데이터는 막 결합형 또는 가용성 SARS-CoV-2 S1 서브유닛 항원을 암호화하는 mRNA의 투여가 SARS-CoV-2 RBD 항원, NTD 항원, 야생형 전체-길이 S 단백질, 및 융합 전(prefusion) 형태를 안정화하기 위한 이중 프롤린 돌연변이를 갖는 S 단백질 각각에 대한 항체 역가를 생성하였음을 입증한다. 본원에 나타낸 바와 같이, 시험된 모든 용량에서, 2회-용량 요법(즉, 부스터 용량 포함)은 SARS-CoV-2 WT S 단백질을 인식하고 이에 결합할 수 있는 항체를 유도하는 데 효과적이었다. 놀랍게도, 유도된 역가는 S1 서브유닛에서 이중 프롤린 돌연변이가 발견되지 않음에도 불구하고, S 단백질의 이중 프롤린 안정화 버전에 대해 측정했을 때 가장 높았다(이중 프롤린 돌연변이는 S2에서 발생하고, S2는 시험된 면역원에 존재하지 않음).
또한, NTD 및 RBD 모두는 바이러스 활성을 중화시키는 항체의 결합을 위한 부위인 것으로 알려져 있다. SARS-CoV-2의 경우 RBD는 안지오텐신-전환 효소 2(ACE2)에 결합하는 스파이크 단백질의 수용체 결합 부위이다. 기능이 완전히 이해되지 않은 NTD는, 당 모이어티를 결합하고 융합 전에서 융합 후 형태로 스파이크 단백질의 형태 전환을 촉진하는 역할을 하는 것으로 보인다. 그럼에도 불구하고, NTD 및 RBD 도메인 모두는 본원에 나타낸 바와 같이 높은 결합 항체 및 중화 항체 역가를 유도한다.
예를 들어, 매우 놀랍게도, 본원의 일부 구현예에서 제공된 데이터는 막 결합 RBD 항원(RBD-TM) 또는 막 결합 NTD 항원(NTD-TM)을 암호화하는 mRNA의 투여로부터의 혈청이 SARS-CoV-2 S1/S2 스파이크 단백질에 대한 면역원성을 나타내었지만, 상기 2개의 mRNA (및 따라서 2개의 항원)의 50:50의 조합이 SARS-CoV-2 S1/S2 스파이크 단백질에 대해 예상외로 높고, 상승적인 중화 항체 역가를 생성하였음을 보여준다.
따라서, 본 개시의 일부 측면은 면역 반응, 예컨대, SARS-CoV-2에 대한 중화 항체 반응을 유도할 수 있는 SARS-CoV-2 S 단백질의 기능적 도메인을 암호화하는 mRNA를 포함하는 조성물을 제공한다. 일부 구현예에서, mRNA는 지질 나노입자 내 제형화된다.
일부 측면에서, SARS-CoV-2 스파이크 단백질의 적어도 2개의 도메인, 및 전장보다 작은 스파이크 단백질을 암호화하는 오픈 리딩 프레임(ORF)을 포함하는 mRNA가 제공된다. 전장 스파이크 단백질보다 작은 스파이크 단백질은 전장 스파이크 단백질보다 작은 적어도 하나의 아미노산을 갖는 스파이크 단백질의 하나 이상의 도메인 및/또는 서브유닛, 또는 비-천연 순서 또는 서열로 함께 연결된 하나 이상의 도메인을 갖는 융합 단백질이다. 일부 구현예에서, 2개의 도메인 중 하나는 SARS-CoV-2 스파이크 단백질의 N-말단 도메인(NTD)이다. 일부 구현예에서, 2개의 도메인 중 하나는 SARS-CoV-2 스파이크 단백질의 수용체 결합 도메인(RBD)이다. 일부 구현예에서, ORF는 NTD 및/또는 RBD에 연결된 막횡단 도메인(TD)을 암호화한다. 일부 구현예에서, TD는 인플루엔자 혈구응집소 막횡단 도메인이다. 일부 구현예에서, ORF는 NTD - RBD - TM을 포함한다. 일부 구현예에서, 적어도 2개의 도메인은 절단 가능하거나 절단 불가능한 링커를 통해 연결된다. 일부 구현예에서, 절단 불가능한 링커는 글리신-세린(GS) 링커이다. 일부 구현예에서, GS 링커는 4-15개의 아미노산이다. 일부 구현예에서, 링커는 pan HLA DR-결합 에피토프(PADRE)이다. 일부 구현예에서, ORF는 신호 펩티드를 암호화한다. 일부 구현예에서, 신호 펩티드는 NTD에 연결된다. 일부 구현예에서, 신호 펩티드는 RBD에 연결된다. 일부 구현예에서, 신호 펩티드는 SARS-CoV-2와 이종이다. 일부 구현예에서, 적어도 2개의 도메인은 가용성이다. 일부 구현예에서 ORF는 트래피킹 신호 도메인을 암호화한다. 일부 구현예에서, 트래피킹 신호 도메인은 대식세포 마커이다. 일부 구현예에서, 대식세포 마커는 CD86 및/또는 CD11b이다. 일부 구현예에서, 트래피킹 신호 도메인은 VSV-G 세포질 꼬리(VSVGct)이다. 일부 구현예에서, 2개의 도메인 중 하나는 SARS-CoV-2 스파이크 단백질의 제1 반복 헵타펩티드: HPPHCPC(HR1)이다. 일부 구현예에서, 2개의 도메인 중 하나는 SARS-CoV-2 스파이크 단백질의 제2 반복 헵타펩티드: HPPHCPC(HR2)이다. 일부 구현예에서, ORF는 HR1 및/또는 HR2에 연결된 막횡단 도메인(TD)을 암호화한다. 일부 구현예에서, TD는 인플루엔자 혈구응집소 막횡단 도메인이다. 일부 구현예에서, ORF는 융합 펩티드(FP)를 암호화한다. 일부 구현예에서, ORF는 CT 꼬리를 암호화한다.
일부 측면에서 SARS-CoV-2 스파이크 단백질의 수용체 결합 도메인(RBD)을 암호화하는 오픈 리딩 프레임(ORF)을 포함하는 mRNA가 제공된다. 일부 구현예에서 RBD는 가용성이다. 일부 구현예에서 RBD는 막횡단 도메인, 선택적으로 인플루엔자 혈구응집소 막횡단 도메인에 연결된다.
본 발명의 하나 이상의 구현예의 세부사항은 하기의 설명에서 제시된다. 본 발명의 다른 특징 또는 이점은 하기 도면 및 여러 구현예의 상세한 설명, 그리고 또한 첨부된 청구항으로부터 명백할 것이다.
도 1은 본 발명의 mRNA에 의해 암호화된 야생형 및 2P 스파이크 단백질 항원의 도식적인 표현이다; 신호 펩티드(SP), 채우기 없음, N-말단 도메인(NTD), 점선; 수용체-결합 도메인(RBD), 하향 대각선 줄무늬; 서브도메인 1(SD1), 가로 줄무늬; 서브도메인 2(SD2), 물결; 융합 펩티드(FP), 상향 대각선 줄무늬; 헵타드 반복 1(HR1) 직조; 헵타드 반복 2(HR2) 대각선 벽돌; (TM), 세로 줄무늬; 및 세포질 꼬리(CT), 벽돌.
도 2는 실시예 1-3에 기술된 mRNA에 의해 암호화된 항원의 예시적인 선형 디자인을 나타낸다.
도 3은 도 2에 도시된 항원의 서열 정렬을 나타낸다.
도 4는 실시예 4-6에 기술된 mRNA에 의해 암호화된 항원의 예시적인 선형 디자인을 나타낸다.
도 5는 본원에 기술된 다양한 S1 서브유닛 항원의 서열 정렬을 나타낸다.
도 6은 실시예 7 및 8에 기술된 mRNA에 의해 암호화된 항원의 예시적인 선형 디자인을 나타낸다.
도 7은 중화 및 ELISA 역가의 상관관계를 나타낸다.
도 8a-8c는 LNP 내의 NTD-RBD-TM을 암호화하는 mRNA를 이용하여 마우스에서 1일 프라임 및 21일 부스트 용량 후 36일째의 혈청 IgG1 및 IgG2a 역가를 나타낸다.
도 2는 실시예 1-3에 기술된 mRNA에 의해 암호화된 항원의 예시적인 선형 디자인을 나타낸다.
도 3은 도 2에 도시된 항원의 서열 정렬을 나타낸다.
도 4는 실시예 4-6에 기술된 mRNA에 의해 암호화된 항원의 예시적인 선형 디자인을 나타낸다.
도 5는 본원에 기술된 다양한 S1 서브유닛 항원의 서열 정렬을 나타낸다.
도 6은 실시예 7 및 8에 기술된 mRNA에 의해 암호화된 항원의 예시적인 선형 디자인을 나타낸다.
도 7은 중화 및 ELISA 역가의 상관관계를 나타낸다.
도 8a-8c는 LNP 내의 NTD-RBD-TM을 암호화하는 mRNA를 이용하여 마우스에서 1일 프라임 및 21일 부스트 용량 후 36일째의 혈청 IgG1 및 IgG2a 역가를 나타낸다.
중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2)는 높은 이환율 및 사망률을 보이는 새로 등장한 호흡기 바이러스이다. SARS-CoV-2는 2002년에 나타난 SARS-CoV, 및 2012년에 등장한 중동 호흡기 증후군 코로나바이러스(MERS-CoV)와 비교하여 전 세계적으로 빠르게 확산되고 있다. 세계보건기구(WHO)는 2020년 7월 6일 현재 COVID-19의 발병으로, 전 세계적으로 거의 11.5백만 건의 확인된 사례와 더불어 530,000명 이상의 사망자가 있음을 보고하였다. COVID-19 감염의 새로운 사례가 증가하고 있으며, 여전히 빠르게 증가하고 있다. 따라서, COVID-19를 예방 및 치료하고, COVID-19가 전 세계에 미치는 심각한 영향을 줄이기 위해, 안전하고 효과적인 다양한 백신 및 약물을 개발하는 것이 중요하다. 다양한 방식을 사용하여 제조된 백신 및 약물과, 개선된 안전성 및 효능을 갖는 백신이 필수적이다. 이들은 코로나바이러스 질환 2019(COVID-19)에 대한 백신 및 치료제의 고급 디자인 및 개발을 가속화할 필요성이 남아 있다.
2020년 1월 7일, 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2)가 2019년 12월 중국 후베이성 우한시에서 발생한 신종 폐렴의 병원체로 확인되었다 (Lu H. 등 (2020) J Med Virol. Apr; 92(4):401-402.). 얼마 지나지 않아, 이 바이러스는 중국에서 발병을 일으키고 전 세계로 퍼졌다. SARS-CoV-2의 게놈 구조 분석에 따르면, 이는 β-코로나바이러스(CoV)에 속한다(Chan 등 2020 Emerg Microbes Infect.; 9(1):221-236).
코로나바이러스 표면 상의 핵심 단백질은 스파이크 단백질이다. 매우 다양한 mRNA 작제물이 디자인되었고, 본원에 개시되어 있다. 스파이크 항원을 암호화하는 적절한 전달 비히클 mRNA로 제형화될 때, 서브유닛 및 이의 도메인은 SARS-CoV-2에 대한 강한 면역 반응을 유도할 수 있고, 따라서 효과적이고 강력한 mRNA 백신을 생산할 수 있다. 다양한 스파이크 단백질 항원, 특히 스파이크 단백질 서브유닛 및 도메인 항원을 암호화하는 mRNA의 투여는 상기 mRNA가 단백질 항원으로 빠르게 번역되는 면역 시스템의 면역 조직 및 세포로의 전달을 초래한다. 다른 면역 세포, 예를 들어, B 세포 및 T 세포는 이후 인식하고 탑재할 수 있으며, 면역 반응은 암호화된 단백질에 대한 면역 반응을 발달시키고, 궁극적으로 코로나바이러스에 대해 오래 지속되는 보호 반응을 생성한다. 면역 시스템에 대한 불량한 제시 또는 항원의 부정확한 폴딩으로 인한 단백질 백신 개발의 결점인, 낮은 면역원성은 본원에 개시된 스파이크 단백질, 서브유닛 및 이의 도메인을 암호화하는 매우 효과적인 mRNA 백신의 사용을 통해 회피된다.
본 개시는 코로나바이러스 항원에 대한 강력한 중화 항체를 유도하는 조성물(예를 들어, mRNA 백신)을 제공한다. 일부 구현예에서, 조성물은 적어도 하나(예를 들어, 1개, 2개 또는 그 이상)의 코로나바이러스 항원, 예컨대 SARS-CoV-2 항원을 암호화하는 mRNA를 포함한다. 일부 구현예에서, mRNA는 스파이크 단백질 도메인, 예컨대 수용체 결합 도메인(RBD), N-말단 도메인(NTD), 또는 RBD와 NTD의 조합을 암호화한다.
본 개시의 일부 측면은 SARS-CoV-2 스파이크 단백질의 수용체 결합 도메인(RBD) 및 단백질 막횡단 도메인, 예를 들어, 천연 발생 또는 이종 막횡단 도메인을 포함하는 융합 단백질을 암호화하는 오픈 리딩 프레임을 포함하는 메신저 리보핵산(mRNA)을 제공한다.
일부 구현예에서, 단백질 막횡단 도메인은 인플루엔자 혈구응집소 막횡단 도메인이다.
일부 구현예에서, 융합 단백질은 서열번호 77의 아미노산 서열에 대해 적어도 80% 동일성을 갖는 아미노산 서열을 포함한다.
일부 구현예에서, 융합 단백질은 서열번호 77의 아미노산 서열에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함한다.
일부 구현예에서, 융합 단백질은 서열번호 77의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열에 대해 적어도 70% 동일성을 갖는 뉴클레오티드 서열을 포함한다.
일부 구현예에서, 상기 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열에 대해 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열을 포함한다.
본 개시의 다른 측면은 SARS-CoV-2 스파이크 단백질의 아미노(N)-말단 도메인 및 막횡단 도메인을 포함하는 융합 단백질을 암호화하는 오픈 리딩 프레임을 포함하는 메신저 리보핵산(mRNA)을 제공한다.
일부 구현예에서, 막횡단 도메인은 인플루엔자 혈구응집소 막횡단 도메인이다.
일부 구현예에서, 융합 단백질은 서열번호 47의 아미노산 서열에 대해 적어도 80% 동일성을 갖는 아미노산 서열을 포함한다.
일부 구현예에서, 융합 단백질은 서열번호 47의 아미노산 서열에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함한다.
일부 구현예에서, 융합 단백질은 서열번호 47의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열에 대해 적어도 70% 동일성을 갖는 뉴클레오티드 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열에 대해 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열을 포함한다.
본 개시의 또 다른 측면은 선택적으로 링커를 통해, SARS-CoV-2 스파이크 단백질의 아미노(N)-말단 도메인에 연결된 SARS-CoV-2 스파이크 단백질의 수용체 결합 도메인을 포함하는 융합 단백질을 암호화하는 오픈 리딩 프레임을 포함하는 메신저 리보핵산(mRNA)을 제공한다.
일부 구현예에서, 융합 단백질은 막횡단 도메인을 추가로 포함한다.
일부 구현예에서, 융합 단백질은 서열번호 92의 아미노산 서열에 대해 적어도 80% 동일성을 갖는 아미노산 서열을 포함한다.
일부 구현예에서, 융합 단백질은 서열번호 92의 아미노산 서열에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함한다.
일부 구현예에서, 융합 단백질은 서열번호 92의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 91의 뉴클레오티드 서열에 대해 적어도 70% 동일성을 갖는 뉴클레오티드 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 91의 뉴클레오티드 서열에 대해 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 91의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, mRNA는 서열번호 131 또는 2의 뉴클레오티드 서열을 선택적으로 포함하는, 5' 비번역 영역(UTR)을 추가로 포함한다.
일부 구현예에서, mRNA는 서열번호 132 또는 4의 뉴클레오티드 서열을 선택적으로 포함하는, 3' 비번역 영역(UTR)을 추가로 포함한다.
일부 구현예에서, mRNA는 5' 캡, 선택적으로 7mG(5')ppp(5')NlmpNp를 추가로 포함한다.
일부 구현예에서, mRNA는 선택적으로 약 100개의 뉴클레오티드 길이를 갖는 폴리A 꼬리를 추가로 포함한다.
일부 구현예에서, mRNA는 화학적 변형, 선택적으로 1-메틸슈도우리딘을 포함한다.
본 개시의 일부 측면은 선행하는 단락 중 임의의 하나의 mRNA를 포함하는 조성물을 제공한다.
본 개시의 다른 측면은 선행하는 단락 중 임의의 하나의 mRNA 중 적어도 2개를 포함하는 조성물을 제공한다.
본 개시의 다른 측면은 (a) SARS-CoV-2 스파이크 단백질의 수용체 결합 도메인(RBD) 및 단백질 막횡단 도메인을 포함하는 융합 단백질을 암호화하는 오픈 리딩 프레임을 포함하는 메신저 리보핵산(mRNA); 및 (b) SARS-CoV-2 스파이크 단백질의 아미노(N)-말단 도메인 및 막횡단 도메인을 포함하는 융합 단백질을 암호화하는 오픈 리딩 프레임을 포함하는 mRNA:를 포함하는 조성물을 제공한다. 일부 구현예에서, (a)의 mRNA 대 (b)의 mRNA의 비율은 약 1:1, 예를 들어, 1:2, 1:3, 21:, 또는 3:1이다. 일부 구현예에서, 조성물 중 mRNA의 적어도 50%는 (a)의 mRNA이다. 예를 들어, 조성물 중 mRNA의 적어도 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%는 (a)의 mRNA이다. 일부 구현예에서, 조성물 중 mRNA의 적어도 50%는 (b)의 mRNA이다. 예를 들어, 조성물 중 mRNA의 적어도 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%는 (b)의 mRNA이다.
일부 구현예에서, 단백질 막횡단 도메인은 인플루엔자 혈구응집소 막횡단 도메인이다.
일부 구현예에서, (a)의 융합 단백질은 서열번호 77의 아미노산 서열에 대해 적어도 80% 동일성을 갖는 아미노산 서열을 포함한다.
일부 구현예에서, (a)의 융합 단백질은 서열번호 77의 아미노산 서열에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함한다.
일부 구현예에서, (a)의 융합 단백질은 서열번호 77의 아미노산 서열을 포함한다.
일부 구현예에서, (a)의 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열에 대해 적어도 70% 동일성을 갖는 뉴클레오티드 서열을 포함한다.
일부 구현예에서, (a)의 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열에 대해 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함한다.
일부 구현예에서, (a)의 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, (b)의 융합 단백질은 서열번호 47의 아미노산 서열에 대해 적어도 80% 동일성을 갖는 아미노산 서열을 포함한다.
일부 구현예에서, (b)의 융합 단백질은 서열번호 47의 아미노산 서열에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함한다.
일부 구현예에서, (b)의 융합 단백질은 서열번호 47의 아미노산 서열을 포함한다.
일부 구현예에서, (b)의 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열에 대해 적어도 70% 동일성을 갖는 뉴클레오티드 서열을 포함한다.
일부 구현예에서, (b)의 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열에 대해 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함한다.
일부 구현예에서, (b)의 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, mRNA는 지질 나노입자 내 제형화된다.
일부 구현예에서, 조성물은 지질 나노입자를 추가로 포함한다.
일부 구현예에서, (a)의 mRNA는 지질 나노입자 내 제형화되고, (b)의 mRNA는 지질 나노입자 내 제형화된다.
일부 구현예에서, 지질 나노입자는 양이온성 지질을 포함한다.
일부 구현예에서, 지질 나노입자는 중성 지질을 추가로 포함한다.
일부 구현예에서, 지질 나노입자는 스테롤을 추가로 포함한다.
일부 구현예에서, 지질 나노입자는 폴리에틸렌 글리콜(PEG)-변형된 지질을 추가로 포함한다.
일부 구현예에서, 지질 나노입자는 이온화 가능한 양이온성 지질, 중성 지질, 스테롤, 및 PEG-변형된 지질을 포함한다.
일부 구현예에서, 이온화 가능한 양이온성 지질은 헵타데칸-9-일 8((2 하이드록시에틸)(6 옥소 6-(운데실옥시)헥실)아미노)옥타노에이트 (화합물 1)이다.
일부 구현예에서, 중성 지질은 1,2 디스테아로일-sn-글리세로-3-포스포콜린(DSPC)이다.
일부 구현예에서, 스테롤은 콜레스테롤이다.
일부 구현예에서, PEG-변형된 지질은 1,2 디미리스토일-sn-글리세롤, 메톡시폴리에틸렌글리콜(PEG2000 DMG)이다.
일부 구현예에서, 지질 나노입자는 20-60 mol%의 이온화 가능한 양이온성 지질, 5-25 mol%의 중성 지질, 25-55 mol%의 스테롤, 및 0.5-15 mol%의 PEG-변형된 지질을 포함한다.
일부 구현예에서, 지질 나노입자는 47 mol%의 이온화 가능한 양이온성 지질; 11.5 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 3.0 mol%의 PEG-변형된 지질; 48 mol%의 이온화 가능한 양이온성 지질; 11 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 2.5 mol%의 PEG-변형된 지질; 49 mol%의 이온화 가능한 양이온성 지질; 10.5 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 2.0 mol%의 PEG-변형된 지질; 50 mol%의 이온화 가능한 양이온성 지질; 10 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 1.5 mol%의 PEG-변형된 지질; 또는 51 mol%의 이온화 가능한 양이온성 지질; 9.5 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 1.0 mol%의 PEG-변형된 지질:을 포함한다.
일부 구현예에서, 지질 나노입자는 47 mol%의 화합물 1; 11.5 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 3.0 mol%의 PEG2000 DMG; 48 mol%의 화합물 1; 11 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 2.5 mol%의 PEG2000 DMG; 49 mol%의 화합물 1; 10.5 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 2.0 mol%의 PEG2000 DMG; 50 mol%의 화합물 1; 10 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 1.5 mol%의 PEG2000 DMG; 또는 51 mol%의 화합물 1; 9.5 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 1.0 mol%의 PEG2000 DMG를 포함한다.
본 개시의 추가 측면은 SARS-CoV-2에 대한 중화 항체 반응을 대상체에서 유도하기에 효과적인 양으로 선행하는 청구항 중 어느 한 항의 mRNA 또는 조성물을 대상체에게 투여하는 단계를 포함하는 방법을 제공한다.
본 개시의 다른 측면은 SARS-CoV-2에 대한 및 T 세포 면역 반응을 대상체에서 유도하기에 효과적인 양으로 선행하는 청구항 중 어느 한 항의 mRNA 또는 조성물을 대상체에게 투여하는 단계를 포함하는 방법을 제공한다.
본 개시의 일부 측면은 SARS-CoV-2에 대한 면역 반응, 예컨대 중화 항체 반응을 유도할 수 있는 코로나바이러스 항원을 암호화하는 오픈 리딩 프레임(ORF)을 포함하는 메신저 리보핵산(mRNA)을 제공하고, 상기 항원은 SARS-CoV-2의 단백질 단편 또는 기능성 단백질 도메인을 포함하며, 선택적으로 상기 RNA는 지질 나노입자 내 제형화된다.
일부 구현예에서, 항원은 기능성 단백질 도메인이다.
일부 구현예에서, 단백질 도메인은 SARS-CoV-2 스파이크 단백질의 N-말단 도메인(NTD)이다.
일부 구현예에서, NTD는 막횡단 도메인, 선택적으로 인플루엔자 혈구응집소 막횡단 도메인에 연결된다.
일부 구현예에서, 항원은 서열번호 47의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 47의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, 단백질 도메인은 SARS-CoV-2 스파이크 단백질의 수용체 결합 도메인(RBD)이다.
일부 구현예에서, RBD는 가용성이다.
일부 구현예에서, 항원은 서열번호 62의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 62의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 61의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 61의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, RBD는 막횡단 도메인, 선택적으로 인플루엔자 혈구응집소 막횡단 도메인에 연결된다.
일부 구현예에서, 항원은 서열번호 77의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 77의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, NTD는 SARS-CoV-2 스파이크 단백질의 RBD에 연결되어 NTD-RBD 융합 단백질을 형성한다.
일부 구현예에서, NTD-RBD 융합은 막횡단 도메인(TM), 선택적으로 인플루엔자 혈구응집소 막횡단 도메인에 연결되어 NTD-RBD-TM 단백질을 형성한다.
일부 구현예에서, 항원은 서열번호 92의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 92의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 91의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 91의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, NTD-RBD 융합은 C-말단 절단을 포함한다.
일부 구현예에서, 항원은 서열번호 107의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 107의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 106의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 106의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, NTD 및/또는 RBD는 확장된 영역을 포함한다.
일부 구현예에서, 항원은 서열번호 59, 86, 89, 116, 119, 또는 122 중 임의의 하나의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 59, 86, 89, 116, 119, 또는 122 중 임의의 하나의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 58, 85, 88, 115, 118, 또는 121 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 58, 85, 88, 115, 118, 또는 121 중 임의의 하나의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, 단백질 도메인은 SARS-CoV-2 스파이크 단백질의 S1 서브유닛 도메인이다.
일부 구현예에서, S1 서브유닛은 가용성이다.
일부 구현예에서, 항원은 서열번호 5의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 5의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 3의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 3의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, S1 서브유닛은 막횡단 도메인, 선택적으로 인플루엔자 혈구응집소 막횡단 도메인에 연결된다.
일부 구현예에서, 항원은 서열번호 17의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 17의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 16의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 16의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, S1 서브유닛은 S 단백질의 RBD 또는 RBD의 일부를 제거하도록 변형되었다.
일부 구현예에서, 항원은 서열번호 20, 23, 26, 29, 32 또는 35 중 임의의 하나의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 20, 23, 26, 29, 32 또는 35 중 임의의 하나의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 19, 22, 25, 28, 41, 또는 34 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 19, 22, 25, 28, 31, 또는 34 중 임의의 하나의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, S1 서브유닛은 S 단백질의 S2 서브유닛에 연결된다.
일부 구현예에서, S2 서브유닛은 SARS-CoV-2 S 단백질로부터 유래된 것이다.
일부 구현예에서, S1 서브유닛은 HKU1 S 단백질로부터 유래된 것이다.
일부 구현예에서, 항원은 서열번호 38의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 38의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 37의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 37의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, S1 서브유닛은 OC43 S 단백질로부터 유래된 것이다.
일부 구현예에서, 항원은 서열번호 41의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 41의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 40의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 40의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, 항원은 페리틴, 루마진 합성효소 및 폴던(foldon)으로부터 선택적으로 선택되는, 스캐폴드 도메인을 추가로 포함한다.
일부 구현예에서, 스캐폴드 도메인은 페리틴이다.
일부 구현예에서, 항원은 서열번호 8 또는 65의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 8 또는 65의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 7 또는 64의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 7 또는 64의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, 스캐폴드 도메인은 루마진 합성효소이다.
일부 구현예에서, 항원은 서열번호 11, 14, 68, 또는 71 중 임의의 하나의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 11, 14, 68, 또는 71 중 임의의 하나의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 10, 13, 67, 또는 70 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 10, 13, 67, 또는 70 중 임의의 하나의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, 스캐폴드 도메인은 폴던이다.
일부 구현예에서, 항원은 서열번호 44, 50, 74, 80, 83, 101, 104 또는 113 중 임의의 하나의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 44, 50, 74, 80, 83, 101, 104 또는 113 중 임의의 하나의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 43, 49, 73, 79, 82, 100, 103, 또는 112 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 43, 49, 73, 79, 82, 100, 103, 또는 112 중 임의의 하나의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, 항원은 대식세포 마커, 선택적으로 CD86, CD11B 및/또는 VSVGct로부터 선택적으로 선택되는, 트래피킹 신호를 추가로 포함한다.
일부 구현예에서, 항원은 서열번호 95, 98, 또는 110 중 임의의 하나의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 95, 98, 또는 110 중 임의의 하나의 아미노산 서열을 포함한다.
일부 구현예에서, 오픈 리딩 프레임은 서열번호 94, 97, 또는 109 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 94, 97, 또는 109 중 임의의 하나의 뉴클레오티드 서열을 포함한다.
일부 구현예에서, mRNA는 지질 나노입자 내 제형화된다.
일부 구현예에서, 지질 나노입자는 양이온성 지질, 선택적으로 이온화 가능한 양이온성 지질, 중성 지질, 스테롤, 및/또는 폴리에틸렌 글리콜(PEG)-변형된 지질을 포함한다. 이온화 가능한 양이온성 지질은 이온화 가능한 지질을 지칭하기 위해 이온화 가능한 지질 및 양이온성 지질과 본원에서 상호교환적으로 사용된다. 일부 구현예에서, 지질 나노입자는 40-50 mol%, 선택적으로 45-50 mol%, 예를 들어, 45-46 mol%, 46-47 mol%, 47-48 mol%, 48-49 mol%, 또는 49-50 mol%, 예를 들어, 약 45 mol%, 45.5 mol%, 46 mol%, 46.5 mol%, 47 mol%, 47.5 mol%, 48 mol%, 48.5 mol%, 49 mol%, 또는 49.5 mol%의 이온화 가능한 지질을 포함한다. 일부 구현예에서, 지질 나노입자는 30-45 mol%, 선택적으로 35-40 mol%, 예를 들어, 30-31 mol%, 31-32 mol%, 32-33 mol%, 33-34 mol%, 35-35 mol%, 35-36 mol%, 36-37 mol%, 38-38 mol%, 38-39 mol%, 또는 39-40 mol%의 스테롤을 포함한다. 일부 구현예에서, 지질 나노입자는 5-15 mol%, 선택적으로 10-12 mol%, 예를 들어, 5-6 mol%, 6-7 mol%, 7-8 mol%, 8-9 mol%, 9-10 mol%, 10-11 mol%, 11-12 mol%, 12-13 mol%, 13-14 mol%, 또는 14-15 mol%의 헬퍼 지질을 포함한다. 일부 구현예에서, 지질 나노입자는 1-5%, 선택적으로 1-3 mol%, 예를 들어 1.5 내지 2.5 mol%, 1-2 mol%, 2-3 mol%, 3-4 mol%, 또는 4-5 mol%의 PEG 지질을 포함한다.
일부 구현예에서, 이온화 가능한 양이온성 지질은 헵타데칸-9-일 8((2 하이드록시에틸)(6 옥소 6-(운데실옥시)헥실)아미노)옥타노에이트 (화합물 1)이고, 중성 지질은 1,2 디스테아로일-sn-글리세로-3-포스포콜린(DSPC)이며, 스테롤은 콜레스테롤이고/이거나, PEG-변형된 지질은 1,2 디미리스토일-sn-글리세롤, 메톡시폴리에틸렌글리콜(PEG2000 DMG)이다.
일부 구현예에서, 지질 나노입자는 20-60 mol%의 이온화 가능한 양이온성 지질, 5-25 mol%의 중성 지질, 25-55 mol%의 스테롤, 및 0.5-15 mol%의 PEG-변형된 지질을 포함한다.
일부 구현예에서, 지질 나노입자는 47 mol%의 이온화 가능한 양이온성 지질; 11.5 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 3.0 mol%의 PEG-변형된 지질; 48 mol%의 이온화 가능한 양이온성 지질; 11 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 2.5 mol%의 PEG-변형된 지질; 49 mol%의 이온화 가능한 양이온성 지질; 10.5 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 2.0 mol%의 PEG-변형된 지질; 50 mol%의 이온화 가능한 양이온성 지질; 10 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 1.5 mol%의 PEG-변형된 지질; 또는 51 mol%의 이온화 가능한 양이온성 지질; 9.5 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 1.0 mol% PEG-변형된 지질:을 포함한다.
일부 구현예에서, 지질 나노입자는 47 mol%의 화합물 1; 11.5 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 3.0 mol%의 PEG2000 DMG; 48 mol%의 화합물 1; 11 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 2.5 mol%의 PEG2000 DMG; 49 mol%의 화합물 1; 10.5 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 2.0 mol%의 PEG2000 DMG; 50 mol%의 화합물 1; 10 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 1.5 mol%의 PEG2000 DMG; 또는 51 mol%의 화합물 1; 9.5 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 1.0 mol%의 PEG2000 DMG:를 포함한다.
국제출원번호 PCT/US2016/058327호(공개번호 WO2017/070626호) 및 국제출원번호 PCT/US2018/022777호(공개번호 WO2018/170347호)의 전체 내용이 참조로 본원에 포함된다.
SARS-Cov-2
SARS-CoV-2의 게놈은 약 9860개의 아미노산을 암호화하는 29.8-30 kb의 크기를 갖는 단일-가닥 양성-센스 RNA(+ssRNA)이다(Chan 등 2000, 상기; Kim 등 2020 Cell, May 14; 181(4):914-921.e10.). SARS-CoV-2는 5'-캡 및 3'-폴리-A 꼬리를 갖는 다시스트론성(polycistronic) mRNA이다. SARS-CoV-2 게놈은 구조 단백질 및 비구조 단백질(Nsps)을 암호화하는 특정 유전자로 구성된다. 게놈에서 구조 단백질의 순서는 5'-복제효소(오픈 리딩 프레임(ORF)1/ab)-구조 단백질[스파이크(S)-외피(E)-막(M)-뉴클레오캡시드(N)]-3'이다. 코로나바이러스의 게놈에는 부속 단백질, 비구조 단백질 및 구조 단백질을 암호화하는 다양한 수의 오픈 리딩 프레임이 포함된다(Song 등 2019 Viruses;11(1):p. 59). 대부분의 항원성 펩티드는 구조 단백질에 위치한다(Cui 등 2019 Nat. Rev. Microbiol.;17(3):181-192). 스파이크 표면 당단백질(S), 작은 외피 단백질(E), 기질 단백질(M) 및 뉴클레오캡시드 단백질(N)은 4가지 주요 구조 단백질이다. S-단백질은 세포 친화성에 기여하기 때문에 이는 중화 항체(NAb) 및 보호 면역을 유도할 수 있으며, 이는 다른 모든 구조 단백질 중 코로나바이러스 백신 개발에 있어서 가장 중요한 표적 중 하나로 간주될 수 있다. 또한, 아미노산 서열 분석은 S-단백질이 코로나바이러스 중에서 보존된 영역을 포함하고 있는 것으로 나타났으며, 이는 보편적 백신 개발의 기초가 될 수 있다.
항원
본 발명의 조성물, 예를 들어, 백신 조성물은 관심 항원, 예를 들어, 베타코로나바이러스 구조 단백질로부터 유래된 항원, 특히 SARS-CoV-2 스파이크 단백질로부터 유래된 항원을 암호화하도록 디자인된 핵산, 특히 mRNA를 특징으로 한다. 본 발명의 조성물, 예를 들어, 백신 조성물은 항원 자체를 포함하지 않고, 오히려 핵산, 특히 세포, 조직 또는 대상체에 일단 전달되면 항원 또는 항원성 서열을 암호화하는 mRNA(들)을 포함한다. 핵산 분자, 특히 mRNA(들)의 전달은 적절한 담체 또는 전달 비히클(예를 들어, 지질 나노입자) 내 상기 핵산 분자를 제형화함으로써 달성되며, 이는 세포, 조직 또는 대상체에 투여시, 핵산은 결국 핵산, 예를 들어 mRNA에 의해 암호화된 단백질을 발현하는 세포에 의해 흡수되도록 한다. 본원에 사용된 바와 같이, 용어 "항원"은 면역 반응을 유도하는, 예를 들어, 대상체에 존재할 때 (예를 들어, 인간 또는 포유동물 대상체에 존재할 때) 면역 반응을 유도하는 단백질(예를 들어, 당단백질), 폴리펩티드, 펩티드 등과 같은 물질을 지칭한다. 본 발명은 적어도 부분적으로 mRNA-암호화된 항원이, 세포 또는 대상체에 투여된 mRNA로부터 발현될 때, 상기 면역 시스템이 발현된 항원에 대한 면역 반응을 생성하도록 할 수 있으며, 예를 들어, 발현된 항원에 대한 항체, 예를 들어, 결합 및/또는 중화 항체의 생산을 유발할 수 있고, 발현된 항원에 특이적인 B 및/또는 T 세포 반응을 유발할 수 있다는 이해에 기초하며, 궁극적으로 항원 또는 항원과 관련된 병원체와의 후속 조우에 대해 보호 또는 예방 반응을 유발할 수 있다. 바람직한 mRNA-암호화된 항원은 "바이러스 항원"이다. 본원에 사용된 바와 같이, 용어 "바이러스 항원"은 바이러스, 예를 들어 병원성 바이러스로부터 유래된 항원을 지칭한다. 본원에 사용된 바와 같은 용어 항원은 전장 단백질, 예를 들어, 전장 바이러스 단백질을 지칭할 수 있거나, 단백질의 단편(예를 들어, 폴리펩티드 또는 펩티드 단편), 서브유닛 또는 도메인, 예를 들어 바이러스 단백질 서브유닛 또는 도메인을 지칭할 수 있다.
많은 단백질은 하나 이상의 폴리펩티드 또는 올리고머 분자로 결합되는 여러 폴리펩티드 사슬로 구성된 4차 또는 3차원 구조를 갖는다. 본원에 사용된 바와 같이, 용어 "서브유닛"은 단일 단백질 분자, 예를 들어 초기 단백질 분자의 처리로부터 생성된 폴리펩티드 또는 폴리펩타이드 사슬을 지칭하며, 이 서브유닛은 다른 단백질 분자(예를 들어, 서브유닛 또는 사슬)와 조립(또는 "공조립")되어 단백질 복합체를 형성한다. 단백질은 비교적 적은 수의 서브유닛을 가질 수 있고 따라서 "올리고머"로 기술되거나, 많은 수의 서브유닛으로 구성될 수 있고 따라서 "다량체"로 기술될 수 있다. 올리고머 또는 다량체 단백질의 서브유닛은 동일하거나, 상동적이거나, 완전히 다를 수 있으며, 이질적인 작업에 전념할 수 있다.
단백질 또는 단백질 서브유닛은 도메인을 추가로 포함할 수 있다. 본원에 사용된 바와 같이, 용어 "도메인"은 단백질 내의 별개의 기능적 및/또는 구조적 단위를 지칭한다. 전형적으로 "도메인"은 특정 기능 또는 상호작용을 담당하며, 단백질의 전반적인 역할에 기여한다. 도메인은 다양한 생물학적 맥락에서 존재할 수 있다. 유사한 도메인(즉, 구조적, 기능적 및/또는 서열 상동성을 공유하는 도메인)은 단일 단백질 내에 존재할 수 있거나 유사하거나 상이한 기능을 갖는 별개의 단백질 내에 존재할 수 있다. 단백질 도메인은 종종 단백질의 나머지 또는 이의 서브유닛과 독립적으로 기능하고 존재할 수 있는 주어진 단백질 3차 구조 또는 서열의 보존된 부분이다.
구조적 및 분자 생물학에서, SARS-CoV-2 바이러스 게놈 서열이 발표된 직후에 수행된 바와 같이, 동일하거나 상동적이거나 유사한 서브유닛 또는 도메인은 새로 확인되거나 새로운 단백질을 분류하는 데 도움이 될 수 있다.
본원에 사용된 바와 같이, 용어 항원은 항원 결합 부위에 의해 인식될 수 있지만, 면역 반응을 유도하기에는 불충분한 항원, 예를 들어, 폴리펩티드 또는 탄수화물 구조의 하부구조인 용어 "에피토프"와 구별된다. 당해 기술은 대상체 또는 면역 세포에 단리된 형태, 예를 들어, 분리된 단백질, 폴리펩티드 또는 펩티드 항원로 전달되는 단백질 항원을 기술하지만, 단백질 항원의 디자인, 시험, 검증 및 생산은 특히 대규모로 단백질을 생산할 때 비용이 많이 들고 시간이 많이 소요될 수 있다. 대조적으로, mRNA 기술은 다양한 항원을 암호화하는 mRNA 작제물의 신속한 디자인 및 시험에 적합하다. 더욱이, 적절한 전달 비히클(예를 들어, 지질 나노입자)에 제제와 결합된 mRNA의 신속한 생산은 신속하게 처리될 수 있고 대규모로 mRNA 백신을 신속하게 생산할 수 있다. 잠재적인 이점은 또한 본 발명의 mRNA에 의해 암호화된 항원이 대상체의 세포에 의해 발현되며, 예를 들어, 인체에 의해 발현되고, 따라서 대상체, 예를 들어, 인체는 항원을 생산하기 위한 "공장" 역할을 한다는 사실로부터 발생하며, 이는 결국, 원하는 면역 반응을 유도한다.
바람직한 측면에서, 항원은 면역 반응을 유도할 수 있는 (예를 들어, 면역 시스템이 항원에 대한 항체를 생산하도록 하는) 단백질이다. 본원에서, 용어 "항원"의 사용은 달리 언급되지 않는 한, 면역원성 단백질, 뿐만 아니라 면역원성 단백질, 예를 들어 면역원성 단편(항원에 대한 면역 반응을 유도하는 (또는 유도할 수 있는) 면역원성 단편)으로부터 유래된 폴리펩티드 또는 펩티드를 포괄한다. 용어 "단백질"은 폴리펩티드 및 펩티드를 포괄하고, 용어 "항원"은 항원성 단편을 포괄하는 것으로 이해되어야 한다. 다른 분자는 항원성, 예컨대 박테리아 다당류 또는 단백질 및 다당류 구조의 조합일 수 있으나, 본원에 포함된 바이러스 백신의 경우, 바이러스 단백질, 바이러스 단백질의 단편과 베타코로나바이러스 SARS-CoV-2로부터 유래된 디자인 및/또는 돌연변이된 단백질이 본원에 특징화된 항원이다.
핵산/mRNA
본원에 기술된 백신 기술은 핵산, 특히 관심 항원, 예를 들어, 베타코로나바이러스 스파이크 단백질 항원, 서브유닛, 도메인 또는 이의 단편(예를 들어, 항원성 단편)을 암호화하도록 디자인된 메신저 RNA(mRNA)를 특징으로 한다. 본 발명의 핵산, 예를 들어 mRNA는 바람직하게는 핵산, 예를 들어, mRNA가 생체내 사용에 적합하도록 적절한 담체 또는 전달 비히클(예를 들어, 지질 나노입자) 내 제형화된다. 적절하게 제형화되는 경우, 핵산, 예를 들어 mRNA는 대상체, 예를 들어, 인간 대상체 내의 세포 및/또는 조직에 전달되어, 이들 핵산에 의해 암호화된 단백질의 번역을 달성할 수 있다.
핵산 분자는 유전 정보를 운반하고 단백질 합성의 과정을 지시함으로써, 모든 세포 기능은 아닐지라도 대부분을 지시하는 연결된 뉴클레오티드로 구성된 거대분자이다. 핵산은 뉴클레오티드의 중합체(뉴클레오티드 단량체)를 포함한다. 따라서, 핵산은 폴리뉴클레오티드(폴리뉴클레오티드 사슬로도 지칭됨)로도 지칭된다. 핵산의 두 가지 주요 부류는 데옥시리보핵산(DNA) 및 리보핵산(RNA)이다. DNA는 모든 독립생활(free-living) 유기체 및 대부분의 바이러스에서 유전 물질을 구성한다. RNA는 특정 바이러스의 유전 물질이지만, 모든 살아있는 세포에서도 발견되며, 이는 세포 공정, 특히 단백질 제조에 중요한 역할을 한다.
뉴클레오시드는 DNA 및 RNA와 같은 핵산의 구조적 서브유닛이다. 뉴클레오시드는 질소 염기(핵염기), 일반적으로 피리미딘(시토신, 티민 또는 우라실) 또는 퓨린(아데닌 또는 구아닌)으로 구성되며, 이는 5탄소 탄수화물 리보스 또는 리보스 또는 데옥시리보스 중 하나인 "당"에 공유결합되어 부착된다. 뉴클레오티드는 질소 염기, 당(리보스 또는 데옥시리보스) 및 1개 내지 3개의 인산기로 구성된다. 본질적으로, 뉴클레오티드는 단순히 추가 포스페이트기 또는 기를 갖는 뉴클레오시드이다.
핵산 분자인 DNA 및 RNA는 하나의 뉴클레오티드의 당 염기와 인접한 뉴클레오티드의 인산기 사이에 에스테르 결합이라고 하는 화학적 결합에 의해 사슬로 서로 연결된 뉴클레오티드로 구성된다. 당은 각 뉴클레오티드의 3' 말단이고, 인산염은 5' 말단이다. 하나의 뉴클레오티드에 있는 당의 5' 탄소에 부착된 인산기는 다음 뉴클레오티드의 3' 탄소에 있는 유리 하이드록실과 에스테르 결합을 형성한다. 이러한 결합을 포스포디에스테르 결합이라고 하며, 당-인산염 백본은 분자가 합성될 때 5'에서 3' 방향으로 확장되거나 성장하는 것으로 기술된다.
핵산의 핵염기 부분은 DNA에서 아데닌(A) 및 구아닌(G)인 퓨린 염기, 및 시토신(C), 티민(T)인 피리미딘 염기, 그리고 RNA에서 우라실(U)을 특징으로 한다. 핵산의 당 부분은 DNA에서 데옥시리보스, RNA에서 리보스를 특징으로 한다. 5개의 뉴클레오시드는 일반적으로 각각 하나의 문자 코드 A, G, C, T 및 U로 축약된다. 그러나, 티미딘은 우리딘에서 발견되는 리보푸라노스 고리보다 2'-데옥시리보푸라노스 모이어티를 포함하므로, "dT"("d"는 "데옥시"를 나타냄)로 더 일반적으로 작성된다. 티미딘은 리보핵산(RNA)이 아닌 데옥시리보핵산(DNA)에서 발견되기 때문이다. 반대로, 우리딘은 DNA가 아닌 RNA에서 발견된다. 나머지 3개의 뉴클레오시드는 RNA 및 DNA 둘 다에서 발견될 수 있다. RNA에서, A, C 및 G로 표시되지만 DNA에서 이들은 dA, dC 및 dG로 표시될 수 있다.
당업자는 달리 언급되지 않는 한, 본 출원에 제시된 핵산 서열은 대표적인 DNA 서열에서 "T"를 언급할 수 있지만, 서열이 mRNA를 나타내는 경우, "T"는 "U"로 치환될 것임을 이해할 것이다. 따라서, 본원에서 특정 서열 식별 번호에 의해 개시되고 확인된 임의의 DNA는 또한 DNA에 상보적인 상응하는 mRNA 서열을 개시하며, 이때 DNA 서열의 각 "T"는 "U"로 치환된다.
핵산은 예를 들어, 데옥시리보핵산(DNA), 리보핵산(RNA), 예를 들어, mRNA, 트레오스 핵산(TNA), 글리콜 핵산(GNA), 펩티드 핵산(PNA), 잠금 핵산(β-D-리보 배열을 갖는 LNA, α-L-리보 배열을 갖는 α-LNA(LNA의 부분입체 이성질체), 2'-아미노 작용기를 갖는 2'-아미노, 및 2'-아미노 작용기를 갖는 2'-아미노-α-LNA를 포함하는, LNA), 에틸렌 핵산(ENA), 사이클로헥세닐 핵산 (CeNA) 및/또는 키메라 및/또는 이들의 조합이거나 이를 포함할 수 있다.
본 발명은 메신저 RNA(mRNA), 특히 관심 항원, 예를 들어, 베타코로나바이러스 스파이크 단백질 항원, 서브유닛, 도메인 또는 이의 단편(예를 들어, 항원성 단편)을 암호화하도록 디자인된 mRNA를 특징으로 한다. RNA의 하위유형인 메신저 RNA(mRNA)는 유전자의 유전적 서열에 상응하는 RNA의 단일-가닥 분자이다. mRNA는 DNA의 단일 가닥이 RNA 중합효소에 의해 해독되고, mRNA가 합성되는, 즉 전사되는 전사의 과정 동안 생성된다. mRNA는 단백질 합성, 즉 번역 과정에서 리보솜에 의해 판독된다. 따라서, 메신저 RNA(mRNA)는 (적어도 하나의) 단백질(천연-발생, 비-천연-발생 또는 아미노산의 변형된 중합체)을 암호화하는 RNA이며, 이는 시험관내, 생체내, 제자리(in situ) 또는 생체외에서 암호화된 단백질을 생성하도록 변역될 수 있다.
본 개시의 조성물은 코로나바이러스 항원을 암호화하는 오픈 리딩 프레임(ORF)을 갖는 (적어도 하나의) mRNA를 포함한다. 일부 구현예에서, mRNA는 5' UTR, 3' UTR, 폴리(A) 꼬리 및/또는 5' 캡 또는 캡 유사체를 추가로 포함한다. 오픈 리딩 프레임(ORF)은 시작 코돈(예를 들어, 메티오닌(ATG 또는 AUG))으로 시작하고 종료 코돈(예를 들어, TAA, TAG 또는 TGA, 또는 UAA, UAG 또는 UGA)으로 끝나는 DNA 또는 RNA의 연속적인 스트레치이다. ORF는 전형적으로 단백질을 암호화한다. 본원에 개시된 서열은 추가 요소, 예를 들어 5' 및 3' UTR을 추가로 포함할 수 있지만, 이러한 요소는 ORF와 달리 본 개시의 mRNA에 반드시 존재할 필요는 없다는 것이 이해될 것이다. 또한, 본 발명의 mRNA, 예를 들어 본 개시의 베타코로나바이러스 백신에 특징이 있는 mRNA는 임의의 5' 비번역 영역(UTR) 및/또는 임의의 3' UTR을 포함할 수 있음을 이해해야 한다. 예시적인 UTR 서열은 서열 목록(예를 들어, 서열번호 2, 4, 131, 및 132)에 제공되고; 그러나, 다른 UTR 서열은 본원에 기술된 임의의 UTR 서열에 대해 사용되거나 교환될 수 있다. UTR은 또한 본원에 제공된 mRNA로부터 생략될 수 있다.
일부 구현예에서, 조성물은 서열번호 45, 75, 또는 90 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 뉴클레오티드 서열을 포함하는 mRNA를 포함한다. 일부 구현예에서, 조성물은 표 1-15의 서열 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 뉴클레오티드 서열을 포함하는 mRNA를 포함한다.
일부 구현예에서, 조성물은 서열번호 46, 76, 또는 91 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 ORF를 포함하는 mRNA를 포함한다. 일부 구현예에서, 조성물은 표 1-15의 서열 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 ORF를 포함하는 mRNA를 포함한다.
본 개시의 조성물의 코로나바이러스 항원 및 코로나바이러스 항원을 암호화하는 mRNA의 예시적인 서열은 표 1-15에 제공된다.
본원에 기술된 mRNA에 의해 암호화된 항원 중 임의의 하나는 신호 서열을 포함하거나 포함하지 않을 수 있음을 이해해야 한다.
암호화된 코로나바이러스 스파이크(S) 단백질 항원
공지된 베타 코로나바이러스의 외피 스파이크(S) 단백질은 바이러스 숙주 친화성과 숙주 세포로의 진입을 결정한다. 코로나바이러스 스파이크(S) 단백질은 중화 항체 및 보호 면역을 유도할 수 있으므로 백신 디자인을 위한 선택 항원이다. S 단백질은 SARS-CoV-2 감염에 중요하다. S 단백질의 구조는 SARS-CoV-2, SARS-CoV, MERS-CoV, HKU1-CoV, MHV-CoV 및 NL63-CoV와 같은 베타 코로나바이러스 간에 유사하다.
본원에 사용된 바와 같이, 용어 "스파이크 단백질"은 베타코로나바이러스를 비롯한 바이러스의 외피(바이러스 표면)로부터 돌출된 동종삼량체를 형성하는 당단백질을 지칭한다. 삼량체화된 스파이크 단백질은 숙주 세포 표면의 수용체에 결합한 후 바이러스 및 숙주 세포막의 융합에 의해 숙주 세포 내로 비리온의 진입을 촉진한다. S 단백질은 바이러스 유형에 따라 1,160 내지 1,400개의 아미노산으로 구성된 고도로 글리코실화된 큰 유형 I 막횡단 융합 단백질이다. 베타코로나바이러스 스파이크 단백질은 약 1100 내지 1500개의 아미노산을 포함하고 도 1에 제시된 바와 같은 구조(즉, 도메인 조성 및 구성)를 포함한다. SARS-CoV-2 스파이크(S) 단백질은 중화 항체 및 보호 면역을 유도할 수 있으므로 백신 디자인을 위한 선택 항원이다. 본 발명의 mRNA는 SARS-CoV-2 스파이크 단백질(즉, mRNA가 세포 또는 조직, 예를 들어 대상체의 세포 또는 조직에 전달될 때 스파이크 단백질이 발현되도록 암호화된 스파이크 단백질), 뿐만 아니라 이의 항원성 변이체를 생성하도록 디자인된다. 당업자는 본질적으로 전장 또는 완전한 스파이크 단백질은 바이러스, 예를 들어, 베타코로나바이러스가 숙주 세포로의 바이러스 진입을 촉진하는 이의 의도된 기능을 수행하는 데 필요할 수 있지만, 스파이크 단백질에 대한 면역 반응을 주로 유도하기 위해 모색할 때 스파이크 단백질 구조 및/또는 서열의 특정 양의 변화가 용인됨을 이해할 것이다. 예를 들어, 암호화된 스파이크 단백질, 예를 들어, 암호화된 스파이크 단백질 항원의 N- 또는 C-말단에서 1개 내지 소수개, 가능하게는 최대 5개 또는 최대 10개의 아미노산의 약간의 절단은, 단백질의 항원성 특성을 변경시키지 않으면서 용인될 수 있다. 마찬가지로, 암호화된 스파이크 단백질, 예를 들어 암호화된 스파이크 단백질 항원의 1개 내지 소수개, 가능하게는 최대 5개 또는 최대 10개 (또는 그 이상)의 아미노산의 변이(예를 들어, 보존적 치환)는, 단백질의 항원성 특성을 변경시키지 않으면서 용인될 수 있다. 예시적인 구현예에서, 스파이크 단백질, 예를 들어 암호화된 스파이크 단백질 항원은 표 1-15의 서열 중 임의의 하나에 제시된 바와 같은 (예를 들어, 서열번호 125로 제시된 아미노산 서열로부터 유래된) 아미노산 서열을 갖는다. 다른 구현예에서, 스파이크 단백질, 예를 들어 암호화된 스파이크 단백질 항원은, 표 1-15의 서열 중 임의의 하나에 제시된 바와 같은 (예를 들어, 서열번호 125로 제시된 아미노산 서열로부터 유래된) 아미노산 서열을 갖는 스파이크 단백질과 (정렬된 경우) 비교하여 100개 이하, 90개 이하, 80개 이하, 70개 이하, 60개 이하, 50개 이하, 40개 이하, 30개 이하, 20개 이하, 10개 이하, 또는 5개 이하의 아미노산 치환 및/또는 결실을 갖는다. 암호화된 스파이크 단백질 서열에 약간의 변이가 있는 경우, 변이체는 바람직하게는 참조 스파이크 단백질 서열과 동일한 활성을 갖고/갖거나, 예를 들어 면역검정법(예를 들어, 효소-결합 면역흡착 검정법(ELISA 검정법))에서 측정된 바와 같이, 참조 스파이크 단백질과 동일한 면역 특이성을 갖는다.
코로나바이러스의 S 단백질은 두 가지 중요한 기능적 서브유닛으로 나눌 수 있으며, 이 중 S 단백질의 구형 머리를 형성하는 N-말단 S1 서브유닛 및 단백질의 스톡(stalk)을 형성하는 C-말단 S2 영역이 포함되며, 이는 바이러스 외피에 직접적으로 매립된다. 잠재적인 숙주 세포와 상호작용 시, S1 서브유닛은 숙주 세포 상의 수용체, 특히 안지오텐신 전환 효소 2(ACE2) 수용체를 인식하고 결합하는 반면, S 단백질의 가장 보존된 구성 요소인 S2 서브유닛은 바이러스의 외피를 숙주 세포막과 융합시키는 역할을 할 것이다. (예를 들어, Shang 등, PLoS Pathog. 2020 Mar; 16(3):e1008392. 참조). 삼량체성 S 단백질 삼량체의 각 단량체는 각각 부착 및 막 융합을 매개하는 두 개의 서브유닛인 S1 및 S2를 함유한다. 예를 들어, 도 1을 참조한다. 생체내 감염 과정의 일부로서, 2개의 서브유닛은 효소적 절단 과정에 의해 서로 분리된다. S 단백질은 감염된 세포의 S1/S2 부위에서 퓨린-매개 절단에 의해 먼저 절단되며, 생체내에서 후속적인 세린 프로테아제-매개 절단 이벤트는 S1 내의 S2' 부위에서 발생한다. SARS-CoV2에서, S1/S2 절단 부위는 아미노산 676-TQTNSPRRAR / SVA-688(서열번호 127 참조)에 있는 것이다. S2' 절단 부위는 아미노산 811-KPSKR/SFI-818(서열번호 126 참조)에 있는 것이다.
본원에 사용된 바와 같이, 예를 들어, 본 발명의 핵산, 예컨대, mRNA에 의해 암호화되는 SARS-CoV-2 S 단백질 항원의 디자인과 관련하여, 용어 "S1 서브유닛"(예를 들어, S1 서브유닛 항원)은 S 단백질 N-말단에서 시작하여 S1/S2 절단 부위에서 끝나는 스파이크 단백질의 N-말단 서브유닛을 지칭하는 반면, 용어 "S2 서브유닛"(예를 들어, S2 서브유닛 항원)은 S1/S2 절단 부위에서 시작하여 스파이크 단백질의 C-말단에서 끝나는 스파이크 단백질의 C-말단 서브유닛을 지칭한다. 상기 기술된 바와 같이, 본질적으로 전장 또는 완전한 스파이크 단백질 S1 또는 S2 서브유닛은 각각 수용체 결합 또는 막 융합에 필요할 수 있지만, 스파이크 단백질 서브유닛에 대한 면역 반응을 주로 유도하기 위해 모색할 때 S1 또는 S2 구조 및/또는 서열의 특정 양의 변화가 용인됨을 이해할 것이다. 예를 들어, 암호화된 서브유닛, 예를 들어, 암호화된 S1 또는 S2 단백질 항원의 N- 또는 C-말단에서 1개 내지 소수개, 가능하게는 최대 4개, 5개, 6개, 7개, 8개, 9개 또는 10개의 아미노산의 약간의 절단은, 단백질의 항원성 특성을 변경시키지 않으면서 용인될 수 있다. 마찬가지로, 암호화된 스파이크 단백질 서브유닛, 예를 들어 암호화된 S1 또는 S2 단백질 항원의 1개 내지 소수개, 가능하게는 최대 4개, 5개, 6개, 7개, 8개, 9개 또는 10개 (또는 그 이상)의 아미노산의 변이(예를 들어, 보존적 치환)는, 단백질(들)의 항원성 특성을 변경시키지 않으면서 용인될 수 있다. 예시적인 구현예에서, 스파이크 단백질, 예를 들어 암호화된 스파이크 단백질 항원은 표 1-15의 서열 중 임의의 하나에 제시된 (예를 들어, 서열번호 125로 제시된 아미노산 서열로부터 유래된) 아미노산 서열을 갖는다. 다른 구현예에서, 스파이크 단백질 서브유닛, 예를 들어 암호화된 S1 또는 S2 단백질 항원은, 서열번호 125로 제시된 바와 같은 아미노산 서열을 갖는 스파이크 단백질의 아미노산 1-685를 포함하거나 이로 구성된 스파이크 단백질 S1 서브유닛 또는 아미노산 686-1273을 포함하거나 이로 구성된 스파이크 단백질 S2 서브유닛과 (정렬된 경우) 비교하여 50개 이하, 40개 이하, 30개 이하, 20개 이하, 10개 이하, 또는 5개 이하의 아미노산 치환 및/또는 결실을 갖는다. 암호화된 스파이크 단백질 서브유닛 서열에 약간의 변이가 있는 경우, 변이체는 바람직하게는 참조 스파이크 단백질 서브유닛 서열과 동일한 활성을 갖고/갖거나, 예를 들어 면역검정법(예를 들어, 효소-결합 면역흡착 검정법(ELISA 검정법))에서 측정된 바와 같이, 참조 스파이크 단백질 서브유닛과 동일한 면역 특이성을 갖는다.
SARS-CoV-2 스파이크 단백질의 S1 및 S2 서브유닛은 구조 및 기능으로 쉽게 식별할 수 있는 도메인을 추가로 포함하며, 이는 차례로 본 발명의 핵산 백신, 특히 mRNA 백신에 의해 암호화되는 항원을 디자인하는 데 특징이 될 수 있다. S1 서브유닛 내에서, 도메인은 N-말단 도메인(NTD) 및 수용체-결합 도메인(RBD)을 포함하고, 상기 RBD 도메인은 수용체-결합 모티프(RBM)를 추가로 포함한다. 야생형 S1 서브유닛은 또한 신호 펩티드(SD), NTD 도메인의 N-말단 및 제1 서브도메인(SD1) 및 제2 서브도메인(SD2)을 포함한다. S2 서브유닛 내에서, 도메인에는 융합 펩티드(FP), 헵타드 반복 1(HR1), 헵타드 반복 2(HR2), 막횡단 도메인(TM) 및 세포질 꼬리(CT)로도 알려진 세포질 도메인이 포함된다(Lu R. 등, 상기; Wan 등, J. Virol. Mar 2020, 94 (7) e00127-20). HR1 및 HR2 도메인은 SARS-CoV-2의 "융합 코어 영역"으로 지칭될 수 있다(Xia 등, 2020 Cell Mol Immunol. Jan; 17(1):1-12.). 도 1은 SARS-CoV-2 스파이크 단백질의 도메인 구조를 도시한다. S1 서브유닛은 N 말단 도메인(NTD), 링커 영역, 수용체 결합 도메인(RBD), 제1 서브도메인(SD1) 및 제2 서브도메인(SD2)을 포함한다. S1 서브유닛은 C-말단 막횡단 도메인(TM)을 추가하도록 변형되거나 이는 가용성일 수 있다. S2 서브유닛은 특히 제1 헵타드 반복(HR1), 제2 헵타드 반복(HR2), 막횡단 도메인(TM) 및 세포질 꼬리를 포함한다. 가용성 S2 서브유닛은 TM 도메인 없이 생성될 수 있다.
S1의 NTD 및 RBD는 이들 도메인이 베타코로나바이러스에 감염된 개체에서 항체를 중화시키는 표적인 것으로 나타났기 때문에 본 발명의 백신 디자인 접근법에 대한 우수한 항원이다. 본원에 사용된 바와 같이, 예를 들어, 항원 디자인 (본 발명의 mRNA에 의해 암호화되고, 예를 들어, 본 발명의 mRNA 백신 및 이의 유래로부터 발현되는 상기 항원)과 관련하여, 용어 "N-말단 도메인" 또는 "NTD"는 서열번호 125로 제시된 아미노산 서열을 갖는 스파이크 단백질의 S1 서브유닛의 아미노산 1-290과 동일성을 갖는, 길이가 대략 290개의 아미노산을 포함하는 SARS-CoV-2 S1 서브유닛 내의 도메인을 지칭한다. 본원에 사용된 바와 같이, 예를 들어, 항원 디자인 (본 발명의 mRNA에 의해 암호화되고, 예를 들어, 본 발명의 mRNA 백신 및 이의 유래로부터 발현되는 상기 항원)과 관련하여, 용어 "수용체 결합 도메인" 또는 "RBD"는 서열번호 125로 제시된 아미노산 서열을 갖는 스파이크 단백질의 S1 서브유닛의 아미노산 316-517과 동일성을 갖는, 길이가 대략 175-225개의 아미노산을 포함하는 SARS-CoV-2 S1 서브유닛 내의 도메인을 지칭한다. 본원에 사용된 바와 같이, 용어 "수용체 결합 모티프"는 ACE2 수용체와 직접적으로 접촉하는 RBD의 부분을 지칭한다. 발현된 RBD는 이의 수용체로서 안지오텐신 전환 효소 2(ACE2)에 특이적으로 결합하고/하거나 RBD-결합 및/또는 중화 항체, 예를 들어, CR3022와 특이적으로 반응할 것으로 예상된다.
본원에 제공된 조성물은 임의의 하나 이상의 전장 또는 부분(서열의 절단 또는 다른 결실) S 단백질 서브유닛(예를 들어, S1 또는 S2 서브유닛), S 단백질 서브유닛의 하나 이상의 도메인 또는 도메인의 조합(예를 들어, SD1 및/또는 SD2가 있거나 없는, NTD, RBD 또는 NTD-RBD 융합), 또는 전장 또는 부분 및 S2 단백질 서브유닛의 키메라를 암호화할 수 있는 mRNA를 포함한다. 다른 S 단백질 서브유닛 및/또는 도메인 구성이 본원에서 고려된다.
도 2 및 도 6은 SARS-CoV-2 스파이크 단백질로부터 유래된 예시적인 도메인 및 서브유닛 항원을 도시한다. 도 2A 및 도 2B는 각각 가용성 및 막횡단 RBD 항원을 도시한다. 막횡단 NTD 항원은 도 2C에 도시된다. 도 2D-2F 및 도 2I에 도시된 도메인 항원은 각각 SP 및 TM 도메인을 갖는 NTD 및 RBD의 예시적인 융합 단백질을 나타낸다. 작제물 중 2개는 말단 트래피킹 도메인(CD86 및/또는 CD11b)을 갖는다. 도메인은 링커, 특히 GS 링커 또는 PADRE 링커를 통해 연결된다(도 2I). NTD 도메인에 대한 RBD 도메인 N-말단을 갖는 도메인 작제물은 도 2G 및 도 2H에 도시된다. 각 작제물은 또한 SP 및/또는 TM 도메인을 포함할 수 있다.
암호화된 서브유닛 항원
본 개시의 일부 측면은 SARS-CoV-2 S 단백질의 (적어도 하나의) 서브유닛을 암호화하는 mRNA를 포함하는 조성물을 제공한다. 일부 구현예에서, mRNA는 S1 서브유닛(예를 들어, 전장 또는 부분)을 암호화한다. 다른 구현예에서, mRNA는 S2 서브유닛(예를 들어, 전장 또는 부분)을 암호화한다. 또 다른 구현예에서, mRNA는 키메라 S1-S2 단백질을 암호화하고, 상기 서브유닛 중 하나는 SARS-CoV-2 S 단백질로부터 유래하며, 다른 서브유닛은 다른 유기체, 예를 들어, 인플루엔자 바이러스와 같은 바이러스로부터 유래한다. 본 개시의 mRNA에 의해 암호화되는 SARS-CoV-2 서브유닛(S1 및/또는 S2)은 가용성이거나 막에 결합(예를 들어, 막횡단 도메인에 연결)될 수 있다. S2를 기반으로 하는 예시적인 항원 디자인은 도 6에 도시된다. 도 6a는 FP, HR1, HR2, TM 및 CT 도메인을 포함하는 전장 S2를 도시한다. 서브유닛 사이의 링커로 구성된 S2의 버전은 도 6b에 도시된다. CT 도메인이 없는 도메인 항원은 도 6c 및 도 6d에 도시된다.
가용성 서브유닛 항원
가용성 단백질은 세포의 세포질에 존재하거나 (예를 들어, 막 결합되지 않은) 세포로부터 분비된다. 세포에 의해 분비되는 가용성 항원은 보체에 의해 옵소닌화될 수 있고 림프절의 여포 수지상 세포에 의해 포획될 수 있으며, 이때 이들은 발현된 단백질 상에 존재하는 에피토프에 특이적인 B 세포에 의해 인식될 수 있다. 서브유닛 항원의 발현은 추가로 특정 서브유닛에 대한 면역 반응의 초점을 맞추고 다른 관련 바이러스와 공유되는 항원의 다른 도메인에 특이적인 기억 B 및 T 세포의 최소의 자극을 허용한다. 이론에 얽매이지 않고, NTD, RBD를 포함하는 SARS-CoV-2 S1 서브유닛과 일부 경우에, SARS-CoV-2 S1 서브유닛의 개재 폴리펩티드가 가용성 형태로 제시되면 S1 서브유닛-특이적 면역 반응을 생성하는 것으로 여겨진다. 따라서, 일부 구현예에서, 본원에 제공된 mRNA는 가용성 SARS-CoV-2 S1 서브유닛 항원 및/또는 가용성 SARS-CoV-2 S2 서브유닛 항원을 암호화한다. 가용성 SARS-CoV-2 S1 서브유닛 항원 및 이를 암호화하는 mRNA의 비-제한적인 예는 하기 표 1A 및 표 1B에 제공된다. 가용성 SARS-CoV-2 서브유닛 항원의 다른 예가 본원에 제공된다.
표 1A. 가용성 서브유닛 항원
표 1B. 가용성 서브유닛 항원
막 결합 서브유닛 항원
막 결합 단백질은 세포막에 고정되어 있다(가용성이 아님). 이론에 얽매이지 않고, 항원 제시 세포는 강한 면역 반응을 생성하기 위해 매립된 항원을 배액 림프절로 운반할 것으로 여겨진다. 배액 림프절에서 발생하는 배 중심 반응은 CD4+ TFH 세포와 B 세포 사이의 장기간 접촉을 수반하여, 제시된 항원에 특이적인 B 세포의 복제 및 IgG1의 생산으로의 클래스 전환을 선호하는 IL-4 및 IL-21과 같은 국소 사이토카인 신호 및 공동-자극을 허용하며, 이들 각각은 수명이 긴 형질 세포 및 기억 B 세포의 생성을 촉진할 수 있다. 따라서, 일부 구현예에서, mRNA는 막 결합 SARS-CoV-2 S1 서브유닛 항원 및/또는 막 결합된 SARS-CoV-2 S2 서브유닛 항원을 암호화한다. 일부 구현예에서, 막 결합 항원(예를 들어, S1 서브유닛, S2 서브유닛, NTD, RBD 또는 이들의 조합)은 세포막에 단백질을 고정시키는 역할을 하는 막횡단 도메인, 예를 들어 천연 발생 막횡단 도메인 또는 (이종 단백질로부터 유래된) 이종 막횡단 도메인에 연결된다. 막 결합 SARS-CoV-2 S1 서브유닛 항원 및 SARS-CoV-2 S2 서브유닛 항원 및 이들을 암호화하는 mRNA의 비-제한적 예는 하기 표 2A 및 표 2B에 제공된다. 다른 막 결합 SARS-CoV-2 S1 서브유닛 항원이 본원에서 고려된다.
표 2A. 막 결합 서브유닛 항원
표 2B. 막 결합 서브유닛 항원
서브유닛 항원 절단 및 RBD 결실
일부 구현예에서, 조성물은 RBD 또는 RBD의 일부를 제거하도록 변형된 S1 서브유닛을 암호화하는 mRNA를 포함한다. S1 서브유닛의 절단은 면역 시스템이 인식할 수 있는 에피토프를 더 적게 제공하고, 이에 따라 나머지 에피토프에 대한 면역 반응을 편향시켜 바이러스 중화에 중요한 특정 에피토프에 대한 항체를 선택할 수 있다. RBD의 절단 또는 부분 결실은 발현된 단백질 또는 이를 운반하는 세포가 수용체 ACE2와 상호작용하는 것을 방지하여, 림프절에 도달하고 원하는 면역 반응을 자극할 가능성을 더 높일 수 있다. 또한, RBD의 제거는 관련 바이러스에 대해 이전에 생성된 교차-반응성 항체에 의한 에피토프 마스킹을 방지할 수 있고, 따라서 유도된 면역 반응을 원하는 항원에 특이적으로 집중시킬 수 있다. 추가적으로, RBD의 제거는 발현된 서브유닛의 형태를 변경하여, 이러한 대안적인 형태적 에피토프에 특이적인 B 세포가 T 세포에 선형 펩티드를 흡수하고 제시하도록 허용하고, 이에 따라 여전히 천연 형태에 존재하는 이들 에피토프에 대한 CD4+ T 세포 반응을 간접적으로 향상시킬 수 있다.
일부 구현예에서, 조성물은 RBD 또는 RBD의 일부를 제거하도록 변형된 S1 서브유닛을 암호화하는 mRNA를 포함하며, 이때 S2 서브유닛은 글리칸을 함유한다. 글리칸은 아스파라긴 잔기를 통한 N-연결된 글리코실화 또는 세린 또는 트레오닌 잔기 상에 O-연결된 글리코실화에 의해 단백질에 부착된다. 단백질의 일부 구성 요소에 글리칸 쉴드(shield)의 존재는 펩티드 에피토프를 마스킹할 수 있으며, 이에 따라 다른 노출된 펩티드 에피토프에 대한 항체 반응을 집중시킨다. 또한, 글리코실화된 단백질은 또한 코팅 글리칸을 인식하는 항체를 유도한다. 글리칸 에피토프를 인식하는 B 세포는 선형 펩티드 에피토프를 흡수하여 CD4+ T 세포에 제시하고, 이에 따라 단백질 전체에서 발견되는 선형 에피토프에 대한 CD4+ T 세포 반응을 향상시킬 것이다.
절단된 SARS-CoV-2 S1 서브유닛 항원 및 이를 암호화하는 mRNA의 비-제한적 예는 하기 표 3A 및 표 3B에 제공된다.
RBD 결실을 갖는 SARS-CoV-2 S1 서브유닛 및 이를 암호화하는 mRNA의 비-제한적인 예는 하기 표 4A 및 표 4B에 제공된다.
표 3A. 서브유닛 항원 절단
표 3B. 서브유닛 항원 절단
표 4A. 서브유닛 항원 RBD 결실
표 4B. 서브유닛 항원 RBD 결실
키메라 S1-S2 서브유닛 항원
일부 구현예에서, 조성물은 키메라 단백질, 예를 들어 하나의 바이러스의 S 단백질로부터 유래된 S1 서브유닛 및 다른 상이한 바이러스의 S 단백질로부터 유래된 S2 서브유닛을 갖는 키메라 S1-S2 단백질을 암호화하는 mRNA를 포함한다. 예를 들어, S2 서브유닛은 SARS-CoV-2로부터 유래될 수 있는 반면, S1 서브유닛은 HKU1으로부터 유래될 수 있다. 다른 예로서, S2 서브유닛은 SARS-CoV-2로부터 유래될 수 있는 반면, S1 서브유닛은 OC43으로부터 유래될 수 있다. 이러한 키메라 단백질은 이전 노출에 의해 생성된 HKU1 또는 OC43의 S1 서브유닛에 특이적인 항체를 순환시키고, 대식세포 및 수지상 세포에 의한 CD4+ T 세포에 대한 SARS-CoV-2 S2 서브유닛 펩티드의 효율적인 흡수 및 교차-제시를 촉진시킴에 의해 옵소닌화될 가능성이 있다. 항체가 순환함에 따른 옵소닌화는 또한 SARS-CoV-2 S2 서브유닛 에피토프에 특이적인 수용체를 갖는 B 세포에 제시하기 위해 여포 수지상 세포에 의한 포획을 촉진한다. 키메라 S1/S2 서브유닛 작제물 및 이를 암호화하는 mRNA의 비-제한적 예는 하기 표 5A 및 표 5B에 제공된다.
표 5A. 키메라 S1 서브유닛-S2 서브유닛 항원
표 5B. 키메라 S1 서브유닛-S2 서브유닛 항원
암호화된 도메인 항원
본 개시의 다른 측면은 S 단백질의 SARS-CoV-2 S1 서브유닛의 (적어도 하나) 서브도메인을 암호화하는 mRNA를 포함하는 조성물을 제공한다. 서브도메인은 (SD1 및/또는 SD2가 있거나 없는) N-말단 도메인(NTD) 또는 수용체 결합 도메인(RBD)일 수 있다. 일부 구현예에서, mRNA는 (SD1 및/또는 SD2가 있거나 없는) NTD 및 RBD의 조합(예를 들어, 비-천연 조합)을 암호화한다. 일부 구현예에서, (SD1 및/또는 SD2가 있거나 없는) NTD 및/또는 RBD는 막횡단 도메인에 연결된다. 일부 구현예에서, mRNA는 시스테인 잔기를 포함하도록 돌연변이된 S 단백질(NTD 및 RBD)의 SARS-CoV-2 S1 서브유닛의 2개의 서브도메인을 암호화한다. 해당 돌연변이는, 일부 구현예에서, 이황화 결합의 형성을 초래한다. 예를 들어, mRNA는 F43C 돌연변이를 포함하는 NTD 및 Q563C 돌연변이를 포함하는 RBD를 암호화할 수 있고, 궁극적으로 이황화 결합을 통해 RBD에 연결된 NTD를 생성한다.
N 말단 도메인(NTD) 작제물
일부 구현예에서, 본원에 제공된 mRNA는 SARS-CoV-2 S 단백질의 S1 서브유닛의 NTD를 암호화한다. 특정 베타코로나바이러스의 NTD는 항체의 보호 수준을 유도한다. MERS와 같은 다른 베타코로나바이러스의 NTD에 특이적인 항체는 막 융합 및 바이러스 진입을 방지함으로써 작용하고(Zhou H 등 Nat Commun. 2019; 3068), 이는 ACE2에 대한 바이러스 부착 방지와 구별되는 제2 중화 메커니즘을 제공한다. 본 개시의 mRNA에 의해 암호화되는 SARS-CoV-2 NTD는 가용성이거나 막 결합될 수 있다. 막 결합 SARS-CoV-2 NTD 항원 및 이를 암호화하는 mRNA의 비-제한적인 예는 하기 표 6A 및 표 6B에 제공된다.
표 6A. 막 결합 NTD 항원
표 6B. 막 결합 NTD 항원
수용체 결합 도메인(RBD) 작제물
다른 구현예에서, 본원에 제공된 mRNA는 SARS-CoV-2 S 단백질의 S1 서브유닛의 RBD를 암호화한다. RBD는 세포에 대한 바이러스 부착을 매개하는, 숙주 세포 상의 ACE2 수용체에 결합한다. 바이러스가 세포에 진입하여 복제하기 위해서는 부착이 필요하다. 따라서, 세포 내로의 바이러스 부착을 차단하는 RBD 표적화된 항체 반응은 세포외 바이러스 입자를 효과적으로 중화시키고, 증식을 방지하고 상기 중화된 바이러스 입자의 다른 구성요소에 대한 추가 면역 반응을 촉진한다. 본 개시의 mRNA에 의해 암호화되는 SARS-CoV-2 RBD는 가용성이거나 막 결합(예를 들어, 막횡단 도메인에 연결)될 수 있다.
가용성 RBD 항원
일부 구현예에서, mRNA는 가용성 SARS-CoV-2 RBD를 암호화한다. 수지상 세포는 음세포작용(pinocytosis)에 의해 가용성 단백질을 샘플링하고, 배액 림프절로 이동시, 상기 샘플링된 단백질을 포함하는 선형 펩티드를 CD4+ T 세포에 제시한다. 이러한 CD4+ T 세포는 RBD로부터의 에피토프를 인식하고, 흡수하고, 제시된 B 세포에 증식 신호를 제공하므로, SARS-CoV-2 스파이크 단백질의 다른 구성 요소 없이 특이적으로 RBD를 투여하면 RBD에 존재하는 에피토프에 대해 면역 반응이 집중될 것으로 예상된다. 가용성 SARS-CoV-2 RBD 및 이를 암호화하는 mRNA의 비-제한적인 예는 하기 표 7A 및 표 7B에 제공된다.
표 7. 가용성 RBD 항원
표 7B. 가용성 RBD 항원
막 결합 RBD 항원
일부 구현예에서, mRNA는 막 결합 SARS-CoV-2 RBD를 암호화한다. 막 결합 RBD를 발현하는 세포는 이러한 막-결합 항원을 배액 림프절로 운반하고, RBD-특이적 B 세포에 의한 에피토프의 효율적인 인식을 촉진할 것으로 예상된다. B 세포 표면은 많은 표면 결합 항체를 포함하고, 발현 세포는 막 결합 RBD의 많은 복제물을 함유하기 때문에, B 세포에 의한 항원의 초기 인식이 B 세포 수용체의 교차-결합으로 이어지며, 다가 효과(avidity effect)를 통해 강한 반응을 자극할 것으로 예상된다. 막 결합 SARS-CoV-2 RBD 및 이를 암호화하는 mRNA의 비-제한적 예는 하기 표 8A 및 표 8B에 제공된다.
표 8A. 막 결합 RBD 항원
표 8B. 막 결합 RBD 항원
도메인 융합 항원
또 다른 구현예에서, 본원에 제공된 mRNA는 SARS-CoV-2 NTD-RBD 융합 단백질을 암호화한다. 예를 들어, S 단백질의 SARS-CoV-2 S1 서브유닛의 NTD 및 RBD는 짧은 아미노산(예를 들어, 글리신-세린) 링커와 같은 링커를 통해 서로 연결되어 상기 도메인 사이의 유연성/힌지 및 공간을 허용할 수 있다. 또 다른 구현예에서, 항원성 에피토프, 예를 들어, PADRE와 같은 클래스 II 보편적 T 세포 에피토프를 포함하는 링커가 사용될 수 있다. 일부 구현예에서, 막횡단 영역은 예를 들어 유연성을 위해 그리고 막과 항원 사이에 합리적인 거리를 허용하기 위해 또 다른 짧은 아미노산(예를 들어, 글리신-세린 또는 PADRE) 링커를 통해 NTD-RBD 융합에 연결된다. 이론에 얽매이지 않고, 이러한 막 결합, 탠덤 구성은 하나의 오픈 리딩 프레임에서 전부는 아니더라도, 대부분의 공지된 중화 및 보호 에피토프를 제시하는 것으로 여겨진다. 이러한 융합 단백질의 투여는 이후 공지된 보호 에피토프에 대한 면역 반응에 초점을 맞추고, 비-보호 에피토프에 특이적인 항체 및 T 세포의 불필요한 생성을 줄여야 한다. 또한, 상이한 도메인에 대한 항체는 숙주 세포에 대한 부착을 차단하거나 결합된 바이러스가 막 융합을 거쳐 숙주 세포로 진입하는 것을 방지하는 것과 같은, 상이한 메커니즘을 통해 바이러스 입자를 중화시킬 수 있다. 상이한 도메인을 포함하는 융합 단백질에 의해 유도되는 광범위한 반응은 따라서 보다 진화적으로 강력할 수 있으며, 백신-유도된 면역을 피하기 위해 다수의 고유한 돌연변이가 필요하다. SARS-CoV-2 NTD-RBD 융합 단백질 및 이를 암호화하는 mRNA의 비-제한적 예는 하기 표 9A 및 표 9B에 제공된다.
링커
다양한 링커가 본 개시에 따라 사용될 수 있다. 본원에 제공된 바와 같은 링커는 단순히 2개의 다른 아미노산 서열을 함께 인공적으로 연결하는 아미노산 서열이다. 본원에 사용된 링커는 절단 가능하거나 절단 불가능할 수 있다. 절단 가능한 링커는 mRNA가 폴리펩티드로 번역되도록 허용하고, 이후 링커의 절단은 각 개별 성분이 독립적으로 방출되도록 허용한다. 절단 불가능한 링커는 연결된 하나 이상의 단백질 서브유닛을 유지하며, 전체 단백질이 구성 요소 서브유닛의 밀접한 근접성을 요구하는 기능을 수행하도록 허용한다. 이러한 링커의 비-제한적 예는 글리신-세린(GS) 링커(절단 불가능); 및 F2A 링커, P2A 링커, T2A 링커, 및 E2A링커(절단 가능)을 포함한다. 다른 링커들이 본원에 사용될 수 있다.
일부 구현예에서, 링커는 GS 링커이다. GS 링커는 글리신 및 세린 아미노산 반복을 포함하는 폴리펩티드 링커이다. 이들은 유연하고 친수성 잔기를 포함하며, 단백질 도메인의 폴딩 및 기능의 간섭 없이, 그리고 2차 구조의 형성 없이 단백질 서브유닛의 융합을 수행하는 데 사용될 수 있다. 일부 구현예에서, mRNA는 3 내지 20개의 아미노산 길이인 GS 링커를 포함하는 융합 단백질을 암호화한다. 예를 들어, GS 링커는 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개 또는 20개의 아미노산 길이를 가질 수 있다 (또는 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 16개, 적어도 17개, 적어도 18개, 적어도 19개 또는 적어도 20개의 아미노산 길이를 가질 수 있다). 일부 구현예에서, GS 링커는 15개의 아미노산 길이(예를 들어, GGSGGSGGSGGSGGG (서열번호 133))이다 (또는 적어도 15개의 아미노산 길이이다). 일부 구현예에서, GS 링커는 8개의 아미노산 길이(예를 들어, GGGSGGGS (서열번호 134))이다 (또는 적어도 8개의 아미노산 길이이다). 일부 구현예에서, GS 링커는 7개의 아미노산 길이(예를 들어, GGGSGGG (서열번호 135))이다 (또는 적어도 7개의 아미노산 길이이다). 일부 구현예에서, GS 링커는 4개의 아미노산 길이(예를 들어, GGGS (서열번호 136))이다 (또는 적어도 4개의 아미노산 길이이다). 일부 구현예에서, GS 링커는 (GGGS)n(서열번호 136)을 포함하고, 여기서 n은 1-5의 임의의 정수이다. 일부 구현예에서, GS 링커는 4개의 아미노산 길이(예를 들어, GSGG (서열번호 152))이다 (또는 적어도 4개의 아미노산 길이이다). 일부 구현예에서, GS 링커는 (GSGG)n (서열번호 152)을 포함하고, 여기서 n은 1-5의 임의의 정수이다.
일부 구현예에서, 링커는 예를 들어, 3개의 아미노산(예를 들어, GGG) 길이 (또는 적어도 3개의 아미노산 길이)를 갖는 글리신 링커이다.
일부 구현예에서, mRNA 백신에 의해 암호화된 단백질은 서로 동일하거나 상이할 수 있는 하나 이상의 링커를 포함한다(예를 들어, 동일한 S 단백질 작제물에서 GGGSGGG (서열번호 135) 및 GGGS (서열번호 136)).
일부 구현예에서, 링커는 pan HLA DR-결합 에피토프(PADRE)(예를 들어, AKFVAAWTLKAAA (서열번호 148))를 암호화하는 mRNA를 포함한다. PADRE는 면역우성(immunodominant) 헬퍼 CD4 T 세포 에피토프 및 강력한 면역원이다(예를 들어, Alexander J. 등 J of Immuno. 164(3): 1625-33 참조, 본원에 참조로 포함됨).
표 9A. 도메인 융합 항원
표 9B. 도메인 융합 항원
트래피킹 신호
일부 구현예에서, mRNA는 골지(Golgi) 트래피킹 신호에 연결된 SARS-CoV-2 S 단백질 도메인(예를 들어, NTD, RBD 또는 NTD-RBD 융합)을 암호화한다. 이러한 신호의 비-제한적인 예는 CD86 및/또는 CD11b와 같은 대식세포 마커를 포함하며, 이는 고도로 발현되고 세포내 영역은 골지체로부터 세포 표면으로의 효율적인 유출을 제어할 수 있다. 다른 세포 트래피킹 신호(서열), 예를 들어 VSV-G 세포질 꼬리(VSVGct)가 본원에 사용될 수 있다. 암호화된 단백질의 세포 표면으로의 보다 효율적인 트래피킹은 B 세포 인식을 위한 항원 가용성을 증가시키고, 이에 따라 암호화된 SARS-CoV-2 S 단백질 도메인에 대한 항체의 생성을 촉진할 것으로 예상된다. 트래피킹 신호에 연결된 SARS-CoV-2 항원 및 이를 암호화하는 mRNA의 비-제한적인 예는 하기 표 10A 및 표 10B에 제공된다.
표 10A. 트래피킹 신호에 연결된 도메인 융합 항원
표 10B. 트래피킹 신호에 연결된 도메인 융합 항원
도메인 융합 C-말단 절단
다른 구현예에서, 본원에 제공된 mRNA는 C-말단 도메인의 일부 부분이 절단된/결실된 SARS-CoV-2 NTD-RBD 융합 단백질을 암호화한다. 일 구현예에서, 13개 (또는 적어도 13개)의 아미노산이 NTD-RBD 융합 단백질의 C-말단 도메인으로부터 결실되었다. 이러한 아미노산의 결실은 항체에 대한 에피토프의 노출을 증가시키고, 이에 따라 NTD 및 RBD 도메인에 존재하는 보호 에피토프에 대한 보다 강력한 면역 반응을 자극할 것으로 예상된다.
C-말단 절단을 갖는 SARS-CoV-2 도메인 융합 항원 및 이를 암호화하는 mRNA의 비-제한적인 예는 하기 표 11A 및 표 11B에 제공된다.
표 11A. 도메인 융합 C-말단 절단
표 11B. 도메인 융합 C-말단 절단
도메인 확장
SARS-CoV-2 S 단백질 도메인 항원은, 일부 구현예에서, NTD 도메인 또는 RBD 도메인인 것으로 당업계에서 이해되는 것에 인접하고/하거나 플랭킹하는 서열을 포함하는 "확장된" 영역을 포함한다. RBD_EXT 시리즈는 SD1(서브도메인 1)을 포괄한다. NTD_EXT 시리즈는 NTD의 C-말단 나선을 포괄한다. 일부 B 세포 및 항체는 SARS-CoV-2 S 단백질 NTD 및 RBD의 적절하게 폴딩되어 있지만, 변성되지 않은 형태에서만 발견되는 형태적 에피토프를 인식한다. NTD 및 RBD 도메인에 인접하고/하거나 측면에 있는 서열의 포함은 항원에 대한 추가 B-세포 에피토프를 제공할 수 있을 뿐만 아니라, 잠재적으로 해당 도메인의 보다 최적의 폴딩을 초래할 수 있고, 두 도메인의 가장자리에서 찾을 수 있는 에피토프에 특이적인 항체로 B 세포를 자극할 수 있다. 또한, 이러한 확장 서열의 포함은 따라서 NTD 또는 RBD와 발현 세포막 사이의 거리를 증가시킬 수 있으며, 발현된 단백질이 세포 표면에 너무 가까울 경우 덜 효율적으로 결합할 수 있는 항체에 대한 두 도메인의 노출을 증가시킬 수 있다. 마지막으로, 확장 서열의 포함은 NTD 또는 RBD 에피토프를 인식한 B 세포에 의해 CD4+ T 세포에 잠재적으로 제시될 수 있는 펩티드의 풀을 증가시키고, 이후 항원 제시를 위해 전체 단백질을 처리하며, 이에 따라 NTD 또는 RBD-특이적 B 세포가 충분한 T 세포 도움을 받을 기회를 증가시킨다. SARS-CoV-2 도메인 확장 및 이를 암호화하는 mRNA의 비-제한적 예는 하기 표 12A 및 표 12B에 제공된다.
표 12. 도메인 확장
표 12B. 도메인 확장
도메인 혼합물
본 개시는, 일부 측면에서, SARS-CoV-2 S 단백질 서브도메인을 암호화하는 mRNA의 혼합물을 포함하는 조성물을 제공한다. 일 예에서, 조성물은 (SD1, SD2, 및/또는 막횡단 도메인이 있거나 없는) NTD를 암호화하는 mRNA 및 (SD1, SD2, 및/또는 막횡단 도메인이 있거나 없는) RBD를 암호화하는 mRNA의 혼합물을 포함한다. 일부 구현예에서, 조성물은 막횡단 도메인(예를 들어, 서열번호 47)에 연결된 NTD를 암호화하는 mRNA(예를 들어, 서열번호 45 또는 46) 및 막횡단 도메인(예를 들어, 서열번호 77)에 연결된 RBD를 암호화하는 mRNA(예를 들어, 서열번호 75 또는 76)를 포함한다.
조성물에서 하나의 mRNA 대 다른 mRNA의 농도 비율은 1:1 (50:50), 1:2, 1:3, 1:4, 또는 1:5일 수 있다. 일부 구현예에서, 비율은 1:1이다. 예를 들어, 조성물은 막횡단 도메인(예를 들어, 서열번호 47)에 연결된 NTD를 암호화하는 mRNA(예를 들어, 서열번호 45 또는 46) 대 막횡단 도메인(예를 들어, 서열번호 77)에 연결된 RBD를 암호화하는 mRNA(예를 들어, 서열번호 75 또는 76)의 1:1 비율을 포함할 수 있다. 일부 구현예에서, 비율은 1:2이다. 예를 들어, 조성물은 막횡단 도메인(예를 들어, 서열번호 47)에 연결된 NTD를 암호화하는 mRNA(예를 들어, 서열번호 45 또는 46) 대 막횡단 도메인(예를 들어, 서열번호 77)에 연결된 RBD를 암호화하는 mRNA(예를 들어, 서열번호 75 또는 76)의 1:2 비율을 포함할 수 있다. 다른 예에서, 조성물은 막횡단 도메인(예를 들어, 서열번호 77)에 연결된 RBD를 암호화하는 mRNA(예를 들어, 서열번호 75 또는 76) 대 막횡단 도메인(예를 들어, 서열번호 47)에 연결된 NTD를 암호화하는 mRNA(예를 들어, 서열번호 45 또는 46)의 1:2 비율을 포함할 수 있다. 상이한 항원을 암호화하는 상이한 mRNA는 다양한 강도의 면역 반응을 자극할 수 있고(Magini D 등 PLoS ONE. 2016; 11:e0161193), 2개의 상이한 항원을 암호화하는 2개의 mRNA의 등몰비의 투여는 하나에 대한 면역 반응을 초래할 수 있지만 다른 하나에 대해서는 그렇지 않을 수 있다(John S 등 Vaccine. 2018; 36:1689-1699). 공동-전달된 mRNA의 비율 조작은 동일한 효능을 가진 원하는 항원을 표적으로 하는 광범위한 면역 반응을 유도하는 데 유용할 수 있다.
암호화된 나노입자 항원
본원에 제공된 mRNA 백신은, 일부 구현예에서, 스캐폴드 도메인에 연결된 코로나바이러스 항원을 포함하는 융합 단백질을 암호화한다. 일부 구현예에서, 스캐폴드 도메인은 본 개시의 mRNA에 의해 암호화되는 항원에 원하는 특성을 부여한다. 예를 들어, 스캐폴드 도메인은 예를 들어, 항원의 구조를 변경하고, 항원의 흡수 및 처리를 변경하고/하거나, 항원이 다른 분자에 결합하도록 함으로써, 항원의 면역원성을 개선할 수 있다. 일부 구현예에서, 항원에 연결된 스캐폴드 도메인은 바이러스 나노입자 또는 더 큰 단백질-폴딩된 면역원으로 항원의 자가-조립을 촉진한다. 본원에서 제공되는 바와 같이, 사용될 수 있는 스캐폴드 도메인의 비-제한적인 예는 페리틴 도메인, 루마진 합성효소 도메인, 폴던 도메인 및 인캡슐린 도메인을 포함한다. 다른 스캐폴드 도메인이 사용될 수 있다.
페리틴
일부 구현예에서, 페리틴 도메인은 스캐폴드 도메인으로서 사용된다. 페리틴은 세포내 철 저장이 이의 주요 기능인, 단백질이다. 페리틴은 24개의 서브유닛으로 구성되며, 각각은 8면체 대칭을 갖는 4차 구조로 자가-조립되는 4개의 알파-나선 묶음(bundle)으로 구성된다(Cho K. J. 등 J Mol Biol. 2009; 390: 83-98; (Granier T. 등 J Biol Inorg Chem. 2003; 8: 105-111; 및 Lawson D.M. 등 Nature. 1991; 349: 541-544). 페리틴은 강력한 열적 및 화학적 안정성을 가진 나노입자로 자가-조립된다. 이러한 방식으로 페리틴 나노입자 내에 항원을 봉입하는 것은 항원의 분해를 지연시킬 뿐만 아니라 개별 항원의 응집 모두를 응집시킬 것으로 예상되며, 각 나노입자는 24개의 항원 서브유닛을 포함한다. 동일한 항원의 많은 복제물의 응집은 수지상 세포에 의한 항원 흡수 및 이동 둘 다 뿐만 아니라 보다 강력한 CD4+ 및 CD8+ T 세포 반응을 향상시킨다(Kastenmuller K 등 J Clin Invest. 2011; 121(5):1782-96). 따라서, 페리틴 나노입자는 항원 제시 및 백신 개발에 적합한 플랫폼이다.
본원에 제공된 mRNA는, 일부 구현예에서, 예를 들어, 글리신(예를 들어, GGG) 링커 도메인을 통해, 페리틴 도메인에 연결된 RBD를 암호화한다. 다른 링커가 사용될 수 있다.
다른 구현예에서, 본원에 제공된 mRNA는 예를 들어, 글리신(예를 들어, GGG) 링커를 통해, 페리틴 도메인에 연결된 S 단백질의 S1 도메인을 암호화한다. 본원의 다른 곳에서 지시된 바와 같이, 다른 링커가 사용될 수 있다.
페리틴 도메인에 연결된 SARS-CoV-2 항원 및 이를 암호화하는 mRNA의 비-제한적 예는 하기 표 13A 및 표 13B에 제공된다.
표 13A. 페리틴 도메인에 연결된 항원
표 13B. 페리틴 도메인에 연결된 항원
루마진 합성효소
일부 구현예에서, 루마진 합성효소 도메인은 스캐폴드 도메인으로서 사용된다. 루마진 합성효소는 고세균, 박테리아, 곰팡이, 식물 및 진균을 포함하는, 다양한 유기체에서 리보플라빈의 생합성에서 끝에서 두 번째(penultimate) 촉매 단계를 담당하는 효소이다. 루마진 합성효소는 그 기원 종에 따라 5량체, 10량체 및 20면체 60량체를 포함하여 크기 및 서브유닛 수가 다양한 동종 올리고머(homooligomer)로 구성된다. 루마진 합성효소 단량체는 150개의 아미노산 길이이며, 플랭킹, 탠덤 알파-나선을 가진 베타-시트를 포함한다. 루마진 합성효소에 대해 상이한 4차 구조가 보고되었으며, 이는 호모펜타머에서 150 Å 직경의 캡시드를 형성하는 12개의 5량체의 대칭성 조립에 이르기까지 형태학적 다양성을 보여준다. 루마진 합성효의 표면 상에 항원의 제시는 정렬된 배열로 표시된 항원의 높은 국소 농도를 초래한다. 이러한 반복적인 구조는 B-세포 수용체의 교차-결합을 가능하게 하고, 다가 효과를 통해 강한 면역 반응을 초래한다.
본원에 제공된 mRNA는, 일부 구현예에서, 예를 들어 글리신-세린(예를 들어, GGS)을 통해 루마진 합성효소 도메인에 연결된 RBD를 암호화한다. 다른 링커가 사용될 수 있다.
다른 구현예에서, 본원에 제공된 mRNA는 예를 들어 글리신-세린(예를 들어, GGS) 링커를 통해 루마진 합성효소 도메인에 연결된 S 단백질의 S1 도메인을 암호화한다. 본원의 다른 곳에서 지시된 바와 같이, 다른 링커가 사용될 수 있다.
폴던 도메인에 연결된 SARS-CoV-2 항원 및 이를 암호화하는 mRNA의 비-제한적 예는 하기 표 14A 및 표 14B에 제공된다.
표 14A. 루마진 합성효소 도메인에 연결된 항원
표 14B. 루마진 합성효소 도메인에 연결된 항원
폴던
일부 구현예에서, 폴던 도메인은 스캐폴드 도메인으로서 사용된다. T4 피브리틴(폴던)의 C-말단 도메인은 피브리틴 삼량체 구조의 형성에 필수적이며, 인공 삼량체화 도메인으로서 사용될 수 있다(예를 들어, Meier S. 등 Journal of Molecular Biology 2004 Dec 3; 344(4): 1051-1069; Tao Y 등 Structure 1997 Jun 15; 5(6):789-98 참조). S 단백질 엑토도메인에 융합된 경우, 폴던 도메인은 S 단백질의 정확한 삼량체화를 촉진하며, 따라서 단백질의 잘못된 폴딩(misfolding)을 방지한다. S 단백질의 융합 전 형태의 생성을 초래하는 이러한 과정은 증가된 발현, 형태적 균질성 및 강력한 중화 항체 반응의 유도를 초래한다.
이론에 얽매이지 않고, 이러한 구성은 폴던이 단백질의 세포내 영역에서 면역원적으로 대체로 침묵시키는 결과를 초래할 것으로 여겨진다. 폴던 도메인에 연결된 SARS-CoV-2 항원 및 이를 암호화하는 mRNA의 비-제한적인 예는 하기 표 15A 및 표 15B에 제공된다.
표 15A. 폴던 도메인에 연결된 항원
표 15B. 폴던 도메인에 연결된 항원
인캡슐린
일부 구현예에서, 인캡슐린 도메인은 스캐폴드 도메인으로서 사용된다. 인캡슐린은 호열성 세균 써모토가 마리티마로부터 단리된 단백질 케이지 나노입자이다. 인캡슐린은 내부 및 외부 직경이 각각 20 및 24 nm인 얇고 20면체 T = 1 대칭성 케이지 구조를 갖는 동일한 31 kDa 단량체의 60개 복제물로부터 조립된다(Sutter M. 등 Nat Struct Mol Biol. 2008; 15: 939-947). T. 마리티마에서 인캡슐린의 정확한 기능은 아직 명확하게 이해되지는 않았으나, 이의 결정 구조는 최근에 해결되었고, 이의 기능은 산화 스트레스 반응 30에 관여하는 DyP(탈염료 퍼옥시다아제) 및 Flp(페리틴 유사 단백질)과 같은 단백질을 캡슐화하는 세포 구획으로서 가정되었다(Rahmanpour R. 등 FEBS J. 2013; 280: 2097-2104). 나노입자 구성을 위한 인캡슐린의 사용은 나노입자의 표면 상에 단백질 항원의 제시와, 나노입자 자체 내에 mRNA와 같은 카고(cargo)의 봉입을 모두 가능하게 한다. 이전의 인캡슐린 나노입자-기반 백신은 표면에 제시된 항원과 카고 단백질 자체 모두에 대해 강한 면역 반응을 유도하였다(Lagoutte P. 등 Vaccine. 2018; 36(25): 3622-3628).
본원에 제공된 mRNA는, 일부 구현예에서, 인캡슐린 도메인에 연결된 S 단백질 도메인(예를 들어, S1, S2, RBD, 및/또는 NTD)을 암호화한다.
융합 단백질
일부 구현예에서, 본 개시의 조성물은 항원성 융합 단백질을 암호화하는 mRNA를 포함한다. 따라서, 암호화된 항원 또는 항원들은 함께 연결된 2개 이상의 단백질(예를 들어, 단백질 및/또는 단백질 단편)을 포함할 수 있다. 대안적으로, 단백질 항원이 융합된 단백질은 그 자체에 강한 면역 반응을 촉진하지 않고, 오히려 코로나바이러스 항원에 대한 강한 면역 반응을 촉진한다. 항원성 융합 단백질은, 일부 구현예에서, 각각의 원래 단백질로부터 기능적 특성을 보유한다.
일부 구현예에서, 융합 단백질은 SARS-CoV-2 스파이크 단백질로부터의 수용체 결합 도메인을 포함한다.
일부 구현예에서, 융합 단백질은 SARS-CoV-2 스파이크 단백질로부터의 N-말단 도메인을 포함한다.
일부 구현예에서, 융합 단백질은 막횡단 도메인을 포함한다. 막횡단 도메인은, 일부 구현예에서, SARS-CoV-2가 아닌 바이러스로부터 유래될 수 있다. 예를 들어, 막횡단 도메인은 인플루엔자 혈구응집소 막횡단 도메인으로부터 유래할 수 있으며, 이는 세포 표면에서 단백질을 효과적으로 고정시키는 것으로 입증되었다.
변이체
일부 구현예에서, 본 개시의 조성물은 코로나바이러스 항원 변이체를 암호화하는 RNA를 포함한다. 항원 변이체 또는 다른 폴리펩타이드 변이체는 이들의 아미노산 서열이 야생형, 천연 또는 참조 서열과 상이한 분자를 지칭한다. 항원/폴리펩티드 변이체는 천연 또는 참조 서열과 비교하여, 아미노산 서열 내의 특정 위치에서 치환, 결실 및/또는 삽입을 보유할 수 있다. 일반적으로, 변이체는 야생형, 천연 또는 참조 서열에 대해 적어도 50%의 동일성을 보유한다. 일부 구현예에서, 변이체는 야생형, 천연 또는 참조 서열과 적어도 80%, 또는 적어도 90% 동일성을 공유한다.
본 개시의 핵산에 의해 암호화되는 변이체 항원/폴리펩티드는 예를 들어, 대상체에서 이들의 면역원성을 향상시키고, 이들의 발현을 향상시키고/시키거나, 이들의 안정성 또는 PK/PD 특성을 개선시키는, 다수의 바람직한 특성 중 임의의 것을 부여하는 아미노산 변화를 함유할 수 있다. 변이체 항원/폴리펩티드는 정례적인 돌연변이 유발 기술을 사용하여 만들 수 있으며, 원하는 특성을 보유하는지의 여부를 결정하기 위해 적절하게 분석될 수 있다. 발현 수준 및 면역원성을 결정하기 위한 분석은 당업계에 잘 알려져 있으며, 예시적인 해당 분석은 실시예 섹션에 제시되어 있다. 유사하게, 단백질 변이체의 PK/PD 특성은 예를 들어, 시간 경과에 따라 백신 접종된 대상체에서 항원의 발현을 결정하고/하거나, 유도된 면역 반응의 지속성을 관찰함으로써 당업계에서 인정된 기법을 사용하여 측정될 수 있다. 변이체 핵산에 의해 암호화된 단백질(들)의 안정성은 열 안정성 또는 요소(urea) 변성 시 안정성을 분석함으로써 측정될 수 있거나 또는 인실리코 예측을 사용하여 측정될 수 있다. 이러한 실험 및 인실리코 측정을 위한 방법은 당업계에 공지되어 있다.
일부 구현예에서, 조성물은 본원에 제공된 서열 중 임의의 하나의 뉴클레오티드 서열을 포함하는 mRNA 또는 mRNA ORF를 포함하거나(예를 들어, 서열 목록 참조), 본원에 제공된 서열 중 임의의 하나의 뉴클레오티드 서열과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 뉴클레오티드 서열을 포함한다.
용어 "동일성"은 서열을 비교함으로써 결정되는 바와 같이, 2개 이상의 폴리펩티드(예를 들어, 항원) 또는 폴리뉴클레오티드(핵산)의 서열 간의 관계를 지칭한다. 동일성은 또한 2개 이상의 아미노산 잔기 또는 핵산 잔기의 스트링 사이의 일치 수에 의해 결정되는 바와 같이 서열 간의 또는 서열 중의 서열 관련성의 정도를 지칭한다. 동일성은 특정 수학적 모델 또는 컴퓨터 프로그램(예를 들어, "알고리즘")에 의해 처리된 (만약에 있다면) 갭 정렬을 가진 2개 이상의 서열 중 더 작은 것 간의 동일한 일치 퍼센트를 측정한다. 관련된 항원 또는 핵산의 동일성은 공지된 방법에 의해 쉽게 계산될 수 있다. 폴리펩티드 또는 폴리뉴클레오티드 서열에 적용함에 따라 "퍼센트(%) 동일성"은, 필요한 경우, 최대 퍼센트 동일성을 달성하기 위해, 서열 정렬 및 갭 도입 후 제2 서열의 핵산 서열 또는 아미노산 서열에서의 잔기와 동일한 후보 아미노산 또는 핵산 서열에서의 잔기(아미노산 잔기 또는 핵산 잔기)의 백분율로서 정의된다. 정렬을 위한 방법 및 컴퓨터 프로그램은 당업계에 잘 알려져 있다. 동일성은 퍼센트 동일성의 계산에 좌우되지만 계산에서 도입된 갭 및 패널티로 인해 값이 상이할 수 있음을 이해한다. 일반적으로, 특정 폴리뉴클레오티드 또는 폴리펩티드(예를 들어, 항원)의 변이체는 본원에 기재된 그리고 당업자에게 공지된 서열 정렬 프로그램 및 매개변수에 의해 결정되는 바와 같이 그 특정 참조 폴리뉴클레오티드 또는 폴리펩티드에 대해 적어도 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 그러나 100% 미만의 서열 동일성을 갖는다. 이러한 정렬을 위한 도구는 BLAST 묶음(Stephen F. Altschul 등 (1997)". Gapped BLAST and PSI-BLAST: a new generation of protein database search programs", Nucleic Acids Res. 25:3389-3402)의 것들을 포함한다. 또 다른 대중적인 로컬 정렬 기술은 Smith-Waterman 알고리즘(Smith, T.F. & Waterman, M.S. (1981) "Identification of common molecular subsequences". J. Mol. Biol. 147:195-197)을 기반으로 한다. 동적 프로그래밍을 기반으로 하는 일반 전반적 정렬 기술은 Needleman-Wunsch 알고리즘(Needleman, S.B. & Wunsch, C.D. (1970) "A general method applicable to the search for similarities in the amino acid sequences of two proteins". J. Mol. Biol. 48:443-453)이다. 보다 최근에, Needleman-Wunsch 알고리즘을 포함하는, 다른 최적의 전반적인 정렬 방법보다 빠르게 뉴클레오티드 및 단백질 서열의 전반적인 정렬을 생성한다고 알려진 신속한 최적의 전반적인 서열 정렬 알고리즘(Fast Optimal Global Sequence Alignment Algorithm; FOGSAA)이 개발되었다.
이와 같이, 참조 서열, 특히 본원에 개시된 폴리펩티드(예를 들어, 항원) 서열에 대하여 치환, 삽입 및/또는 부가, 결실 및 공유 변형을 함유하는 펩티드 또는 폴리펩티드를 암호화하는 폴리뉴클레오티드는 본 개시의 범위 내에 포함된다. 예를 들어, 서열 태그 또는 아미노산, 예컨대 하나 이상의 라이신은 (예를 들어, N-말단 또는 C-말단 끝에서) 펩티드 서열에 부가될 수 있다. 서열 태그는 펩티드 검출, 정제 또는 국부화에 사용될 수 있다. 라이신은 펩티드 용해도를 증가시키거나, 비오틴화를 허용하는데 사용될 수 있다. 대안적으로, 펩티드 또는 단백질의 아미노산 서열의 카르복시 및 아미노 말단 영역에 위치한 아미노산 잔기는 선택적으로 결실되어 절단된 서열을 제공할 수 있다. 특정 아미노산(예를 들어, C-말단 또는 N-말단 잔기)은 예를 들어, 가용성이거나 고체 지지체에 연결된 더 큰 서열의 일부로서 서열의 발현과 같이 서열의 사용에 따라 대안적으로 결실될 수 있다. 일부 구현예에서, 신호 서열, 종결 서열, 막횡단 도메인, 링커, (예를 들어, 폴던 영역과 같은) 다량체화 도메인 등에 대한 (또는 암호화) 서열은 동일 또는 유사한 기능을 달성하는 대안적인 서열로 치환될 수 있다. 일부 구현예에서, 단백질 코어 내의 공동은 예를 들어, 더 큰 아미노산을 도입함으로써 안정성을 개선시키기 위해 채워질 수 있다. 다른 구현예에서, 매립된 수소 결합 네트워크는 안정성을 개선시키기 위해 소수성 잔기로 대체될 수 있다. 또 다른 구현예에서, 글리코실화 부위를 제거하고 적절한 잔기로 대체할 수 있다. 이러한 서열은 당업자에게 용이하게 식별가능하다. 또한, 본원에 제공된 서열 중 일부는 예를 들어, mRNA 백신의 제조에 사용하기 전에, 결실될 수 있는 (예를 들어, N-말단 또는 C-말단 끝에서) 서열 태그 또는 말단 펩티드 서열을 함유한다는 것을 이해해야 한다.
당업자에 의해 인식되는 바와 같이, 단백질 단편, 기능성 단백질 도메인, 및 상동성 단백질은 또한 관심 코로나바이러스 항원의 범위 내에 있는 것으로 간주된다. 예를 들어, 단편이 면역원성이고 코로나바이러스에 대한 보호 면역 반응을 부여한다면, 참조 단백질의 임의의 단백질 단편(참조 항원 서열보다 적어도 하나의 아미노산 잔기가 더 짧지만 다른 것은 동일한 폴리펩ㅌ드 서열을 의미함)이 본원에 제공된다. 참조 단백질과 동일하지만 절단된 변이체 외에도, 일부 구현예에서, 항원은 본원에 제공되거나 언급된 임의의 서열에 나타낸 바와 같은 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 또는 그 이상의 돌연변이를 포함한다. 항원/항원성 폴리펩티드는 길이가 약 4개, 6개, 또는 8개 아미노산에서 전장 단백질까지의 범위일 수 있다.
안정화 요소
천연-발생 진핵생물 mRNA 분자는 5'-캡 구조 또는 3'-폴리(A) 꼬리와 같은, 다른 구조적 특징 외에, 이들의 5'-말단(5' UTR) 및/또는 3'-말단(3' UTR)의 비번역 영역(UTR)을 포함하나, 이에 제한되지 않는 안정화 요소를 함유할 수 있다. 5' UTR과 3' UTR은 모두 전형적으로 게놈 DNA로부터 전사되며, 미성숙한 mRNA의 요소이다. 5'-캡 및 3'-폴리(A) 꼬리와 같은 성숙한 mRNA의 특징적인 구조적 특징은 일반적으로 mRNA 처리 동안 전사된(미성숙한) mRNA에 추가된다.
일부 구현예에서, 조성물은 적어도 하나의 변형, 적어도 하나의 5' 말단 캡을 갖는 적어도 하나의 항원성 폴리펩티드를 암호화하는 오픈 리딩 프레임을 갖는 mRNA를 포함하고, 지질 나노입자 내에 제형화된다. 폴리뉴클레오티드의 5'-캡핑은 제조업체 프로토콜에 따라 5'-구아노신 캡 구조를 생성하기 위해 하기와 같은 화학적 RNA 캡 유사체를 사용하여 시험관내-전사 반응 동안 동시에 완료될 수 있다: 3'-O-Me-m7G(5')ppp(5') G [ARCA 캡]; G(5')ppp(5')A; G(5')ppp(5')G; m7G(5')ppp(5')A; m7G(5')ppp(5')G (New England BioLabs, Ipswich, MA). 변형된 RNA의 5'-캡핑은 "Cap 0" 구조를 생성하기 위해 백시니아 바이러스 캡핑 효소를 사용하여 전사-후 완료될 수 있다: m7G(5')ppp(5')G (New England BioLabs, Ipswich, MA). 캡 1 구조는 m7G(5')ppp(5')G-2'-O-메틸을 생성하기 위해 백시니아 바이러스 캡핑 효소 및 2'-O 메틸-트랜스퍼라제를 모두 사용하여 생성할 수 있다. 캡 2 구조는 캡 1 구조로부터 생성된 후 2'-O 메틸-트랜스퍼라제를 사용하여 5'-맨 끝에서 세번째(antepenultimate) 뉴클레오티드의 2'-O-메틸화에 의해 생성될 수 있다. 캡 3 구조는 캡 2 구조로부터 생성된 후 2'-O 메틸-트랜스퍼라제를 사용하여 5'-맨 끝에서 네번째(preantepenultimate) 뉴클레오티드의 2'-O-메틸화에 의해 생성될 수 있다. 효소는 재조합 공급원으로부터 유래될 수 있다.
3'-폴리(A) 꼬리는 전형적으로 전사된 mRNA의 3'-말단에 부가된 아데닌 뉴클레오티드의 스트레치이다. 일부 경우에, 최대 약 400개의 아데닌 뉴클레오티드를 포함할 수 있다. 일부 구현예에서, 3'-폴리(A) 꼬리의 길이는 개별 mRNA의 안정성과 관련하여 필수적인 요소일 수 있다.
일부 구현예에서, 조성물은 안정화 요소를 포함한다. 안정화 요소는 예를 들어 히스톤 스템-루프(stem-loop)를 포함할 수 있다. 스템-루프 결합 단백질(SLBP), 32 kDa 단백질이 확인되었다. 핵 및 세포질 모두에서 히스톤 메신저의 3'-말단에 있는 히스톤 스템-루프와 관련이 있다. 이의 발현 수준은 세포 주기에 의해 조절되고; 히스톤 mRNA 수준이 또한 상승된 경우, S-기 동안 최고조에 달한다. 단백질은 U7 snRNP에 의해 히스톤 전(pre)-mRNA의 효율적인 3'-말단 처리에 필수적인 것으로 나타났다. SLBP는 처리 후 스템-루프와 계속 연관되며, 이후 성숙한 히스톤 mRNA가 세포질에서 히스톤 단백질로의 번역을 자극시킨다. SLBP의 RNA 결합 도메인은 후생동물 및 원생동물을 통해 보존되고; 히스톤 스템-루프에 대한 결합은 루프의 구조에 좌우된다. 최소 결합 부위는 스템-루프에 대해 적어도 3개의 뉴클레오타이드 5' 및 2개의 뉴클레오타이드 3'을 포함한다.
일부 구현예에서, mRNA는 암호화 영역, 적어도 하나의 히스톤 스템-루프, 및 선택적으로, 폴리(A) 서열 또는 폴리아데닐화 신호를 포함한다. 폴리(A) 서열 또는 폴리아데닐화 신호는 일반적으로 암호화된 단백질의 발현 수준을 향상시켜야 한다. 암호화된 단백질은, 일부 구현예에서, 히스톤 단백질, 리포터 단백질(예를 들어, 루시퍼라아제, GFP, EGFP, β-갈락토시다아제, EGFP), 또는 마커 또는 선택 단백질(예를 들어, 알파-글로빈, 갈락토키나제 및 잔틴:구아닌 포스포리보실 트랜스퍼라제(GPT))가 아니다.
일부 구현예에서, mRNA는 폴리(A) 서열 또는 폴리아데닐화 신호 및 적어도 하나의 히스톤 스템-루프의 조합을 포함하지만, 둘 다 천연에서 대안적인 기전을 나타내더라도, 개별 요소 중 하나에서 관찰된 수준 이상으로 단백질 발현을 증가시키기 위해 상승적으로 작용한다. 폴리(A) 및 적어도 하나의 히스톤 스템-루프 조합의 상승작용 효과는 요소의 순서 또는 폴리(A) 서열의 길이에 좌우되지 않는다.
일부 구현예에서, mRNA는 히스톤 다운스트림 요소(HDE)를 포함하지 않는다. "히스톤 다운스트림 요소"(HDE)는 U7 snRNA에 대한 결합 부위를 나타내는, 천연 발생 스템-루프의 대략 15 내지 20개의 뉴클레오티드 3'의 퓨린-풍부 폴리뉴클레오티드 스트레치를 포함하며, 이는 히스톤 전(pre)-mRNA를 성숙한 히스톤 mRNA로 처리하는 데 관여한다. 일부 구현예에서, 핵산은 인트론을 포함하지 않는다.
mRNA는 변형 또는 비변형될 수 있거나 활성화 또는 불활성화될 수 있는, 인핸서 및/또는 프로모터 서열을 함유할 수 있거나 함유하지 않을 수 있다. 일부 구현예에서, 히스톤 스템-루프는 일반적으로 히스톤 유전자로부터 유래되고, 구조의 루프를 형성하는, 짧은 서열로 구성되는, 스페이서에 의해 분리된 2개의 이웃한 부분적으로 또는 전체적으로 역 상보적인 서열의 분자내 염기 쌍을 포함한다. 쌍을 이루지 않은 루프 영역은 전형적으로 스템 루프 요소 중 하나와 염기 쌍을 이룰 수 없다. 이는 많은 RNA 2차 구조의 핵심 성분인 것처럼, RNA에서 더 종종 발생하지만, 단일가닥 DNA에서도 존재할 수 있다. 스템-루프 구조의 안정성은 일반적으로 길이, 불일치 또는 돌출의 수, 및 쌍을 이루는 영역의 염기 조성에 좌우된다. 일부 구현예에서, 워블 염기 쌍(비-왓슨-크릭 염기 쌍)이 생길 수 있다. 일부 구현예에서, 적어도 하나의 히스톤 스템-루프 서열은 15 내지 45개의 뉴클레오티드의 길이를 포함한다.
일부 구현예에서, mRNA는 제거된 하나 이상의 AU-풍부 서열을 갖는다. 때때로 AURES로 지칭되는 이들 서열은 3' UTR에서 발견되는 불안정화 서열이다. AURES는 RNA 백신으로부터 제거될 수 있다. 대안적으로, AURES는 RNA 백신에 남아있을 수 있다.
신호 펩티드
일부 구현예에서, 조성물은 코로나바이러스 항원에 융합된 신호 펩티드를 암호화하는 ORF를 갖는 mRNA를 포함한다. 단백질의 N-말단 15-60개 아미노산을 포함하는 신호 펩티드는 전형적으로 분비성 경로 상의 막을 가로지르는 전위에 필요하며, 따라서 진핵생물 및 원핵생물 모두에서 대부분의 단백질의 분비성 경로로의 진입을 보편적으로 제어한다. 진핵생물에서, 초기 전구체 단백질(전-단백질)의 신호 펩티드는 리보솜을 조면 소포체(ER) 막으로 안내하고, 처리를 위해 막을 가로지르는 성장하는 펩티드 사슬의 수송을 개시한다. ER 처리는 성숙한 단백질을 생성하고, 상기 신호 펩티드는 전형적으로 숙주 세포의 ER-상주 신호 펩티다아제에 의해 전구체 단백질로부터 절단되거나, 이들은 절단되지 않은 채로 남아있고 막 앵커로서 기능한다. 신호 펩티드는 또한 단백질의 세포막으로의 표적화를 용이하게 할 수 있다.
신호 펩티드는 15-60개의 아미노산의 길이를 가질 수 있다. 예를 들어, 신호 펩티드는 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 30개, 31개, 32개, 33개, 34개, 35개, 36개, 37개, 38개, 39개, 40개, 41개, 42개, 43개, 44개, 45개, 46개, 47개, 48개, 49개, 50개, 51개, 52개, 53개, 54개, 55개, 56개, 57개, 58개, 59개, 또는 60개의 아미노산의 길이를 가질 수 있다. 일부 구현예에서, 신호 펩티드는 20-60개, 25-60개, 30-60개, 35-60개, 40-60개, 45-60개, 50-60개, 55-60개, 15-55개, 20-55개, 25-55개, 30-55개, 35-55개, 40-55개, 45-55개, 50-55개, 15-50개, 20-50개, 25-50개, 30-50개, 35-50개, 40-50개, 45-50개, 15-45개, 20-45개, 25-45개, 30-45개, 35-45개, 40-45개, 15-40개, 20-40개, 25-40개, 30-40개, 35-40개, 15-35개, 20-35개, 25-35개, 30-35개, 15-30개, 20-30개, 25-30개, 15-25개, 20-25개, 또는 15-20개의 아미노산의 길이를 갖는다.
(천연에서 코로나바이러스 항원 이외의 유전자의 발현을 조절하는) 이종 유전자로부터의 신호 펩티드는 당업계에 공지되어 있고, 원하는 특성에 대해 시험한 다음 본 개시의 핵산에 혼입될 수 있다.
서열 최적화
일부 구현예에서, 본 개시의 항원을 암호화하는 ORF는 코돈 최적화된다. 코돈 최적화 방법은 당업계에 공지되어 있다. 예를 들어, 본원에 제공된 서열 중 임의의 하나 이상의 ORF는 코돈 최적화될 수 있다. 코돈 최적화는, 일부 구현예에서, 적절한 폴딩을 보장하기 위해 표적 및 숙주 유기체에서 코돈 빈도를 일치시키는데; mRNA 안정성을 증가시키기 위해 또는 2차 구조를 감소시키기 위해 GC 함량을 편향시키는데; 유전자 작제 또는 발현을 손상시킬 수 있는 연쇄 반복 코돈 또는 염기 실행을 최소화하는데; 전사 및 번역 제어 영역을 맞춤화하는데; 단백질 트래피킹 서열을 삽입 또는 제거하는데; 암호화된 단백질내 번역 후 변형 부위(예를 들어, 글리코실화 부위)를 제거/첨가하는데; 단백질 도메인을 첨가, 제거 또는 셔플링하는데; 제한 부위를 삽입 또는 제거하는데; 리보솜 결합 부위 및 mRNA 분해 부위를 변형시키는데; 단백질의 다양한 도메인을 적절하게 폴딩하도록 하는 번역 속도를 조정하는데; 또는 폴리뉴클레오티드 내의 문제 2차 구조를 감소 또는 제거하는데 사용될 수 있다. 코돈 최적화 도구, 알고리즘 및 서비스는 당업계에 알려져 있으며 - 비-제한적인 예는 GeneArt(Life Technologies), DNA2.0(Menlo Park CA) 및/또는 독점 방법으로부터의 서비스를 포함한다. 일부 구현예에서, 오픈 리딩 프레임(ORF) 서열은 최적화 알고리즘을 사용하여 최적화된다.
일부 구현예에서, 코돈 최적화된 서열은 천연-발생 또는 야생형 서열 ORF(예를 들어, 코로나바이러스 항원을 암호화하는 천연-발생 또는 야생형 mRNA 서열)에 대해 95% 미만의 서열 동일성을 공유한다. 일부 구현예에서, 코돈 최적화된 서열은 천연-발생 또는 야생형 서열(예를 들어, 코로나바이러스 항원을 암호화하는 천연-발생 또는 야생형 mRNA 서열)에 대해 90% 미만의 서열 동일성을 공유한다. 일부 구현예에서, 코돈 최적화된 서열은 천연-발생 또는 야생형 서열(예를 들어, 코로나바이러스 항원을 암호화하는 천연-발생 또는 야생형 mRNA 서열)에 대해 85% 미만의 서열 동일성을 공유한다. 일부 구현예에서, 코돈 최적화된 서열은 천연-발생 또는 야생형 서열(예를 들어, 코로나바이러스 항원을 암호화하는 천연-발생 또는 야생형 mRNA 서열)에 대해 80% 미만의 서열 동일성을 공유한다. 일부 구현예에서, 코돈 최적화된 서열은 천연-발생 또는 야생형 서열(예를 들어, 코로나바이러스 항원을 암호화하는 천연-발생 또는 야생형 mRNA 서열)에 대해 75% 미만의 서열 동일성을 공유한다.
일부 구현예에서, 코돈 최적화된 서열은 천연-발생 또는 야생형 서열(예를 들어, 코로나바이러스 항원을 암호화하는 천연-발생 또는 야생형 mRNA 서열)에 대해 65% 내지 85%(예를 들어, 약 67% 내지 약 85% 또는 약 67% 내지 약 80%) 서열 동일성을 공유한다. 일부 구현예에서, 코돈 최적화된 서열은 천연-발생 또는 야생형 서열(예를 들어, 코로나바이러스 항원을 암호화하는 천연-발생 또는 야생형 mRNA 서열)에 대해 65% 내지 75% 또는 약 80% 서열 동일성을 공유한다.
일부 구현예에서, 코돈-최적화된 서열은 비-코돈-최적화된 서열에 의해 암호화되는 코로나바이러스 항원만큼 면역원성인 항원을 암호화하거나, 보다 면역원성(예를 들어, 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 100%, 또는 적어도 200% 이상)인 항원을 암호화한다.
포유동물 숙주 세포 내로 형질감염될 때, 변형된 mRNA는 12 내지 18시간 또는 18시간 초과, 예를 들어, 24, 36, 48, 60, 72, 또는 72시간 초과의 안정성을 갖고, 이는 포유동물 숙주 세포에 의해 발현될 수 있다.
일부 구현예에서, 코돈 최적화된 RNA는 G/C의 수준이 향상된 것일 수 있다. 핵산 분자(예를 들어, mRNA)의 G/C-함량은 RNA의 안정성에 영향을 미칠 수 있다. 증가된 양의 구아닌(G) 및/또는 시토신(C) 잔기를 갖는 RNA는 다량의 아데닌(A) 및 티민(T) 또는 우라실(U) 뉴클레오티드를 함유하는 mRNA 보다 기능적으로 더 안정할 수 있다. 예로서, WO02/098443호는 번역된 영역에서 서열 변형에 의해 안정화된 mRNA를 함유하는 약학적 조성물을 개시한다. 유전자 코드의 축퇴성으로 인해, 변형은 기존 코돈을 생성된 아미노산을 변경하지 않으면서 더 큰 RNA 안정성을 촉진하는 코돈으로 치환함으로써 작동한다. 접근법은 RNA의 암호화 영역으로 제한된다.
화학적으로 비변형된 뉴클레오티드
일부 구현예에서, mRNA는 화학적으로 변형되지 않으며 아데노신, 구아노신, 시토신 및 우리딘으로 구성된 표준 리보뉴클레오티드를 포함한다. 일부 구현예에서, 본 개시의 뉴클레오티드 및 뉴클레오시드는 전사된 RNA(예를 들어, A, G, C, 또는 U)에 존재하는 것과 같은 표준 뉴클레오시드 잔기를 포함한다. 일부 구현예에서, 본 개시의 뉴클레오티드 및 뉴클레오시드는 DNA(예를 들어, dA, dG, dC, 또는 dT)에 존재하는 것과 같은 표준 데옥시리보뉴클레오시드를 포함한다.
화학적 변형
본 개시의 조성물은 일부 구현예에서, 코로나바이러스 항원을 암호화하는 오픈 리딩 프레임을 갖는 mRNA를 포함하며, 상기 핵산은 당업계에 공지된 바와 같이 표준(비변형됨) 또는 변형될 수 있는 뉴클레오티드 및/또는 뉴클레오시드를 포함한다. 일부 구현예에서, 본 개시의 뉴클레오티드 및 뉴클레오시드는 변형된 뉴클레오티드 또는 뉴클레오시드를 포함한다. 이러한 변형된 뉴클레오티드 및 뉴클레오시드는 천연-발생 변형된 뉴클레오티드 및 뉴클레오시드 또는 비-천연 발생 변형된 뉴클레오티드 및 뉴클레오시드일 수 있다. 이러한 변형은 당업계에서 인식되는 바와 같이 뉴클레오티드 및/또는 뉴클레오시드의 당, 백본, 또는 핵염기 부분에서의 변형을 포함할 수 있다.
일부 구현예에서, 본 개시의 천연-발생 변형된 뉴클레오티드 또는 뉴클레오티드는 당업계에 일반적으로 공지되거나, 인식된 바와 같은 것이다. 이러한 천연 발생 변형된 뉴클레오티드 및 뉴클레오티드의 비제한적인 예는 특히 광범위하게 인식된 MODOMICS 데이터베이스에서 찾을 수 있다.
일부 구현예에서, 본 개시의 비-천연 발생 변형된 뉴클레오티드 또는 뉴클레오시드는 당업계에 일반적으로 공지되거나, 인식된 바와 같은 것이다. 이러한 비-천연 발생 변형된 뉴클레오티드 및 뉴클레오시드의 비제한적인 예는 특히, 공개된 미국 출원 번호 PCT/US2012/058519호; PCT/US2013/075177호; PCT/US2014/058897호; PCT/US2014/058891호; PCT/US2014/070413호; PCT/US2015/36773호; PCT/US2015/36759호; PCT/US2015/36771호; 또는 PCT/IB2017/051367호에서 찾을 수 있으며, 이들 모두는 본원에 참조로 포함된다.
따라서, 본 개시의 핵산(예를 들어, DNA 핵산 및 RNA 핵산, 예컨대 mRNA 핵산)은 표준 뉴클레오티드 및 뉴클레오시드, 천연-발생 뉴클레오티드 및 뉴클레오시드, 비-천연-발생 뉴클레오티드 및 뉴클레오시드, 또는 이의 임의의 조합을 포함할 수 있다.
본 개시의 핵산(예를 들어, DNA 핵산 및 RNA 핵산, 예컨대 mRNA 핵산)은, 일부 구현예에서, 다양한 (하나 초과의) 상이한 유형의 표준 및/또는 변형된 뉴클레오티드 및 뉴클레오시드를 포함한다. 일부 구현예에서, 핵산의 특정 영역은 1개, 2개 이상의 (선택적으로 상이한) 유형의 표준 및/또는 변형된 뉴클레오티드 및 뉴클레오시드를 함유한다.
일부 구현예에서, 세포 또는 유기체에 도입된 변형된 RNA 핵산(예를 들어, 변형된 mRNA 핵산)은 표준 뉴클레오티드 및 뉴클레오시드를 포함하는 비변형된 핵산에 비해 각각 세포 또는 유기체에서 감소된 분해를 나타낸다.
일부 구현예에서, 세포 또는 유기체에 도입된 변형된 RNA 핵산(예를 들어, 변형된 mRNA 핵산)은 표준 뉴클레오티드 및 뉴클레오시드를 포함하는 비변형된 핵산에 비해 각각 세포 또는 유기체에서 감소된 면역원성(예를 들어, 감소된 선천적 반응)을 나타낼 수 있다.
핵산(예를 들어, RNA 핵산, 예컨대 mRNA 핵산)은, 일부 구현예에서, 원하는 기능 또는 특성을 달성하기 위해 핵산의 합성 동안 또는 합성 후 도입되는 비-천연 변형된 뉴클레오티드를 포함한다. 변형은 뉴클레오티드간 연결, 퓨린 또는 피리미딘 염기, 또는 당에 존재할 수 있다. 변형은 화학적 합성 또는 사슬의 말단 또는 사슬의 다른 곳에서 폴리머라제 효소를 사용하여 도입될 수 있다. 핵산의 임의의 영역은 화학적으로 변형될 수 있다.
본 개시는 핵산(예를 들어, RNA 핵산, 예컨대 mRNA 핵산)의 변형된 뉴클레오시드 및 뉴클레오티드를 제공한다. "뉴클레오시드"는 유기 염기(예를 들어, 퓨린 또는 피리미딘) 또는 이의 유도체(본원에서 "핵염기"로도 지칭됨)와 조합하여 당 분자(예를 들어, 펜토스 또는 리보스) 또는 이의 유도체를 함유하는 화합물을 지칭한다. "뉴클레오티드"는 포스페이트 기를 포함하는 뉴클레오시드를 지칭한다. 변형된 뉴클레오티드는 하나 이상의 변형된 또는 비-천연 뉴클레오시드를 포함하기 위해, 예를 들어, 화학적으로, 효소적으로, 또는 재조합적으로와 같은 임의의 유용한 방법에 의해 합성될 수 있다. 핵산은 연결된 뉴클레오시드의 영역 또는 영역들을 포함할 수 있다. 이러한 영역은 가변적인 백본 연결을 가질 수 있다. 연결은 표준 포스포디에스테르 연결일 수 있으며, 이 경우 핵산은 뉴클레오티드의 영역을 포함할 것이다.
변형된 뉴클레오티드 염기 쌍은 표준 아데노신-티민, 아데노신-우라실, 또는 구아노신-시토신 염기 쌍, 뿐만 아니라 비-표준 또는 변형된 염기를 포함하는 뉴클레오티드 및/또는 변형된 뉴클레오티드 사이에 형성된 염기 쌍을 포함하며, 여기서 수소 결합 공여체 및 수소 결합 수용체의 배열은 예를 들어 적어도 하나의 화학적 변형을 갖는 핵산에서와 같이 비-표준 염기 및 표준 염기 사이 또는 2개의 상보적 비-표준 염기 구조 사이의 수소 결합을 허용한다. 이러한 비-표준 염기 쌍의 하나의 예는 변형된 뉴클레오티드 이노신 및 아데닌, 시토신 또는 우라실 사이의 염기 쌍이다. 염기/당 또는 링커의 임의의 조합은 본 개시의 핵산으로 혼입될 수 있다.
일부 구현예에서, 핵산(예를 들어, RNA 핵산, 예컨대 mRNA 핵산)에서 변형된 핵염기는 1-메틸-슈도우리딘(m1Ψ), 1-에틸-슈도우리딘(e1Ψ), 5-메톡시-우리딘(mo5U), 5-메틸-시티딘(m5C), 및/또는 슈도우리딘(Ψ)을 포함한다. 일부 구현예에서, 핵산(예를 들어, RNA 핵산, 예컨대 mRNA 핵산)에서 변형된 핵염기는 5-메톡시메틸 우리딘, 5-메틸티오 우리딘, 1-메톡시메틸 슈도우리딘, 5-메틸 시티딘, 및/또는 5-메톡시 시티딘을 포함한다. 일부 구현예에서, 폴리리보뉴클레오티드는 화학적 변형을 포함하나 이에 제한되지 않는, 임의의 전술한 변형된 핵염기 중 적어도 2개(예를 들어, 2개, 3개, 4개 이상)의 조합을 포함한다.
일부 구현예에서, 본 개시의 mRNA는 핵산의 하나 이상 또는 모든 우리딘 위치에서 1-메틸-슈도우리딘(m1Ψ) 치환을 포함한다.
일부 구현예에서, 본 개시의 mRNA는 핵산의 하나 이상 또는 모든 우리딘 위치에서 1-메틸-슈도우리딘(m1Ψ) 치환 및 핵산의 하나 이상 또는 모든 시티딘 위치에서 5-메틸 시티딘 치환을 포함한다.
일부 구현예에서, 본 개시의 mRNA는 핵산의 하나 이상 또는 모든 우리딘 위치에서 슈도우리딘(Ψ) 치환을 포함한다.
일부 구현예에서, 본 개시의 mRNA는 핵산의 하나 이상 또는 모든 우리딘 위치에서 슈도우리딘(Ψ) 치환 및 핵산의 하나 이상 또는 모든 시티딘 위치에서 5-메틸 시티딘 치환을 포함한다.
일부 구현예에서, 본 개시의 mRNA는 핵산의 하나 이상 또는 모든 우리딘 위치에서 우리딘을 포함한다.
일부 구현예에서, mRNA는 특정 변형에 대해 균일하게 변형(예를 들어, 완전히 변형, 전체 서열에 걸쳐 변형)된다. 예를 들어, 핵산은 1-메틸-슈도우리딘으로 균일하게 변형될 수 있으며, 이는 mRNA 서열에서 모든 우리딘 잔기가 1-메틸-슈도우리딘으로 대체됨을 의미한다. 유사하게는, 핵산은 상기 제시된 것들과 같은 변형된 잔기로 대체함으로써 서열에 존재하는 임의의 유형의 뉴클레오시드 잔기에 대해 균일하게 변형될 수 있다.
본 개시의 핵산은 분자의 전체 길이에 따라 부분적으로 또는 완전히 변형될 수 있다. 예를 들어, 하나 이상 또는 모든 또는 주어진 유형의 뉴클레오티드(예를 들어, 퓨린 또는 피리미딘, 또는 A, G, U, C 중 임의의 하나 이상 또는 모두)는 개시의 핵산, 또는 이의 미리 결정된 서열 영역(예를 들어, 폴리(A) 꼬리를 포함하거나 또는 제외한 mRNA)에서 균일하게 변형될 수 있다. 일부 구현예에서, 본 개시의 핵산 (또는 이의 서열 영역)에서 모든 뉴클레오티드 X는 변형된 뉴클레오티드이며, 상기 X는 뉴클레오티드 A, G, U, C 중 임의의 하나, 또는 조합 A+G, A+U, A+C, G+U, G+C, U+C, A+G+U, A+G+C, G+U+C 또는 A+G+C 중 임의의 하나일 수 있다.
핵산은 약 1% 내지 약 100%의 변형된 뉴클레오티드(전체 뉴클레오티드 함량과 관련하여, 또는 하나 이상의 유형의 뉴클레오티드, 즉, A, G, U, 또는 C 중 임의의 하나 이상과 관련하여) 또는 임의의 중간 백분율(예를 들어, 1% 내지 20%, 1% 내지 25%, 1% 내지 50%, 1% 내지 60%, 1% 내지 70%, 1% 내지 80%, 1% 내지 90%, 1% 내지 95%, 10% 내지 20%, 10% 내지 25%, 10% 내지 50%, 10% 내지 60%, 10% 내지 70%, 10% 내지 80%, 10% 내지 90%, 10% 내지 95%, 10% 내지 100%, 20% 내지 25%, 20% 내지 50%, 20% 내지 60%, 20% 내지 70%, 20% 내지 80%, 20% 내지 90%, 20% 내지 95%, 20% 내지 100%, 50% 내지 60%, 50% 내지 70%, 50% 내지 80%, 50% 내지 90%, 50% 내지 95%, 50% 내지 100%, 70% 내지 80%, 70% 내지 90%, 70% 내지 95%, 70% 내지 100%, 80% 내지 90%, 80% 내지 95%, 80% 내지 100%, 90% 내지 95%, 90% 내지 100%, 및 95% 내지 100%)을 함유할 수 있다. 임의의 나머지 백분율은 비변형된 A, G, U, 또는 C의 존재에 의해 고려되는 것으로 이해될 것이다.
mRNA는 최소 1% 및 최대 100%의 변형된 뉴클레오티드, 또는 적어도 5% 변형된 뉴클레오티드, 적어도 10% 변형된 뉴클레오티드, 적어도 25% 변형된 뉴클레오티드, 적어도 50% 변형된 뉴클레오티드, 적어도 80% 변형된 뉴클레오티드, 또는 적어도 90% 변형된 뉴클레오티드와 같은 임의의 중간 백분율을 함유할 수 있다. 예를 들어, 핵산은 변형된 우라실 또는 시토신과 같은 변형된 피리미딘을 함유할 수 있다. 일부 구현예에서, 핵산 내 우라실의 적어도 5%, 적어도 10%, 적어도 25%, 적어도 50%, 적어도 80%, 적어도 90% 또는 100%가 변형된 우라실(예를 들어, 5-치환된 우라실)로 대체된다. 변형된 우라실은 단일 고유 구조를 갖는 화합물로 대체될 수 있거나, 상이한 구조(예를 들어, 2개, 3개, 4개 이상의 고유 구조)를 갖는 복수의 화합물로 대체될 수 있다. 일부 구현예에서, 핵산 내 시토신의 적어도 5%, 적어도 10%, 적어도 25%, 적어도 50%, 적어도 80%, 적어도 90%, 또는 100%가 변형된 시토신(예를 들어, 5-치환된 시토신)으로 대체된다. 변형된 시토신은 단일 고유 구조를 갖는 화합물로 대체될 수 있거나, 상이한 구조(예를 들어, 2개, 3개, 4개 이상의 고유 구조)를 갖는 복수의 화합물로 대체될 수 있다.
비번역 영역(UTR)
본 개시의 mRNA는 비번역 영역으로서 작용하거나 기능하는 하나 이상의 영역 또는 부분을 포함할 수 있다. mRNA가 적어도 하나의 관심 항원을 암호화하도록 디자인된 경우, 핵산은 이러한 비번역 영역(UTR) 중 하나 이상을 포함할 수 있다. 핵산의 야생형 비번역 영역은 전사되나 번역되지는 않는다. mRNA에서, 5' UTR은 전사 시작 부위에서 시작하여 시작 코돈까지 계속되지만, 시작 코돈은 포함하지 않는다; 반면, 3' UTR은 정지 코돈 직후에 시작하여 전사 종결 신호까지 계속된다. 핵산 분자 및 번역의 안정성 측면에서 UTR에 의해 수행되는 조절 역할에 대한 증거 체제가 증가하고 있다. UTR의 조절 기능은 무엇보다도 분자의 안정성을 향상시키기 위해, 본 개시의 폴리뉴클레오티드에 혼입될 수 있다. 특정 기능은 바람직하지 않은 기관 부위로 잘못 지시되는 경우 전사체의 제어된 하향-조절을 보장하기 위해 혼입될 수도 있다. 다양한 5' UTR 및 3' UTR 서열은 공지되어 있고 당업계에서 이용가능하다.
5' UTR은 시작 코돈 (리보솜에 의해 번역된 mRNA 전사체의 제1 코돈)으로부터 바로 업스트림 (5')인 mRNA의 영역이다. 5' UTR은 단백질을 암호화하지 않는다(이는 비-암호화임). 천연 5' UTR은 번역 개시에 역할을 하는 기능을 갖는다. 이들은 리보솜이 많은 유전자의 번역을 개시하는 과정에 수반되는 것으로 통상적으로 알려진 Kozak 서열과 같은 특징을 가지고 있다. 코작 서열은 공통 CCR(A/G)CCAUGG (서열번호 128)를 가지며, 여기서 R은 시작 코돈(AUG)의 상류에 있는 퓨린(아데닌 또는 구아닌) 3개 염기이며, 그 뒤에 또 다른 'G'가 있다. 5' UTR은 또한 신장 인자 결합에 관여하는 2차 구조를 형성하는 것으로 알려져 있다.
본 개시의 일부 구현예에서, 5' UTR은 이종 UTR, 즉, 상이한 ORF와 연관된 천연에서 발견되는 UTR이다. 또 다른 구현예에서, 5' UTR은 합성 UTR, 즉 천연에서 발생하지 않는다. 합성 UTR은 이들의 특성을 개선하기 위해, 예를 들어, 유전자 발현을 증가시키기 위해 돌연변이된 UTR 뿐만 아니라 완전히 합성된 UTR을 포함한다. 예시적인 5' UTR은 제노프스(Xenopus) 또는 인간 유래 a-글로빈 또는 b-글로빈(8278063; 9012219), 인간 시토크롬 b-245 a 폴리펩티드, 및 하이드록시스테로이드(17b) 탈수소효소, 및 담배 식각 바이러스(US8278063호, 9012219)를 포함한다. CMV 극초기 1(IE1) 유전자(US20140206753호, WO2013/185069호), 서열 GGGAUCCUACC(서열번호 129)(WO2014144196호)도 사용될 수 있다. 다른 구현예에서, TOP 유전자의 5' UTR은 5' TOP 모티프(올리고피리미딘 트랙)가 결여된 TOP 유전자의 5' UTR(예를 들어, WO/2015101414호, WO2015101415호, WO/2015/062738호, WO2015024667호, WO2015024667호이고; 리보솜 단백질 Large 32(L32) 유전자로부터 유래된 5' UTR 요소(WO/2015101414호, WO2015101415호, WO/2015/062738호), 하이드록시스테로이드(17-β) 탈수소효소 4 유전자(HSD17B4)의 5' UTR로부터 유래된 5' UTR 요소(WO2015024667호), 또는 ATP5A1의 5' UTR로부터 유래된 5' UTR 요소(WO2015024667호)가 사용될 수 있다. 일부 구현예에서, 내부 리보솜 진입 부위(IRES)가 5' UTR 대신 사용된다.
일부 구현예에서, 본 개시의 5' UTR은 서열 131 및 서열번호 2로부터 선택되는 서열을 포함한다.
3' UTR은 정지 코돈 (번역의 종결을 신호하는 mRNA 전사체의 코돈)으로부터 바로 다운스트림(3')인 mRNA의 영역이다. 3' UTR은 단백질을 암호화하지 않는다(이는 비-암호화임). 천연 또는 야생형 3' UTR은 그들에 함입된 아데노신 및 우리딘의 스트레치(stretch)를 갖는 것으로 알려져 있다. 이러한 AU 풍부한 특징은 높은 전환율을 갖는 유전자에서 특히 보편적이다. 이들의 서열 특징 및 기능적 특성에 기반하여, AU 풍부 요소(ARE)는 3가지 부류로 분리될 수 있으며(Chen 등, 1995): 클래스 I ARE는 U-풍부 영역 내에서 AUUUA 모티프의 몇몇 분산된 복제물을 함유한다. C-Myc 및 MyoD는 클래스 I ARE를 함유한다. 클래스 II ARE는 2개 이상의 중복 UUAUUUA(U/A)(U/A)(서열번호 130) 노나머를 갖는다. 이 유형의 ARE를 함유하는 분자는 GM-CSF 및 TNF-a를 포함한다. 클래스 III ARES는 덜 제대로 정의된다. 이들 U 풍부 영역은 AUUUA 모티프를 함유하지 않는다. c-Jun 및 마이오게닌은 이 부류의 2가지 잘 연구된 예이다. ARE에 대한 대부분의 단백질 결합은 메신저를 불안정하게 하는 것으로 알려져 있는 반면, ELAV 패밀리의 구성원, 가장 현저하게는 HuR은 mRNA의 안정성을 증가시키는 것으로 보고되었다. HuR은 모두 3가지 부류의 ARE에 결합한다. 핵산 분자의 3' UTR에 HuR 특이적 결합 부위를 조작하는 것은 HuR 결합을 유도할 것이고, 따라서 생체내 메신저의 안정화를 유도할 것이다.
3' UTR AU 풍부 요소(ARE)의 도입, 제거 또는 변형은 본 개시의 핵산(예를 들어, RNA)의 안정성을 조절하기 위해 사용될 수 있다. 특정 핵산을 조작할 때, 본 개시의 핵산을 덜 안정하게 만들기 위해 ARE의 하나 이상의 복제물이 도입될 수 있고, 이에 의해 번역을 축소시키며 생성된 단백질의 생산을 감소시킨다. 마찬가지로, ARE는 세포내 안정성을 증가시키기 위해 동정되고 제거되거나 또는 돌연변이될 수 있고, 따라서, 생성된 단백질의 번역 및 생산을 증가시킨다. 형질감염 실험은 본 개시의 핵산을 이용하여, 적절한 세포주에서 수행될 수 있고, 단백질 생산은 형질감염 후 다양한 시점에 분석될 수 있다. 예를 들어, 세포는 상이한 ARE-조작 분자로 형질감염될 수 있고, 적절한 단백질에 대해 ELISA 키트를 이용하여 형질감염 후 6시간, 12시간, 24시간, 48시간 및 7일에 생성된 단백질을 분석한다.
3' UTR은 이종 또는 합성일 수 있다. 3' UTR과 관련하여, 제노푸스 β-글로빈 UTR 및 인간 β-글로빈 UTR을 포함하는, 글로빈 UTR이 당업계에 공지되어 있다(8278063, 9012219, US20110086907호). 2개의 순차적인 인간 β-글로빈 3' UTR을 머리에서 꼬리로 클로닝함으로써 일부 세포 유형에서 안정성이 향상된 변형된 β-글로빈 작제물이 개발되었으며, 당업계에 잘 알려져 있다(US2012/0195936호, WO2014/071963호). 또한, a2-글로빈, a1-글로빈, UTR 및 이들의 돌연변이체도 당업계에 공지되어 있다(WO2015101415호, WO2015024667호). 비특허 문헌의 mRNA 작제물에 기술된 다른 3' UTR에는 CYBA(Ferizi 등, 2015) 및 알부민(Thess 등, 2015)이 포함된다. 다른 예시적인 3' UTR에는 (야생형 또는 변형된) 소 또는 인간 성장 호르몬(WO2013/185069호, US20140206753호, WO2014152774호), 토끼 β 글로빈 및 B형 간염 바이러스(HBV)의 것이 포함되고, α-글로빈 3' UTR 및 바이러스 VEEV 3' UTR 서열도 당업계에 공지되어 있다. 일부 구현예에서, 서열 UUUGAAUU(WO2014144196호)가 사용된다. 일부 구현예에서, 인간 및 마우스 리보솜 단백질의 3' UTR이 사용된다. 다른 예에는 rps9 3' UTR (WO2015101414호), FIG4 (WO2015101415호), 및 인간 알부민 7(WO2015101415호)이 포함된다.
일부 구현예에서, 본 개시의 3' UTR은 서열 132 및 서열번호 4로부터 선택되는 서열을 포함한다.
당업자는 이종 또는 합성인 5' UTR이 임의의 원하는 3' UTR 서열과 함께 사용될 수 있음을 이해할 것이다. 예를 들어, 이종 5' UTR은 이종 3" UTR이 있는 합성 3' UTR과 함께 사용될 수 있다.
비-UTR 서열은 또한 핵산 내의 영역 또는 서브영역으로 사용될 수 있다. 예를 들어, 인트론 또는 인트론 서열의 일부는 본 개시의 핵산의 영역에 혼입될 수 있다. 인트론 서열의 혼입은 핵산 수준 뿐만 아니라 단백질 생산을 증가시킬 수 있다.
특징의 조합은 측부 영역(flanking region)에 포함될 수 있고, 다른 특징 내에 포함될 수 있다. 예를 들어, ORF는 강한 코작(Kozak) 번역 개시 신호를 포함할 수 있는 5' UTR 및/또는 폴리-A 꼬리의 주형 첨가를 위한 올리고(dT) 서열을 포함할 수 있는 3' UTR에 의해 플랭크될 수 있다. 5' UTR은 본원에 그 전체가 참조로 포함된 미국 출원 공개 번호 제20100293625호 및 PCT/US2014/069155호에 기재된 5' UTR과 같은 동일하고/하거나 상이한 유전자로부터의 제1 폴리뉴클레오티드 단편 및 제2 폴리뉴클레오티드 단편을 포함할 수 있다.
임의의 유전자로부터의 임의의 UTR이 핵산 영역에 포함될 수 있음을 이해해야 한다. 더욱이, 임의의 알려진 유전자의 다중 야생형 UTR이 활용될 수 있다. 야생형 영역의 변이체가 아닌 인공 UTR을 제공하는 것도 본 개시의 범위 내에 있다. 이러한 UTR 또는 이의 일부는 이들이 선택된 전사체와 동일한 방향으로 배치될 수 있거나 방향 또는 위치가 변경될 수 있다. 따라서 5' 또는 3' UTR은 하나 이상의 다른 5' UTR 또는 3' UTR로 반전되고, 단축되고, 연장되고, 이루어질 수 있다. 본원에 사용된 바와 같이, UTR 서열과 관련하여 용어 "변경된"은 UTR이 참조 서열과 관련하여 어떤 방식으로든 변화되었음을 의미한다. 예를 들어, 3' UTR 또는 5' UTR은 상기 교시된 방향 또는 위치의 변화에 의해 야생형 또는 천연 UTR에 비해 변경될 수 있거나, 추가 뉴클레오티드의 포함, 뉴클레오티드의 결실, 뉴클레오티드의 교체 또는 전위에 의해 변경될 수 있다. "변경된" UTR (3'이든 5'이든)을 생성하는 이러한 변화들 중 임의의 것은 변이체 UTR을 포함한다.
일부 구현예에서, 5' UTR 또는 3' UTR과 같은 이중, 삼중 또는 사중 UTR이 사용될 수 있다. 본원에 사용된 바와 같이, "이중" UTR은 동일한 UTR의 2개의 복제물이 연속하여 또는 실질적으로 연속하여 암호화된 것이다. 예를 들어, 이중 베타-글로빈 3' UTR은 미국 특허 공개 제20100129877호에 기재된 바와 같이 사용될 수 있으며, 이 내용은 그 전체가 본원에 참조로 포함된다.
또한 패턴화된 UTR에 대한 본 개시의 범주 내에 있다. 본원에 사용된 바와 같이, "패턴화된 UTR"은 ABABAB 또는 AABBAABBAABB 또는 ABCABCABC 또는 1회, 2회, 또는 3회 이상 반복되는 이의 변이체와 같은 반복 또는 교대 패턴을 반영하는 UTR이다. 이러한 패턴에서, 각각의 문자, A, B 또는 C는 뉴클레오티드 수준에서 상이한 UTR을 나타낸다.
일부 구현예에서, 측부 영역은 단백질이 공통 기능, 구조, 특징 또는 특성을 공유하는 전사체 패밀리로부터 선택된다. 예를 들어, 관심 폴리펩티드는 발달 동안 특정 세포, 조직에서 또는 일부 시간에 발현되는 단백질 패밀리에 속할 수 있다. 임의의 이들 유전자로부터의 UTR은 동일하거나 상이한 단백질 패밀리의 임의의 다른 UTR로 교체되어 새로운 폴리뉴클레오티드를 생성할 수 있다. 본원에 사용된 바와 같이, "단백질 패밀리"는 적어도 하나의 기능, 구조, 특징, 국소화, 기원 또는 발현 패턴을 공유하는 2개 이상의 관심 폴리펩티드의 그룹을 지칭하기 위해 가장 넓은 의미로 사용된다.
비번역 영역은 또한 번역 인핸서 요소(TEE)를 포함할 수 있다. 비-제한적인 예로서, TEE는 본원에 그 전체가 참조로 포함된 미국 출원 번호 제20090226470호에 기재된 것들, 및 당업계에 공지된 것들을 포함할 수 있다.
RNA의 시험관내 전사
본원에 기재된 폴리뉴클레오티드를 암호화하는 cDNA는 시험관내 전사(IVT) 시스템을 사용하여 전사될 수 있다. RNA의 시험관내 전사는 당업계에 공지되어 있고, 국제 공개 WO 2014/152027호에 기재되어 있으며, 이는 그 전체가 본원에 참조로 포함된다. 일부 구현예에서, 본 개시의 RNA는 WO 2018/053209호 및 WO 2019/036682호에 기재된 방법 중 임의의 하나 이상에 따라 제조되며, 이들 각각은 본원에 참조로 포함된다.
일부 구현예에서, RNA 전사체는 RNA 전사체를 생성하기 위해 시험관내 전사 반응에서 비-증폭된, 선형화된 DNA 주형을 사용하여 생성된다. 일부 구현예에서, 주형 DNA는 단리된 DNA이다. 일부 구현예에서, 주형 DNA는 cDNA이다. 일부 구현예에서, cDNA는 mRNA, 이에 제한되지는 않으나, 예를 들어, 코로나바이러스 mRNA의 역전사에 의해 형성된다. 일부 구현예에서, 세포, 예를 들어, 박테리아 세포, 예를 들어, E. coli, 예를 들어, DH-1 세포는 플라스미드 DNA 주형으로 형질감염된다. 일부 구현예에서, 형질감염된 세포는 플라스미드 DNA를 복제하기 위해 배양되며, 이는 이후 단리되고 정제된다. 일부 구현예에서, DNA 주형은 관심 유전자의 5'에 위치하고 작동가능하게 연결된 RNA 폴리머라제 프로모터, 예를 들어, T7 프로모터를 포함한다.
일부 구현예에서, 시험관내 전사 주형은 5' 비번역(UTR) 영역을 암호화하고, 오픈 리딩 프레임을 함유하고, 3' UTR 및 폴리A 꼬리를 암호화한다. 시험관내 전사 주형의 특정 핵산 서열 조성 및 길이는 주형에 의해 암호화된 mRNA에 의존할 것이다.
"5' 비번역 영역"(UTR)은 폴리펩티드를 암호화하지 않는 시작 코돈 (즉, 리보솜에 의해 번역된 mRNA 전사체의 제1 코돈)으로부터 바로 업스트림 (즉, 5')인 mRNA의 영역을 지칭한다. RNA 전사체가 생성되는 경우, 5' UTR은 프로모터 서열을 포함할 수 있다. 이러한 프로모터 서열은 당업계에 공지되어 있다. 이러한 프로모터 서열은 본 개시의 백신에 존재하지 않을 것임을 이해해야 한다.
"3' 비번역 영역"(UTR)은 폴리펩티드를 암호화하지 않는 정지 코돈 (즉, 번역의 종결을 신호하는 mRNA 전사체의 코돈)으로부터 바로 다운스트림 (즉, 3')인 mRNA의 영역을 지칭한다.
"오픈 리딩 프레임"은 시작 코돈 (예를 들어, 메티오닌(ATG))으로 시작하여, 정지 코돈 (예를 들어, TAA, TAG 또는 TGA)으로 종료하는 DNA의 연속적인 스트레치이며 폴리펩티드를 암호화한다.
"폴리(A) 꼬리"는 다중, 연속적인 아데노신 모노포스페이트를 함유하는 3' UTR로부터, 다운스트림, 예를 들어, 바로 다운스트림 (즉, 3')인, mRNA의 영역이다. 폴리(A) 꼬리는 10 내지 300 아데노신 모노포스페이트를 함유할 수 있다. 예를 들어, 폴리(A) 꼬리는 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, 250, 260, 270, 280, 290, 또는 300 아데노신 모노포스페이트를 함유할 수 있다. 일부 구현예에서, 폴리(A) 꼬리는 50 내지 250 아데노신 모노포스페이트를 함유한다. 관련된 생물학적 설정에서 (예를 들어, 세포에서, 생체내에서), 폴리(A) 꼬리는, 예를 들어, 세포질에서 효소적 분해로부터 mRNA를 보호하는 기능을 하고, 전사 종결, 및/또는 핵으로부터 mRNA의 유출, 및 번역을 돕는다.
일부 구현예에서, 핵산은 200 내지 3,000개의 뉴클레오티드를 포함한다. 예를 들어, 핵산은 200 내지 500, 200 내지 1000, 200 내지 1500, 200 내지 3000, 500 내지 1000, 500 내지 1500, 500 내지 2000, 500 내지 3000, 1000 내지 1500, 1000 내지 2000, 1000 내지 3000, 1500 내지 3000, 또는 2000 내지 3000개의 뉴클레오티드)를 포함할 수 있다.
시험관내 전사 시스템은 전형적으로 전사 완충액, 뉴클레오티드 트리포스페이트(NTP), RNase 억제제 및 폴리머라제를 포함한다.
NTP는 사내에서 제조될 수 있거나, 공급자로부터 선택될 수 있거나, 본원에 기술된 바와 같이 합성될 수 있다. NTP는 천연 및 비천연 (변형된) NTP를 포함하는 본원에 기재된 것들로부터 선택될 수 있으나, 이에 제한되지는 않는다.
임의의 수의 RNA 폴리머라제 또는 변이체가 본 개시의 방법에서 사용될 수 있다. 상기 폴리머라제는 이에 제한되지는 않으나, 파지 RNA 폴리머라제, 예를 들어, T7 RNA 폴리머라제, T3 RNA 폴리머라제, SP6 RNA 폴리머라제, 및/또는 변이 폴리머라제, 예컨대, 이에 제한되지는 않으나, 화학적으로 변형된 핵산 및/또는 뉴클레오티드를 포함하는, 변형된 핵산 및/또는 변형된 뉴클레오티드를 혼입할 수 있는 폴리머라제로부터 선택될 수 있다. 일부 구현예는 DNase의 사용을 배제한다.
일부 구현예에서, RNA 전사체는 효소적 캡핑을 통해 캡핑된다. 일부 구현예에서, RNA는 5' 말단 캡, 예를 들어 7mG(5')ppp(5')NlmpNp를 포함한다.
화학적 합성
고체상 화학적 합성. 본 개시의 핵산은 고체상 기술을 사용하여 전체적으로 또는 부분적으로 제조될 수 있다. 핵산의 고체상 화학적 합성은 분자가 고체 지지체 상에 고정화되고, 반응 용액에서 단계별로 합성되는 자동화된 방법이다. 고체상 합성은 핵산 서열의 화학적 변형의 부위-특이적 도입에 유용하다.
액체상 화학적 합성. 단량체 빌딩 블록의 순차적 첨가에 의한 본 개시의 핵산 합성은 액체상에서 수행될 수 있다.
합성 방법의 조합. 상기 논의된 합성 방법은 이들 각각의 장점 및 한계를 갖는다. 이러한 방법을 조합하여 한계를 극복하려는 시도가 이루어지고 있다. 이러한 방법의 조합은 본 개시의 범위 내에 있다. 효소적 결찰과 조합하여 고체상 또는 액체상 화학적 합성의 사용은 화학적 합성 단독으로 수득할 수 없는 긴 사슬 핵산을 생성하는 효율적인 방법을 제공한다.
핵산 영역 또는 서브 영역의 결찰
리가아제에 의해 핵산을 조립하는 것도 사용될 수 있다. DNA 또는 RNA 리가아제는 포스포디에스테르 결합의 형성을 통해 폴리뉴클레오티드 사슬의 5' 및 3' 말단의 분자간 결찰을 촉진한다. 키메라 폴리뉴클레오티드 및/또는 원형 핵산과 같은 핵산은 하나 이상의 영역 또는 서브 영역의 결찰에 의해 제조될 수 있다. DNA 단편은 리가아제 촉매화 반응에 의해 결합되어 상이한 기능을 갖는 재조합 DNA를 생성할 수 있다. 하나는 5' 인산기가 있고, 다른 하나는 유리 3' 하이드록실기가 있는, 2개의 올리고데옥시뉴클레오티드는 DNA 리가아제의 기질 역할을 한다.
정제
본원에 기술된 핵산의 정제는 핵산 정화, 품질 보증 및 품질 관리를 포함할 수 있으나, 이에 제한되지 않는다. 정화는 이에 제한되지 않는, AGENCOURT® 비드(Beckman Coulter Genomics, Danvers, MA), 폴리-T 비드, LNATM 올리고-T 포획 프로브(EXIQON® Inc, Vedbaek, Denmark)와 같은 당업계에 공지된 방법 또는 이에 제한되지 않는, 강한 음이온 교환 HPLC, 약한 음이온 교환 HPLC, 역상 HPLC(RP-HPLC), 및 소수성 상호작용 HPLC(HIC-HPLC)와 같은 HPLC 기반 정제 방법에 의해 수행될 수 있다. "정제된 핵산"과 같은 핵산과 관련하여 사용될 때 용어 "정제된"은 적어도 하나의 오염물로부터 분리된 것을 지칭한다. "오염 물질"은 다른 부적합하거나, 불순물이 섞여있거나, 열등하게 만드는 임의의 물질이다. 따라서, 정제된 핵산(예를 들어, DNA 및 RNA)은 천연에서 발견되는 것과 다른 형태 또는 설정으로 존재하거나, 처리 또는 정제 방법을 적용하기 전에 존재했던 것과 다른 형태 또는 설정으로 존재한다.
품질 보증 및/또는 품질 관리 검사는 겔 전기영동, UV 흡광도 또는 분석용 HPLC와 같은 방법을 사용하여 수행할 수 있으나, 이에 제한되지 않는다.
일부 구현예에서, 핵산은 역전사 효소-PCR을 포함하나 이에 제한되지 않는 방법에 의해 시퀀싱될 수 있다.
정량화
일부 구현예에서, 본 개시의 핵산은 엑소좀에서 또는 하나 이상의 체액으로부터 유래된 경우에 정량화될 수 있다. 체액에는 말초 혈액, 혈청,혈장, 복수, 소변, 뇌척수액(CSF), 객담, 타액, 골수, 활액, 수액, 양수액, 귀지, 모유, 기관지 폐포 세척액, 정액, 전립선액, 쿠퍼액 또는 사정전 액(pre-ejaculatory fluid), 땀, 대변, 모발, 눈물, 낭종액, 흉막 및 복막액, 심낭액, 림프, 미즙, 유미(chyle), 담즙, 간질액, 월경, 고름, 피지, 구토, 질 분비물, 점막 분비물, 대변 물, 췌장액, 누강의 세척액, 기관지 폐 흡인물, 배반포 강 유체(blastocyl cavity fluid), 및 제대혈이 포함된다. 대안적으로, 엑소좀은 폐, 심장, 췌장, 위, 장, 방광, 신장, 난소, 정소, 피부, 결장, 유방, 전립선, 뇌, 식도, 간 및 태반으로 이루어진 군으로부터 선택되는 기관으로부터 회수될 수 있다.
분석은 구성 특이적 프로브, 세포측정법, qRT-PCR, 실시간 PCR, PCR, 유세포 분석법, 전기영동, 질량 분석법 또는 이들의 조합을 사용하여 수행될 수 있는 반면, 엑소좀은 효소 결합 면역흡착 분석(ELISA) 방법과 같은 면역조직화학적 방법을 사용하여 단리될 수 있다. 엑소좀은 또한 크기 배제 크로마토그래피, 밀도 구배 원심분리, 차등 원심분리, 나노막 한외여과, 면역흡착 포획, 친화성 정제, 미세유체 분리, 또는 이들의 조합에 의해 단리될 수 있다.
이러한 방법은 조사자가 남아 있거나 전달되는 핵산 수준을 실시간으로 모니터링할 수 있는 능력을 제공한다. 이는 본 개시의 핵산이 일부 구현예에서, 구조적 또는 화학적 변형으로 인해 내인성 형태와 상이하기 때문에 가능하다.
일부 구현예에서, 핵산은 이에 제한되지 않는, 자외선 가시 분광법(UV/Vis)과 같은 방법을 사용하여 정량화될 수 있다. UV/Vis 분광계의 비-제한적인 예는 NANODROP® 분광계(ThermoFisher, Waltham, MA)이다. 상기 정량화된 핵산은 핵산이 적절한 크기일 수 있는지 여부를 결정하기 위해 분석될 수 있으며, 핵산의 분해가 일어나지 않았음을 확인한다. 핵산의 분해는 이에 제한되지 않는, 아가로스 겔 전기영동과 같은 방법, 이에 제한되지 않는, 강한 음이온 교환 HPLC, 약한 음이온 교환 HPLC, 역상 HPLC(RP-HPLC), 및 소수성 상호작용 HPLC(HIC-HPLC), 액체 크로마토그래피-질량 분석법(LCMS), 모세관 전기영동(CE) 및 모세관 겔 전기영동(CGE)과 같은 HPLC 기반 정제 방법으로 확인할 수 있다.
지질 나노입자(LNP)
일부 구현예에서, 본 개시의 mRNA는 지질 나노입자(LNP)로 제형화된다. 지질 나노입자는 전형적으로 관심 핵산 카고(cargo)와 함께 이온화 가능한 양이온성 지질, 비-양이온성 지질, 스테롤 및 PEG 지질 성분을 포함한다. 본 개시의 지질 나노입자는 당업계에 일반적으로 공지된 성분, 조성물, 및 방법을 사용하여 생성될 수 있으며, 예를 들어 PCT/US2016/052352호; PCT/US2016/068300호; PCT/US2017/037551호; PCT/US2015/027400호; PCT/US2016/047406호; PCT/US2016000129호; PCT/US2016/014280호; PCT/US2016/014280호; PCT/US2017/038426호; PCT/US2014/027077호; PCT/US2014/055394호; PCT/US2016/52117호; PCT/US2012/069610호; PCT/US2017/027492호; PCT/US2016/059575호 및 PCT/US2016/069491호를 참조하고, 이들 모두는 그 전체가 본원에 참조로 포함된다.
본 개시의 백신은 전형적으로 지질 나노입자 내 제형화된다. 일부 구현예에서, 지질 나노입자는 적어도 하나의 이온화 가능한 양이온성 지질, 적어도 하나의 비-양이온성 지질, 적어도 하나의 스테롤, 및/또는 적어도 하나의 폴리에틸렌 글리콜(PEG)-변형된 지질을 포함한다.
일부 구현예에서, 지질 나노입자는 40-50 mol%, 선택적으로 45-50 mol%, 예를 들어, 45-46 mol%, 46-47 mol%, 47-48 mol%, 48-49 mol%, 또는 49-50 mol%, 예를 들어, 약 45 mol%, 45.5 mol%, 46 mol%, 46.5 mol%, 47 mol%, 47.5 mol%, 48 mol%, 48.5 mol%, 49 mol%, 또는 49.5 mol%의 이온화 가능한 지질을 포함한다.
일부 구현예에서, 지질 나노입자는 30-45 mol%, 선택적으로 35-40 mol%, 예를 들어, 30-31 mol%, 31-32 mol%, 32-33 mol%, 33-34 mol%, 35-35 mol%, 35-36 mol%, 36-37 mol%, 38-38 mol%, 38-39 mol%, 또는 39-40 mol%의 스테롤을 포함한다.
일부 구현예에서, 지질 나노입자는 5-15 mol%, 선택적으로 10-12 mol%, 예를 들어, 5-6 mol%, 6-7 mol%, 7-8 mol%, 8-9 mol%, 9-10 mol%, 10-11 mol%, 11-12 mol%, 12-13 mol%, 13-14 mol%, 또는 14-15 mol%의 헬퍼 지질을 포함한다.
일부 구현예에서, 지질 나노입자는 1-5%, 선택적으로 1-3 mol%, 예를 들어 1.5 내지 2.5 mol%, 1-2 mol%, 2-3 mol%, 3-4 mol%, 또는 4-5 mol%의 PEG 지질을 포함한다.
일부 구현예에서, 지질 나노입자는 20-60 mol%의 이온화 가능한 양이온성 지질을 포함한다. 예를 들어, 지질 나노입자는 20-50 mol%, 20-40 mol%, 20-30 mol%, 30-60 mol%, 30-50 mol%, 30-40 mol%, 40-60 mol%, 40-50 mol%, 또는 50-60 mol%의 이온화 가능한 양이온성 지질을 포함할 수 있다. 일부 구현예에서, 지질 나노입자는 20 mol%, 30 mol%, 40 mol%, 50 mol%, 또는 60 mol%의 이온화 가능한 양이온성 지질을 포함한다. 일부 구현예에서, 지질 나노입자는 35 mol%, 36 mol%, 37 mol%, 38 mol%, 39 mol%, 40 mol%, 41 mol%, 42 mol%, 43 mol%, 44 mol%, 45 mol%, 46 mol%, 47 mol%, 48 mol%, 49 mol%, 50 mol%, 51 mol%, 52 mol%, 53 mol%, 54 mol%, 또는 55 mol%의 이온화 가능한 양이온성 지질을 포함한다.
일부 구현예에서, 지질 나노입자는 5-25 mol%의 비-양이온성 지질을 포함한다. 예를 들어, 지질 나노입자는 5-20 mol%, 5-15 mol%, 5-10 mol%, 10-25 mol%, 10-20 mol%, 10-25 mol%, 15-25 mol%, 15-20 mol%, 또는 20-25 mol%의 비-양이온성 지질을 포함할 수 있다. 일부 구현예에서, 지질 나노입자는 5 mol%, 10 mol%, 15 mol%, 20 mol%, 또는 25 mol%의 비-양이온성 지질을 포함한다.
일부 구현예에서, 지질 나노입자는 25-55 mol%의 스테롤을 포함한다. 예를 들어, 지질 나노입자는 25-50 mol%, 25-45 mol%, 25-40 mol%, 25-35 mol%, 25-30 mol%, 30-55 mol%, 30-50 mol%, 30-45 mol%, 30-40 mol%, 30-35 mol%, 35-55 mol%, 35-50 mol%, 35-45 mol%, 35-40 mol%, 40-55 mol%, 40-50 mol%, 40-45 mol%, 45-55 mol%, 45-50 mol%, 또는 50-55 mol%의 스테롤을 포함할 수 있다. 일부 구현예에서, 지질 나노입자는 25 mol%, 30 mol%, 35 mol%, 40 mol%, 45 mol%, 50 mol%, 또는 55 mol%의 스테롤을 포함한다.
일부 구현예에서, 지질 나노입자는 0.5-15 mol%의 PEG-변형된 지질을 포함한다. 예를 들어, 지질 나노입자는 0.5-10 mol%, 0.5-5 mol%, 1-15 mol%, 1-10 mol%, 1-5 mol%, 2-15 mol%, 2-10 mol%, 2-5 mol%, 5-15 mol%, 5-10 mol%, 또는 10-15 mol%를 포함할 수 있다. 일부 구현예에서, 지질 나노입자는 0.5 mol%, 1 mol%, 2 mol%, 3 mol%, 4 mol%, 5 mol%, 6 mol%, 7 mol%, 8 mol%, 9 mol%, 10 mol%, 11 mol%, 12 mol%, 13 mol%, 14 mol%, 또는 15 mol%의 PEG-변형된 지질을 포함한다.
일부 구현예에서, 지질 나노입자는 20-60 mol%의 이온화 가능한 양이온성 지질, 5-25 mol%의 비-양이온성 지질, 25-55 mol%의 스테롤, 및 0.5-15 mol%의 PEG-변형된 지질을 포함한다.
일부 구현예에서, 본 개시의 이온화 가능한 양이온성 지질은 하기 화학식 (I)의 화합물 또는 이의 염 또는 이성질체를 포함한다:
식 중:
R1은 C5-30 알킬, C5-20 알케닐, -R*YR", -YR", 및 -R"M'R'로 이루어진 군으로부터 선택되고;
R2 및 R3은 H, C1-14 알킬, C2-14 알케닐, R*YR", -YR", 및 -R*OR"로 이루어진 군으로부터 독립적으로 선택되거나, 또는 R2 및 R3은 이들이 부착되는 원자와 함께 헤테로사이클 또는 카르보사이클을 형성하며;
R4는 C3-6 카르보사이클, -(CH2)nQ, -(CH2)nCHQR, -CHQR, -CQ(R)2, 및 비치환된 C1-6 알킬로 이루어진 군으로부터 선택되고, 이때 Q는 카르보사이클, 헤테로사이클, -OR, -O(CH2)nN(R)2, -C(O)OR, -OC(O)R, -CX3, -CX2H, -CXH2, -CN, -N(R)2, -C(O)N(R)2, -N(R)C(O)R, -N(R)S(O)2R, -N(R)C(O)N(R)2, -N(R)C(S)N(R)2, -N(R)R8,
-O(CH2)nOR, -N(R)C(=NR9)N(R)2, -N(R)C(=CHR9)N(R)2, -OC(O)N(R)2, -N(R)C(O)OR,
-N(OR)C(O)R, -N(OR)S(O)2R, -N(OR)C(O)OR, -N(OR)C(O)N(R)2, -N(OR)C(S)N(R)2,
-N(OR)C(=NR9)N(R)2, -N(OR)C(=CHR9)N(R)2, -C(=NR9)N(R)2, -C(=NR9)R, -C(O)N(R)OR, 및 -C(R)N(R)2C(O)OR로부터 선택되며, 각각의 n은 1, 2, 3, 4, 및 5로부터 독립적으로 선택되고;
각각의 R5는 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R6은 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
M 및 M'는 -C(O)O-, -OC(O)-, -C(O)N(R')-, -N(R')C(O)-, -C(O)-, -C(S)-, -C(S)S-, -SC(S)-, -CH(OH)-, -P(O)(OR')O-, -S(O)2-, -S-S-, 아릴기, 및 헤테로아릴기로부터 독립적으로 선택되고;
R7은 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 선택되고;
R8은 C3-6 카르보사이클 및 헤테로사이클로 이루어진 군으로부터 선택되고;
R9는 H, CN, NO2, C1-6 알킬, -OR, -S(O)2R, -S(O)2N(R)2, C2-6 알케닐, C3-6 카르보사이클 및 헤테로사이클로 이루어진 군으로부터 선택되고;
각각의 R은 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R'은 C1-18 알킬, C2-18 알케닐, -R*YR", -YR", 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R"은 C3-14 알킬 및 C3-14 알케닐로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R*은 C1-12 알킬 및 C2-12 알케닐로 이루어진 군으로부터 독립적으로 선택되고;
각각의 Y는 독립적으로 C3-6 카르보사이클이고;
각각의 X는 F, Cl, Br, 및 I로 이루어진 군으로부터 독립적으로 선택되고;
m은 5, 6, 7, 8, 9, 10, 11, 12, 및 13으로부터 선택된다.
일부 구현예에서, 화학식 (I)의 화합물의 서브세트(subset)는 R4가 -(CH2)nQ, -(CH2)nCHQR, -CHQR, 또는 -CQ(R)2인 경우, (i) n이 1, 2, 3, 4 또는 5일 때, Q는 -N(R)2가 아니거나, 또는 (ii) n이 1 또는 2일 때, Q는 5, 6, 또는 7-원 헤테로사이클로알킬이 아닌 화합물들을 포함한다.
일부 구현예에서, 화학식 (I)의 화합물의 또 다른 서브세트는 하기의 화합물, 또는 이의 염 또는 이성질체를 포함한다:
R1은 C5-30 알킬, C5-20 알케닐, -R*YR", -YR", 및 -R"M'R'로 이루어진 군으로부터 선택되고;
R2 및 R3은 H, C1-14 알킬, C2-14 알케닐, -R*YR", -YR", 및 -R*OR"로 이루어진 군으로부터 독립적으로 선택되거나, 또는 R2 및 R3은 이들이 부착되는 원자와 함께 헤테로사이클 또는 카르보사이클을 형성하며;
R4는 C3-6 카르보사이클, -(CH2)nQ, -(CH2)nCHQR, -CHQR, -CQ(R)2, 및 비치환된 C1-6 알킬로 이루어진 군으로부터 선택되고, 이때 Q는 C3-6 카르보사이클, N, O, 및 S로부터 선택되는 하나 이상의 헤테로원자를 갖는 5-원 내지 14-원 헤테로아릴, -OR, -O(CH2)nN(R)2, -C(O)OR, -OC(O)R, -CX3, -CX2H, -CXH2, -CN, -C(O)N(R)2, -N(R)C(O)R, -N(R)S(O)2R, -N(R)C(O)N(R)2, -N(R)C(S)N(R)2, -CRN(R)2C(O)OR, -N(R)R8, -O(CH2)nOR, -N(R)C(=NR9)N(R)2, -N(R)C(=CHR9)N(R)2, -OC(O)N(R)2, -N(R)C(O)OR, -N(OR)C(O)R, -N(OR)S(O)2R, -N(OR)C(O)OR, -N(OR)C(O)N(R)2, -N(OR)C(S)N(R)2, -N(OR)C(=NR9)N(R)2, -N(OR)C(=CHR9)N(R)2, -C(=NR9)N(R)2, -C(=NR9)R, -C(O)N(R)OR, 및 N, O 및 S로부터 선택되는 하나 이상의 헤테로원자를 가지며 옥소(=O), OH, 아미노, 모노- 또는 디-알킬아미노, 및 C1-3 알킬로부터 선택되는 하나 이상의 치환기로 치환된 5-원 내지 14-원 헤테로사이클로알킬로부터 선택되고, 각각의 n은 1, 2, 3, 4, 및 5로부터 독립적으로 선택되고;
각각의 R5는 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R6는 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
M 및 M'은 -C(O)O-, -OC(O)-, -C(O)N(R')-, -N(R')C(O)-, -C(O)-, -C(S)-, -C(S)S-, -SC(S)-, -CH(OH)-, -P(O)(OR')O-, -S(O)2-, -S-S-, 아릴기, 및 헤테로아릴기로부터 독립적으로 선택되고;
R7은 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 선택되고;
R8은 C3-6 카르보사이클 및 헤테로사이클로 이루어진 군으로부터 선택되고;
R9는 H, CN, NO2, C1-6 알킬, -OR, -S(O)2R, -S(O)2N(R)2, C2-6 알케닐, C3-6 카르보사이클 및 헤테로사이클로 이루어진 군으로부터 선택되고;
각각의 R은 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R'은 C1-18 알킬, C2-18 알케닐, -R*YR", -YR", 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R"은 C3-14 알킬 및 C3-14 알케닐로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R*은 C1-12 알킬 및 C2-12 알케닐로 이루어진 군으로부터 독립적으로 선택되고;
각각의 Y는 독립적으로 C3-6 카르보사이클이고;
각각의 X는 F, Cl, Br, 및 I로 이루어진 군으로부터 독립적으로 선택되고;
m은 5, 6, 7, 8, 9, 10, 11, 12 및 13으로부터 선택된다.
일부 구현예에서, 화학식 (I)의 화합물의 또 다른 서브세트는 하기의 화합물, 또는 이의 염 또는 이성질체를 포함한다:
R1은 C5-30 알킬, C5-20 알케닐, -R*YR", -YR", 및 -R"M'R'로 이루어진 군으로부터 선택되고;
R2 및 R3은 H, C1-14 알킬, C2-14 알케닐, -R*YR", -YR", 및 -R*OR"로 이루어진 군으로부터 독립적으로 선택되거나, 또는 R2 및 R3은 이들이 부착되는 원자와 함께 헤테로사이클 또는 카르보사이클을 형성하며;
R4는 C3-6 카르보사이클, -(CH2)nQ, -(CH2)nCHQR, -CHQR, -CQ(R)2, 및 비치환된 C1-6 알킬로 이루어진 군으로부터 선택되고, 이때 Q는 C3-6 카르보사이클, N, O, 및 S로부터 선택되는 하나 이상의 헤테로원자를 갖는 5-원 내지 14-원 헤테로사이클, -OR, -O(CH2)nN(R)2, -C(O)OR, -OC(O)R, -CX3, -CX2H, -CXH2, -CN, -C(O)N(R)2, -N(R)C(O)R, -N(R)S(O)2R, -N(R)C(O)N(R)2, -N(R)C(S)N(R)2, -CRN(R)2C(O)OR, -N(R)R8, -O(CH2)nOR, -N(R)C(=NR9)N(R)2, -N(R)C(=CHR9)N(R)2, -OC(O)N(R)2, -N(R)C(O)OR, -N(OR)C(O)R, -N(OR)S(O)2R, -N(OR)C(O)OR, -N(OR)C(O)N(R)2, -N(OR)C(S)N(R)2, -N(OR)C(=NR9)N(R)2, -N(OR)C(=CHR9)N(R)2, -C(=NR9)R, -C(O)N(R)OR, 및 -C(=NR9)N(R)2로부터 선택되고, 각각의 n은 1, 2, 3, 4, 및 5로부터 독립적으로 선택되고; Q가 5-원 내지 14-원 헤테로사이클일 때 (i) R4는 -(CH2)nQ이고 이때 n은 1 또는 2이거나, 또는 (ii) R4는 -(CH2)nCHQR이고 이때 n은 1이거나, 또는 (iii) R4는 -CHQR, 및 -CQ(R)2이고, 이때 Q는 5-원 내지 14-원 헤테로아릴 또는 8-원 내지 14-원 헤테로사이클로알킬이고;
각각의 R5는 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R6은 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
M 및 M'은 -C(O)O-, -OC(O)-, -C(O)N(R')-, -N(R')C(O)-, -C(O)-, -C(S)-, -C(S)S-, -SC(S)-, -CH(OH)-, -P(O)(OR')O-, -S(O)2-, -S-S-, 아릴기 및 헤테로아릴기로부터 독립적으로 선택되고;
R7은 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 선택되고;
R8은 C3-6 카르보사이클 및 헤테로사이클로 이루어진 군으로부터 선택되고;
R9는 H, CN, NO2, C1-6 알킬, -OR, -S(O)2R, -S(O)2N(R)2, C2-6 알케닐, C3-6 카르보사이클 및 헤테로사이클로 이루어진 군으로부터 선택되고;
각각의 R은 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R'은 C1-18 알킬, C2-18 알케닐, -R*YR", -YR", 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R"은 C3-14 알킬 및 C3-14 알케닐로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R*은 C1-12 알킬 및 C2-12 알케닐로 이루어진 군으로부터 독립적으로 선택되고;
각각의 Y는 독립적으로 C3-6 카르보사이클이고;
각각의 X는 F, Cl, Br 및 I로 이루어진 군으로부터 독립적으로 선택되고;
m은 5, 6, 7, 8, 9, 10, 11, 12 및 13으로부터 선택된다.
일부 구현예에서, 화학식 (I)의 화합물의 또 다른 서브세트는 하기 화합물 또는 이의 염 또는 이성질체를 포함한다:
R1은 C5-30 알킬, C5-20 알케닐, -R*YR", -YR", 및 -R"M'R'로 이루어진 군으로부터 선택되고;
R2 및 R3은 H, C1-14 알킬, C2-14 알케닐, -R*YR", -YR", 및 -R*OR"로 이루어진 군으로부터 독립적으로 선택되거나, 또는 R2 및 R3은 이들이 부착되는 원자와 함께 헤테로사이클 또는 카르보사이클을 형성하며;
R4는 C3-6 카르보사이클, -(CH2)nQ, -(CH2)nCHQR, -CHQR, -CQ(R)2, 및 비치환된 C1-6 알킬로 이루어진 군으로부터 선택되고, 이때 Q는 C3-6 카르보사이클, N, O, 및 S로부터 선택되는 하나 이상의 헤테로원자를 갖는 5-원 내지 14-원 헤테로아릴, -OR, -O(CH2)nN(R)2, -C(O)OR, -OC(O)R, -CX3, -CX2H, -CXH2, -CN, -C(O)N(R)2, -N(R)C(O)R, -N(R)S(O)2R, -N(R)C(O)N(R)2, -N(R)C(S)N(R)2, -CRN(R)2C(O)OR, -N(R)R8, -O(CH2)nOR, -N(R)C(=NR9)N(R)2, -N(R)C(=CHR9)N(R)2, -OC(O)N(R)2, -N(R)C(O)OR, -N(OR)C(O)R, -N(OR)S(O)2R, -N(OR)C(O)OR, -N(OR)C(O)N(R)2, -N(OR)C(S)N(R)2, -N(OR)C(=NR9)N(R)2, -N(OR)C(=CHR9)N(R)2, -C(=NR9)R, -C(O)N(R)OR, 및 -C(=NR9)N(R)2로부터 선택되고, 각각의 n은 1, 2, 3, 4, 및 5로부터 독립적으로 선택되고;
각각의 R5는 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R6은 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
M 및 M'은 -C(O)O-, -OC(O)-, -C(O)N(R')-, -N(R')C(O)-, -C(O)-, -C(S)-, -C(S)S-, -SC(S)-, -CH(OH)-, -P(O)(OR')O-, -S(O)2-, -S-S-, 아릴기 및 헤테로아릴기로부터 독립적으로 선택되고;
R7은 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 선택되고;
R8은 C3-6 카르보사이클 및 헤테로사이클로 이루어진 군으로부터 선택되고;
R9는 H, CN, NO2, C1-6 알킬, -OR, -S(O)2R, -S(O)2N(R)2, C2-6 알케닐, C3-6 카르보사이클 및 헤테로사이클로 이루어진 군으로부터 선택되고;
각각의 R은 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R'은 C1-18 알킬, C2-18 알케닐, -R*YR", -YR", 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R"은 C3-14 알킬 및 C3-14 알케닐로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R*은 C1-12 알킬 및 C2-12 알케닐로 이루어진 군으로부터 독립적으로 선택되고;
각각의 Y는 독립적으로 C3-6 카르보사이클이고;
각각의 X는 F, Cl, Br 및 I로 이루어진 군으로부터 독립적으로 선택되고;
m은 5, 6, 7, 8, 9, 10, 11, 12 및 13으로부터 선택된다.
일부 구현예에서, 화학식 (I)의 화합물의 또 다른 서브세트는 하기의 화합물, 또는 이의 염 또는 이성질체를 포함한다:
R1은 C5-30 알킬, C5-20 알케닐, -R*YR", -YR", 및 -R"M'R'로 이루어진 군으로부터 선택되고;
R2 및 R3은 H, C2-14 알킬, C2-14 알케닐, -R*YR", -YR", 및 -R*OR"로 이루어진 군으로부터 독립적으로 선택되거나, 또는 R2 및 R3은 이들이 부착되는 원자와 함께 헤테로사이클 또는 카르보사이클을 형성하며;
R4는 -(CH2)nQ 또는 -(CH2)nCHQR이고, 이때 Q는 -N(R)2이며, n은 3, 4 및 5로부터 선택되고;
각각의 R5는 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R6은 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
M 및 M'은 -C(O)O-, -OC(O)-, -C(O)N(R')-, -N(R')C(O)-, -C(O)-, -C(S)-, -C(S)S-, -SC(S)-, -CH(OH)-, -P(O)(OR')O-, -S(O)2-, -S-S-, 아릴기 및 헤테로아릴기로부터 독립적으로 선택되고;
R7은 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 선택되고;
각각의 R은 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R'은 C1-18 알킬, C2-18 알케닐, -R*YR", -YR", 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R"은 C3-14 알킬 및 C3-14 알케닐로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R*은 C1-12 알킬 및 C1-12 알케닐로 이루어진 군으로부터 독립적으로 선택되고;
각각의 Y는 독립적으로 C3-6 카르보사이클이고;
각각의 X는 F, Cl, Br 및 I로 이루어진 군으로부터 독립적으로 선택되고;
m은 5, 6, 7, 8, 9, 10, 11, 12 및 13으로부터 선택된다.
일부 구현예에서, 화학식 (I)의 화합물의 또 다른 서브세트는 하기 화합물 또는 이의 염 또는 이성질체를 포함한다:
R1은 C5-30 알킬, C5-20 알케닐, -R*YR", -YR", 및 -R"M'R'로 이루어진 군으로부터 선택되고;
R2 및 R3은 C1-14 알킬, C2-14 알케닐, -R*YR", -YR", 및 -R*OR"로 이루어진 군으로부터 독립적으로 선택되거나, 또는 R2 및 R3은 이들이 부착되는 원자와 함께 헤테로사이클 또는 카르보사이클을 형성하며;
R4는 -(CH2)nQ, -(CH2)nCHQR, -CHQR, 및 -CQ(R)2로 이루어진 군으로부터 선택되고, 이때 Q는 -N(R)2이며, n은 1, 2, 3, 4 및 5로부터 선택되고;
각각의 R5는 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R6은 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
M 및 M'은 -C(O)O-, -OC(O)-, -C(O)N(R')-, -N(R')C(O)-, -C(O)-, -C(S)-, -C(S)S-, -SC(S)-, -CH(OH)-, -P(O)(OR')O-, -S(O)2-, -S-S-, 아릴기 및 헤테로아릴기로부터 독립적으로 선택되고;
R7은 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 선택되고;
각각의 R은 C1-3 알킬, C2-3 알케닐, 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R'은 C1-18 알킬, C2-18 알케닐, -R*YR", -YR", 및 H로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R"은 C3-14 알킬 및 C3-14 알케닐로 이루어진 군으로부터 독립적으로 선택되고;
각각의 R*은 C1-12 알킬 및 C1-12 알케닐로 이루어진 군으로부터 독립적으로 선택되고;
각각의 Y는 독립적으로 C3-6 카르보사이클이고;
각각의 X는 F, Cl, Br 및 I로 이루어진 군으로부터 독립적으로 선택되고;
m은 5, 6, 7, 8, 9, 10, 11, 12 및 13으로부터 선택된다.
일부 구현예에서, 화학식 (I)의 화합물의 서브세트는 하기 화학식 (IA)의 화합물, 또는 이의 염 또는 이성질체를 포함한다:
식 중, l은 1, 2, 3, 4 및 5로부터 선택되고; m은 5, 6, 7, 8 및 9로부터 선택되고; M1은 결합 또는 M'이고; R4는 비치환된 C1-3 알킬, 또는 -(CH2)nQ이고, 이때 Q는 OH, -NHC(S)N(R)2, -NHC(O)N(R)2, -N(R)C(O)R, -N(R)S(O)2R, -N(R)R8, -NHC(=NR9)N(R)2, -NHC(=CHR9)N(R)2, -OC(O)N(R)2, -N(R)C(O)OR, 헤테로아릴 또는 헤테로사이클로알킬이며; M 및 M'은 -C(O)O-, -OC(O)-, -C(O)N(R')-, -P(O)(OR')O-, -S-S-, 아릴기 및 헤테로아릴기로부터 독립적으로 선택되고; R2 및 R3은 H, C1-14 알킬, 및 C2-14 알케닐로 이루어진 군으로부터 독립적으로 선택된다.
일부 구현예에서, 화학식 (I)의 화합물의 서브세트는 하기 화학식 (II)의 화합물 또는 이의 염 또는 이성질체를 포함한다:
식 중, l은 1, 2, 3, 4 및 5로부터 선택되며; M1은 결합 또는 M'이고; R4는 비치환된 C1-3 알킬, 또는 -(CH2)nQ이며, 이때 n은 2, 3 또는 4이고, Q는 OH, -NHC(S)N(R)2, -NHC(O)N(R)2, -N(R)C(O)R, -N(R)S(O)2R, -N(R)R8, -NHC(=NR9)N(R)2, -NHC(=CHR9)N(R)2, -OC(O)N(R)2, -N(R)C(O)OR, 헤테로아릴 또는 헤테로사이클로알킬이고; M 및 M'은 -C(O)O-, -OC(O)-, -C(O)N(R')-, -P(O)(OR')O-, -S-S-, 아릴기 및 헤테로아릴기로부터 독립적으로 선택되고; R2 및 R3은 H, C1-14 알킬 및 C2-14 알케닐로 이루어진 군으로부터 독립적으로 선택된다.
일부 구현예에서, 화학식 (I)의 화합물의 서브세트는 하기 화학식 (IIa), (IIb), (IIc), 또는 (IIe)의 화합물 또는 이의 염 또는 이성질체를 포함한다:
식 중, R4는 본원에 기재된 바와 같다.
일부 구현예에서, 화학식 (I)의 화합물의 서브세트는 하기 화학식 (IId)의 화합물 또는 이의 염 또는 이성질체를 포함한다:
식 중, n은 2, 3 또는 4이고; m, R', R" 및 R2 내지 R6은 본원에 기재된 바와 같다. 예를 들어, R2 및 R3의 각각은 C5-14 알킬 및 C5-14 알케닐로 이루어진 군으로부터 독립적으로 선택될 수 있다.
일부 구현예에서, 본 개시의 이온화 가능한 양이온성 지질은 하기 구조를 갖는 화합물을 포함한다:
일부 구현예에서, 본 개시의 이온화 가능한 양이온성 지질은 하기 구조를 갖는 화합물을 포함한다:
일부 구현예에서, 본 개시의 비-양이온성 지질은 1,2-디스테아로일-sn-글리세로-3-포스포콜린(DSPC), 1,2-디올레오일-sn-글리세로-3-포스포에탄올아민(DOPE), 1,2-디리놀레오일-sn-글리세로-3-포스포콜린(DLPC), 1,2-디미리스토일-sn-글리세로-포스포콜린(DMPC), 1,2-디올레오일-sn-글리세로-3-포스포콜린(DOPC), 1,2-디팔미토일-sn-글리세로-3-포스포콜린(DPPC), 1,2-디운데카노일-sn-글리세로-포스포콜린(DUPC), 1-팔미토일-2-올레오일-sn-글리세로-3-포스포콜린(POPC), 1,2-디-O-옥타데세닐-sn-글리세로-3-포스포콜린(18:0 디에테르 PC), 1-올레오일-2 콜레스테릴헤미숙시노일-sn-글리세로-3-포스포콜린(OChemsPC), 1-헥사데실-sn-글리세로-3-포스포콜린(C16 Lyso PC), 1,2-디리놀레노일-sn-글리세로-3-포스포콜린, 1,2-디아라키도노일-sn-글리세로-3-포스포콜린, 1,2-디도코사헥사에노일-sn-글리세로-3-포스포콜린, 1,2-디피타노일-sn-글리세로-3-포스포에탄올아민(ME 16.0 PE), 1,2-디스테아로일-sn-글리세로-3-포스포에탄올아민, 1,2-디리놀레오일-sn-글리세로-3-포스포에탄올아민, 1,2-디리놀레노일-sn-글리세로-3-포스포에탄올아민, 1,2-디아라키도노일-sn-글리세로-3-포스포에탄올아민, 1,2-디도코사헥사에노일-sn-글리세로-3-포스포에탄올아민, 1,2-디올레오일-sn-글리세로-3-포스포-rac-(1-글리세롤) 나트륨 염(DOPG), 스핑고미엘린, 및 이들의 혼합물을 포함한다.
일부 구현예에서, 본 개시의 PEG 변형된 지질은 PEG-변형된 포스파티딜에탄올아민, PEG-변형된 포스파티드산, PEG-변형된 세라마이드, PEG-변형된 디알킬아민, PEG-변형된 디아실글리세롤, PEG-변형된 디알킬글리세롤, 및 이들의 혼합물을 포함한다. 일부 구현예에서, PEG-변형된 지질은 DMG-PEG, PEG-c-DOMG(PEG-DOMG로도 지칭됨), PEG-DSG 및/또는 PEG-DPG이다.
일부 구현예에서, 본 개시의 스테롤은 콜레스테롤, 페코스테롤, 시토스테롤, 에르고스테롤, 캄페스테롤, 스티그마스테롤, 브라시카스테롤, 토마티딘, 우르솔산, 알파-토코페롤, 및 이의 혼합물을 포함한다.
일부 구현예에서, 본 개시의 LNP는 화합물 1의 이온화 가능한 양이온성 지질을 포함하며, 상기 비-양이온성 지질은 DSPC이고, 구조적 지질은 콜레스테롤이고, PEG 지질은 DMG-PEG이다.
일부 구현예에서, 지질 나노입자는 45 - 55 몰%(mol%) 이온화 가능한 양이온성 지질을 포함한다. 예를 들어, 지질 나노입자는 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 또는 55 mol%의 이온화 가능한 양이온성 지질을 포함할 수 있다.
일부 구현예에서, 지질 나노입자는 5 - 15 mol%, 5 - 10 mol%, 또는 10 - 15 mol%의 DSPC를 포함한다. 예를 들어, 지질 나노입자는 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 또는 15 mol%의 DSPC를 포함할 수 있다.
일부 구현예에서, 지질 나노입자는 35 - 40 mol%의 콜레스테롤을 포함한다. 예를 들어, 지질 나노입자는 35, 35.5, 36, 36.5, 37, 37.5, 38, 38.5, 39, 39.5, 또는 40 mol%의 콜레스테롤을 포함할 수 있다.
일부 구현예에서, 지질 나노입자는 1 - 2 mol%, 1 - 3 mol%, 1 - 4 mol%, 또는 1 - 5 mol%의 DMG-PEG를 포함한다. 예를 들어, 지질 나노입자는 1, 1.5, 2, 2.5, 3, 또는 3.5 mol%의 DMG-PEG를 포함할 수 있다.
일부 구현예에서, 지질 나노입자는 50 mol%의 이온화 가능한 양이온성 지질, 10 mol%의 DSPC, 38.5 mol%의 콜레스테롤, 및 1.5 mol%의 DMG-PEG를 포함한다.
일부 구현예에서, 지질 나노입자는 49 mol%의 이온화 가능한 양이온성 지질, 10 mol%의 DSPC, 38.5 mol%의 콜레스테롤, 및 2.5 mol%의 DMG-PEG를 포함한다.
일부 구현예에서, 지질 나노입자는 49 mol%의 이온화 가능한 양이온성 지질, 11 mol%의 DSPC, 38.5 mol%의 콜레스테롤, 및 1.5 mol%의 DMG-PEG를 포함한다.
일부 구현예에서, 지질 나노입자는 48 mol%의 이온화 가능한 양이온성 지질, 11 mol%의 DSPC, 38.5 mol%의 콜레스테롤, 및 2.5 mol%의 DMG-PEG를 포함한다.
일부 구현예에서, 본 개시의 LNP는 약 2:1 내지 약 30:1의 N:P 비율을 포함한다.
일부 구현예에서, 본 개시의 LNP는 약 6:1의 N:P 비율을 포함한다.
일부 구현예에서, 본 개시의 LNP는 약 3:1의 N:P 비율을 포함한다.
일부 구현예에서, 본 개시의 LNP는 약 10:1 내지 약 100:1의 이온화 가능한 양이온성 지질 성분 대 RNA의 중량/중량(wt/wt) 비율을 포함한다.
일부 구현예에서, 본 개시의 LNP는 약 20:1의 이온화 가능한 양이온성 지질 성분 대 RNA의 중량/중량(wt/wt) 비율을 포함한다.
일부 구현예에서, 본 개시의 LNP는 약 10:1의 이온화 가능한 양이온성 지질 성분 대 RNA의 중량/중량(wt/wt) 비율을 포함한다.
일부 구현예에서, 본 개시의 LNP는 약 50 nm 내지 약 150 nm의 평균 직경을 갖는다.
일부 구현예에서, 본 개시의 LNP는 약 70 nm 내지 약 120 nm의 평균 직경을 갖는다.
다가 백신
본원에 제공된 바와 같은, 조성물은 동일하거나 상이한 종의 2개 이상의 항원을 암호화하는 RNA 또는 다중 RNA를 포함할 수 있다. 일부 구현예에서, 조성물은 2개 이상의 코로나바이러스 항원을 암호화하는 mRNA 또는 다중 mRNA를 포함한다. 일부 구현예에서, RNA는 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개 또는 그 이상의 코로나바이러스 항원을 암호화할 수 있다.
일부 구현예에서, 항원을 암호화하는 2개 이상의 상이한 mRNA가 동일한 지질 나노입자 내 제형화될 수 있다. 다른 구현예에서, 항원을 암호화하는 2개 이상의 상이한 RNA는 별개의 지질 나노입자 내 제형화될 수 있다(각각의 RNA는 단일 지질 나노입자 내 제형화됨). 지질 나노입자는 이후 (예를 들어, 다중 항원을 암호화하는 다중 RNA 포함하는) 단일 백신 조성물로서 조합되어 투여될 수 있거나, 개별적으로 투여될 수 있다.
조합 백신
본원에 제공된 바와 같은, 조성물은 동일하거나 상이한 바이러스 균주의 2개 이상의 항원을 암호화하는 mRNA 또는 다중 RNA를 포함할 수 있다. 하나 이상의 코로나바이러스 및 상이한 유기체의 하나 이상의 항원(들)을 암호화하는 RNA를 포함하는 조합 백신이 또한 본원에서 제공된다. 따라서, 본 개시의 백신은 동일한 균주/종의 하나 이상의 항원, 또는 상이한 균주/종의 하나 이상의 항원, 예를 들어, 코로나바이러스 감염의 위험이 높은 동일한 지리적 영역에서 발견되는 유기체 또는 코로나바이러스에 노출될 때 개체가 이에 노출될 가능성이 있는 유기체에 대한 면역을 유도하는 항원을 표적으로 하는 조합 백신일 수 있다.
약학적 제제
예를 들어, 인간 및 다른 포유동물에서 코로나바이러스의 예방 또는 치료용 조성물(예를 들어, 약학적 조성물), 방법, 키트 및 시약이 본원에 제공된다. 본원에 제공된 조성물은 치료제 또는 예방제로서 사용될 수 있다. 이들은 코로나바이러스 감염을 예방 및/또는 치료하기 위한 의약에서 사용될 수 있다.
일부 구현예에서, 본원에 기재된 바와 같은 RNA를 함유하는 코로나바이러스 백신은 대상체(예를 들어, 포유류 대상체, 예컨대 인간 대상체)에게 투여될 수 있고, mRNA는 항원성 폴리펩타이드(항원)를 생산하기 위해 생체내에서 번역된다.
조성물(예를 들어, RNA를 포함)의 "유효량"은, 적어도 부분적으로, 상기 표적 조직, 표적 세포 유형, 투여 수단, RNA의 물리적 특징(예를 들어, 길이, 뉴클레오티드 조성물, 및/또는 변형된 뉴클레오시드의 정도) 및 백신의 다른 성분, 및 다른 결정인자, 예컨대, 대상체의 연령, 체중, 키, 성별 및 일반적인 건강을 기반으로 한다. 전형적으로, 유효량의 조성물은 대상체의 세포에서 항원 생산의 기능으로서 유도된 또는 부스팅된 면역 반응을 제공한다. 일부 구현예에서, 적어도 하나의 화학적 변형을 갖는 mRNA를 함유하는 유효량의 조성물은 동일한 항원 또는 펩티드 항원을 암호화하는 상응하는 비변형된 폴리뉴클레오티드를 함유하는 조성물보다 더 효율적이다. 증가된 항원 생산은 증가된 세포 형질감염(RNA 백신으로 형질감염된 세포의 백분율), 폴리뉴클레오티드로부터의 증가된 단백질 번역 및/또는 발현, (예를 들어, 변형된 폴리뉴클레오티드로부터의 단백질 번역 기간 증가에 의해 입증된 바와 같이) 감소된 핵산 분해, 또는 숙주 세포의 변경된 항원 특이적 면역 반응에 의해 입증될 수 있다.
용어 "약학적 조성물"은, 생체내 또는 생체외 진단 또는 치료 용도에 특히 적합하게 조성물을 만드는, 불활성 또는 활성인, 담체와 활성제의 조합을 지칭한다. "약학적으로 허용가능한 담체"는 대상체에게 또는 대상체 상에 투여된 후, 바람직하지 않은 생리학적 효과를 야기시키지 않는다. 약학적 조성물 내 담체는 활성 성분과 양립가능하고, 이를 안정화시킬 수 있다는 의미에서 또한 "허용가능"해야 한다. 하나 이상의 가용화제는 활성제의 전달을 위한 약학적 담체로서 이용될 수 있다. 약학적으로 허용가능한 담체의 예는, 투약 형태로서 사용가능한 조성물을 달성하기 위한, 생체적합성 비히클, 보조제, 첨가제, 및 희석제를 포함하나, 이에 제한되지는 않는다. 다른 담체의 예는 콜로이드성 산화규소, 마그네슘 스테아르산, 셀룰로오스, 및 나트륨 라우릴 설페이트를 포함한다. 추가의 적합한 약학적 담체 및 희석제, 뿐만 아니라 이들의 용도를 위한 약학적 필수품은 Remington's Pharmaceutical Sciences에 기재되어 있다.
일부 구현예에서, 본 개시에 따른 조성물(폴리뉴클레오티드 및 이들의 암호화된 폴리펩티드를 포함)은 코로나바이러스 감염의 치료 또는 예방에 사용될 수 있다. 조성물은 건강한 개체에 대한 능동 면역화 계획의 일부로서 예방적으로 또는 치료적으로, 또는 잠복기 동안 또는 증상의 발병 후 활성 감염 동안 감염 초기에 투여될 수 있다. 일부 구현예에서, 세포, 조직 또는 대상체에 제공되는 RNA의 양은 면역 예방에 효과적인 양일 수 있다.
조성물은 다른 예방적 또는 치료적 화합물과 함께 투여될 수 있다. 비-제한적인 예로서, 예방적 또는 치료적 화합물은 보조제 또는 부스터일 수 있다. 본원에 사용된 바와 같이, 예방적 조성물, 예컨대 백신을 언급할 때, 용어 "부스터"는 예방적 (백신) 조성물의 추가 투여를 지칭한다. 부스터 (또는 부스터 백신)는 예방적 조성물의 초기 투여 후에 주어질 수 있다. 예방적 조성물의 초기 투여와 부스터 사이의 투여 시간은, 이에 제한되지는 않으나, 1분, 2분, 3분, 4분, 5분, 6분, 7분, 8분, 9분, 10분, 15분, 20분, 35분, 40분, 45분, 50분, 55분, 1시간, 2시간, 3시간, 4시간, 5시간, 6시간, 7시간, 8시간, 9시간, 10시간, 11시간, 12시간, 13시간, 14시간, 15시간, 16시간, 17시간, 18시간, 19시간, 20시간, 21시간, 22시간, 23시간, 1일, 36시간, 2일, 3일, 4일, 5일, 6일, 1주, 10일, 2주, 3주, 1개월, 2개월, 3개월, 4개월, 5개월, 6개월, 7개월, 8개월, 9개월, 10개월, 11개월, 1년, 18개월, 2년, 3년, 4년, 5년, 6년, 7년, 8년, 9년, 10년, 11년, 12년, 13년, 14년, 15년, 16년, 17년, 18년, 19년, 20년, 25년, 30년, 35년, 40년, 45년, 50년, 55년, 60년, 65년, 70년, 75년, 80년, 85년, 90년, 95년 또는 99년 이상일 수 있다. 예시적인 구현예에서, 예방적 조성물의 초기 투여와 부스터 사이의 투여 시간은, 이에 제한되지 않으나, 1주, 2주, 3주, 1개월, 2개월, 3개월, 6개월 또는 1년일 수 있다.
일부 구현예에서, 조성물은 당업계에 공지된 불활성화된 백신의 투여와 유사하게 근육내로, 비강내로 또는 진피내로 투여될 수 있다.
조성물은 감염의 유병률 또는 충족되지 않은 의학적 요구의 정도 또는 수준에 따라 다양한 환경에서 활용될 수 있다. 비제한적인 예로서, RNA 백신은 다양한 감염성 질환을 치료 및/또는 예방하는데 활용될 수 있다. RNA 백신은 상업적으로 이용가능한 백신보다 훨씬 더 큰 항체 역가를 생성하고, 면역을 더 잘 중화시키며, 더 오래 지속되는 면역 반응을 생성하고/하거나, 더 빨리 반응을 생성한다는 점에서 우수한 특성을 갖는다.
선택적으로 하나 이상의 약학적으로 허용가능한 부형제와 조합하여 RNA 및/또는 복합체를 포함하는 약학적 조성물이 본원에 제공된다.
RNA는 단독으로 또는 하나 이상의 다른 성분과 함께 제형화거나 투여될 수 있다. 예를 들어, 조성물은 이에 제한되지는 않으나, 보조제(adjuvant)를 포함하는 다른 성분을 포함할 수 있다.
일부 구현예에서, 조성물은 보조제를 포함하지 않는다(이들은 보조제가 없음).
RNA는 하나 이상의 약학적으로-허용가능한 부형제와 조합하여 제형화되거나 투여될 수 있다. 일부 구현예에서, 백신 조성물은 예를 들어, 치료적-활성 물질, 예방적-활성 물질, 또는 둘 다의 조합과 같은 적어도 하나의 추가 활성 물질을 포함한다. 백신 조성물은 무균, 발열원-무함유 또는 무균 및 발열원-무함유 둘 다일 수 있다. 약제, 예컨대 백신 조성물의 제형 및/또는 제조의 일반적인 고려사항은, 예를 들어 Remington: The Science and Practice of Pharmacy 21st ed., Lippincott Williams & Wilkins, 2005(이는 그 전체가 본원에 참조로 포함됨)에서 확인할 수 있다.
일부 구현예에서, 조성물은 인간, 인간 환자 또는 대상체에게 투여된다. 본 개시의 목적을 위해, 어구 "활성 성분"은 일반적으로, 상기 성분 내에 함유된 RNA 백신 또는 폴리뉴클레오티드, 예를 들어, 항원을 암호화하는 mRNA를 지칭한다.
본원에 기재된 백신 조성물의 제형은 약리학 분야에서 공지되거나 이후 개발되는 임의의 방법에 의해 제조될 수 있다. 일반적으로, 이러한 준비 방법은 활성 성분(예를 들어, mRNA)을 부형제 및/또는 하나 이상의 다른 보조 성분과 결합시키고, 그 다음, 필요하고/하거나 바람직한 경우, 생성물을 원하는 단일- 또는 다중-용량 단위로 분할, 성형 및/또는 포장하는 단계를 포함한다.
본 개시에 따른 약학적 조성물 내의 활성 성분, 약학적으로 허용가능한 부형제, 및/또는 임의의 추가 성분의 상대적인 양은 치료된 대상체의 동일성, 크기, 및/또는 상태 및 추가로 조성물이 투여될 경로에 따라 달라질 것이다. 예로서, 본 조성물은 0.1% 내지 100%, 예를 들어, 0.5 내지 50%, 1 내지 30%, 5 내지 80%, 적어도 80%(w/w)의 활성 성분을 포함할 수 있다.
일부 구현예에서, mRNA는 (1) 안정성 증가; (2) 세포 형질감염의 증가; (3) (예를 들어, 데포 제형으로부터) 지속 또는 지연 방출의 허용; (4) 생체 분포의 변경(예를 들어, 특정 조직 또는 세포 유형에 대한 표적); (5) 생체내 암호화된 단백질 번역의 증가; 및/또는 (6) 생체내 암호화된 단백질(항원)의 방출 프로파일 변경을 위해 하나 이상의 부형제를 사용하여 제형화된다. 임의의 그리고 모든 용매, 분산 매질, 희석제 또는 다른 액체 비히클, 분산물 또는 현탁 보조제, 표면 활성제, 등장제, 증점제 또는 유화제, 보존제와 같은 전통적인 부형제 이외에, 부형제는 제한 없이, 리피도이드, 리포좀, 지질 나노입자, 중합체, 리포플렉스, 코어-쉘 나노입자, 펩티드, 단백질, (예를 들어, 대상체 내로 이식을 위해) RNA로 형질감염된 세포, 하이알루로니다제, 나노입자 모방체 및 이들의 조합을 포함할 수 있다.
투약/투여
인간 및 다른 포유동물에서 코로나바이러스 감염의 예방 및/또는 치료를 위한 조성물(예를 들어, RNA 백신), 방법, 키트 및 시약이 본원에 제공된다. 면역화 조성물은 치료제 또는 예방제로서 사용될 수 있다. 일부 구현예에서, 조성물은 코로나바이러스 감염으로부터 예방적 보호를 제공하기 위해 사용된다. 일부 구현예에서, 조성물은 코로나바이러스 감염을 치료하기 위해 사용된다. 일부 구현예, 구현예에서, 조성물은 예를 들어, 생체외에서 말초혈액 단핵세포(PBMC)를 활성화하기 위해 면역 이펙터 세포의 프라이밍에 사용되며, 이는 이후 대상체 내로 주입(재주입)된다.
대상체는 비인간 영장류 및 인간 대상체를 포함하는, 임의의 포유동물일 수 있다. 전형적으로, 대상체는 인간 대상체이다.
일부 구현예에서, 조성물(예를 들어, RNA 백신)은 항원-특이적 면역 반응을 유도하기 위한 유효량으로 대상체(예를 들어, 포유류 대상체, 예컨대 인간 대상체)에게 투여된다. 코로나바이러스 항원을 암호화하는 RNA는 생체내에서 발현되고 번역되어 항원을 생성하고, 이는 이후 대상체에서 면역 반응을 자극한다.
코로나바이러스로부터의 예방적 보호는 본 개시의 조성물의 투여 후에 달성될 수 있다. 면역화 조성물은 1회, 2회, 3회, 4회 또는 그 이상 투여될 수 있으나, 백신을 1회 투여하는 것으로 충분할 가능성이 있다(선택적으로 단일 부스터가 뒤따름). 덜 바람직하지만, 치료 반응을 달성하기 위해 감염된 개체에게 조성물을 투여하는 것이 가능하다. 투약은 이에 따라 조정될 필요가 있을 수 있다.
코로나바이러스 항원(또는 다중 항원)에 대한 대상체에서 면역 반응을 유도하는 방법이 본 개시의 측면에서 제공된다. 일부 구현예에서, 상기 방법은 코로나바이러스 항원을 암호화하는 오픈 리딩 프레임을 갖는 mRNA를 포함하는 조성물을 대상체에게 투여하는 단계를 포함하며, 이에 따라 대상체에서 코로나바이러스 항원에 특이적인 면역 반응을 유도하고, 여기서 상기 대상체에서 항-항원 항체 역가는 항원에 대한 전통적 백신의 예방적 유효량으로 백신 접종된 대상체에서 항-항원 항체 역가에 비해 백신 접종 후 증가된다. "항-항원 항체"는 항원에 특이적으로 결합하는 혈청 항체이다.
예방적 유효량은 임상적으로 허용가능한 수준에서 바이러스에 의한 감염을 예방하는 유효량이다. 일부 구현예에서, 치료적으로 유효량은 백신용 포장 삽입물에서 나열된 용량이다. 본원에 사용된 바와 같이, 전통적 백신은 본 개시의 mRNA 백신 이외의 백신을 지칭한다. 예를 들어, 전통적 백신은 이에 제한되지는 않으나, 살아있는 미생물 백신, 사멸된 미생물 백신, 서브유닛 백신, 단백질 항원 백신, DNA 백신, 바이러스 유사 입자(VLP) 백신 등을 포함한다. 예시적인 구현예에서, 전통적 백신은 규제 승인을 획득하고/하거나 국가 약물 규제 기관, 예를 들어 미국 식품의약국(FDA) 또는 유럽 의약품청(EMA)에 의해 등록된 백신이다.
일부 구현예에서, 대상체에서의 항-항원 항체 역가는 코로나바이러스 또는 백신 미접종된 대상체에 대한 예방적 유효량의 전통적 백신으로 백신 접종된 대상체에서의 항-항원 항체 역가에 비해 백신 접종 후 1 log 내지 10 log 증가된다. 일부 구현예에서, 대상체에서의 항-항원 항체 역가는 코로나바이러스 또는 백신 미접종된 대상체에 대한 예방적 유효량의 전통적 백신이 백신 접종된 대상체에서의 항-항원 항체 역가에 비해 백신 접종 후 1 log, 2 log, 3 log, 4 log, 5 log 또는 10 log 증가된다.
코로나바이러스에 대한 대상체에서 면역 반응을 유도하는 방법이 본 개시의 다른 측면에서 제공된다. 상기 방법은 코로나바이러스 항원을 암호화하는 오픈 리딩 프레임을 포함하는 mRNA를 포함하는 조성물을 대상체에게 투여하는 단계를 포함하며, 이에 따라 대상체에서 코로나바이러스에 특이적인 면역 반응을 유도하고, 여기서 상기 대상체에서의 면역 반응은 조성물에 비해 투여량 수준의 2배 내지 100배에서 코로나바이러스에 대한 전통적 백신으로 백신 접종된 대상체에서의 면역 반응과 동등하다.
일부 구현예에서, 대상체에서의 면역 반응은 본 개시의 조성물에 비해 2배의 투여량 수준에서 전통적 백신으로 백신 접종된 대상체에서의 면역 반응과 동등하다. 일부 구현예에서, 대상체에서의 면역 반응은 본 개시의 조성물에 비해 3배의 투여량 수준에서 전통적 백신으로 백신 접종된 대상체에서의 면역 반응과 동등하다. 일부 구현예에서, 대상체에서의 면역 반응은 본 개시의 조성물에 비해 4배, 5배, 10배, 50배, 또는 100배의 투여량 수준에서 전통적 백신으로 백신 접종된 대상체에서의 면역 반응과 동등하다. 일부 구현예에서, 대상체에서의 면역 반응은 본 개시의 조성물에 비해 10배 내지 1000배의 투여량 수준에서 전통적 백신으로 백신 접종된 대상체에서의 면역 반응과 동등하다. 일부 구현예에서, 대상체에서의 면역 반응은 본 개시의 조성물에 비해 100배 내지 1000배의 투여량 수준에서 전통적 백신으로 백신 접종된 대상체에서의 면역 반응과 동등하다.
다른 구현예에서, 면역 반응은 대상체에서의 [단백질] 항체 역가를 결정함으로써 평가된다. 다른 구현예에서, 면역화된 대상체로부터의 혈청 또는 항체의 능력은 바이러스 흡수를 중화하거나 인간 B 림프구의 코로나바이러스 형질전환을 감소시키는 이의 능력에 대해 시험된다. 다른 구현예에서, 강력한 T 세포 반응(들)을 촉진하는 능력은 당업계에 인정된 기법을 사용하여 측정된다.
다른 측면에서, 본 개시는 코로나바이러스 항원을 암호화하는 오픈 리딩 프레임을 갖는 mRNA를 포함하는 조성물을 대상체에게 투여함으로써 코로나바이러스에 대한 대상체에서의 면역 반응을 유도하는 방법을 제공하며, 이에 따라 대상체에서 코로나바이러스 항원에 특이적인 면역 반응을 유도하고, 여기서 상기 대상체에서의 면역 반응은 코로나바이러스에 대한 전통적 백신의 예방적 유효량으로 백신 접종된 대상체에서 유도된 면역 반응에 비해 2일 내지 10주 더 일찍 유도된다. 일부 구현예에서, 대상체에서의 면역 반응은 본 개시의 조성물에 비해 2배 내지 100배의 투여량 수준에서 전통적 백신의 예방적 유효량으로 백신 접종된 대상체에서 유도된다.
일부 구현예에서, 대상체에서의 면역 반응은 예방적 유효량의 전통적 백신으로 백신 접종을 받은 대상체에서 유도된 면역 반응에 비해 2일, 3일, 1주, 2주, 3주, 5주 또는 10주 더 일찍 유도된다.
또한 제1 항원을 암호화하는 오픈 리딩 프레임을 갖는 mRNA를 대상체에게 투여함으로써 코로나바이러스에 대한 대상체에서의 면역 반응을 유도하는 방법이 본원에 제공되며, 여기서 상기 RNA는 안정화 요소를 포함하지 않고, 여기서 보조제는 백신과 공동-제형화되거나 공동-투여되지 않는다.
조성물은 치료적으로 효과적인 결과를 초래하는 임의의 경로에 의해 투여될 수 있다. 이들은, 이에 제한되지는 않으나, 진피내, 근육내, 비강내 및/또는 피하 투여를 포함한다. 본 개시는 RNA 백신을 이를 필요로 하는 대상체에게 투여하는 단계를 포함하는 방법을 제공한다. 요구된 정확한 양은, 대상체의 종, 연령, 및 일반적인 병태, 질환의 중증도, 특정 조성물, 이의 투여 방식, 이의 활성 방식 등에 따라 대상체마다 다를 수 있다. RNA는 전형적으로 투여의 용이성 및 투여량의 균일성을 위해 투여량 단위 형태로 제형화된다. 그러나, RNA의 총 1일 사용량은 건전한 의학적 판단의 범위 내에서 주치의에 의해 결정될 수 있음이 이해될 것이다. 임의의 특정 환자에 대하여 특정 치료적으로 효과적인, 예방적으로 효과적인, 또는 적절한 이미징 용량 수준은 하기를 포함하는 다양한 인자에 따라 달라질 것이다: 치료받는 장애 및 장애의 중증도; 이용된 특정 화합물의 활성; 이용된 특정 조성물; 환자의 연령, 체중, 일반적인 건강, 성별 및 식이; 이용된 특정 화합물의 투여 시간, 투여 경로, 및 배출 속도; 치료 기간; 이용된 특정 화합물과 조합으로 또는 동시에 사용된 약물; 및 의학 분야에서 잘 알려진 유사 인자.
본원에 제공된 바와 같은, RNA의 유효량은 예를 들어 단일 용량으로 또는 2회의 10 μg 용량으로 투여되는 20 μg 만큼 낮을 수 있다. 일부 구현예에서, 유효량은 20 μg-300 μg 또는 25 μg-300 μg의 총 용량이다. 예를 들어, 유효량은 20 μg, 25 μg, 30 μg, 35 μg, 40 μg, 45 μg, 50 μg, 55 μg, 60 μg, 65 μg, 70 μg, 75 μg, 80 μg, 85 μg, 90 μg, 95 μg, 100 μg, 110 μg, 120 μg, 130 μg, 140 μg, 150 μg, 160 μg, 170 μg, 180 μg, 190 μg, 200 μg, 250 μg, 또는 300 μg의 총 용량일 수 있다. 일부 구현예에서, 유효량은 20 μg의 총 용량이다. 일부 구현예에서, 유효량은 25 μg의 총 용량이다. 일부 구현예에서, 유효량은 50 μg의 총 용량이다. 일부 구현예에서, 유효량은 75 μg의 총 용량이다. 일부 구현예에서, 유효량은 100 μg의 총 용량이다. 일부 구현예에서, 유효량은 150 μg의 총 용량이다. 일부 구현예에서, 유효량은 200 μg의 총 용량이다. 일부 구현예에서, 유효량은 250 μg의 총 용량이다. 일부 구현예에서, 유효량은 300 μg의 총 용량이다.
본원에 기술된 RNA는 비강내, 기관내 또는 (예를 들어, 정맥내로, 안내로, 유리체내로, 근육내로, 피내로, 심장내로, 복강내로 및 피하로) 주사가능한 것과 같은 본원에 기술된 제형으로 제제화될 수 있다.
백신 효능
본 개시의 일부 측면은 조성물(예를 들어, RNA 백신)의 제제를 제공하고, 상기 RNA는 대상체에서 항원 특이적 면역 반응(예를 들어, 코로나바이러스 항원에 특이적인 항체의 생산)을 생성하기 위한 유효량으로 제제화된다. "유효량"은 항원-특이적 면역 반응을 생성하는데 효과적인 RNA의 용량이다. 또한 대상체에서 항원-특이적 면역 반응을 유도하는 방법이 본원에 제공된다.
본원에 사용된 바와 같이, 본 개시의 백신 또는 LNP에 대한 면역 반응은 백신에 존재하는 (하나 이상의) 코로나바이러스 단백질(들)에 대한 체액성 및/또는 세포성 면역 반응의 대상체에서의 발달이다. 본 개시의 목적을 위해, "체액성" 면역 반응은 예를 들어, 분비(IgA) 또는 IgG 분자를 포함하는, 항체 분자에 의해 매개되는 면역 반응을 지칭하는 반면, "세포성" 면역 반응은 T-림프구(예를 들어, CD4+ 헬퍼 및/또는 CD8+ T 세포(예를 들어, CTL) 및/또는 기타 백혈구에 의해 매개되는 면역 반응이다. 세포성 면역의 하나의 중요한 측면은 세포용해성 T-세포(CTL)에 의한 항원-특이적 반응을 수반한다. CTL은 주요 조직적합성 복합체(MHC)에 의해 암호화되고 세포의 표면 상에서 발현되는 단백질과 관련하여 제시되는 펩티드 항원에 대한 특이성을 갖는다. CTL은 세포내 미생물의 파괴 또는 이러한 미생물에 감염된 세포의 용해를 유도하고 촉진하는 데 도움이 된다. 세포성 면역의 또 다른 측면은 헬퍼 T-세포에 의한 항원-특이적 반응을 수반한다. 헬퍼 T-세포는 기능을 자극하는 데 도움이 되도록 작용하고, 이들의 표면 상에 MHC 분자와 관련하여 펩티드 항원을 나타내는 세포에 대해 비특이적 이펙터 세포의 활성을 집중시킨다. 세포성 면역 반응은 또한 CD4+ 및 CD8+ T-세포로부터 유래된 것들을 포함하는 활성화된 T-세포 및/또는 기타 백혈구에 의해 생성되는 사이토카인, 케모카인, 및 기타 해당 분자의 생산을 유도한다.
일부 구현예에서, 항원-특이적 면역 반응은 본원에 제공된 바와 같은 조성물이 투여된 대상체에서 생산된 항-코로나바이러스 항원 항체 역가를 측정하는 것을 특징으로 한다. 항체 역가는 대상체 내에서 항체, 예를 들어, 특정 항원 또는 항원의 에피토프에 특이적인 항체의 양의 측정이다. 항체 역가는 긍정적인 결과를 제공하는 가장 큰 희석의 역수로서 전형적으로 표현된다. 효소-결합 면역흡착 분석법(ELISA)은 예를 들어 항체 역가를 결정하기 위한 일반적인 분석법이다.
다양한 혈청학적 시험을 사용하여 암호화된 관심 항원, 예를 들어, SAR-CoV-2 바이러스 또는 SAR-CoV-2 바이러스 항원, 예를 들어, SAR-CoV-2 스파이크 또는 이의 도메인의 S 단백질에 대한 항체를 측정할 수 있다. 이러한 검사에는 혈구응집-억제 시험, 보체 고정 시험, 형광 항체 시험, 효소-결합 면역흡착 분석법(ELISA) 및 플라크 감소 중화 시험(PRNT)이 포함된다. 이러한 각 시험은 상이한 항체 활성을 측정한다. 예시적인 구현예에서, 플라크 감소 중화 시험, 또는 PRNT(예를 들어, PRNT50 또는 PRNT90)는 보호의 혈청학적 상관관계로서 사용된다. PRNT는 시험관 내 바이러스 중화의 생물학적 매개변수를 측정하고 특정 부류의 바이러스 중에서 가장 혈청학적으로 바이러스-특이적인 시험이며, 이는 바이러스 감염으로부터 혈청 보호 수준과 밀접한 연관성이 있다.
PRNT의 기본 디자인은 시험관 또는 미세역가 플레이트에서 바이러스-항체 상호작용이 일어나도록 한 다음, 혼합물을 바이러스-민감성 세포, 바람직하게는 포유류 기원의 세포에 플레이팅하여 바이러스 감염성에 대한 항체 효과를 측정할 수 있다. 세포는 자손 바이러스의 확산을 제한하는 반-고체 배지로 오버레이된다. 생산적인 감염을 개시하는 각 바이러스는 다양한 방법으로 검출될 수 있는 국소화된 감염 영역(플라크)을 생성한다. 플라크를 계수하고 바이러스의 시작 농도와 다시 비교하여 총 바이러스 감염성의 감소 백분율을 결정한다. PRNT에서, 테스트되는 혈청 샘플은 일반적으로 표준화된 양의 바이러스와 혼합하기 전에 연속 희석을 거친다. 바이러스의 농도는 감수성 세포에 첨가되고 반-고체 배지로 오버레이되는 경우에 개별 플라크가 식별되고 계수될 수 있도록, 일정하게 유지된다. 이러한 방식으로, PRNT 종점 역가는 임의의 선택된 바이러스 활성의 감소 백분율에서 각 혈청 샘플에 대해 계산될 수 있다.
백신 면역원성을 평가하기 위한 기능 분석에서, 항체 적정을 위한 혈청 샘플 희석 시리즈는 "혈청보호" 역치 역가 미만에서 이상적으로 시작해야 한다. SARS-CoV-2 중화 항체와 관련하여 "혈청보호" 역치 역가는 알려지지 않은 채로 남아 있으나; 1:10의 혈청 반응 양성 역치는 특정 구현예에서 혈청보호 역치로 간주될 수 있다.
PRNT 종점 역가는 플라크 수의 원하는 감소 백분율을 나타내는 마지막 혈청 희석의 역수로 표현된다. PRNT 역가는 플라크 수의 50% 이상 감소(PRNT50)를 기반으로 계산될 수 있다. PRNT50 역가는 백신 혈청에 대해 더 높은 컷-오프(예를 들어, PRNT90)를 사용하는 역가보다 바람직하며, 적정 곡선의 선형 부분에서 보다 정확한 결과를 제공한다.
PRNT 역가를 계산하는 여러 방법이 있다. 역가를 계산하는 가장 간단하고 가장 널리 사용되는 방법은 플라크를 계수하고, 입력 플라크의 역-적정을 기반으로 입력 플라크 수의 >50% 감소를 나타내기 위해 마지막 혈청 희석의 역수로서 역가를 기록한다. 여러 혈청 희석으로부터의 곡선 맞춤 방법의 사용은 보다 정확한 결과의 계산을 가능하게 할 수 있다. 이를 위해 사용 가능한 다양한 컴퓨터 분석 프로그램(예를 들어, SPSS 또는 GraphPad Prism)이 있다.
일부 구현예에서, 항체 역가는 대상체가 감염되었는지 여부를 평가하는데 또는 면역화가 필요한지 여부를 결정하는데 사용된다. 일부 구현예에서, 항체 역가는 자가면역 반응의 강도를 결정하는데, 부스터 면역화가 필요한지 여부를 결정하는데, 이전의 백신이 효과적인지 여부를 결정하는데, 그리고 임의의 최근 또는 이전의 감염을 확인하는데 사용된다. 본 개시에 따르면, 항체 역가는 조성물(예를 들어, RNA 백신)에 의해 대상체에서 유도된 면역 반응의 강도를 결정하는데 사용될 수 있다.
일부 구현예에서, 대상체에서 생산된 항-코로나바이러스 항원 항체 역가는 대조군에 비해 적어도 1 log까지 증가된다. 예를 들어, 대상체에서 생산된 항-코로나바이러스 항원 항체 역가는 대조군에 비해 적어도 1.5, 적어도 2, 적어도 2.5, 또는 적어도 3 log까지 증가될 수 있다. 일부 구현예에서, 대상체에서 생산된 항-코로나바이러스 항원 항체 역가는 대조군에 비해 1, 1.5, 2, 2.5 또는 3 log까지 증가된다. 일부 구현예에서, 대상체에서 생산된 항-코로나바이러스 항원 항체 역가는 대조군에 비해 1-3 log까지 증가된다. 예를 들어, 대상체에서 생산된 항-코로나바이러스 항원 항체 역가는 대조군에 비해 1-1.5, 1-2, 1-2.5, 1-3, 1.5-2, 1.5-2.5, 1.5-3, 2-2.5, 2-3, 또는 2.5-3 log까지 증가될 수 있다.
일부 구현예에서, 대상체에서 생산된 항-코로나바이러스 항원 항체 역가는 대조군에 비해 적어도 2배 증가된다. 예를 들어, 대상체에서 생산된 항-코로나바이러스 항원 항체 역가는 대조군에 비해 적어도 3 배, 적어도 4 배, 적어도 5 배, 적어도 6 배, 적어도 7 배, 적어도 8 배, 적어도 9 배, 또는 적어도 10 배 증가될 수 있다. 일부 구현예에서, 대상체에서 생산된 항-코로나바이러스 항원 항체 역가는 대조군에 비해 2, 3, 4, 5, 6, 7, 8, 9, 또는 10배 증가된다. 일부 구현예에서, 대상체에서 생산된 항-코로나바이러스 항원 항체 역가는 대조군에 비해 2-10배 증가된다. 예를 들어, 대상체에서 생산된 항-코로나바이러스 항원 항체 역가는 대조군에 비해 2-10, 2-9, 2-8, 2-7, 2-6, 2-5, 2-4, 2-3, 3-10, 3-9, 3-8, 3-7, 3-6, 3-5, 3-4, 4-10, 4-9, 4-8, 4-7, 4-6, 4-5, 5-10, 5-9, 5-8, 5-7, 5-6, 6-10, 6-9, 6-8, 6-7, 7-10, 7-9, 7-8, 8-10, 8-9, 또는 9-10배 증가될 수 있다.
일부 구현예에서, 항원-특이적 면역 반응은 코로나바이러스에 대한 혈청 중화 항체 역가의 기하 평균 비율(GMR)로 지칭되는, 기하 평균 역가(GMT)의 비율로 측정된다. 기하 평균 역가(GMT)는 모든 값을 곱하고 상기 수의 n제곱근을 취하여 계산된 대상체 그룹에 대한 평균 항체 역가이며, 상기 n은 사용 가능한 데이터를 가진 대상체의 수이다.
대조군은, 일부 구현예에서, 조성물(예를 들어, RNA 백신)이 투여되지 않은 대상체에서 생산된 항-코로나바이러스 항원 항체 역가이다. 일부 구현예에서, 대조군은 재조합 또는 정제된 단백질 백신이 투여된 대상체에서 생산된 항-코로나바이러스 항원 항체 역가이다. 재조합 단백질 백신은 전형적으로 이종 발현 시스템(예를 들어, 박테리아 또는 효모)에서 생산되거나 다량의 병원성 유기체로부터 정제된 단백질 항원을 포함한다.
일부 구현예에서, 효과적인 조성물(예를 들어, RNA 백신)의 능력은 뮤린 모델에서 측정된다. 예를 들어, 조성물은 뮤린 모델 및 중화 항체 역가의 유도에 대해 분석된 뮤린 모델에 투여될 수 있다. 바이러스 챌린지 연구는 또한 본 개시의 백신의 효능을 평가하기 위해 사용될 수 있다. 예를 들어, 조성물은 뮤린 모델에 투여될 수 있고, 뮤린 모델은 바이러스로 챌린지되고, 뮤린 모델은 생존 및/또는 면역 반응(예를 들어, 중화 항체 반응, T 세포 반응(예를 들어, 사이토카인 반응))에 대해 분석될 수 있다.
일부 구현예에서, 조성물(예를 들어, RNA 백신)의 유효량은 재조합 단백질 백신의 표준 치료 용량과 비교하여 감소된 용량이다. 본원에 제공된 바와 같은 "표준 치료"는, 의학적 또는 심리적 치료 지침을 지칭하고 일반적이거나 특이적일 수 있다. "표준 치료"는 주어진 병태의 치료에 관련된 의료 전문가 간의 과학적 증거 및 공동 작업을 기반으로 한 적절한 치료를 구체화한다. 의사/임상의가 특정 유형의 환자, 병 또는 임상 상황에 대해 따라야 하는 진단 및 치료 과정이다. 본원에 제공된 바와 같은 "표준 치료 용량"은 의사/임상의 또는 다른 의료 전문가가 코로나바이러스 감염 또는 관련된 병태를 치료 또는 예방하기 위한 표준 치료 지침을 따르는 동안, 코로나바이러스 감염 또는 관련된 병태를 치료 또는 예방하기 위해 대상체에게 투여하는 재조합 또는 정제된 단백질 백신, 또는 생약독화된 또는 불활성화된 백신, 또는 VLP 백신의 용량을 지칭한다.
일부 구현예에서, 조성물의 유효량이 투여된 대상체에서 생산된 항-코로나바이러스 항원 항체 역가는 재조합 또는 정제된 단백질 백신, 또는 생약독화된 또는 불활성화된 백신, 또는 VLP 백신의 표준 치료 용량이 투여된 대조군 대상체에서 생산된 항-코로나바이러스 항원 항체 역가와 동등하다.
백신 효능은 표준 분석을 사용하여 평가될 수 있다(예를 들어, Weinberg 등, J Infect Dis. 2010 Jun 1;201(11):1607-10 참조). 예를 들어, 백신 효능은 이중-맹검, 무작위화된, 임상 제어된 시험에 의해 측정될 수 있다. 백신 효능은 백신 미접종된(ARU)과 백신 접종된(ARV) 코호트 연구 간의 질환 발병률(AR)의 비례 감소로서 표현될 수 있고, 하기 공식을 사용하여 백신 접종된 군 간의 질환의 상대 위험도(RR)로부터 계산될 수 있다:
효능 = (ARU - ARV)/ARU x 100; 및
효능 = (1-RR) x 100.
마찬가지로, 백신 유효성은 표준 분석을 사용하여 평가될 수 있다(예를 들어, Weinberg 등, J Infect Dis. 2010 Jun 1;201(11):1607-10 참조). 백신 유효성은 (높은 백신 효능을 갖는 것으로 이미 입증될 수 있는) 백신이 모집단에서 질환을 얼마나 감소시키는지의 평가이다. 이러한 측정은 통제된 임상 시험에서보다 자연 현장 조건 하에서 백신 자체 뿐만 아니라 백신 접종 프로그램의 이점 및 역효과의 순 균형을 평가할 수 있다. 백신 유효성은 백신 효능(역가)에 비례하지만, 또한 모집단의 표적 그룹이 얼마나 면역화되었는지에 의해, 뿐만 아니라 입원, 외래 방문, 또는 비용의 "실사회" 결과에 영향을 주는 다른 비-백신-관련된 인자에 의해 영향을 받는다. 예를 들어, 일련의 감염된 사례 및 적절한 대조군 간의 백신 접종률을 비교하는 후향적 사례 대조군 분석이 사용될 수 있다. 백신 유효성은 백신 접종에도 불구하고 감염이 발병하는 경우 오즈비(OR)를 사용하여 비율 차이로서 표현될 수 있다:
유효성 = (1 - OR) x 100.
일부 구현예에서, 조성물(예를 들어, RNA 백신)의 효능은 백신 미접종 대조군 대상체에 비해 적어도 60%이다. 예를 들어, 조성물의 효능은 백신 미접종 대조군 대상체에 비해 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 95%, 적어도 98%, 또는 100%일 수 있다.
살균 면역. 살균 면역은 숙주로의 효과적인 병원체 감염을 방지하는 독특한 면역 상태를 지칭한다. 일부 구현예에서, 본 개시의 조성물의 유효량은 적어도 1년 동안 대상체에서 살균 면역을 제공하기에 충분하다. 예를 들어, 본 개시의 조성물의 유효량은 적어도 2년, 적어도 3년, 적어도 4년, 또는 적어도 5년 동안 대상체에서 살균 면역을 제공하기에 충분하다. 일부 구현예에서, 본 개시의 조성물의 유효량은 대조군에 비해 적어도 5배 더 낮은 용량으로 대상체에서 살균 면역을 제공하기에 충분하다. 예를 들어, 유효량은 대조군에 비해 적어도 10배 낮은, 15배, 또는 20배 낮은 용량으로 대상체에서 살균 면역을 제공하기에 충분할 수 있다.
검출 가능한 항원. 일부 구현예에서, 본 개시의 조성물의 유효량은 투여 후 1-72시간에 대상체의 혈청에서 측정된 바와 같이 검출 가능한 수준의 코로나바이러스 항원을 생성하기에 충분하다.
역가. 항체 역가는 대상체 내의 항체, 예를 들어, 특정 항원(예를 들어, 항-코로나바이러스 항원)에 특이적인 항체 수의 측정이다. 항체 역가는 전형적으로 양성 결과를 제공하는 최대 희석액의 역수로 표시된다. 효소-결합 면역흡착 분석법(ELISA)은 예를 들어 항체 역가를 측정하기 위한 일반적인 분석법이다.
일부 구현예에서, 본 개시의 조성물의 유효량은 투여 후 1-72시간에 대상체의 혈청에서 측정된 바와 같이 코로나바이러스 항원에 대한 중화 항체에 의해 생산된 1,000-10,000의 중화 항체 역가를 생성하기에 충분하다. 일부 구현예에서, 유효량은 투여 후 1-72시간에 대상체의 혈청에서 측정된 바와 같이 코로나바이러스 항원에 대한 중화 항체에 의해 생산된 1,000-5,000의 중화 항체 역가를 생성하기에 충분하다. 일부 구현예에서, 유효량은 투여 후 1-72시간에 대상체의 혈청에서 측정된 바와 같이 코로나바이러스 항원에 대한 중화 항체에 의해 생산된 5,000-10,000의 중화 항체 역가를 생성하기에 충분하다.
일부 구현예에서, 중화 항체 역가는 적어도 100 NT50이다. 예를 들어, 중화 항체 역가는 적어도 200, 300, 400, 500, 600, 700, 800, 900 또는 1000 NT50일 수 있다. 일부 구현예에서, 중화 항체 역가는 적어도 10,000 NT50이다.
일부 구현예에서, 중화 항체 역가는 밀리리터 당 적어도 100 중화 단위(NU/mL)이다. 예를 들어, 중화 항체 역가는 적어도 200, 300, 400, 500, 600, 700, 800, 900 또는 1000 NU/mL일 수 있다. 일부 구현예에서, 중화 항체 역가는 적어도 10,000 NU/mL이다.
일부 구현예에서, 대상체 내 생산된 항-코로나바이러스 항원 항체 역가는 대조군에 비해 적어도 1 log 만큼 증가된다. 예를 들어, 대상체 내 생산된 항-코로나바이러스 항원 항체 역가는 대조군에 비해 적어도 2, 3, 4, 5, 6, 7, 8, 9 또는 10 log 만큼 증가될 수 있다.
일부 구현예에서, 대상체 내 생산된 항-코로나바이러스 항원 항체 역가는 대조군에 비해 적어도 2배 증가된다. 예를 들어, 대상체 내 생산된 항-코로나바이러스 항원 항체 역가는 대조군에 비해 적어도 3, 4, 5, 6, 7, 8, 9 또는 10배 증가된다.
일부 구현예에서, n 수의 곱의 n제곱근 기하 평균은 비례 성장을 기술하는 데 일반적으로 사용된다. 일부 구현예에서, 기하 평균은 대상체 내 생산된 항체 역가를 특성화하는 데 사용된다.
대조군은 예를 들어, 백신 미접종 대상체, 또는 바이러스 약독화 생백신, 불활성화된 바이러스 백신, 또는 단백질 서브유닛 백신을 투여받은 대상체일 수 있다.
추가 구현예
본 개시의 추가 구현예는 하기 번호가 매겨진 단락에 의해 포함된다:
1. SARS-CoV-2 스파이크 단백질의 수용체 결합 도메인(RBD) 및 단백질 막횡단 도메인을 포함하는 융합 단백질을 암호화하는 오픈 리딩 프레임을 포함하는 메신저 리보핵산(mRNA).
2. 단락 1에 있어서, 상기 단백질 막횡단 도메인은 인플루엔자 혈구응집소 막횡단 도메인인, mRNA.
3. 단락 2에 있어서, 상기 융합 단백질은 서열번호 77의 아미노산 서열에 대해 적어도 80% 동일성을 갖는 아미노산 서열을 포함하는 것인, mRNA.
4. 단락 3에 있어서, 상기 융합 단백질은 서열번호 77의 아미노산 서열에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하는 것인, mRNA.
5. 단락 4에 있어서, 상기 융합 단백질은 서열번호 77의 아미노산 서열을 포함하는 것인, mRNA.
6. 선행하는 단락 중 어느 한 단락에 있어서, 상기 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열에 대해 적어도 70% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, mRNA.
7. 단락 6에 있어서, 상기 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열에 대해 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, mRNA.
8. 단락 7에 있어서, 상기 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열을 포함하는 것인, mRNA.
9. SARS-CoV-2 스파이크 단백질의 아미노(N)-말단 도메인(NTD) 및 막횡단 도메인을 포함하는 융합 단백질을 암호화하는 오픈 리딩 프레임을 포함하는 메신저 리보핵산(mRNA).
10. 단락 9에 있어서, 상기 막횡단 도메인은 인플루엔자 혈구응집소 막횡단 도메인인, mRNA.
11. 단락 10에 있어서, 상기 융합 단백질은 서열번호 47의 아미노산 서열에 대해 적어도 80% 동일성을 갖는 아미노산 서열을 포함하는 것인, mRNA.
12. 단락 11에 있어서, 상기 융합 단백질은 서열번호 47의 아미노산 서열에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하는 것인, mRNA.
13. 단락 12에 있어서, 상기 융합 단백질은 서열번호 47의 아미노산 서열을 포함하는 것인, mRNA.
14. 선행하는 단락 중 어느 한 단락에 있어서, 상기 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열에 대해 적어도 70% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, mRNA.
15. 단락 14에 있어서, 상기 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열에 대해 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, mRNA.
16. 단락 15에 있어서, 상기 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열을 포함하는 것인, mRNA.
17. SARS-CoV-2 스파이크의 수용체 결합 도메인에 연결된 SARS-CoV-2 스파이크 단백질의 아미노(N)-말단 도메인을 포함하는 융합 단백질을 암호화하는 오픈 리딩 프레임을 포함하는 메신저 리보핵산(mRNA).
18. 단락 17에 있어서, 상기 융합 단백질은 막횡단 도메인을 추가로 포함하는 것인, mRNA.
19. 단락 18에 있어서, 상기 융합 단백질은 서열번호 92의 아미노산 서열에 대해 적어도 80% 동일성을 갖는 아미노산 서열을 포함하는 것인, mRNA.
20. 단락 18에 있어서, 상기 융합 단백질은 서열번호 92의 아미노산 서열에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하는 것인, mRNA.
21. 단락 20에 있어서, 상기 융합 단백질은 서열번호 92의 아미노산 서열을 포함하는 것인, mRNA.
22. 선행하는 단락 중 어느 한 단락에 있어서, 상기 오픈 리딩 프레임은 서열번호 91의 뉴클레오티드 서열에 대해 적어도 70% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, mRNA.
23. 단락 22에 있어서, 상기 오픈 리딩 프레임은 서열번호 91의 뉴클레오티드 서열에 대해 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, mRNA.
24. 단락 23에 있어서, 상기 오픈 리딩 프레임은 서열번호 91의 뉴클레오티드 서열을 포함하는 것인, mRNA.
25. 선행하는 단락 중 어느 한 단락에 있어서, 서열번호 131 또는 2의 뉴클레오티드 서열을 선택적으로 포함하는, 5' 비번역 영역(UTR)을 추가로 포함하는 것인, mRNA.
26. 선행하는 단락 중 어느 한 단락에 있어서, 서열번호 132 또는 4의 뉴클레오티드 서열을 선택적으로 포함하는, 3' 비번역 영역(UTR)을 추가로 포함하는 것인, mRNA.
27. 선행하는 단락 중 어느 한 단락에 있어서, 5' 캡, 선택적으로 7mG(5')ppp(5')NlmpNp를 추가로 포함하는 것인, mRNA.
28. 선행하는 단락 중 어느 한 단락에 있어서, 선택적으로 약 100개의 뉴클레오티드 길이를 갖는 폴리A 꼬리를 추가로 포함하는 것인, mRNA.
29. 선행하는 단락 중 어느 한 단락에 있어서, 상기 mRNA는 화학적 변형, 선택적으로 1-메틸슈도우리딘을 포함하는 것인, mRNA.
30. 단락 1 내지 단락 29 중 어느 한 단락의 mRNA를 포함하는 조성물.
31. 단락 1 내지 단락 8 중 어느 한 단락의 mRNA 및 단락 9 내지 단락 16 중 어느 한 단락의 mRNA를 포함하는 조성물.
32. 단락 17 내지 단락 29 중 어느 한 단락의 mRNA를 포함하는 조성물.
33. (a) SARS-CoV-2 스파이크 단백질의 수용체 결합 도메인(RBD) 및 단백질 막횡단 도메인을 포함하는 융합 단백질을 암호화하는 오픈 리딩 프레임을 포함하는 메신저 리보핵산(mRNA); 및
(b) SARS-CoV-2 스파이크 단백질의 아미노(N)-말단 도메인 및 막횡단 도메인을 포함하는 융합 단백질을 암호화하는 오픈 리딩 프레임을 포함하는 mRNA:
를 포함하는 조성물.
34. 단락 33에 있어서, 상기 단백질 막횡단 도메인은 인플루엔자 혈구응집소 막횡단 도메인인, 조성물.
35. 단락 34에 있어서, 상기 (a)의 융합 단백질은 서열번호 77의 아미노산 서열에 대해 적어도 80% 동일성을 갖는 아미노산 서열을 포함하는 것인, 조성물.
36. 단락 35에 있어서, 상기 (a)의 융합 단백질은 서열번호 77의 아미노산 서열에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하는 것인, 조성물.
37. 단락 36에 있어서, 상기 (a)의 융합 단백질은 서열번호 77의 아미노산 서열을 포함하는 것인, 조성물.
38. 단락 34 내지 단락 37 중 어느 한 단락에 있어서, 상기 (a)의 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열에 대해 적어도 70% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, 조성물.
39. 단락 38에 있어서, 상기 (a)의 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열에 대해 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, 조성물.
40. 단락 39에 있어서, 상기 (a)의 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열을 포함하는 것인, 조성물.
41. 단락 34 내지 단락 40 중 어느 한 단락에 있어서, 상기 (b)의 융합 단백질은 서열번호 47의 아미노산 서열에 대해 적어도 80% 동일성을 갖는 아미노산 서열을 포함하는 것인, 조성물.
42. 단락 41에 있어서, 상기 (b)의 융합 단백질은 서열번호 47의 아미노산 서열에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하는 것인, 조성물.
43. 단락 42에 있어서, 상기 (b)의 융합 단백질은 서열번호 47의 아미노산 서열을 포함하는 것인, 조성물.
44. 단락 34 내지 단락 43 중 어느 한 단락에 있어서, 상기 (b)의 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열에 대해 적어도 70% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, 조성물.
45. 단락 44에 있어서, 상기 (b)의 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열에 대해 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, 조성물.
46. 단락 45에 있어서, 상기 (b)의 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열을 포함하는 것인, 조성물.
47. 단락 33 내지 단락 46 중 어느 한 단락에 있어서, 상기 (a)의 mRNA 대 (b)의 mRNA의 비율은 약 1:1인, 조성물.
48. 지질 나노입자 내 제형화된 단락 1 내지 단락 29 중 어느 한 단락의 mRNA.
49. 지질 나노입자를 추가로 포함하는 단락 30 내지 단락 47 중 어느 한 단락의 조성물.
50. 단락 49에 있어서, 상기 mRNA는 지질 나노입자 내 제형화되는 것인, 조성물.
51. 단락 33 내지 단락 47 중 어느 한 단락에 있어서, 상기 (a)의 mRNA는 지질 나노입자 내 제형화되고, 상기 (b)의 mRNA는 지질 나노입자 내 제형화되는 것인, 조성물.
52. 단락 51에 있어서, 상기 (a) 및 (b)의 mRNA는 동일한 지질 나노입자 내 존재하거나, 상기 (a) 및 (b)의 각각의 mRNA는 서로 상대적으로 별개의 나노입자 내 제형화되는 것인, 조성물.
53. 단락 48의 mRNA 또는 단락 49 내지 단락 52 중 어느 한 단락의 조성물에 있어서, 상기 지질 나노입자는 양이온성 지질을 포함하는 것인 mRNA 또는 조성물.
54. 단락 53에 있어서, 상기 지질 나노입자는 중성 지질을 추가로 포함하는 것인, mRNA 또는 조성물.
55. 단락 53 또는 단락 54에 있어서, 상기 지질 나노입자는 스테롤을 추가로 포함하는 것인, mRNA 또는 조성물.
56. 단락 53 내지 단락 55 중 어느 한 단락에 있어서, 상기 지질 나노입자는 폴리에틸렌 글리콜(PEG)-변형된 지질을 추가로 포함하는 것인, mRNA 또는 조성물.
57. 단락 53 내지 단락 56 중 어느 한 단락에 있어서, 상기 지질 나노입자는 이온화 가능한 양이온성 지질, 중성 지질, 스테롤, 및 PEG-변형된 지질을 포함하는 것인, mRNA 또는 조성물.
58. 단락 57에 있어서, 상기 이온화 가능한 양이온성 지질은 헵타데칸-9-일 8((2 하이드록시에틸)(6 옥소 6-(운데실옥시)헥실)아미노)옥타노에이트 (화합물 1)인, mRNA 또는 조성물.
59. 단락 57 또는 단락 58에 있어서, 상기 중성 지질은 1,2 디스테아로일-sn-글리세로-3-포스포콜린(DSPC)인, mRNA 또는 조성물.
60. 단락 57 내지 단락 59 중 어느 한 단락에 있어서, 상기 스테롤은 콜레스테롤인, mRNA 또는 조성물.
61. 단락 57 내지 단락 60 중 어느 한 단락에 있어서, 상기 PEG-변형된 지질은 1,2 디미리스토일-sn-글리세롤, 메톡시폴리에틸렌글리콜(PEG2000 DMG)인, mRNA 또는 조성물.
62. 단락 57 내지 단락 61 중 어느 한 단락에 있어서, 상기 지질 나노입자는 20-60 mol%의 이온화 가능한 양이온성 지질, 5-25 mol%의 중성 지질, 25-55 mol%의 스테롤, 및 0.5-15 mol%의 PEG-변형된 지질을 포함하는 것인, mRNA 또는 조성물.
63. 단락 62에 있어서, 상기 지질 나노입자는
47 mol%의 이온화 가능한 양이온성 지질; 11.5 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 3.0 mol% PEG-변형된 지질;
48 mol%의 이온화 가능한 양이온성 지질; 11 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 2.5 mol%의 PEG-변형된 지질;
49 mol%의 이온화 가능한 양이온성 지질; 10.5 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 2.0 mol%의 PEG-변형된 지질;
50 mol%의 이온화 가능한 양이온성 지질; 10 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 1.5 mol%의 PEG-변형된 지질; 또는
51 mol%의 이온화 가능한 양이온성 지질; 9.5 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 1.0 mol%의 PEG-변형된 지질:
을 포함하는 mRNA 또는 조성물.
64. 단락 63에 있어서, 상기 지질 나노입자는
47 mol%의 화합물 1; 11.5 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 3.0 mol%의 PEG2000 DMG;
48 mol%의 화합물 1; 11 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 2.5 mol%의 PEG2000 DMG;
49 mol%의 화합물 1; 10.5 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 2.0 mol%의 PEG2000 DMG;
50 mol%의 화합물 1; 10 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 1.5 mol%의 PEG2000 DMG; 또는
51 mol%의 화합물 1; 9.5 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 1.0 mol%의 PEG2000 DMG:
를 포함하는 mRNA 또는 조성물.
65. SARS-CoV-2에 대한 중화 항체 반응을 대상체에서 유도하기에 효과적인 양으로 선행하는 단락 중 어느 한 단락의 mRNA 또는 조성물을 대상체에게 투여하는 단계를 포함하는 방법.
66. SARS-CoV-2에 대한 T 세포 면역 반응을 대상체에서 유도하기에 효과적인 양으로 선행하는 단락 중 어느 한 단락의 mRNA 또는 조성물을 대상체에게 투여하는 단계를 포함하는 방법.
67. SARS-CoV-2에 대한 면역 반응, 예컨대 중화 항체 반응을 유도할 수 있는 코로나바이러스 항원을 암호화하는 오픈 리딩 프레임(ORF)을 포함하는 메신저 리보핵산(mRNA)으로서, 상기 항원은 SARS-CoV-2의 단백질 단편 또는 기능성 단백질 도메인을 포함하며, 선택적으로 상기 RNA는 지질 나노입자 내 제형화되는 것인 메신저 리보핵산(mRNA).
68. 단락 67에 있어서, 상기 항원은 기능성 단백질 도메인인, mRNA.
69. 단락 68에 있어서, 상기 단백질 도메인은 SARS-CoV-2 스파이크 단백질의 N-말단 도메인(NTD)인, mRNA.
70. 단락 69에 있어서, 상기 NTD는 막횡단 도메인, 선택적으로 인플루엔자 혈구응집소 막횡단 도메인에 연결된 것인, mRNA.
71. 단락 70에 있어서, 상기 항원은 서열번호 47의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 47의 아미노산 서열을 포함하는 것인, mRNA.
72. 단락 70 또는 단락 71에 있어서, 상기 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열을 포함하는 것인, mRNA.
73. 단락 68에 있어서, 상기 단백질 도메인은 SARS-CoV-2 스파이크 단백질의 수용체 결합 도메인(RBD)인, mRNA.
74. 단락 73에 있어서, 상기 RBD는 가용성인, mRNA.
75. 단락 74에 있어서, 상기 항원은 서열번호 62의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 62의 아미노산 서열을 포함하는 것인, mRNA.
76. 단락 74 또는 단락 75에 있어서, 상기 오픈 리딩 프레임은 서열번호 61의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 61의 뉴클레오티드 서열을 포함하는 것인, mRNA.
77. 단락 73에 있어서, 상기 RBD는 막횡단 도메인, 선택적으로 인플루엔자 혈구응집소 막횡단 도메인에 연결된 것인, mRNA.
78. 단락 77에 있어서, 상기 항원은 서열번호 77의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 77의 아미노산 서열을 포함하는 것인, mRNA.
79. 단략 77 또는 단락 78에 있어서, 상기 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열을 포함하는 것인, mRNA.
80. 단락 69에 있어서, 상기 NTD는 SARS-CoV-2 스파이크 단백질의 RBD에 연결되어 NTD-RBD 융합 단백질을 형성하는 것인, mRNA.
81. 단락 80에 있어서, 상기 NTD-RBD 융합은 막횡단 도메인(TM), 선택적으로 인플루엔자 혈구응집소 막횡단 도메인에 연결되어 NTD-RBD-TM 단백질을 형성하는 것인, mRNA.
82. 단락 81에 있어서, 상기 항원은 서열번호 92의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 92의 아미노산 서열을 포함하는 것인, mRNA.
83. 단락 81 또는 단락 82에 있어서, 상기 오픈 리딩 프레임은 서열번호 91의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 91의 뉴클레오티드 서열을 포함하는 것인, mRNA.
84. 단락 80에 있어서, 상기 NTD-RBD 융합은 C-말단 절단을 포함하는 것인, mRNA.
85. 단락 84에 있어서, 상기 항원은 서열번호 107의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 107의 아미노산 서열을 포함하는 것인, mRNA.
86. 단락 84 또는 단락 85에 있어서, 상기 오픈 리딩 프레임은 서열번호 106의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 106의 뉴클레오티드 서열을 포함하는 것인, mRNA.
87. 선행하는 단락 중 어느 한 단락에 있어서, 상기 NTD 및/또는 RBD는 확장된 영역을 포함하는 것인, mRNA.
88. 단락 87에 있어서, 상기 항원은 서열번호 59, 86, 89, 116, 119, 또는 122 중 임의의 하나의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 59, 86, 89, 116, 119, 또는 122 중 임의의 하나의 아미노산 서열을 포함하는 것인, mRNA.
89. 단락 87 또는 88에 있어서, 상기 오픈 리딩 프레임은 서열번호 58, 85, 88, 115, 118, 또는 121 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 58, 85, 88, 115, 118, 또는 121 중 임의의 하나의 뉴클레오티드 서열을 포함하는 것인, mRNA.
90. 단락 68에 있어서, 상기 단백질 도메인은 SARS-CoV-2 스파이크 단백질의 S1 서브유닛 도메인인, mRNA.
91. 단락 90에 있어서, 상기 S1 서브유닛은 가용성인, mRNA.
92. 단락 91에 있어서, 상기 항원은 서열번호 5의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 5의 아미노산 서열을 포함하는 것인, mRNA.
93. 단락 91 또는 단락 92에 있어서, 상기 오픈 리딩 프레임은 서열번호 3의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 3의 뉴클레오티드 서열을 포함하는 것인, mRNA.
94. 단락 90에 있어서, 상기 S1 서브유닛은 막횡단 도메인, 선택적으로 인플루엔자 혈구응집소 막횡단 도메인에 연결된 것인, mRNA.
95. 단락 94에 있어서, 상기 항원은 서열번호 17의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 17의 아미노산 서열을 포함하는 것인, mRNA.
96. 단락 94 또는 단락 95에 있어서, 상기 오픈 리딩 프레임은 서열번호 16의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 16의 뉴클레오티드 서열을 포함하는 것인, mRNA.
97. 단락 90에 있어서, 상기 S1 서브유닛은 S 단백질의 RBD 또는 RBD의 일부를 제거하도록 변형된 것인, mRNA.
98. 단락 97에 있어서, 상기 항원은 서열번호 20, 23, 26, 29, 32 또는 35 중 임의의 하나의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 20, 23, 26, 29, 32 또는 35 중 임의의 하나의 아미노산 서열을 포함하는 것인, mRNA.
99. 단락 97 또는 단락 98에 있어서, 상기 오픈 리딩 프레임은 서열번호 19, 22, 25, 28, 41, 또는 34 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 19, 22, 25, 28, 31, 또는 34 중 임의의 하나의 뉴클레오티드 서열을 포함하는 것인, mRNA.
100. 단락 90에 있어서, 상기 S1 서브유닛은 S 단백질의 S2 서브유닛에 연결된 것인, mRNA.
101.
단락 100에 있어서, 상기 S2 서브유닛은 SARS-CoV-2 S 단백질로부터 유래된 것이고, 일부 구현예에서 상기 S2 서브유닛은 서열번호 145의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하는 오픈 리딩 프레임을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 145의 뉴클레오티드 서열을 포함하는 것인, mRNA.
102. 단락 101에 있어서, 상기 S1 서브유닛은 HKU1 S 단백질로부터 유래된 것인, mRNA.
103. 단락 102에 있어서, 상기 항원은 서열번호 38의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 38의 아미노산 서열을 포함하는 것인, mRNA.
104. 단락 102 또는 단락 103에 있어서, 상기 오픈 리딩 프레임은 서열번호 37의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 37의 뉴클레오티드 서열을 포함하는 것인, mRNA.
105. 단락 101에 있어서, 상기 S1 서브유닛은 OC43 S 단백질로부터 유래된 것인, mRNA.
106. 단락 105에 있어서, 상기 항원은 서열번호 41의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 41의 아미노산 서열을 포함하는 것인, mRNA.
107. 단락 105 또는 단락 106에 있어서, 상기 오픈 리딩 프레임은 서열번호 40의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 40의 뉴클레오티드 서열을 포함하는 것인, mRNA.
108. 선행하는 단락 중 어느 한 단락에 있어서, 상기 항원은 페리틴, 루마진 합성효소 및 폴던으로부터 선택적으로 선택되는, 스캐폴드 도메인을 추가로 포함하는 것인, mRNA.
109. 단락 108에 있어서, 상기 스캐폴드 도메인은 페리틴인, mRNA.
110. 단락 109에 있어서, 상기 항원은 서열번호 8 또는 65의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 8 또는 65의 아미노산 서열을 포함하는 것인, mRNA.
111. 단락 109 또는 단락 110에 있어서, 상기 오픈 리딩 프레임은 서열번호 7 또는 64의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 7 또는 64의 뉴클레오티드 서열을 포함하는 것인, mRNA.
112. 단락 108에 있어서, 상기 스캐폴드 도메인은 루마진 합성효소인, mRNA.
113. 단락 112에 있어서, 상기 항원은 서열번호 11, 14, 68, 또는 71 중 임의의 하나의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 11, 14, 68, 또는 71 중 임의의 하나의 아미노산 서열을 포함하는 것인, mRNA.
114. 단락 112 또는 단락 113에 있어서, 상기 오픈 리딩 프레임은 서열번호 10, 13, 67, 또는 70 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 10, 13, 67, 또는 70 중 임의의 하나의 뉴클레오티드 서열을 포함하는 것인, mRNA.
115. 단락 108에 있어서, 상기 스캐폴드 도메인은 폴던인, mRNA.
116. 단락 115에 있어서, 상기 항원은 서열번호 44, 50, 74, 80, 83, 101, 104 또는 113 중 임의의 하나의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 44, 50, 74, 80, 83, 101, 104 또는 113 중 임의의 하나의 아미노산 서열을 포함하는 것인, mRNA.
117. 단락 115 또는 단락 116에 있어서, 상기 오픈 리딩 프레임은 서열번호 43, 49, 73, 79, 82, 100, 103, 또는 112 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 43, 49, 73, 79, 82, 100, 103, 또는 112 중 임의의 하나의 뉴클레오티드 서열을 포함하는 것인, mRNA.
118. 선행하는 단락 중 어느 한 단락에 있어서, 대식세포 마커, 선택적으로 CD86, CD11B 및/또는 VSVGct로부터 선택적으로 선택되는 트래피킹 신호를 추가로 포함하는 것인, mRNA.
119. 단락 118에 있어서, 상기 항원은 서열번호 95, 98, 또는 110 중 임의의 하나의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 95, 98, 또는 110 중 임의의 하나의 아미노산 서열을 포함하는 것인, mRNA.
120. 단락 118 또는 단락 119에 있어서, 상기 오픈 리딩 프레임은 서열번호 94, 97, 또는 109 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 94, 97, 또는 109 중 임의의 하나의 뉴클레오티드 서열을 포함하는 것인, mRNA.
121.지질 나노입자 내 제형화된 단락 67 내지 단락 120 중 어느 한 단락의 mRNA.
122. 단락 121에 있어서, 상기 지질 나노입자는 양이온성 지질, 선택적으로 이온화 가능한 양이온성 지질, 중성 지질, 스테롤, 및/또는 폴리에틸렌 글리콜(PEG)-변형된 지질을 포함하는 것인, mRNA.
123. 단락 108에 있어서, 상기 이온화 가능한 양이온성 지질은 헵타데칸-9-일 8((2 하이드록시에틸)(6 옥소 6-(운데실옥시)헥실)아미노)옥타노에이트 (화합물 1)이고, 중성 지질은 1,2 디스테아로일-sn-글리세로-3-포스포콜린(DSPC)이고, 스테롤은 콜레스테롤이고/이거나, PEG-변형된 지질은 1,2 디미리스토일-sn-글리세롤, 메톡시폴리에틸렌글리콜 (PEG2000 DMG)인, mRNA 또는 조성물.
124. 단락 121 내지 단락 123 중 어느 한 단락에 있어서, 상기 지질 나노입자는 20-60 mol%의 이온화 가능한 양이온성 지질, 5-25 mol%의 중성 지질, 25-55 mol%의 스테롤, 및 0.5-15 mol%의 PEG-변형된 지질을 포함하는 것인, mRNA 또는 조성물.
125. 단락 124에 있어서, 상기 지질 나노입자는
47 mol%의 이온화 가능한 양이온성 지질; 11.5 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 3.0 mol%의 PEG-변형된 지질;
48 mol%의 이온화 가능한 양이온성 지질; 11 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 2.5 mol%의 PEG-변형된 지질;
49 mol%의 이온화 가능한 양이온성 지질; 10.5 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 2.0 mol%의 PEG-변형된 지질;
50 mol%의 이온화 가능한 양이온성 지질; 10 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 1.5 mol%의 PEG-변형된 지질; 또는
51 mol%의 이온화 가능한 양이온성 지질; 9.5 mol%의 중성 지질; 38.5 mol%의 스테롤; 및 1.0 mol%의 PEG-변형된 지질:
을 포함하는 mRNA 또는 조성물.
126. 단락 125에 있어서, 상기 지질 나노입자는
47 mol%의 화합물 1; 11.5 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 3.0 mol%의 PEG2000 DMG;
48 mol%의 화합물 1; 11 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 2.5 mol%의 PEG2000 DMG;
49 mol%의 화합물 1; 10.5 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 2.0 mol%의 PEG2000 DMG;
50 mol%의 화합물 1; 10 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 1.5 mol%의 PEG2000 DMG; 또는
51 mol%의 화합물 1; 9.5 mol%의 DSPC; 38.5 mol%의 콜레스테롤; 및 1.0 mol%의 PEG2000 DMG:
를 포함하는 mRNA 또는 조성물.
127. SARS-CoV-2에 대한 중화 항체 반응을 대상체에서 유도하기에 효과적인 양으로 단락 67 내지 단락 126 중 어느 한 단락의 mRNA를 대상체에게 투여하는 단계를 포함하는 방법.
128. SARS-CoV-2에 대한 T 세포 면역 반응을 대상체에서 유도하기에 효과적인 양으로 단락 67 내지 단락 126 중 어느 한 단락의 mRNA를 대상체에게 투여하는 단계를 포함하는 방법.
실시예
실시예 1. 발현 데이터
본 연구에 사용된 mRNA를 사용하여 SARS-CoV-2 코로나바이러스 스파이크(S) 단백질의 주요 중화 도메인을 발현시켰으며, 이러한 중화 단백질 도메인은 살아서 확산되는 천연 바이러스에 의한 감염으로부터 사람들을 보호하기 위한 면역원성 조성물 또는 백신으로서 개별적으로 또는 조합하여 사용될 때 보호 면역을 유도하는데 더 효과적인지의 여부를 평가한다. mRNA에 의해 암호화된 단백질의 선형 디자인은 도 2에 도시되어 있다. 모든 단백질은 또한 인플루엔자의 혈구응집소(HA)로부터 유래된 카르복시(C) 말단 막횡단 도메인(TM)을 포함한다.
NTD 및 RBD 둘 다는 중화 바이러스 활성을 나타내는 항체의 결합을 위한 부위로 알려져 있다. SARS-CoV-2의 경우에 RBD는 스파이크 단백질의 수용체 결합 부위이며, 안지오텐신-전환 효소 2(ACE2)에 결합한다. 기능이 완전히 이해되지 않은, 아미노(N) 말단 도메인인 NTD는 당 모이어티에 결합하고, 스파이크 단백질의 융합 전 형태로부터 융합 후 형태로의 구조적 전이를 촉진하는 역할을 갖는 것으로 보인다. Zhou H, Chen Y, Zhang S 등 Nat Commun. 2019; 10(1): 3068을 참조한다. 그럼에도 불구하고, NTD 및 RBD 도메인 둘 다는 하기 논의되는 바와 같이 높은 결합 항체 및 중화 항체 역가를 유도한다.
mRNA RBD-TM 백신("SARS-CoV-2 RBD-TM"; 서열번호 75-77), mRNA NTD-TM 백신("SARS-CoV-2 NTD-TM"; 서열번호 45-47) 및 mRNA NTD-RBD-TM("SARS-CoV-1 NTD-RBD-TM"; 서열번호 90-92) 백신에 대한 발현 데이터는 SARS-CoV-2 스파이크 단백질의 수용체 결합 도메인(RBD)에 대해(mAb1) 및 SARS-CoV-2 스파이크 단백질의 N-말단 도메인(NTD)에 대해(Ab2) 특이적인 항체를 사용하여 표 16 및 표 17에 나타내었다. 표 16은 24시간(hr), 48 hr 및 72 hr째에 WT SARS-CoV-2 스파이크 단백질 mRNA(표 16)와 비교한 (희석 범위 전반에 걸친) MFI*Freq의 평균 배수 차이를 나타낸다.
표 16. S2P 단백질과 비교한 총 항원 발현(MFI * Freq) 배수 변화
RBD=수용체 결합 도메인
NTD=N-말단 도메인
TM=막횡단 도메인
실시예 2. 단일 용량 이후 21일차 면역원성 데이터 및 중화 데이터
mRNA NTD-TM 및 mRNA RBD-TM(실시예 1에 기재됨)을 하기 용량으로 마우스에 투여하였다: 0.001 μg, 0.01 μg, 0.1 μg 또는 1 μg(N=8). mRNA NTD-RBD-TM(실시예 1에 기재됨)을 하기 용량으로 마우스에 투여하였다: 0.1 μg 또는 1 μg(N=8). mRNA NTD-TM 및 mRNA RBD-TM의 50:50 혼합물을 마우스에 투여하였으며, 이때 0.2 μg의 총 mRNA에 대해 0.1 μg의 각각의 mRNA, 또는 2 μg의 총 mRNA에 대해 1 μg의 각각의 mRNA가 함유되었다(N=8). 이후, SARS-CoV-2 스파이크 단백질-특이적 IgG 역가(표 17), SARS-CoV-2 RBD-특이적 IgG 역가(표 18), 및 SARS-CoV-2 NTD-특이적 IgG 역가(표 19)는 백신 접종 후 21일째에 ELISA로 측정하였다. 데이터는 표 17-19에 제공된다. 0.1 μg 용량의 mRNA NTD-RBD-TM 및 0.2 μg 용량의 mRNA NTD-TM 및 mRNA RBD-TM 조성물의 50:50 혼합물은, 관찰 가능한 NTD-특이적 및 RBD-특이적 IgG 역가를 유도하였으며, 0.1 μg 용량의 RBD-TM 및 NTD-TM은 각각 RBD 및 NTD 항원에 대해 측정 가능한 IgG 역가를 유도하였다.
표 17. SARS-CoV-2 S1/S2 스파이크 단백질-특이적 IgG 역가 - 평균값
N=8의 평균; PBS 단독 = 1.1
표 18. RBD 도메인-특이적 IgG 역가 - 평균값
N=8의 평균; PBS 단독 = 1.1
표 19. NTD 도메인-특이적 IgG 역가 - 평균값
N=8의 평균; PBS 단독 = 1.1
1 μg 용량의 RBD-TM 및 NTD-RBD-TM 조성물 및 2 μg 용량의 NTD-TM 및 RBD-TM 조성물의 50:50 혼합물로 백신 접종한 마우스의 혈청으로부터 중화 역가를 측정하고, ELISA 역가 및 중화 역가 간의 상관관계를 분석하였다(도 7).
1 μg 용량의 NTD-RBD-TM 조성물 또는 2 μg 용량의 NTD-TM 및 RBD-TM 조성물의 50:50 혼합물에 의해 유도된 역가는 1 μg 용량의 RBD-TM 조성물에 의해 유도된 역가보다 더 컸다(표 20). 스파이크-특이적 IgG, RBD-특이적 IgG, 및 NTD-특이적 IgG의 중화 역가 및 ELISA 역가 간에는 유의미한 상관관계가 존재한다(도 7).
표 20. 중화 역가 - 평균값
N=8의 평균; PBS 단독 = 1.1
재조합 VSVΔG
-기반 SARS-CoV-2 슈도바이러스 중화 분석
코돈-최적화된 야생형 또는 D614G 스파이크 유전자(Wuhan-Hu-1 균주; NC_045512.2)를 pCAGGS 벡터에 클로닝하였다. VSVΔG-기반 SARS-CoV-2 슈도바이러스를 생성하기 위해, BHK-21/WI-2 세포를 스파이크 발현 플라스미드로 형질감염시키고, 이전에 기술한 바와 같이 VSVΔG-반딧불이-루시페라아제를 감염시켰다(Whitt, 2010). A549-hACE2-TMPRSS2 세포는 VSVΔG-기반 SARS-CoV-2 슈도바이러스 중화 분석을 위한 표적 세포로 사용하였다. hACE2-P2A-TMPRSS2를 암호화하는 렌티바이러스는 A549-hACE2-TMPRSS2 세포를 생성하도록 만들어졌으며, 이는 10% 소 태아 혈청 및 1 μg/mL 퓨로마이신이 보충된 DMEM에서 유지하였다. A549-hACE2-TMPRSS2 세포를 섭씨 37도에서 1시간 동안 슈도바이러스로 감염시켰다. 감염 후 접종 바이러스 또는 바이러스-항체 혼합을 제거하였다. 18 hr 후, 동일한 부피의 One-Glo 시약(Promega; E6120)을 BMG PHERastar-FS 플레이트 리더를 사용하여 판독하기 위해 배양 배지에 첨가하였다. 중화 절차 및 데이터 분석은 전술한 렌티바이러스-기반 슈도바이러스 중화 분석과 동일하다. Whitt, M.A.(2010)를 참조한다. Journal of Virological Methods 169, 365-374.
실시예 3. 2회 용량 이후 36일차 면역원성 데이터
실시예 2에 기재된 동일한 용량의 mRNA 백신을 제1 용량으로 백신 접종 후 22일째에 부스터 용량으로서 마우스에 다시 투여하였다. RBD 항원, NTD 항원, 야생형(WT) 스파이크(S) 단백질 및 S2P 단백질 (융합 전 형태를 안정화시키는 이중 프롤린 돌연변이를 갖는 S 단백질) 각각에 대한 부스터 용량 후 생산된 항체의 역가를 36일째 혈청으로부터 ELISA로 측정하고 하기에 나타내었다. LNP 내 mRNA에 의해 암호화된 RBD-TM 및 NTD-TM의 2가지 면역원성 조성물의 50:50 혼합물을 22일째에 부스터 용량으로서 마우스에 2 μg 또는 0.2 μg의 총 mRNA를 투여하고, 36일째에 역가를 측정하였다. 표 21을 참조한다.
LNP 내 mRNA에 의해 암호화된 RBD-TM, NTD-TM, 또는 NTD-RBD-TM로 면역화된 마우스에 따른 표 21에 나타낸 WT S 단백질 역가는 SARS-CoV-2 WT S 단백질을 인식하고 이에 결합할 수 있는 유도 항체로 시험된 모든 용량에서 2회 용량이 우수함을 나타내었다.
표 21. SARS-CoV-2 WT S-특이적 IgG 역가 - 기하 평균값
N=8의 평균; PBS 단독 = 1.1
LNP 내 mRNA에 의해 암호화된 RBD-TM, NTD-TM, 또는 NTD-RBD-TM의 2회 용량으로 면역화된 마우스의 혈청은 SARS-CoV-2 S2P 단백질을 인식하고 결합하는 항체의 능력에 대해 추가로 분석되었다. SARS-CoV-2 S2P 단백질에 대한 역가는 플레이트 상의 항원으로서 S2P를 사용하여 ELISA로 측정하였고, 하기 표 22에 나타내었다. 이들 면역원 각각은 S2P가 항원인 경우 대 WT S 단백질이 ELISA 항원인 경우 훨씬 더 높은 항체 역가를 유도하였다. 표 21 및 표 22를 비교한다.
표 22. SARS-CoV-2 S2P-특이적 IgG 역가 - 기하 평균값
N=8의 평균; PBS 단독 = 1.1
표 23에서, 면역원은 LNP 내 mRNA에 의해 암호화된 RBD-TM 및 NTD-TM의 50:50 혼합이었으며, WT S, RBD, NTD 및 S2P에 대한 역가는 1회 용량(21일) 및 2회 용량(36일) 후에 측정하였다. 이러한 결과는 면역원이 동일한 용량의 개별 항원에 의해 유도된 항체 역가와 비교하여 50:50 혼합의 RBD-TM 및 NTD-TM 조합인 경우 역가가 극적으로 증가하였음을 나타낸다. 50:50 혼합은 면역화 항원에 대해 우수한 역가를 유도하였으나, 놀랍게도 WT S 단백질에 대해 훨씬 더 우수한 역가 및 S2P 단백질에 대해 극도로 더 높은 역가를 유도하였다. 표 23을 참조한다.
표 23. SARS-CoV-2 항원-특이적 IgG 역가 - 기하 평균값
N=8의 평균; PBS 단독 = 1.1
표 24는 각각의 RBD-TM 및 NTD-TM을 해당 항원을 암호화하는 mRNA로서 사용한 면역화의 결과를 나타낸다. ELISA 플레이트 상의 항원으로서 mRNA 면역원에 의해 암호화된 단백질을 사용하여 8마리 마우스의 그룹에 대해 기하 평균 역가를 측정하였다. 또한, 면역원성 조성물 둘 다는 항원이 LNP 내 제형화된 mRNA로서 투여된 경우 면역화 항원에 대해 높은 역가를 유도하였다. 이 경우에, 2회 용량은 모든 농도에서 우수한 항체 반응을 생성하였다. 그러나, 마이크로그램 당 (μg) 기준으로 이러한 항원의 50:50 혼합은 항원을 단독으로 투여한 경우보다 약 10배 더 높은 항체 반응을 유도하였다. 표 23 및 표 24를 비교한다.
표 24. SARS-CoV-2 RBD 및 NTD 도메인 특이적 IgG 역가 - 기하 평균값
N=8의 평균; PBS 단독 = 1.1
RBD에 연결되고 LNP 내 mRNA에 의해 암호화된 NTD를 포함하는 융합 단백질은 1일째 및 21일째에 0.1 및 1 μg 용량으로 8마리의 마우스 그룹에 면역원성 조성물로서 투여하였다. 하기 표 25를 참조한다. NTD-RBD-TM의 융합 단백질 버전을 암호화하는 mRNA도 단일 도메인이 면역화 항원인 경우보다 더 높은 개별 도메인에 대한 매우 우수한 역가를 유도하였다. S2P 단백질에 대한 역가는 WT S 단백질에 대한 역가보다 약 8배 더 높았다. 표 25를 참조한다.
표 25. SARS-CoV-2 NTD-RBD-TM 도메인 특이적 IgG 역가 - 기하 평균값
N=8의 평균; PBS 단독 = 1.1
중화 데이터는 표 26에 나타내었다. mRNA에 의해 암호화된 S1-666-TM은 S1 서브도메인, 구체적으로 막횡단 도메인에 부착된 SARS-CoV-2 스파이크 단백질의 잔기 1-666을 사용하는 항원이다.
표 26. 1일째 및 22일째에 2회의 면역화 후 36일째의 평균 중화 역가.
N=8의 평균; PBS 단독 = 1.1
실시예 4. S1-666-TM의 면역원성
LNP 내 mRNA에 의해 암호화된 S1-666-TM (또는 스파이크 단백질 S의 S1 잔기 1-666)은 1일째에 프라임 면역화로서 마우스에 투여하였고, 0.01 μg 및 0.1 μg(N=8) 그룹의 경우 22일째에 부스터 용량으로서 투여하였다. 각각의 mRNA RBD, mRNA NTD 및 mRNA 야생형(WT) 스파이크(S) 단백질(도 1)에 대한 부스터 용량 후 생산된 항체의 역가는 21일째(부스트 전) 및 36일째(부스트 후)의 혈청을 ELISA로 측정하였으며, 하기 표 27에 나타내었다.
LNP 내 mRNA에 의해 암호화된 S1-666-TM으로 면역화된 마우스에 따른 표 27에 나타낸 WT S 단백질 역가는 SARS-CoV-2 WT S 단백질을 인식하고 이에 결합할 수 있는 유도 항체로 시험된 모든 용량에서 2회 용량이 우수함을 나타내었다. 놀랍게도, 유도된 역가는 S1에서 2P 돌연변이가 발견되지 않았음에도 불구하고 스파이크 단백질의 S2P 버전에 대해 측정한 경우 가장 높았으며, 이는 2P 돌연변이가 S2에서 발생하고 S2가 면역원에 존재하지 않기 때문이다. 다른 작제물과 유사하게, NTD 역가가 높아지도록 제2 용량이 필요하다.
표 27. SARS-CoV-2 항원-특이적 IgG 역가 - 기하 평균값
N=8의 평균; PBS 단독 = 1.1
실시예 5. 2회 용량 이후 36일차 RBD-TM, NTD-TM, NTD-RBD-TM, 및 NTD-TM/RBD-TM 조성물의 50:50 혼합물의 면역원성
해당 반복 실험에서, 상기 실시예에 기재된 동일한 용량의 mRNA 백신을 제1 용량으로 백신 접종 후 22일째에 부스터 용량으로서 마우스에 다시 투여하였다. 이후, SARS-CoV-2 스파이크 단백질-특이적 IgG 역가, SARS-CoV-2 S2P 단백질-특이적 IgG 역가, SARS-CoV-2 RBD-특이적 IgG 역가, 및 SARS-CoV-2 NTD-특이적 IgG 역가(는 제1 용량으로 백신 접종 후 36일째에 ELISA로 측정하였다.
결과는 1 μg 및 0.1 μg 용량의 mRNA RBD-TM, mRNA NTD-TM, mRNA NTD-RBD-TM 조성물, 및 1 μg 및 0.1 μg 각각의 mRNA RBD-TM 및 mRNA NTD-TM 조성물을 함유하는 50:50 혼합물이, SARS-CoV-2 스파이크 또는 SARS-CoV-2 S2P 단백질에 대해 높은 ELISA 역가를 유도하였음을 나타내었다.
실시예 6. 면역원성 연구
mRNA NTD-TM 및 mRNA RBD-TM의 50:50 혼합물의 면역원성을 하기 용량으로 마우스에 투여하였다: 0.2 μg 또는 2 μg 총 mRNA (0.1 μg 또는 1 μg의 각각의 mRNA) (N=8). 프라임 용량은 1일째에 투여하였고, 부스트 용량은 22일째에 투여하였다. 36일째에, ELISA를 사용하여 SARS-CoV-2 안정화된 융합 전 스파이크 단백질(SARS-CoV-2 pre-S)에 대한 항체 결합을 평가하였다. mRNA NTD-RBD-TM, mRNA RBD-TM 및 mRNA NTD-TM을 포함하는 하기 백신 조성물을 하기 용량으로 마우스에 투여하였다: 0.1 μg 또는 0.01 μg(N=8). GMT 데이터를 측정하고, 하기 표 28에 나타내었다.
표 28. S 단백질 도메인 융합 및 조합에 의해 유도된 SARS-CoV-2 스파이크 역가
실시예 7. NTD-RBD-TM에 대한 IgG2a 및 IgG1의 비율 측정
NTD-RBD-TM, mRNA NTD-RBD-TM의 조성물을 하기 용량으로 마우스에 투여하였다: 0.1 μg 또는 1 μg. 프라임 용량은 1일째에 투여하였고, 부스트 용량은 22일째에 투여하였다. 36일째에, S2P 특이적 IgG1 및 IgG2a 역가를 평가하였다. 도 7a-도 7c를 참조한다. 36일째까지, IgG2a의 역가는 용량 수준 둘 모두에서 IgG1의 양보다 더 높았다. 도 7a를 참조한다. T 세포 반응이 Th1 또는 Th2 유형의 반응으로 편향되는지의 여부를 규명하기 위해, 본 발명자들은 36일차 시점에서 IgG2a/IgG1의 비율을 플롯팅하였다. 도 7b에 나타낸 바와 같이, NTD-RBD-TM 조성물은 항체 면역 반응을 유도하며, 이는 완전히 Th1 유형의 반응 내에 있다. Th2 유형 반응은 질병 증강을 유도하는 것과의 연관성으로 인해 백신 개발에 있어서 불리하다.
실시예 8. 면역원성 연구
표 29에 열거된 mRNA를 하기 용량으로 마우스에 투여하였다: 0.1 μg 또는 1 μg(N=8). 프라임 용량은 1일째에 투여하였고, 부스트 용량은 22일째에 투여하였다. 혈청 IgG 역가는 21일째 및 36일째에 S2P 코팅된 플레이트 상에서 분석하였다. 결과는 표 29에 나타내었다.
표 29.
추가 서열
본원에 기술된 mRNA 서열 중 임의의 것이 5' UTR 및/또는 3' UTR을 포함할 수 있음을 이해해야 한다. UTR 서열은 하기 서열로부터 선택되거나, 다른 공지된 UTR 서열이 사용될 수 있다. 또한, 본원에 기술된 mRNA 작제물 중 임의의 것이 폴리(A) 꼬리 및/또는 캡(예를 들어, 7mG(5')ppp(5')NlmpNp)을 추가로 포함할 수 있음을 이해해야 한다. 추가로, 본원에 기술된 다수의 mRNA 및 암호화된 항원 서열은 신호 펩티드 및/또는 펩티드 태그(예를 들어, C-말단 His 태그)를 포함하지만, 표시된 신호 펩티드 및/또는 펩티드 태그가 다른 신호 펩티드 및/또는 펩티드 태그로 대체될 수 있거나, 신호 펩티드 및/또는 펩티드 태그가 생략될 수 있음을 이해해야 한다.
본원에 기술된 오픈 리딩 프레임 및/또는 상응하는 아미노산 서열 중 임의의 하나는 신호 서열을 포함하거나 제외할 수 있음을 또한 이해해야 한다.
본원에 개시된 모든 참조, 특허 및 특허 출원은 각각이 인용된 주제와 관련하여 참조로 포함되며, 일부 경우에는 문서의 전체를 포함할 수 있다.
상기 명세서 및 청구항에서 본원에 사용된 바와 같이, 부정관사 "한(a)" 및 "하나의(an)"는 명백하게 반대로 표시되지 않는 한, "적어도 하나"를 의미하는 것으로 이해되어야 한다. 또한, 명백하게 반대로 표시되지 않는 한, 하나 이상의 단계 또는 행위를 포함하는 본원에 청구된 임의의 방법에 있어서, 상기 방법의 단계 또는 행위의 순서는 반드시 상기 방법의 단계 또는 행위가 인용되는 순서로 제한되지 않는 것으로 이해되어야 한다.
청구항에서 뿐만 아니라 상기 명세서에서, 모든 전환 어구(transitional phrase), 예컨대 "포함하는", "비롯한", "동반하는", "갖는", "함유하는", "포괄하는", "보유하는", "구성된" 등은 개방형으로, 즉, 포함하나 이에 제한되지 않는 의미로 이해되어야 한다. 단지 상기 전환 어구 "구성되는" 및 "본질적으로 구성되는"은 미국 특허청의 특허 심사 절차 매뉴얼, 섹션 2111.03에 제시된 바와 같이, 각각 폐쇄형 또는 반-폐쇄형 전환 어구일 수 있다.
선행하는 수치의 용어 "약" 및 "실질적으로"는 인용된 수치의 평균 ± 10%를 의미한다.
값의 범위가 제공되는 경우, 범위의 상단과 하단 사이의 각 값이 본원에 구체적으로 고려되고 기술된다.
국제출원번호 PCT/US2015/02740호, PCT/US2016/043348호, PCT/US2016/043332호, PCT/US2016/058327호, PCT/US2016/058324호, PCT/US2016/058314호, PCT/US2016/058310호, PCT/US2016/058321호, PCT/US2016/058297호, PCT/US2016/058319호, 및 PCT/US2016/058314호의 전체 내용이 참조로 본원에 포함된다.
SEQUENCE LISTING
<110> ModernaTX, Inc.
<120> SARS-COV-2 mRNA DOMAIN VACCINES
<130> M1378.70157WO00
<140> Not Yet Assigned
<141> Concurrently Herewith
<150> US 63/063,137
<151> 2020-08-07
<150> US 63/044,330
<151> 2020-06-25
<150> US 63/016,175
<151> 2020-04-27
<150> US 62/971,825
<151> 2020-02-07
<160> 152
<170> PatentIn version 3.5
<210> 1
<211> 2216
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 1
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120
acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180
guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240
gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300
cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360
cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420
aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480
ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540
agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600
aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660
aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720
gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780
cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840
gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900
aacggcacca ucaccgacgc cguggacugc gcccuggacc cucugagcga gaccaagugc 960
acccugaaga gcuucaccgu ggagaagggc aucuaccaga ccagcaacuu ccgggugcag 1020
cccaccgaga gcaucgugcg guuccccaac aucaccaacc ugugccccuu cggcgaggug 1080
uucaacgcca cccgguucgc cagcguguac gccuggaacc ggaagcggau cagcaacugc 1140
guggccgacu acagcgugcu guacaacagc gccagcuuca gcaccuucaa gugcuacggc 1200
gugagcccca ccaagcugaa cgaccugugc uucaccaacg uguacgccga cagcuucgug 1260
auccguggcg acgaggugcg gcagaucgca cccggccaga caggcaagau cgccgacuac 1320
aacuacaagc ugcccgacga cuucaccggc ugcgugaucg ccuggaacag caacaaccuc 1380
gacagcaagg ugggcggcaa cuacaacuac cuguaccggc uguuccggaa gagcaaccug 1440
aagcccuucg agcgggacau cagcaccgag aucuaccaag ccggcuccac cccuugcaac 1500
ggcguggagg gcuucaacug cuacuucccu cugcagagcu acggcuucca gcccaccaac 1560
ggcgugggcu accagcccua ccggguggug gugcugagcu ucgagcugcu gcacgcccca 1620
gccaccgugu guggccccaa gaagagcacc aaccugguga agaacaagug cgugaacuuc 1680
aacuucaacg gccuuaccgg caccggcgug cugaccgaga gcaacaagaa auuccugccc 1740
uuucagcagu ucggccggga caucgccgac accaccgacg cugugcggga uccccagacc 1800
cuggagaucc uggacaucac cccuugcagc uucggcggcg ugagcgugau caccccaggc 1860
accaacacca gcaaccaggu ggccgugcug uaccaggacg ugaacugcac cgaggugccc 1920
guggccaucc acgccgacca gcugacaccc accuggcggg ucuacagcac cggcagcaac 1980
guguuccaga cccgggccgg uugccugauc ggcgccgagc acgugaacaa cagcuacgag 2040
ugcgacaucc ccaucggcgc cggcaucugu gccagcuacc agacccagac caauucauga 2100
uaauaggcug gagccucggu ggccuagcuu cuugccccuu gggccucccc ccagccccuc 2160
cuccccuucc ugcacccgua cccccguggu cuuugaauaa agucugagug ggcggc 2216
<210> 2
<211> 57
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 2
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccacc 57
<210> 3
<211> 2040
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 3
auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60
cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120
aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180
aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240
aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300
auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360
aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420
cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480
agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540
ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600
uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660
ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720
cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780
ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840
gagaacggca ccaucaccga cgccguggac ugcgcccugg acccucugag cgagaccaag 900
ugcacccuga agagcuucac cguggagaag ggcaucuacc agaccagcaa cuuccgggug 960
cagcccaccg agagcaucgu gcgguucccc aacaucacca accugugccc cuucggcgag 1020
guguucaacg ccacccgguu cgccagcgug uacgccugga accggaagcg gaucagcaac 1080
ugcguggccg acuacagcgu gcuguacaac agcgccagcu ucagcaccuu caagugcuac 1140
ggcgugagcc ccaccaagcu gaacgaccug ugcuucacca acguguacgc cgacagcuuc 1200
gugauccgug gcgacgaggu gcggcagauc gcacccggcc agacaggcaa gaucgccgac 1260
uacaacuaca agcugcccga cgacuucacc ggcugcguga ucgccuggaa cagcaacaac 1320
cucgacagca aggugggcgg caacuacaac uaccuguacc ggcuguuccg gaagagcaac 1380
cugaagcccu ucgagcggga caucagcacc gagaucuacc aagccggcuc caccccuugc 1440
aacggcgugg agggcuucaa cugcuacuuc ccucugcaga gcuacggcuu ccagcccacc 1500
aacggcgugg gcuaccagcc cuaccgggug guggugcuga gcuucgagcu gcugcacgcc 1560
ccagccaccg uguguggccc caagaagagc accaaccugg ugaagaacaa gugcgugaac 1620
uucaacuuca acggccuuac cggcaccggc gugcugaccg agagcaacaa gaaauuccug 1680
cccuuucagc aguucggccg ggacaucgcc gacaccaccg acgcugugcg ggauccccag 1740
acccuggaga uccuggacau caccccuugc agcuucggcg gcgugagcgu gaucacccca 1800
ggcaccaaca ccagcaacca gguggccgug cuguaccagg acgugaacug caccgaggug 1860
cccguggcca uccacgccga ccagcugaca cccaccuggc gggucuacag caccggcagc 1920
aacguguucc agacccgggc cgguugccug aucggcgccg agcacgugaa caacagcuac 1980
gagugcgaca uccccaucgg cgccggcauc ugugccagcu accagaccca gaccaauuca 2040
<210> 4
<211> 119
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 4
ugauaauagg cuggagccuc gguggccuag cuucuugccc cuugggccuc cccccagccc 60
cuccuccccu uccugcaccc guacccccgu ggucuuugaa uaaagucuga gugggcggc 119
<210> 5
<211> 680
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 5
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser
675 680
<210> 6
<211> 2729
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 6
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120
acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180
guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240
gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300
cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360
cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420
aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480
ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540
agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600
aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660
aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720
gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780
cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840
gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900
aacggcacca ucaccgacgc cguggacugc gcccuggacc cucugagcga gaccaagugc 960
acccugaaga gcuucaccgu ggagaagggc aucuaccaga ccagcaacuu ccgggugcag 1020
cccaccgaga gcaucgugcg guuccccaac aucaccaacc ugugccccuu cggcgaggug 1080
uucaacgcca cccgguucgc cagcguguac gccuggaacc ggaagcggau cagcaacugc 1140
guggccgacu acagcgugcu guacaacagc gccagcuuca gcaccuucaa gugcuacggc 1200
gugagcccca ccaagcugaa cgaccugugc uucaccaacg uguacgccga cagcuucgug 1260
auccguggcg acgaggugcg gcagaucgca cccggccaga caggcaagau cgccgacuac 1320
aacuacaagc ugcccgacga cuucaccggc ugcgugaucg ccuggaacag caacaaccuc 1380
gacagcaagg ugggcggcaa cuacaacuac cuguaccggc uguuccggaa gagcaaccug 1440
aagcccuucg agcgggacau cagcaccgag aucuaccaag ccggcuccac cccuugcaac 1500
ggcguggagg gcuucaacug cuacuucccu cugcagagcu acggcuucca gcccaccaac 1560
ggcgugggcu accagcccua ccggguggug gugcugagcu ucgagcugcu gcacgcccca 1620
gccaccgugu guggccccaa gaagagcacc aaccugguga agaacaagug cgugaacuuc 1680
aacuucaacg gccuuaccgg caccggcgug cugaccgaga gcaacaagaa auuccugccc 1740
uuucagcagu ucggccggga caucgccgac accaccgacg cugugcggga uccccagacc 1800
cuggagaucc uggacaucac cccuugcagc uucggcggcg ugagcgugau caccccaggc 1860
accaacacca gcaaccaggu ggccgugcug uaccaggacg ugaacugcac cgaggugccc 1920
guggccaucc acgccgacca gcugacaccc accuggcggg ucuacagcac cggcagcaac 1980
guguuccaga cccgggccgg uugccugauc ggcgccgagc acgugaacaa cagcuacgag 2040
ugcgacaucc ccaucggcgc cggcaucugu gccagcuacc agacccagac caauucagga 2100
ggaggcagcg gcggcgauau caucaagcuu cugaacgagc aaguuaacaa ggaaaugcag 2160
agcaguaauc ucuacaugag caugagcagc uggugcuaca cccacucccu ggacggagca 2220
ggccucuucc uguucgacca cgcagccgag gaguacgagc acgcuaagaa guugaucauu 2280
uucuugaacg agaacaacgu gcccgugcag cuaacgucaa ucagcgcacc ugagcacaag 2340
uucgagggcc ugacccagau cuuccagaag gccuacgaac acgaacagca caucuccgag 2400
agcaucaaca auauugugga ucacgcuauc aaguccaagg accacgcuac cuucaacuuc 2460
cugcaguggu acguggccga gcaacaugag gaggaggugc uguucaagga cauccuggac 2520
aagaucgagc ugaucgguaa ugagaaucac ggccuguacc uggccgacca guacgugaag 2580
ggcaucgcca agagccggaa gucaggcuca ugauaauagg cuggagccuc gguggccuag 2640
cuucuugccc cuugggccuc cccccagccc cuccuccccu uccugcaccc guacccccgu 2700
ggucuuugaa uaaagucuga gugggcggc 2729
<210> 7
<211> 2553
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 7
auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60
cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120
aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180
aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240
aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300
auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360
aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420
cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480
agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540
ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600
uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660
ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720
cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780
ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840
gagaacggca ccaucaccga cgccguggac ugcgcccugg acccucugag cgagaccaag 900
ugcacccuga agagcuucac cguggagaag ggcaucuacc agaccagcaa cuuccgggug 960
cagcccaccg agagcaucgu gcgguucccc aacaucacca accugugccc cuucggcgag 1020
guguucaacg ccacccgguu cgccagcgug uacgccugga accggaagcg gaucagcaac 1080
ugcguggccg acuacagcgu gcuguacaac agcgccagcu ucagcaccuu caagugcuac 1140
ggcgugagcc ccaccaagcu gaacgaccug ugcuucacca acguguacgc cgacagcuuc 1200
gugauccgug gcgacgaggu gcggcagauc gcacccggcc agacaggcaa gaucgccgac 1260
uacaacuaca agcugcccga cgacuucacc ggcugcguga ucgccuggaa cagcaacaac 1320
cucgacagca aggugggcgg caacuacaac uaccuguacc ggcuguuccg gaagagcaac 1380
cugaagcccu ucgagcggga caucagcacc gagaucuacc aagccggcuc caccccuugc 1440
aacggcgugg agggcuucaa cugcuacuuc ccucugcaga gcuacggcuu ccagcccacc 1500
aacggcgugg gcuaccagcc cuaccgggug guggugcuga gcuucgagcu gcugcacgcc 1560
ccagccaccg uguguggccc caagaagagc accaaccugg ugaagaacaa gugcgugaac 1620
uucaacuuca acggccuuac cggcaccggc gugcugaccg agagcaacaa gaaauuccug 1680
cccuuucagc aguucggccg ggacaucgcc gacaccaccg acgcugugcg ggauccccag 1740
acccuggaga uccuggacau caccccuugc agcuucggcg gcgugagcgu gaucacccca 1800
ggcaccaaca ccagcaacca gguggccgug cuguaccagg acgugaacug caccgaggug 1860
cccguggcca uccacgccga ccagcugaca cccaccuggc gggucuacag caccggcagc 1920
aacguguucc agacccgggc cgguugccug aucggcgccg agcacgugaa caacagcuac 1980
gagugcgaca uccccaucgg cgccggcauc ugugccagcu accagaccca gaccaauuca 2040
ggaggaggca gcggcggcga uaucaucaag cuucugaacg agcaaguuaa caaggaaaug 2100
cagagcagua aucucuacau gagcaugagc agcuggugcu acacccacuc ccuggacgga 2160
gcaggccucu uccuguucga ccacgcagcc gaggaguacg agcacgcuaa gaaguugauc 2220
auuuucuuga acgagaacaa cgugcccgug cagcuaacgu caaucagcgc accugagcac 2280
aaguucgagg gccugaccca gaucuuccag aaggccuacg aacacgaaca gcacaucucc 2340
gagagcauca acaauauugu ggaucacgcu aucaagucca aggaccacgc uaccuucaac 2400
uuccugcagu gguacguggc cgagcaacau gaggaggagg ugcuguucaa ggacauccug 2460
gacaagaucg agcugaucgg uaaugagaau cacggccugu accuggccga ccaguacgug 2520
aagggcaucg ccaagagccg gaagucaggc uca 2553
<210> 8
<211> 851
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 8
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Gly Gly Gly Ser Gly Gly Asp Ile
675 680 685
Ile Lys Leu Leu Asn Glu Gln Val Asn Lys Glu Met Gln Ser Ser Asn
690 695 700
Leu Tyr Met Ser Met Ser Ser Trp Cys Tyr Thr His Ser Leu Asp Gly
705 710 715 720
Ala Gly Leu Phe Leu Phe Asp His Ala Ala Glu Glu Tyr Glu His Ala
725 730 735
Lys Lys Leu Ile Ile Phe Leu Asn Glu Asn Asn Val Pro Val Gln Leu
740 745 750
Thr Ser Ile Ser Ala Pro Glu His Lys Phe Glu Gly Leu Thr Gln Ile
755 760 765
Phe Gln Lys Ala Tyr Glu His Glu Gln His Ile Ser Glu Ser Ile Asn
770 775 780
Asn Ile Val Asp His Ala Ile Lys Ser Lys Asp His Ala Thr Phe Asn
785 790 795 800
Phe Leu Gln Trp Tyr Val Ala Glu Gln His Glu Glu Glu Val Leu Phe
805 810 815
Lys Asp Ile Leu Asp Lys Ile Glu Leu Ile Gly Asn Glu Asn His Gly
820 825 830
Leu Tyr Leu Ala Asp Gln Tyr Val Lys Gly Ile Ala Lys Ser Arg Lys
835 840 845
Ser Gly Ser
850
<210> 9
<211> 2762
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 9
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
ggcauccugc ccagcccugg caugcccgcu cugcugagcc uggugagccu gcugagcgug 120
cugcugaugg gcugcguggc ugagaccggc augcagaucu acgagggcaa gcugaccgca 180
gagggccugc gguucggcau cguggccagc cgcgccaacc acgcucuggu ggaccggcuu 240
guggagggcg cuaucgacgc caucgugaga cacggcggcc gggaagagga caucacccug 300
gugcgggugu gcggcagcug ggagauuccc gucgccgccg gagaacuggc ccggaaggag 360
gacaucgacg ccgugaucgc caucggcgug cugugcagag gcgccacgcc cagcuucgac 420
uacaucgcca gcgaggugag caagggccug gccgaccuga gccuggagcu gcggaagccc 480
aucaccuucg gcgugaucac cgccgacacc cuggagcagg ccaucgaggc cgcaggcacc 540
ugccacggca acaagggcug ggaagccgcc cugugcgcca ucgagauggc caaccuguuc 600
aagagccugc ggggcggaag uggaggcucu gguggcagcg gaggaucugg cggcggcacc 660
acccggaccc agcugccacc agccuacacc aacagcuuca cccggggcgu cuacuacccc 720
gacaaggugu uccggagcag cguccugcac agcacccagg accuguuccu gcccuucuuc 780
agcaacguga ccugguucca cgccauccac gugagcggca ccaacggcac caagcgguuc 840
gacaaccccg ugcugcccuu caacgacggc guguacuucg ccagcaccga gaagagcaac 900
aucauccggg gcuggaucuu cggcaccacc cuggacagca agacccagag ccugcugauc 960
gugaauaacg ccaccaacgu ggugaucaag gugugcgagu uccaguucug caacgacccc 1020
uuccugggcg uguacuacca caagaacaac aagagcugga uggagagcga guuccgggug 1080
uacagcagcg ccaacaacug caccuucgag uacgugagcc agcccuuccu gauggaccug 1140
gagggcaagc agggcaacuu caagaaccug cgggaguucg uguucaagaa caucgacggc 1200
uacuucaaga ucuacagcaa gcacacccca aucaaccugg ugcgggaucu gccccagggc 1260
uucucagccc uggagccccu gguggaccug cccaucggca ucaacaucac ccgguuccag 1320
acccugcugg cccugcaccg gagcuaccug accccaggcg acagcagcag cggguggaca 1380
gcaggcgcgg cugcuuacua cgugggcuac cugcagcccc ggaccuuccu gcugaaguac 1440
aacgagaacg gcaccaucac cgacgccgug gacugcgccc uggacccucu gagcgagacc 1500
aagugcaccc ugaagagcuu caccguggag aagggcaucu accagaccag caacuuccgg 1560
gugcagccca ccgagagcau cgugcgguuc cccaacauca ccaaccugug ccccuucggc 1620
gagguguuca acgccacccg guucgccagc guguacgccu ggaaccggaa gcggaucagc 1680
aacugcgugg ccgacuacag cgugcuguac aacagcgcca gcuucagcac cuucaagugc 1740
uacggcguga gccccaccaa gcugaacgac cugugcuuca ccaacgugua cgccgacagc 1800
uucgugaucc guggcgacga ggugcggcag aucgcacccg gccagacagg caagaucgcc 1860
gacuacaacu acaagcugcc cgacgacuuc accggcugcg ugaucgccug gaacagcaac 1920
aaccucgaca gcaagguggg cggcaacuac aacuaccugu accggcuguu ccggaagagc 1980
aaccugaagc ccuucgagcg ggacaucagc accgagaucu accaagccgg cuccaccccu 2040
ugcaacggcg uggagggcuu caacugcuac uucccucugc agagcuacgg cuuccagccc 2100
accaacggcg ugggcuacca gcccuaccgg gugguggugc ugagcuucga gcugcugcac 2160
gccccagcca ccgugugugg ccccaagaag agcaccaacc uggugaagaa caagugcgug 2220
aacuucaacu ucaacggccu uaccggcacc ggcgugcuga ccgagagcaa caagaaauuc 2280
cugcccuuuc agcaguucgg ccgggacauc gccgacacca ccgacgcugu gcgggauccc 2340
cagacccugg agauccugga caucaccccu ugcagcuucg gcggcgugag cgugaucacc 2400
ccaggcacca acaccagcaa ccagguggcc gugcuguacc aggacgugaa cugcaccgag 2460
gugcccgugg ccauccacgc cgaccagcug acacccaccu ggcgggucua cagcaccggc 2520
agcaacgugu uccagacccg ggccgguugc cugaucggcg ccgagcacgu gaacaacagc 2580
uacgagugcg acauccccau cggcgccggc aucugugcca gcuaccagac ccagaccaau 2640
ucaugauaau aggcuggagc cucgguggcc uagcuucuug ccccuugggc cuccccccag 2700
ccccuccucc ccuuccugca cccguacccc cguggucuuu gaauaaaguc ugagugggcg 2760
gc 2762
<210> 10
<211> 2586
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 10
augggcaucc ugcccagccc uggcaugccc gcucugcuga gccuggugag ccugcugagc 60
gugcugcuga ugggcugcgu ggcugagacc ggcaugcaga ucuacgaggg caagcugacc 120
gcagagggcc ugcgguucgg caucguggcc agccgcgcca accacgcucu gguggaccgg 180
cuuguggagg gcgcuaucga cgccaucgug agacacggcg gccgggaaga ggacaucacc 240
cuggugcggg ugugcggcag cugggagauu cccgucgccg ccggagaacu ggcccggaag 300
gaggacaucg acgccgugau cgccaucggc gugcugugca gaggcgccac gcccagcuuc 360
gacuacaucg ccagcgaggu gagcaagggc cuggccgacc ugagccugga gcugcggaag 420
cccaucaccu ucggcgugau caccgccgac acccuggagc aggccaucga ggccgcaggc 480
accugccacg gcaacaaggg cugggaagcc gcccugugcg ccaucgagau ggccaaccug 540
uucaagagcc ugcggggcgg aaguggaggc ucugguggca gcggaggauc uggcggcggc 600
accacccgga cccagcugcc accagccuac accaacagcu ucacccgggg cgucuacuac 660
cccgacaagg uguuccggag cagcguccug cacagcaccc aggaccuguu ccugcccuuc 720
uucagcaacg ugaccugguu ccacgccauc cacgugagcg gcaccaacgg caccaagcgg 780
uucgacaacc ccgugcugcc cuucaacgac ggcguguacu ucgccagcac cgagaagagc 840
aacaucaucc ggggcuggau cuucggcacc acccuggaca gcaagaccca gagccugcug 900
aucgugaaua acgccaccaa cguggugauc aaggugugcg aguuccaguu cugcaacgac 960
cccuuccugg gcguguacua ccacaagaac aacaagagcu ggauggagag cgaguuccgg 1020
guguacagca gcgccaacaa cugcaccuuc gaguacguga gccagcccuu ccugauggac 1080
cuggagggca agcagggcaa cuucaagaac cugcgggagu ucguguucaa gaacaucgac 1140
ggcuacuuca agaucuacag caagcacacc ccaaucaacc uggugcggga ucugccccag 1200
ggcuucucag cccuggagcc ccugguggac cugcccaucg gcaucaacau cacccgguuc 1260
cagacccugc uggcccugca ccggagcuac cugaccccag gcgacagcag cagcgggugg 1320
acagcaggcg cggcugcuua cuacgugggc uaccugcagc cccggaccuu ccugcugaag 1380
uacaacgaga acggcaccau caccgacgcc guggacugcg cccuggaccc ucugagcgag 1440
accaagugca cccugaagag cuucaccgug gagaagggca ucuaccagac cagcaacuuc 1500
cgggugcagc ccaccgagag caucgugcgg uuccccaaca ucaccaaccu gugccccuuc 1560
ggcgaggugu ucaacgccac ccgguucgcc agcguguacg ccuggaaccg gaagcggauc 1620
agcaacugcg uggccgacua cagcgugcug uacaacagcg ccagcuucag caccuucaag 1680
ugcuacggcg ugagccccac caagcugaac gaccugugcu ucaccaacgu guacgccgac 1740
agcuucguga uccguggcga cgaggugcgg cagaucgcac ccggccagac aggcaagauc 1800
gccgacuaca acuacaagcu gcccgacgac uucaccggcu gcgugaucgc cuggaacagc 1860
aacaaccucg acagcaaggu gggcggcaac uacaacuacc uguaccggcu guuccggaag 1920
agcaaccuga agcccuucga gcgggacauc agcaccgaga ucuaccaagc cggcuccacc 1980
ccuugcaacg gcguggaggg cuucaacugc uacuucccuc ugcagagcua cggcuuccag 2040
cccaccaacg gcgugggcua ccagcccuac cggguggugg ugcugagcuu cgagcugcug 2100
cacgccccag ccaccgugug uggccccaag aagagcacca accuggugaa gaacaagugc 2160
gugaacuuca acuucaacgg ccuuaccggc accggcgugc ugaccgagag caacaagaaa 2220
uuccugcccu uucagcaguu cggccgggac aucgccgaca ccaccgacgc ugugcgggau 2280
ccccagaccc uggagauccu ggacaucacc ccuugcagcu ucggcggcgu gagcgugauc 2340
accccaggca ccaacaccag caaccaggug gccgugcugu accaggacgu gaacugcacc 2400
gaggugcccg uggccaucca cgccgaccag cugacaccca ccuggcgggu cuacagcacc 2460
ggcagcaacg uguuccagac ccgggccggu ugccugaucg gcgccgagca cgugaacaac 2520
agcuacgagu gcgacauccc caucggcgcc ggcaucugug ccagcuacca gacccagacc 2580
aauuca 2586
<210> 11
<211> 862
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 11
Met Gly Ile Leu Pro Ser Pro Gly Met Pro Ala Leu Leu Ser Leu Val
1 5 10 15
Ser Leu Leu Ser Val Leu Leu Met Gly Cys Val Ala Glu Thr Gly Met
20 25 30
Gln Ile Tyr Glu Gly Lys Leu Thr Ala Glu Gly Leu Arg Phe Gly Ile
35 40 45
Val Ala Ser Arg Ala Asn His Ala Leu Val Asp Arg Leu Val Glu Gly
50 55 60
Ala Ile Asp Ala Ile Val Arg His Gly Gly Arg Glu Glu Asp Ile Thr
65 70 75 80
Leu Val Arg Val Cys Gly Ser Trp Glu Ile Pro Val Ala Ala Gly Glu
85 90 95
Leu Ala Arg Lys Glu Asp Ile Asp Ala Val Ile Ala Ile Gly Val Leu
100 105 110
Cys Arg Gly Ala Thr Pro Ser Phe Asp Tyr Ile Ala Ser Glu Val Ser
115 120 125
Lys Gly Leu Ala Asp Leu Ser Leu Glu Leu Arg Lys Pro Ile Thr Phe
130 135 140
Gly Val Ile Thr Ala Asp Thr Leu Glu Gln Ala Ile Glu Ala Ala Gly
145 150 155 160
Thr Cys His Gly Asn Lys Gly Trp Glu Ala Ala Leu Cys Ala Ile Glu
165 170 175
Met Ala Asn Leu Phe Lys Ser Leu Arg Gly Gly Ser Gly Gly Ser Gly
180 185 190
Gly Ser Gly Gly Ser Gly Gly Gly Thr Thr Arg Thr Gln Leu Pro Pro
195 200 205
Ala Tyr Thr Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val
210 215 220
Phe Arg Ser Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe
225 230 235 240
Phe Ser Asn Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn
245 250 255
Gly Thr Lys Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val
260 265 270
Tyr Phe Ala Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe
275 280 285
Gly Thr Thr Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn
290 295 300
Ala Thr Asn Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp
305 310 315 320
Pro Phe Leu Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu
325 330 335
Ser Glu Phe Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr
340 345 350
Val Ser Gln Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe
355 360 365
Lys Asn Leu Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys
370 375 380
Ile Tyr Ser Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln
385 390 395 400
Gly Phe Ser Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn
405 410 415
Ile Thr Arg Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr
420 425 430
Pro Gly Asp Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr
435 440 445
Val Gly Tyr Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn
450 455 460
Gly Thr Ile Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu
465 470 475 480
Thr Lys Cys Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln
485 490 495
Thr Ser Asn Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro
500 505 510
Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg
515 520 525
Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val
530 535 540
Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys
545 550 555 560
Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn
565 570 575
Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile
580 585 590
Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro
595 600 605
Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp
610 615 620
Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys
625 630 635 640
Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln
645 650 655
Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe
660 665 670
Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln
675 680 685
Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala
690 695 700
Thr Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys
705 710 715 720
Val Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu
725 730 735
Ser Asn Lys Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala
740 745 750
Asp Thr Thr Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp
755 760 765
Ile Thr Pro Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr
770 775 780
Asn Thr Ser Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr
785 790 795 800
Glu Val Pro Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg
805 810 815
Val Tyr Ser Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu
820 825 830
Ile Gly Ala Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile
835 840 845
Gly Ala Gly Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser
850 855 860
<210> 12
<211> 2714
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 12
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120
acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180
guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240
gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300
cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360
cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420
aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480
ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540
agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600
aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660
aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720
gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780
cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840
gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900
aacggcacca ucaccgacgc cguggacugc gcccuggacc cucugagcga gaccaagugc 960
acccugaaga gcuucaccgu ggagaagggc aucuaccaga ccagcaacuu ccgggugcag 1020
cccaccgaga gcaucgugcg guuccccaac aucaccaacc ugugccccuu cggcgaggug 1080
uucaacgcca cccgguucgc cagcguguac gccuggaacc ggaagcggau cagcaacugc 1140
guggccgacu acagcgugcu guacaacagc gccagcuuca gcaccuucaa gugcuacggc 1200
gugagcccca ccaagcugaa cgaccugugc uucaccaacg uguacgccga cagcuucgug 1260
auccguggcg acgaggugcg gcagaucgca cccggccaga caggcaagau cgccgacuac 1320
aacuacaagc ugcccgacga cuucaccggc ugcgugaucg ccuggaacag caacaaccuc 1380
gacagcaagg ugggcggcaa cuacaacuac cuguaccggc uguuccggaa gagcaaccug 1440
aagcccuucg agcgggacau cagcaccgag aucuaccaag ccggcuccac cccuugcaac 1500
ggcguggagg gcuucaacug cuacuucccu cugcagagcu acggcuucca gcccaccaac 1560
ggcgugggcu accagcccua ccggguggug gugcugagcu ucgagcugcu gcacgcccca 1620
gccaccgugu guggccccaa gaagagcacc aaccugguga agaacaagug cgugaacuuc 1680
aacuucaacg gccuuaccgg caccggcgug cugaccgaga gcaacaagaa auuccugccc 1740
uuucagcagu ucggccggga caucgccgac accaccgacg cugugcggga uccccagacc 1800
cuggagaucc uggacaucac cccuugcagc uucggcggcg ugagcgugau caccccaggc 1860
accaacacca gcaaccaggu ggccgugcug uaccaggacg ugaacugcac cgaggugccc 1920
guggccaucc acgccgacca gcugacaccc accuggcggg ucuacagcac cggcagcaac 1980
guguuccaga cccgggccgg uugccugauc ggcgccgagc acgugaacaa cagcuacgag 2040
ugcgacaucc ccaucggcgc cggcaucugu gccagcuacc agacccagac caauucagga 2100
ggaggcuccg gaggcgguag cgcugagacc ggcaugcaga ucuacgaggg caagcugacc 2160
gcagagggcc ugcgguucgg caucguggcc agccgcgcca accacgcucu gguggaccgg 2220
cuuguggagg gcgcuaucga cgccaucgug agacacggcg gccgggaaga ggacaucacc 2280
cuggugcggg ugugcggcag cugggagauu cccgucgccg ccggagaacu ggcccggaag 2340
gaggacaucg acgccgugau cgccaucggc gugcugugca gaggcgccac gcccagcuuc 2400
gacuacaucg ccagcgaggu gagcaagggc cuggccgacc ugagccugga gcugcggaag 2460
cccaucaccu ucggcgugau caccgccgac acccuggagc aggccaucga ggccgcaggc 2520
accugccacg gcaacaaggg cugggaagcc gcccugugcg ccaucgagau ggccaaccug 2580
uucaagagcc ugcggugaua auaggcugga gccucggugg ccuagcuucu ugccccuugg 2640
gccucccccc agccccuccu ccccuuccug cacccguacc cccguggucu uugaauaaag 2700
ucugaguggg cggc 2714
<210> 13
<211> 2538
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 13
auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60
cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120
aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180
aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240
aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300
auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360
aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420
cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480
agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540
ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600
uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660
ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720
cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780
ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840
gagaacggca ccaucaccga cgccguggac ugcgcccugg acccucugag cgagaccaag 900
ugcacccuga agagcuucac cguggagaag ggcaucuacc agaccagcaa cuuccgggug 960
cagcccaccg agagcaucgu gcgguucccc aacaucacca accugugccc cuucggcgag 1020
guguucaacg ccacccgguu cgccagcgug uacgccugga accggaagcg gaucagcaac 1080
ugcguggccg acuacagcgu gcuguacaac agcgccagcu ucagcaccuu caagugcuac 1140
ggcgugagcc ccaccaagcu gaacgaccug ugcuucacca acguguacgc cgacagcuuc 1200
gugauccgug gcgacgaggu gcggcagauc gcacccggcc agacaggcaa gaucgccgac 1260
uacaacuaca agcugcccga cgacuucacc ggcugcguga ucgccuggaa cagcaacaac 1320
cucgacagca aggugggcgg caacuacaac uaccuguacc ggcuguuccg gaagagcaac 1380
cugaagcccu ucgagcggga caucagcacc gagaucuacc aagccggcuc caccccuugc 1440
aacggcgugg agggcuucaa cugcuacuuc ccucugcaga gcuacggcuu ccagcccacc 1500
aacggcgugg gcuaccagcc cuaccgggug guggugcuga gcuucgagcu gcugcacgcc 1560
ccagccaccg uguguggccc caagaagagc accaaccugg ugaagaacaa gugcgugaac 1620
uucaacuuca acggccuuac cggcaccggc gugcugaccg agagcaacaa gaaauuccug 1680
cccuuucagc aguucggccg ggacaucgcc gacaccaccg acgcugugcg ggauccccag 1740
acccuggaga uccuggacau caccccuugc agcuucggcg gcgugagcgu gaucacccca 1800
ggcaccaaca ccagcaacca gguggccgug cuguaccagg acgugaacug caccgaggug 1860
cccguggcca uccacgccga ccagcugaca cccaccuggc gggucuacag caccggcagc 1920
aacguguucc agacccgggc cgguugccug aucggcgccg agcacgugaa caacagcuac 1980
gagugcgaca uccccaucgg cgccggcauc ugugccagcu accagaccca gaccaauuca 2040
ggaggaggcu ccggaggcgg uagcgcugag accggcaugc agaucuacga gggcaagcug 2100
accgcagagg gccugcgguu cggcaucgug gccagccgcg ccaaccacgc ucugguggac 2160
cggcuugugg agggcgcuau cgacgccauc gugagacacg gcggccggga agaggacauc 2220
acccuggugc gggugugcgg cagcugggag auucccgucg ccgccggaga acuggcccgg 2280
aaggaggaca ucgacgccgu gaucgccauc ggcgugcugu gcagaggcgc cacgcccagc 2340
uucgacuaca ucgccagcga ggugagcaag ggccuggccg accugagccu ggagcugcgg 2400
aagcccauca ccuucggcgu gaucaccgcc gacacccugg agcaggccau cgaggccgca 2460
ggcaccugcc acggcaacaa gggcugggaa gccgcccugu gcgccaucga gauggccaac 2520
cuguucaaga gccugcgg 2538
<210> 14
<211> 846
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 14
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Gly Gly Gly Ser Gly Gly Gly Ser
675 680 685
Ala Glu Thr Gly Met Gln Ile Tyr Glu Gly Lys Leu Thr Ala Glu Gly
690 695 700
Leu Arg Phe Gly Ile Val Ala Ser Arg Ala Asn His Ala Leu Val Asp
705 710 715 720
Arg Leu Val Glu Gly Ala Ile Asp Ala Ile Val Arg His Gly Gly Arg
725 730 735
Glu Glu Asp Ile Thr Leu Val Arg Val Cys Gly Ser Trp Glu Ile Pro
740 745 750
Val Ala Ala Gly Glu Leu Ala Arg Lys Glu Asp Ile Asp Ala Val Ile
755 760 765
Ala Ile Gly Val Leu Cys Arg Gly Ala Thr Pro Ser Phe Asp Tyr Ile
770 775 780
Ala Ser Glu Val Ser Lys Gly Leu Ala Asp Leu Ser Leu Glu Leu Arg
785 790 795 800
Lys Pro Ile Thr Phe Gly Val Ile Thr Ala Asp Thr Leu Glu Gln Ala
805 810 815
Ile Glu Ala Ala Gly Thr Cys His Gly Asn Lys Gly Trp Glu Ala Ala
820 825 830
Leu Cys Ala Ile Glu Met Ala Asn Leu Phe Lys Ser Leu Arg
835 840 845
<210> 15
<211> 2300
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 15
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120
acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180
guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240
gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300
cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360
cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420
aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480
ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540
agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600
aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660
aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720
gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780
cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840
gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900
aacggcacca ucaccgacgc cguggacugc gcccuggacc cucugagcga gaccaagugc 960
acccugaaga gcuucaccgu ggagaagggc aucuaccaga ccagcaacuu ccgggugcag 1020
cccaccgaga gcaucgugcg guuccccaac aucaccaacc ugugccccuu cggcgaggug 1080
uucaacgcca cccgguucgc cagcguguac gccuggaacc ggaagcggau cagcaacugc 1140
guggccgacu acagcgugcu guacaacagc gccagcuuca gcaccuucaa gugcuacggc 1200
gugagcccca ccaagcugaa cgaccugugc uucaccaacg uguacgccga cagcuucgug 1260
auccguggcg acgaggugcg gcagaucgca cccggccaga caggcaagau cgccgacuac 1320
aacuacaagc ugcccgacga cuucaccggc ugcgugaucg ccuggaacag caacaaccuc 1380
gacagcaagg ugggcggcaa cuacaacuac cuguaccggc uguuccggaa gagcaaccug 1440
aagcccuucg agcgggacau cagcaccgag aucuaccaag ccggcuccac cccuugcaac 1500
ggcguggagg gcuucaacug cuacuucccu cugcagagcu acggcuucca gcccaccaac 1560
ggcgugggcu accagcccua ccggguggug gugcugagcu ucgagcugcu gcacgcccca 1620
gccaccgugu guggccccaa gaagagcacc aaccugguga agaacaagug cgugaacuuc 1680
aacuucaacg gccuuaccgg caccggcgug cugaccgaga gcaacaagaa auuccugccc 1740
uuucagcagu ucggccggga caucgccgac accaccgacg cugugcggga uccccagacc 1800
cuggagaucc uggacaucac cccuugcagc uucggcggcg ugagcgugau caccccaggc 1860
accaacacca gcaaccaggu ggccgugcug uaccaggacg ugaacugcac cgaggugccc 1920
guggccaucc acgccgacca gcugacaccc accuggcggg ucuacagcac cggcagcaac 1980
guguuccaga cccgggccgg uugccugauc ggcgccgagc acgugaacaa cagcuacgag 2040
ugcgacaucc ccaucggcgc cggcaucugu gccagcuacc agacccagac caauucaucu 2100
ggcggaggca gcauccuggc caucuacagc accguggcca gcagccuggu gcugcuggug 2160
agccugggcg ccaucagcuu cugauaauag gcuggagccu cgguggccua gcuucuugcc 2220
ccuugggccu ccccccagcc ccuccucccc uuccugcacc cguacccccg uggucuuuga 2280
auaaagucug agugggcggc 2300
<210> 16
<211> 2124
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 16
auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60
cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120
aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180
aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240
aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300
auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360
aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420
cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480
agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540
ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600
uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660
ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720
cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780
ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840
gagaacggca ccaucaccga cgccguggac ugcgcccugg acccucugag cgagaccaag 900
ugcacccuga agagcuucac cguggagaag ggcaucuacc agaccagcaa cuuccgggug 960
cagcccaccg agagcaucgu gcgguucccc aacaucacca accugugccc cuucggcgag 1020
guguucaacg ccacccgguu cgccagcgug uacgccugga accggaagcg gaucagcaac 1080
ugcguggccg acuacagcgu gcuguacaac agcgccagcu ucagcaccuu caagugcuac 1140
ggcgugagcc ccaccaagcu gaacgaccug ugcuucacca acguguacgc cgacagcuuc 1200
gugauccgug gcgacgaggu gcggcagauc gcacccggcc agacaggcaa gaucgccgac 1260
uacaacuaca agcugcccga cgacuucacc ggcugcguga ucgccuggaa cagcaacaac 1320
cucgacagca aggugggcgg caacuacaac uaccuguacc ggcuguuccg gaagagcaac 1380
cugaagcccu ucgagcggga caucagcacc gagaucuacc aagccggcuc caccccuugc 1440
aacggcgugg agggcuucaa cugcuacuuc ccucugcaga gcuacggcuu ccagcccacc 1500
aacggcgugg gcuaccagcc cuaccgggug guggugcuga gcuucgagcu gcugcacgcc 1560
ccagccaccg uguguggccc caagaagagc accaaccugg ugaagaacaa gugcgugaac 1620
uucaacuuca acggccuuac cggcaccggc gugcugaccg agagcaacaa gaaauuccug 1680
cccuuucagc aguucggccg ggacaucgcc gacaccaccg acgcugugcg ggauccccag 1740
acccuggaga uccuggacau caccccuugc agcuucggcg gcgugagcgu gaucacccca 1800
ggcaccaaca ccagcaacca gguggccgug cuguaccagg acgugaacug caccgaggug 1860
cccguggcca uccacgccga ccagcugaca cccaccuggc gggucuacag caccggcagc 1920
aacguguucc agacccgggc cgguugccug aucggcgccg agcacgugaa caacagcuac 1980
gagugcgaca uccccaucgg cgccggcauc ugugccagcu accagaccca gaccaauuca 2040
ucuggcggag gcagcauccu ggccaucuac agcaccgugg ccagcagccu ggugcugcug 2100
gugagccugg gcgccaucag cuuc 2124
<210> 17
<211> 707
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 17
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Gly Gly Gly Ser Ile Leu Ala Ile
675 680 685
Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val Ser Leu Gly Ala
690 695 700
Ile Ser Phe
705
<210> 18
<211> 1853
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 18
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120
acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180
guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240
gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300
cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360
cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420
aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480
ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540
agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600
aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660
aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720
gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780
cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840
gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900
aacggcacca ucaccgacgc cguggacugc gcccuggacc cucugagcga gaccaagugc 960
acccugaaga gcuucaccgu ggagaagggc aucuaccaga ccagcaacuu ccgggugcag 1020
cccaccgaga gcaucgugcg guuccccaac aucaccaacc ugugccccuu cggcgaggug 1080
uucaacgcca cccgguucgc cagcguguac gccuggaacc ggaagcggau cagcaacugc 1140
guggccgacu acagcgugcu guacaacagc gccagcuuca gcaccuucaa gugcuacggc 1200
gugagcccca ccaagcugaa cgaccugugc uucaccaacg uguacgccga cagcuucgug 1260
auccguggcg acgaggugcg gcagaucgca cccggccaga caggcaagau cgccgacuac 1320
aacuacaagc ugcccgacga cuucaccggc ugcgugaucg ccuggaacag caacaaccuc 1380
gacagcaagg ugggcggcaa cuacaacuac cuguaccggc uguuccggaa gagcaaccug 1440
aagcccuucg agcgggacau cagcaccgag aucuaccaag ccggcuccac cccuugcaac 1500
ggcguggagg gcuucaacug cuacuucccu cugcagagcu acggcuucca gcccaccaac 1560
ggcgugggcu accagcccua ccggguggug gugcugagcu ucgagcugcu gcacgcccca 1620
gccaccgugu guggccccaa gaagagcacc ucuggcggag gcagcauccu ggccaucuac 1680
agcaccgugg ccagcagccu ggugcugcug gugagccugg gcgccaucag cuucugauaa 1740
uaggcuggag ccucgguggc cuagcuucuu gccccuuggg ccucccccca gccccuccuc 1800
cccuuccugc acccguaccc ccguggucuu ugaauaaagu cugagugggc ggc 1853
<210> 19
<211> 1677
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 19
auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60
cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120
aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180
aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240
aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300
auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360
aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420
cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480
agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540
ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600
uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660
ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720
cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780
ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840
gagaacggca ccaucaccga cgccguggac ugcgcccugg acccucugag cgagaccaag 900
ugcacccuga agagcuucac cguggagaag ggcaucuacc agaccagcaa cuuccgggug 960
cagcccaccg agagcaucgu gcgguucccc aacaucacca accugugccc cuucggcgag 1020
guguucaacg ccacccgguu cgccagcgug uacgccugga accggaagcg gaucagcaac 1080
ugcguggccg acuacagcgu gcuguacaac agcgccagcu ucagcaccuu caagugcuac 1140
ggcgugagcc ccaccaagcu gaacgaccug ugcuucacca acguguacgc cgacagcuuc 1200
gugauccgug gcgacgaggu gcggcagauc gcacccggcc agacaggcaa gaucgccgac 1260
uacaacuaca agcugcccga cgacuucacc ggcugcguga ucgccuggaa cagcaacaac 1320
cucgacagca aggugggcgg caacuacaac uaccuguacc ggcuguuccg gaagagcaac 1380
cugaagcccu ucgagcggga caucagcacc gagaucuacc aagccggcuc caccccuugc 1440
aacggcgugg agggcuucaa cugcuacuuc ccucugcaga gcuacggcuu ccagcccacc 1500
aacggcgugg gcuaccagcc cuaccgggug guggugcuga gcuucgagcu gcugcacgcc 1560
ccagccaccg uguguggccc caagaagagc accucuggcg gaggcagcau ccuggccauc 1620
uacagcaccg uggccagcag ccuggugcug cuggugagcc ugggcgccau cagcuuc 1677
<210> 20
<211> 559
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 20
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Ser Gly Gly Gly Ser Ile Leu Ala Ile Tyr Ser Thr Val
530 535 540
Ala Ser Ser Leu Val Leu Leu Val Ser Leu Gly Ala Ile Ser Phe
545 550 555
<210> 21
<211> 2042
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 21
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120
acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180
guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240
gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300
cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360
cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420
aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480
ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540
agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600
aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660
aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720
gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780
cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840
gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900
aacggcacca ucaccgacgc cguggacugc gcccuggacc cucugagcga gaccaagugc 960
acccugaaga gcuucaccgu ggagaagggc aucuaccaga ccagcaacuu ccgggugcag 1020
cccaccgaga gcaucgugcg guuccccaac aucaccaacc ugugccccuu cggcgaggug 1080
uucaacgcca cccgguucgc cagcguguac gccuggaacc ggaagcggau cagcaacugc 1140
guggccgacu acagcgugcu guacaacagc gccagcuuca gcaccuucaa gugcuacggc 1200
gugagcccca ccaagcugaa cgaccugugc uucaccaacg uguacgccga cagcuucgug 1260
auccguggcg acgaggugcg gcagaucgca cccggccaga caggcaagau cgccgacuac 1320
aacuacaagc ugcccgacga cuucaccggc ugcgugaucg ccuggaacag caacaaccuc 1380
gacagcaagg ugggcggcaa cuacaacuac cuguaccggc uguuccggaa gagcaaccug 1440
aagcccuucg agcgggacau cagcaccgag aucuaccaag ccggcuccac cccuugcaac 1500
ggcguggagg gcuucaacug cuacuucccu cugcagagcu acggcuucca gcccaccaac 1560
ggcgugggcu accagcccua ccggguggug gugcugagcu ucgagcugcu gcacgcccca 1620
gccaccgugu guggccccaa gaagagcacc aaccugguga agaacaagug cgugaacuuc 1680
aacuucaacg gccuuaccgg caccggcgug cugaccgaga gcaacaagaa auuccugccc 1740
uuucagcagu ucggccggga caucgccgac accaccgacg cugugcggga uccccagacc 1800
cuggagaucc uggacaucac cccuugcagc uucggcggcu cuggcggagg cagcauccug 1860
gccaucuaca gcaccguggc cagcagccug gugcugcugg ugagccuggg cgccaucagc 1920
uucugauaau aggcuggagc cucgguggcc uagcuucuug ccccuugggc cuccccccag 1980
ccccuccucc ccuuccugca cccguacccc cguggucuuu gaauaaaguc ugagugggcg 2040
gc 2042
<210> 22
<211> 1866
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 22
auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60
cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120
aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180
aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240
aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300
auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360
aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420
cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480
agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540
ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600
uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660
ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720
cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780
ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840
gagaacggca ccaucaccga cgccguggac ugcgcccugg acccucugag cgagaccaag 900
ugcacccuga agagcuucac cguggagaag ggcaucuacc agaccagcaa cuuccgggug 960
cagcccaccg agagcaucgu gcgguucccc aacaucacca accugugccc cuucggcgag 1020
guguucaacg ccacccgguu cgccagcgug uacgccugga accggaagcg gaucagcaac 1080
ugcguggccg acuacagcgu gcuguacaac agcgccagcu ucagcaccuu caagugcuac 1140
ggcgugagcc ccaccaagcu gaacgaccug ugcuucacca acguguacgc cgacagcuuc 1200
gugauccgug gcgacgaggu gcggcagauc gcacccggcc agacaggcaa gaucgccgac 1260
uacaacuaca agcugcccga cgacuucacc ggcugcguga ucgccuggaa cagcaacaac 1320
cucgacagca aggugggcgg caacuacaac uaccuguacc ggcuguuccg gaagagcaac 1380
cugaagcccu ucgagcggga caucagcacc gagaucuacc aagccggcuc caccccuugc 1440
aacggcgugg agggcuucaa cugcuacuuc ccucugcaga gcuacggcuu ccagcccacc 1500
aacggcgugg gcuaccagcc cuaccgggug guggugcuga gcuucgagcu gcugcacgcc 1560
ccagccaccg uguguggccc caagaagagc accaaccugg ugaagaacaa gugcgugaac 1620
uucaacuuca acggccuuac cggcaccggc gugcugaccg agagcaacaa gaaauuccug 1680
cccuuucagc aguucggccg ggacaucgcc gacaccaccg acgcugugcg ggauccccag 1740
acccuggaga uccuggacau caccccuugc agcuucggcg gcucuggcgg aggcagcauc 1800
cuggccaucu acagcaccgu ggccagcagc cuggugcugc uggugagccu gggcgccauc 1860
agcuuc 1866
<210> 23
<211> 622
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 23
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Ser Gly Gly Gly Ser Ile Leu Ala Ile Tyr Ser Thr Val Ala
595 600 605
Ser Ser Leu Val Leu Leu Val Ser Leu Gly Ala Ile Ser Phe
610 615 620
<210> 24
<211> 2066
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 24
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120
acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180
guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240
gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300
cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360
cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420
aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480
ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540
agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600
aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660
aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720
gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780
cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840
gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900
aacggcacca ucaccgacgc cguggacugc gcccuggacc cucugagcga gaccaagugc 960
acccugaaga gcuucaccgu gggcagcggc ggcggcagcg gcggaggcag cggaggaggc 1020
agcggcggag gcaguggagg ccagcccacc gagagcaucg ugcgguuccc caacaucacc 1080
aaccugugcc ccuucggcga gguguucaac gccacccggu ucgccagcgu guacgccugg 1140
aaccggaagc ggaucagcaa cugcguggcc gacuacagcg ugcuguacaa cagcgccagc 1200
uucagcaccu ucaagugcua cggcgugagc cccaccaagc ugaacgaccu gugcuucacc 1260
aacguguacg ccgacagcuu cgugauccgu ggcgacgagg ugcggcagau cgcacccggc 1320
cagacaggca agaucgccga cuacaacuac aagcugcccg acgacuucac cggcugcgug 1380
aucgccugga acagcaacaa ccucgacagc aaggugggcg gcaacuacaa cuaccuguac 1440
cggcuguucc ggaagagcaa ccugaagccc uucgagcggg acaucagcac cgagaucuac 1500
caagccggcu ccaccccuug caacggcgug gagggcuuca acugcuacuu cccucugcag 1560
agcuacggcu uccagcccac caacggcgug ggcuaccagc ccuaccgggu gguggugcug 1620
agcuucgagc ugcugcacgc cccagccacc guguguggcc ccaagaagag caccaaccug 1680
gugaagaaca agugcgugaa cuucaacuuc aacggccuua ccggcaccgg cgugcugacc 1740
gagagcaaca agaaauuccu gcccuuucag caguucggcc gggacaucgc cgacaccacc 1800
gacgcugugc gggaucccca gacccuggag auccuggaca ucaccccuug cagcuucggc 1860
ggcucuggcg gaggcagcau ccuggccauc uacagcaccg uggccagcag ccuggugcug 1920
cuggugagcc ugggcgccau cagcuucuga uaauaggcug gagccucggu ggccuagcuu 1980
cuugccccuu gggccucccc ccagccccuc cuccccuucc ugcacccgua cccccguggu 2040
cuuugaauaa agucugagug ggcggc 2066
<210> 25
<211> 1890
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 25
auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60
cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120
aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180
aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240
aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300
auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360
aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420
cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480
agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540
ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600
uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660
ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720
cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780
ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840
gagaacggca ccaucaccga cgccguggac ugcgcccugg acccucugag cgagaccaag 900
ugcacccuga agagcuucac cgugggcagc ggcggcggca gcggcggagg cagcggagga 960
ggcagcggcg gaggcagugg aggccagccc accgagagca ucgugcgguu ccccaacauc 1020
accaaccugu gccccuucgg cgagguguuc aacgccaccc gguucgccag cguguacgcc 1080
uggaaccgga agcggaucag caacugcgug gccgacuaca gcgugcugua caacagcgcc 1140
agcuucagca ccuucaagug cuacggcgug agccccacca agcugaacga ccugugcuuc 1200
accaacgugu acgccgacag cuucgugauc cguggcgacg aggugcggca gaucgcaccc 1260
ggccagacag gcaagaucgc cgacuacaac uacaagcugc ccgacgacuu caccggcugc 1320
gugaucgccu ggaacagcaa caaccucgac agcaaggugg gcggcaacua caacuaccug 1380
uaccggcugu uccggaagag caaccugaag cccuucgagc gggacaucag caccgagauc 1440
uaccaagccg gcuccacccc uugcaacggc guggagggcu ucaacugcua cuucccucug 1500
cagagcuacg gcuuccagcc caccaacggc gugggcuacc agcccuaccg ggugguggug 1560
cugagcuucg agcugcugca cgccccagcc accgugugug gccccaagaa gagcaccaac 1620
cuggugaaga acaagugcgu gaacuucaac uucaacggcc uuaccggcac cggcgugcug 1680
accgagagca acaagaaauu ccugcccuuu cagcaguucg gccgggacau cgccgacacc 1740
accgacgcug ugcgggaucc ccagacccug gagauccugg acaucacccc uugcagcuuc 1800
ggcggcucug gcggaggcag cauccuggcc aucuacagca ccguggccag cagccuggug 1860
cugcugguga gccugggcgc caucagcuuc 1890
<210> 26
<211> 630
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 26
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly
305 310 315 320
Gly Ser Gly Gly Gly Ser Gly Gly Gln Pro Thr Glu Ser Ile Val Arg
325 330 335
Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala
340 345 350
Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn
355 360 365
Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr
370 375 380
Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe
385 390 395 400
Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg
405 410 415
Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys
420 425 430
Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn
435 440 445
Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe
450 455 460
Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile
465 470 475 480
Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys
485 490 495
Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly
500 505 510
Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala
515 520 525
Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn
530 535 540
Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu
545 550 555 560
Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp
565 570 575
Ile Ala Asp Thr Thr Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile
580 585 590
Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Ser Gly Gly Gly Ser Ile
595 600 605
Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val Ser
610 615 620
Leu Gly Ala Ile Ser Phe
625 630
<210> 27
<211> 2066
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 27
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120
acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180
gugugccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240
gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300
cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360
cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420
aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480
ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540
agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600
aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660
aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720
gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780
cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840
gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900
aacggcacca ucaccgacgc cguggacugc gcccuggacc cucugagcga gaccaagugc 960
acccugaaga gcuucaccgu gggcagcggc ggcggcagcg gcggaggcag cggaggaggc 1020
agcggcggag gcaguggagg ccagcccacc gagagcaucg ugcgguuccc caacaucacc 1080
aaccugugcc ccuucggcga gguguucaac gccacccggu ucgccagcgu guacgccugg 1140
aaccggaagc ggaucagcaa cugcguggcc gacuacagcg ugcuguacaa cagcgccagc 1200
uucagcaccu ucaagugcua cggcgugagc cccaccaagc ugaacgaccu gugcuucacc 1260
aacguguacg ccgacagcuu cgugauccgu ggcgacgagg ugcggcagau cgcacccggc 1320
cagacaggca agaucgccga cuacaacuac aagcugcccg acgacuucac cggcugcgug 1380
aucgccugga acagcaacaa ccucgacagc aaggugggcg gcaacuacaa cuaccuguac 1440
cggcuguucc ggaagagcaa ccugaagccc uucgagcggg acaucagcac cgagaucuac 1500
caagccggcu ccaccccuug caacggcgug gagggcuuca acugcuacuu cccucugcag 1560
agcuacggcu uccagcccac caacggcgug ggcuaccagc ccuaccgggu gguggugcug 1620
agcuucgagc ugcugcacgc cccagccacc guguguggcc ccaagaagag caccaaccug 1680
gugaagaaca agugcgugaa cuucaacuuc aacggccuua ccggcaccgg cgugcugacc 1740
gagagcaaca agaaauuccu gcccuuuugc caguucggcc gggacaucgc cgacaccacc 1800
gacgcugugc gggaucccca gacccuggag auccuggaca ucaccccuug cagcuucggc 1860
ggcucuggcg gaggcagcau ccuggccauc uacagcaccg uggccagcag ccuggugcug 1920
cuggugagcc ugggcgccau cagcuucuga uaauaggcug gagccucggu ggccuagcuu 1980
cuugccccuu gggccucccc ccagccccuc cuccccuucc ugcacccgua cccccguggu 2040
cuuugaauaa agucugagug ggcggc 2066
<210> 28
<211> 1890
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 28
auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60
cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120
aaggugugcc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180
aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240
aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300
auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360
aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420
cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480
agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540
ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600
uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660
ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720
cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780
ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840
gagaacggca ccaucaccga cgccguggac ugcgcccugg acccucugag cgagaccaag 900
ugcacccuga agagcuucac cgugggcagc ggcggcggca gcggcggagg cagcggagga 960
ggcagcggcg gaggcagugg aggccagccc accgagagca ucgugcgguu ccccaacauc 1020
accaaccugu gccccuucgg cgagguguuc aacgccaccc gguucgccag cguguacgcc 1080
uggaaccgga agcggaucag caacugcgug gccgacuaca gcgugcugua caacagcgcc 1140
agcuucagca ccuucaagug cuacggcgug agccccacca agcugaacga ccugugcuuc 1200
accaacgugu acgccgacag cuucgugauc cguggcgacg aggugcggca gaucgcaccc 1260
ggccagacag gcaagaucgc cgacuacaac uacaagcugc ccgacgacuu caccggcugc 1320
gugaucgccu ggaacagcaa caaccucgac agcaaggugg gcggcaacua caacuaccug 1380
uaccggcugu uccggaagag caaccugaag cccuucgagc gggacaucag caccgagauc 1440
uaccaagccg gcuccacccc uugcaacggc guggagggcu ucaacugcua cuucccucug 1500
cagagcuacg gcuuccagcc caccaacggc gugggcuacc agcccuaccg ggugguggug 1560
cugagcuucg agcugcugca cgccccagcc accgugugug gccccaagaa gagcaccaac 1620
cuggugaaga acaagugcgu gaacuucaac uucaacggcc uuaccggcac cggcgugcug 1680
accgagagca acaagaaauu ccugcccuuu ugccaguucg gccgggacau cgccgacacc 1740
accgacgcug ugcgggaucc ccagacccug gagauccugg acaucacccc uugcagcuuc 1800
ggcggcucug gcggaggcag cauccuggcc aucuacagca ccguggccag cagccuggug 1860
cugcugguga gccugggcgc caucagcuuc 1890
<210> 29
<211> 630
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 29
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Cys Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly
305 310 315 320
Gly Ser Gly Gly Gly Ser Gly Gly Gln Pro Thr Glu Ser Ile Val Arg
325 330 335
Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala
340 345 350
Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn
355 360 365
Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr
370 375 380
Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe
385 390 395 400
Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg
405 410 415
Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys
420 425 430
Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn
435 440 445
Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe
450 455 460
Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile
465 470 475 480
Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys
485 490 495
Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly
500 505 510
Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala
515 520 525
Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn
530 535 540
Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu
545 550 555 560
Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Cys Gln Phe Gly Arg Asp
565 570 575
Ile Ala Asp Thr Thr Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile
580 585 590
Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Ser Gly Gly Gly Ser Ile
595 600 605
Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val Ser
610 615 620
Leu Gly Ala Ile Ser Phe
625 630
<210> 30
<211> 3182
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 30
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120
acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180
guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240
gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300
cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360
cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420
aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480
ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540
agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600
aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660
aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720
gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780
cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840
gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900
aacggcacca ucaccgacgc cguggacugc gcccuggacc cucugagcga gaccaagugc 960
acccugaaga gcuucaccgu ggagaagggc aucuaccaga ccagcaacuu cggcggcagc 1020
ggcggcguga gcgugaucac cccaggcacc aacaccagca accagguggc cgugcuguac 1080
caggacguga acugcaccga ggugcccgug gccauccacg ccgaccagcu gacacccacc 1140
uggcgggucu acagcaccgg cagcaacgug uuccagaccc gggccgguug ccugaucggc 1200
gccgagcacg ugaacaacag cuacgagugc gacaucccca ucggcgccgg caucugugcc 1260
agcuaccaga cccagaccaa uucaccccgg agggcaagga gcguggccag ccagagcauc 1320
aucgccuaca ccaugagccu gggcgccgag aacagcgugg ccuacagcaa caacagcauc 1380
gccaucccca ccaacuucac caucagcgug accaccgaga uucugcccgu gagcaugacc 1440
aagaccagcg uggacugcac cauguacauc ugcggcgaca gcaccgagug cagcaaccug 1500
cugcugcagu acggcagcuu cugcacccag cugaaccggg cccugaccgg caucgccgug 1560
gagcaggaca agaacaccca ggagguguuc gcccagguga agcagaucua caagaccccu 1620
cccaucaagg acuucggcgg cuucaacuuc agccagaucc ugcccgaccc cagcaagccc 1680
agcaagcgga gcuucaucga ggaccugcug uucaacaagg ugacccuagc cgacgccggc 1740
uucaucaagc aguacggcga cugccucggc gacauagccg cccgggaccu gaucugcgcc 1800
cagaaguuca acggccugac cgugcugccu ccccugcuga ccgacgagau gaucgcccag 1860
uacaccagcg cccuguuagc cggaaccauc accagcggcu ggacuuucgg cgcuggagcc 1920
gcucugcaga uccccuucgc caugcagaug gccuaccggu ucaacggcau cggcgugacc 1980
cagaacgugc uguacgagaa ccagaagcug aucgccaacc aguucaacag cgccaucggc 2040
aagauccagg acagccugag cagcaccgcu agcgcccugg gcaagcugca ggacguggug 2100
aaccagaacg cccaggcccu gaacacccug gugaagcagc ugagcagcaa cuucggcgcc 2160
aucagcagcg ugcugaacga cauccugagc cggcuggacc cucccaacgc caccgugcag 2220
aucgaccggc ugaucacugg ccggcugcag agccugcaga ccuacgugac ccagcagcug 2280
auccgggccg ccgagauucg ggccagcgcc aaccuggccg ccaccaagau gagcgagugc 2340
gugcugggcc agagcaagcg gguggacuuc ugcggcaagg gcuaccaccu gaugagcuuu 2400
ccccagagcg caccccacgg agugguguuc cugcacguga ccuacgugcc cgcccaggag 2460
aagaacuuca ccaccgcccc agccaucugc cacgacggca aggcccacuu uccccgggag 2520
ggcguguucg ugagcaacgg cacccacugg uucgugaccc agcggaacuu cuacgagccc 2580
cagaucauca ccaccgacaa caccuucgug agcggcaacu gcgacguggu gaucggcauc 2640
gugaacaaca ccguguacga uccccugcag cccgagcugg acagcuucaa ggaggagcug 2700
gacaaguacu ucaagaauca caccagcccc gacguggacc ugggcgacau cagcggcauc 2760
aacgccagcg uggugaacau ccagaaggag aucgaucggc ugaacgaggu ggccaagaac 2820
cugaacgaga gccugaucga ccugcaggag cugggcaagu acgagcagua caucaagugg 2880
cccugguaca ucuggcuggg cuucaucgcc ggccugaucg ccaucgugau ggugaccauc 2940
augcugugcu gcaugaccag cugcugcagc ugccugaagg gcuguugcag cugcggcagc 3000
ugcugcaagu ucgacgagga cgacagcgag cccgugcuga agggcgugaa gcugcacuac 3060
accugauaau aggcuggagc cucgguggcc uagcuucuug ccccuugggc cuccccccag 3120
ccccuccucc ccuuccugca cccguacccc cguggucuuu gaauaaaguc ugagugggcg 3180
gc 3182
<210> 31
<211> 3006
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 31
auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60
cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120
aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180
aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240
aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300
auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360
aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420
cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480
agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540
ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600
uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660
ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720
cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780
ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840
gagaacggca ccaucaccga cgccguggac ugcgcccugg acccucugag cgagaccaag 900
ugcacccuga agagcuucac cguggagaag ggcaucuacc agaccagcaa cuucggcggc 960
agcggcggcg ugagcgugau caccccaggc accaacacca gcaaccaggu ggccgugcug 1020
uaccaggacg ugaacugcac cgaggugccc guggccaucc acgccgacca gcugacaccc 1080
accuggcggg ucuacagcac cggcagcaac guguuccaga cccgggccgg uugccugauc 1140
ggcgccgagc acgugaacaa cagcuacgag ugcgacaucc ccaucggcgc cggcaucugu 1200
gccagcuacc agacccagac caauucaccc cggagggcaa ggagcguggc cagccagagc 1260
aucaucgccu acaccaugag ccugggcgcc gagaacagcg uggccuacag caacaacagc 1320
aucgccaucc ccaccaacuu caccaucagc gugaccaccg agauucugcc cgugagcaug 1380
accaagacca gcguggacug caccauguac aucugcggcg acagcaccga gugcagcaac 1440
cugcugcugc aguacggcag cuucugcacc cagcugaacc gggcccugac cggcaucgcc 1500
guggagcagg acaagaacac ccaggaggug uucgcccagg ugaagcagau cuacaagacc 1560
ccucccauca aggacuucgg cggcuucaac uucagccaga uccugcccga ccccagcaag 1620
cccagcaagc ggagcuucau cgaggaccug cuguucaaca aggugacccu agccgacgcc 1680
ggcuucauca agcaguacgg cgacugccuc ggcgacauag ccgcccggga ccugaucugc 1740
gcccagaagu ucaacggccu gaccgugcug ccuccccugc ugaccgacga gaugaucgcc 1800
caguacacca gcgcccuguu agccggaacc aucaccagcg gcuggacuuu cggcgcugga 1860
gccgcucugc agauccccuu cgccaugcag auggccuacc gguucaacgg caucggcgug 1920
acccagaacg ugcuguacga gaaccagaag cugaucgcca accaguucaa cagcgccauc 1980
ggcaagaucc aggacagccu gagcagcacc gcuagcgccc ugggcaagcu gcaggacgug 2040
gugaaccaga acgcccaggc ccugaacacc cuggugaagc agcugagcag caacuucggc 2100
gccaucagca gcgugcugaa cgacauccug agccggcugg acccucccaa cgccaccgug 2160
cagaucgacc ggcugaucac uggccggcug cagagccugc agaccuacgu gacccagcag 2220
cugauccggg ccgccgagau ucgggccagc gccaaccugg ccgccaccaa gaugagcgag 2280
ugcgugcugg gccagagcaa gcggguggac uucugcggca agggcuacca ccugaugagc 2340
uuuccccaga gcgcacccca cggaguggug uuccugcacg ugaccuacgu gcccgcccag 2400
gagaagaacu ucaccaccgc cccagccauc ugccacgacg gcaaggccca cuuuccccgg 2460
gagggcgugu ucgugagcaa cggcacccac ugguucguga cccagcggaa cuucuacgag 2520
ccccagauca ucaccaccga caacaccuuc gugagcggca acugcgacgu ggugaucggc 2580
aucgugaaca acaccgugua cgauccccug cagcccgagc uggacagcuu caaggaggag 2640
cuggacaagu acuucaagaa ucacaccagc cccgacgugg accugggcga caucagcggc 2700
aucaacgcca gcguggugaa cauccagaag gagaucgauc ggcugaacga gguggccaag 2760
aaccugaacg agagccugau cgaccugcag gagcugggca aguacgagca guacaucaag 2820
uggcccuggu acaucuggcu gggcuucauc gccggccuga ucgccaucgu gauggugacc 2880
aucaugcugu gcugcaugac cagcugcugc agcugccuga agggcuguug cagcugcggc 2940
agcugcugca aguucgacga ggacgacagc gagcccgugc ugaagggcgu gaagcugcac 3000
uacacc 3006
<210> 32
<211> 1002
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 32
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Gly Gly
305 310 315 320
Ser Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln
325 330 335
Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala
340 345 350
Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly
355 360 365
Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His
370 375 380
Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys
385 390 395 400
Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val
405 410 415
Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn
420 425 430
Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr
435 440 445
Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser
450 455 460
Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn
465 470 475 480
Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu
485 490 495
Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala
500 505 510
Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly
515 520 525
Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg
530 535 540
Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala
545 550 555 560
Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg
565 570 575
Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro
580 585 590
Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala
595 600 605
Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln
610 615 620
Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val
625 630 635 640
Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe
645 650 655
Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser
660 665 670
Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu
675 680 685
Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser
690 695 700
Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Asn Ala Thr Val
705 710 715 720
Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr
725 730 735
Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
740 745 750
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg
755 760 765
Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser
770 775 780
Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln
785 790 795 800
Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala
805 810 815
His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe
820 825 830
Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn
835 840 845
Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn
850 855 860
Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu
865 870 875 880
Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly
885 890 895
Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile
900 905 910
Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp
915 920 925
Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr
930 935 940
Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr
945 950 955 960
Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys
965 970 975
Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro
980 985 990
Val Leu Lys Gly Val Lys Leu His Tyr Thr
995 1000
<210> 33
<211> 2378
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 33
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uucguguucc uggugcugcu gccccuggug agcagccagg gcaccaucac cgacgccgug 120
gacugcgccc uggacccucu gagcgagacc aagugcaccc ugaagagcuu caccguggag 180
aagggcaucu accagaccag caacuucggc ggcagcggcg gcgugagcgu gaucacccca 240
ggcaccaaca ccagcaacca gguggccgug cuguaccagg acgugaacug caccgaggug 300
cccguggcca uccacgccga ccagcugaca cccaccuggc gggucuacag caccggcagc 360
aacguguucc agacccgggc cgguugccug aucggcgccg agcacgugaa caacagcuac 420
gagugcgaca uccccaucgg cgccggcauc ugugccagcu accagaccca gaccaauuca 480
ccccggaggg caaggagcgu ggccagccag agcaucaucg ccuacaccau gagccugggc 540
gccgagaaca gcguggccua cagcaacaac agcaucgcca uccccaccaa cuucaccauc 600
agcgugacca ccgagauucu gcccgugagc augaccaaga ccagcgugga cugcaccaug 660
uacaucugcg gcgacagcac cgagugcagc aaccugcugc ugaacuacac cagcuucugc 720
acccagcuga accgggcccu gaccggcauc gccguggagc aggacaagaa cacccaggag 780
guguucgccc aggugaagca gaucuacaag accccuccca ucaaggacuu cggcggcuuc 840
aacuucagcc agauccugcc cgaccccagc aagcccagca agcggagcuu caucgaggac 900
cugcuguuca acaaggugac ccuagccgac gccggcuuca ucaagcagua cggcgacugc 960
cucggcgaca uagccgcccg ggaccugauc ugcgcccaga aguucaacgg ccugaccgug 1020
cugccucccc ugcugaccga cgagaugauc gcccaguaca ccagcgcccu guuagccgga 1080
accaucacca gcggcuggac uuucggcgcu ggagccgcuc ugcagauccc cuucgccaug 1140
cagauggccu accgguucaa cggcaucggc gugacccaga acgugcugua cgagaaccag 1200
aagcugaucg ccaaccaguu caacagcgcc aucggcaaga uccaggacag ccugagcagc 1260
accgcuagcg cccugggcaa gcugcaggac guggugaacc agaacgccca ggcccugaac 1320
acccugguga agcagcugag cagcaacuuc ggcgccauca gcagcgugcu gaacgacauc 1380
cugagccggc uggacccucc caacgccacc gugcagaucg accggcugau cacuggccgg 1440
cugcagagcc ugcagaccua cgugacccag cagcugaucc gggccgccga gauucgggcc 1500
agcgccaacc uggccgccac caagaugagc gagugcgugc ugggccagag caagcgggug 1560
gacuucugcg gcaagggcua ccaccugaug agcuuucccc agagcgcacc ccacggagug 1620
guguuccugc acgugaccua cgugcccgcc caggagaaga acuucaccac cgccccagcc 1680
aucugccacg acggcaaggc ccacuuuccc cgggagggcg uguucgugag caacggcacc 1740
cacugguucg ugacccagcg gaacuucuac gagccccaga ucaucaccac cgacaacacc 1800
uucgugagcg gcaacugcga cguggugauc ggcaucguga acaacaccgu guacgauccc 1860
cugcagcccg agcuggacag cuucaaggag gagcuggaca aguacuucaa gaaucacacc 1920
agccccgacg uggaccuggg cgacaucagc ggcaucaacg ccagcguggu gaacauccag 1980
aaggagaucg aucggcugaa cgagguggcc aagaaccuga acgagagccu gaucgaccug 2040
caggagcugg gcaaguacga gcaguacauc aaguggcccu gguacaucug gcugggcuuc 2100
aucgccggcc ugaucgccau cgugauggug accaucaugc ugugcugcau gaccagcugc 2160
ugcagcugcc ugaagggcug uugcagcugc ggcagcugcu gcaaguucga cgaggacgac 2220
agcgagcccg ugcugaaggg cgugaagcug cacuacaccu gauaauaggc uggagccucg 2280
guggccuagc uucuugcccc uugggccucc ccccagcccc uccuccccuu ccugcacccg 2340
uacccccgug gucuuugaau aaagucugag ugggcggc 2378
<210> 34
<211> 2202
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 34
auguucgugu uccuggugcu gcugccccug gugagcagcc agggcaccau caccgacgcc 60
guggacugcg cccuggaccc ucugagcgag accaagugca cccugaagag cuucaccgug 120
gagaagggca ucuaccagac cagcaacuuc ggcggcagcg gcggcgugag cgugaucacc 180
ccaggcacca acaccagcaa ccagguggcc gugcuguacc aggacgugaa cugcaccgag 240
gugcccgugg ccauccacgc cgaccagcug acacccaccu ggcgggucua cagcaccggc 300
agcaacgugu uccagacccg ggccgguugc cugaucggcg ccgagcacgu gaacaacagc 360
uacgagugcg acauccccau cggcgccggc aucugugcca gcuaccagac ccagaccaau 420
ucaccccgga gggcaaggag cguggccagc cagagcauca ucgccuacac caugagccug 480
ggcgccgaga acagcguggc cuacagcaac aacagcaucg ccauccccac caacuucacc 540
aucagcguga ccaccgagau ucugcccgug agcaugacca agaccagcgu ggacugcacc 600
auguacaucu gcggcgacag caccgagugc agcaaccugc ugcugaacua caccagcuuc 660
ugcacccagc ugaaccgggc ccugaccggc aucgccgugg agcaggacaa gaacacccag 720
gagguguucg cccaggugaa gcagaucuac aagaccccuc ccaucaagga cuucggcggc 780
uucaacuuca gccagauccu gcccgacccc agcaagccca gcaagcggag cuucaucgag 840
gaccugcugu ucaacaaggu gacccuagcc gacgccggcu ucaucaagca guacggcgac 900
ugccucggcg acauagccgc ccgggaccug aucugcgccc agaaguucaa cggccugacc 960
gugcugccuc cccugcugac cgacgagaug aucgcccagu acaccagcgc ccuguuagcc 1020
ggaaccauca ccagcggcug gacuuucggc gcuggagccg cucugcagau ccccuucgcc 1080
augcagaugg ccuaccgguu caacggcauc ggcgugaccc agaacgugcu guacgagaac 1140
cagaagcuga ucgccaacca guucaacagc gccaucggca agauccagga cagccugagc 1200
agcaccgcua gcgcccuggg caagcugcag gacgugguga accagaacgc ccaggcccug 1260
aacacccugg ugaagcagcu gagcagcaac uucggcgcca ucagcagcgu gcugaacgac 1320
auccugagcc ggcuggaccc ucccaacgcc accgugcaga ucgaccggcu gaucacuggc 1380
cggcugcaga gccugcagac cuacgugacc cagcagcuga uccgggccgc cgagauucgg 1440
gccagcgcca accuggccgc caccaagaug agcgagugcg ugcugggcca gagcaagcgg 1500
guggacuucu gcggcaaggg cuaccaccug augagcuuuc cccagagcgc accccacgga 1560
gugguguucc ugcacgugac cuacgugccc gcccaggaga agaacuucac caccgcccca 1620
gccaucugcc acgacggcaa ggcccacuuu ccccgggagg gcguguucgu gagcaacggc 1680
acccacuggu ucgugaccca gcggaacuuc uacgagcccc agaucaucac caccgacaac 1740
accuucguga gcggcaacug cgacguggug aucggcaucg ugaacaacac cguguacgau 1800
ccccugcagc ccgagcugga cagcuucaag gaggagcugg acaaguacuu caagaaucac 1860
accagccccg acguggaccu gggcgacauc agcggcauca acgccagcgu ggugaacauc 1920
cagaaggaga ucgaucggcu gaacgaggug gccaagaacc ugaacgagag ccugaucgac 1980
cugcaggagc ugggcaagua cgagcaguac aucaaguggc ccugguacau cuggcugggc 2040
uucaucgccg gccugaucgc caucgugaug gugaccauca ugcugugcug caugaccagc 2100
ugcugcagcu gccugaaggg cuguugcagc ugcggcagcu gcugcaaguu cgacgaggac 2160
gacagcgagc ccgugcugaa gggcgugaag cugcacuaca cc 2202
<210> 35
<211> 734
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 35
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Gly Thr
1 5 10 15
Ile Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys
20 25 30
Cys Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser
35 40 45
Asn Phe Gly Gly Ser Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn
50 55 60
Thr Ser Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu
65 70 75 80
Val Pro Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val
85 90 95
Tyr Ser Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile
100 105 110
Gly Ala Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly
115 120 125
Ala Gly Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg
130 135 140
Ala Arg Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu
145 150 155 160
Gly Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro
165 170 175
Thr Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met
180 185 190
Thr Lys Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr
195 200 205
Glu Cys Ser Asn Leu Leu Leu Asn Tyr Thr Ser Phe Cys Thr Gln Leu
210 215 220
Asn Arg Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln
225 230 235 240
Glu Val Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys
245 250 255
Asp Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys
260 265 270
Pro Ser Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr
275 280 285
Leu Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp
290 295 300
Ile Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr
305 310 315 320
Val Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser
325 330 335
Ala Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly
340 345 350
Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn
355 360 365
Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile
370 375 380
Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser
385 390 395 400
Ser Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn
405 410 415
Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly
420 425 430
Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro
435 440 445
Asn Ala Thr Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser
450 455 460
Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg
465 470 475 480
Ala Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly
485 490 495
Gln Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser
500 505 510
Phe Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr
515 520 525
Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
530 535 540
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly
545 550 555 560
Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile
565 570 575
Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly
580 585 590
Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser
595 600 605
Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp
610 615 620
Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile
625 630 635 640
Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu
645 650 655
Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys
660 665 670
Trp Pro Trp Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile
675 680 685
Val Met Val Thr Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys
690 695 700
Leu Lys Gly Cys Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp
705 710 715 720
Asp Ser Glu Pro Val Leu Lys Gly Val Lys Leu His Tyr Thr
725 730
<210> 36
<211> 4241
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 36
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uuccugauca ucuucauccu gcccaccacc cuggccguga ucggcgacuu caacugcacc 120
aacagcuuca ucaacgacua caacaagacc aucccucgga ucagcgaaga cgugguggac 180
gugucccugg gccugggcac cuacuacgug cugaaccggg uguaccugaa caccacacug 240
cuguucaccg gcuacuuccc caagagcggc gccaacuucc gggaccuggc ccugaagggc 300
agcaucuacc ugagcaccuu gugguacaag ccucccuucc ugagcgacuu caauaacggc 360
aucuucucua aggugaagaa caccaagcug uacguaaaca acacccugua cagcgaguuc 420
agcaccaucg ugaucggcag cguguucguc aacaccagcu acaccaucgu ggugcagccc 480
cacaacggca uccuggagau caccgccugc caguacacca ugugcgagua cccucacacc 540
gugugcaaga gcaagggcuc cauccggaac gagagcuggc acaucgacag cagcgagccg 600
cugugccugu ucaagaagaa cuucaccuac aacgugagcg ccgacuggcu guacuuccac 660
uucuaccagg agcggggcgu guucuacgcc uacuacgccg acgugggcau gccaaccacc 720
uuccuguuca gccuguaccu gggcaccauc cugagccacu acuacgugau gccccugacc 780
ugcaacgcca ucagcucaaa caccgacaac gagacccugg aguacugggu gacuccacug 840
agccggcggc aguaccugcu gaacuucgac gagcacggcg ugaucaccaa cgccguggac 900
ugcgcccugg acccucugag cgagaccaag ugcacccuga agagcuucac cguggagaag 960
ggcaucuacc agaccagcgg cuucaccgug aagcccguag ccaccgugua ccggcggauc 1020
cccaaccugc ccgacugcga caucgacaac uggcugaaca acgucagcgu gcccagccca 1080
cugaacuggg agcggcggau cuucagcaac ugcaacuuca aucugagcac ccugcugcgg 1140
cuggugcacg uggacagcuu cagcugcaac aaccuggaca agagcaagau cuucgguagc 1200
ugcuucaaca gcaucaccgu ggacaaguuc gccaucccua accggcggcg ggacgaucug 1260
cagcugggca gcagcggcuu ccugcagagc agcaacuaca agaucgacau cagcagcuca 1320
agcugccagc uguacuacag ccugccccug gugaacguga ccaucaacaa cuucaacccc 1380
agcagcugga accggcggua cggcuucggc agcuucaacc ugagcagcua cgacguggug 1440
uacagcgacc acugcuucag cgugaacagc gacuucugcc ccugugccga cccuagcgug 1500
gugaacagcu gcgccaagag caagccuccc agcgccauuu gccccgccgg caccaaguac 1560
cggcacugcg accuggacac cacccuguac gugaagaacu ggugccggug cagcugccug 1620
cccgacccca ucagcaccua cagccccaac accugucccc agaagaaggu gguggugggu 1680
aucggcgagc acugucccgg ccugggcauc aacgaggaga agugcggcac ccagcugaac 1740
cacagcagcu gcuucuguag ccccgacgcc uuccugggcu ggagcuucga cagcugcauc 1800
agcaacaacc ggugcaacau cuuuagcaac uucaucuuca acggaaucaa cagcggcacc 1860
accugcagca acgaccugcu guauagcaac accgagauca gcaccggcgu gugcgugaac 1920
uacgaccugu acggcaucac cggccagggc aucuucaagg aggugagcgc cgccuacuac 1980
aacaacuggc agaaccugcu guacgacagc aacggcaaca ucaucggcuu caaggacuuu 2040
cugaccaaca agaccuacac cauccugccc ugcuacagcg gcggcgugag cgugaucacc 2100
ccaggcacca acaccagcaa ccagguggcc gugcuguacc aggacgugaa cugcaccgag 2160
gugcccgugg ccauccacgc cgaccagcug acacccaccu ggcgggucua cagcaccggc 2220
agcaacgugu uccagacccg ggccgguugc cugaucggcg ccgagcacgu gaacaacagc 2280
uacgagugcg acauccccau cggcgccggc aucugugcca gcuaccagac ccagaccaau 2340
ucaccccgga gggcaaggag cguggccagc cagagcauca ucgccuacac caugagccug 2400
ggcgccgaga acagcguggc cuacagcaac aacagcaucg ccauccccac caacuucacc 2460
aucagcguga ccaccgagau ucugcccgug agcaugacca agaccagcgu ggacugcacc 2520
auguacaucu gcggcgacag caccgagugc agcaaccugc ugcugcagua cggcagcuuc 2580
ugcacccagc ugaaccgggc ccugaccggc aucgccgugg agcaggacaa gaacacccag 2640
gagguguucg cccaggugaa gcagaucuac aagaccccuc ccaucaagga cuucggcggc 2700
uucaacuuca gccagauccu gcccgacccc agcaagccca gcaagcggag cuucaucgag 2760
gaccugcugu ucaacaaggu gacccuagcc gacgccggcu ucaucaagca guacggcgac 2820
ugccucggcg acauagccgc ccgggaccug aucugcgccc agaaguucaa cggccugacc 2880
gugcugccuc cccugcugac cgacgagaug aucgcccagu acaccagcgc ccuguuagcc 2940
ggaaccauca ccagcggcug gacuuucggc gcuggagccg cucugcagau ccccuucgcc 3000
augcagaugg ccuaccgguu caacggcauc ggcgugaccc agaacgugcu guacgagaac 3060
cagaagcuga ucgccaacca guucaacagc gccaucggca agauccagga cagccugagc 3120
agcaccgcua gcgcccuggg caagcugcag gacgugguga accagaacgc ccaggcccug 3180
aacacccugg ugaagcagcu gagcagcaac uucggcgcca ucagcagcgu gcugaacgac 3240
auccugagcc ggcuggaccc ucccgaggcc gaggugcaga ucgaccggcu gaucacuggc 3300
cggcugcaga gccugcagac cuacgugacc cagcagcuga uccgggccgc cgagauucgg 3360
gccagcgcca accuggccgc caccaagaug agcgagugcg ugcugggcca gagcaagcgg 3420
guggacuucu gcggcaaggg cuaccaccug augagcuuuc cccagagcgc accccacgga 3480
gugguguucc ugcacgugac cuacgugccc gcccaggaga agaacuucac caccgcccca 3540
gccaucugcc acgacggcaa ggcccacuuu ccccgggagg gcguguucgu gagcaacggc 3600
acccacuggu ucgugaccca gcggaacuuc uacgagcccc agaucaucac caccgacaac 3660
accuucguga gcggcaacug cgacguggug aucggcaucg ugaacaacac cguguacgau 3720
ccccugcagc ccgagcugga cagcuucaag gaggagcugg acaaguacuu caagaaucac 3780
accagccccg acguggaccu gggcgacauc agcggcauca acgccagcgu ggugaacauc 3840
cagaaggaga ucgaucggcu gaacgaggug gccaagaacc ugaacgagag ccugaucgac 3900
cugcaggagc ugggcaagua cgagcaguac aucaaguggc ccugguacau cuggcugggc 3960
uucaucgccg gccugaucgc caucgugaug gugaccauca ugcugugcug caugaccagc 4020
ugcugcagcu gccugaaggg cuguugcagc ugcggcagcu gcugcaaguu cgacgaggac 4080
gacagcgagc ccgugcugaa gggcgugaag cugcacuaca ccugauaaua ggcuggagcc 4140
ucgguggccu agcuucuugc cccuugggcc uccccccagc cccuccuccc cuuccugcac 4200
ccguaccccc guggucuuug aauaaagucu gagugggcgg c 4241
<210> 37
<211> 4065
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 37
auguuccuga ucaucuucau ccugcccacc acccuggccg ugaucggcga cuucaacugc 60
accaacagcu ucaucaacga cuacaacaag accaucccuc ggaucagcga agacguggug 120
gacguguccc ugggccuggg caccuacuac gugcugaacc ggguguaccu gaacaccaca 180
cugcuguuca ccggcuacuu ccccaagagc ggcgccaacu uccgggaccu ggcccugaag 240
ggcagcaucu accugagcac cuugugguac aagccucccu uccugagcga cuucaauaac 300
ggcaucuucu cuaaggugaa gaacaccaag cuguacguaa acaacacccu guacagcgag 360
uucagcacca ucgugaucgg cagcguguuc gucaacacca gcuacaccau cguggugcag 420
ccccacaacg gcauccugga gaucaccgcc ugccaguaca ccaugugcga guacccucac 480
accgugugca agagcaaggg cuccauccgg aacgagagcu ggcacaucga cagcagcgag 540
ccgcugugcc uguucaagaa gaacuucacc uacaacguga gcgccgacug gcuguacuuc 600
cacuucuacc aggagcgggg cguguucuac gccuacuacg ccgacguggg caugccaacc 660
accuuccugu ucagccugua ccugggcacc auccugagcc acuacuacgu gaugccccug 720
accugcaacg ccaucagcuc aaacaccgac aacgagaccc uggaguacug ggugacucca 780
cugagccggc ggcaguaccu gcugaacuuc gacgagcacg gcgugaucac caacgccgug 840
gacugcgccc uggacccucu gagcgagacc aagugcaccc ugaagagcuu caccguggag 900
aagggcaucu accagaccag cggcuucacc gugaagcccg uagccaccgu guaccggcgg 960
auccccaacc ugcccgacug cgacaucgac aacuggcuga acaacgucag cgugcccagc 1020
ccacugaacu gggagcggcg gaucuucagc aacugcaacu ucaaucugag cacccugcug 1080
cggcuggugc acguggacag cuucagcugc aacaaccugg acaagagcaa gaucuucggu 1140
agcugcuuca acagcaucac cguggacaag uucgccaucc cuaaccggcg gcgggacgau 1200
cugcagcugg gcagcagcgg cuuccugcag agcagcaacu acaagaucga caucagcagc 1260
ucaagcugcc agcuguacua cagccugccc cuggugaacg ugaccaucaa caacuucaac 1320
cccagcagcu ggaaccggcg guacggcuuc ggcagcuuca accugagcag cuacgacgug 1380
guguacagcg accacugcuu cagcgugaac agcgacuucu gccccugugc cgacccuagc 1440
guggugaaca gcugcgccaa gagcaagccu cccagcgcca uuugccccgc cggcaccaag 1500
uaccggcacu gcgaccugga caccacccug uacgugaaga acuggugccg gugcagcugc 1560
cugcccgacc ccaucagcac cuacagcccc aacaccuguc cccagaagaa ggugguggug 1620
gguaucggcg agcacugucc cggccugggc aucaacgagg agaagugcgg cacccagcug 1680
aaccacagca gcugcuucug uagccccgac gccuuccugg gcuggagcuu cgacagcugc 1740
aucagcaaca accggugcaa caucuuuagc aacuucaucu ucaacggaau caacagcggc 1800
accaccugca gcaacgaccu gcuguauagc aacaccgaga ucagcaccgg cgugugcgug 1860
aacuacgacc uguacggcau caccggccag ggcaucuuca aggaggugag cgccgccuac 1920
uacaacaacu ggcagaaccu gcuguacgac agcaacggca acaucaucgg cuucaaggac 1980
uuucugacca acaagaccua caccauccug cccugcuaca gcggcggcgu gagcgugauc 2040
accccaggca ccaacaccag caaccaggug gccgugcugu accaggacgu gaacugcacc 2100
gaggugcccg uggccaucca cgccgaccag cugacaccca ccuggcgggu cuacagcacc 2160
ggcagcaacg uguuccagac ccgggccggu ugccugaucg gcgccgagca cgugaacaac 2220
agcuacgagu gcgacauccc caucggcgcc ggcaucugug ccagcuacca gacccagacc 2280
aauucacccc ggagggcaag gagcguggcc agccagagca ucaucgccua caccaugagc 2340
cugggcgccg agaacagcgu ggccuacagc aacaacagca ucgccauccc caccaacuuc 2400
accaucagcg ugaccaccga gauucugccc gugagcauga ccaagaccag cguggacugc 2460
accauguaca ucugcggcga cagcaccgag ugcagcaacc ugcugcugca guacggcagc 2520
uucugcaccc agcugaaccg ggcccugacc ggcaucgccg uggagcagga caagaacacc 2580
caggaggugu ucgcccaggu gaagcagauc uacaagaccc cucccaucaa ggacuucggc 2640
ggcuucaacu ucagccagau ccugcccgac cccagcaagc ccagcaagcg gagcuucauc 2700
gaggaccugc uguucaacaa ggugacccua gccgacgccg gcuucaucaa gcaguacggc 2760
gacugccucg gcgacauagc cgcccgggac cugaucugcg cccagaaguu caacggccug 2820
accgugcugc cuccccugcu gaccgacgag augaucgccc aguacaccag cgcccuguua 2880
gccggaacca ucaccagcgg cuggacuuuc ggcgcuggag ccgcucugca gauccccuuc 2940
gccaugcaga uggccuaccg guucaacggc aucggcguga cccagaacgu gcuguacgag 3000
aaccagaagc ugaucgccaa ccaguucaac agcgccaucg gcaagaucca ggacagccug 3060
agcagcaccg cuagcgcccu gggcaagcug caggacgugg ugaaccagaa cgcccaggcc 3120
cugaacaccc uggugaagca gcugagcagc aacuucggcg ccaucagcag cgugcugaac 3180
gacauccuga gccggcugga cccucccgag gccgaggugc agaucgaccg gcugaucacu 3240
ggccggcugc agagccugca gaccuacgug acccagcagc ugauccgggc cgccgagauu 3300
cgggccagcg ccaaccuggc cgccaccaag augagcgagu gcgugcuggg ccagagcaag 3360
cggguggacu ucugcggcaa gggcuaccac cugaugagcu uuccccagag cgcaccccac 3420
ggaguggugu uccugcacgu gaccuacgug cccgcccagg agaagaacuu caccaccgcc 3480
ccagccaucu gccacgacgg caaggcccac uuuccccggg agggcguguu cgugagcaac 3540
ggcacccacu gguucgugac ccagcggaac uucuacgagc cccagaucau caccaccgac 3600
aacaccuucg ugagcggcaa cugcgacgug gugaucggca ucgugaacaa caccguguac 3660
gauccccugc agcccgagcu ggacagcuuc aaggaggagc uggacaagua cuucaagaau 3720
cacaccagcc ccgacgugga ccugggcgac aucagcggca ucaacgccag cguggugaac 3780
auccagaagg agaucgaucg gcugaacgag guggccaaga accugaacga gagccugauc 3840
gaccugcagg agcugggcaa guacgagcag uacaucaagu ggcccuggua caucuggcug 3900
ggcuucaucg ccggccugau cgccaucgug auggugacca ucaugcugug cugcaugacc 3960
agcugcugca gcugccugaa gggcuguugc agcugcggca gcugcugcaa guucgacgag 4020
gacgacagcg agcccgugcu gaagggcgug aagcugcacu acacc 4065
<210> 38
<211> 1355
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 38
Met Phe Leu Ile Ile Phe Ile Leu Pro Thr Thr Leu Ala Val Ile Gly
1 5 10 15
Asp Phe Asn Cys Thr Asn Ser Phe Ile Asn Asp Tyr Asn Lys Thr Ile
20 25 30
Pro Arg Ile Ser Glu Asp Val Val Asp Val Ser Leu Gly Leu Gly Thr
35 40 45
Tyr Tyr Val Leu Asn Arg Val Tyr Leu Asn Thr Thr Leu Leu Phe Thr
50 55 60
Gly Tyr Phe Pro Lys Ser Gly Ala Asn Phe Arg Asp Leu Ala Leu Lys
65 70 75 80
Gly Ser Ile Tyr Leu Ser Thr Leu Trp Tyr Lys Pro Pro Phe Leu Ser
85 90 95
Asp Phe Asn Asn Gly Ile Phe Ser Lys Val Lys Asn Thr Lys Leu Tyr
100 105 110
Val Asn Asn Thr Leu Tyr Ser Glu Phe Ser Thr Ile Val Ile Gly Ser
115 120 125
Val Phe Val Asn Thr Ser Tyr Thr Ile Val Val Gln Pro His Asn Gly
130 135 140
Ile Leu Glu Ile Thr Ala Cys Gln Tyr Thr Met Cys Glu Tyr Pro His
145 150 155 160
Thr Val Cys Lys Ser Lys Gly Ser Ile Arg Asn Glu Ser Trp His Ile
165 170 175
Asp Ser Ser Glu Pro Leu Cys Leu Phe Lys Lys Asn Phe Thr Tyr Asn
180 185 190
Val Ser Ala Asp Trp Leu Tyr Phe His Phe Tyr Gln Glu Arg Gly Val
195 200 205
Phe Tyr Ala Tyr Tyr Ala Asp Val Gly Met Pro Thr Thr Phe Leu Phe
210 215 220
Ser Leu Tyr Leu Gly Thr Ile Leu Ser His Tyr Tyr Val Met Pro Leu
225 230 235 240
Thr Cys Asn Ala Ile Ser Ser Asn Thr Asp Asn Glu Thr Leu Glu Tyr
245 250 255
Trp Val Thr Pro Leu Ser Arg Arg Gln Tyr Leu Leu Asn Phe Asp Glu
260 265 270
His Gly Val Ile Thr Asn Ala Val Asp Cys Ala Leu Asp Pro Leu Ser
275 280 285
Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr
290 295 300
Gln Thr Ser Gly Phe Thr Val Lys Pro Val Ala Thr Val Tyr Arg Arg
305 310 315 320
Ile Pro Asn Leu Pro Asp Cys Asp Ile Asp Asn Trp Leu Asn Asn Val
325 330 335
Ser Val Pro Ser Pro Leu Asn Trp Glu Arg Arg Ile Phe Ser Asn Cys
340 345 350
Asn Phe Asn Leu Ser Thr Leu Leu Arg Leu Val His Val Asp Ser Phe
355 360 365
Ser Cys Asn Asn Leu Asp Lys Ser Lys Ile Phe Gly Ser Cys Phe Asn
370 375 380
Ser Ile Thr Val Asp Lys Phe Ala Ile Pro Asn Arg Arg Arg Asp Asp
385 390 395 400
Leu Gln Leu Gly Ser Ser Gly Phe Leu Gln Ser Ser Asn Tyr Lys Ile
405 410 415
Asp Ile Ser Ser Ser Ser Cys Gln Leu Tyr Tyr Ser Leu Pro Leu Val
420 425 430
Asn Val Thr Ile Asn Asn Phe Asn Pro Ser Ser Trp Asn Arg Arg Tyr
435 440 445
Gly Phe Gly Ser Phe Asn Leu Ser Ser Tyr Asp Val Val Tyr Ser Asp
450 455 460
His Cys Phe Ser Val Asn Ser Asp Phe Cys Pro Cys Ala Asp Pro Ser
465 470 475 480
Val Val Asn Ser Cys Ala Lys Ser Lys Pro Pro Ser Ala Ile Cys Pro
485 490 495
Ala Gly Thr Lys Tyr Arg His Cys Asp Leu Asp Thr Thr Leu Tyr Val
500 505 510
Lys Asn Trp Cys Arg Cys Ser Cys Leu Pro Asp Pro Ile Ser Thr Tyr
515 520 525
Ser Pro Asn Thr Cys Pro Gln Lys Lys Val Val Val Gly Ile Gly Glu
530 535 540
His Cys Pro Gly Leu Gly Ile Asn Glu Glu Lys Cys Gly Thr Gln Leu
545 550 555 560
Asn His Ser Ser Cys Phe Cys Ser Pro Asp Ala Phe Leu Gly Trp Ser
565 570 575
Phe Asp Ser Cys Ile Ser Asn Asn Arg Cys Asn Ile Phe Ser Asn Phe
580 585 590
Ile Phe Asn Gly Ile Asn Ser Gly Thr Thr Cys Ser Asn Asp Leu Leu
595 600 605
Tyr Ser Asn Thr Glu Ile Ser Thr Gly Val Cys Val Asn Tyr Asp Leu
610 615 620
Tyr Gly Ile Thr Gly Gln Gly Ile Phe Lys Glu Val Ser Ala Ala Tyr
625 630 635 640
Tyr Asn Asn Trp Gln Asn Leu Leu Tyr Asp Ser Asn Gly Asn Ile Ile
645 650 655
Gly Phe Lys Asp Phe Leu Thr Asn Lys Thr Tyr Thr Ile Leu Pro Cys
660 665 670
Tyr Ser Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn
675 680 685
Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val
690 695 700
Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr
705 710 715 720
Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu
725 730 735
His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile
740 745 750
Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser
755 760 765
Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu
770 775 780
Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe
785 790 795 800
Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr
805 810 815
Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser
820 825 830
Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala
835 840 845
Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe
850 855 860
Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly
865 870 875 880
Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys
885 890 895
Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp
900 905 910
Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala
915 920 925
Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro
930 935 940
Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu
945 950 955 960
Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu
965 970 975
Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly
980 985 990
Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln
995 1000 1005
Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr
1010 1015 1020
Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala
1025 1030 1035
Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly
1040 1045 1050
Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro
1055 1060 1065
Pro Glu Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu
1070 1075 1080
Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala
1085 1090 1095
Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu
1100 1105 1110
Cys Val Leu Gly Gln Ser Lys Arg Val Asp Phe Cys Gly Lys Gly
1115 1120 1125
Tyr His Leu Met Ser Phe Pro Gln Ser Ala Pro His Gly Val Val
1130 1135 1140
Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe Thr
1145 1150 1155
Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His Phe Pro Arg
1160 1165 1170
Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val Thr Gln
1175 1180 1185
Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe
1190 1195 1200
Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
1205 1210 1215
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu
1220 1225 1230
Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu
1235 1240 1245
Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys
1250 1255 1260
Glu Ile Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser
1265 1270 1275
Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys
1280 1285 1290
Trp Pro Trp Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala
1295 1300 1305
Ile Val Met Val Thr Ile Met Leu Cys Cys Met Thr Ser Cys Cys
1310 1315 1320
Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly Ser Cys Cys Lys Phe
1325 1330 1335
Asp Glu Asp Asp Ser Glu Pro Val Leu Lys Gly Val Lys Leu His
1340 1345 1350
Tyr Thr
1355
<210> 39
<211> 4247
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 39
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uuccugaucc ugcugaucag ccugcccacc gccuucgccg ugaucggcga ccugaagugc 120
accagcgaca acaucaacga caaggacacc ggcccaccac ccaucagcac cgacaccgug 180
gacgugacca acggccuggg caccuacuac gugcuggacc ggguguaccu gaacaccacc 240
cuguuccuga acggcuacua ccccaccagc ggcagcaccu accggaauau ggcccugaag 300
ggcagcgugc ugcugagccg gcugugguuc aagccaccau uccugagcga cuucaucaac 360
ggaaucuucg ccaaggugaa gaacaccaag gugaucaagg accgggugau guacagcgag 420
uuccccgcca ucaccauugg caguaccuuc gugaacacca gcuacagcgu gguggugcag 480
ccccggacca ucaacagcac ccaggacggc gacaacaagc ugcagggccu gcuggaggug 540
agcgugugcc aguacaacau gugcgaguac ccucagacca ucugccaccc caaccugggc 600
aaccaccgga aggagcugug gcaccuggac accggcgugg ugagcugccu guacaagcgg 660
aacuucaccu acgacguaaa cgccgacuac cuguacuucc acuucuacca ggagggcggc 720
accuucuacg ccuacuucac cgacacgggc guggugacca aguuccuguu caacguguac 780
cugggcaugg cccugagcca cuacuacgug augccccuga ccuguaacag caagcugacc 840
cuggaguacu gggugacccc ucugaccagc cggcaguacc ugcuggccuu caaccaggac 900
ggcaucaucu ucaacgccgu ggacugcgcc cuggacccuc ugagcgagac caagugcacc 960
cugaagagcu ucaccgugga gaagggcauc uaccagacca acggcuacac cgugcagccc 1020
aucgccgacg uguaccggcg gaagcccaac cugcccaacu gcaacaucga ggccuggcug 1080
aacgacaaga gcgugcccuc gccccugaac ugggagcgga agaccuucag caacugcaac 1140
uucaacauga gcagucugau gagcuucauc caggccgaca gcuucaccug caacaacauc 1200
gacgccgcca agaucuacgg caugugcuuc agcagcauca ccaucgacaa guuugccauc 1260
cccaacggcc ggaaggugga ccugcagcug ggcaaccugg gcuaccugca gagcuucaac 1320
uaccggaucg acaccaccgc caccucuugc cagcuguacu acaaccugcc cgccgccaac 1380
gugagcguga gccgguucaa ccccagcacc uggaacaagc gguucggcuu cauugaggac 1440
agcguguuca aaccccggcc cgcaggagua cugaccaacc acgacguggu guacgcccag 1500
cacugcuuca aggcacccaa gaacuucugc cccugcaagc ugaacggcag cugugugggc 1560
ucuggccccg guaagaacaa cggcauaggg acuugcccgg cagggaccaa cuaccugacc 1620
ugcgacaacc ugugcacacc cgaccccauc accuucaccg gcaccuacaa guguccccag 1680
accaagagcc uggugggcau cggcgagcac ugcagcggcc uggccgugaa gagcgacuac 1740
ugcggcggca acagcugcac cugucggccc caggccuucc ugggcuggag cgccgacagc 1800
ugccugcagg gcgacaagug caacaucuuu gccaacuuca uccugcacga cgugaacagc 1860
ggccugaccu gcagcaccga ccugcagaag gccaacaccg acaucauccu gggcgugugc 1920
gugaacuacg acuuguacgg cauccugggc cagggcaucu ucguggaggu gaacgccacc 1980
uacuacaaca gcuggcagaa ccugcuguac gacagcaacg gcaaccugua cggcuuccgg 2040
gacuacauca ucaaccggac cuucaugauc cggagcugcu acagcggcgg cgugagcgug 2100
aucaccccag gcaccaacac cagcaaccag guggccgugc uguaccagga cgugaacugc 2160
accgaggugc ccguggccau ccacgccgac cagcugacac ccaccuggcg ggucuacagc 2220
accggcagca acguguucca gacccgggcc gguugccuga ucggcgccga gcacgugaac 2280
aacagcuacg agugcgacau ccccaucggc gccggcaucu gugccagcua ccagacccag 2340
accaauucac cccggagggc aaggagcgug gccagccaga gcaucaucgc cuacaccaug 2400
agccugggcg ccgagaacag cguggccuac agcaacaaca gcaucgccau ccccaccaac 2460
uucaccauca gcgugaccac cgagauucug cccgugagca ugaccaagac cagcguggac 2520
ugcaccaugu acaucugcgg cgacagcacc gagugcagca accugcugcu gcaguacggc 2580
agcuucugca cccagcugaa ccgggcccug accggcaucg ccguggagca ggacaagaac 2640
acccaggagg uguucgccca ggugaagcag aucuacaaga ccccucccau caaggacuuc 2700
ggcggcuuca acuucagcca gauccugccc gaccccagca agcccagcaa gcggagcuuc 2760
aucgaggacc ugcuguucaa caaggugacc cuagccgacg ccggcuucau caagcaguac 2820
ggcgacugcc ucggcgacau agccgcccgg gaccugaucu gcgcccagaa guucaacggc 2880
cugaccgugc ugccuccccu gcugaccgac gagaugaucg cccaguacac cagcgcccug 2940
uuagccggaa ccaucaccag cggcuggacu uucggcgcug gagccgcucu gcagaucccc 3000
uucgccaugc agauggccua ccgguucaac ggcaucggcg ugacccagaa cgugcuguac 3060
gagaaccaga agcugaucgc caaccaguuc aacagcgcca ucggcaagau ccaggacagc 3120
cugagcagca ccgcuagcgc ccugggcaag cugcaggacg uggugaacca gaacgcccag 3180
gcccugaaca cccuggugaa gcagcugagc agcaacuucg gcgccaucag cagcgugcug 3240
aacgacaucc ugagccggcu ggacccuccc gaggccgagg ugcagaucga ccggcugauc 3300
acuggccggc ugcagagccu gcagaccuac gugacccagc agcugauccg ggccgccgag 3360
auucgggcca gcgccaaccu ggccgccacc aagaugagcg agugcgugcu gggccagagc 3420
aagcgggugg acuucugcgg caagggcuac caccugauga gcuuucccca gagcgcaccc 3480
cacggagugg uguuccugca cgugaccuac gugcccgccc aggagaagaa cuucaccacc 3540
gccccagcca ucugccacga cggcaaggcc cacuuucccc gggagggcgu guucgugagc 3600
aacggcaccc acugguucgu gacccagcgg aacuucuacg agccccagau caucaccacc 3660
gacaacaccu ucgugagcgg caacugcgac guggugaucg gcaucgugaa caacaccgug 3720
uacgaucccc ugcagcccga gcuggacagc uucaaggagg agcuggacaa guacuucaag 3780
aaucacacca gccccgacgu ggaccugggc gacaucagcg gcaucaacgc cagcguggug 3840
aacauccaga aggagaucga ucggcugaac gagguggcca agaaccugaa cgagagccug 3900
aucgaccugc aggagcuggg caaguacgag caguacauca aguggcccug guacaucugg 3960
cugggcuuca ucgccggccu gaucgccauc gugaugguga ccaucaugcu gugcugcaug 4020
accagcugcu gcagcugccu gaagggcugu ugcagcugcg gcagcugcug caaguucgac 4080
gaggacgaca gcgagcccgu gcugaagggc gugaagcugc acuacaccug auaauaggcu 4140
ggagccucgg uggccuagcu ucuugccccu ugggccuccc cccagccccu ccuccccuuc 4200
cugcacccgu acccccgugg ucuuugaaua aagucugagu gggcggc 4247
<210> 40
<211> 4071
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 40
auguuccuga uccugcugau cagccugccc accgccuucg ccgugaucgg cgaccugaag 60
ugcaccagcg acaacaucaa cgacaaggac accggcccac cacccaucag caccgacacc 120
guggacguga ccaacggccu gggcaccuac uacgugcugg accgggugua ccugaacacc 180
acccuguucc ugaacggcua cuaccccacc agcggcagca ccuaccggaa uauggcccug 240
aagggcagcg ugcugcugag ccggcugugg uucaagccac cauuccugag cgacuucauc 300
aacggaaucu ucgccaaggu gaagaacacc aaggugauca aggaccgggu gauguacagc 360
gaguuccccg ccaucaccau uggcaguacc uucgugaaca ccagcuacag cgugguggug 420
cagccccgga ccaucaacag cacccaggac ggcgacaaca agcugcaggg ccugcuggag 480
gugagcgugu gccaguacaa caugugcgag uacccucaga ccaucugcca ccccaaccug 540
ggcaaccacc ggaaggagcu guggcaccug gacaccggcg uggugagcug ccuguacaag 600
cggaacuuca ccuacgacgu aaacgccgac uaccuguacu uccacuucua ccaggagggc 660
ggcaccuucu acgccuacuu caccgacacg ggcgugguga ccaaguuccu guucaacgug 720
uaccugggca uggcccugag ccacuacuac gugaugcccc ugaccuguaa cagcaagcug 780
acccuggagu acugggugac cccucugacc agccggcagu accugcuggc cuucaaccag 840
gacggcauca ucuucaacgc cguggacugc gcccuggacc cucugagcga gaccaagugc 900
acccugaaga gcuucaccgu ggagaagggc aucuaccaga ccaacggcua caccgugcag 960
cccaucgccg acguguaccg gcggaagccc aaccugccca acugcaacau cgaggccugg 1020
cugaacgaca agagcgugcc cucgccccug aacugggagc ggaagaccuu cagcaacugc 1080
aacuucaaca ugagcagucu gaugagcuuc auccaggccg acagcuucac cugcaacaac 1140
aucgacgccg ccaagaucua cggcaugugc uucagcagca ucaccaucga caaguuugcc 1200
auccccaacg gccggaaggu ggaccugcag cugggcaacc ugggcuaccu gcagagcuuc 1260
aacuaccgga ucgacaccac cgccaccucu ugccagcugu acuacaaccu gcccgccgcc 1320
aacgugagcg ugagccgguu caaccccagc accuggaaca agcgguucgg cuucauugag 1380
gacagcgugu ucaaaccccg gcccgcagga guacugacca accacgacgu gguguacgcc 1440
cagcacugcu ucaaggcacc caagaacuuc ugccccugca agcugaacgg cagcugugug 1500
ggcucuggcc ccgguaagaa caacggcaua gggacuugcc cggcagggac caacuaccug 1560
accugcgaca accugugcac acccgacccc aucaccuuca ccggcaccua caaguguccc 1620
cagaccaaga gccugguggg caucggcgag cacugcagcg gccuggccgu gaagagcgac 1680
uacugcggcg gcaacagcug caccugucgg ccccaggccu uccugggcug gagcgccgac 1740
agcugccugc agggcgacaa gugcaacauc uuugccaacu ucauccugca cgacgugaac 1800
agcggccuga ccugcagcac cgaccugcag aaggccaaca ccgacaucau ccugggcgug 1860
ugcgugaacu acgacuugua cggcauccug ggccagggca ucuucgugga ggugaacgcc 1920
accuacuaca acagcuggca gaaccugcug uacgacagca acggcaaccu guacggcuuc 1980
cgggacuaca ucaucaaccg gaccuucaug auccggagcu gcuacagcgg cggcgugagc 2040
gugaucaccc caggcaccaa caccagcaac cagguggccg ugcuguacca ggacgugaac 2100
ugcaccgagg ugcccguggc cauccacgcc gaccagcuga cacccaccug gcgggucuac 2160
agcaccggca gcaacguguu ccagacccgg gccgguugcc ugaucggcgc cgagcacgug 2220
aacaacagcu acgagugcga cauccccauc ggcgccggca ucugugccag cuaccagacc 2280
cagaccaauu caccccggag ggcaaggagc guggccagcc agagcaucau cgccuacacc 2340
augagccugg gcgccgagaa cagcguggcc uacagcaaca acagcaucgc cauccccacc 2400
aacuucacca ucagcgugac caccgagauu cugcccguga gcaugaccaa gaccagcgug 2460
gacugcacca uguacaucug cggcgacagc accgagugca gcaaccugcu gcugcaguac 2520
ggcagcuucu gcacccagcu gaaccgggcc cugaccggca ucgccgugga gcaggacaag 2580
aacacccagg agguguucgc ccaggugaag cagaucuaca agaccccucc caucaaggac 2640
uucggcggcu ucaacuucag ccagauccug cccgacccca gcaagcccag caagcggagc 2700
uucaucgagg accugcuguu caacaaggug acccuagccg acgccggcuu caucaagcag 2760
uacggcgacu gccucggcga cauagccgcc cgggaccuga ucugcgccca gaaguucaac 2820
ggccugaccg ugcugccucc ccugcugacc gacgagauga ucgcccagua caccagcgcc 2880
cuguuagccg gaaccaucac cagcggcugg acuuucggcg cuggagccgc ucugcagauc 2940
cccuucgcca ugcagauggc cuaccgguuc aacggcaucg gcgugaccca gaacgugcug 3000
uacgagaacc agaagcugau cgccaaccag uucaacagcg ccaucggcaa gauccaggac 3060
agccugagca gcaccgcuag cgcccugggc aagcugcagg acguggugaa ccagaacgcc 3120
caggcccuga acacccuggu gaagcagcug agcagcaacu ucggcgccau cagcagcgug 3180
cugaacgaca uccugagccg gcuggacccu cccgaggccg aggugcagau cgaccggcug 3240
aucacuggcc ggcugcagag ccugcagacc uacgugaccc agcagcugau ccgggccgcc 3300
gagauucggg ccagcgccaa ccuggccgcc accaagauga gcgagugcgu gcugggccag 3360
agcaagcggg uggacuucug cggcaagggc uaccaccuga ugagcuuucc ccagagcgca 3420
ccccacggag ugguguuccu gcacgugacc uacgugcccg cccaggagaa gaacuucacc 3480
accgccccag ccaucugcca cgacggcaag gcccacuuuc cccgggaggg cguguucgug 3540
agcaacggca cccacugguu cgugacccag cggaacuucu acgagcccca gaucaucacc 3600
accgacaaca ccuucgugag cggcaacugc gacgugguga ucggcaucgu gaacaacacc 3660
guguacgauc cccugcagcc cgagcuggac agcuucaagg aggagcugga caaguacuuc 3720
aagaaucaca ccagccccga cguggaccug ggcgacauca gcggcaucaa cgccagcgug 3780
gugaacaucc agaaggagau cgaucggcug aacgaggugg ccaagaaccu gaacgagagc 3840
cugaucgacc ugcaggagcu gggcaaguac gagcaguaca ucaaguggcc cugguacauc 3900
uggcugggcu ucaucgccgg ccugaucgcc aucgugaugg ugaccaucau gcugugcugc 3960
augaccagcu gcugcagcug ccugaagggc uguugcagcu gcggcagcug cugcaaguuc 4020
gacgaggacg acagcgagcc cgugcugaag ggcgugaagc ugcacuacac c 4071
<210> 41
<211> 1357
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 41
Met Phe Leu Ile Leu Leu Ile Ser Leu Pro Thr Ala Phe Ala Val Ile
1 5 10 15
Gly Asp Leu Lys Cys Thr Ser Asp Asn Ile Asn Asp Lys Asp Thr Gly
20 25 30
Pro Pro Pro Ile Ser Thr Asp Thr Val Asp Val Thr Asn Gly Leu Gly
35 40 45
Thr Tyr Tyr Val Leu Asp Arg Val Tyr Leu Asn Thr Thr Leu Phe Leu
50 55 60
Asn Gly Tyr Tyr Pro Thr Ser Gly Ser Thr Tyr Arg Asn Met Ala Leu
65 70 75 80
Lys Gly Ser Val Leu Leu Ser Arg Leu Trp Phe Lys Pro Pro Phe Leu
85 90 95
Ser Asp Phe Ile Asn Gly Ile Phe Ala Lys Val Lys Asn Thr Lys Val
100 105 110
Ile Lys Asp Arg Val Met Tyr Ser Glu Phe Pro Ala Ile Thr Ile Gly
115 120 125
Ser Thr Phe Val Asn Thr Ser Tyr Ser Val Val Val Gln Pro Arg Thr
130 135 140
Ile Asn Ser Thr Gln Asp Gly Asp Asn Lys Leu Gln Gly Leu Leu Glu
145 150 155 160
Val Ser Val Cys Gln Tyr Asn Met Cys Glu Tyr Pro Gln Thr Ile Cys
165 170 175
His Pro Asn Leu Gly Asn His Arg Lys Glu Leu Trp His Leu Asp Thr
180 185 190
Gly Val Val Ser Cys Leu Tyr Lys Arg Asn Phe Thr Tyr Asp Val Asn
195 200 205
Ala Asp Tyr Leu Tyr Phe His Phe Tyr Gln Glu Gly Gly Thr Phe Tyr
210 215 220
Ala Tyr Phe Thr Asp Thr Gly Val Val Thr Lys Phe Leu Phe Asn Val
225 230 235 240
Tyr Leu Gly Met Ala Leu Ser His Tyr Tyr Val Met Pro Leu Thr Cys
245 250 255
Asn Ser Lys Leu Thr Leu Glu Tyr Trp Val Thr Pro Leu Thr Ser Arg
260 265 270
Gln Tyr Leu Leu Ala Phe Asn Gln Asp Gly Ile Ile Phe Asn Ala Val
275 280 285
Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser
290 295 300
Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Asn Gly Tyr Thr Val Gln
305 310 315 320
Pro Ile Ala Asp Val Tyr Arg Arg Lys Pro Asn Leu Pro Asn Cys Asn
325 330 335
Ile Glu Ala Trp Leu Asn Asp Lys Ser Val Pro Ser Pro Leu Asn Trp
340 345 350
Glu Arg Lys Thr Phe Ser Asn Cys Asn Phe Asn Met Ser Ser Leu Met
355 360 365
Ser Phe Ile Gln Ala Asp Ser Phe Thr Cys Asn Asn Ile Asp Ala Ala
370 375 380
Lys Ile Tyr Gly Met Cys Phe Ser Ser Ile Thr Ile Asp Lys Phe Ala
385 390 395 400
Ile Pro Asn Gly Arg Lys Val Asp Leu Gln Leu Gly Asn Leu Gly Tyr
405 410 415
Leu Gln Ser Phe Asn Tyr Arg Ile Asp Thr Thr Ala Thr Ser Cys Gln
420 425 430
Leu Tyr Tyr Asn Leu Pro Ala Ala Asn Val Ser Val Ser Arg Phe Asn
435 440 445
Pro Ser Thr Trp Asn Lys Arg Phe Gly Phe Ile Glu Asp Ser Val Phe
450 455 460
Lys Pro Arg Pro Ala Gly Val Leu Thr Asn His Asp Val Val Tyr Ala
465 470 475 480
Gln His Cys Phe Lys Ala Pro Lys Asn Phe Cys Pro Cys Lys Leu Asn
485 490 495
Gly Ser Cys Val Gly Ser Gly Pro Gly Lys Asn Asn Gly Ile Gly Thr
500 505 510
Cys Pro Ala Gly Thr Asn Tyr Leu Thr Cys Asp Asn Leu Cys Thr Pro
515 520 525
Asp Pro Ile Thr Phe Thr Gly Thr Tyr Lys Cys Pro Gln Thr Lys Ser
530 535 540
Leu Val Gly Ile Gly Glu His Cys Ser Gly Leu Ala Val Lys Ser Asp
545 550 555 560
Tyr Cys Gly Gly Asn Ser Cys Thr Cys Arg Pro Gln Ala Phe Leu Gly
565 570 575
Trp Ser Ala Asp Ser Cys Leu Gln Gly Asp Lys Cys Asn Ile Phe Ala
580 585 590
Asn Phe Ile Leu His Asp Val Asn Ser Gly Leu Thr Cys Ser Thr Asp
595 600 605
Leu Gln Lys Ala Asn Thr Asp Ile Ile Leu Gly Val Cys Val Asn Tyr
610 615 620
Asp Leu Tyr Gly Ile Leu Gly Gln Gly Ile Phe Val Glu Val Asn Ala
625 630 635 640
Thr Tyr Tyr Asn Ser Trp Gln Asn Leu Leu Tyr Asp Ser Asn Gly Asn
645 650 655
Leu Tyr Gly Phe Arg Asp Tyr Ile Ile Asn Arg Thr Phe Met Ile Arg
660 665 670
Ser Cys Tyr Ser Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr
675 680 685
Ser Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val
690 695 700
Pro Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr
705 710 715 720
Ser Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly
725 730 735
Ala Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala
740 745 750
Gly Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala
755 760 765
Arg Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly
770 775 780
Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr
785 790 795 800
Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr
805 810 815
Lys Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu
820 825 830
Cys Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn
835 840 845
Arg Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu
850 855 860
Val Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp
865 870 875 880
Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro
885 890 895
Ser Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu
900 905 910
Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile
915 920 925
Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val
930 935 940
Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala
945 950 955 960
Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala
965 970 975
Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly
980 985 990
Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala
995 1000 1005
Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser
1010 1015 1020
Ser Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln
1025 1030 1035
Asn Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn
1040 1045 1050
Phe Gly Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu
1055 1060 1065
Asp Pro Pro Glu Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly
1070 1075 1080
Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg
1085 1090 1095
Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr Lys Met
1100 1105 1110
Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp Phe Cys Gly
1115 1120 1125
Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala Pro His Gly
1130 1135 1140
Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu Lys Asn
1145 1150 1155
Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His Phe
1160 1165 1170
Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
1175 1180 1185
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn
1190 1195 1200
Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn
1205 1210 1215
Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys
1220 1225 1230
Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val
1235 1240 1245
Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile
1250 1255 1260
Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn
1265 1270 1275
Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr
1280 1285 1290
Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu
1295 1300 1305
Ile Ala Ile Val Met Val Thr Ile Met Leu Cys Cys Met Thr Ser
1310 1315 1320
Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly Ser Cys Cys
1325 1330 1335
Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys Gly Val Lys
1340 1345 1350
Leu His Tyr Thr
1355
<210> 42
<211> 1157
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 42
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120
acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180
guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240
gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300
cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360
cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420
aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480
ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540
agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600
aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660
aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720
gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780
cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840
gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900
aacggcacca ucaccgacgc cguggacucu ggcggaggcg gcagcgccau cggcggcuac 960
auccccgagg ccccuagaga cggccaggcc uacgugcgga aggacggcga gugggugcug 1020
cugagcaccu uccugggcug auaauaggcu ggagccucgg uggccuagcu ucuugccccu 1080
ugggccuccc cccagccccu ccuccccuuc cugcacccgu acccccgugg ucuuugaaua 1140
aagucugagu gggcggc 1157
<210> 43
<211> 981
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 43
auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60
cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120
aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180
aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240
aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300
auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360
aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420
cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480
agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540
ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600
uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660
ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720
cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780
ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840
gagaacggca ccaucaccga cgccguggac ucuggcggag gcggcagcgc caucggcggc 900
uacauccccg aggccccuag agacggccag gccuacgugc ggaaggacgg cgagugggug 960
cugcugagca ccuuccuggg c 981
<210> 44
<211> 327
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 44
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Ser Gly Gly Gly Gly Ser Ala Ile Gly Gly Tyr Ile Pro Glu
290 295 300
Ala Pro Arg Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val
305 310 315 320
Leu Leu Ser Thr Phe Leu Gly
325
<210> 45
<211> 1130
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 45
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120
acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180
guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240
gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300
cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360
cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420
aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480
ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540
agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600
aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660
aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720
gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780
cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840
gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900
aacggcacca ucaccgacgc cguggacucu ggcggaggca gcauccuggc caucuacagc 960
accguggcca gcagccuggu gcugcuggug agccugggcg ccaucagcuu cugauaauag 1020
gcuggagccu cgguggccua gcuucuugcc ccuugggccu ccccccagcc ccuccucccc 1080
uuccugcacc cguacccccg uggucuuuga auaaagucug agugggcggc 1130
<210> 46
<211> 954
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 46
auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60
cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120
aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180
aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240
aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300
auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360
aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420
cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480
agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540
ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600
uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660
ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720
cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780
ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840
gagaacggca ccaucaccga cgccguggac ucuggcggag gcagcauccu ggccaucuac 900
agcaccgugg ccagcagccu ggugcugcug gugagccugg gcgccaucag cuuc 954
<210> 47
<211> 318
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 47
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Ser Gly Gly Gly Ser Ile Leu Ala Ile Tyr Ser Thr Val Ala
290 295 300
Ser Ser Leu Val Leu Leu Val Ser Leu Gly Ala Ile Ser Phe
305 310 315
<210> 48
<211> 1238
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 48
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120
acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180
guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240
gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300
cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360
cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420
aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480
ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540
agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600
aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660
aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720
gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780
cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840
gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900
aacggcacca ucaccgacgc cguggacucu ggcggaggca gcauccuggc caucuacagc 960
accguggcca gcagccuggu gcugcuggug agccugggcg ccaucagcuu cggcggaggc 1020
agcgccaucg gcggcuacau ccccgaggcc ccuagagacg gccaggccua cgugcggaag 1080
gacggcgagu gggugcugcu gagcaccuuc cugggcaagu gauaauaggc uggagccucg 1140
guggccuagc uucuugcccc uugggccucc ccccagcccc uccuccccuu ccugcacccg 1200
uacccccgug gucuuugaau aaagucugag ugggcggc 1238
<210> 49
<211> 1062
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 49
auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60
cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120
aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180
aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240
aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300
auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360
aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420
cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480
agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540
ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600
uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660
ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720
cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780
ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840
gagaacggca ccaucaccga cgccguggac ucuggcggag gcagcauccu ggccaucuac 900
agcaccgugg ccagcagccu ggugcugcug gugagccugg gcgccaucag cuucggcgga 960
ggcagcgcca ucggcggcua cauccccgag gccccuagag acggccaggc cuacgugcgg 1020
aaggacggcg agugggugcu gcugagcacc uuccugggca ag 1062
<210> 50
<211> 354
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 50
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Ser Gly Gly Gly Ser Ile Leu Ala Ile Tyr Ser Thr Val Ala
290 295 300
Ser Ser Leu Val Leu Leu Val Ser Leu Gly Ala Ile Ser Phe Gly Gly
305 310 315 320
Gly Ser Ala Ile Gly Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln
325 330 335
Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu
340 345 350
Gly Lys
<210> 51
<211> 1130
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 51
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120
acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180
gugugccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240
gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300
cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360
cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420
aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480
ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540
agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600
aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660
aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720
gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780
cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840
gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900
aacggcacca ucaccgacgc cguggacucu ggcggaggca gcauccuggc caucuacagc 960
accguggcca gcagccuggu gcugcuggug agccugggcg ccaucagcuu cugauaauag 1020
gcuggagccu cgguggccua gcuucuugcc ccuugggccu ccccccagcc ccuccucccc 1080
uuccugcacc cguacccccg uggucuuuga auaaagucug agugggcggc 1130
<210> 52
<211> 954
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 52
auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60
cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120
aaggugugcc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180
aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240
aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300
auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360
aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420
cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480
agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540
ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600
uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660
ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720
cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780
ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840
gagaacggca ccaucaccga cgccguggac ucuggcggag gcagcauccu ggccaucuac 900
agcaccgugg ccagcagccu ggugcugcug gugagccugg gcgccaucag cuuc 954
<210> 53
<211> 318
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 53
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Cys Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Ser Gly Gly Gly Ser Ile Leu Ala Ile Tyr Ser Thr Val Ala
290 295 300
Ser Ser Leu Val Leu Leu Val Ser Leu Gly Ala Ile Ser Phe
305 310 315
<210> 54
<211> 1181
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 54
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120
acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180
gugugccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240
gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300
cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360
cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420
aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480
ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540
agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600
aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660
aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720
gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780
cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840
gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900
aacggcacca ucaccgacgc cguggacugc gcccuggacc cucugagcga gaccaagugc 960
acccugaaga gcuucaccuc uggcggaggc agcauccugg ccaucuacag caccguggcc 1020
agcagccugg ugcugcuggu gagccugggc gccaucagcu ucugauaaua ggcuggagcc 1080
ucgguggccu agcuucuugc cccuugggcc uccccccagc cccuccuccc cuuccugcac 1140
ccguaccccc guggucuuug aauaaagucu gagugggcgg c 1181
<210> 55
<211> 1005
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 55
auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60
cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120
aaggugugcc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180
aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240
aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300
auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360
aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420
cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480
agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540
ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600
uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660
ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720
cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780
ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840
gagaacggca ccaucaccga cgccguggac ugcgcccugg acccucugag cgagaccaag 900
ugcacccuga agagcuucac cucuggcgga ggcagcaucc uggccaucua cagcaccgug 960
gccagcagcc uggugcugcu ggugagccug ggcgccauca gcuuc 1005
<210> 56
<211> 335
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 56
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Cys Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Ser Gly Gly Gly Ser Ile Leu Ala Ile Tyr Ser Thr Val
305 310 315 320
Ala Ser Ser Leu Val Leu Leu Val Ser Leu Gly Ala Ile Ser Phe
325 330 335
<210> 57
<211> 1181
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 57
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120
acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180
guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240
gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300
cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360
cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420
aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480
ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540
agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600
aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660
aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720
gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780
cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840
gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900
aacggcacca ucaccgacgc cguggacugc gcccuggacc cucugagcga gaccaagugc 960
acccugaaga gcuucaccuc uggcggaggc agcauccugg ccaucuacag caccguggcc 1020
agcagccugg ugcugcuggu gagccugggc gccaucagcu ucugauaaua ggcuggagcc 1080
ucgguggccu agcuucuugc cccuugggcc uccccccagc cccuccuccc cuuccugcac 1140
ccguaccccc guggucuuug aauaaagucu gagugggcgg c 1181
<210> 58
<211> 1005
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 58
auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60
cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120
aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180
aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240
aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300
auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360
aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420
cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480
agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540
ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600
uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660
ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720
cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780
ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840
gagaacggca ccaucaccga cgccguggac ugcgcccugg acccucugag cgagaccaag 900
ugcacccuga agagcuucac cucuggcgga ggcagcaucc uggccaucua cagcaccgug 960
gccagcagcc uggugcugcu ggugagccug ggcgccauca gcuuc 1005
<210> 59
<211> 335
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 59
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Ser Gly Gly Gly Ser Ile Leu Ala Ile Tyr Ser Thr Val
305 310 315 320
Ala Ser Ser Leu Val Leu Leu Val Ser Leu Gly Ala Ile Ser Phe
325 330 335
<210> 60
<211> 836
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 60
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uacagcaugc agcuggcuag cugcgugacc cugacccugg ugcugcuggu gaacagccag 120
cccaacauca ccaaccugug ccccuucggc gagguguuca acgccacccg guucgccagc 180
guguacgccu ggaaccggaa gcggaucagc aacugcgugg ccgacuacag cgugcuguac 240
aacagcgcca gcuucagcac cuucaagugc uacggcguga gccccaccaa gcugaacgac 300
cugugcuuca ccaacgugua cgccgacagc uucgugaucc guggcgacga ggugcggcag 360
aucgcacccg gccagacagg caagaucgcc gacuacaacu acaagcugcc cgacgacuuc 420
accggcugcg ugaucgccug gaacagcaac aaccucgaca gcaagguggg cggcaacuac 480
aacuaccugu accggcuguu ccggaagagc aaccugaagc ccuucgagcg ggacaucagc 540
accgagaucu accaagccgg cuccaccccu ugcaacggcg uggagggcuu caacugcuac 600
uucccucugc agagcuacgg cuuccagccc accaacggcg ugggcuacca gcccuaccgg 660
gugguggugc ugagcuucga gcugcugcac gccccagcca ccgugugugg ccccaaguga 720
uaauaggcug gagccucggu ggccuagcuu cuugccccuu gggccucccc ccagccccuc 780
cuccccuucc ugcacccgua cccccguggu cuuugaauaa agucugagug ggcggc 836
<210> 61
<211> 660
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 61
auguacagca ugcagcuggc uagcugcgug acccugaccc uggugcugcu ggugaacagc 60
cagcccaaca ucaccaaccu gugccccuuc ggcgaggugu ucaacgccac ccgguucgcc 120
agcguguacg ccuggaaccg gaagcggauc agcaacugcg uggccgacua cagcgugcug 180
uacaacagcg ccagcuucag caccuucaag ugcuacggcg ugagccccac caagcugaac 240
gaccugugcu ucaccaacgu guacgccgac agcuucguga uccguggcga cgaggugcgg 300
cagaucgcac ccggccagac aggcaagauc gccgacuaca acuacaagcu gcccgacgac 360
uucaccggcu gcgugaucgc cuggaacagc aacaaccucg acagcaaggu gggcggcaac 420
uacaacuacc uguaccggcu guuccggaag agcaaccuga agcccuucga gcgggacauc 480
agcaccgaga ucuaccaagc cggcuccacc ccuugcaacg gcguggaggg cuucaacugc 540
uacuucccuc ugcagagcua cggcuuccag cccaccaacg gcgugggcua ccagcccuac 600
cggguggugg ugcugagcuu cgagcugcug cacgccccag ccaccgugug uggccccaag 660
<210> 62
<211> 220
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 62
Met Tyr Ser Met Gln Leu Ala Ser Cys Val Thr Leu Thr Leu Val Leu
1 5 10 15
Leu Val Asn Ser Gln Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu
20 25 30
Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys
35 40 45
Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala
50 55 60
Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn
65 70 75 80
Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly
85 90 95
Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp
100 105 110
Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp
115 120 125
Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu
130 135 140
Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile
145 150 155 160
Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu
165 170 175
Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr
180 185 190
Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu
195 200 205
Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
210 215 220
<210> 63
<211> 1349
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 63
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uacagcaugc agcuggcuag cugcgugacc cugacccugg ugcugcuggu gaacagccag 120
cccaacauca ccaaccugug ccccuucggc gagguguuca acgccacccg guucgccagc 180
guguacgccu ggaaccggaa gcggaucagc aacugcgugg ccgacuacag cgugcuguac 240
aacagcgcca gcuucagcac cuucaagugc uacggcguga gccccaccaa gcugaacgac 300
cugugcuuca ccaacgugua cgccgacagc uucgugaucc guggcgacga ggugcggcag 360
aucgcacccg gccagacagg caagaucgcc gacuacaacu acaagcugcc cgacgacuuc 420
accggcugcg ugaucgccug gaacagcaac aaccucgaca gcaagguggg cggcaacuac 480
aacuaccugu accggcuguu ccggaagagc aaccugaagc ccuucgagcg ggacaucagc 540
accgagaucu accaagccgg cuccaccccu ugcaacggcg uggagggcuu caacugcuac 600
uucccucugc agagcuacgg cuuccagccc accaacggcg ugggcuacca gcccuaccgg 660
gugguggugc ugagcuucga gcugcugcac gccccagcca ccgugugugg ccccaaggga 720
ggaggcagcg gcggcgauau caucaagcuu cugaacgagc aaguuaacaa ggaaaugcag 780
agcaguaauc ucuacaugag caugagcagc uggugcuaca cccacucccu ggacggagca 840
ggccucuucc uguucgacca cgcagccgag gaguacgagc acgcuaagaa guugaucauu 900
uucuugaacg agaacaacgu gcccgugcag cuaacgucaa ucagcgcacc ugagcacaag 960
uucgagggcc ugacccagau cuuccagaag gccuacgaac acgaacagca caucuccgag 1020
agcaucaaca auauugugga ucacgcuauc aaguccaagg accacgcuac cuucaacuuc 1080
cugcaguggu acguggccga gcaacaugag gaggaggugc uguucaagga cauccuggac 1140
aagaucgagc ugaucgguaa ugagaaucac ggccuguacc uggccgacca guacgugaag 1200
ggcaucgcca agagccggaa gucaggcuca ugauaauagg cuggagccuc gguggccuag 1260
cuucuugccc cuugggccuc cccccagccc cuccuccccu uccugcaccc guacccccgu 1320
ggucuuugaa uaaagucuga gugggcggc 1349
<210> 64
<211> 1173
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 64
auguacagca ugcagcuggc uagcugcgug acccugaccc uggugcugcu ggugaacagc 60
cagcccaaca ucaccaaccu gugccccuuc ggcgaggugu ucaacgccac ccgguucgcc 120
agcguguacg ccuggaaccg gaagcggauc agcaacugcg uggccgacua cagcgugcug 180
uacaacagcg ccagcuucag caccuucaag ugcuacggcg ugagccccac caagcugaac 240
gaccugugcu ucaccaacgu guacgccgac agcuucguga uccguggcga cgaggugcgg 300
cagaucgcac ccggccagac aggcaagauc gccgacuaca acuacaagcu gcccgacgac 360
uucaccggcu gcgugaucgc cuggaacagc aacaaccucg acagcaaggu gggcggcaac 420
uacaacuacc uguaccggcu guuccggaag agcaaccuga agcccuucga gcgggacauc 480
agcaccgaga ucuaccaagc cggcuccacc ccuugcaacg gcguggaggg cuucaacugc 540
uacuucccuc ugcagagcua cggcuuccag cccaccaacg gcgugggcua ccagcccuac 600
cggguggugg ugcugagcuu cgagcugcug cacgccccag ccaccgugug uggccccaag 660
ggaggaggca gcggcggcga uaucaucaag cuucugaacg agcaaguuaa caaggaaaug 720
cagagcagua aucucuacau gagcaugagc agcuggugcu acacccacuc ccuggacgga 780
gcaggccucu uccuguucga ccacgcagcc gaggaguacg agcacgcuaa gaaguugauc 840
auuuucuuga acgagaacaa cgugcccgug cagcuaacgu caaucagcgc accugagcac 900
aaguucgagg gccugaccca gaucuuccag aaggccuacg aacacgaaca gcacaucucc 960
gagagcauca acaauauugu ggaucacgcu aucaagucca aggaccacgc uaccuucaac 1020
uuccugcagu gguacguggc cgagcaacau gaggaggagg ugcuguucaa ggacauccug 1080
gacaagaucg agcugaucgg uaaugagaau cacggccugu accuggccga ccaguacgug 1140
aagggcaucg ccaagagccg gaagucaggc uca 1173
<210> 65
<211> 391
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 65
Met Tyr Ser Met Gln Leu Ala Ser Cys Val Thr Leu Thr Leu Val Leu
1 5 10 15
Leu Val Asn Ser Gln Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu
20 25 30
Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys
35 40 45
Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala
50 55 60
Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn
65 70 75 80
Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly
85 90 95
Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp
100 105 110
Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp
115 120 125
Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu
130 135 140
Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile
145 150 155 160
Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu
165 170 175
Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr
180 185 190
Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu
195 200 205
Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Gly Gly Gly Ser
210 215 220
Gly Gly Asp Ile Ile Lys Leu Leu Asn Glu Gln Val Asn Lys Glu Met
225 230 235 240
Gln Ser Ser Asn Leu Tyr Met Ser Met Ser Ser Trp Cys Tyr Thr His
245 250 255
Ser Leu Asp Gly Ala Gly Leu Phe Leu Phe Asp His Ala Ala Glu Glu
260 265 270
Tyr Glu His Ala Lys Lys Leu Ile Ile Phe Leu Asn Glu Asn Asn Val
275 280 285
Pro Val Gln Leu Thr Ser Ile Ser Ala Pro Glu His Lys Phe Glu Gly
290 295 300
Leu Thr Gln Ile Phe Gln Lys Ala Tyr Glu His Glu Gln His Ile Ser
305 310 315 320
Glu Ser Ile Asn Asn Ile Val Asp His Ala Ile Lys Ser Lys Asp His
325 330 335
Ala Thr Phe Asn Phe Leu Gln Trp Tyr Val Ala Glu Gln His Glu Glu
340 345 350
Glu Val Leu Phe Lys Asp Ile Leu Asp Lys Ile Glu Leu Ile Gly Asn
355 360 365
Glu Asn His Gly Leu Tyr Leu Ala Asp Gln Tyr Val Lys Gly Ile Ala
370 375 380
Lys Ser Arg Lys Ser Gly Ser
385 390
<210> 66
<211> 1376
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 66
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
ggcauccugc ccagcccugg caugcccgcu cugcugagcc uggugagccu gcugagcgug 120
cugcugaugg gcugcguggc ugagaccggc augcagaucu acgagggcaa gcugaccgca 180
gagggccugc gguucggcau cguggccagc cgcgccaacc acgcucuggu ggaccggcuu 240
guggagggcg cuaucgacgc caucgugaga cacggcggcc gggaagagga caucacccug 300
gugcgggugu gcggcagcug ggagauuccc gucgccgccg gagaacuggc ccggaaggag 360
gacaucgacg ccgugaucgc caucggcgug cugugcagag gcgccacgcc cagcuucgac 420
uacaucgcca gcgaggugag caagggccug gccgaccuga gccuggagcu gcggaagccc 480
aucaccuucg gcgugaucac cgccgacacc cuggagcagg ccaucgaggc cgcaggcacc 540
ugccacggca acaagggcug ggaagccgcc cugugcgcca ucgagauggc caaccuguuc 600
aagagccugc ggggcggaag uggaggcucu gguggcagcg gaggaucugg cggcggccag 660
cccaacauca ccaaccugug ccccuucggc gagguguuca acgccacccg guucgccagc 720
guguacgccu ggaaccggaa gcggaucagc aacugcgugg ccgacuacag cgugcuguac 780
aacagcgcca gcuucagcac cuucaagugc uacggcguga gccccaccaa gcugaacgac 840
cugugcuuca ccaacgugua cgccgacagc uucgugaucc guggcgacga ggugcggcag 900
aucgcacccg gccagacagg caagaucgcc gacuacaacu acaagcugcc cgacgacuuc 960
accggcugcg ugaucgccug gaacagcaac aaccucgaca gcaagguggg cggcaacuac 1020
aacuaccugu accggcuguu ccggaagagc aaccugaagc ccuucgagcg ggacaucagc 1080
accgagaucu accaagccgg cuccaccccu ugcaacggcg uggagggcuu caacugcuac 1140
uucccucugc agagcuacgg cuuccagccc accaacggcg ugggcuacca gcccuaccgg 1200
gugguggugc ugagcuucga gcugcugcac gccccagcca ccgugugugg ccccaaguga 1260
uaauaggcug gagccucggu ggccuagcuu cuugccccuu gggccucccc ccagccccuc 1320
cuccccuucc ugcacccgua cccccguggu cuuugaauaa agucugagug ggcggc 1376
<210> 67
<211> 1200
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 67
augggcaucc ugcccagccc uggcaugccc gcucugcuga gccuggugag ccugcugagc 60
gugcugcuga ugggcugcgu ggcugagacc ggcaugcaga ucuacgaggg caagcugacc 120
gcagagggcc ugcgguucgg caucguggcc agccgcgcca accacgcucu gguggaccgg 180
cuuguggagg gcgcuaucga cgccaucgug agacacggcg gccgggaaga ggacaucacc 240
cuggugcggg ugugcggcag cugggagauu cccgucgccg ccggagaacu ggcccggaag 300
gaggacaucg acgccgugau cgccaucggc gugcugugca gaggcgccac gcccagcuuc 360
gacuacaucg ccagcgaggu gagcaagggc cuggccgacc ugagccugga gcugcggaag 420
cccaucaccu ucggcgugau caccgccgac acccuggagc aggccaucga ggccgcaggc 480
accugccacg gcaacaaggg cugggaagcc gcccugugcg ccaucgagau ggccaaccug 540
uucaagagcc ugcggggcgg aaguggaggc ucugguggca gcggaggauc uggcggcggc 600
cagcccaaca ucaccaaccu gugccccuuc ggcgaggugu ucaacgccac ccgguucgcc 660
agcguguacg ccuggaaccg gaagcggauc agcaacugcg uggccgacua cagcgugcug 720
uacaacagcg ccagcuucag caccuucaag ugcuacggcg ugagccccac caagcugaac 780
gaccugugcu ucaccaacgu guacgccgac agcuucguga uccguggcga cgaggugcgg 840
cagaucgcac ccggccagac aggcaagauc gccgacuaca acuacaagcu gcccgacgac 900
uucaccggcu gcgugaucgc cuggaacagc aacaaccucg acagcaaggu gggcggcaac 960
uacaacuacc uguaccggcu guuccggaag agcaaccuga agcccuucga gcgggacauc 1020
agcaccgaga ucuaccaagc cggcuccacc ccuugcaacg gcguggaggg cuucaacugc 1080
uacuucccuc ugcagagcua cggcuuccag cccaccaacg gcgugggcua ccagcccuac 1140
cggguggugg ugcugagcuu cgagcugcug cacgccccag ccaccgugug uggccccaag 1200
<210> 68
<211> 400
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 68
Met Gly Ile Leu Pro Ser Pro Gly Met Pro Ala Leu Leu Ser Leu Val
1 5 10 15
Ser Leu Leu Ser Val Leu Leu Met Gly Cys Val Ala Glu Thr Gly Met
20 25 30
Gln Ile Tyr Glu Gly Lys Leu Thr Ala Glu Gly Leu Arg Phe Gly Ile
35 40 45
Val Ala Ser Arg Ala Asn His Ala Leu Val Asp Arg Leu Val Glu Gly
50 55 60
Ala Ile Asp Ala Ile Val Arg His Gly Gly Arg Glu Glu Asp Ile Thr
65 70 75 80
Leu Val Arg Val Cys Gly Ser Trp Glu Ile Pro Val Ala Ala Gly Glu
85 90 95
Leu Ala Arg Lys Glu Asp Ile Asp Ala Val Ile Ala Ile Gly Val Leu
100 105 110
Cys Arg Gly Ala Thr Pro Ser Phe Asp Tyr Ile Ala Ser Glu Val Ser
115 120 125
Lys Gly Leu Ala Asp Leu Ser Leu Glu Leu Arg Lys Pro Ile Thr Phe
130 135 140
Gly Val Ile Thr Ala Asp Thr Leu Glu Gln Ala Ile Glu Ala Ala Gly
145 150 155 160
Thr Cys His Gly Asn Lys Gly Trp Glu Ala Ala Leu Cys Ala Ile Glu
165 170 175
Met Ala Asn Leu Phe Lys Ser Leu Arg Gly Gly Ser Gly Gly Ser Gly
180 185 190
Gly Ser Gly Gly Ser Gly Gly Gly Gln Pro Asn Ile Thr Asn Leu Cys
195 200 205
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
210 215 220
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
225 230 235 240
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
245 250 255
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
260 265 270
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
275 280 285
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
290 295 300
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
305 310 315 320
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
325 330 335
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
340 345 350
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
355 360 365
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
370 375 380
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
385 390 395 400
<210> 69
<211> 1334
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 69
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uacagcaugc agcuggcuag cugcgugacc cugacccugg ugcugcuggu gaacagccag 120
cccaacauca ccaaccugug ccccuucggc gagguguuca acgccacccg guucgccagc 180
guguacgccu ggaaccggaa gcggaucagc aacugcgugg ccgacuacag cgugcuguac 240
aacagcgcca gcuucagcac cuucaagugc uacggcguga gccccaccaa gcugaacgac 300
cugugcuuca ccaacgugua cgccgacagc uucgugaucc guggcgacga ggugcggcag 360
aucgcacccg gccagacagg caagaucgcc gacuacaacu acaagcugcc cgacgacuuc 420
accggcugcg ugaucgccug gaacagcaac aaccucgaca gcaagguggg cggcaacuac 480
aacuaccugu accggcuguu ccggaagagc aaccugaagc ccuucgagcg ggacaucagc 540
accgagaucu accaagccgg cuccaccccu ugcaacggcg uggagggcuu caacugcuac 600
uucccucugc agagcuacgg cuuccagccc accaacggcg ugggcuacca gcccuaccgg 660
gugguggugc ugagcuucga gcugcugcac gccccagcca ccgugugugg ccccaaggga 720
ggaggcuccg gaggcgguag cgcugagacc ggcaugcaga ucuacgaggg caagcugacc 780
gcagagggcc ugcgguucgg caucguggcc agccgcgcca accacgcucu gguggaccgg 840
cuuguggagg gcgcuaucga cgccaucgug agacacggcg gccgggaaga ggacaucacc 900
cuggugcggg ugugcggcag cugggagauu cccgucgccg ccggagaacu ggcccggaag 960
gaggacaucg acgccgugau cgccaucggc gugcugugca gaggcgccac gcccagcuuc 1020
gacuacaucg ccagcgaggu gagcaagggc cuggccgacc ugagccugga gcugcggaag 1080
cccaucaccu ucggcgugau caccgccgac acccuggagc aggccaucga ggccgcaggc 1140
accugccacg gcaacaaggg cugggaagcc gcccugugcg ccaucgagau ggccaaccug 1200
uucaagagcc ugcggugaua auaggcugga gccucggugg ccuagcuucu ugccccuugg 1260
gccucccccc agccccuccu ccccuuccug cacccguacc cccguggucu uugaauaaag 1320
ucugaguggg cggc 1334
<210> 70
<211> 1158
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 70
auguacagca ugcagcuggc uagcugcgug acccugaccc uggugcugcu ggugaacagc 60
cagcccaaca ucaccaaccu gugccccuuc ggcgaggugu ucaacgccac ccgguucgcc 120
agcguguacg ccuggaaccg gaagcggauc agcaacugcg uggccgacua cagcgugcug 180
uacaacagcg ccagcuucag caccuucaag ugcuacggcg ugagccccac caagcugaac 240
gaccugugcu ucaccaacgu guacgccgac agcuucguga uccguggcga cgaggugcgg 300
cagaucgcac ccggccagac aggcaagauc gccgacuaca acuacaagcu gcccgacgac 360
uucaccggcu gcgugaucgc cuggaacagc aacaaccucg acagcaaggu gggcggcaac 420
uacaacuacc uguaccggcu guuccggaag agcaaccuga agcccuucga gcgggacauc 480
agcaccgaga ucuaccaagc cggcuccacc ccuugcaacg gcguggaggg cuucaacugc 540
uacuucccuc ugcagagcua cggcuuccag cccaccaacg gcgugggcua ccagcccuac 600
cggguggugg ugcugagcuu cgagcugcug cacgccccag ccaccgugug uggccccaag 660
ggaggaggcu ccggaggcgg uagcgcugag accggcaugc agaucuacga gggcaagcug 720
accgcagagg gccugcgguu cggcaucgug gccagccgcg ccaaccacgc ucugguggac 780
cggcuugugg agggcgcuau cgacgccauc gugagacacg gcggccggga agaggacauc 840
acccuggugc gggugugcgg cagcugggag auucccgucg ccgccggaga acuggcccgg 900
aaggaggaca ucgacgccgu gaucgccauc ggcgugcugu gcagaggcgc cacgcccagc 960
uucgacuaca ucgccagcga ggugagcaag ggccuggccg accugagccu ggagcugcgg 1020
aagcccauca ccuucggcgu gaucaccgcc gacacccugg agcaggccau cgaggccgca 1080
ggcaccugcc acggcaacaa gggcugggaa gccgcccugu gcgccaucga gauggccaac 1140
cuguucaaga gccugcgg 1158
<210> 71
<211> 386
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 71
Met Tyr Ser Met Gln Leu Ala Ser Cys Val Thr Leu Thr Leu Val Leu
1 5 10 15
Leu Val Asn Ser Gln Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu
20 25 30
Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys
35 40 45
Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala
50 55 60
Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn
65 70 75 80
Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly
85 90 95
Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp
100 105 110
Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp
115 120 125
Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu
130 135 140
Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile
145 150 155 160
Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu
165 170 175
Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr
180 185 190
Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu
195 200 205
Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Gly Gly Gly Ser
210 215 220
Gly Gly Gly Ser Ala Glu Thr Gly Met Gln Ile Tyr Glu Gly Lys Leu
225 230 235 240
Thr Ala Glu Gly Leu Arg Phe Gly Ile Val Ala Ser Arg Ala Asn His
245 250 255
Ala Leu Val Asp Arg Leu Val Glu Gly Ala Ile Asp Ala Ile Val Arg
260 265 270
His Gly Gly Arg Glu Glu Asp Ile Thr Leu Val Arg Val Cys Gly Ser
275 280 285
Trp Glu Ile Pro Val Ala Ala Gly Glu Leu Ala Arg Lys Glu Asp Ile
290 295 300
Asp Ala Val Ile Ala Ile Gly Val Leu Cys Arg Gly Ala Thr Pro Ser
305 310 315 320
Phe Asp Tyr Ile Ala Ser Glu Val Ser Lys Gly Leu Ala Asp Leu Ser
325 330 335
Leu Glu Leu Arg Lys Pro Ile Thr Phe Gly Val Ile Thr Ala Asp Thr
340 345 350
Leu Glu Gln Ala Ile Glu Ala Ala Gly Thr Cys His Gly Asn Lys Gly
355 360 365
Trp Glu Ala Ala Leu Cys Ala Ile Glu Met Ala Asn Leu Phe Lys Ser
370 375 380
Leu Arg
385
<210> 72
<211> 947
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 72
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uacagcaugc agcuggcuag cugcgugacc cugacccugg ugcugcuggu gaacagccag 120
cccaacauca ccaaccugug ccccuucggc gagguguuca acgccacccg guucgccagc 180
guguacgccu ggaaccggaa gcggaucagc aacugcgugg ccgacuacag cgugcuguac 240
aacagcgcca gcuucagcac cuucaagugc uacggcguga gccccaccaa gcugaacgac 300
cugugcuuca ccaacgugua cgccgacagc uucgugaucc guggcgacga ggugcggcag 360
aucgcacccg gccagacagg caagaucgcc gacuacaacu acaagcugcc cgacgacuuc 420
accggcugcg ugaucgccug gaacagcaac aaccucgaca gcaagguggg cggcaacuac 480
aacuaccugu accggcuguu ccggaagagc aaccugaagc ccuucgagcg ggacaucagc 540
accgagaucu accaagccgg cuccaccccu ugcaacggcg uggagggcuu caacugcuac 600
uucccucugc agagcuacgg cuuccagccc accaacggcg ugggcuacca gcccuaccgg 660
gugguggugc ugagcuucga gcugcugcac gccccagcca ccgugugugg ccccaagucu 720
ggcggaggcg gcagcgccau cggcggcuac auccccgagg ccccuagaga cggccaggcc 780
uacgugcgga aggacggcga gugggugcug cugagcaccu uccugggcug auaauaggcu 840
ggagccucgg uggccuagcu ucuugccccu ugggccuccc cccagccccu ccuccccuuc 900
cugcacccgu acccccgugg ucuuugaaua aagucugagu gggcggc 947
<210> 73
<211> 771
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 73
auguacagca ugcagcuggc uagcugcgug acccugaccc uggugcugcu ggugaacagc 60
cagcccaaca ucaccaaccu gugccccuuc ggcgaggugu ucaacgccac ccgguucgcc 120
agcguguacg ccuggaaccg gaagcggauc agcaacugcg uggccgacua cagcgugcug 180
uacaacagcg ccagcuucag caccuucaag ugcuacggcg ugagccccac caagcugaac 240
gaccugugcu ucaccaacgu guacgccgac agcuucguga uccguggcga cgaggugcgg 300
cagaucgcac ccggccagac aggcaagauc gccgacuaca acuacaagcu gcccgacgac 360
uucaccggcu gcgugaucgc cuggaacagc aacaaccucg acagcaaggu gggcggcaac 420
uacaacuacc uguaccggcu guuccggaag agcaaccuga agcccuucga gcgggacauc 480
agcaccgaga ucuaccaagc cggcuccacc ccuugcaacg gcguggaggg cuucaacugc 540
uacuucccuc ugcagagcua cggcuuccag cccaccaacg gcgugggcua ccagcccuac 600
cggguggugg ugcugagcuu cgagcugcug cacgccccag ccaccgugug uggccccaag 660
ucuggcggag gcggcagcgc caucggcggc uacauccccg aggccccuag agacggccag 720
gccuacgugc ggaaggacgg cgagugggug cugcugagca ccuuccuggg c 771
<210> 74
<211> 257
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 74
Met Tyr Ser Met Gln Leu Ala Ser Cys Val Thr Leu Thr Leu Val Leu
1 5 10 15
Leu Val Asn Ser Gln Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu
20 25 30
Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys
35 40 45
Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala
50 55 60
Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn
65 70 75 80
Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly
85 90 95
Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp
100 105 110
Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp
115 120 125
Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu
130 135 140
Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile
145 150 155 160
Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu
165 170 175
Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr
180 185 190
Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu
195 200 205
Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Ser Gly Gly Gly
210 215 220
Gly Ser Ala Ile Gly Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln
225 230 235 240
Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu
245 250 255
Gly
<210> 75
<211> 920
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 75
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uacagcaugc agcuggcuag cugcgugacc cugacccugg ugcugcuggu gaacagccag 120
cccaacauca ccaaccugug ccccuucggc gagguguuca acgccacccg guucgccagc 180
guguacgccu ggaaccggaa gcggaucagc aacugcgugg ccgacuacag cgugcuguac 240
aacagcgcca gcuucagcac cuucaagugc uacggcguga gccccaccaa gcugaacgac 300
cugugcuuca ccaacgugua cgccgacagc uucgugaucc guggcgacga ggugcggcag 360
aucgcacccg gccagacagg caagaucgcc gacuacaacu acaagcugcc cgacgacuuc 420
accggcugcg ugaucgccug gaacagcaac aaccucgaca gcaagguggg cggcaacuac 480
aacuaccugu accggcuguu ccggaagagc aaccugaagc ccuucgagcg ggacaucagc 540
accgagaucu accaagccgg cuccaccccu ugcaacggcg uggagggcuu caacugcuac 600
uucccucugc agagcuacgg cuuccagccc accaacggcg ugggcuacca gcccuaccgg 660
gugguggugc ugagcuucga gcugcugcac gccccagcca ccgugugugg ccccaagucu 720
ggcggaggca gcauccuggc caucuacagc accguggcca gcagccuggu gcugcuggug 780
agccugggcg ccaucagcuu cugauaauag gcuggagccu cgguggccua gcuucuugcc 840
ccuugggccu ccccccagcc ccuccucccc uuccugcacc cguacccccg uggucuuuga 900
auaaagucug agugggcggc 920
<210> 76
<211> 744
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 76
auguacagca ugcagcuggc uagcugcgug acccugaccc uggugcugcu ggugaacagc 60
cagcccaaca ucaccaaccu gugccccuuc ggcgaggugu ucaacgccac ccgguucgcc 120
agcguguacg ccuggaaccg gaagcggauc agcaacugcg uggccgacua cagcgugcug 180
uacaacagcg ccagcuucag caccuucaag ugcuacggcg ugagccccac caagcugaac 240
gaccugugcu ucaccaacgu guacgccgac agcuucguga uccguggcga cgaggugcgg 300
cagaucgcac ccggccagac aggcaagauc gccgacuaca acuacaagcu gcccgacgac 360
uucaccggcu gcgugaucgc cuggaacagc aacaaccucg acagcaaggu gggcggcaac 420
uacaacuacc uguaccggcu guuccggaag agcaaccuga agcccuucga gcgggacauc 480
agcaccgaga ucuaccaagc cggcuccacc ccuugcaacg gcguggaggg cuucaacugc 540
uacuucccuc ugcagagcua cggcuuccag cccaccaacg gcgugggcua ccagcccuac 600
cggguggugg ugcugagcuu cgagcugcug cacgccccag ccaccgugug uggccccaag 660
ucuggcggag gcagcauccu ggccaucuac agcaccgugg ccagcagccu ggugcugcug 720
gugagccugg gcgccaucag cuuc 744
<210> 77
<211> 248
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 77
Met Tyr Ser Met Gln Leu Ala Ser Cys Val Thr Leu Thr Leu Val Leu
1 5 10 15
Leu Val Asn Ser Gln Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu
20 25 30
Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys
35 40 45
Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala
50 55 60
Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn
65 70 75 80
Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly
85 90 95
Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp
100 105 110
Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp
115 120 125
Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu
130 135 140
Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile
145 150 155 160
Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu
165 170 175
Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr
180 185 190
Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu
195 200 205
Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Ser Gly Gly Gly
210 215 220
Ser Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu
225 230 235 240
Val Ser Leu Gly Ala Ile Ser Phe
245
<210> 78
<211> 1025
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 78
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uacagcaugc agcuggcuag cugcgugacc cugacccugg ugcugcuggu gaacagccag 120
cccaacauca ccaaccugug ccccuucggc gagguguuca acgccacccg guucgccagc 180
guguacgccu ggaaccggaa gcggaucagc aacugcgugg ccgacuacag cgugcuguac 240
aacagcgcca gcuucagcac cuucaagugc uacggcguga gccccaccaa gcugaacgac 300
cugugcuuca ccaacgugua cgccgacagc uucgugaucc guggcgacga ggugcggcag 360
aucgcacccg gccagacagg caagaucgcc gacuacaacu acaagcugcc cgacgacuuc 420
accggcugcg ugaucgccug gaacagcaac aaccucgaca gcaagguggg cggcaacuac 480
aacuaccugu accggcuguu ccggaagagc aaccugaagc ccuucgagcg ggacaucagc 540
accgagaucu accaagccgg cuccaccccu ugcaacggcg uggagggcuu caacugcuac 600
uucccucugc agagcuacgg cuuccagccc accaacggcg ugggcuacca gcccuaccgg 660
gugguggugc ugagcuucga gcugcugcac gccccagcca ccgugugugg ccccaagucu 720
ggcggaggcg gcagcgccau cggcggcuac auccccgagg ccccuagaga cggccaggcc 780
uacgugcgga aggacggcga gugggugcug cugagcaccu uccugggcgg aggcagcauc 840
cuggccaucu acagcaccgu ggccagcagc cuggugcugc uggugagccu gggcgccauc 900
agcuucugau aauaggcugg agccucggug gccuagcuuc uugccccuug ggccuccccc 960
cagccccucc uccccuuccu gcacccguac ccccgugguc uuugaauaaa gucugagugg 1020
gcggc 1025
<210> 79
<211> 849
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 79
auguacagca ugcagcuggc uagcugcgug acccugaccc uggugcugcu ggugaacagc 60
cagcccaaca ucaccaaccu gugccccuuc ggcgaggugu ucaacgccac ccgguucgcc 120
agcguguacg ccuggaaccg gaagcggauc agcaacugcg uggccgacua cagcgugcug 180
uacaacagcg ccagcuucag caccuucaag ugcuacggcg ugagccccac caagcugaac 240
gaccugugcu ucaccaacgu guacgccgac agcuucguga uccguggcga cgaggugcgg 300
cagaucgcac ccggccagac aggcaagauc gccgacuaca acuacaagcu gcccgacgac 360
uucaccggcu gcgugaucgc cuggaacagc aacaaccucg acagcaaggu gggcggcaac 420
uacaacuacc uguaccggcu guuccggaag agcaaccuga agcccuucga gcgggacauc 480
agcaccgaga ucuaccaagc cggcuccacc ccuugcaacg gcguggaggg cuucaacugc 540
uacuucccuc ugcagagcua cggcuuccag cccaccaacg gcgugggcua ccagcccuac 600
cggguggugg ugcugagcuu cgagcugcug cacgccccag ccaccgugug uggccccaag 660
ucuggcggag gcggcagcgc caucggcggc uacauccccg aggccccuag agacggccag 720
gccuacgugc ggaaggacgg cgagugggug cugcugagca ccuuccuggg cggaggcagc 780
auccuggcca ucuacagcac cguggccagc agccuggugc ugcuggugag ccugggcgcc 840
aucagcuuc 849
<210> 80
<211> 283
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 80
Met Tyr Ser Met Gln Leu Ala Ser Cys Val Thr Leu Thr Leu Val Leu
1 5 10 15
Leu Val Asn Ser Gln Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu
20 25 30
Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys
35 40 45
Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala
50 55 60
Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn
65 70 75 80
Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly
85 90 95
Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp
100 105 110
Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp
115 120 125
Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu
130 135 140
Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile
145 150 155 160
Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu
165 170 175
Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr
180 185 190
Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu
195 200 205
Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Ser Gly Gly Gly
210 215 220
Gly Ser Ala Ile Gly Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln
225 230 235 240
Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu
245 250 255
Gly Gly Gly Ser Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu
260 265 270
Val Leu Leu Val Ser Leu Gly Ala Ile Ser Phe
275 280
<210> 81
<211> 1028
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 81
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uacagcaugc agcuggcuag cugcgugacc cugacccugg ugcugcuggu gaacagccag 120
cccaacauca ccaaccugug ccccuucggc gagguguuca acgccacccg guucgccagc 180
guguacgccu ggaaccggaa gcggaucagc aacugcgugg ccgacuacag cgugcuguac 240
aacagcgcca gcuucagcac cuucaagugc uacggcguga gccccaccaa gcugaacgac 300
cugugcuuca ccaacgugua cgccgacagc uucgugaucc guggcgacga ggugcggcag 360
aucgcacccg gccagacagg caagaucgcc gacuacaacu acaagcugcc cgacgacuuc 420
accggcugcg ugaucgccug gaacagcaac aaccucgaca gcaagguggg cggcaacuac 480
aacuaccugu accggcuguu ccggaagagc aaccugaagc ccuucgagcg ggacaucagc 540
accgagaucu accaagccgg cuccaccccu ugcaacggcg uggagggcuu caacugcuac 600
uucccucugc agagcuacgg cuuccagccc accaacggcg ugggcuacca gcccuaccgg 660
gugguggugc ugagcuucga gcugcugcac gccccagcca ccgugugugg ccccaagucu 720
ggcggaggca gcauccuggc caucuacagc accguggcca gcagccuggu gcugcuggug 780
agccugggcg ccaucagcuu cggcggaggc agcgccaucg gcggcuacau ccccgaggcc 840
ccuagagacg gccaggccua cgugcggaag gacggcgagu gggugcugcu gagcaccuuc 900
cugggcaagu gauaauaggc uggagccucg guggccuagc uucuugcccc uugggccucc 960
ccccagcccc uccuccccuu ccugcacccg uacccccgug gucuuugaau aaagucugag 1020
ugggcggc 1028
<210> 82
<211> 852
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 82
auguacagca ugcagcuggc uagcugcgug acccugaccc uggugcugcu ggugaacagc 60
cagcccaaca ucaccaaccu gugccccuuc ggcgaggugu ucaacgccac ccgguucgcc 120
agcguguacg ccuggaaccg gaagcggauc agcaacugcg uggccgacua cagcgugcug 180
uacaacagcg ccagcuucag caccuucaag ugcuacggcg ugagccccac caagcugaac 240
gaccugugcu ucaccaacgu guacgccgac agcuucguga uccguggcga cgaggugcgg 300
cagaucgcac ccggccagac aggcaagauc gccgacuaca acuacaagcu gcccgacgac 360
uucaccggcu gcgugaucgc cuggaacagc aacaaccucg acagcaaggu gggcggcaac 420
uacaacuacc uguaccggcu guuccggaag agcaaccuga agcccuucga gcgggacauc 480
agcaccgaga ucuaccaagc cggcuccacc ccuugcaacg gcguggaggg cuucaacugc 540
uacuucccuc ugcagagcua cggcuuccag cccaccaacg gcgugggcua ccagcccuac 600
cggguggugg ugcugagcuu cgagcugcug cacgccccag ccaccgugug uggccccaag 660
ucuggcggag gcagcauccu ggccaucuac agcaccgugg ccagcagccu ggugcugcug 720
gugagccugg gcgccaucag cuucggcgga ggcagcgcca ucggcggcua cauccccgag 780
gccccuagag acggccaggc cuacgugcgg aaggacggcg agugggugcu gcugagcacc 840
uuccugggca ag 852
<210> 83
<211> 284
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 83
Met Tyr Ser Met Gln Leu Ala Ser Cys Val Thr Leu Thr Leu Val Leu
1 5 10 15
Leu Val Asn Ser Gln Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu
20 25 30
Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys
35 40 45
Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala
50 55 60
Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn
65 70 75 80
Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly
85 90 95
Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp
100 105 110
Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp
115 120 125
Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu
130 135 140
Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile
145 150 155 160
Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu
165 170 175
Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr
180 185 190
Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu
195 200 205
Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Ser Gly Gly Gly
210 215 220
Ser Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu
225 230 235 240
Val Ser Leu Gly Ala Ile Ser Phe Gly Gly Gly Ser Ala Ile Gly Gly
245 250 255
Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr Val Arg Lys Asp
260 265 270
Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly Lys
275 280
<210> 84
<211> 1142
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 84
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uacagcaugc agcuggcuag cugcgugacc cugacccugg ugcugcuggu gaacagccag 120
cgggugcagc ccaccgagag caucgugcgg uuccccaaca ucaccaaccu gugccccuuc 180
ggcgaggugu ucaacgccac ccgguucgcc agcguguacg ccuggaaccg gaagcggauc 240
agcaacugcg uggccgacua cagcgugcug uacaacagcg ccagcuucag caccuucaag 300
ugcuacggcg ugagccccac caagcugaac gaccugugcu ucaccaacgu guacgccgac 360
agcuucguga uccguggcga cgaggugcgg cagaucgcac ccggccagac aggcaagauc 420
gccgacuaca acuacaagcu gcccgacgac uucaccggcu gcgugaucgc cuggaacagc 480
aacaaccucg acagcaaggu gggcggcaac uacaacuacc uguaccggcu guuccggaag 540
agcaaccuga agcccuucga gcgggacauc agcaccgaga ucuaccaagc cggcuccacc 600
ccuugcaacg gcguggaggg cuucaacugc uacuucccuc ugcagagcua cggcuuccag 660
cccaccaacg gcgugggcua ccagcccuac cggguggugg ugcugagcuu cgagcugcug 720
cacgccccag ccaccgugug uggccccaag aagagcacca accuggugaa gaacaagugc 780
gugaacuuca acuucaacgg ccuuaccggc accggcgugc ugaccgagag caacaagaaa 840
uuccugcccu uucagcaguu cggccgggac aucgccgaca ccaccgacgc ugugcgggau 900
ccccagaccc uggagauccu ggacaucacc ccuugcagcu cuggcggagg cagcauccug 960
gccaucuaca gcaccguggc cagcagccug gugcugcugg ugagccuggg cgccaucagc 1020
uucugauaau aggcuggagc cucgguggcc uagcuucuug ccccuugggc cuccccccag 1080
ccccuccucc ccuuccugca cccguacccc cguggucuuu gaauaaaguc ugagugggcg 1140
gc 1142
<210> 85
<211> 966
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 85
auguacagca ugcagcuggc uagcugcgug acccugaccc uggugcugcu ggugaacagc 60
cagcgggugc agcccaccga gagcaucgug cgguucccca acaucaccaa ccugugcccc 120
uucggcgagg uguucaacgc cacccgguuc gccagcgugu acgccuggaa ccggaagcgg 180
aucagcaacu gcguggccga cuacagcgug cuguacaaca gcgccagcuu cagcaccuuc 240
aagugcuacg gcgugagccc caccaagcug aacgaccugu gcuucaccaa cguguacgcc 300
gacagcuucg ugauccgugg cgacgaggug cggcagaucg cacccggcca gacaggcaag 360
aucgccgacu acaacuacaa gcugcccgac gacuucaccg gcugcgugau cgccuggaac 420
agcaacaacc ucgacagcaa ggugggcggc aacuacaacu accuguaccg gcuguuccgg 480
aagagcaacc ugaagcccuu cgagcgggac aucagcaccg agaucuacca agccggcucc 540
accccuugca acggcgugga gggcuucaac ugcuacuucc cucugcagag cuacggcuuc 600
cagcccacca acggcguggg cuaccagccc uaccgggugg uggugcugag cuucgagcug 660
cugcacgccc cagccaccgu guguggcccc aagaagagca ccaaccuggu gaagaacaag 720
ugcgugaacu ucaacuucaa cggccuuacc ggcaccggcg ugcugaccga gagcaacaag 780
aaauuccugc ccuuucagca guucggccgg gacaucgccg acaccaccga cgcugugcgg 840
gauccccaga cccuggagau ccuggacauc accccuugca gcucuggcgg aggcagcauc 900
cuggccaucu acagcaccgu ggccagcagc cuggugcugc uggugagccu gggcgccauc 960
agcuuc 966
<210> 86
<211> 322
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 86
Met Tyr Ser Met Gln Leu Ala Ser Cys Val Thr Leu Thr Leu Val Leu
1 5 10 15
Leu Val Asn Ser Gln Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe
20 25 30
Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr
35 40 45
Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys
50 55 60
Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe
65 70 75 80
Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr
85 90 95
Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln
100 105 110
Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu
115 120 125
Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu
130 135 140
Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg
145 150 155 160
Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr
165 170 175
Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr
180 185 190
Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr
195 200 205
Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro
210 215 220
Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys
225 230 235 240
Cys Val Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr
245 250 255
Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile
260 265 270
Ala Asp Thr Thr Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu
275 280 285
Asp Ile Thr Pro Cys Ser Ser Gly Gly Gly Ser Ile Leu Ala Ile Tyr
290 295 300
Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val Ser Leu Gly Ala Ile
305 310 315 320
Ser Phe
<210> 87
<211> 1142
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 87
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uacagcaugc agcuggcuag cugcgugacc cugacccugg ugcugcuggu gaacagccag 120
cgggugcagc ccaccgagag caucgugcgg uuccccaaca ucaccaaccu gugccccuuc 180
ggcgaggugu ucaacgccac ccgguucgcc agcguguacg ccuggaaccg gaagcggauc 240
agcaacugcg uggccgacua cagcgugcug uacaacagcg ccagcuucag caccuucaag 300
ugcuacggcg ugagccccac caagcugaac gaccugugcu ucaccaacgu guacgccgac 360
agcuucguga uccguggcga cgaggugcgg cagaucgcac ccggccagac aggcaagauc 420
gccgacuaca acuacaagcu gcccgacgac uucaccggcu gcgugaucgc cuggaacagc 480
aacaaccucg acagcaaggu gggcggcaac uacaacuacc uguaccggcu guuccggaag 540
agcaaccuga agcccuucga gcgggacauc agcaccgaga ucuaccaagc cggcuccacc 600
ccuugcaacg gcguggaggg cuucaacugc uacuucccuc ugcagagcua cggcuuccag 660
cccaccaacg gcgugggcua ccagcccuac cggguggugg ugcugagcuu cgagcugcug 720
cacgccccag ccaccgugug uggccccaag aagagcacca accuggugaa gaacaagugc 780
gugaacuuca acuucaacgg ccuuaccggc accggcgugc ugaccgagag caacaagaaa 840
uuccugcccu uuugccaguu cggccgggac aucgccgaca ccaccgacgc ugugcgggau 900
ccccagaccc uggagauccu ggacaucacc ccuugcagcu cuggcggagg cagcauccug 960
gccaucuaca gcaccguggc cagcagccug gugcugcugg ugagccuggg cgccaucagc 1020
uucugauaau aggcuggagc cucgguggcc uagcuucuug ccccuugggc cuccccccag 1080
ccccuccucc ccuuccugca cccguacccc cguggucuuu gaauaaaguc ugagugggcg 1140
gc 1142
<210> 88
<211> 966
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 88
auguacagca ugcagcuggc uagcugcgug acccugaccc uggugcugcu ggugaacagc 60
cagcgggugc agcccaccga gagcaucgug cgguucccca acaucaccaa ccugugcccc 120
uucggcgagg uguucaacgc cacccgguuc gccagcgugu acgccuggaa ccggaagcgg 180
aucagcaacu gcguggccga cuacagcgug cuguacaaca gcgccagcuu cagcaccuuc 240
aagugcuacg gcgugagccc caccaagcug aacgaccugu gcuucaccaa cguguacgcc 300
gacagcuucg ugauccgugg cgacgaggug cggcagaucg cacccggcca gacaggcaag 360
aucgccgacu acaacuacaa gcugcccgac gacuucaccg gcugcgugau cgccuggaac 420
agcaacaacc ucgacagcaa ggugggcggc aacuacaacu accuguaccg gcuguuccgg 480
aagagcaacc ugaagcccuu cgagcgggac aucagcaccg agaucuacca agccggcucc 540
accccuugca acggcgugga gggcuucaac ugcuacuucc cucugcagag cuacggcuuc 600
cagcccacca acggcguggg cuaccagccc uaccgggugg uggugcugag cuucgagcug 660
cugcacgccc cagccaccgu guguggcccc aagaagagca ccaaccuggu gaagaacaag 720
ugcgugaacu ucaacuucaa cggccuuacc ggcaccggcg ugcugaccga gagcaacaag 780
aaauuccugc ccuuuugcca guucggccgg gacaucgccg acaccaccga cgcugugcgg 840
gauccccaga cccuggagau ccuggacauc accccuugca gcucuggcgg aggcagcauc 900
cuggccaucu acagcaccgu ggccagcagc cuggugcugc uggugagccu gggcgccauc 960
agcuuc 966
<210> 89
<211> 322
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 89
Met Tyr Ser Met Gln Leu Ala Ser Cys Val Thr Leu Thr Leu Val Leu
1 5 10 15
Leu Val Asn Ser Gln Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe
20 25 30
Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr
35 40 45
Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys
50 55 60
Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe
65 70 75 80
Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr
85 90 95
Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln
100 105 110
Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu
115 120 125
Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu
130 135 140
Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg
145 150 155 160
Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr
165 170 175
Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr
180 185 190
Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr
195 200 205
Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro
210 215 220
Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys
225 230 235 240
Cys Val Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr
245 250 255
Glu Ser Asn Lys Lys Phe Leu Pro Phe Cys Gln Phe Gly Arg Asp Ile
260 265 270
Ala Asp Thr Thr Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu
275 280 285
Asp Ile Thr Pro Cys Ser Ser Gly Gly Gly Ser Ile Leu Ala Ile Tyr
290 295 300
Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val Ser Leu Gly Ala Ile
305 310 315 320
Ser Phe
<210> 90
<211> 1748
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 90
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120
acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180
guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240
gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300
cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360
cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420
aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480
ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540
agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600
aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660
aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720
gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780
cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840
gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900
aacggcacca ucaccgacgc cguggacgga ggcggaucgg gaggcggacc caacaucacc 960
aaccugugcc ccuucggcga gguguucaac gccacccggu ucgccagcgu guacgccugg 1020
aaccggaagc ggaucagcaa cugcguggcc gacuacagcg ugcuguacaa cagcgccagc 1080
uucagcaccu ucaagugcua cggcgugagc cccaccaagc ugaacgaccu gugcuucacc 1140
aacguguacg ccgacagcuu cgugauccgu ggcgacgagg ugcggcagau cgcacccggc 1200
cagacaggca agaucgccga cuacaacuac aagcugcccg acgacuucac cggcugcgug 1260
aucgccugga acagcaacaa ccucgacagc aaggugggcg gcaacuacaa cuaccuguac 1320
cggcuguucc ggaagagcaa ccugaagccc uucgagcggg acaucagcac cgagaucuac 1380
caagccggcu ccaccccuug caacggcgug gagggcuuca acugcuacuu cccucugcag 1440
agcuacggcu uccagcccac caacggcgug ggcuaccagc ccuaccgggu gguggugcug 1500
agcuucgagc ugcugcacgc cccagccacc guguguggcc ccaagucugg cggaggcagc 1560
auccuggcca ucuacagcac cguggccagc agccuggugc ugcuggugag ccugggcgcc 1620
aucagcuucu gauaauaggc uggagccucg guggccuagc uucuugcccc uugggccucc 1680
ccccagcccc uccuccccuu ccugcacccg uacccccgug gucuuugaau aaagucugag 1740
ugggcggc 1748
<210> 91
<211> 1572
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 91
auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60
cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120
aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180
aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240
aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300
auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360
aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420
cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480
agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540
ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600
uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660
ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720
cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780
ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840
gagaacggca ccaucaccga cgccguggac ggaggcggau cgggaggcgg acccaacauc 900
accaaccugu gccccuucgg cgagguguuc aacgccaccc gguucgccag cguguacgcc 960
uggaaccgga agcggaucag caacugcgug gccgacuaca gcgugcugua caacagcgcc 1020
agcuucagca ccuucaagug cuacggcgug agccccacca agcugaacga ccugugcuuc 1080
accaacgugu acgccgacag cuucgugauc cguggcgacg aggugcggca gaucgcaccc 1140
ggccagacag gcaagaucgc cgacuacaac uacaagcugc ccgacgacuu caccggcugc 1200
gugaucgccu ggaacagcaa caaccucgac agcaaggugg gcggcaacua caacuaccug 1260
uaccggcugu uccggaagag caaccugaag cccuucgagc gggacaucag caccgagauc 1320
uaccaagccg gcuccacccc uugcaacggc guggagggcu ucaacugcua cuucccucug 1380
cagagcuacg gcuuccagcc caccaacggc gugggcuacc agcccuaccg ggugguggug 1440
cugagcuucg agcugcugca cgccccagcc accgugugug gccccaaguc uggcggaggc 1500
agcauccugg ccaucuacag caccguggcc agcagccugg ugcugcuggu gagccugggc 1560
gccaucagcu uc 1572
<210> 92
<211> 524
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 92
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Gly Gly Gly Ser Gly Gly Gly Pro Asn Ile Thr Asn Leu Cys
290 295 300
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
305 310 315 320
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
325 330 335
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
340 345 350
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
355 360 365
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
370 375 380
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
385 390 395 400
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
405 410 415
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
420 425 430
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
435 440 445
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
450 455 460
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
465 470 475 480
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
485 490 495
Ser Gly Gly Gly Ser Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser
500 505 510
Leu Val Leu Leu Val Ser Leu Gly Ala Ile Ser Phe
515 520
<210> 93
<211> 1925
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 93
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120
acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180
guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240
gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300
cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360
cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420
aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480
ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540
agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600
aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660
aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720
gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780
cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840
gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900
aacggcacca ucaccgacgc cguggacgga ggcggaucgg gaggcggacc caacaucacc 960
aaccugugcc ccuucggcga gguguucaac gccacccggu ucgccagcgu guacgccugg 1020
aaccggaagc ggaucagcaa cugcguggcc gacuacagcg ugcuguacaa cagcgccagc 1080
uucagcaccu ucaagugcua cggcgugagc cccaccaagc ugaacgaccu gugcuucacc 1140
aacguguacg ccgacagcuu cgugauccgu ggcgacgagg ugcggcagau cgcacccggc 1200
cagacaggca agaucgccga cuacaacuac aagcugcccg acgacuucac cggcugcgug 1260
aucgccugga acagcaacaa ccucgacagc aaggugggcg gcaacuacaa cuaccuguac 1320
cggcuguucc ggaagagcaa ccugaagccc uucgagcggg acaucagcac cgagaucuac 1380
caagccggcu ccaccccuug caacggcgug gagggcuuca acugcuacuu cccucugcag 1440
agcuacggcu uccagcccac caacggcgug ggcuaccagc ccuaccgggu gguggugcug 1500
agcuucgagc ugcugcacgc cccagccacc guguguggcc ccaagucugg cggaggcagc 1560
auccuggcca ucuacagcac cguggccagc agccuggugc ugcuggugag ccugggcgcc 1620
aucagcuuca agaagaagaa gcggccacgg aacuccuaca agugcggcac caacaccaug 1680
gagcgggagg agagcgagca gaccaagaag cgggagaaga uccacauucc ugaacggucc 1740
gacgaagccc agcggguguu caagagcagc aagaccagca gcugcgacaa gagcgacacc 1800
ugcuucugau aauaggcugg agccucggug gccuagcuuc uugccccuug ggccuccccc 1860
cagccccucc uccccuuccu gcacccguac ccccgugguc uuugaauaaa gucugagugg 1920
gcggc 1925
<210> 94
<211> 1749
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 94
auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60
cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120
aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180
aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240
aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300
auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360
aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420
cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480
agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540
ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600
uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660
ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720
cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780
ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840
gagaacggca ccaucaccga cgccguggac ggaggcggau cgggaggcgg acccaacauc 900
accaaccugu gccccuucgg cgagguguuc aacgccaccc gguucgccag cguguacgcc 960
uggaaccgga agcggaucag caacugcgug gccgacuaca gcgugcugua caacagcgcc 1020
agcuucagca ccuucaagug cuacggcgug agccccacca agcugaacga ccugugcuuc 1080
accaacgugu acgccgacag cuucgugauc cguggcgacg aggugcggca gaucgcaccc 1140
ggccagacag gcaagaucgc cgacuacaac uacaagcugc ccgacgacuu caccggcugc 1200
gugaucgccu ggaacagcaa caaccucgac agcaaggugg gcggcaacua caacuaccug 1260
uaccggcugu uccggaagag caaccugaag cccuucgagc gggacaucag caccgagauc 1320
uaccaagccg gcuccacccc uugcaacggc guggagggcu ucaacugcua cuucccucug 1380
cagagcuacg gcuuccagcc caccaacggc gugggcuacc agcccuaccg ggugguggug 1440
cugagcuucg agcugcugca cgccccagcc accgugugug gccccaaguc uggcggaggc 1500
agcauccugg ccaucuacag caccguggcc agcagccugg ugcugcuggu gagccugggc 1560
gccaucagcu ucaagaagaa gaagcggcca cggaacuccu acaagugcgg caccaacacc 1620
auggagcggg aggagagcga gcagaccaag aagcgggaga agauccacau uccugaacgg 1680
uccgacgaag cccagcgggu guucaagagc agcaagacca gcagcugcga caagagcgac 1740
accugcuuc 1749
<210> 95
<211> 583
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 95
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Gly Gly Gly Ser Gly Gly Gly Pro Asn Ile Thr Asn Leu Cys
290 295 300
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
305 310 315 320
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
325 330 335
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
340 345 350
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
355 360 365
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
370 375 380
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
385 390 395 400
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
405 410 415
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
420 425 430
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
435 440 445
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
450 455 460
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
465 470 475 480
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
485 490 495
Ser Gly Gly Gly Ser Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser
500 505 510
Leu Val Leu Leu Val Ser Leu Gly Ala Ile Ser Phe Lys Lys Lys Lys
515 520 525
Arg Pro Arg Asn Ser Tyr Lys Cys Gly Thr Asn Thr Met Glu Arg Glu
530 535 540
Glu Ser Glu Gln Thr Lys Lys Arg Glu Lys Ile His Ile Pro Glu Arg
545 550 555 560
Ser Asp Glu Ala Gln Arg Val Phe Lys Ser Ser Lys Thr Ser Ser Cys
565 570 575
Asp Lys Ser Asp Thr Cys Phe
580
<210> 96
<211> 1805
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 96
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120
acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180
guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240
gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300
cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360
cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420
aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480
ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540
agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600
aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660
aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720
gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780
cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840
gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900
aacggcacca ucaccgacgc cguggacgga ggcggaucgg gaggcggacc caacaucacc 960
aaccugugcc ccuucggcga gguguucaac gccacccggu ucgccagcgu guacgccugg 1020
aaccggaagc ggaucagcaa cugcguggcc gacuacagcg ugcuguacaa cagcgccagc 1080
uucagcaccu ucaagugcua cggcgugagc cccaccaagc ugaacgaccu gugcuucacc 1140
aacguguacg ccgacagcuu cgugauccgu ggcgacgagg ugcggcagau cgcacccggc 1200
cagacaggca agaucgccga cuacaacuac aagcugcccg acgacuucac cggcugcgug 1260
aucgccugga acagcaacaa ccucgacagc aaggugggcg gcaacuacaa cuaccuguac 1320
cggcuguucc ggaagagcaa ccugaagccc uucgagcggg acaucagcac cgagaucuac 1380
caagccggcu ccaccccuug caacggcgug gagggcuuca acugcuacuu cccucugcag 1440
agcuacggcu uccagcccac caacggcgug ggcuaccagc ccuaccgggu gguggugcug 1500
agcuucgagc ugcugcacgc cccagccacc guguguggcc ccaagucugg cggaggcagc 1560
auccuggcca ucuacagcac cguggccagc agccuggugc ugcuggugag ccugggcgcc 1620
aucagcuuca agcggcagua caaggacaug augagcgagg gaggaccacc uggcgcugag 1680
ccacagugau aauaggcugg agccucggug gccuagcuuc uugccccuug ggccuccccc 1740
cagccccucc uccccuuccu gcacccguac ccccgugguc uuugaauaaa gucugagugg 1800
gcggc 1805
<210> 97
<211> 1629
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 97
auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60
cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120
aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180
aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240
aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300
auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360
aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420
cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480
agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540
ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600
uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660
ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720
cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780
ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840
gagaacggca ccaucaccga cgccguggac ggaggcggau cgggaggcgg acccaacauc 900
accaaccugu gccccuucgg cgagguguuc aacgccaccc gguucgccag cguguacgcc 960
uggaaccgga agcggaucag caacugcgug gccgacuaca gcgugcugua caacagcgcc 1020
agcuucagca ccuucaagug cuacggcgug agccccacca agcugaacga ccugugcuuc 1080
accaacgugu acgccgacag cuucgugauc cguggcgacg aggugcggca gaucgcaccc 1140
ggccagacag gcaagaucgc cgacuacaac uacaagcugc ccgacgacuu caccggcugc 1200
gugaucgccu ggaacagcaa caaccucgac agcaaggugg gcggcaacua caacuaccug 1260
uaccggcugu uccggaagag caaccugaag cccuucgagc gggacaucag caccgagauc 1320
uaccaagccg gcuccacccc uugcaacggc guggagggcu ucaacugcua cuucccucug 1380
cagagcuacg gcuuccagcc caccaacggc gugggcuacc agcccuaccg ggugguggug 1440
cugagcuucg agcugcugca cgccccagcc accgugugug gccccaaguc uggcggaggc 1500
agcauccugg ccaucuacag caccguggcc agcagccugg ugcugcuggu gagccugggc 1560
gccaucagcu ucaagcggca guacaaggac augaugagcg agggaggacc accuggcgcu 1620
gagccacag 1629
<210> 98
<211> 543
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 98
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Gly Gly Gly Ser Gly Gly Gly Pro Asn Ile Thr Asn Leu Cys
290 295 300
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
305 310 315 320
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
325 330 335
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
340 345 350
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
355 360 365
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
370 375 380
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
385 390 395 400
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
405 410 415
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
420 425 430
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
435 440 445
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
450 455 460
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
465 470 475 480
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
485 490 495
Ser Gly Gly Gly Ser Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser
500 505 510
Leu Val Leu Leu Val Ser Leu Gly Ala Ile Ser Phe Lys Arg Gln Tyr
515 520 525
Lys Asp Met Met Ser Glu Gly Gly Pro Pro Gly Ala Glu Pro Gln
530 535 540
<210> 99
<211> 1853
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 99
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120
acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180
guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240
gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300
cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360
cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420
aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480
ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540
agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600
aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660
aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720
gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780
cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840
gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900
aacggcacca ucaccgacgc cguggacgga ggcggaucgg gaggcggacc caacaucacc 960
aaccugugcc ccuucggcga gguguucaac gccacccggu ucgccagcgu guacgccugg 1020
aaccggaagc ggaucagcaa cugcguggcc gacuacagcg ugcuguacaa cagcgccagc 1080
uucagcaccu ucaagugcua cggcgugagc cccaccaagc ugaacgaccu gugcuucacc 1140
aacguguacg ccgacagcuu cgugauccgu ggcgacgagg ugcggcagau cgcacccggc 1200
cagacaggca agaucgccga cuacaacuac aagcugcccg acgacuucac cggcugcgug 1260
aucgccugga acagcaacaa ccucgacagc aaggugggcg gcaacuacaa cuaccuguac 1320
cggcuguucc ggaagagcaa ccugaagccc uucgagcggg acaucagcac cgagaucuac 1380
caagccggcu ccaccccuug caacggcgug gagggcuuca acugcuacuu cccucugcag 1440
agcuacggcu uccagcccac caacggcgug ggcuaccagc ccuaccgggu gguggugcug 1500
agcuucgagc ugcugcacgc cccagccacc guguguggcc ccaagucugg cggaggcggc 1560
agcgccaucg gcggcuacau ccccgaggcc ccuagagacg gccaggccua cgugcggaag 1620
gacggcgagu gggugcugcu gagcaccuuc cugggcggag gcagcauccu ggccaucuac 1680
agcaccgugg ccagcagccu ggugcugcug gugagccugg gcgccaucag cuucugauaa 1740
uaggcuggag ccucgguggc cuagcuucuu gccccuuggg ccucccccca gccccuccuc 1800
cccuuccugc acccguaccc ccguggucuu ugaauaaagu cugagugggc ggc 1853
<210> 100
<211> 1677
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 100
auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60
cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120
aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180
aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240
aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300
auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360
aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420
cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480
agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540
ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600
uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660
ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720
cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780
ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840
gagaacggca ccaucaccga cgccguggac ggaggcggau cgggaggcgg acccaacauc 900
accaaccugu gccccuucgg cgagguguuc aacgccaccc gguucgccag cguguacgcc 960
uggaaccgga agcggaucag caacugcgug gccgacuaca gcgugcugua caacagcgcc 1020
agcuucagca ccuucaagug cuacggcgug agccccacca agcugaacga ccugugcuuc 1080
accaacgugu acgccgacag cuucgugauc cguggcgacg aggugcggca gaucgcaccc 1140
ggccagacag gcaagaucgc cgacuacaac uacaagcugc ccgacgacuu caccggcugc 1200
gugaucgccu ggaacagcaa caaccucgac agcaaggugg gcggcaacua caacuaccug 1260
uaccggcugu uccggaagag caaccugaag cccuucgagc gggacaucag caccgagauc 1320
uaccaagccg gcuccacccc uugcaacggc guggagggcu ucaacugcua cuucccucug 1380
cagagcuacg gcuuccagcc caccaacggc gugggcuacc agcccuaccg ggugguggug 1440
cugagcuucg agcugcugca cgccccagcc accgugugug gccccaaguc uggcggaggc 1500
ggcagcgcca ucggcggcua cauccccgag gccccuagag acggccaggc cuacgugcgg 1560
aaggacggcg agugggugcu gcugagcacc uuccugggcg gaggcagcau ccuggccauc 1620
uacagcaccg uggccagcag ccuggugcug cuggugagcc ugggcgccau cagcuuc 1677
<210> 101
<211> 559
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 101
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Gly Gly Gly Ser Gly Gly Gly Pro Asn Ile Thr Asn Leu Cys
290 295 300
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
305 310 315 320
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
325 330 335
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
340 345 350
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
355 360 365
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
370 375 380
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
385 390 395 400
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
405 410 415
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
420 425 430
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
435 440 445
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
450 455 460
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
465 470 475 480
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
485 490 495
Ser Gly Gly Gly Gly Ser Ala Ile Gly Gly Tyr Ile Pro Glu Ala Pro
500 505 510
Arg Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu
515 520 525
Ser Thr Phe Leu Gly Gly Gly Ser Ile Leu Ala Ile Tyr Ser Thr Val
530 535 540
Ala Ser Ser Leu Val Leu Leu Val Ser Leu Gly Ala Ile Ser Phe
545 550 555
<210> 102
<211> 1856
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 102
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120
acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180
guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240
gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300
cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360
cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420
aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480
ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540
agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600
aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660
aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720
gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780
cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840
gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900
aacggcacca ucaccgacgc cguggacgga ggcggaucgg gaggcggacc caacaucacc 960
aaccugugcc ccuucggcga gguguucaac gccacccggu ucgccagcgu guacgccugg 1020
aaccggaagc ggaucagcaa cugcguggcc gacuacagcg ugcuguacaa cagcgccagc 1080
uucagcaccu ucaagugcua cggcgugagc cccaccaagc ugaacgaccu gugcuucacc 1140
aacguguacg ccgacagcuu cgugauccgu ggcgacgagg ugcggcagau cgcacccggc 1200
cagacaggca agaucgccga cuacaacuac aagcugcccg acgacuucac cggcugcgug 1260
aucgccugga acagcaacaa ccucgacagc aaggugggcg gcaacuacaa cuaccuguac 1320
cggcuguucc ggaagagcaa ccugaagccc uucgagcggg acaucagcac cgagaucuac 1380
caagccggcu ccaccccuug caacggcgug gagggcuuca acugcuacuu cccucugcag 1440
agcuacggcu uccagcccac caacggcgug ggcuaccagc ccuaccgggu gguggugcug 1500
agcuucgagc ugcugcacgc cccagccacc guguguggcc ccaagucugg cggaggcagc 1560
auccuggcca ucuacagcac cguggccagc agccuggugc ugcuggugag ccugggcgcc 1620
aucagcuucg gcggaggcag cgccaucggc ggcuacaucc ccgaggcccc uagagacggc 1680
caggccuacg ugcggaagga cggcgagugg gugcugcuga gcaccuuccu gggcaaguga 1740
uaauaggcug gagccucggu ggccuagcuu cuugccccuu gggccucccc ccagccccuc 1800
cuccccuucc ugcacccgua cccccguggu cuuugaauaa agucugagug ggcggc 1856
<210> 103
<211> 1680
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 103
auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60
cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120
aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180
aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240
aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300
auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360
aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420
cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480
agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540
ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600
uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660
ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720
cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780
ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840
gagaacggca ccaucaccga cgccguggac ggaggcggau cgggaggcgg acccaacauc 900
accaaccugu gccccuucgg cgagguguuc aacgccaccc gguucgccag cguguacgcc 960
uggaaccgga agcggaucag caacugcgug gccgacuaca gcgugcugua caacagcgcc 1020
agcuucagca ccuucaagug cuacggcgug agccccacca agcugaacga ccugugcuuc 1080
accaacgugu acgccgacag cuucgugauc cguggcgacg aggugcggca gaucgcaccc 1140
ggccagacag gcaagaucgc cgacuacaac uacaagcugc ccgacgacuu caccggcugc 1200
gugaucgccu ggaacagcaa caaccucgac agcaaggugg gcggcaacua caacuaccug 1260
uaccggcugu uccggaagag caaccugaag cccuucgagc gggacaucag caccgagauc 1320
uaccaagccg gcuccacccc uugcaacggc guggagggcu ucaacugcua cuucccucug 1380
cagagcuacg gcuuccagcc caccaacggc gugggcuacc agcccuaccg ggugguggug 1440
cugagcuucg agcugcugca cgccccagcc accgugugug gccccaaguc uggcggaggc 1500
agcauccugg ccaucuacag caccguggcc agcagccugg ugcugcuggu gagccugggc 1560
gccaucagcu ucggcggagg cagcgccauc ggcggcuaca uccccgaggc cccuagagac 1620
ggccaggccu acgugcggaa ggacggcgag ugggugcugc ugagcaccuu ccugggcaag 1680
<210> 104
<211> 560
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 104
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Gly Gly Gly Ser Gly Gly Gly Pro Asn Ile Thr Asn Leu Cys
290 295 300
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
305 310 315 320
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
325 330 335
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
340 345 350
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
355 360 365
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
370 375 380
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
385 390 395 400
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
405 410 415
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
420 425 430
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
435 440 445
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
450 455 460
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
465 470 475 480
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
485 490 495
Ser Gly Gly Gly Ser Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser
500 505 510
Leu Val Leu Leu Val Ser Leu Gly Ala Ile Ser Phe Gly Gly Gly Ser
515 520 525
Ala Ile Gly Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr
530 535 540
Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly Lys
545 550 555 560
<210> 105
<211> 1826
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 105
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120
acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180
guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240
gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300
cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360
cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420
aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480
ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540
agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600
aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660
aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720
gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780
cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840
gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900
aacggcacca ucaccgacgc cguggacgga ggcggaucgg gaggcggacc caacaucacc 960
aaccugugcc ccuucggcga gguguucaac gccacccggu ucgccagcgu guacgccugg 1020
aaccggaagc ggaucagcaa cugcguggcc gacuacagcg ugcuguacaa cagcgccagc 1080
uucagcaccu ucaagugcua cggcgugagc cccaccaagc ugaacgaccu gugcuucacc 1140
aacguguacg ccgacagcuu cgugauccgu ggcgacgagg ugcggcagau cgcacccggc 1200
cagacaggca agaucgccga cuacaacuac aagcugcccg acgacuucac cggcugcgug 1260
aucgccugga acagcaacaa ccucgacagc aaggugggcg gcaacuacaa cuaccuguac 1320
cggcuguucc ggaagagcaa ccugaagccc uucgagcggg acaucagcac cgagaucuac 1380
caagccggcu ccaccccuug caacggcgug gagggcuuca acugcuacuu cccucugcag 1440
agcuacggcu uccagcccac caacggcgug ggcuaccagc ccuaccgggu gguggugcug 1500
agcuucgagc ugcugcacgc cccagccacc guguguggcc ccaagucugg cggaggcagc 1560
auccuggcca ucuacagccu gggcuucauc gccggccuga ucgccaucgu gauggugacc 1620
aucaugcugu gcugcaugac cagcugcugc agcugccuga agggcuguug cagcugcggc 1680
agcugcugca aguucgacga ggacgacuga uaauaggcug gagccucggu ggccuagcuu 1740
cuugccccuu gggccucccc ccagccccuc cuccccuucc ugcacccgua cccccguggu 1800
cuuugaauaa agucugagug ggcggc 1826
<210> 106
<211> 1650
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 106
auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60
cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120
aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180
aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240
aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300
auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360
aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420
cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480
agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540
ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600
uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660
ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720
cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780
ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840
gagaacggca ccaucaccga cgccguggac ggaggcggau cgggaggcgg acccaacauc 900
accaaccugu gccccuucgg cgagguguuc aacgccaccc gguucgccag cguguacgcc 960
uggaaccgga agcggaucag caacugcgug gccgacuaca gcgugcugua caacagcgcc 1020
agcuucagca ccuucaagug cuacggcgug agccccacca agcugaacga ccugugcuuc 1080
accaacgugu acgccgacag cuucgugauc cguggcgacg aggugcggca gaucgcaccc 1140
ggccagacag gcaagaucgc cgacuacaac uacaagcugc ccgacgacuu caccggcugc 1200
gugaucgccu ggaacagcaa caaccucgac agcaaggugg gcggcaacua caacuaccug 1260
uaccggcugu uccggaagag caaccugaag cccuucgagc gggacaucag caccgagauc 1320
uaccaagccg gcuccacccc uugcaacggc guggagggcu ucaacugcua cuucccucug 1380
cagagcuacg gcuuccagcc caccaacggc gugggcuacc agcccuaccg ggugguggug 1440
cugagcuucg agcugcugca cgccccagcc accgugugug gccccaaguc uggcggaggc 1500
agcauccugg ccaucuacag ccugggcuuc aucgccggcc ugaucgccau cgugauggug 1560
accaucaugc ugugcugcau gaccagcugc ugcagcugcc ugaagggcug uugcagcugc 1620
ggcagcugcu gcaaguucga cgaggacgac 1650
<210> 107
<211> 550
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 107
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Gly Gly Gly Ser Gly Gly Gly Pro Asn Ile Thr Asn Leu Cys
290 295 300
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
305 310 315 320
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
325 330 335
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
340 345 350
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
355 360 365
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
370 375 380
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
385 390 395 400
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
405 410 415
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
420 425 430
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
435 440 445
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
450 455 460
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
465 470 475 480
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
485 490 495
Ser Gly Gly Gly Ser Ile Leu Ala Ile Tyr Ser Leu Gly Phe Ile Ala
500 505 510
Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys Cys Met Thr
515 520 525
Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly Ser Cys Cys
530 535 540
Lys Phe Asp Glu Asp Asp
545 550
<210> 108
<211> 1826
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 108
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120
acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180
guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240
gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300
cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360
cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420
aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480
ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540
agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600
aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660
aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720
gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780
cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840
gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900
aacggcacca ucaccgacgc cguggacgga ggcggaucgg gaggcggacc caacaucacc 960
aaccugugcc ccuucggcga gguguucaac gccacccggu ucgccagcgu guacgccugg 1020
aaccggaagc ggaucagcaa cugcguggcc gacuacagcg ugcuguacaa cagcgccagc 1080
uucagcaccu ucaagugcua cggcgugagc cccaccaagc ugaacgaccu gugcuucacc 1140
aacguguacg ccgacagcuu cgugauccgu ggcgacgagg ugcggcagau cgcacccggc 1200
cagacaggca agaucgccga cuacaacuac aagcugcccg acgacuucac cggcugcgug 1260
aucgccugga acagcaacaa ccucgacagc aaggugggcg gcaacuacaa cuaccuguac 1320
cggcuguucc ggaagagcaa ccugaagccc uucgagcggg acaucagcac cgagaucuac 1380
caagccggcu ccaccccuug caacggcgug gagggcuuca acugcuacuu cccucugcag 1440
agcuacggcu uccagcccac caacggcgug ggcuaccagc ccuaccgggu gguggugcug 1500
agcuucgagc ugcugcacgc cccagccacc guguguggcc ccaagucugg cggaggcagc 1560
agcagcaucg ccagcuucuu cuucaucauc gggcugauca ucggccucuu ccuggugcug 1620
cgggugggca uccaccugug caucaagcug aagcacacca agaagagaca gaucuacacc 1680
gacaucgaga ugaaccggcu gggcaaguga uaauaggcug gagccucggu ggccuagcuu 1740
cuugccccuu gggccucccc ccagccccuc cuccccuucc ugcacccgua cccccguggu 1800
cuuugaauaa agucugagug ggcggc 1826
<210> 109
<211> 1650
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 109
auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60
cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120
aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180
aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240
aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300
auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360
aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420
cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480
agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540
ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600
uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660
ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720
cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780
ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840
gagaacggca ccaucaccga cgccguggac ggaggcggau cgggaggcgg acccaacauc 900
accaaccugu gccccuucgg cgagguguuc aacgccaccc gguucgccag cguguacgcc 960
uggaaccgga agcggaucag caacugcgug gccgacuaca gcgugcugua caacagcgcc 1020
agcuucagca ccuucaagug cuacggcgug agccccacca agcugaacga ccugugcuuc 1080
accaacgugu acgccgacag cuucgugauc cguggcgacg aggugcggca gaucgcaccc 1140
ggccagacag gcaagaucgc cgacuacaac uacaagcugc ccgacgacuu caccggcugc 1200
gugaucgccu ggaacagcaa caaccucgac agcaaggugg gcggcaacua caacuaccug 1260
uaccggcugu uccggaagag caaccugaag cccuucgagc gggacaucag caccgagauc 1320
uaccaagccg gcuccacccc uugcaacggc guggagggcu ucaacugcua cuucccucug 1380
cagagcuacg gcuuccagcc caccaacggc gugggcuacc agcccuaccg ggugguggug 1440
cugagcuucg agcugcugca cgccccagcc accgugugug gccccaaguc uggcggaggc 1500
agcagcagca ucgccagcuu cuucuucauc aucgggcuga ucaucggccu cuuccuggug 1560
cugcgggugg gcauccaccu gugcaucaag cugaagcaca ccaagaagag acagaucuac 1620
accgacaucg agaugaaccg gcugggcaag 1650
<210> 110
<211> 550
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 110
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Gly Gly Gly Ser Gly Gly Gly Pro Asn Ile Thr Asn Leu Cys
290 295 300
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
305 310 315 320
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
325 330 335
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
340 345 350
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
355 360 365
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
370 375 380
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
385 390 395 400
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
405 410 415
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
420 425 430
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
435 440 445
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
450 455 460
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
465 470 475 480
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
485 490 495
Ser Gly Gly Gly Ser Ser Ser Ile Ala Ser Phe Phe Phe Ile Ile Gly
500 505 510
Leu Ile Ile Gly Leu Phe Leu Val Leu Arg Val Gly Ile His Leu Cys
515 520 525
Ile Lys Leu Lys His Thr Lys Lys Arg Gln Ile Tyr Thr Asp Ile Glu
530 535 540
Met Asn Arg Leu Gly Lys
545 550
<210> 111
<211> 1775
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 111
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120
acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180
guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240
gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300
cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360
cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420
aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480
ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540
agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600
aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660
aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720
gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780
cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840
gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900
aacggcacca ucaccgacgc cguggacgga ggcggaucgg gaggcggacc caacaucacc 960
aaccugugcc ccuucggcga gguguucaac gccacccggu ucgccagcgu guacgccugg 1020
aaccggaagc ggaucagcaa cugcguggcc gacuacagcg ugcuguacaa cagcgccagc 1080
uucagcaccu ucaagugcua cggcgugagc cccaccaagc ugaacgaccu gugcuucacc 1140
aacguguacg ccgacagcuu cgugauccgu ggcgacgagg ugcggcagau cgcacccggc 1200
cagacaggca agaucgccga cuacaacuac aagcugcccg acgacuucac cggcugcgug 1260
aucgccugga acagcaacaa ccucgacagc aaggugggcg gcaacuacaa cuaccuguac 1320
cggcuguucc ggaagagcaa ccugaagccc uucgagcggg acaucagcac cgagaucuac 1380
caagccggcu ccaccccuug caacggcgug gagggcuuca acugcuacuu cccucugcag 1440
agcuacggcu uccagcccac caacggcgug ggcuaccagc ccuaccgggu gguggugcug 1500
agcuucgagc ugcugcacgc cccagccacc guguguggcc ccaagucugg cggaggcggc 1560
agcgccaucg gcggcuacau ccccgaggcc ccuagagacg gccaggccua cgugcggaag 1620
gacggcgagu gggugcugcu gagcaccuuc cugggcugau aauaggcugg agccucggug 1680
gccuagcuuc uugccccuug ggccuccccc cagccccucc uccccuuccu gcacccguac 1740
ccccgugguc uuugaauaaa gucugagugg gcggc 1775
<210> 112
<211> 1599
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 112
auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60
cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120
aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180
aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240
aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300
auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360
aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420
cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480
agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540
ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600
uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660
ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720
cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780
ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840
gagaacggca ccaucaccga cgccguggac ggaggcggau cgggaggcgg acccaacauc 900
accaaccugu gccccuucgg cgagguguuc aacgccaccc gguucgccag cguguacgcc 960
uggaaccgga agcggaucag caacugcgug gccgacuaca gcgugcugua caacagcgcc 1020
agcuucagca ccuucaagug cuacggcgug agccccacca agcugaacga ccugugcuuc 1080
accaacgugu acgccgacag cuucgugauc cguggcgacg aggugcggca gaucgcaccc 1140
ggccagacag gcaagaucgc cgacuacaac uacaagcugc ccgacgacuu caccggcugc 1200
gugaucgccu ggaacagcaa caaccucgac agcaaggugg gcggcaacua caacuaccug 1260
uaccggcugu uccggaagag caaccugaag cccuucgagc gggacaucag caccgagauc 1320
uaccaagccg gcuccacccc uugcaacggc guggagggcu ucaacugcua cuucccucug 1380
cagagcuacg gcuuccagcc caccaacggc gugggcuacc agcccuaccg ggugguggug 1440
cugagcuucg agcugcugca cgccccagcc accgugugug gccccaaguc uggcggaggc 1500
ggcagcgcca ucggcggcua cauccccgag gccccuagag acggccaggc cuacgugcgg 1560
aaggacggcg agugggugcu gcugagcacc uuccugggc 1599
<210> 113
<211> 533
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 113
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Gly Gly Gly Ser Gly Gly Gly Pro Asn Ile Thr Asn Leu Cys
290 295 300
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
305 310 315 320
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
325 330 335
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
340 345 350
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
355 360 365
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
370 375 380
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
385 390 395 400
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
405 410 415
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
420 425 430
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
435 440 445
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
450 455 460
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
465 470 475 480
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
485 490 495
Ser Gly Gly Gly Gly Ser Ala Ile Gly Gly Tyr Ile Pro Glu Ala Pro
500 505 510
Arg Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu
515 520 525
Ser Thr Phe Leu Gly
530
<210> 114
<211> 1973
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 114
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120
acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180
guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240
gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300
cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360
cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420
aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480
ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540
agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600
aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660
aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720
gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780
cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840
gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900
aacggcacca ucaccgacgc cguggacgga ggcggaucgg gaggcggaca gcgggugcag 960
cccaccgaga gcaucgugcg guuccccaac aucaccaacc ugugccccuu cggcgaggug 1020
uucaacgcca cccgguucgc cagcguguac gccuggaacc ggaagcggau cagcaacugc 1080
guggccgacu acagcgugcu guacaacagc gccagcuuca gcaccuucaa gugcuacggc 1140
gugagcccca ccaagcugaa cgaccugugc uucaccaacg uguacgccga cagcuucgug 1200
auccguggcg acgaggugcg gcagaucgca cccggccaga caggcaagau cgccgacuac 1260
aacuacaagc ugcccgacga cuucaccggc ugcgugaucg ccuggaacag caacaaccuc 1320
gacagcaagg ugggcggcaa cuacaacuac cuguaccggc uguuccggaa gagcaaccug 1380
aagcccuucg agcgggacau cagcaccgag aucuaccaag ccggcuccac cccuugcaac 1440
ggcguggagg gcuucaacug cuacuucccu cugcagagcu acggcuucca gcccaccaac 1500
ggcgugggcu accagcccua ccggguggug gugcugagcu ucgagcugcu gcacgcccca 1560
gccaccgugu guggccccaa gaagagcacc aaccugguga agaacaagug cgugaacuuc 1620
aacuucaacg gccuuaccgg caccggcgug cugaccgaga gcaacaagaa auuccugccc 1680
uuucagcagu ucggccggga caucgccgac accaccgacg cugugcggga uccccagacc 1740
cuggagaucc uggacaucac cccuugcagc ucuggcggag gcagcauccu ggccaucuac 1800
agcaccgugg ccagcagccu ggugcugcug gugagccugg gcgccaucag cuucugauaa 1860
uaggcuggag ccucgguggc cuagcuucuu gccccuuggg ccucccccca gccccuccuc 1920
cccuuccugc acccguaccc ccguggucuu ugaauaaagu cugagugggc ggc 1973
<210> 115
<211> 1797
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 115
auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60
cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120
aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180
aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240
aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300
auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360
aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420
cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480
agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540
ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600
uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660
ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720
cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780
ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840
gagaacggca ccaucaccga cgccguggac ggaggcggau cgggaggcgg acagcgggug 900
cagcccaccg agagcaucgu gcgguucccc aacaucacca accugugccc cuucggcgag 960
guguucaacg ccacccgguu cgccagcgug uacgccugga accggaagcg gaucagcaac 1020
ugcguggccg acuacagcgu gcuguacaac agcgccagcu ucagcaccuu caagugcuac 1080
ggcgugagcc ccaccaagcu gaacgaccug ugcuucacca acguguacgc cgacagcuuc 1140
gugauccgug gcgacgaggu gcggcagauc gcacccggcc agacaggcaa gaucgccgac 1200
uacaacuaca agcugcccga cgacuucacc ggcugcguga ucgccuggaa cagcaacaac 1260
cucgacagca aggugggcgg caacuacaac uaccuguacc ggcuguuccg gaagagcaac 1320
cugaagcccu ucgagcggga caucagcacc gagaucuacc aagccggcuc caccccuugc 1380
aacggcgugg agggcuucaa cugcuacuuc ccucugcaga gcuacggcuu ccagcccacc 1440
aacggcgugg gcuaccagcc cuaccgggug guggugcuga gcuucgagcu gcugcacgcc 1500
ccagccaccg uguguggccc caagaagagc accaaccugg ugaagaacaa gugcgugaac 1560
uucaacuuca acggccuuac cggcaccggc gugcugaccg agagcaacaa gaaauuccug 1620
cccuuucagc aguucggccg ggacaucgcc gacaccaccg acgcugugcg ggauccccag 1680
acccuggaga uccuggacau caccccuugc agcucuggcg gaggcagcau ccuggccauc 1740
uacagcaccg uggccagcag ccuggugcug cuggugagcc ugggcgccau cagcuuc 1797
<210> 116
<211> 599
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 116
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Gly Gly Gly Ser Gly Gly Gly Gln Arg Val Gln Pro Thr Glu
290 295 300
Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu
305 310 315 320
Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys
325 330 335
Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala
340 345 350
Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn
355 360 365
Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly
370 375 380
Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp
385 390 395 400
Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp
405 410 415
Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu
420 425 430
Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile
435 440 445
Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu
450 455 460
Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr
465 470 475 480
Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu
485 490 495
Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Asn
500 505 510
Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr Gly
515 520 525
Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln Gln
530 535 540
Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp Pro Gln
545 550 555 560
Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Ser Gly Gly Gly Ser
565 570 575
Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val
580 585 590
Ser Leu Gly Ala Ile Ser Phe
595
<210> 117
<211> 1799
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 117
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120
acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180
guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240
gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300
cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360
cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420
aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480
ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540
agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600
aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660
aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720
gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780
cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840
gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900
aacggcacca ucaccgacgc cguggacugc gcccuggacc cucugagcga gaccaagugc 960
acccugaaga gcuucaccgg aggcggaucg ggaggcggac ccaacaucac caaccugugc 1020
cccuucggcg agguguucaa cgccacccgg uucgccagcg uguacgccug gaaccggaag 1080
cggaucagca acugcguggc cgacuacagc gugcuguaca acagcgccag cuucagcacc 1140
uucaagugcu acggcgugag ccccaccaag cugaacgacc ugugcuucac caacguguac 1200
gccgacagcu ucgugauccg uggcgacgag gugcggcaga ucgcacccgg ccagacaggc 1260
aagaucgccg acuacaacua caagcugccc gacgacuuca ccggcugcgu gaucgccugg 1320
aacagcaaca accucgacag caaggugggc ggcaacuaca acuaccugua ccggcuguuc 1380
cggaagagca accugaagcc cuucgagcgg gacaucagca ccgagaucua ccaagccggc 1440
uccaccccuu gcaacggcgu ggagggcuuc aacugcuacu ucccucugca gagcuacggc 1500
uuccagccca ccaacggcgu gggcuaccag cccuaccggg ugguggugcu gagcuucgag 1560
cugcugcacg ccccagccac cguguguggc cccaagucug gcggaggcag cauccuggcc 1620
aucuacagca ccguggccag cagccuggug cugcugguga gccugggcgc caucagcuuc 1680
ugauaauagg cuggagccuc gguggccuag cuucuugccc cuugggccuc cccccagccc 1740
cuccuccccu uccugcaccc guacccccgu ggucuuugaa uaaagucuga gugggcggc 1799
<210> 118
<211> 1623
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 118
auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60
cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120
aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180
aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240
aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300
auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360
aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420
cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480
agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540
ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600
uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660
ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720
cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780
ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840
gagaacggca ccaucaccga cgccguggac ugcgcccugg acccucugag cgagaccaag 900
ugcacccuga agagcuucac cggaggcgga ucgggaggcg gacccaacau caccaaccug 960
ugccccuucg gcgagguguu caacgccacc cgguucgcca gcguguacgc cuggaaccgg 1020
aagcggauca gcaacugcgu ggccgacuac agcgugcugu acaacagcgc cagcuucagc 1080
accuucaagu gcuacggcgu gagccccacc aagcugaacg accugugcuu caccaacgug 1140
uacgccgaca gcuucgugau ccguggcgac gaggugcggc agaucgcacc cggccagaca 1200
ggcaagaucg ccgacuacaa cuacaagcug cccgacgacu ucaccggcug cgugaucgcc 1260
uggaacagca acaaccucga cagcaaggug ggcggcaacu acaacuaccu guaccggcug 1320
uuccggaaga gcaaccugaa gcccuucgag cgggacauca gcaccgagau cuaccaagcc 1380
ggcuccaccc cuugcaacgg cguggagggc uucaacugcu acuucccucu gcagagcuac 1440
ggcuuccagc ccaccaacgg cgugggcuac cagcccuacc gggugguggu gcugagcuuc 1500
gagcugcugc acgccccagc caccgugugu ggccccaagu cuggcggagg cagcauccug 1560
gccaucuaca gcaccguggc cagcagccug gugcugcugg ugagccuggg cgccaucagc 1620
uuc 1623
<210> 119
<211> 541
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 119
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Gly Gly Gly Ser Gly Gly Gly Pro Asn Ile Thr Asn Leu
305 310 315 320
Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr
325 330 335
Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val
340 345 350
Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser
355 360 365
Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser
370 375 380
Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr
385 390 395 400
Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly
405 410 415
Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly
420 425 430
Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro
435 440 445
Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro
450 455 460
Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr
465 470 475 480
Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val
485 490 495
Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro
500 505 510
Lys Ser Gly Gly Gly Ser Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser
515 520 525
Ser Leu Val Leu Leu Val Ser Leu Gly Ala Ile Ser Phe
530 535 540
<210> 120
<211> 2024
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 120
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120
acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180
guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240
gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300
cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360
cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420
aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480
ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540
agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600
aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660
aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720
gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780
cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840
gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900
aacggcacca ucaccgacgc cguggacugc gcccuggacc cucugagcga gaccaagugc 960
acccugaaga gcuucaccgg aggcggaucg ggaggcggac agcgggugca gcccaccgag 1020
agcaucgugc gguuccccaa caucaccaac cugugccccu ucggcgaggu guucaacgcc 1080
acccgguucg ccagcgugua cgccuggaac cggaagcgga ucagcaacug cguggccgac 1140
uacagcgugc uguacaacag cgccagcuuc agcaccuuca agugcuacgg cgugagcccc 1200
accaagcuga acgaccugug cuucaccaac guguacgccg acagcuucgu gauccguggc 1260
gacgaggugc ggcagaucgc acccggccag acaggcaaga ucgccgacua caacuacaag 1320
cugcccgacg acuucaccgg cugcgugauc gccuggaaca gcaacaaccu cgacagcaag 1380
gugggcggca acuacaacua ccuguaccgg cuguuccgga agagcaaccu gaagcccuuc 1440
gagcgggaca ucagcaccga gaucuaccaa gccggcucca ccccuugcaa cggcguggag 1500
ggcuucaacu gcuacuuccc ucugcagagc uacggcuucc agcccaccaa cggcgugggc 1560
uaccagcccu accggguggu ggugcugagc uucgagcugc ugcacgcccc agccaccgug 1620
uguggcccca agaagagcac caaccuggug aagaacaagu gcgugaacuu caacuucaac 1680
ggccuuaccg gcaccggcgu gcugaccgag agcaacaaga aauuccugcc cuuucagcag 1740
uucggccggg acaucgccga caccaccgac gcugugcggg auccccagac ccuggagauc 1800
cuggacauca ccccuugcag cucuggcgga ggcagcaucc uggccaucua cagcaccgug 1860
gccagcagcc uggugcugcu ggugagccug ggcgccauca gcuucugaua auaggcugga 1920
gccucggugg ccuagcuucu ugccccuugg gccucccccc agccccuccu ccccuuccug 1980
cacccguacc cccguggucu uugaauaaag ucugaguggg cggc 2024
<210> 121
<211> 1848
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 121
auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60
cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120
aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180
aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240
aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300
auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360
aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420
cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480
agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540
ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600
uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660
ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720
cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780
ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840
gagaacggca ccaucaccga cgccguggac ugcgcccugg acccucugag cgagaccaag 900
ugcacccuga agagcuucac cggaggcgga ucgggaggcg gacagcgggu gcagcccacc 960
gagagcaucg ugcgguuccc caacaucacc aaccugugcc ccuucggcga gguguucaac 1020
gccacccggu ucgccagcgu guacgccugg aaccggaagc ggaucagcaa cugcguggcc 1080
gacuacagcg ugcuguacaa cagcgccagc uucagcaccu ucaagugcua cggcgugagc 1140
cccaccaagc ugaacgaccu gugcuucacc aacguguacg ccgacagcuu cgugauccgu 1200
ggcgacgagg ugcggcagau cgcacccggc cagacaggca agaucgccga cuacaacuac 1260
aagcugcccg acgacuucac cggcugcgug aucgccugga acagcaacaa ccucgacagc 1320
aaggugggcg gcaacuacaa cuaccuguac cggcuguucc ggaagagcaa ccugaagccc 1380
uucgagcggg acaucagcac cgagaucuac caagccggcu ccaccccuug caacggcgug 1440
gagggcuuca acugcuacuu cccucugcag agcuacggcu uccagcccac caacggcgug 1500
ggcuaccagc ccuaccgggu gguggugcug agcuucgagc ugcugcacgc cccagccacc 1560
guguguggcc ccaagaagag caccaaccug gugaagaaca agugcgugaa cuucaacuuc 1620
aacggccuua ccggcaccgg cgugcugacc gagagcaaca agaaauuccu gcccuuucag 1680
caguucggcc gggacaucgc cgacaccacc gacgcugugc gggaucccca gacccuggag 1740
auccuggaca ucaccccuug cagcucuggc ggaggcagca uccuggccau cuacagcacc 1800
guggccagca gccuggugcu gcuggugagc cugggcgcca ucagcuuc 1848
<210> 122
<211> 616
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 122
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Gly Gly Gly Ser Gly Gly Gly Gln Arg Val Gln Pro Thr
305 310 315 320
Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly
325 330 335
Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg
340 345 350
Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser
355 360 365
Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu
370 375 380
Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg
385 390 395 400
Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala
405 410 415
Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala
420 425 430
Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr
435 440 445
Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp
450 455 460
Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val
465 470 475 480
Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro
485 490 495
Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe
500 505 510
Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr
515 520 525
Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr
530 535 540
Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln
545 550 555 560
Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp Pro
565 570 575
Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Ser Gly Gly Gly
580 585 590
Ser Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu
595 600 605
Val Ser Leu Gly Ala Ile Ser Phe
610 615
<210> 123
<211> 3995
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 123
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120
acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180
guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240
gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300
cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360
cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420
aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480
ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540
agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600
aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660
aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720
gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780
cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840
gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900
aacggcacca ucaccgacgc cguggacugc gcccuggacc cucugagcga gaccaagugc 960
acccugaaga gcuucaccgu ggagaagggc aucuaccaga ccagcaacuu ccgggugcag 1020
cccaccgaga gcaucgugcg guuccccaac aucaccaacc ugugccccuu cggcgaggug 1080
uucaacgcca cccgguucgc cagcguguac gccuggaacc ggaagcggau cagcaacugc 1140
guggccgacu acagcgugcu guacaacagc gccagcuuca gcaccuucaa gugcuacggc 1200
gugagcccca ccaagcugaa cgaccugugc uucaccaacg uguacgccga cagcuucgug 1260
auccguggcg acgaggugcg gcagaucgca cccggccaga caggcaagau cgccgacuac 1320
aacuacaagc ugcccgacga cuucaccggc ugcgugaucg ccuggaacag caacaaccuc 1380
gacagcaagg ugggcggcaa cuacaacuac cuguaccggc uguuccggaa gagcaaccug 1440
aagcccuucg agcgggacau cagcaccgag aucuaccaag ccggcuccac cccuugcaac 1500
ggcguggagg gcuucaacug cuacuucccu cugcagagcu acggcuucca gcccaccaac 1560
ggcgugggcu accagcccua ccggguggug gugcugagcu ucgagcugcu gcacgcccca 1620
gccaccgugu guggccccaa gaagagcacc aaccugguga agaacaagug cgugaacuuc 1680
aacuucaacg gccuuaccgg caccggcgug cugaccgaga gcaacaagaa auuccugccc 1740
uuucagcagu ucggccggga caucgccgac accaccgacg cugugcggga uccccagacc 1800
cuggagaucc uggacaucac cccuugcagc uucggcggcg ugagcgugau caccccaggc 1860
accaacacca gcaaccaggu ggccgugcug uaccaggacg ugaacugcac cgaggugccc 1920
guggccaucc acgccgacca gcugacaccc accuggcggg ucuacagcac cggcagcaac 1980
guguuccaga cccgggccgg uugccugauc ggcgccgagc acgugaacaa cagcuacgag 2040
ugcgacaucc ccaucggcgc cggcaucugu gccagcuacc agacccagac caauucaccc 2100
cggagggcaa ggagcguggc cagccagagc aucaucgccu acaccaugag ccugggcgcc 2160
gagaacagcg uggccuacag caacaacagc aucgccaucc ccaccaacuu caccaucagc 2220
gugaccaccg agauucugcc cgugagcaug accaagacca gcguggacug caccauguac 2280
aucugcggcg acagcaccga gugcagcaac cugcugcugc aguacggcag cuucugcacc 2340
cagcugaacc gggcccugac cggcaucgcc guggagcagg acaagaacac ccaggaggug 2400
uucgcccagg ugaagcagau cuacaagacc ccucccauca aggacuucgg cggcuucaac 2460
uucagccaga uccugcccga ccccagcaag cccagcaagc ggagcuucau cgaggaccug 2520
cuguucaaca aggugacccu agccgacgcc ggcuucauca agcaguacgg cgacugccuc 2580
ggcgacauag ccgcccggga ccugaucugc gcccagaagu ucaacggccu gaccgugcug 2640
ccuccccugc ugaccgacga gaugaucgcc caguacacca gcgcccuguu agccggaacc 2700
aucaccagcg gcuggacuuu cggcgcugga gccgcucugc agauccccuu cgccaugcag 2760
auggccuacc gguucaacgg caucggcgug acccagaacg ugcuguacga gaaccagaag 2820
cugaucgcca accaguucaa cagcgccauc ggcaagaucc aggacagccu gagcagcacc 2880
gcuagcgccc ugggcaagcu gcaggacgug gugaaccaga acgcccaggc ccugaacacc 2940
cuggugaagc agcugagcag caacuucggc gccaucagca gcgugcugaa cgacauccug 3000
agccggcugg acaaggugga ggccgaggug cagaucgacc ggcugaucac uggccggcug 3060
cagagccugc agaccuacgu gacccagcag cugauccggg ccgccgagau ucgggccagc 3120
gccaaccugg ccgccaccaa gaugagcgag ugcgugcugg gccagagcaa gcggguggac 3180
uucugcggca agggcuacca ccugaugagc uuuccccaga gcgcacccca cggaguggug 3240
uuccugcacg ugaccuacgu gcccgcccag gagaagaacu ucaccaccgc cccagccauc 3300
ugccacgacg gcaaggccca cuuuccccgg gagggcgugu ucgugagcaa cggcacccac 3360
ugguucguga cccagcggaa cuucuacgag ccccagauca ucaccaccga caacaccuuc 3420
gugagcggca acugcgacgu ggugaucggc aucgugaaca acaccgugua cgauccccug 3480
cagcccgagc uggacagcuu caaggaggag cuggacaagu acuucaagaa ucacaccagc 3540
cccgacgugg accugggcga caucagcggc aucaacgcca gcguggugaa cauccagaag 3600
gagaucgauc ggcugaacga gguggccaag aaccugaacg agagccugau cgaccugcag 3660
gagcugggca aguacgagca guacaucaag uggcccuggu acaucuggcu gggcuucauc 3720
gccggccuga ucgccaucgu gauggugacc aucaugcugu gcugcaugac cagcugcugc 3780
agcugccuga agggcuguug cagcugcggc agcugcugca aguucgacga ggacgacagc 3840
gagcccgugc ugaagggcgu gaagcugcac uacaccugau aauaggcugg agccucggug 3900
gccuagcuuc uugccccuug ggccuccccc cagccccucc uccccuuccu gcacccguac 3960
ccccgugguc uuugaauaaa gucugagugg gcggc 3995
<210> 124
<211> 3819
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 124
auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60
cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120
aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180
aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240
aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300
auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360
aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420
cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480
agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540
ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600
uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660
ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720
cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780
ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840
gagaacggca ccaucaccga cgccguggac ugcgcccugg acccucugag cgagaccaag 900
ugcacccuga agagcuucac cguggagaag ggcaucuacc agaccagcaa cuuccgggug 960
cagcccaccg agagcaucgu gcgguucccc aacaucacca accugugccc cuucggcgag 1020
guguucaacg ccacccgguu cgccagcgug uacgccugga accggaagcg gaucagcaac 1080
ugcguggccg acuacagcgu gcuguacaac agcgccagcu ucagcaccuu caagugcuac 1140
ggcgugagcc ccaccaagcu gaacgaccug ugcuucacca acguguacgc cgacagcuuc 1200
gugauccgug gcgacgaggu gcggcagauc gcacccggcc agacaggcaa gaucgccgac 1260
uacaacuaca agcugcccga cgacuucacc ggcugcguga ucgccuggaa cagcaacaac 1320
cucgacagca aggugggcgg caacuacaac uaccuguacc ggcuguuccg gaagagcaac 1380
cugaagcccu ucgagcggga caucagcacc gagaucuacc aagccggcuc caccccuugc 1440
aacggcgugg agggcuucaa cugcuacuuc ccucugcaga gcuacggcuu ccagcccacc 1500
aacggcgugg gcuaccagcc cuaccgggug guggugcuga gcuucgagcu gcugcacgcc 1560
ccagccaccg uguguggccc caagaagagc accaaccugg ugaagaacaa gugcgugaac 1620
uucaacuuca acggccuuac cggcaccggc gugcugaccg agagcaacaa gaaauuccug 1680
cccuuucagc aguucggccg ggacaucgcc gacaccaccg acgcugugcg ggauccccag 1740
acccuggaga uccuggacau caccccuugc agcuucggcg gcgugagcgu gaucacccca 1800
ggcaccaaca ccagcaacca gguggccgug cuguaccagg acgugaacug caccgaggug 1860
cccguggcca uccacgccga ccagcugaca cccaccuggc gggucuacag caccggcagc 1920
aacguguucc agacccgggc cgguugccug aucggcgccg agcacgugaa caacagcuac 1980
gagugcgaca uccccaucgg cgccggcauc ugugccagcu accagaccca gaccaauuca 2040
ccccggaggg caaggagcgu ggccagccag agcaucaucg ccuacaccau gagccugggc 2100
gccgagaaca gcguggccua cagcaacaac agcaucgcca uccccaccaa cuucaccauc 2160
agcgugacca ccgagauucu gcccgugagc augaccaaga ccagcgugga cugcaccaug 2220
uacaucugcg gcgacagcac cgagugcagc aaccugcugc ugcaguacgg cagcuucugc 2280
acccagcuga accgggcccu gaccggcauc gccguggagc aggacaagaa cacccaggag 2340
guguucgccc aggugaagca gaucuacaag accccuccca ucaaggacuu cggcggcuuc 2400
aacuucagcc agauccugcc cgaccccagc aagcccagca agcggagcuu caucgaggac 2460
cugcuguuca acaaggugac ccuagccgac gccggcuuca ucaagcagua cggcgacugc 2520
cucggcgaca uagccgcccg ggaccugauc ugcgcccaga aguucaacgg ccugaccgug 2580
cugccucccc ugcugaccga cgagaugauc gcccaguaca ccagcgcccu guuagccgga 2640
accaucacca gcggcuggac uuucggcgcu ggagccgcuc ugcagauccc cuucgccaug 2700
cagauggccu accgguucaa cggcaucggc gugacccaga acgugcugua cgagaaccag 2760
aagcugaucg ccaaccaguu caacagcgcc aucggcaaga uccaggacag ccugagcagc 2820
accgcuagcg cccugggcaa gcugcaggac guggugaacc agaacgccca ggcccugaac 2880
acccugguga agcagcugag cagcaacuuc ggcgccauca gcagcgugcu gaacgacauc 2940
cugagccggc uggacaaggu ggaggccgag gugcagaucg accggcugau cacuggccgg 3000
cugcagagcc ugcagaccua cgugacccag cagcugaucc gggccgccga gauucgggcc 3060
agcgccaacc uggccgccac caagaugagc gagugcgugc ugggccagag caagcgggug 3120
gacuucugcg gcaagggcua ccaccugaug agcuuucccc agagcgcacc ccacggagug 3180
guguuccugc acgugaccua cgugcccgcc caggagaaga acuucaccac cgccccagcc 3240
aucugccacg acggcaaggc ccacuuuccc cgggagggcg uguucgugag caacggcacc 3300
cacugguucg ugacccagcg gaacuucuac gagccccaga ucaucaccac cgacaacacc 3360
uucgugagcg gcaacugcga cguggugauc ggcaucguga acaacaccgu guacgauccc 3420
cugcagcccg agcuggacag cuucaaggag gagcuggaca aguacuucaa gaaucacacc 3480
agccccgacg uggaccuggg cgacaucagc ggcaucaacg ccagcguggu gaacauccag 3540
aaggagaucg aucggcugaa cgagguggcc aagaaccuga acgagagccu gaucgaccug 3600
caggagcugg gcaaguacga gcaguacauc aaguggcccu gguacaucug gcugggcuuc 3660
aucgccggcc ugaucgccau cgugauggug accaucaugc ugugcugcau gaccagcugc 3720
ugcagcugcc ugaagggcug uugcagcugc ggcagcugcu gcaaguucga cgaggacgac 3780
agcgagcccg ugcugaaggg cgugaagcug cacuacacc 3819
<210> 125
<211> 1273
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 125
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
1145 1150 1155
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn
1160 1165 1170
Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu
1175 1180 1185
Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu
1205 1210 1215
Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met
1220 1225 1230
Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro
1250 1255 1260
Val Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 126
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 126
Lys Pro Ser Lys Arg Ser Phe Ile
1 5
<210> 127
<211> 13
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 127
Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
1 5 10
<210> 128
<211> 9
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 128
ccrccaugg 9
<210> 129
<211> 11
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 129
gggauccuac c 11
<210> 130
<211> 9
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 130
uuauuuaww 9
<210> 131
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 131
gggaaauaag agagaaaaga agaguaagaa gaaauauaag agccacc 47
<210> 132
<211> 119
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 132
ugauaauagg cuggagccuc gguggccaug cuucuugccc cuugggccuc cccccagccc 60
cuccuccccu uccugcaccc guacccccgu ggucuuugaa uaaagucuga gugggcggc 119
<210> 133
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 133
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Gly
1 5 10 15
<210> 134
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 134
Gly Gly Gly Ser Gly Gly Gly Ser
1 5
<210> 135
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 135
Gly Gly Gly Ser Gly Gly Gly
1 5
<210> 136
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 136
Gly Gly Gly Ser
1
<210> 137
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 137
Ser Gly Gly Ser
1
<210> 138
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 138
Ser Gly Gly Gly Ser
1 5
<210> 139
<211> 1602
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 139
auguacagca ugcagcuggc uagcugcgug acccugaccc uggugcugcu ggugaacagc 60
cagcccaaca ucaccaaccu gugccccuuc ggcgaggugu ucaacgccac ccgguucgcc 120
agcguguacg ccuggaaccg gaagcggauc agcaacugcg uggccgacua cagcgugcug 180
uacaacagcg ccagcuucag caccuucaag ugcuacggcg ugagccccac caagcugaac 240
gaccugugcu ucaccaacgu guacgccgac agcuucguga uccguggcga cgaggugcgg 300
cagaucgcac ccggccagac aggcaagauc gccgacuaca acuacaagcu gcccgacgac 360
uucaccggcu gcgugaucgc cuggaacagc aacaaccucg acagcaaggu gggcggcaac 420
uacaacuacc uguaccggcu guuccggaag agcaaccuga agcccuucga gcgggacauc 480
agcaccgaga ucuaccaagc cggcuccacc ccuugcaacg gcguggaggg cuucaacugc 540
uacuucccuc ugcagagcua cggcuuccag cccaccaacg gcgugggcua ccagcccuac 600
cggguggugg ugcugagcuu cgagcugcug cacgccccag ccaccgugug uggccccaag 660
ucuggcggag gcagcggagg cggaagccag ugcgugaacc ugaccacccg gacccagcug 720
ccaccagccu acaccaacag cuucacccgg ggcgucuacu accccgacaa gguguuccgg 780
agcagcgucc ugcacagcac ccaggaccug uuccugcccu ucuucagcaa cgugaccugg 840
uuccacgcca uccacgugag cggcaccaac ggcaccaagc gguucgacaa ccccgugcug 900
cccuucaacg acggcgugua cuucgccagc accgagaaga gcaacaucau ccggggcugg 960
aucuucggca ccacccugga cagcaagacc cagagccugc ugaucgugaa uaacgccacc 1020
aacgugguga ucaaggugug cgaguuccag uucugcaacg accccuuccu gggcguguac 1080
uaccacaaga acaacaagag cuggauggag agcgaguucc ggguguacag cagcgccaac 1140
aacugcaccu ucgaguacgu gagccagccc uuccugaugg accuggaggg caagcagggc 1200
aacuucaaga accugcggga guucguguuc aagaacaucg acggcuacuu caagaucuac 1260
agcaagcaca ccccaaucaa ccuggugcgg gaucugcccc agggcuucuc agcccuggag 1320
ccccuggugg accugcccau cggcaucaac aucacccggu uccagacccu gcuggcccug 1380
caccggagcu accugacccc aggcgacagc agcagcgggu ggacagcagg cgcggcugcu 1440
uacuacgugg gcuaccugca gccccggacc uuccugcuga aguacaacga gaacggcacc 1500
aucaccgacg ccguggacuc uggcggaggc agcauccugg ccaucuacag caccguggcc 1560
agcagccugg ugcugcuggu gagccugggc gccaucagcu uc 1602
<210> 140
<211> 534
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 140
Met Tyr Ser Met Gln Leu Ala Ser Cys Val Thr Leu Thr Leu Val Leu
1 5 10 15
Leu Val Asn Ser Gln Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu
20 25 30
Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys
35 40 45
Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala
50 55 60
Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn
65 70 75 80
Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly
85 90 95
Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp
100 105 110
Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp
115 120 125
Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu
130 135 140
Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile
145 150 155 160
Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu
165 170 175
Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr
180 185 190
Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu
195 200 205
Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Ser Gly Gly Gly
210 215 220
Ser Gly Gly Gly Ser Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu
225 230 235 240
Pro Pro Ala Tyr Thr Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp
245 250 255
Lys Val Phe Arg Ser Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu
260 265 270
Pro Phe Phe Ser Asn Val Thr Trp Phe His Ala Ile His Val Ser Gly
275 280 285
Thr Asn Gly Thr Lys Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp
290 295 300
Gly Val Tyr Phe Ala Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp
305 310 315 320
Ile Phe Gly Thr Thr Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val
325 330 335
Asn Asn Ala Thr Asn Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys
340 345 350
Asn Asp Pro Phe Leu Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp
355 360 365
Met Glu Ser Glu Phe Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe
370 375 380
Glu Tyr Val Ser Gln Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly
385 390 395 400
Asn Phe Lys Asn Leu Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr
405 410 415
Phe Lys Ile Tyr Ser Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu
420 425 430
Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly
435 440 445
Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr
450 455 460
Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala
465 470 475 480
Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn
485 490 495
Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Ser Gly Gly Gly Ser Ile
500 505 510
Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val Ser
515 520 525
Leu Gly Ala Ile Ser Phe
530
<210> 141
<211> 1778
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 141
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uacagcaugc agcuggcuag cugcgugacc cugacccugg ugcugcuggu gaacagccag 120
cccaacauca ccaaccugug ccccuucggc gagguguuca acgccacccg guucgccagc 180
guguacgccu ggaaccggaa gcggaucagc aacugcgugg ccgacuacag cgugcuguac 240
aacagcgcca gcuucagcac cuucaagugc uacggcguga gccccaccaa gcugaacgac 300
cugugcuuca ccaacgugua cgccgacagc uucgugaucc guggcgacga ggugcggcag 360
aucgcacccg gccagacagg caagaucgcc gacuacaacu acaagcugcc cgacgacuuc 420
accggcugcg ugaucgccug gaacagcaac aaccucgaca gcaagguggg cggcaacuac 480
aacuaccugu accggcuguu ccggaagagc aaccugaagc ccuucgagcg ggacaucagc 540
accgagaucu accaagccgg cuccaccccu ugcaacggcg uggagggcuu caacugcuac 600
uucccucugc agagcuacgg cuuccagccc accaacggcg ugggcuacca gcccuaccgg 660
gugguggugc ugagcuucga gcugcugcac gccccagcca ccgugugugg ccccaagucu 720
ggcggaggca gcggaggcgg aagccagugc gugaaccuga ccacccggac ccagcugcca 780
ccagccuaca ccaacagcuu cacccggggc gucuacuacc ccgacaaggu guuccggagc 840
agcguccugc acagcaccca ggaccuguuc cugcccuucu ucagcaacgu gaccugguuc 900
cacgccaucc acgugagcgg caccaacggc accaagcggu ucgacaaccc cgugcugccc 960
uucaacgacg gcguguacuu cgccagcacc gagaagagca acaucauccg gggcuggauc 1020
uucggcacca cccuggacag caagacccag agccugcuga ucgugaauaa cgccaccaac 1080
guggugauca aggugugcga guuccaguuc ugcaacgacc ccuuccuggg cguguacuac 1140
cacaagaaca acaagagcug gauggagagc gaguuccggg uguacagcag cgccaacaac 1200
ugcaccuucg aguacgugag ccagcccuuc cugauggacc uggagggcaa gcagggcaac 1260
uucaagaacc ugcgggaguu cguguucaag aacaucgacg gcuacuucaa gaucuacagc 1320
aagcacaccc caaucaaccu ggugcgggau cugccccagg gcuucucagc ccuggagccc 1380
cugguggacc ugcccaucgg caucaacauc acccgguucc agacccugcu ggcccugcac 1440
cggagcuacc ugaccccagg cgacagcagc agcgggugga cagcaggcgc ggcugcuuac 1500
uacgugggcu accugcagcc ccggaccuuc cugcugaagu acaacgagaa cggcaccauc 1560
accgacgccg uggacucugg cggaggcagc auccuggcca ucuacagcac cguggccagc 1620
agccuggugc ugcuggugag ccugggcgcc aucagcuucu gauaauaggc uggagccucg 1680
guggccuagc uucuugcccc uugggccucc ccccagcccc uccuccccuu ccugcacccg 1740
uacccccgug gucuuugaau aaagucugag ugggcggc 1778
<210> 142
<211> 1602
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 142
auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60
cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120
aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180
aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240
aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300
auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360
aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420
cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480
agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540
ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600
uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660
ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720
cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780
ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840
gagaacggca ccaucaccga cgccguggac ggaggcgcca aguucguggc cgccuggacu 900
cugaaggccg cagccggcgg acccaacauc accaaccugu gccccuucgg cgagguguuc 960
aacgccaccc gguucgccag cguguacgcc uggaaccgga agcggaucag caacugcgug 1020
gccgacuaca gcgugcugua caacagcgcc agcuucagca ccuucaagug cuacggcgug 1080
agccccacca agcugaacga ccugugcuuc accaacgugu acgccgacag cuucgugauc 1140
cguggcgacg aggugcggca gaucgcaccc ggccagacag gcaagaucgc cgacuacaac 1200
uacaagcugc ccgacgacuu caccggcugc gugaucgccu ggaacagcaa caaccucgac 1260
agcaaggugg gcggcaacua caacuaccug uaccggcugu uccggaagag caaccugaag 1320
cccuucgagc gggacaucag caccgagauc uaccaagccg gcuccacccc uugcaacggc 1380
guggagggcu ucaacugcua cuucccucug cagagcuacg gcuuccagcc caccaacggc 1440
gugggcuacc agcccuaccg ggugguggug cugagcuucg agcugcugca cgccccagcc 1500
accgugugug gccccaaguc uggcggaggc agcauccugg ccaucuacag caccguggcc 1560
agcagccugg ugcugcuggu gagccugggc gccaucagcu uc 1602
<210> 143
<211> 534
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 143
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Gly Gly Ala Lys Phe Val Ala Ala Trp Thr Leu Lys Ala Ala
290 295 300
Ala Gly Gly Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe
305 310 315 320
Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile
325 330 335
Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe
340 345 350
Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu
355 360 365
Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu
370 375 380
Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn
385 390 395 400
Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser
405 410 415
Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg
420 425 430
Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr
435 440 445
Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe
450 455 460
Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly
465 470 475 480
Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu
485 490 495
His Ala Pro Ala Thr Val Cys Gly Pro Lys Ser Gly Gly Gly Ser Ile
500 505 510
Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val Ser
515 520 525
Leu Gly Ala Ile Ser Phe
530
<210> 144
<211> 1778
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 144
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120
acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180
guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240
gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300
cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360
cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420
aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480
ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540
agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600
aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660
aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720
gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780
cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840
gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900
aacggcacca ucaccgacgc cguggacgga ggcgccaagu ucguggccgc cuggacucug 960
aaggccgcag ccggcggacc caacaucacc aaccugugcc ccuucggcga gguguucaac 1020
gccacccggu ucgccagcgu guacgccugg aaccggaagc ggaucagcaa cugcguggcc 1080
gacuacagcg ugcuguacaa cagcgccagc uucagcaccu ucaagugcua cggcgugagc 1140
cccaccaagc ugaacgaccu gugcuucacc aacguguacg ccgacagcuu cgugauccgu 1200
ggcgacgagg ugcggcagau cgcacccggc cagacaggca agaucgccga cuacaacuac 1260
aagcugcccg acgacuucac cggcugcgug aucgccugga acagcaacaa ccucgacagc 1320
aaggugggcg gcaacuacaa cuaccuguac cggcuguucc ggaagagcaa ccugaagccc 1380
uucgagcggg acaucagcac cgagaucuac caagccggcu ccaccccuug caacggcgug 1440
gagggcuuca acugcuacuu cccucugcag agcuacggcu uccagcccac caacggcgug 1500
ggcuaccagc ccuaccgggu gguggugcug agcuucgagc ugcugcacgc cccagccacc 1560
guguguggcc ccaagucugg cggaggcagc auccuggcca ucuacagcac cguggccagc 1620
agccuggugc ugcuggugag ccugggcgcc aucagcuucu gauaauaggc uggagccucg 1680
guggccuagc uucuugcccc uugggccucc ccccagcccc uccuccccuu ccugcacccg 1740
uacccccgug gucuuugaau aaagucugag ugggcggc 1778
<210> 145
<211> 1785
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 145
auguacagca ugcagcuggc uagcugcgug acccugaccc uggugcugcu ggugaacagc 60
cagggcgccg agaacagcgu ggccuacagc aacaacagca ucgccauccc caccaacuuc 120
accaucagcg ugaccaccga gauucugccc gugagcauga ccaagaccag cguggacugc 180
accauguaca ucugcggcga cagcaccgag ugcagcaacc ugcugcugca guacggcagc 240
uucugcaccc agcugaaccg ggcccugacc ggcaucgccg uggagcagga caagaacacc 300
caggaggugu ucgcccaggu gaagcagauc uacaagaccc cucccaucaa ggacuucggc 360
ggcuucaacu ucagccagau ccugcccgac cccagcaagc ccagcaagcg gagcuucauc 420
gaggaccugc uguucaacaa ggugacccua gccgacgccg gcuucaucaa gcaguacggc 480
gacugccucg gcgacauagc cgcccgggac cugaucugcg cccagaaguu caacggccug 540
accgugcugc cuccccugcu gaccgacgag augaucgccc aguacaccag cgcccuguua 600
gccggaacca ucaccagcgg cuggacuuuc ggcgcuggag ccgcucugca gauccccuuc 660
gccaugcaga uggccuaccg guucaacggc aucggcguga cccagaacgu gcuguacgag 720
aaccagaagc ugaucgccaa ccaguucaac agcgccaucg gcaagaucca ggacagccug 780
agcagcaccg cuagcgcccu gggcaagcug caggacgugg ugaaccagaa cgcccaggcc 840
cugaacaccc uggugaagca gcugagcagc aacuucggcg ccaucagcag cgugcugaac 900
gacauccuga gccggcugga cccucccgag gccgaggugc agaucgaccg gcugaucacu 960
ggccggcugc agagccugca gaccuacgug acccagcagc ugauccgggc cgccgagauu 1020
cgggccagcg ccaaccuggc cgccaccaag augagcgagu gcgugcuggg ccagagcaag 1080
cggguggacu ucugcggcaa gggcuaccac cugaugagcu uuccccagag cgcaccccac 1140
ggaguggugu uccugcacgu gaccuacgug cccgcccagg agaagaacuu caccaccgcc 1200
ccagccaucu gccacgacgg caaggcccac uuuccccggg agggcguguu cgugagcaac 1260
ggcacccacu gguucgugac ccagcggaac uucuacgagc cccagaucau caccaccgac 1320
aacaccuucg ugagcggcaa cugcgacgug gugaucggca ucgugaacaa caccguguac 1380
gauccccugc agcccgagcu ggacagcuuc aaggaggagc uggacaagua cuucaagaau 1440
cacaccagcc ccgacgugga ccugggcgac aucagcggca ucaacgccag cguggugaac 1500
auccagaagg agaucgaucg gcugaacgag guggccaaga accugaacga gagccugauc 1560
gaccugcagg agcugggcaa guacgagcag uacaucaagu ggcccuggua caucuggcug 1620
ggcuucaucg ccggccugau cgccaucgug auggugacca ucaugcugug cugcaugacc 1680
agcugcugca gcugccugaa gggcuguugc agcugcggca gcugcugcaa guucgacgag 1740
gacgacagcg agcccgugcu gaagggcgug aagcugcacu acacc 1785
<210> 146
<211> 595
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 146
Met Tyr Ser Met Gln Leu Ala Ser Cys Val Thr Leu Thr Leu Val Leu
1 5 10 15
Leu Val Asn Ser Gln Gly Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn
20 25 30
Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr Thr Glu Ile
35 40 45
Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr Met Tyr Ile
50 55 60
Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln Tyr Gly Ser
65 70 75 80
Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala Val Glu Gln
85 90 95
Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln Ile Tyr Lys
100 105 110
Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu
115 120 125
Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu Asp Leu Leu
130 135 140
Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly
145 150 155 160
Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys
165 170 175
Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp Glu Met Ile
180 185 190
Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp
195 200 205
Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met
210 215 220
Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu
225 230 235 240
Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile
245 250 255
Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp
260 265 270
Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu
275 280 285
Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser
290 295 300
Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile Asp Arg Leu Ile Thr
305 310 315 320
Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg
325 330 335
Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr Lys Met Ser
340 345 350
Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp Phe Cys Gly Lys Gly
355 360 365
Tyr His Leu Met Ser Phe Pro Gln Ser Ala Pro His Gly Val Val Phe
370 375 380
Leu His Val Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala
385 390 395 400
Pro Ala Ile Cys His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val
405 410 415
Phe Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr
420 425 430
Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys
435 440 445
Asp Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln
450 455 460
Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
465 470 475 480
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala
485 490 495
Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala
500 505 510
Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr
515 520 525
Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly Phe Ile Ala
530 535 540
Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys Cys Met Thr
545 550 555 560
Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly Ser Cys Cys
565 570 575
Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys Gly Val Lys Leu
580 585 590
His Tyr Thr
595
<210> 147
<211> 1961
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 147
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uacagcaugc agcuggcuag cugcgugacc cugacccugg ugcugcuggu gaacagccag 120
ggcgccgaga acagcguggc cuacagcaac aacagcaucg ccauccccac caacuucacc 180
aucagcguga ccaccgagau ucugcccgug agcaugacca agaccagcgu ggacugcacc 240
auguacaucu gcggcgacag caccgagugc agcaaccugc ugcugcagua cggcagcuuc 300
ugcacccagc ugaaccgggc ccugaccggc aucgccgugg agcaggacaa gaacacccag 360
gagguguucg cccaggugaa gcagaucuac aagaccccuc ccaucaagga cuucggcggc 420
uucaacuuca gccagauccu gcccgacccc agcaagccca gcaagcggag cuucaucgag 480
gaccugcugu ucaacaaggu gacccuagcc gacgccggcu ucaucaagca guacggcgac 540
ugccucggcg acauagccgc ccgggaccug aucugcgccc agaaguucaa cggccugacc 600
gugcugccuc cccugcugac cgacgagaug aucgcccagu acaccagcgc ccuguuagcc 660
ggaaccauca ccagcggcug gacuuucggc gcuggagccg cucugcagau ccccuucgcc 720
augcagaugg ccuaccgguu caacggcauc ggcgugaccc agaacgugcu guacgagaac 780
cagaagcuga ucgccaacca guucaacagc gccaucggca agauccagga cagccugagc 840
agcaccgcua gcgcccuggg caagcugcag gacgugguga accagaacgc ccaggcccug 900
aacacccugg ugaagcagcu gagcagcaac uucggcgcca ucagcagcgu gcugaacgac 960
auccugagcc ggcuggaccc ucccgaggcc gaggugcaga ucgaccggcu gaucacuggc 1020
cggcugcaga gccugcagac cuacgugacc cagcagcuga uccgggccgc cgagauucgg 1080
gccagcgcca accuggccgc caccaagaug agcgagugcg ugcugggcca gagcaagcgg 1140
guggacuucu gcggcaaggg cuaccaccug augagcuuuc cccagagcgc accccacgga 1200
gugguguucc ugcacgugac cuacgugccc gcccaggaga agaacuucac caccgcccca 1260
gccaucugcc acgacggcaa ggcccacuuu ccccgggagg gcguguucgu gagcaacggc 1320
acccacuggu ucgugaccca gcggaacuuc uacgagcccc agaucaucac caccgacaac 1380
accuucguga gcggcaacug cgacguggug aucggcaucg ugaacaacac cguguacgau 1440
ccccugcagc ccgagcugga cagcuucaag gaggagcugg acaaguacuu caagaaucac 1500
accagccccg acguggaccu gggcgacauc agcggcauca acgccagcgu ggugaacauc 1560
cagaaggaga ucgaucggcu gaacgaggug gccaagaacc ugaacgagag ccugaucgac 1620
cugcaggagc ugggcaagua cgagcaguac aucaaguggc ccugguacau cuggcugggc 1680
uucaucgccg gccugaucgc caucgugaug gugaccauca ugcugugcug caugaccagc 1740
ugcugcagcu gccugaaggg cuguugcagc ugcggcagcu gcugcaaguu cgacgaggac 1800
gacagcgagc ccgugcugaa gggcgugaag cugcacuaca ccugauaaua ggcuggagcc 1860
ucgguggccu agcuucuugc cccuugggcc uccccccagc cccuccuccc cuuccugcac 1920
ccguaccccc guggucuuug aauaaagucu gagugggcgg c 1961
<210> 148
<211> 13
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 148
Ala Lys Phe Val Ala Ala Trp Thr Leu Lys Ala Ala Ala
1 5 10
<210> 149
<211> 2216
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 149
gggaaauaag agagaaaaga agaguaagaa gaaauauaag accccggcgc cgccaccaug 60
uucguguucc uggugcugcu gccccuggug agcagccagu gcgugaaccu gaccacccgg 120
acccagcugc caccagccua caccaacagc uucacccggg gcgucuacua ccccgacaag 180
guguuccgga gcagcguccu gcacagcacc caggaccugu uccugcccuu cuucagcaac 240
gugaccuggu uccacgccau ccacgugagc ggcaccaacg gcaccaagcg guucgacaac 300
cccgugcugc ccuucaacga cggcguguac uucgccagca ccgagaagag caacaucauc 360
cggggcugga ucuucggcac cacccuggac agcaagaccc agagccugcu gaucgugaau 420
aacgccacca acguggugau caaggugugc gaguuccagu ucugcaacga ccccuuccug 480
ggcguguacu accacaagaa caacaagagc uggauggaga gcgaguuccg gguguacagc 540
agcgccaaca acugcaccuu cgaguacgug agccagcccu uccugaugga ccuggagggc 600
aagcagggca acuucaagaa ccugcgggag uucguguuca agaacaucga cggcuacuuc 660
aagaucuaca gcaagcacac cccaaucaac cuggugcggg aucugcccca gggcuucuca 720
gcccuggagc cccuggugga ccugcccauc ggcaucaaca ucacccgguu ccagacccug 780
cuggcccugc accggagcua ccugacccca ggcgacagca gcagcgggug gacagcaggc 840
gcggcugcuu acuacguggg cuaccugcag ccccggaccu uccugcugaa guacaacgag 900
aacggcacca ucaccgacgc cguggacugc gcccuggacc cucugagcga gaccaagugc 960
acccugaaga gcuucaccgu ggagaagggc aucuaccaga ccagcaacuu ccgggugcag 1020
cccaccgaga gcaucgugcg guuccccaac aucaccaacc ugugccccuu cggcgaggug 1080
uucaacgcca cccgguucgc cagcguguac gccuggaacc ggaagcggau cagcaacugc 1140
guggccgacu acagcgugcu guacaacagc gccagcuuca gcaccuucaa gugcuacggc 1200
gugagcccca ccaagcugaa cgaccugugc uucaccaacg uguacgccga cagcuucgug 1260
auccguggcg acgaggugcg gcagaucgca cccggccaga caggcaagau cgccgacuac 1320
aacuacaagc ugcccgacga cuucaccggc ugcgugaucg ccuggaacag caacaaccuc 1380
gacagcaagg ugggcggcaa cuacaacuac cuguaccggc uguuccggaa gagcaaccug 1440
aagcccuucg agcgggacau cagcaccgag aucuaccaag ccggcuccac cccuugcaac 1500
ggcguggagg gcuucaacug cuacuucccu cugcagagcu acggcuucca gcccaccaac 1560
ggcgugggcu accagcccua ccggguggug gugcugagcu ucgagcugcu gcacgcccca 1620
gccaccgugu guggccccaa gaagagcacc aaccugguga agaacaagug cgugaacuuc 1680
aacuucaacg gccuuaccgg caccggcgug cugaccgaga gcaacaagaa auuccugccc 1740
uuucagcagu ucggccggga caucgccgac accaccgacg cugugcggga uccccagacc 1800
cuggagaucc uggacaucac cccuugcagc uucggcggcg ugagcgugau caccccaggc 1860
accaacacca gcaaccaggu ggccgugcug uaccaggacg ugaacugcac cgaggugccc 1920
guggccaucc acgccgacca gcugacaccc accuggcggg ucuacagcac cggcagcaac 1980
guguuccaga cccgggccgg uugccugauc ggcgccgagc acgugaacaa cagcuacgag 2040
ugcgacaucc ccaucggcgc cggcaucugu gccagcuacc agacccagac caauucauga 2100
uaauaggcug gagccucggu ggccuagcuu cuugccccuu gggccucccc ccagccccuc 2160
cuccccuucc ugcacccgua cccccguggu cuuugaauaa agucugagug ggcggc 2216
<210> 150
<211> 2040
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 150
auguucgugu uccuggugcu gcugccccug gugagcagcc agugcgugaa ccugaccacc 60
cggacccagc ugccaccagc cuacaccaac agcuucaccc ggggcgucua cuaccccgac 120
aagguguucc ggagcagcgu ccugcacagc acccaggacc uguuccugcc cuucuucagc 180
aacgugaccu gguuccacgc cauccacgug agcggcacca acggcaccaa gcgguucgac 240
aaccccgugc ugcccuucaa cgacggcgug uacuucgcca gcaccgagaa gagcaacauc 300
auccggggcu ggaucuucgg caccacccug gacagcaaga cccagagccu gcugaucgug 360
aauaacgcca ccaacguggu gaucaaggug ugcgaguucc aguucugcaa cgaccccuuc 420
cugggcgugu acuaccacaa gaacaacaag agcuggaugg agagcgaguu ccggguguac 480
agcagcgcca acaacugcac cuucgaguac gugagccagc ccuuccugau ggaccuggag 540
ggcaagcagg gcaacuucaa gaaccugcgg gaguucgugu ucaagaacau cgacggcuac 600
uucaagaucu acagcaagca caccccaauc aaccuggugc gggaucugcc ccagggcuuc 660
ucagcccugg agccccuggu ggaccugccc aucggcauca acaucacccg guuccagacc 720
cugcuggccc ugcaccggag cuaccugacc ccaggcgaca gcagcagcgg guggacagca 780
ggcgcggcug cuuacuacgu gggcuaccug cagccccgga ccuuccugcu gaaguacaac 840
gagaacggca ccaucaccga cgccguggac ugcgcccugg acccucugag cgagaccaag 900
ugcacccuga agagcuucac cguggagaag ggcaucuacc agaccagcaa cuuccgggug 960
cagcccaccg agagcaucgu gcgguucccc aacaucacca accugugccc cuucggcgag 1020
guguucaacg ccacccgguu cgccagcgug uacgccugga accggaagcg gaucagcaac 1080
ugcguggccg acuacagcgu gcuguacaac agcgccagcu ucagcaccuu caagugcuac 1140
ggcgugagcc ccaccaagcu gaacgaccug ugcuucacca acguguacgc cgacagcuuc 1200
gugauccgug gcgacgaggu gcggcagauc gcacccggcc agacaggcaa gaucgccgac 1260
uacaacuaca agcugcccga cgacuucacc ggcugcguga ucgccuggaa cagcaacaac 1320
cucgacagca aggugggcgg caacuacaac uaccuguacc ggcuguuccg gaagagcaac 1380
cugaagcccu ucgagcggga caucagcacc gagaucuacc aagccggcuc caccccuugc 1440
aacggcgugg agggcuucaa cugcuacuuc ccucugcaga gcuacggcuu ccagcccacc 1500
aacggcgugg gcuaccagcc cuaccgggug guggugcuga gcuucgagcu gcugcacgcc 1560
ccagccaccg uguguggccc caagaagagc accaaccugg ugaagaacaa gugcgugaac 1620
uucaacuuca acggccuuac cggcaccggc gugcugaccg agagcaacaa gaaauuccug 1680
cccuuucagc aguucggccg ggacaucgcc gacaccaccg acgcugugcg ggauccccag 1740
acccuggaga uccuggacau caccccuugc agcuucggcg gcgugagcgu gaucacccca 1800
ggcaccaaca ccagcaacca gguggccgug cuguaccagg acgugaacug caccgaggug 1860
cccguggcca uccacgccga ccagcugaca cccaccuggc gggucuacag caccggcagc 1920
aacguguucc agacccgggc cgguugccug aucggcgccg agcacgugaa caacagcuac 1980
gagugcgaca uccccaucgg cgccggcauc ugugccagcu accagaccca gaccaauuca 2040
<210> 151
<211> 680
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 151
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser
675 680
<210> 152
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 152
Gly Ser Gly Gly
1
Claims (154)
- SARS-CoV-2 스파이크 단백질의 적어도 2개의 도메인, 및 전장보다 작은 스파이크 단백질을 암호화하는 오픈 리딩 프레임(ORF)을 포함하는 메신저 리보핵산(mRNA).
- 제1항에 있어서, 상기 2개의 도메인 중 하나는 SARS-CoV-2 스파이크 단백질의 N-말단 도메인(NTD)인, mRNA.
- 제1항 또는 제2항에 있어서, 상기 2개의 도메인 중 하나는 SARS-CoV-2 스파이크 단백질의 수용체 결합 도메인(RBD)인, mRNA.
- 제2항 또는 제3항에 있어서, 상기 ORF는 NTD 및/또는 RBD에 연결된 막횡단 도메인(TD)을 암호화하는 것인, mRNA.
- 제4항에 있어서, 상기 TD는 인플루엔자 혈구응집소 막횡단 도메인인, mRNA.
- 제3항 또는 제4항에 있어서, 상기 ORF는 NTD - RBD - TM을 포함하는 것인, mRNA.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 적어도 2개의 도메인은 절단 가능하거나 절단 불가능한 링커를 통해 연결된 것인, mRNA.
- 제7항에 있어서, 상기 절단 불가능한 링커는 글리신-세린(GS) 링커인, mRNA.
- 제8항에 있어서, 상기 GS 링커는 4-15개의 아미노산인, mRNA.
- 제6항에 있어서, 상기 링커는 pan HLA DR-결합 에피토프(PADRE)인, mRNA.
- 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 ORF는 신호 펩티드를 암호화하는 것인, mRNA.
- 제11항에 있어서, 상기 신호 펩티드는 NTD에 연결된 것인, mRNA.
- 제11항에 있어서, 상기 신호 펩티드는 RBD에 연결된 것인, mRNA.
- 제11항 내지 제13항 중 어느 한 항에 있어서, 상기 신호 펩티드는 SARS-CoV-2와 이종인, mRNA.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 적어도 2개의 도메인은 가용성인, mRNA.
- 제1항 내지 제14항 중 어느 한 항에 있어서, 상기 ORF는 트래피킹 신호 도메인을 암호화하는 것인, mRNA.
- 제16항에 있어서, 상기 트래피킹 신호 도메인은 대식세포 마커인, mRNA.
- 제16항에 있어서, 상기 대식세포 마커는 CD86 및/또는 CD11b인, mRNA.
- 제16항에 있어서, 상기 트래피킹 신호 도메인은 VSV-G 세포질 꼬리(VSVGct)인, mRNA.
- 제1항에 있어서, 상기 2개의 도메인 중 하나는 SARS-CoV-2 스파이크 단백질의 제1 반복 헵타펩티드: HPPHCPC(HR1)인, mRNA.
- 제1항에 있어서, 상기 2개의 도메인 중 하나는 SARS-CoV-2 스파이크 단백질의 제2 반복 헵타펩티드: HPPHCPC(HR2)인, mRNA.
- 제20항 또는 제21항에 있어서, 상기 ORF는 HR1 및/또는 HR2에 연결된 막횡단 도메인(TD)을 암호화하는 것인, mRNA.
- 제22항에 있어서, 상기 TD는 인플루엔자 혈구응집소 막횡단 도메인인, mRNA.
- 제20항 내지 제23항 중 어느 한 항에 있어서, 상기 ORF는 융합 펩티드(FP)를 암호화하는 것인, mRNA.
- 제20항 내지 제23항 중 어느 한 항에 있어서, 상기 ORF는 CT 꼬리를 암호화하는 것인, mRNA.
- SARS-CoV-2 스파이크 단백질의 수용체 결합 도메인(RBD)을 암호화하는 오픈 리딩 프레임(ORF)을 포함하는 메신저 리보핵산(mRNA).
- 제26항에 있어서, 상기 RBD는 가용성인, mRNA.
- 제26항에 있어서, 상기 RBD는 막횡단 도메인, 선택적으로 인플루엔자 혈구응집소 막횡단 도메인에 연결된 것인, mRNA.
- SARS-CoV-2 스파이크 단백질의 N-말단 도메인(NTD)을 암호화하는 오픈 리딩 프레임(ORF)을 포함하는 메신저 리보핵산(mRNA).
- 제29항에 있어서, 상기 NTD는 SARS-CoV-2 스파이크 단백질의 RBD에 연결되어 NTD-RBD 융합 단백질을 형성하는 것인, mRNA.
- 제30항에 있어서, 상기 NTD-RBD 융합은 막횡단 도메인(TM), 선택적으로 인플루엔자 혈구응집소 막횡단 도메인에 연결되어 NTD-RBD-TM 단백질을 형성하는 것인, mRNA.
- 제30항에 있어서, 상기 NTD-RBD 융합은 C-말단 절단을 포함하는 것인, mRNA.
- 제26항 내지 제32항 중 어느 한 항에 있어서, 상기 NTD 및/또는 RBD는 확장된 영역을 포함하는 것인, mRNA.
- S1 서브유닛을 암호화하는 오픈 리딩 프레임(ORF)을 포함하는 메신저 리보핵산(mRNA)으로서, 상기 S1 서브유닛은 막횡단 도메인, 선택적으로 인플루엔자 혈구응집소 막횡단 도메인에 연결된 것인 메신저 리보핵산(mRNA).
- S1 서브유닛을 암호화하는 오픈 리딩 프레임(ORF)을 포함하는 메신저 리보핵산(mRNA)으로서, 상기 S1 서브유닛은 S 단백질의 RBD 또는 RBD의 일부를 제거하도록 변형된 것인 메신저 리보핵산(mRNA).
- S2 서브유닛에 연결된 S1 서브유닛을 암호화하는 오픈 리딩 프레임(ORF)을 포함하는 메신저 리보핵산(mRNA)으로서, 상기 S1 서브유닛은 HKU1 S 단백질로부터 유래된 것인 메신저 리보핵산(mRNA).
- S2 서브유닛에 연결된 S1 서브유닛을 암호화하는 오픈 리딩 프레임(ORF)을 포함하는 메신저 리보핵산(mRNA)으로서, 상기 S1 서브유닛은 OC43 S 단백질로부터 유래된 것인 메신저 리보핵산(mRNA).
- 제34항 내지 제37항 중 어느 한 항에 있어서, 대식세포 마커, 선택적으로 CD86, CD11B 및/또는 VSVGct로부터 선택적으로 선택되는 트래피킹 신호를 추가로 포함하는 것인, mRNA.
- SARS-CoV-2 스파이크 단백질의 S2 서브유닛을 암호화하는 오픈 리딩 프레임(ORF)을 포함하는 메신저 리보핵산(mRNA).
- SARS-CoV-2 스파이크 단백질의 수용체 결합 도메인(RBD) 및 단백질 막횡단 도메인을 포함하는 융합 단백질을 암호화하는 오픈 리딩 프레임을 포함하는 메신저 리보핵산(mRNA).
- 제40항에 있어서, 상기 단백질 막횡단 도메인은 인플루엔자 혈구응집소 막횡단 도메인인, mRNA.
- SARS-CoV-2 스파이크 단백질의 아미노(N)-말단 도메인(NTD) 및 막횡단 도메인을 포함하는 융합 단백질을 암호화하는 오픈 리딩 프레임을 포함하는 메신저 리보핵산(mRNA).
- 제42항에 있어서, 상기 막횡단 도메인은 인플루엔자 혈구응집소 막횡단 도메인인, mRNA.
- SARS-CoV-2 스파이크 단백질의 수용체 결합 도메인에 연결된 SARS-CoV-2 스파이크 단백질의 아미노(N)-말단 도메인을 포함하는 융합 단백질을 암호화하는 오픈 리딩 프레임을 포함하는 메신저 리보핵산(mRNA).
- 제44항에 있어서, 상기 융합 단백질은 막횡단 도메인을 추가로 포함하는 것인, mRNA.
- 제1항 내지 제45항 중 어느 한 항에 있어서, 5' 캡, 선택적으로 7mG(5')ppp(5')NlmpNp를 추가로 포함하는 것인, mRNA.
- 제1항 내지 제45항 중 어느 한 항에 있어서, 선택적으로 약 100개의 뉴클레오티드 길이를 갖는 폴리A 꼬리를 추가로 포함하는 것인, mRNA.
- 제1항 내지 제46항 중 어느 한 항에 있어서, 상기 mRNA는 화학적 변형, 선택적으로 1-메틸슈도우리딘을 포함하는 것인, mRNA.
- 제1항 내지 제47항 중 어느 한 항에 있어서, 상기 mRNA 내의 각각의 우리딘은 1-메틸슈도우리딘인, mRNA.
- (a) SARS-CoV-2 스파이크 단백질의 수용체 결합 도메인(RBD) 및 단백질 막횡단 도메인을 포함하는 융합 단백질을 암호화하는 오픈 리딩 프레임을 포함하는 메신저 리보핵산(mRNA); 및
(b) SARS-CoV-2 스파이크 단백질의 아미노(N)-말단 도메인(NTD) 및 막횡단 도메인을 포함하는 융합 단백질을 암호화하는 오픈 리딩 프레임을 포함하는 mRNA
를 포함하는 조성물. - 제49항에 있어서, 상기 단백질 막횡단 도메인은 인플루엔자 혈구응집소 막횡단 도메인인, 조성물.
- 제50항에 있어서, 상기 (a)의 융합 단백질은 서열번호 77의 아미노산 서열에 대해 적어도 80% 동일성을 갖는 아미노산 서열을 포함하는 것인, 조성물.
- 제51항에 있어서, 상기 (a)의 융합 단백질은 서열번호 77의 아미노산 서열에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하는 것인, 조성물.
- 제52항에 있어서, 상기 (a)의 융합 단백질은 서열번호 77의 아미노산 서열을 포함하는 것인, 조성물.
- 제50항 내지 제53항 중 어느 한 항에 있어서, 상기 (a)의 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열에 대해 적어도 70% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, 조성물.
- 제54항에 있어서, 상기 (a)의 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열에 대해 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, 조성물.
- 제55항에 있어서, 상기 (a)의 오픈 리딩 프레임은 서열번호 76의 뉴클레오티드 서열을 포함하는 것인, 조성물.
- 제50항 내지 제56항 중 어느 한 항에 있어서, 상기 (b)의 융합 단백질은 서열번호 47의 아미노산 서열에 대해 적어도 80% 동일성을 갖는 아미노산 서열을 포함하는 것인, 조성물.
- 제57항에 있어서, 상기 (b)의 융합 단백질은 서열번호 47의 아미노산 서열에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하는 것인, 조성물.
- 제58항에 있어서, 상기 (b)의 융합 단백질은 서열번호 47의 아미노산 서열을 포함하는 것인, 조성물.
- 제50항 내지 제59항 중 어느 한 항에 있어서, 상기 (b)의 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열에 대해 적어도 70% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, 조성물.
- 제60항에 있어서, 상기 (b)의 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열에 대해 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, 조성물.
- 제61항에 있어서, 상기 (b)의 오픈 리딩 프레임은 서열번호 46의 뉴클레오티드 서열을 포함하는 것인, 조성물.
- 제49항 내지 제62항 중 어느 한 항에 있어서, 상기 (a)의 mRNA 대 (b)의 mRNA의 비율은 약 1:1인, 조성물.
- 제1항 내지 제48항 중 어느 한 항에 있어서, 조성물 내 지질 나노입자를 추가로 포함하는 것인, mRNA.
- 제49항 내지 제62항 중 어느 한 항에 있어서, 지질 나노입자를 추가로 포함하는 것인, 조성물.
- 제64항 또는 제65항에 있어서, 상기 mRNA는 지질 나노입자 내 존재하는 것인, 조성물.
- 제49항 내지 제62항 중 어느 한 항에 있어서, 상기 (a)의 mRNA는 지질 나노입자 내 존재하고, 상기 (b)의 mRNA는 지질 나노입자 내 존재하는 것인, 조성물.
- 제67항에 있어서, 상기 (a) 및 (b)의 mRNA는 동일한 지질 나노입자 내 존재하거나, 상기 (a) 및 (b)의 각각의 mRNA는 서로 상대적으로 별개의 나노입자 내 제형화되는 것인, 조성물.
- 제64항 내지 제68항 중 어느 한 항에 있어서, 상기 지질 나노입자는 양이온성 지질을 포함하는 것인, 조성물.
- 제69항에 있어서, 상기 지질 나노입자는 중성 지질을 추가로 포함하는 것인, 조성물.
- 제69항 또는 제70항에 있어서, 상기 지질 나노입자는 스테롤을 추가로 포함하는 것인, 조성물.
- 제69항 내지 제71항 중 어느 한 항에 있어서, 상기 지질 나노입자는 폴리에틸렌 글리콜(PEG)-변형된 지질을 추가로 포함하는 것인, 조성물.
- 제69항 내지 제72항 중 어느 한 항에 있어서, 상기 지질 나노입자는 이온화 가능한 양이온성 지질, 중성 지질, 스테롤, 및 PEG-변형된 지질을 포함하는 것인, 조성물.
- 제73항에 있어서, 상기 이온화 가능한 양이온성 지질은 헵타데칸-9-일 8((2 하이드록시에틸)(6 옥소 6-(운데실옥시)헥실)아미노)옥타노에이트 (화합물 1)인, 조성물.
- 제73항 또는 제74항에 있어서, 상기 중성 지질은 1,2 디스테아로일-sn-글리세로-3-포스포콜린(DSPC)인, 조성물.
- 제69항 내지 제75항 중 어느 한 항에 있어서, 상기 스테롤은 콜레스테롤인, 조성물.
- 제69항 내지 제76항 중 어느 한 항에 있어서, 상기 PEG-변형된 지질은 1,2 디미리스토일-sn-글리세롤, 메톡시폴리에틸렌글리콜(PEG2000 DMG)인, 조성물.
- 제69항 내지 제77항 중 어느 한 항에 있어서, 상기 지질 나노입자는 20-60 mol%의 이온화 가능한 양이온성 지질, 5-25 mol%의 중성 지질, 25-55 mol%의 스테롤, 및 0.5-15 mol%의 PEG-변형된 지질을 포함하는 것인, 조성물.
- 제78항에 있어서, 상기 지질 나노입자는
40-50 mol%, 선택적으로 45-50 mol%의 이온화 가능한 지질, 30-45 mol%, 선택적으로 35-40 mol%의 스테롤, 5-15 mol%, 선택적으로 10-12 mol%의 헬퍼 지질, 1-5%, 선택적으로 1-3 mol%, 또는 1.5 내지 2.5 mol%의 PEG 지질:
을 포함하는 조성물. - 제79항에 있어서, 상기 지질 나노입자는
40-50 mol%, 선택적으로 45-50 mol%의 화합물 1, 30-45 mol%, 선택적으로 35-40 mol%의 콜레스테롤, 5-15 mol%, 선택적으로 10-12 mol%의 DSPC, 1-5%, 선택적으로 1-3 mol%, 또는 1.5 내지 2.5 mol%의 PEG2000DMG:
를 포함하는 조성물. - SARS-CoV-2에 대한 중화 항체 반응을 대상체에서 유도하기에 효과적인 양으로 제1항 내지 제80항 중 어느 한 항의 mRNA 또는 조성물을 대상체에게 투여하는 단계를 포함하는 방법.
- SARS-CoV-2에 대한 T 세포 면역 반응을 대상체에서 유도하기에 효과적인 양으로 제1항 내지 제81항 중 어느 한 항의 mRNA 또는 조성물을 대상체에게 투여하는 단계를 포함하는 방법.
- SARS-CoV-2에 대한 중화 항체 반응 및 T 세포 면역 반응을 대상체에서 유도하기에 효과적인 양으로 제1항 내지 제48항 중 어느 한 항의 mRNA를 대상체에게 투여하는 단계를 포함하는 방법.
- SARS-CoV-2 스파이크 단백질의 적어도 1개의 도메인을 암호화하는 오픈 리딩 프레임(ORF)을 포함하는 메신저 리보핵산(mRNA).
- 제84항에 있어서, 상기 mRNA는 제1항 내지 제48항 중 어느 한 항의 것인, mRNA.
- 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 77의 아미노산 서열에 대해 적어도 80% 동일성을 갖는 아미노산 서열을 암호화하는 것인, mRNA.
- 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 77의 아미노산 서열에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 암호화하는 것인, mRNA.
- 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 77의 아미노산 서열을 암호화하는 것인, mRNA.
- 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 76의 뉴클레오티드 서열에 대해 적어도 70% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, mRNA.
- 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 76의 뉴클레오티드 서열에 대해 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, mRNA.
- 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 76의 뉴클레오티드 서열을 포함하는 것인, mRNA.
- 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 47의 아미노산 서열에 대해 적어도 80% 동일성을 갖는 아미노산 서열을 암호화하는 것인, mRNA.
- 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 47의 아미노산 서열에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 암호화하는 것인, mRNA.
- 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 47의 아미노산 서열을 암호화하는 것인, mRNA.
- 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 46의 뉴클레오티드 서열에 대해 적어도 70% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, mRNA.
- 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 46의 뉴클레오티드 서열에 대해 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, mRNA.
- 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 46의 뉴클레오티드 서열을 포함하는 것인, mRNA.
- 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 62의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 암호화하고, 선택적으로 상기 항원은 서열번호 62의 아미노산 서열을 포함하는 것인, mRNA.
- 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 61의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 61의 뉴클레오티드 서열을 포함하는 것인, mRNA.
- 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 92, 140, 또는 143의 아미노산 서열에 대해 적어도 80% 동일성을 갖는 아미노산 서열을 암호화하는 것인, mRNA.
- 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 92, 140, 또는 143의 아미노산 서열에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 암호화하는 것인, mRNA.
- 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 92, 140, 또는 143의 아미노산 서열을 암호화하는 것인, mRNA.
- 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 91, 139, 또는 142의 뉴클레오티드 서열에 대해 적어도 70% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, mRNA.
- 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 91, 139, 또는 142의 뉴클레오티드 서열에 대해 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인, mRNA.
- 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 91, 139, 또는 142의 뉴클레오티드 서열을 포함하는 것인, mRNA.
- 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 107의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 암호화하고, 선택적으로 상기 항원은 서열번호 107의 아미노산 서열을 포함하는 것인, mRNA.
- 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 106의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 106의 뉴클레오티드 서열을 포함하는 것인, mRNA.
- 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 59, 86, 89, 116, 119, 또는 122 중 임의의 하나의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 암호화하고, 선택적으로 상기 항원은 서열번호 59, 86, 89, 116, 119, 또는 122 중 임의의 하나의 아미노산 서열을 포함하는 것인, mRNA.
- 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 58, 85, 88, 115, 118, 또는 121 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 58, 85, 88, 115, 118, 또는 121 중 임의의 하나의 뉴클레오티드 서열을 포함하는 것인, mRNA.
- 서열번호 5의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하는 S1 서브유닛 항원을 암호화하는 오픈 리딩 프레임(ORF)을 포함하고, 선택적으로 상기 항원은 서열번호 5의 아미노산 서열을 포함하는 메신저 리보핵산(mRNA).
- 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 3의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 3의 뉴클레오티드 서열을 포함하는 것인, mRNA.
- 제84항 또는 제85항에 있어서, 상기 항원은 서열번호 17 또는 146의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 17 또는 146의 아미노산 서열을 포함하는 것인, mRNA.
- 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 16 또는 145의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 16 또는 145의 뉴클레오티드 서열을 포함하는 것인, mRNA.
- 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 20, 23, 26, 29, 32 또는 35 중 임의의 하나의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 암호화하고, 선택적으로 상기 항원은 서열번호 20, 23, 26, 29, 32 또는 35 중 임의의 하나의 아미노산 서열을 포함하는 것인, mRNA.
- 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 19, 22, 25, 28, 41, 또는 34 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 19, 22, 25, 28, 31, 또는 34 중 임의의 하나의 뉴클레오티드 서열을 포함하는 것인, mRNA.
- 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 38의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 암호화하고, 선택적으로 상기 항원은 서열번호 38의 아미노산 서열을 포함하는 것인, mRNA.
- 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 37의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 37의 뉴클레오티드 서열을 포함하는 것인, mRNA.
- 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 41의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 암호화하고, 선택적으로 상기 항원은 서열번호 41의 아미노산 서열을 포함하는 것인, mRNA.
- 제84항 또는 제85항에 있어서, 상기 ORF는 서열번호 40의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 40의 뉴클레오티드 서열을 포함하는 것인, mRNA.
- 제1항 내지 제119항 중 어느 한 항에 있어서, 서열번호 131 또는 2의 뉴클레오티드 서열을 선택적으로 포함하는, 5' 비번역 영역(UTR)을 추가로 포함하는 것인, mRNA.
- 제1항 내지 제120항 중 어느 한 항에 있어서, 서열번호 132 또는 4의 뉴클레오티드 서열을 선택적으로 포함하는, 3' 비번역 영역(UTR)을 추가로 포함하는 것인, mRNA.
- 서열번호 8 또는 65의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하는 항원을 암호화하는 오픈 리딩 프레임(ORF)을 포함하고, 선택적으로 상기 항원은 서열번호 8 또는 65의 아미노산 서열을 포함하는 메신저 리보핵산(mRNA).
- 제122항에 있어서, 상기 ORF는 서열번호 7 또는 64의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 7 또는 64의 뉴클레오티드 서열을 포함하는 것인, mRNA.
- 서열번호 11, 14, 68, 또는 71 중 임의의 하나의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하는 항원을 암호화하는 오픈 리딩 프레임(ORF)을 포함하고, 선택적으로 상기 항원은 서열번호 11, 14, 68, 또는 71 중 임의의 하나의 아미노산 서열을 포함하는 메신저 리보핵산(mRNA).
- 제124항에 있어서, 상기 오픈 리딩 프레임은 서열번호 10, 13, 67, 또는 70 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 10, 13, 67, 또는 70 중 임의의 하나의 뉴클레오티드 서열을 포함하는 것인, mRNA.
- 서열번호 44, 50, 74, 80, 83, 101, 104 또는 113 중 임의의 하나의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하는 항원을 암호화하는 오픈 리딩 프레임(ORF)을 포함하고, 선택적으로 상기 항원은 서열번호 44, 50, 74, 80, 83, 101, 104 또는 113 중 임의의 하나의 아미노산 서열을 포함하는 메신저 리보핵산(mRNA).
- 제126항에 있어서, 상기 오픈 리딩 프레임은 서열번호 43, 49, 73, 79, 82, 100, 103, 또는 112 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 43, 49, 73, 79, 82, 100, 103, 또는 112 중 임의의 하나의 뉴클레오티드 서열을 포함하는 것인, mRNA.
- 제108항에 있어서, 상기 항원은 서열번호 95, 98, 또는 110 중 임의의 하나의 아미노산 서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하고, 선택적으로 상기 항원은 서열번호 95, 98, 또는 110 중 임의의 하나의 아미노산 서열을 포함하는 것인, mRNA.
- 제127항 또는 제128항에 있어서, 상기 오픈 리딩 프레임은 서열번호 94, 97, 또는 109 중 임의의 하나의 뉴클레오티드 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 뉴클레오티드 서열을 포함하고, 선택적으로 상기 오픈 리딩 프레임은 서열번호 94, 97, 또는 109 중 임의의 하나의 뉴클레오티드 서열을 포함하는 것인, mRNA.
- 제84항 내지 제129항 중 어느 한 항에 있어서, 조성물 내 지질 나노입자를 추가로 포함하는 것인, mRNA.
- 제130항에 있어서, 상기 mRNA는 지질 나노입자 내 존재하는 것인, 조성물.
- 제130항 내지 제131항 중 어느 한 항에 있어서, 상기 지질 나노입자는 양이온성 지질을 포함하는 것인, 조성물.
- 제132항에 있어서, 상기 지질 나노입자는 중성 지질을 추가로 포함하는 것인, 조성물.
- 제130항 내지 제133항 중 어느 한 항에 있어서, 상기 지질 나노입자는 스테롤을 추가로 포함하는 것인, 조성물.
- 제130항 내지 제134항 중 어느 한 항에 있어서, 상기 지질 나노입자는 폴리에틸렌 글리콜(PEG)-변형된 지질을 추가로 포함하는 것인, 조성물.
- 제130항 내지 제135항 중 어느 한 항에 있어서, 상기 지질 나노입자는 이온화 가능한 양이온성 지질, 중성 지질, 스테롤, 및 PEG-변형된 지질을 포함하는 것인, 조성물.
- 제136항에 있어서, 상기 이온화 가능한 양이온성 지질은 헵타데칸-9-일 8((2 하이드록시에틸)(6 옥소 6-(운데실옥시)헥실)아미노)옥타노에이트 (화합물 1)인, 조성물.
- 제136항 또는 제137항에 있어서, 상기 중성 지질은 1,2 디스테아로일-sn-글리세로-3-포스포콜린(DSPC)인, 조성물.
- 제130항 내지 제138항 중 어느 한 항에 있어서, 상기 스테롤은 콜레스테롤인, 조성물.
- 제130항 내지 제139항 중 어느 한 항에 있어서, 상기 PEG-변형된 지질은 1,2 디미리스토일-sn-글리세롤, 메톡시폴리에틸렌글리콜(PEG2000 DMG)인, 조성물.
- 제130항 내지 제140항 중 어느 한 항에 있어서, 상기 지질 나노입자는 20-60 mol%의 이온화 가능한 양이온성 지질, 5-25 mol%의 중성 지질, 25-55 mol%의 스테롤, 및 0.5-15 mol%의 PEG-변형된 지질을 포함하는 것인, 조성물.
- 제141항에 있어서, 상기 지질 나노입자는
40-50 mol%, 선택적으로 45-50 mol%의 이온화 가능한 지질, 30-45 mol%, 선택적으로 35-40 mol%의 스테롤, 5-15 mol%, 선택적으로 10-12 mol%의 헬퍼 지질, 1-5%, 선택적으로 1-3 mol%, 또는 1.5 내지 2.5 mol%의 PEG 지질:
을 포함하는 조성물. - 제142항에 있어서, 상기 지질 나노입자는
40-50 mol%, 선택적으로 45-50 mol%의 화합물 1, 30-45 mol%, 선택적으로 35-40 mol%의 콜레스테롤, 5-15 mol%, 선택적으로 10-12 mol%의 DSPC, 1-5%, 선택적으로 1-3 mol%, 또는 1.5 내지 2.5 mol%의 PEG2000DMG:
를 포함하는 조성물. - 제84항 내지 제129항 중 어느 한 항에 있어서, 상기 mRNA는 화학적 변형, 선택적으로 1-메틸슈도우리딘을 포함하는 것인, mRNA.
- 제84항 내지 제129항 중 어느 한 항에 있어서, 상기 mRNA 내의 각각의 우리딘은 1-메틸슈도우리딘인, mRNA.
- 제130항 내지 제143항 중 어느 한 항에 있어서, 상기 mRNA는 화학적 변형, 선택적으로 1-메틸슈도우리딘을 포함하는 것인, 조성물.
- 제130항 내지 제143항 중 어느 한 항에 있어서, 상기 mRNA 내의 각각의 우리딘은 1-메틸슈도우리딘인, 조성물.
- SARS-CoV-2에 대한 중화 항체 반응을 대상체에서 유도하기에 효과적인 양으로 제84항 내지 제129항 중 어느 한 항의 mRNA를 대상체에게 투여하는 단계를 포함하는 방법.
- SARS-CoV-2에 대한 T 세포 면역 반응을 대상체에서 유도하기에 효과적인 양으로 제84항 내지 제129항 중 어느 한 항의 mRNA를 대상체에게 투여하는 단계를 포함하는 방법.
- SARS-CoV-2에 대한 중화 항체 반응 및 T 세포 면역 반응을 대상체에서 유도하기에 효과적인 양으로 제84항 내지 제129항 중 어느 한 항의 mRNA를 대상체에게 투여하는 단계를 포함하는 방법.
- SARS-CoV-2에 대한 중화 항체 반응을 대상체에서 유도하기에 효과적인 양으로 제130항 내지 제143항 중 어느 한 항의 조성물을 대상체에게 투여하는 단계를 포함하는 방법.
- SARS-CoV-2에 대한 T 세포 면역 반응을 대상체에서 유도하기에 효과적인 양으로 제130항 내지 제143항 중 어느 한 항의 조성물을 대상체에게 투여하는 단계를 포함하는 방법.
- SARS-CoV-2에 대한 중화 항체 반응 및 T 세포 면역 반응을 대상체에서 유도하기에 효과적인 양으로 제130항 내지 제143항 중 어느 한 항의 조성물을 대상체에게 투여하는 단계를 포함하는 방법.
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202062971825P | 2020-02-07 | 2020-02-07 | |
US62/971,825 | 2020-02-07 | ||
US202063016175P | 2020-04-27 | 2020-04-27 | |
US63/016,175 | 2020-04-27 | ||
US202063044330P | 2020-06-25 | 2020-06-25 | |
US63/044,330 | 2020-06-25 | ||
US202063063137P | 2020-08-07 | 2020-08-07 | |
US63/063,137 | 2020-08-07 | ||
PCT/US2021/016979 WO2021159040A2 (en) | 2020-02-07 | 2021-02-06 | Sars-cov-2 mrna domain vaccines |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220140528A true KR20220140528A (ko) | 2022-10-18 |
Family
ID=74845093
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227028371A KR20220140528A (ko) | 2020-02-07 | 2021-02-06 | Sars-cov-2 mrna 도메인 백신 |
Country Status (11)
Country | Link |
---|---|
US (1) | US20230346914A1 (ko) |
EP (1) | EP4100052A2 (ko) |
JP (3) | JP7438604B2 (ko) |
KR (1) | KR20220140528A (ko) |
CN (1) | CN115551545A (ko) |
AU (1) | AU2021215938A1 (ko) |
BR (1) | BR112022015565A2 (ko) |
CA (1) | CA3170150A1 (ko) |
IL (1) | IL295377A (ko) |
MX (1) | MX2022009707A (ko) |
WO (1) | WO2021159040A2 (ko) |
Families Citing this family (53)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11564893B2 (en) | 2015-08-17 | 2023-01-31 | Modernatx, Inc. | Methods for preparing particles and related compositions |
PL3718565T3 (pl) | 2015-10-22 | 2022-09-19 | Modernatx, Inc. | Szczepionki przeciwko wirusom układu oddechowego |
WO2017070613A1 (en) | 2015-10-22 | 2017-04-27 | Modernatx, Inc. | Human cytomegalovirus vaccine |
AU2017326423B2 (en) | 2016-09-14 | 2023-11-09 | Modernatx, Inc. | High purity RNA compositions and methods for preparation thereof |
MA46584A (fr) | 2016-10-21 | 2019-08-28 | Modernatx Inc | Vaccin contre le cytomégalovirus humain |
MA46766A (fr) | 2016-11-11 | 2019-09-18 | Modernatx Inc | Vaccin antigrippal |
MA47787A (fr) | 2017-03-15 | 2020-01-22 | Modernatx Inc | Vaccin contre le virus respiratoire syncytial |
WO2018170256A1 (en) | 2017-03-15 | 2018-09-20 | Modernatx, Inc. | Herpes simplex virus vaccine |
EP3609534A4 (en) | 2017-03-15 | 2021-01-13 | ModernaTX, Inc. | BROAD SPECTRUM VACCINE AGAINST THE INFLUENZA VIRUS |
US11045540B2 (en) | 2017-03-15 | 2021-06-29 | Modernatx, Inc. | Varicella zoster virus (VZV) vaccine |
MA47790A (fr) | 2017-03-17 | 2021-05-05 | Modernatx Inc | Vaccins à base d'arn contre des maladies zoonotiques |
MA48047A (fr) | 2017-04-05 | 2020-02-12 | Modernatx Inc | Réduction ou élimination de réponses immunitaires à des protéines thérapeutiques administrées par voie non intraveineuse, par exemple par voie sous-cutanée |
WO2018232357A1 (en) | 2017-06-15 | 2018-12-20 | Modernatx, Inc. | Rna formulations |
MA49914A (fr) | 2017-08-18 | 2021-04-21 | Modernatx Inc | Procédés analytiques par hplc |
US11912982B2 (en) | 2017-08-18 | 2024-02-27 | Modernatx, Inc. | Methods for HPLC analysis |
EP3668971B1 (en) | 2017-08-18 | 2024-04-10 | ModernaTX, Inc. | Rna polymerase variants |
JP7275111B2 (ja) | 2017-08-31 | 2023-05-17 | モデルナティエックス インコーポレイテッド | 脂質ナノ粒子の生成方法 |
MA54676A (fr) | 2018-01-29 | 2021-11-17 | Modernatx Inc | Vaccins à base d'arn contre le vrs |
US11851694B1 (en) | 2019-02-20 | 2023-12-26 | Modernatx, Inc. | High fidelity in vitro transcription |
US11576966B2 (en) | 2020-02-04 | 2023-02-14 | CureVac SE | Coronavirus vaccine |
US11241493B2 (en) | 2020-02-04 | 2022-02-08 | Curevac Ag | Coronavirus vaccine |
WO2021213924A1 (en) | 2020-04-22 | 2021-10-28 | BioNTech SE | Coronavirus vaccine |
EP4155406A4 (en) * | 2020-05-18 | 2024-03-27 | Cansino Shanghai Biotechnologies Co Ltd | MRNA OR MRNA COMPOSITION, PREPARATION METHOD THEREFOR AND ASSOCIATED APPLICATION |
WO2022046583A1 (en) * | 2020-08-24 | 2022-03-03 | Phylex Biosciences, Inc. | Reagents and methods for preventing, treating or limiting severe acute respiratory syndrome (sars) coronavirus infection |
US11406703B2 (en) | 2020-08-25 | 2022-08-09 | Modernatx, Inc. | Human cytomegalovirus vaccine |
US20220193225A1 (en) * | 2020-08-31 | 2022-06-23 | Bruce Lyday | Compositions and methods for sars-2 vaccine with virus replicative particles and recombinant glycoproteins |
EP4267178A1 (en) | 2020-12-22 | 2023-11-01 | CureVac SE | Rna vaccine against sars-cov-2 variants |
WO2022155524A1 (en) * | 2021-01-15 | 2022-07-21 | Modernatx, Inc. | Variant strain-based coronavirus vaccines |
US11524023B2 (en) * | 2021-02-19 | 2022-12-13 | Modernatx, Inc. | Lipid nanoparticle compositions and methods of formulating the same |
EP4308156A1 (en) * | 2021-03-15 | 2024-01-24 | ModernaTX, Inc. | Therapeutic use of sars-cov-2 mrna domain vaccines |
WO2022235853A1 (en) | 2021-05-04 | 2022-11-10 | BioNTech SE | Immunogen selection |
WO2023022954A1 (en) * | 2021-08-15 | 2023-02-23 | Burton Dennis R | Undirected mutated mrna vaccine |
AU2022330710A1 (en) * | 2021-08-17 | 2024-01-18 | Monash University | Vaccine compositions |
WO2023026170A1 (en) * | 2021-08-24 | 2023-03-02 | Victoria Link Limited | Fusion polypeptide |
WO2023034991A1 (en) * | 2021-09-02 | 2023-03-09 | Kansas State University Research Foundation | Mrna vaccine formulations and methods of using the same |
CN113527522B (zh) * | 2021-09-13 | 2021-12-21 | 深圳市瑞吉生物科技有限公司 | 一种新冠病毒三聚体重组蛋白、DNA、mRNA及应用和mRNA疫苗 |
CN116064598B (zh) * | 2021-10-08 | 2024-03-12 | 苏州艾博生物科技有限公司 | 冠状病毒的核酸疫苗 |
WO2023060483A1 (zh) * | 2021-10-13 | 2023-04-20 | 清华大学 | 多肽-rbd免疫偶联物及其用途 |
CA3235180A1 (en) | 2021-10-21 | 2023-04-27 | BioNTech SE | Coronavirus vaccine |
WO2023064993A1 (en) * | 2021-10-21 | 2023-04-27 | The University Of Melbourne | Chimeric betacoronavirus spike polypeptides |
WO2023092069A1 (en) * | 2021-11-18 | 2023-05-25 | Modernatx, Inc. | Sars-cov-2 mrna domain vaccines and methods of use |
WO2023096990A1 (en) * | 2021-11-24 | 2023-06-01 | Flagship Pioneering Innovation Vi, Llc | Coronavirus immunogen compositions and their uses |
JP2023081859A (ja) | 2021-11-29 | 2023-06-13 | ビオンテック・ソシエタス・エウロパエア | コロナウイルスワクチン |
IL288634A (en) * | 2021-12-02 | 2023-07-01 | Yeda Res & Dev | Improving the translation and protein secretion efficiency of mRNA vaccines |
WO2023113094A1 (ko) * | 2021-12-16 | 2023-06-22 | 주식회사 씨티씨백 | 면역원성이 증가된 코로나바이러스감염증-19 백신 조성물 |
CN116376942A (zh) * | 2021-12-31 | 2023-07-04 | 广州国家实验室 | mRNA疫苗 |
EP4242308A1 (en) * | 2022-01-27 | 2023-09-13 | Shenzhen Rhegen Biotechnology Co., Ltd. | Sars-cov-2 mrna vaccine, and preparation method therefor and use thereof |
WO2023142283A1 (zh) | 2022-01-27 | 2023-08-03 | 深圳市瑞吉生物科技有限公司 | 一种新型冠状病毒mRNA疫苗及其制备方法与应用 |
WO2023143600A1 (zh) * | 2022-01-30 | 2023-08-03 | 康希诺生物股份公司 | 一种用于核酸递送的新型可电离脂质及其lnp组合物和疫苗 |
CN114213509B (zh) * | 2022-02-22 | 2022-06-10 | 广州市锐博生物科技有限公司 | 基于SARS-CoV-2的S蛋白的疫苗及其用途 |
CN116726162A (zh) * | 2022-03-11 | 2023-09-12 | 病毒与疫苗研究中心有限公司 | 用于呼吸道病毒性疾病的疫苗加强组合物 |
KR20230144421A (ko) * | 2022-04-07 | 2023-10-16 | 엠큐렉스 주식회사 | 사스-코로나바이러스 2 감염증에 대한 rna 백신 |
WO2024002985A1 (en) | 2022-06-26 | 2024-01-04 | BioNTech SE | Coronavirus vaccine |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10121252A1 (de) | 2001-04-30 | 2002-11-07 | Christos C Zouboulis | Behandlung der Akne |
EP1800697B1 (de) | 2001-06-05 | 2010-04-14 | CureVac GmbH | Stabilisierte mRNA mit erhöhtem G/C-Gehalt für die Gentherapie |
US9012219B2 (en) | 2005-08-23 | 2015-04-21 | The Trustees Of The University Of Pennsylvania | RNA preparations comprising purified modified RNA for reprogramming cells |
DE102005046490A1 (de) | 2005-09-28 | 2007-03-29 | Johannes-Gutenberg-Universität Mainz | Modifikationen von RNA, die zu einer erhöhten Transkriptstabilität und Translationseffizienz führen |
AU2008271907A1 (en) | 2007-06-29 | 2009-01-08 | Commonwealth Scientific And Industrial Research Organisation | Methods for degrading toxic compounds |
EP2535419A3 (en) | 2007-09-26 | 2013-05-29 | Intrexon Corporation | Synthetic 5'UTRs, expression vectors, and methods for increasing transgene expression |
SG10201408165WA (en) | 2007-12-11 | 2015-01-29 | Scripps Research Inst | Compositions and methods related to mrna translational enhancer elements |
AU2010278309B2 (en) | 2009-07-31 | 2013-10-31 | Ethris Gmbh | RNA with a combination of unmodified and modified nucleotides for protein expression |
JP6184945B2 (ja) | 2011-06-08 | 2017-08-23 | シャイアー ヒューマン ジェネティック セラピーズ インコーポレイテッド | mRNA送達のための脂質ナノ粒子組成物および方法 |
US10245229B2 (en) | 2012-06-08 | 2019-04-02 | Translate Bio, Inc. | Pulmonary delivery of mRNA to non-lung target cells |
WO2014071963A1 (en) | 2012-11-09 | 2014-05-15 | Biontech Ag | Method for cellular rna expression |
CN105209490A (zh) | 2013-03-14 | 2015-12-30 | 夏尔人类遗传性治疗公司 | 用于递送mrna编码的抗体的方法和组合物 |
SI2972360T1 (en) | 2013-03-15 | 2018-08-31 | Translate Bio, Inc. | Synergistic improvement in the delivery of nucleic acids via mixed formulations |
US10138507B2 (en) | 2013-03-15 | 2018-11-27 | Modernatx, Inc. | Manufacturing methods for production of RNA transcripts |
SG10201801428RA (en) | 2013-08-21 | 2018-03-28 | Curevac Ag | Method for increasing expression of rna-encoded proteins |
WO2015062738A1 (en) | 2013-11-01 | 2015-05-07 | Curevac Gmbh | Modified rna with decreased immunostimulatory properties |
WO2015101415A1 (en) | 2013-12-30 | 2015-07-09 | Curevac Gmbh | Artificial nucleic acid molecules |
DK3090053T3 (en) | 2013-12-30 | 2019-02-25 | Curevac Ag | Artificial nucleic acid molecules |
RU2021109685A (ru) | 2014-04-23 | 2021-04-13 | МОДЕРНАТиЭкс, ИНК. | Вакцины на основе нуклеиновых кислот |
PL3718565T3 (pl) | 2015-10-22 | 2022-09-19 | Modernatx, Inc. | Szczepionki przeciwko wirusom układu oddechowego |
AU2017326423B2 (en) | 2016-09-14 | 2023-11-09 | Modernatx, Inc. | High purity RNA compositions and methods for preparation thereof |
WO2018115527A2 (en) * | 2016-12-23 | 2018-06-28 | Curevac Ag | Mers coronavirus vaccine |
EP3582790A4 (en) | 2017-02-16 | 2020-11-25 | ModernaTX, Inc. | VERY POWERFUL IMMUNOGENIC COMPOSITIONS |
MA47790A (fr) | 2017-03-17 | 2021-05-05 | Modernatx Inc | Vaccins à base d'arn contre des maladies zoonotiques |
EP3668971B1 (en) | 2017-08-18 | 2024-04-10 | ModernaTX, Inc. | Rna polymerase variants |
-
2021
- 2021-02-06 CA CA3170150A patent/CA3170150A1/en active Pending
- 2021-02-06 WO PCT/US2021/016979 patent/WO2021159040A2/en unknown
- 2021-02-06 IL IL295377A patent/IL295377A/en unknown
- 2021-02-06 EP EP21709270.9A patent/EP4100052A2/en active Pending
- 2021-02-06 KR KR1020227028371A patent/KR20220140528A/ko unknown
- 2021-02-06 JP JP2022548194A patent/JP7438604B2/ja active Active
- 2021-02-06 MX MX2022009707A patent/MX2022009707A/es unknown
- 2021-02-06 BR BR112022015565A patent/BR112022015565A2/pt not_active Application Discontinuation
- 2021-02-06 CN CN202180013506.4A patent/CN115551545A/zh active Pending
- 2021-02-06 US US17/797,784 patent/US20230346914A1/en active Pending
- 2021-02-06 AU AU2021215938A patent/AU2021215938A1/en active Pending
-
2023
- 2023-08-16 JP JP2023132619A patent/JP7443608B2/ja active Active
-
2024
- 2024-02-20 JP JP2024023916A patent/JP2024050973A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
CN115551545A (zh) | 2022-12-30 |
JP7438604B2 (ja) | 2024-02-27 |
WO2021159040A2 (en) | 2021-08-12 |
CA3170150A1 (en) | 2021-08-12 |
WO2021159040A9 (en) | 2021-11-25 |
EP4100052A2 (en) | 2022-12-14 |
US20230346914A1 (en) | 2023-11-02 |
MX2022009707A (es) | 2022-09-07 |
AU2021215938A1 (en) | 2022-09-01 |
JP2024050973A (ja) | 2024-04-10 |
JP7443608B2 (ja) | 2024-03-05 |
JP2023513544A (ja) | 2023-03-31 |
JP2023153256A (ja) | 2023-10-17 |
IL295377A (en) | 2022-10-01 |
BR112022015565A2 (pt) | 2022-09-27 |
WO2021159040A3 (en) | 2021-11-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7443608B2 (ja) | SARS-COV-2 mRNAドメインワクチン | |
US20230108894A1 (en) | Coronavirus rna vaccines | |
US20210228707A1 (en) | Coronavirus rna vaccines | |
US20230355743A1 (en) | Multi-proline-substituted coronavirus spike protein vaccines | |
WO2021159130A2 (en) | Coronavirus rna vaccines and methods of use | |
JP2024503699A (ja) | バリアント株ベースのコロナウイルスワクチン | |
KR20220133911A (ko) | 호흡기 바이러스 면역화 조성물 | |
JP2024503698A (ja) | 変異型株ベースのコロナウイルスワクチン | |
WO2022266010A1 (en) | Mrna vaccines encoding flexible coronavirus spike proteins | |
WO2023283642A2 (en) | Pan-human coronavirus concatemeric vaccines | |
WO2022266012A1 (en) | Coronavirus glycosylation variant vaccines | |
JP2024514183A (ja) | エプスタイン-バーウイルスmRNAワクチン | |
WO2023283645A1 (en) | Pan-human coronavirus domain vaccines | |
WO2023092069A1 (en) | Sars-cov-2 mrna domain vaccines and methods of use | |
EP4308156A1 (en) | Therapeutic use of sars-cov-2 mrna domain vaccines | |
TW202217000A (zh) | Sars—cov—2 mrna結構域疫苗 |